Блог

Основы восточной символографии

  • Цветков Максим
  • 21.05.2019

Восточные иероглифы это прекрасный пример визуальной экспрессии. В азиатских языках множество графем и черт, но нет алфавита. Исторически иероглифы появились благодаря сжиганию костей и камней в костре, и угадыванию будущего по получившимся на костях/камнях чертам.

Но существует и более красивая версия, берущая корни во временах гадания на черепаховых щитках и костях животных. Эта специфическая практика состояла в том, что на щитке проделывались углубления и отверстия, а затем гадатель произносил просьбу духам и подносил к щитку раскалённую железную палку. В результате щиток покрывался трещинами, по форме которых гадатель предсказывал различные события. Затем он фиксировал предсказание на этом же щитке. Таким способом получались дошедшие до наших дней священные письмена.

В письменах были пиктограммы, в которых берут свое начало китайские иероглифы (пико это рисовать). Идеограммы строятся на пиктограммах. Поначалу, ими начали писать законы на огромных железных котлах, которые ставили в городе. Но котел сложно отвезти в другой город, поэтому перешли на письмо на бамбуке, так появились самые ранние книги в Китае. На дощечках писали справа налево сверху вниз, связывали дощечки веревками и отвозили в разные части страны. Веревки сгнили, и до сих пор при раскопках находят эти дощечки и с трудом понимают последовательность текстов, так как утерян порядок следования дощечек.

Визуальная форма

Иероглиф обладает 1) внешней оболочкой 2) смысловым содержанием 3) фонетическим звучанием. В наши дни иероглиф это письменный знак, который не равен изображению определенного предмета. Попытки привязать иероглиф к образу это лишь один из способов запомнить сам рисунок. Многие иероглифы состоят из нескольких знаков: фонетики и знаки-ключи, определяющие значение иероглифа. Под знаками я подразумеваю графемы, которые состоят из черт. Например, иероглиф с ключом обрастает дополнительными чертами 皮 (pí) → 波 (bō) → 婆 (pó). Ключ определяет смысл, фонетик— звучание. Условно иероглифы можно разделить на три вида: идеограммы (некие идеи, единицы смысла: 麻 означает растительную культуру и состоит из широкой крыши 广 и 林 леса, так как запасы складывались под крышу). Фонограммы (ключ + фонетик, в иероглифе 妈 есть 马, и по звучанию они похожи), почти 80% всех иероглифов в китайском языке. Символограммы (上 вверх и 下 вниз, как знаки). Дополнительно можно выделить заимствованные, например 来 это приходить и читается как lái, но раньше 来 обозначал ячмень. Люди говорили lái в значении приходить, но не было иероглифа для слова приходить, и в итоге поменялся смысл иероглифа.

Смысловое содержание и сам рисунок иероглифа не обозначает его фонетическое звучание. В современном китайском соотношение иероглифа и его произношения коррелируется, по разным источникам, от 20 до 60%. На практике это ближе к 20%. Но иногда можно по рисунку иероглифа понять его произношение. Например, 荷 (hè) в технической документации переводится как нагрузка и не очень распространен среди переводчиков, но аналогичный по рисунку 何 читается также (hé), но другим тоном, переводчики смогут это правильно прочитать. Иероглиф читается как слог, у каждого иероглифа может быть до пяти тонов и, соответственно, значений, и в разных провинциях разные произношения. Пример: 啊, который в зависимости от тона a, ā, á, ǎ, à, выражает разные эмоции, четвертый тон чаще используется для ругательств. Распространенные слова 买 и 卖 переводятся как купить и продать, читаются одинаково, но разными тонами: mǎi и mài. На юге Китая кантонское произношение, а на севере совсем другие диалекты, тогда как в Пекине произношение ближе к раннему китайскому языку. В каком-нибудь Сучжоу можно встретить 6-8 тонов. Принято выделять 7 распространенных диалектов: mandarin (putonghua), gan, hakka, min, wu, xiang и cantonese. В 1950 mandarin был выбран как официальный диалект для всего Китая.

Раньше иероглифы состояли из бОльшого числа черт, и запомнить их было достаточно сложно. Поэтому одной из целей реформы письменности, осуществленной китайским правительством в 60-х годах XX века, было упрощение иероглифов путем уменьшения количества черт. Это позволило обучить чтению и письму огромное количество людей и визуально упростить иероглифы. Например, 飛 -> 飞, 雞 -> 鸡, 學 -> 学, 開 ->开. По большей части упрощали ключи, лишь около 600 иероглифов были сильно изменены. Классические иероглифы используются в Тайване, ГК и Макао. И мастера каллиграфии.

Но при этом китайцы очень любят визуальную экспрессию, которая появляется при большом количестве черт. И когда вам говорят востоковеды, что иероглиф состоит из 30-40 черт и это максимальное возможное количество, будьте уверены, в какой-нибудь провинции владелец небольшой закусочной уже нарисовал на вывеске название, состоящее из 80-90 черт.

Эмодзи также передают другие смыслы, отличные от европейских. Например,👌 означает 30, и в жизни и в интернете.

В лингвистике есть понятие «просодия». Это ритм и мелодия речи.

Считается, что ручка — один из главных врагов для иероглифа. В книгах иероглиф обладает разной толщиной написания штрихов. Но на практике, толщина линий пошла от письма пером и кистями, а для понимания и распознавания иероглифа толщина линий не нужна. Толщина линий в иероглифе это чисто эстетическая составляющая. Посмотрите на примере ниже, как пишут носители языка для своих соотечественников:

Куда важнее отслеживать длину штрихов, это сильно влияет на смысл. Например: 七 «семь» и 匕 «черпак». Или классическая ошибка: 土 «деревенщина» и 士 «воин». Первый символ отличается от второго длиной средней горизонтальной черты. А вот тут найти разницу еще сложнее: 妺 и 妹. А вот что надо учитывать, сам рисунок иероглифа может отличаться в зависимости от стиля написания: Чжуаньшу, Лишу, Синшу, Цаошу, Кайшу.

Таких неприятных искажений смысла помогает избежать правильная последовательность рисования черт в иероглифе. Это важно, так как рука ведет себя по разному при разном наклоне ручки/пера, направления движения руки. При написании символов есть три основных правила порядка рисования черт:

  1. сверху вниз, слево направо → ;
  2. сначала горизонтальные, потом вертикальные, затем черты под наклоном влево, затем с наклоном вправо: — | \ / ‘ , если горизонтальная и вертикальная черты не пересекаются;
  3. 冂冋回 сначала внешнее, потом внутреннее, потом закрытие;
  1. Есть и более сложный алгоритм:
  2. Первыми рисуют горизонтальные черты, после вертикальные и откидные.
  3. Сначала пишется откидная влево, потом откидная вправо.
  4. Иероглифы пишется сверху вниз.
  5. Затем слева направо.
  6. Вначале пишутся внешние контуры иероглифа, потом идут штрихи внутри.
  7. Черта, замыкающая контур иероглифа снизу, пишется последней.
  8. Рисуем центральную вертикальную черту, потом боковые черты.

Большинство слов в современном китайском языке состоит из двух слогов-иероглифов с ударением на последний. Посмотрите на пример ниже из китайского кафе:

Ввод значений

Для записи звучания иероглифов используется система Пиньинь. Это транслитерация на английский. Именно транслитом и печатают иероглифы на английской клавиатуре, а потом из предложенного списка выбирают нужный.

Пиньинь дословно означает «соединять звуки», обычно переводится как «транскрипция», «фонетика», «произношение» китайского языка. Представляет собой наиболее удачный образец романизации (фонетического обозначения и транслитерации в латинский алфавит) стандартного китайского языка, использующегося на всей территории Китая. Пиньинь также стал основным средством компьютеризации китайского языка. Так как китайский язык тоновый, в Пиньинь разработаны соответствующие значки, которые ставятся над гласными финалями для обозначения каждого из тонов китайского языка:

При наборе на телефоне китайцы используют как стандартную qwerty раскладку, так и 9-ти кнопочную, к которой привыкли с досмартфоновой эпохи (Т9). Так же для тех, кто не силен в пиньинь (система придумана не так давно и старшее поколение может вполне не знать ее) существует вариант ручного ввода: простое рисование иероглифа пальцем, либо голосовой ввод. Также можно вводить последовательность черт, а в Гонконге встречается раскладка клавиатуры Sucheng/Cangjie.

Также существует бинарный китайский, он больше молодежный и письменный. Например, 二 созвучен со словом любовь (爱).

Устаревшие варианты ввода все еще можно встретить. Например, Wubi. Это более быстрый способ ввода, но сложный в освоении. На данный момент сложно найти софт с нормальной поддержкой Wubi, поэтому даже приверженцы этого метода ввода переходят на пиньинь, что является целью государства. Стандартизация. В Тайване популярны Cangjie и Boshiamy, в Японии Kanji.

Технические моменты

Благодаря Adobe и Google у нас есть по крайней мере один хороший бесплатный шрифт, который предлагает согласованный взгляд на языки CJK (Chinese, Japanese, and Korean): Source Han Sans. Япония использует ханьскую идеографию («ханьцзы» или «канцзы»), поэтому используется один шрифт для разных языков. Если речь о мобильных устройствах, то можно посмотреть Droid Sans Fallback. Но для японского языка плохо подходят китайские иероглифы. Поэтому японцы создали упрощенные и стилизованные версии определенных иероглифов: Hiragana и Katakana, которые сейчас используются вместе с китайскими иероглифами.

Выбор шрифтов не велик, китайские шрифты сделать нелегко, потому что нужно нарисовать тысячи иероглифов для традиционных глифов. Весят шрифты с таким количеством символов от 30MB. Посмотрите на шрифт CFF OTF, который в полной комплектации весит 34MB. Не удивительно, что большинство китайских сайтов полагается на системный шрифт, а не подгружают пользователю гарнитуру шрифта. Либо используют шрифты до 1MB, которые вмещают около 3 000 иероглифов. Но даже это слишком тяжелый файл для простой веб-страницы, так что про @font-face придется забыть. Как результат, пригодных для работы гарнитур в принципе не много, а хороших единицы. Наиболее часто используемые шрифты: PMingLiU (с засечками), Microsoft JhengHei (san-serif), Microsoft YaHei (微软雅黑), SimHei (黑体), SimSun (宋体) как шрифт для Chinese Simplify, Google Noto Sans CJK. В Tencent мне рекомендовали использовать варианты Microsoft YaHei: FZLanTingHei, FZLanTingKanHei, FZLanTingYuan и FZZhengHei, последний я использовал для финальных макетов.

Apple рекомендует для Pages использовать следующие гарнитуры:

  • Simplified Chinese: PingFang SC
  • Traditional Chinese for Taiwan: PingFang TC
  • Traditional Chinese for Hong Kong и Macau: PingFang HK
  • Korean: Apple SD Gothic Neo
  • Japanese: Hiragino Sans (sans serif) или Hiragino Mincho (serif)

Отдельно хочется упомянуть, что китайские шрифты также нужно покупать и стоят они дороже европейских, так как нарисовать 3 000 иероглифов дороже, чем 270 глифов для европейского шрифта. Если у шрифта есть приписка FZ в названии, то он был разработан foundertype, аналогичные аббревиатуры в названии указывают на производителя. Даже если сравнить максимальную версию гарнитуры для европейского рынка с поддержкой 100 языков + дополнительные символы, это все равно лишь 840 символов. И в одиночку азиатские гарнитуры не разрабатываются, это работа команды из десятков дизайнеров.

Также есть разделение на шрифты с засечками и без, по аналогии с латинскими. В шрифтах без засечек толщина штрихов примерно одинаковая, а шрифты с засечками более художественные. Шрифты без засечек чаще используются для небольших текстов, заголовков.

Есть такой термин как 春联 (chūnlián) — красные полосы бумаги с пожеланиями на Китайский новый год, которому уже более 4 000 лет. Празднует в конце января/начале февраля. Одна из примечательных особенностей, это наклеивание красных полос бумаги с пожеланиями на вход в дом. Слева и справа от входа, и небольшие полосы сверху и на саму дверь, обязательно на красном фоне золотыми или черными иероглифами. Причем нельзя путать местами левую и правую сторону.

В плохих шрифтах (да и в хороших тоже) могут быть дорисованы лишние черты к иероглифам. По этой причине Apple иногда использует картинки вместо текста для заголовков на китайской версии своего сайта. В некоторых гарнитурах нет написания даже для всех ключей. В разных регионах восточной Азии могут использоваться разные глифы для одинаковых значений. Помимо этого, существуют разные стили, например син-шу (行書) и цао-шу (草書). Чувствуете ворох проблем с пониманием смысла текстов определенной частью населения? Из хорошего: юникод поддерживает все нужные символы без привязки к UTF-8, UTF-16, или UTF-32. А это более 80 000 иероглифов. В этом легко убедиться, побродив по ссылке. Но на практике используется примерно 3 500 иероглифов, этого достаточно для печати журналов и газет.

Минимальным размером иероглифа считается 8x8px, под такой размер адаптирован шрифт SimSun, но даже носители языка с трудом могут распознавать иероглифы в таком размере и читают по контексту, не вычитывая каждый иероглиф. Лучше ориентироваться на диапазон 12-16px. Все, что меньше 16px, вызывает затруднения при чтении. Я в одном проекте использовал 18px, проблем не возникло. А межстрочный интервал лучше оставить в диапазоне от 120% до 145% от размера шрифта.
Считывать иероглифы издалека сложнее, чем латиницу, учитывайте это:

Все мини-символы, вроде пунктуации, занимают ровно такой же размер кегельной площадки, как и обычные иероглифы. Вот примеры: ,。?」. Это попытка сделать шрифт моноширинным и это не правильно, символы пунктуации не должна занимать такую большую кегельную площадку, только посмотрите как это выглядит 「运动员」. Никаких других расстояний между символами добавлять не нужно, потому что в китайском более ценно не слово, а иероглиф. В древнекитайском языке одно слово всегда обозначалось одним иероглифом, и не было знаков припинания. Чтение таких текстов работало по принципу: читаешь, читаешь, читаешь и внезапно в голове появляется картинка. Каждый иероглиф имеет смысл, а зачастую много смыслов, поэтому по внешнему виду иероглифа или радикала невозможно догадаться о его значении. Пример: 水 (shuǐ) это вода как отдельный иероглиф, но как составная часть другого иероглифа вода пишется как 氵, вот пример с расположением слева: 洋 (yāng) — океан.

Китайские сайты пугают европейца отсутствием обилия пустого пространства, в китайском языке иероглифы сами по себе громоздкие и не разделяются пробелом, отсутствуют заглавные буквы. Но зато выравнивание текста идет слева направо сверху вниз, как и в европейских языках. По крайней мере, в большинстве случаев. Иногда можно наткнуться на написание сверху вниз слева направо. В основном, в очень формулярских документах, либо художественная запись из Тайваня и Гонконга, или для стихов. Для вертикальной записи вводятся дополнительные корректировки знаков препинания, например точка по центру ячейки иероглифа.

Верстая сайт, при объявлении шрифта весьма полезно указывать имена гарнитур сначала на английском, затем на китайском языках. Так как файл шрифта в системе может называться по разному. Также, по аналогии с Arial / Helvetica, нужно указать шрифты для Windows и MacOS.

Это основное, что нужно знать для минимизации шанса ошибиться при работе на азиатские компании. Я очень надеюсь, что вы не допустите ошибок при разработке продуктов на азиатские рынки и учтете все новые знания из статьи при проектировании интерфейсов. Иначе можно услышать от китайских коллег в свой адрес пренебрежительное слово guā lǎowài (瓜老外). Переводится как глупый иностранец европейской внешности, который плохо понимает язык и культуру Китая. Хотите делать интерфейсы для Китая? 了解一下!

6 комментариев

  1. Глеб Щукин

    18.04.2020

    您好 ! Отличная статья, спасибо!
    Перечисленные шрифты это, видимо, самые популярные. А есть ли какие-либо более эстетичные и художественные?

    • Цветков Максим

      18.04.2020

      Из интересных, Alibaba PuHuiTi, 方正字庫FZNSTFW, SimHei. Есть сайт chinesefont.org, там можно найти интересные примеры.
      天天向上!)

  2. Andrey Vorontsov

    06.10.2020

    Добрый день! как подбирать ключевые слова для японских сторов, если не знаем азиатских языков?

  3. Dmitry Tigrov

    07.01.2021

    Как продвигать пищевую продукцию в поднебесной?

    • Цветков Максим

      07.01.2021

      Создаете аккаунт в Baidu, и переделываете сайт на китайский язык, размещаете его в Китае, получаете лицензии G и ICP. И пускаете контекстную рекламу.
      Заказываете отзывов для Zhihu и KOL.
      Поддерживаете чатик бренда в Wechat, Weibo и Xiaohongshu.

Добавить комментарий для Цветков Максим Отменить ответ

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.