Основы восточной символографии

Восточные иероглифы это прекрасный пример визуальной экспрессии. В азиатских языках множество графем и черт, но нет алфавита. Исторически иероглифы появились благодаря сжиганию костей и камней в костре, и угадыванию будущего по получившимся на костях/камнях чертам.

Но существует и более красивая версия, берущая корни во временах гадания на черепаховых щитках и костях животных. Эта специфическая практика состояла в том, что на щитке проделывались углубления и отверстия, а затем гадатель произносил просьбу духам и подносил к щитку раскалённую железную палку. В результате щиток покрывался трещинами, по форме которых гадатель предсказывал различные события. Затем он фиксировал предсказание на этом же щитке. Таким способом получались дошедшие до наших дней священные письмена.

В письменах были пиктограммы, в которых берут свое начало китайские иероглифы. Поначалу, ими начали писать законы на огромных железных котлах, которые ставили в городе. Но котел сложно отвезти в другой город, поэтому перешли на письмо на бамбуке, так появились самые ранние книги в Китае. На дощечках писали справа налево сверху вниз, связывали дощечки веревками и отвозили в разные части страны. Веревки сгнили, и до сих пор при раскопках находят эти дощечки и с трудом понимают последовательность текстов, так как утерян порядок следования дощечек.

Визуальная форма

Иероглиф обладает 1) внешней оболочкой 2) смысловым содержанием 3) фонетическим звучанием. В наши дни иероглиф это письменный знак, который не равен изображению определенного предмета. Попытки привязать иероглиф к образу это лишь один из способов запомнить сам рисунок. Многие иероглифы состоят из нескольких знаков: фонетики и знаки-ключи, определяющие значение иероглифа. Под знаками я подразумеваю графемы, которые состоят из черт. Например, иероглиф с ключом обрастает дополнительными чертами 皮 (pí) → 波 (bō) → 婆 (pó). Ключ определяет смысл, фонетик— звучание. Условно иероглифы можно разделить на три вида: идеограммы (некие идеи, единицы смысла) , фонограммы (ключ + фонетик, отображение звуков), почти 80% всех иероглифов в китайском языке, и детерминативы.

Смысловое содержание и сам рисунок иероглифа не обозначает его фонетическое звучание. В современном китайском соотношение иероглифа и его произношения коррелируется, по разным источникам, от 20 до 60%. На практике это ближе к 20%. Но иногда можно по рисунку иероглифа понять его произношение. Например, 荷 (hè) в технической документации переводится как нагрузка и не очень распространен среди переводчиков, но аналогичный по рисунку 何 читается также (hé), но другим тоном, переводчики смогут это правильно прочитать. Иероглиф читается как слог, у каждого иероглифа может быть до пяти тонов и, соответственно, значений, и в разных провинциях разные произношения. Пример: 啊, который в зависимости от тона a, ā, á, ǎ, à, выражает разные эмоции, четвертый тон чаще используется для ругательств. Распространенные слова 买 и 卖 переводятся как купить и продать, читаются одинаково, но разными тонами: mǎi и mài. На юге Китая кантонское произношение, а на севере совсем другие диалекты, тогда как в Пекине произношение ближе к раннему китайскому языку. Можно выделить 7 распространенных диалектов: mandarin (putonghua), gan, hakka, min, wu, xiang и cantonese. В 1950 mandarin был выбран как официальный диалект для всего Китая.

Раньше иероглифы состояли из бОльшого числа черт, и запомнить их было достаточно сложно. Поэтому одной из целей реформы письменности, осуществленной китайским правительством в 60-х годах XX века, было упрощение иероглифов путем уменьшения количества черт. Это позволило обучить чтению и письму огромное количество людей и визуально упростить иероглифы. Например, 飛 -> 飞, 雞 -> 鸡. По большей части упрощали ключи, лишь около 600 иероглифов были сильно изменены.

Но при этом китайцы очень любят визуальную экспрессию, которая появляется при большом количестве черт. И когда вам говорят востоковеды, что иероглиф состоит из 30-40 черт и это максимальное возможное количество, будьте уверены, в какой-нибудь провинции владелец небольшой закусочной уже нарисовал на вывеске название, состоящее из 80-90 черт.

Эмодзи также передают другие смыслы, отличные от европейских. Например,👌 означает 30, и в жизни и в интернете.

Считается, что ручка — один из главных врагов для иероглифа. В книгах иероглиф обладает разной толщиной написания штрихов. Но на практике, толщина линий пошла от письма пером и кистями, а для понимания и распознавания иероглифа толщина линий не нужна. Толщина линий в иероглифе это чисто эстетическая составляющая. Посмотрите на примере ниже, как пишут носители языка для своих соотечественников:

Куда важнее отслеживать длину штрихов, это сильно влияет на смысл. Например: 七 «семь» и 匕 «черпак». Или классическая ошибка: 土 «деревенщина» и 士 «воин». Первый символ отличается от второго длиной средней горизонтальной черты.

Таких неприятных искажений смысла помогает избежать правильная последовательность рисования черт в иероглифе. Это важно, так как рука ведет себя по разному при разном наклоне ручки/пера, направления движения руки. При написании символов есть три основных правила порядка рисования черт:

  1. сверху вниз, слево направо → ;
  2. сначала горизонтальные, потом вертикальные, затем черты под наклоном влево, затем с наклоном вправо: — | \ / ‘ , если горизонтальная и вертикальная черты не пересекаются;
  3. 冂冋回 сначала внешнее, потом внутреннее, потом закрытие;
  1. Есть и более сложный алгоритм:
  2. Первыми рисуют горизонтальные черты, после вертикальные и откидные.
  3. Сначала пишется откидная влево, потом откидная вправо.
  4. Иероглифы пишется сверху вниз.
  5. Затем слева направо.
  6. Вначале пишутся внешние контуры иероглифа, потом идут штрихи внутри.
  7. Черта, замыкающая контур иероглифа снизу, пишется последней.
  8. Рисуем центральную вертикальную черту, потом боковые черты.

Большинство слов в современном китайском языке состоит из двух слогов-иероглифов с ударением на последний. Посмотрите на пример ниже из китайского кафе:

Ввод значений

Для записи звучания иероглифов используется система Пиньинь. Это транслитерация на английский. Именно транслитом и печатают иероглифы на английской клавиатуре, а потом из предложенного списка выбирают нужный.

Пиньинь дословно означает «соединять звуки», обычно переводится как «транскрипция», «фонетика», «произношение» китайского языка. Представляет собой наиболее удачный образец романизации (фонетического обозначения и транслитерации в латинский алфавит) стандартного китайского языка, использующегося на всей территории Китая. Пиньинь также стал основным средством компьютеризации китайского языка. Так как китайский язык тоновый, в Пиньинь разработаны соответствующие значки, которые ставятся над гласными финалями для обозначения каждого из тонов китайского языка:

При наборе на телефоне китайцы используют как стандартную qwerty раскладку, так и 9-ти кнопочную, к которой привыкли с досмартфоновой эпохи (Т9). Так же для тех, кто не силен в пиньинь (система придумана не так давно и старшее поколение может вполне не знать ее) существует вариант ручного ввода: простое рисование иероглифа пальцем, либо голосовой ввод. Также можно вводить последовательность черт, а в Гонконге встречается раскладка клавиатуры Sucheng/Cangjie.

Технические моменты

Благодаря Adobe и Google у нас есть по крайней мере один хороший бесплатный шрифт, который предлагает согласованный взгляд на языки CJK (Chinese, Japanese, and Korean): Source Han Sans. Если речь о мобильных устройствах, то можно посмотреть Droid Sans Fallback. Япония использует ханьскую идеографию («ханьцзы» или «канцзы»), поэтому используется один шрифт для разных языков. Для японского языка плохо подходят китайские иероглифы. Поэтому японцы создали упрощенные и стилизованные версии определенных иероглифов: Hiragana и Katakana, которые сейчас используются вместе с китайскими иероглифами.

Выбор шрифтов не велик, китайские шрифты сделать нелегко, потому что нужно нарисовать тысячи иероглифов для традиционных глифов. Весят шрифты с таким количеством символов от 30MB. Посмотрите на шрифт CFF OTF, который в полной комплектации весит 34MB. Не удивительно, что большинство китайских сайтов полагается на системный шрифт, а не подгружают пользователю гарнитуру шрифта. Либо используют шрифты до 1MB, которые вмещают около 3 000 иероглифов. Но даже это слишком тяжелый файл для простой веб-страницы, так что про @font-face придется забыть. Как результат, пригодных для работы гарнитур в принципе не много, а хороших единицы. Наиболее часто используемые шрифты: PMingLiU (с засечками), Microsoft JhengHei (san-serif), Microsoft YaHei (微软雅黑), SimHei (黑体), SimSun (宋体) как шрифт для Chinese Simplify, Google Noto Sans CJK.

Apple рекомендует для Pages использовать следующие гарнитуры:

  • Simplified Chinese: PingFang SC
  • Traditional Chinese for Taiwan: PingFang TC
  • Traditional Chinese for Hong Kong и Macau: PingFang HK
  • Korean: Apple SD Gothic Neo
  • Japanese: Hiragino Sans (sans serif) или Hiragino Mincho (serif)

Отдельно хочется упомянуть, что китайские шрифты также нужно покупать и стоят они дороже европейских, так как нарисовать 3 000 иероглифов дороже, чем 270 глифов для европейского шрифта. Если у шрифта есть приписка FZ в названии, то он был разработан foundertype, аналогичные аббревиатуры в названии указывают на производителя. Даже если сравнить максимальную версию гарнитуры для европейского рынка с поддержкой 100 языков + дополнительные символы, это все равно лишь 840 символов. И в одиночку азиатские гарнитуры не разрабатываются, это работа команды из десятков дизайнеров.

Также есть разделение на шрифты с засечками и без, по аналогии с латинскими. В шрифтах без засечек толщина штрихов примерно одинаковая, а шрифты с засечками более художественные. Шрифты без засечек чаще используются для небольших текстов, заголовков.

В плохих шрифтах (да и в хороших тоже) могут быть дорисованы лишние черты к иероглифам. По этой причине Apple иногда использует картинки вместо текста для заголовков на китайской версии своего сайта. В некоторых гарнитурах нет написания даже для всех ключей. В разных регионах восточной Азии могут использоваться разные глифы для одинаковых значений. Помимо этого, существуют разные стили, например син-шу (行書) и цао-шу (草書). Чувствуете ворох проблем с пониманием смысла текстов определенной частью населения? Из хорошего: юникод поддерживает все нужные символы без привязки к UTF-8, UTF-16, или UTF-32. А это более 80 000 иероглифов. В этом легко убедиться, побродив по ссылке. Но на практике используется примерно 3 500 иероглифов, этого достаточно для печати журналов и газет.

Минимальным размером иероглифа считается 8x8px, под такой размер адаптирован шрифт SimSun, но даже носители языка с трудом могут распознавать иероглифы в таком размере и читают по контексту, не вычитывая каждый иероглиф. Лучше ориентироваться на диапазон 12-16px. Все, что меньше 16px, вызывает затруднения при чтении. Я в одном проекте использовал 18px, проблем не возникло. А межстрочный интервал лучше оставить в диапазоне от 120% до 145% от размера шрифта.
Считывать иероглифы издалека сложнее, чем латиницу, учитывайте это:

Все мини-символы, вроде пунктуации, занимают ровно такой же размер кегельной площадки, как и обычные иероглифы. Вот примеры: ,。?」. Это попытка сделать шрифт моноширинным и это не правильно, символы пунктуации не должна занимать такую большую кегельную площадку, только посмотрите как это выглядит 「运动员」. Никаких других расстояний между символами добавлять не нужно, потому что в китайском более ценно не слово, а иероглиф. Каждый иероглиф имеет смысл, а зачастую много смыслов, поэтому по внешнему виду иероглифа или радикала невозможно догадаться о его значении. Пример: 水 (shuǐ) это вода как отдельный иероглиф, но как составная часть иероглифа пишется 氵, если расположена слева: 洋 (yāng) — океан.

Китайские сайты пугают европейца отсутствием обилия пустого пространства, в китайском языке иероглифы сами по себе громоздкие и не разделяются пробелом, отсутствуют заглавные буквы. Но зато выравнивание текста идет слева направо сверху вниз, как и в европейских языках. Иногда можно наткнуться на написание сверху вниз слева направо. В основном, в очень формулярских документах, либо художественная запись из Тайваня и Гонконга, например, для стихов. Для вертикальной записи вводятся дополнительные корректировки знаков препинания, например точка по центру ячейки иероглифа.

Верстая сайт, при объявлении шрифта весьма полезно указывать имена гарнитур сначала на английском, затем на китайском языках. Так как файл шрифта в системе может называться по разному. Также, по аналогии с Arial / Helvetica, нужно указать шрифты для Windows и MacOS.

Это основное, что нужно знать для минимизации шанса ошибиться при работе на азиатские компании. Я очень надеюсь, что вы не допустите ошибок при разработке продуктов на азиатские рынки и учтете все новые знания из статьи при проектировании интерфейсов. Иначе можно услышать от китайских коллег в свой адрес пренебрежительное слово лаовай (老外). То есть иностранец европейской внешности, который плохо понимает язык и культуру Китая.

«Взаимодействуя с данным сайтом, вы, как пользователь, автоматически даете согласие согласие на обработку персональных данных» Согласие

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.