НОВОСТИ   БИБЛИОТЕКА   ЭНЦИКЛОПЕДИЯ   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  






17.09.2013

Как мы вставили сирийский язык в Windows

На окраине городка Ист-Брансуик, в котором находится знаменитый университет Ратгерс, карты указывают небольшую деревню с типично американским названием Пискатауэй. В этой американской деревне находится сирологический издательско-исследовательский центр Гиваргиса (Джорджа) Кираза. Центр состоит из сирологической библиотеки «Бет Мардуто» (дом знаний) и издательства «Горгиас пресс».

Джордж Кираз родился в 1963 г. в Палестине, непосредственно в Вифлееме в семье сирийских христиан, затем в 70-х семья перебралась в США, а Кираз отправился учиться в Великобританию, где получил два образования — компьютерных наук и программирования в Кембридже и сирийского языка — в Оксфорде.

Джордж и его семья, жена Кристин и трое детей, являются энтузиастами изучения сирийского языка, они говорят по-сирийски в своей семье, а кроме того Кираз служит дьяконом в сиро-православном приходе в 50 милях от Пискатауэй. Я застал Джорджа как раз в перерыве между решением издательских вопросов и поездкой в церковь на молебен за освобождение сирийского епископа, захваченного недавно недалеко от Алеппо в Сирии.

Но мне хотелось поговорить с Джорджем на одну давно интересующую меня тему. В 1990-х гг. Киразу удалось убедить фирму Microsoft включить сирийский язык в список языков, поддерживаемых Windows по умолчанию. Чтобы понять смысл и масштаб этого дела, необходимо пояснение.

Сирийский (христианский арамейский) язык считается по формальным признакам «мертвым» языком, т. е. продукция текстов на котором прекратилась и носителей живого разговорного сирийского в природе не имеется. Но это и так, и не так. Если сравнить с греческим, аналогия выйдет вполне удачная: древний язык остался только в текстах, а современный язык пользуется той же письменностью, но уже далеко ушел от своего предка. Сирийцев в мире насчитывается несколько сотен тысяч, множество их погибло в результате геноцида в Турции в 1912-15 гг., самое большое их компактное поселение находится на востоке Турции в районе города Мардин и называется Тур-Абдин (букв. «гора», т. е. монастырь служителей Бога).

Сирийцы живут в Америке, Сирии, Иране, Ираке, России, Австралии, Швеци... И хотя они не говорят на языке классической сирийской литературы (расцвет которой приходится на 3-14 вв.), в некотором смысле они заинтересованы в возможности писать на компьютере на своем родном языке не меньше других народов. Сложность заключается в том, что сирийский пользуется особым письмом, которое отчасти похоже на арабское, но имеет свой характер и вид. Кираз, кстати, написал и издал отдельный большой труд, посвященный сирийскому письму и его особенностям.

Мы сидим на веранде здания, в котором помещаются «Бет Мардуто» и «Горгиас пресс», пьем крепкий восточный кофе и Джордж Кираз рассказывает мне о своем проекте с «Майкрософтом».

Джордж, расскажи, пожалуйста, как получилось, что корпорация «Майкрософт» включила сирийский в список стандартных языков Windows?

Прежде, чем случилась эта история с «Майкрософт», все пользовались для сирийского программой MLS (Multi-lingual scholar) для DOS-среды, но к концу 1990-х Windows стала вездесущей и люди стали спрашивать, нельзя ли писать в Windows по-сирийски? Проблема была в том, что было две разных системы - английская Windows и арабская Windows. Вторая умела писать справа налево, как положено в сирийском, но ни одна, ни другая не распознавала сирийский как особый язык.

Когда «Майкрософт» перешла на новую операционную систему Windows 2000, они решили, что больше не будет отдельно европейской и ближневосточной версии - в одной системе будет и письмо слева направо, и справа налево. Тогда я и стал этим заниматься. Мне посчастливилось познакомиться с одним парнем по имени Пол Нельсон, который интересовался сирийскими шрифтами, и по удачному совпадению этот Нельсон получил работу в «Майкрософт», где он отвечал за интерпретатор письма (script-engine) в Windows. Это очень помогло в нашем деле. Но было одно требование: сирийский должен быть частью Unicode, в противном случае «Майкрософт» отказывалась делать это.

В 1998, кажется, мы внесли предложение в Unicode consortium, я, Пол Нельсон и Саргон Хассо, ассириец из Чикаго, Мы встретились с представителями Unicode и два года работали над сирийским как частью Unicode. В результате сирийский был принят как часть Unicode, и это позволило включить его в список поддерживаемых языков продуктов «Майкрософта». Главная заслуга тут принадлежала этому Нельсону, который написал весь программный код в свободное от работы время. Его босс в «Майкрософт» сказал ему: «делай, пожалуйста, но не в рабочее время». Но поскольку у них уже был интерпретатор письма для арабского, дело было не безумно сложным. Нужно было переделать его так, чтобы он распознавал сирийский.

Затем встал вопрос о шрифтах. Мы собрали команду в «Бет-Мардуто» и сделали шрифты, назвав эту семью Meltho fonts, от слова меллто - «слово» по-сирийски.

Откуда вы взяли образцы шрифтов?

Несколько шрифтов, Estrangelo Edessa, Serto Jerusalem, East Syriac Adiabene я написал еще ранее в 1986 г., кажется, для MLS, Serto Jerusalem был взят с типографических образцов монастыря св. Марка в Иерусалиме, шрифт Estrangelo Edessa был сделан похожим на шрифт изданий CSCO (Corpus scriptorum christianorum orientalium, известная серия изданий текстов издательства Peeters в Бельгии), который был разработан для типографии в Огайо. Но мы его немного подрихтовали. А восточно-сирийский шрифт мы сделали с образцов мосульского Mosul press. Я написал обо всем этом в моей книге, про историю шрифтов.

То есть, сирийский в Windows — это подсистема арабского?

Нет, нет, это теперь отдельная система, у нее своя база Unicode, и тексты распознаются как сирийские. Еще до меня, как я сказал, Windows существовала в двух видах, арабско-еврейском и европейском. Тогда уже некоторые люди стали приспосабливать самодельные сирийские шрифты для письма на арабской Windows. Там буквы были сирийские, но это не был сирийский язык. Когда ты печатал, система «думала», что ты печатаешь по-арабски. И подбор текста (sorting) делалась через арабский порядок букв в алфавите, отличный орт сирийского. Т. е. если ты сделаешь операцию «copy-paste», текст вставится как арабский! Будет такой «гаршуни наоборот» (гаршуни — гетерографическая система письма 9-16 вв., при которой арабский записывался сирийскими буквами — А. М.). Но теперь, благодаря программной адаптации, которую мы сделали для «Майкрософт», сирийский распознается как отдельный язык. Независимый язык, подобно любому другому языку. Вот, например, русский — это отдельный язык, каждый символ имеет свой код в Unicode, также и каждый сирийский символ имеет свою кодировку в Unicode, каждая буква, олаф, бет, гамаль, каждая точка, сьоме (знак множественного числа, похожий на диэрезу — А. М.).

Я знаю, что шрифты Meltho идут в сопровождении особых макросов для MS Word, для конвертации цифр из арабских в сирийские и т.д.

Да, я написал их для MLS и сконвертировал по Word. MLS был проектом компании Gamma productons в Калифорнии, в нем было пять языков: иврит, арабский, греческий, кириллический и конечно, латиница. Это была старая система, там не было мыши, все надо было делать с клавиатуры, вручную двигать курсор, чистить, в общем, каменный век. Я нарисовал сирийский для этой программы.

И они приняли твою разработку?

На самом деле они просто попросили меня сделать это. Об этом тоже есть в моей книге. К программе прилагался редактор шрифтов, мы купили его и я написал для себя сирийский. И затем уже они в Gamma, как-то прознали и позвонили мне. Они сказали: клиенты просят нас сделать сирийский, Вы не смогли бы сделать его? Тогда я сделал только серто (западно-сирийская разновидность сирийского письма), но для клиентов пришлось делать все три. В те времена шрифты были bit-map, состояли из точек. Чтобы сделать больший кегль, нужно было просто скопировать букву и нарисовать новую на ее месте. Т.е. для каждого кегля надо было писать новый шрифт. И это еще не все! Каждый принтер тогда имел свое разрешение, и для каждого принтера мы писали свои шрифты, для лазерных, точечных (dot-matrix), для точечных мы еще и писали по две разновидности, обычную и quad-density. Печатающая головка проходила над одним местом десять раз, чтобы было лучше. Для них мы делали отдельный вариант. Было сделано море шрифтов.

Теперь это векторные шрифты?

Ну да, теперь это углы, кривые Безье...

Понятно. А как с другими системами? Многие люди ищут возможности работать с сирийским на Маках, на Андроиде. Как там обстоит дело?

Ну, поскольку сирийский теперь — часть Unicode, нет никаких препятствий для того, чтобы адаптировать сирийский и для этих устройств. Проблема в том, будут ли компании, которые их разрабатывают и продвигают, делать это или нет. С Apple Computer мы уже десять лет пытаемся найти контакт. Как только появляется кто-то, кто связан с ними, в отделе языков, например, мы пишем туда письма, но пока - никакой реакции. Шрифты Meltho работают на Маке, я знаю людей, которые работают с сирийским. На нашей странице в Сети, посвященной шрифтам Meltho, есть инструкция, как работать с ними на Маке. С последней версией операционной системы можно уже работать, по крайней мере, читать можно. Веб-сайты отображаются правильно. Чтобы писать, нужна специальная программа, такая есть, она сделана в Израиле, называлась Nysus, теперь по-новому - Mellel. С ним можно писать, используя наши шрифты.

Насколько сирийский представлен в Сети? Много ли сирийских ресурсов в вэбе?

Я не думаю, что сайтов целиком на сирийском много. Это, в основном, сайты религиозных общин, использующие сирийское письмо для ново-арамейского (Modern Syriac). В таких сайтах, как правило, есть и раздел на голландском, немецком или английском, в зависимости от страны этой диаспоры... Я видел несколько таких.

Последний вопрос. Думаешь ли ты, что внесение сирийского в языки, поддерживаемые «Майкрософт», может как-то приблизить создание электронного корпуса сирийского языка, подобного Thesaurus linguae syriacae?

Мы, безусловно, нуждаемся в нем, ведь все, что мы делаем на компьютере, кодируется. Все буквы — это числа. Это делает возможным кроссплатформенность: все согласны, что E заглавное - это 65. И это позволяет портировать на Андроид, например. Сирийское олаф, например, это 070, все должны признавать это. И это требование для создания тезауруса. Кодировка не сделает корпус за нас, но она позволяет сделать его нам.

Спасибо, Джордж.

Пожалуйста!

АЛЕКСЕЙ МУРАВЬЕВ


Источники:

  1. polit.ru










© GENLING.RU, 2001-2021
При использовании материалов сайта активная ссылка обязательна:
http://genling.ru/ 'Общее языкознание'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь