К вопросу о казахском языке в интернете

Колосов Александр ( akolosov@samal.kz)

Казахстанскому Интернету исполнилось 10 лет. Так уж случилось, что его рождение и независимость Казахстана по времени почти совпадают. А это значит, что казахский язык стал государственным, и проблема его применения в интернете еще более актуальна.

Здесь можно выделить несколько вопросов, которые появились и потребовали решения. Во-первых, вопрос перевода технических терминов и широкого распространения неологизмов. На сегодняшний день в Казахстане стала весьма популярной тенденция перевода многих международных терминов и обозначений на казахский язык. При этом разными авторами некоторые термины переводятся по-разному. Это естественно. В результате многие этнические казахи зачастую не могут понять содержание статей, репортажей и т.п. А тут еще и глобализация со своим английским повсюду. Со временем проблема решится, наверное, сама собой. Так происходит и в других языках: часть новых слов закрепляется, часть тихо уходит, забывается. Но это, прежде всего, проблемы лингвистов.

Во-вторых, создатели интернета, американцы,

делали веб-страницы на основе латинского шрифта. Графика казахского языка, да и всех других тоже, в расчет не принималась. Проблему кириллицы, можно сказать, хотя и с оговорками, решили. А вот специфические знаки казахского алфавита русскими шрифтами не передаются.

В-третьих, создавать веб-страницы по-казахски оказалось еще сложнее, чем их читать. Все по той же причине особенных букв алфавита.

 

Главная проблема – отсутствие единой общепринятой кодировки шрифтов. Каждый создатель сайта занимался этим самостоятельно, в отрыве от других. Первые разработки начались еще в 1993-94 гг., однако результаты не удовлетворяли специалистов и обычных пользователей несовершенством систем и требованиями к ресурсам. Постепенно стали ориентироваться на стандартный набор шрифтов, поставляемый с ОС Microsoft Windows. Основными 3-мя семействами шрифтов являются в настоящее время Arial, Courier, Times.

Русский алфавит, кириллица, официально входит в эти семейства и занимает свою страницу в файлах-шрифтах вышеназванных семейств, чего нельзя сказать о казахском алфавите. Установка дополнительного шрифта, содержащего казахский алфавит, в компьютер не решала проблему с корректным отображением казахского текста в интернете. Дело в том, что средства работы с интернетом оперируют с семействами шрифтов, а дополнительно установленный шрифт не войдет ни в какое семейство и поэтому отображаться на экране компьютера будет только основная страница этого шрифта, обычно латиница. Проблему могла решить только корпорация Microsoft путем включения в основной набор шрифтов Windows казахского алфавита.

 

К 1998 году ситуация изменилась, прежние проблемы были решены, но встал вопрос несовместимости разработанных шрифтов. Единственным приемлемым выходом стал Unicode, поддержку которого обеспечивала компания Microsoft. В 1998 году гигант компьютерной промышленности занимался разработкой Windows NT. Он запросил информацию о шрифтах казахского языка для внедрения поддержки Unicode. Т.к. в предыдущих версиях ОС, поддерживающих Unicode, не было локализации по Казахстану, полученная информация была заложена в ОС Windows Millennium Edition, Windows 2000 и Windows XP.

Unicode является международным стандартным 16-разрядным кодом, принятым во многих странах. Включает в себя до 65 тысяч знаков, может поддерживать и китайский, и таиландский, и многие другие языки. В 2001 г. принят стандарт на 8-разрядный код в Казахстане.

При разработке первых интернет-сайтов на казахском языке, веб-дизайнеры просто копировали текст на казахском языке как рисунок и затем вставляли его в страницу. Таким способом был спроектирован первый сайт телекомпании Хабар, позже – Физико-технического института АН РК. В 1997 г. с помощью транслитерации латиницей выставили страничку на казахском языке http://www.sci.kz

Когда нашли более приемлемое решение – Unicode, – работы по созданию сайтов пошли веселее. Один из первых кто использовал шрифты Unicode, стал Кайрат Рахим. http://www.pmicro.kz/~library/abai.htm .

С помощью нового унифицированного кода Unicode были спроектированы и другие сайты. Среди них

http://www.samal.kz/~qazaq/jasqazaq/

http://www.samal.kz/~akolya/qaztarih/

http://www.kazakhtili.kz/

http://www.kazaag.kz/

http://www.qazaqtili.com/

http://www.makaldar.narod.ru/ и др.

Словари

http://kz.host.kz/

http://sozdic.kz/

http://www.tilashar.kz/ и др.

В те годы каждая веб-студия, группа или просто разработчики решали проблему по-своему. Компания Nursat, например, начала работу над казахоязычными сайтами одной из первых. Поначалу вручную кодировались символы. Такая работа была кропотливой, отнимала слишком много времени. Так были созданы в 1999 году www.kazwoman.nursat.kz и позже www.tilashar.kz. Растягивающиеся сроки работ не устраивали клиентов, поэтому было принято решение автоматизировать процесс чтобы «безболезненно» внедрять шрифты. Но все же операторам и системным администраторам приходилось «работать руками», сроки работ по-прежнему были довольно большими.

Пионером автономной работы стал сайт телекомпании Хабар www.khabar.kz . Затем была внедрена разработка компании, модуль Unix, задачей которого является разработка веб-страниц на казахском языке, и их просмотр различными типами браузеров. Веб-страницы, созданные при помощи этого модуля, полностью совместимы с операционными системами Windows 95/98/NT/2000, корректно работают под системами семейства Unix. Благодаря этому модулю пользователь, даже не имея на компьютере казахского шрифта и специального драйвера казахского языка, может просматривать web-страницы, а также распечатывать интернет-страницы без потери языковой кодировки.

В основу этого программного продукта заложена концепция использования подгружаемых динамических шрифтов на компьютер пользователя. Динамический шрифт создается при помощи модуля, который в свою очередь использует некоторые бесплатные библиотеки, входящие в состав Microsoft Weft. Программная часть модуля написана на языке Microsoft Visual Basic. В нее вошли следующие компоненты: подмодуль для создания динамического шрифта, текстовый редактор с возможностью создания *.html документа с различными типами кодировок и FTP-подмодуль, для выставления созданного материала на сервер клиента и его администрирования. Модуль позволяет создавать новые *.html документы и редактировать уже имеющиеся. При создании страницы используется кодировка Unicode (UTF-8). Аналог этой кодировки в модуле имеет название TransCyrillic. Созданные файлы выкладываются при помощи FTP-подмодуля на сервер.

Впервые модуль был применен при разработке веб-сайта Ассоциации деловых женщин Казахстана www.kazwomen.nursat.kz. Он прошел испытания под всеми типами браузеров и операционных систем типа Windows 95/98/NT/Me/2000, XP и Unix. Официальная презентация этого программного продукта состоялась на втором казахстанском интернет-форуме, который проходил в Алматы 6-7 июня 2001 года. Сегодня модуль конвертации национальных языков в интернете активно применяется при разработке клиентских веб-систем. С его помощью можно создавать сайты не только на казахском, но и на узбекском, турецком, кыргызском и даже… китайском языках.

Таким образом Нурсатом созданы сайты:

• Ассоциация деловых женщин Казахстана www.kazwoman.nursat.kz

• Министерство Иностранных дел РК www.mfa.kz

• Сайт изучения казахского языка www.tilashar.kz

• Телевизионная агентство Хабар www.khabar.kz

• Казахская компания по управлению электрическими сетями ОАО “Kegoc” www.kegoc.kz

• Национальная холдинговая компания “Алматыкурылыс” www.almatykurylys.kz

 

Интересной работой 2001 г. стало изобретение карагандинца Андрея Сергеева «Казновица». Он рассказывает: «Однажды, занимаясь с дочкой уроками (казахским языком), я придумал Транскрипцию «Казновицу» – схему записи казахских специфических букв (диакритических символов) с помощью кириллицы и одного латинского символа i.

Пример:

?АЗА?СТАН РЕСПУБЛИКАСЫ =

КЪАЗАКЪСТАН РЕСПУБЛИКАСЫ

Выглядит непривычно, НО! Я не использовал при этом никаких ДОПОЛНИТЕЛЬНЫХ СРЕДСТВ для написания этого слова, только БУКВОСОЧЕТАНИЯ!

Къарагъанды къаласы, Нуьркен Аьбдиров коьшесi, 5 уьйi.

Название КАЗНОВИЦА включает в себя сокращение трех слов: КАЗахская НОВая кириллИЦА. В основе идеи казновицы – немецкий подход к замене специальных диакритических символов немецкого языка (умлаутов A:, O, U и ?) на буквосочетания, так называемые диграфы (АЕ, OE, UE и SS). В Германии параллельно существуют и умлаты и диграфы»

Казновица учитывает особенности тюркского слово- и звукообразования, что подтверждено ведущими специалистами тюркологами (Кобей Хусаинов, Канат Тумыш) , не требует больших затрат, простота и открытость идеи позволяет пользоваться ей совершенно бесплатно для аккуратной передачи средствами русского алфавита всех тонкостей казахского написания слов.

А вот что говорит по этому поводу Михаил Юрьевич Лисянский, специалист по юзабилити студии Артемия Лебедева:

«Казановица лишена очень многих психологических недостатков новой письменности, поскольку является на самом деле постепенной реформой алфавита. Из-за того, что для стандартной кириллицы в интернете уже сложились определенные стандарты, использование Казановицы позволяет избежать огромного количества технических сложностей и потому использовать казахский язык для передачи информации и общения через интернет прямо сейчас.

По прошествии некоторого времени, в течение которого Казановица использовалась в интернете для общения между людьми, выяснилось, что Казановица не замыкается только на казахском языке – на ее основе могут быть созданы и создаются интернет-письменность для многих современных языков, чей алфавит основан на кириллице, но у которых есть проблемы со стандартами в компьютерной индустрии. Таким образом, казахский язык дает пример, что, не смотря ни на что, национальные языки могут иметь свое развитие и в современных средствах коммуникации, каким является интернет. В соответствии с принципами, заложенными в Казановице, успешно были созданы интернет-письменности для киргизского, башкирского и удмуртского языков».

 

В июне 2001 г. в Интернет Трейнинг Центре www.samal.kz прошла онлайновая научно-практическая конференция по вопросам казахского языка в интернете. В ее работе приняли участие видные лингвисты, преподаватели казахского языка, представители интернет-общественности. Начинание поддержано Управлением по языкам аппарата Акима г. Алматы. Рассмотрено было несколько весьма актуальных вопросов. Особенные споры развернулись на тему перехода казахского языка на латинскую графику.

Основным аргументов приверженцев этой идеи было то, что клавиатура современного компьютера создана для латинской графики, поэтому перевод казахского языка на нее одним махом все проблемы решает. Оппоненты же говорили, что клавиатура и вообще современный облик компьютера – дело временное. Завтра появится другая, более совершенная техника, переход на нее куда более легкое дело, нежели столь радикальная реформа языка. И вообще, не язык надо к технике приспосабливать, а технику к языку. Переход же на латиницу вызовет большой ряд новых проблем, относящихся к куда более значимым вещам в культуре, языкознании, библиотечном деле, сохранении интеллектуального наследия. Примерно поровну разделилось число участников дискуссии. На сегодняшний день есть немало сайтов, которые используют для казахского языка как кириллицу, так и латиницу. Но это не совсем латинский шрифт, а скорее турецкий его вариант.

 

Нынешнее состояние дел в этом вопросе хорошо видно на конкурсе AWARD 2004. 43 сайта заявлены как казахоязычные. При этом только небольшая их часть единственным языком информации рассматривает казахский. В основном же, содержание представлено на двух или даже трех языках – казахском, английском и русском. Таковы неписанные законы интернета http://www.award.kz/pnom.php?shnom=3 .

 

Еще одна работа Интернет Трейнинг Центра. Болатхан Жайдаринов приложил большие старания к созданию ресурса MP3 «Казахские песни»http://kazahanderi.samal.kz/ . Там сейчас 355 песен на казахском языке. Посетителей настолько много, что у ИТЦ появилась проблема слишком большого исходящего трафика.

 

Казахстанской Федерацией Интернета www.kif.kz готовится к печати очередное методическое пособие «Основы веб-дизайа». Евгений Чуриков, веб-мастер IREXа подготовил для него приложение – подробное руководство по технике создания веб-сайтов на казахском языке. Это облегчит участникам программы Фонда Сорос-Казахстан «Интернет для учреждений гражданского сектора» www.os.kz школам и общественным организациям применение казахского языка в интернете.

Вызывают интерес работы известного казахстанского тюрколога Александра Николаевича Гаркавца, главного научного сотрудника Института истории и этнологии МНиО–АН РК, ознакомиться с которыми можно на сайтах www.qypchaq.freenet.kz, www.qypchaq.unesco.kz Проблемы графики казахского языка рассматриваются в контексте тюркологии, в контексте научных интересов ученого. А они широки: от древних кыпчакских языков до развития тюркских языков, в частности казахского, в условиях взаимодействия с другими языками и языковой политики, языковых контактов, языкового строительства.

Большим энтузиастом применения казахского языка в интернете, применения современных информационных технологий в языкознании, в отношении казахского языка, является Алия Абжановна Курышжанова, ученый-лингвист, статьи которой можно почитать не только на страницах нашего журнала, но и на сайте «История казахстанского Интернета» http://www.samal.kz/kazinet/ .

При подготовке статьи использованы материалы, предоставленные:

Гульзирой Меттыбаевой, еще одна ее статья есть на http://www.samal.kz/samalkz/siltime.shtml

Болатханом Жайдариновым

Евгением Чуриковым

Компанией «Нурсат»

Интернет Трейнинг Центром

Leave a Reply

Your email address will not be published. Required fields are marked *