Новости

О проекте внедрения чеченского языка в компьютерные технологии

С.М. Умархаджиев, канд. физ.-мат. наук,
заведующий отделом прикладной семиотики
Академии наук Чеченской Республики

Для современного человека, который хочет общаться на чеченском языке, очень важны следующие возможности, которые могут быть предоставлены компьютерными программами:

  1. проверка правописания текста на чеченском языке;
  2. перевод текста с чеченского языка на любой другой язык и обратно;
  3. чтение и распознавание компьютером текстов на чеченском языке.

Несколько лет назад, на очередном праздновании Дня чеченского языка, Глава Чеченской Республики Рамзан Ахматович Кадыров поставил задачу о необходимости дальнейшего усиления работы по сохранению чеченского языка, в том числе и о составлении словарей чеченского языка. Во исполнение этого поручения, в Академии наук ЧР была создана группа специалистов для внедрения чеченского языка в компьютерные технологии. По примеру Академии наук Татарстана, где подобные разработки проводятся большим коллективом ученых, объединенных в НИИ Прикладной семиотики, для разработки проекта «Чеченская локализация компьютерных программ»  был создан отдел прикладной семиотики.

В настоящее время в отделе работают 6 научных сотрудников: 1 филолог и 5 программистов. Над проектом локализации работают и сотрудники отдела языка и литературы (рук. Нурвади Альбеков). Текущие задачи проекта обсуждаются на совместных научных семинарах. Учеными-филологами обсуждались предложения по изменению орфографии чеченского языка (http://ps95.ru/noxchijn-orfografin-problemashna-lerina-iilmanan-seminar/). В 2016 году в Академии наук ЧР была проведена научно-практическая конференция с участием более 100 ученых, журналистов и педагогов, после которой было принято решение не изменять орфографию и правила грамматики чеченского языка (http://ps.gknu.ru/obyavlenie-50http://ps95.ru/noxchijn-orfografi-toyarexa-mexala-g%D3%8Fulch/).

В первую очередь для реализации проекта «Чеченская локализация компьютерных программ»  необходимо было иметь электронные словари чеченского языка. Была проведена очень кропотливая работа по оцифровыванию двух основных словарей: Мациев А.Г. «Чеченско-русский словарь». М. 1961; Карасаев А.Т., Мациев А.Г. «Русско-чеченский словарь». М. 1978. Эти словари и другие словари, а также программы, созданные в отделе прикладной семиотики, выложены для свободного доступа на сайтах Академии наук (www.anchr.ru) и отдела прикладной семиотики (http://ps95.ru/category/than-belhash/) .

Для удобства набора на клавиатуре чеченского текста создана компьютерная программа Elp-Ӏ (http://ps95.ru/noxchijn-i-elp-yazden-programma/).

Сотрудниками отдела подготовлен и издан словарь:  Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А.,Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам. Грозный. 2017 (https://elibrary.ru/item.asp?id=30491142 .

Было создано веб-приложение «Нохчийн-оьрсийн, оьрсийн-нохчийн онлайн дошам «ДикДошам», которым можно пользоваться через Интернет на сайтах отдела и Академии наук (http://ps95.ru/dikdosham/). Это приложение включает материал следующих словарей:

  1. Мациев А.Г. Нохчийн-оьрсийн дошам;
  2. Карасаев А.Т., Мациев А.Г. Оьрсийн-нохчийн дошам;
  3. Умархаджиев С.М., Ахматукаев А.А. Нохчийн-оьрсийн, оьрсийн-нохчийн математикин  терминийн дошам;
  4. Абдурашидов Э.Д. Нохчийн-оьрсийн, оьрсийн-нохчийн юридически терминийн дошам;
  5. Берсанов Р.У. Нохчийн-оьрсийн адаман анатомин дошам;
  6. Берсанов Р.У. Оьрсийн-нохчийн адаман анатомин дошам;
  7. Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А., Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам;
  8. Байсултанов Д.Б. Нохчийн-оьрсийн дошам

Совместно с отделом языка и литературы создается тезаурус чеченского языка.

Для работы по созданию электронной лексической базы созданы 7 компьютерных программ, на которые в Федеральной службе по интеллектуальной собственности получены Свидетельства государственной регистрации программ для ЭВМ (http://ps95.ru/noxchijn-respublikin-%D3%8Filmanijn-akademin-pajde-semiotikin-otdelan-belxan-korta-zham%D3%8Fash/).

Проводится исследовательская работа по организации компьютерного чтения чеченских текстов. По результатам всех этих разработок сотрудниками отдела опубликованы статьи в научных журналах. Для организации на компьютере автоматической проверки тестов создана электронная база чеченского языка (словник), содержащая около 2,5 миллиона слов.

Таким образом, проведена не только работа, направленная на чеченскую локализацию компьютерных программ, но и подготовлены специалисты для практической реализации проекта.

Проект фактически уже реализован: компьютеры отдела прикладной семиотики проверяют орфографию чеченских текстов, подчеркивают неправильные слова и предлагают варианты замены.

Только для того, чтобы любой человек мог настроить свой компьютер на проверку чеченских текстов, подготовленные в отделе программы должны быть встроены в редактор Word коммерческой компании Microsoft. Для доступа к коду редактора текстов Microsoft Word нужно получить разрешение компании Microsoft. На наше обращение в офис Microsoft нам было предложено для определения востребованности проекта выложить идею в чат сайта компании Microsoft для голосования.

Идея получила около 11 тыс. голосов (https://word.uservoice.com/forums/304924-word-for-windows-desktop-application/suggestions/32108578-chechen-spelling-dictionary). Ни одна идея, выложенная на этот чат, не получала такую высокую поддержку.Теперь остается ждать реакции компании Microsoft.

Для полной реализации проекта «Чеченская локализация компьютерных программ» мы очень нуждаемся в поддержке Главы Чеченской Республики Рамзана Ахматовича Кадырова.

 

Ещё раз хотим подчеркнуть, что в данном проекте речь идет только о внедрении чеченского языка в компьютерные технологии. Об изменении орфографии и грамматики чеченского языка речь не идет.

Все наши разработки, компьютерные программы, электронные словари выложены на сайте Академии наук ЧР (http://ps95.ru/) и находятся в свободном доступе.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *