Новости

О проекте внедрения чеченского языка в компьютерные технологии

В отделе прикладной семиотики Академии наук Чеченской Республики с 2014 года разрабатывается проект «Чеченская локализация компьютерных программ».

Цель проекта.

· Перевод на чеченский язык и адаптация к национальным традициям и обычаям часто используемых программ для компьютеров и мобильных устройств.

· Автоматизированная проверка правописания текстов на чеченском языке.

· Автоматизированный перевод чеченских текстов на другие языки и обратно.

· Синтез и распознавание чеченской речи.

Этапы выполнения проекта.

· Преобразование всех изданных словарей чеченского языка в цифровой машинно-обрабатываемй формат (выполнено, см. сайт отдела) .

· Создание приложения для удобства набора на клавиатуре чеченских текстов (выполнено, компьютерная программа Elp-I).

· Создание лексической базы данных чеченского языка (выполнено, база данных на основе словаря Мациева содержит 3 млн. слов и словоформ).

· Создание системы автоматизированной системы проверки правописания (частично выполнено, для OS Linux создана система проверки орфографии чеченского языка).

· На основе изданных словарей создан онлайн чеченско-русский, русско-чеченский словарь «Дикдошам» (выполнено, см. сайт отдела).

· Подготовка предложений по изменению орфографии чеченского языка (выполнено).

· Подготовка корпуса чеченского языка.

· Подготовка 20-ти часовой звуковой базы языка (выполнено).

· Создание системы синтеза чеченского языка (частично выполнено, online-система на компьютерах и смартфонах читает тексты на чеченском, http://dosh-speech.ru/ ).

· Создание системы распознавания чеченского языка.

· Создание систем машинного перевода чеченского языка.

· Локализация компьютерных программ.

Состояние дел.

1. В отделе прикладной семиотики АН ЧР работают 6 научных сотрудников – 4 программиста и 2 филолога (для реализации подобного проекта в Академии наук Татарстана в 1993 году создан НИИ Прикладной семиотики).

2. Созданная на основе изданного ещё в 1961 году словаря Мациева и существующей орфографии система проверки правописания несовершенна. На основе новой орфографии, утвержденной Указом Главы ЧР Р.А. Кадырова, модифицируется созданная лексическая база чеченского языка и планируется подготовка приложений для автоматического изменения текстов в соответствии с новой орфографией.

 

С.М. Умархаджиев

 

4 комментария

  • Соьлжа-ГIала

    Текстехь хьахийна йолу “dosh-speech.ru” сайт схьа ма ца йоьллу сан, болх беш йац и, схьахетарехь.

    • admin

      Доброго дня. Мы работаем над усовершенствованием синтезатора речи. Этот сайт будет обновлен до более современной базы. Спасибо за понимание.

  • Yusup Khasbulatov

    Что значит данный пункт? Тут имеется ввиду в формат doc?

    “Преобразование всех изданных словарей чеченского языка в цифровой машинно-обрабатываемй формат (выполнено, см. сайт отдела) .”

    Я работаю над парсером словаря Мациева: https://github.com/khashashin/maciev_dict_parser/blob/master/maciev_d_parser.py

    Если у вас имеется более развитый парсер, не могли бы вы им поделиться?

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *