В отделе прикладной семиотики Академии наук Чеченской Республики с 2014 года разрабатывается проект «Чеченская локализация компьютерных программ».
Цель проекта.
· Перевод на чеченский язык и адаптация к национальным традициям и обычаям часто используемых программ для компьютеров и мобильных устройств.
· Автоматизированная проверка правописания текстов на чеченском языке.
· Автоматизированный перевод чеченских текстов на другие языки и обратно.
· Синтез и распознавание чеченской речи.
Этапы выполнения проекта.
· Преобразование всех изданных словарей чеченского языка в цифровой машинно-обрабатываемй формат (выполнено, см. сайт отдела) .
· Создание приложения для удобства набора на клавиатуре чеченских текстов (выполнено, компьютерная программа Elp-I).
· Создание лексической базы данных чеченского языка (выполнено, база данных на основе словаря Мациева содержит 3 млн. слов и словоформ).
· Создание системы автоматизированной системы проверки правописания (частично выполнено, для OS Linux создана система проверки орфографии чеченского языка).
· На основе изданных словарей создан онлайн чеченско-русский, русско-чеченский словарь «Дикдошам» (выполнено, см. сайт отдела).
· Подготовка предложений по изменению орфографии чеченского языка (выполнено).
· Подготовка корпуса чеченского языка.
· Подготовка 20-ти часовой звуковой базы языка (выполнено).
· Создание системы синтеза чеченского языка (частично выполнено, online-система на компьютерах и смартфонах читает тексты на чеченском, http://dosh-speech.ru/ ).
· Создание системы распознавания чеченского языка.
· Создание систем машинного перевода чеченского языка.
· Локализация компьютерных программ.
Состояние дел.
1. В отделе прикладной семиотики АН ЧР работают 6 научных сотрудников – 4 программиста и 2 филолога (для реализации подобного проекта в Академии наук Татарстана в 1993 году создан НИИ Прикладной семиотики).
2. Созданная на основе изданного ещё в 1961 году словаря Мациева и существующей орфографии система проверки правописания несовершенна. На основе новой орфографии, утвержденной Указом Главы ЧР Р.А. Кадырова, модифицируется созданная лексическая база чеченского языка и планируется подготовка приложений для автоматического изменения текстов в соответствии с новой орфографией.
С.М. Умархаджиев
4 комментария
Соьлжа-ГIала
Текстехь хьахийна йолу “dosh-speech.ru” сайт схьа ма ца йоьллу сан, болх беш йац и, схьахетарехь.
admin
Доброго дня. Мы работаем над усовершенствованием синтезатора речи. Этот сайт будет обновлен до более современной базы. Спасибо за понимание.
Yusup Khasbulatov
Что значит данный пункт? Тут имеется ввиду в формат doc?
“Преобразование всех изданных словарей чеченского языка в цифровой машинно-обрабатываемй формат (выполнено, см. сайт отдела) .”
Я работаю над парсером словаря Мациева: https://github.com/khashashin/maciev_dict_parser/blob/master/maciev_d_parser.py
Если у вас имеется более развитый парсер, не могли бы вы им поделиться?
admin
Доброго дня! С Вами скоро свяжутся.