29 июня отдел прикладной семиотики провел очередной еженедельный семинар, в ходе которого обсуждались проблемы разрешения графической омонимии, необходимой для оптимизации созданной системы синтеза речи. Также были решены рабочие вопросы по создаваемому программному модулю распознавания омографов в чеченских текстах.
Докладчик Ясаева Мадина представила описание работы по сбору текстовой базы для подготовки обучающего корпуса распознавания омографов.
Отметим, что в базу включены тексты на чеченском языке различных стилей. Объем на сегодняшний день составляет около 5 млн. страниц.
Данным отделом также ведется работа по созданию программы автоматического переноса чеченских текстов со старой орфографии на новую.