• Новости

    О системах проверки орфографии

    19 августа прошло совещание отдела прикладной семиотики АН ЧР. На совещании обсуждались вопросы касательно видов системы и программы проверки орфографии и содержание модулей системы синтеза чеченской речи.   Младший научный сотрудник Астемиров Арсламбек выступил с докладом о системах проверки орфографии, таких как: Hunspell, ОРФО и LanguageTool.   В ходе слушания доклада, среди присутствующих возникло обсуждение вопросов принципиально важных при выборе той или иной системы для внедрения чеченского языка.   Также на заседании были подняты вопросы подготовки и внедрения в систему синтеза чеченской речи некоторых модулей: нормализатор текстов, транслитератор, транскриптор и т.д. Были рассмотрены пути наиболее упрощенных алгоритмов при разработке данных модулей и приняты  решения относительно их реализации.   Сбор дополнительной…

  • Новости

    Проект системы автоматического синтеза и распознавания чеченской речи получил грант на реализацию

    Академия наук и ГГНТУ им.акад. М. Д. Миллионщикова разработали проект первой системы синтеза чеченской речи, который уже получил грант на реализацию. Разработчиком проекта выступила старший преподаватель кафедры «Информатика и вычислительная техника» Элиса Израилова. На стадии реализации эта инициатива получила положительные отзывы научной общественности. Особенность и необходимость ее подтверждает и факт того, что проект «Создание системы автоматического синтеза и распознавания чеченской речи» стал победителем программы «Старт» Фонда содействия инновациям. «Так как почти каждый из нас говорит и понимает речь, развитие естественно-языковых систем позволит человеку без специальных навыков общаться с компьютером в любое время и в любом месте без дополнительного обучения, используя такие устройства как мобильный телефон», – рассказывает Э. Израилова. Необходимо…

  • Новости

    TXTFILTERER

    Возможность сверки словарного материала на чеченском языке предоставила программа TXTFILTERER. Программа автоматически проверяет все слова из указанного текстового файла на их наличие в эталонной базе данных. Файлы для сверки и «эталонной базы» можно задать вручную. Программа активно используется для выполнения технической части работы со словарным материалом, как специалистами по компьютерной лингвистике, так и филологами, работающими в области лексикографии. Программа может работать с различными форматами текстовых документов, таких как pdf, txt, doc, docx, xls, odt и т.д..

  • Новости

    ELP-I_FOR_LINUX

    Общеизвестная программа для набора буквы «Ӏ» на чеченском языке, теперь доступна в операционной системе LINUX. Программа ELP-I заметно облегчила не только набор текстов на чеченском языке, но и редактуру готовых материалов. После установки программы на компьютер и настройки русской клавиатуры, ELP-I реализует следующие функции: Нажатие клавиши BKSL (обратный слэш «\») – выдает букву I; В документе LibreOffice Writer, одновременное нажатие двух клавиш Alt+I – заменяет все цифры «1», играющие роль буквы «I», на букву «I».

  • Новости

    Заседание семинара

    25.06.2020 прошло первое еженедельное заседание семинара отдела прикладной семиотики АН ЧР, отложенное ранее в связи режимом самоизоляции. На заседании были подняты вопросы связанные с переходным периодом работы в отделе по различным направлениям. Одним из наиболее активно разрабатываемых, является создание систем синтеза чеченской речи. В рамках проекта, реализовываемого по гранту, предполагается работа в два этапа. В настоящее время, к концу подходит работа над первым этапом, а именно – над созданием базы данных, включающую тексты на чеченском языке и соответствующие им аудиофайлы. На заседании были обсуждены вопросы по завершению первого этапа и началу работы над вторым. Следующей темой стало внесение изменений в правила орфографии чеченского языка. В связи с чем перед сотрудниками…

  • Новости

    Программа для ЭВМ: «Elp-Az»

    Число программ по поддержанию и развитию чеченского языка пополнилось с выходом «Elp-Az». Программа расширяет возможность транскрибирования чеченских текстов. В ее основу заложен фонетический алфавит Azbat — технический фонетический алфавит чеченского языка разработанный отделом прикладной семиотики АНЧР. Авторы программы: Умархаджиев Салаудин Мусаевич, Израилова Элиса Салаудиновна, Бадаева Айшат Салауддиновна, Бекаев Мовсар Хамидович, Султанов Зелимхан Аюбович, Эльсаев Якуб Витальевич, Абдулкадыров Адам Турпалалиевич. Программа «Elp-Az» расширяет возможности транслитерации чеченских текстов с использованием фонем и транскрибирования чеченских текстов по правилам графема к фонеме на основе алфавита Azbat. При создании данного ресурса использовался язык программирования – Python. Главной сложностью для разработчиков являлось соблюдение правил огромного числа символов. Программа работает на операционных системах Windows и Linux. .

  • Новости

    AZBAT – технический фонетический алфавит чеченского языка

    В самом начале развития компьютерных технологий, встал вопрос о необходимости создания фонетического технического алфавита чеченского языка и его адаптации на все компьютерные системы. Т.к. кириллица уступает латинице в этом вопросе, многие программы прибегают к системе латинских символов, в связи с чем было принято решение о проведении работы в данной области. Руководителем проекта стала Израилова Элиса, начавшая исследования в этом направлении. Стоит отметить, что распознаванию в любой системе поддается очень узкий спектр знаков. Трудоёмкость данной задачи выявилась в ходе работы, т.к. возникла необходимость в передаче звукового состава чеченского языка при помощи машиночитаемых символов латинского алфавита. Главная проблема заключается в том, что количество звуков в чеченском языке превышает численность символов в латинском алфавите. Решая данную задачу, пришлось прибегнуть к сочетанию символов для передачи одного звука, но при…

  • Новости

    Впервые создана система синтеза чеченской речи

    В отделе прикладной семиотики АН ЧР в рамках проекта “Чеченской локализации компьютерных программ” проводится разработка компьютерных программ для создания системы синтеза чеченской речи – чтения текстов на чеченском языке.

  • Без рубрики

    Программа для сравнения текстов

    Сотрудниками отдела прикладной семиотики разработана программа TxtFilterer, предназначенная для обработки и анализа текстовых файлов. Она позволяет сравнить два текстовых файла и вывести список слов, которые либо есть в обоих файлах, либо есть в одном файле, но отсутствуют в другом. Поддерживает текстовые файлы форматов txt, pdf, odf, xls, rtf, doc, docx.