• Новости

    Новогодние праздники приближаются, но это не снижает темп работы отдела прикладной семиотики АН ЧР

    Основная практическая работа по первому этапу проекта была связана с подготовкой базы данных, которая состоит из чеченских текстов и соответствующих им фонограмм речи. База данных предназначена для машинного обучения нейросетевых систем синтеза и распознавания речи. В рамках первого этапа по проекту решены следующие задачи: создание речевой и текстовой базы данных для обучения системы синтеза речи на базе глубоких сверточных нейронных сетей, создание различных программ для работы с грамматикой и речевыми технологиями чеченского языка, проводить оптимизацию созданной программы автоматического транскрибирования чеченских текстов, производить запись аудио базы по подготовленным текстам, выполнить обработку записанных аудиофайлов, разработать программный модуль нормализации числительных и аббревиатур. Ведется работа по обработке голоса диктора и аудио файлов, при помощи…

  • Новости

    День Конституции Российской Федерации!

          Дорогие сограждане! От имени Президиума АН ЧР и от себя лично поздравляю вас со знаменательной датой – Днем Конституции Российской Федерации! Для нас этот праздник имеет особое значение, являясь символом свободы и утверждением торжества права и демократии. С принятием Конституции начался процесс активного восстановления и развития социально-экономической сферы в стране, улучшения благосостояния наших граждан. Мы все помним, как многонациональный народ Чеченской Республики был вытиснут из правового, конституционного, экономического и информационного поля России. День Конституции – это знаковое событие, закрепившее основы государственного строя России. Благодаря мужеству и героизму Первого Президента ЧР, Героя России Ахмата-Хаджи Кадырова, Чеченская Республика вернулась в лоно российского конституционного пространства и заняла достойное место среди…

  • Новости

    Получено свидетельство о регистрации программы для ЭВМ

    Сотрудники отдела прикладной семиотики, работающие над проектом создания системы синтеза чеченской речи, разработали программный модуль нормализации числительных. Для того, чтобы программа синтеза речи корректно распознавала и озвучивала слова, не отображенные на письме побуквенно, было решено создать отдельный модуль – нормализатор – который будет впоследствии встроен в систему синтеза речи. Для создания этой программы был определен перечень задач и разработан алгоритм решения каждой из них в соответствии с особенностями чеченской грамматики, сложившихся традиций сокращения, орфографии и орфоэпии. Программа преобразует цифровые выражения числительных в тексте в словесные формулировки на чеченском языке, автоматически определяет вида числительного, выраженного цифрами (количественное, порядковое); делает расшифровку дробных числительных. Кроме того, программа будет интересна и полезна школьникам и студентам, изучающим чеченский…

  • Новости

    О возложении обязанностей Президента Академии наук ЧР

    Радостным событием для научного сообщества Чеченской Республики стало известие о подписании указа Главой Чеченской Республики, Героем России Рамзаном Кадыровым о возложении обязанностей Президента Академии наук ЧР на действующего президента, известного российского ученого, профессора, академика Гапурова Ш.А. Данный указ является подлинным свидетельством того, что Глава ЧР, Герой России Р.А. Кадыров понимает важность сохранения и развития научного потенциала республики. За последние годы наука Чеченской Республики сделала поступательные и заметные шаги в своем развитии, пройдя сложный и тернистый путь возрождения и созидания, начатый по инициативе и распоряжению Первого Президента ЧР, Героя России Ахмата-Хаджи Кадырова (Дала г1азот къобал дойла цуьнан!). Коллектив Академии наук ЧР выражает глубокую благодарность Главе ЧР, Герою России Р.А. Кадырову за…

  • Новости

    День народного единства

    Дорогие друзья! – замечательная история наших предков. Благодаря им сейчас процветает наша могучая Россия. Наш Первый Президент, Герой России Ахмат-Хаджи Кадыров всегда уделял особое внимание вопросам сохранения межнационального согласия. Он говорил, что многообразие национальных культур, дружба народов являются залогом сильного и процветающего государства. И это действительно так. Сегодня благодаря деятельности Главы Чеченской Республики, Героя России Рамзана Ахматовича Кадырова наш регион уверенно развивается и является одним из самых процветающих в России. Самое главное, что люди чувствуют себя членами единой, дружной семьи. И так будет всегда! Наша гордость не имеет границ за то, что мы ходим по земле, которая пропитана до мельчайшей крупицы прошлым. А прошлое – это история, которую мы должны…

  • Новости

    TerahYoza

    Возможность перевода цифровых выражений числительных в тексте в словесные формулировки на чеченском языке с соблюдением всех правил орфографии предоставила программа TerahYoza. Главная функция программы: 1) перевод записи цифрами в словесную запись; 2) автоматическое определение вида числительного, выраженного цифрами (количественное, порядковое); 3) расшифровка дробных числительных.  

  • Новости

    Математическая модель поверхностного натяжения двойных систем

    13.10.2020 состоялось заседание совместного научного семинара Отдела физико-математических исследований КНИИ РАН и Цента проблем материаловедения АН ЧР. С докладом «Математическая модель поверхностного натяжения двойных систем» выступил доктор физико-математических наук С.М. Умархаджиев. Состоялась живая и полезная дискуссия. Профессор Р.Х. Дадашев высоко оценил полученные докладчиком результаты.  

  • Новости

    Синтез чеченской речи: работа над программной обработкой голоса и специализированных плагинов

    Для системы DCTTS синтеза речи размер минимальной обучающей базы составляет 5 часов. Такая база использовалась отделом прикладной семиотики АН ЧР в 2019 году во время экспериментального обучения нейронных сетей. В рамках разрабатываемого проекта у нас появилась возможность подготовки более качественной и объемной (20 часов речи) фонетико-акустической базы данных. Подготовленная текстовая база данных была разбита на отдельные предложения длиной не более 180 символов вместе с пробелами. Каждое предложение пронумеровано для дальнейшей порядковой аудиозаписи по соответствующей нумерации. В итоге количество предложений в текстовой и аудио базе составило 14200. Таким образом, создаваемая база данных состоит из текстового документа с предложениями и звуковых файлов в формате.wav, то есть каждому текстовому предложению соответствует аудио образец…

  • Новости

    Разработка прототипа системы синтеза речи для чеченского языка

    Отделом прикладной семиотики АН ЧР проводится работа над разработкой экспериментальной фонетико-акустической базы чеченского языка, адаптированной для обучения нейросетевой системы синтеза речи. Основная практическая работа по первому этапу проекта была связана с подготовкой базы данных, которая состоит из чеченских текстов и соответствующих им фонограмм речи. База данных предназначена для машинного обучения нейросетевых систем синтеза и распознавания речи. В рамках первого этапа по проекту решались следующие задачи: создание речевой и текстовой базы данных для обучения системы синтеза речи на базе глубоких сверточных нейронных сетей; создание различных программ для работы с грамматикой и речевыми технологиями чеченского языка; проведение оптимизации созданной программы автоматического транскрибирования чеченских текстов; произведение записи аудио-базы по подготовленным текстам; выполнение обработки…

  • Новости

    Онлайн семинар отдела

    19 августа состоялся онлайн-семинар отдела прикладной семиотики АН ЧР. Одной из тем обсуждения был процесс работы над проектом по созданию системы синтеза чеченской речи. Основной задачей стоял вопрос об улучшении качества записи диктора. Устранение посторонних звуков и шумов проводится программистами отдела Султановым Зелемханом и Астемировым Арсламбеком. Подобная обработка аудиофайлов проводится “вручную”, данный метод требует долгой и кропотливой работы специалистов. Создание оболочки на языке программирования Python было поручено Астемирову Арсламбеку.  Регистрация в Роспатенте программы нормализатор числительных и аббревиатур, заведующий отделом Умархаджиев С.М. поручил сотруднику Султанову Зелимхану. В процессе обсуждения было решено создать базу аббревиатур и иных сокращений, впоследствии  также передать ее для записи диктору, т.к. для дальнейшей работы данная база необходима…