Керланаш

Впервые создана система синтеза чеченской речи

В отделе прикладной семиотики АН ЧР в рамках проекта “Чеченской локализации компьютерных программ” проводится разработка компьютерных программ для создания системы синтеза чеченской речи – чтения текстов на чеченском языке.

      Существуют различные системы синтеза естественных языков, созданные коллективами программистов таких крупных компаний, как  Google, Microsoft, Yandex, Центр речевых технологий (Санкт-Петербург), Sakrament (Минск). Эти системы построены на основе многолетних исследований и предварительно созданных языковых корпусов, состоящих из акустико-фонетических, текстовых, речевых баз данных. Для чеченского языка систематические исследования в области речевых технологий не проводились,  поэтому сотрудникам отдела фактически пришлось начать работу “с нуля”.

Чеченский язык относится к категории малоресурсных языков, для которых развитие информационных технологий в определенной сфере является недостаточным. Таким образом, работа отдела над речевыми технологиями велась в ограниченных условиях, связанных с недостатком научной литературы, отсутствием специально размеченных текстовых и речевых корпусов, тезаурусов, словарей и других информационных ресурсов. Изучив различные методы и системы синтеза речи для наиболее популярных языков мира, и опираясь на опыт работы вышеприведенных компаний и разработчиков, было решено остановиться на методике, основанной на использовании нейросетевых технологий и машинного обучения.

В последние годы исследования и разработки в области нейросетевых архитектур связаны с созданием, так называемых, end-to-end систем автоматического синтеза речи, обладающих рядом преимуществ по сравнению с классическими системами. Глубокое машинное обучение таких систем объединяет внутренние строительные блоки в единую модель и непосредственно связывает вход и выход. Это является основным преимуществом end-to-end моделей по сравнению с классическими системами синтеза речи, обычно состоящими из различных доменных модулей (текстовый анализатор, генератор F0, генератор спектра, вокодер).

В отделе была подготовлена небольшая экспериментальная речевая база данных, состоящая из 5 часов речи, представленная в виде нескольких тысяч предложений, озвученных женским голосом. Затем было запущено пробное обучение системы на подготовленной базе данных. Начиная эксперимент по машинному обучению, мы были ориентированы как на положительный, так и на отрицательный результат, так как после обучения подобные системы могут выдавать как непонятные звуки, щелчки, свист, так и речь.

Результат эксперимента превзошел наши ожидания, так как все-таки удалось синтезировать чеченскую речь!

По нашим предварительным оценкам качество синтезируемой речи среднее. Некоторые слова система еще плохо читает, не всегда правильно озвучиваются долгие и краткие гласные, голос системы – роботизированный, но на данном первоначальном этапе полученный результат является положительным: система синтеза чеченской речи создана, остается улучшить качество. Такие системы на основе речевой базы объёмом не менее 15 часов дают на выходе более качественную и разборчивую речь.

Приобретение сервера (компьютера с большой оперативной и видео памятью), позволит расширить речевую базу данных и, тем самым, получить чеченскую речь высокого качества.

По ссылке https://soundcloud.com/user-33608246 можно прослушать образцы синтеза речи, полученные разработанной системой.

6 комментариев

  • Mr. Churchill

    Дукхаха болу Google гочдархо тIехь болу меттанашал гIоле ю.
    Масала, албанхойн а, сербийн а меттанаш оц гочдархочуьнан сайт тIехь цхьа дош кхечу дешах къаста а ца ло, ткъа хӏара цхьацца кхачамбацарш ялахь а, дерриге къамелах кхеталуш ю.
    Цунна аса собар ден жимма хан яра.
    ХӀара юкъъяларна вуно хазахетта ву со.
    Кхин дӏа дуккху кхиамаш хуьлийла шу,
    Дела, аш вайн мотт кхиорехь бечу балхана, реза а хуьлда!

  • Zalpa Chupalaeva

    Je suis fière de mon peuple et aussi de ma nièce Umarhadzhieva Elisa, une femme brillante et intelligente. À l’époque de ma jeunesse il était interdit de parler en public dans notre langue maternelle. Et maintenant le monde entier peut entendre notre belle et riche langue.et cela grâce au travail d’une équipe de chercheurs tchétchènes. Merci, merci mille fois.

Добавить комментарий для admin Отменить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *