Записи по категории: Новости

Очередное заседание семинара отдела прикладной семиотики

В отделе прикладной семиотики в среду 4 июля прошел очередной семинар, посвященный чеченской локализации программного обеспечения.

Семинар начался с обсуждения последних новостей академии наук: общее годичное собрание АН ЧР, отчет президента Гапурова Шахрудди о работе академии, выборы членов АН ЧР.

Умархаджиев Салаудин рассказал сотрудникам отдела о беседе, которую он провел с директором СПИИРАН, доктором технических наук Ронжиным Андреем Леонидовичем.

Ученые быстро нашли общий язык и договорились о научном сотрудничестве в области речевых технологий. Ронжин посоветовал также обратиться к заведующему лабораторией речевых и многомодальных интерфейсов СПИИРАН Карпову Алексею Анатольевичу.

Лаборатория занимается разработкой речевых технологий (систем автоматического распознавания, понимания и синтеза русской речи), многомодальных интерфейсов (объединение аудио, видео, жестовой, текстовой и иной информации), систем компьютерного зрения и обработки аудиовизуальных сигналов, интеллектуальных комнат и пространств, ассистивных информационных технологий, интеллектуальных человеко-машинных интерфейсов и диалоговых систем.

Израилова Элиса связалась с Карповым Алексеем, в беседе они затронули актуальные вопросы по синтезу и распознаванию речи.  — Для нашего отдела большой плюс – налаживание связей с такими учеными, так как центр речевых технологий России находится именно в Санкт-Петербурге, — сказал Умархаджиев.

Ронжин А.Л. является также организатором и сопредседателем международной конференции «Речь и компьютер» — SPECOM, проходящей ежегодно в различных городах Европы. Сотрудники отдела прикладной семиотики решили в ближайшем будущем обязательно принять участие в этой конференции.

Израилова Элиса и Бадаева Айшат отчитались о том, что в данное время занимаются созданием фонетико-акустической базы данных, состоящей из набора чеченских предложений и соответствующих им звуковых файлов. В дальнейшем эта база будет использоваться для обучения нейронной сети и создания системы синтеза чеченской речи.

Султанов Зелим рассказал, об исследовании орфографии современных чеченских авторов и ее значительном отличии от лексики чеченско-русского словаря Мациева.

Бадаева Айшат и Бекаев Мовсар продолжают работу по расширению лексической базы чеченского языка. Они показали списки слов, не вошедших в словник и привели примеры новых слов, часто используемых в литературных текстах.

Асхабов Хаважи рассказал о разработанных дополнительных функциях чеченского текстового редактора CheWriter.

Хотелось бы напомнить – каждую среду в 14:30 двери нашего отдела открыты для всех желающих послушать и принять участие в обсуждении работы отдела прикладной семиотики. И как всегда принимал активное участие в нашем семинаре сотрудник отдела языка и литературы Абдулкадыров Адам.

 

Получено еще одно свидетельство о регистрации программы для ЭВМ «DoshStat»

Программа предназначена для анализа и исследования частотности слов, поддерживающая пакетную обработку различных типов электронных текстовых документов. Функции: поддержка единого хранилища данных; поддержка форматов pdf, txt, doc, docx, odt, xlsx, htm, html, rtf; подсчет количества символов и слов; исследование частотности и плотности слов; поиск слов по заданным условиям.

О проекте внедрения чеченского языка в компьютерные технологии

С.М. Умархаджиев, канд. физ.-мат. наук,
заведующий отделом прикладной семиотики
Академии наук Чеченской Республики

Для современного человека, который хочет общаться на чеченском языке, очень важны следующие возможности, которые могут быть предоставлены компьютерными программами:

  1. проверка правописания текста на чеченском языке;
  2. перевод текста с чеченского языка на любой другой язык и обратно;
  3. чтение и распознавание компьютером текстов на чеченском языке.

Несколько лет назад, на очередном праздновании Дня чеченского языка, Глава Чеченской Республики Рамзан Ахматович Кадыров поставил задачу о необходимости дальнейшего усиления работы по сохранению чеченского языка, в том числе и о составлении словарей чеченского языка. Во исполнение этого поручения, в Академии наук ЧР была создана группа специалистов для внедрения чеченского языка в компьютерные технологии. По примеру Академии наук Татарстана, где подобные разработки проводятся большим коллективом ученых, объединенных в НИИ Прикладной семиотики, для разработки проекта «Чеченская локализация компьютерных программ»  был создан отдел прикладной семиотики.

В настоящее время в отделе работают 6 научных сотрудников: 1 филолог и 5 программистов. Над проектом локализации работают и сотрудники отдела языка и литературы (рук. Нурвади Альбеков). Текущие задачи проекта обсуждаются на совместных научных семинарах. Учеными-филологами обсуждались предложения по изменению орфографии чеченского языка (http://ps95.ru/noxchijn-orfografin-problemashna-lerina-iilmanan-seminar/). В 2016 году в Академии наук ЧР была проведена научно-практическая конференция с участием более 100 ученых, журналистов и педагогов, после которой было принято решение не изменять орфографию и правила грамматики чеченского языка (http://ps.gknu.ru/obyavlenie-50; http://ps95.ru/noxchijn-orfografi-toyarexa-mexala-g%D3%8Fulch/).

В первую очередь для реализации проекта «Чеченская локализация компьютерных программ»  необходимо было иметь электронные словари чеченского языка. Была проведена очень кропотливая работа по оцифровыванию двух основных словарей: Мациев А.Г. «Чеченско-русский словарь». М. 1961; Карасаев А.Т., Мациев А.Г. «Русско-чеченский словарь». М. 1978. Эти словари и другие словари, а также программы, созданные в отделе прикладной семиотики, выложены для свободного доступа на сайтах Академии наук (www.anchr.ru) и отдела прикладной семиотики (http://ps95.ru/category/than-belhash/) .

Для удобства набора на клавиатуре чеченского текста создана компьютерная программа Elp-Ӏ (http://ps95.ru/noxchijn-i-elp-yazden-programma/).

Сотрудниками отдела подготовлен и издан словарь:  Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А.,Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам. Грозный. 2017 (https://elibrary.ru/item.asp?id=30491142 .

Было создано веб-приложение «Нохчийн-оьрсийн, оьрсийн-нохчийн онлайн дошам «ДикДошам», которым можно пользоваться через Интернет на сайтах отдела и Академии наук (http://ps95.ru/dikdosham/). Это приложение включает материал следующих словарей:

  1. Мациев А.Г. Нохчийн-оьрсийн дошам;
  2. Карасаев А.Т., Мациев А.Г. Оьрсийн-нохчийн дошам;
  3. Умархаджиев С.М., Ахматукаев А.А. Нохчийн-оьрсийн, оьрсийн-нохчийн математикин  терминийн дошам;
  4. Абдурашидов Э.Д. Нохчийн-оьрсийн, оьрсийн-нохчийн юридически терминийн дошам;
  5. Берсанов Р.У. Нохчийн-оьрсийн адаман анатомин дошам;
  6. Берсанов Р.У. Оьрсийн-нохчийн адаман анатомин дошам;
  7. Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А., Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам;
  8. Байсултанов Д.Б. Нохчийн-оьрсийн дошам

Совместно с отделом языка и литературы создается тезаурус чеченского языка.

Для работы по созданию электронной лексической базы созданы 7 компьютерных программ, на которые в Федеральной службе по интеллектуальной собственности получены Свидетельства государственной регистрации программ для ЭВМ (http://ps95.ru/noxchijn-respublikin-%D3%8Filmanijn-akademin-pajde-semiotikin-otdelan-belxan-korta-zham%D3%8Fash/).

Проводится исследовательская работа по организации компьютерного чтения чеченских текстов. По результатам всех этих разработок сотрудниками отдела опубликованы статьи в научных журналах. Для организации на компьютере автоматической проверки тестов создана электронная база чеченского языка (словник), содержащая около 2,5 миллиона слов.

Таким образом, проведена не только работа, направленная на чеченскую локализацию компьютерных программ, но и подготовлены специалисты для практической реализации проекта.

Проект фактически уже реализован: компьютеры отдела прикладной семиотики проверяют орфографию чеченских текстов, подчеркивают неправильные слова и предлагают варианты замены.

Только для того, чтобы любой человек мог настроить свой компьютер на проверку чеченских текстов, подготовленные в отделе программы должны быть встроены в редактор Word коммерческой компании Microsoft. Для доступа к коду редактора текстов Microsoft Word нужно получить разрешение компании Microsoft. На наше обращение в офис Microsoft нам было предложено для определения востребованности проекта выложить идею в чат сайта компании Microsoft для голосования.

Идея получила около 11 тыс. голосов (https://word.uservoice.com/forums/304924-word-for-windows-desktop-application/suggestions/32108578-chechen-spelling-dictionary). Ни одна идея, выложенная на этот чат, не получала такую высокую поддержку.Теперь остается ждать реакции компании Microsoft.

Для полной реализации проекта «Чеченская локализация компьютерных программ» мы очень нуждаемся в поддержке Главы Чеченской Республики Рамзана Ахматовича Кадырова.

 

Ещё раз хотим подчеркнуть, что в данном проекте речь идет только о внедрении чеченского языка в компьютерные технологии. Об изменении орфографии и грамматики чеченского языка речь не идет.

Все наши разработки, компьютерные программы, электронные словари выложены на сайте Академии наук ЧР (http://ps95.ru/) и находятся в свободном доступе.

Чеченский язык в программе Microsoft Word

Одна из наиболее важных задач отдела прикладной семиотики – создание программы проверки правописания текстов на чеченском языке.

С момента открытия в отделе проводились работы в этой области по всем направлениям: от выявления существующих проблем чеченской орфографии до составления алгоритмов формальных моделей слово- и формообразования в чеченском языке. Читать далее…

Русско-чеченский, чеченско-русский словарь компьютерной лексики

Как известно, когда язык начинает осваивать новую для него сферу, он совершает еще один шаг в своем развитии, поскольку его носителям приходится искать новые языковые средства, формы, расширяются сферы пользования языком. Внедрение же языка в сферу информационных технологий – один из процессов способствующих наиболее активному его развитию. В современном мире образование, наука, искусство, общественные институты – все эти сферы обслуживаются средствами информационных технологий. Даже если пользователь работает с программой, не имеющей отношение непосредственно к языку, его взаимодействие с ней возможно только посредством языковых средств: интерфейс, настройки, параметры программы – все это реализуется и контролируется только посредством языка. Поэтому сферы пользования языком, который функционирует в компьютерных технологиях, значительно расширяются. Читать далее…

Чеченское правописание в Microsoft Word

Приглашение на открытое голосование на официальном форуме поддержки Microsoft 

Отдел прикладной семиотики Академии наук Чеченской Республики работает над организацией проверки правописания чеченского языка в Microsoft Word.

Для реализации проекта необходим сбор голосов пользователей. В связи с чем, просим вас принять участие в открытом голосовании на официальном форуме Microsoft.

Для этого перейдите по ссылкеhttps://word.uservoice.com/…/32108578-chechen-spelling-dict… и проследуйте прилагаемой инструкции, состоящей из 3-х легких шагов:

instr

Работа над тезаурусом чеченского языка

tez12 ноября прошло заседание совместного семинара отдела прикладной семиотики и отдела языка и литературы. Доклад сделали ведущий научный сотрудник отдела прикладной семиотики Асхабов Хаважи и младший научный сотрудник отдела языка и литературы Абдулкадыров Адам. Доклад был посвящен вопросам создания тезауруса чеченского языка, а также разработки средств для внедрения сведений из тезауруса в сфере информационных технологий. В настоящее время Абдулкадыров Адам работает над составлением чеченского тезауруса, Асхабов Хаважи – над разработкой цифровой оболочки для словарного материала, с которым работает А. Абдулкадыров. Ранее Абдулкадыров А. определил некоторые особенности, которые должны присутствовать в программе для работы с тезаурусом.
Читать далее…

Научить компьютер говорить по-чеченски

Одной из задач, поставленных перед отделом на перспективу, является внедрение чеченского языка в сферу средств распознавания и синтеза речи. Говоря другими словами, требуется научить компьютер грамотно читать голосом чеченский текст, а также понимать голосовые команды на чеченском языке, поступающие извне. Разработки в области искусственного интеллекта вообще являются одними из наиболее сложных и трудоемких в сфере информационных технологий. Работа, проводимая в отделе, также потребует основательных исследований в сфере языка,  компьютерной лингвистики, а также ставит трудоемкие и интересные задачи перед программистами.

Израиловой Элисе, старшему научному сотруднику отдела, было поручено провести исследования в данном направлении и определить основные исходные задачи и потребности для реализации этого проекта. Израилова Э.С. представила доклад «Методы синтеза и распознавания речи». Все способы синтеза речи, как отметила докладчик, можно подразделить на группы: параметрический синтез, компиляционный (компилятивный) синтез, синтез по правилам, синтез на основе нейронных сетей. Читать далее…

Наверх