Отдел прикладной семиотики Академии наук Чеченской Республики Отдел прикладной семиотики Академии наук Чеченской Республики

О проекте внедрения чеченского языка в компьютерные технологии

С.М. Умархаджиев, канд. физ.-мат. наук,
заведующий отделом прикладной семиотики
Академии наук Чеченской Республики

Для современного человека, который хочет общаться на чеченском языке, очень важны следующие возможности, которые могут быть предоставлены компьютерными программами:

  1. проверка правописания текста на чеченском языке;
  2. перевод текста с чеченского языка на любой другой язык и обратно;
  3. чтение и распознавание компьютером текстов на чеченском языке.

Несколько лет назад, на очередном праздновании Дня чеченского языка, Глава Чеченской Республики Рамзан Ахматович Кадыров поставил задачу о необходимости дальнейшего усиления работы по сохранению чеченского языка, в том числе и о составлении словарей чеченского языка. Во исполнение этого поручения, в Академии наук ЧР была создана группа специалистов для внедрения чеченского языка в компьютерные технологии. По примеру Академии наук Татарстана, где подобные разработки проводятся большим коллективом ученых, объединенных в НИИ Прикладной семиотики, для разработки проекта «Чеченская локализация компьютерных программ»  был создан отдел прикладной семиотики.

В настоящее время в отделе работают 6 научных сотрудников: 1 филолог и 5 программистов. Над проектом локализации работают и сотрудники отдела языка и литературы (рук. Нурвади Альбеков). Текущие задачи проекта обсуждаются на совместных научных семинарах. Учеными-филологами обсуждались предложения по изменению орфографии чеченского языка (http://ps95.ru/noxchijn-orfografin-problemashna-lerina-iilmanan-seminar/). В 2016 году в Академии наук ЧР была проведена научно-практическая конференция с участием более 100 ученых, журналистов и педагогов, после которой было принято решение не изменять орфографию и правила грамматики чеченского языка (http://ps.gknu.ru/obyavlenie-50; http://ps95.ru/noxchijn-orfografi-toyarexa-mexala-g%D3%8Fulch/).

В первую очередь для реализации проекта «Чеченская локализация компьютерных программ»  необходимо было иметь электронные словари чеченского языка. Была проведена очень кропотливая работа по оцифровыванию двух основных словарей: Мациев А.Г. «Чеченско-русский словарь». М. 1961; Карасаев А.Т., Мациев А.Г. «Русско-чеченский словарь». М. 1978. Эти словари и другие словари, а также программы, созданные в отделе прикладной семиотики, выложены для свободного доступа на сайтах Академии наук (www.anchr.ru) и отдела прикладной семиотики (http://ps95.ru/category/than-belhash/) .

Для удобства набора на клавиатуре чеченского текста создана компьютерная программа Elp-Ӏ (http://ps95.ru/noxchijn-i-elp-yazden-programma/).

Сотрудниками отдела подготовлен и издан словарь:  Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А.,Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам. Грозный. 2017 (https://elibrary.ru/item.asp?id=30491142 .

Было создано веб-приложение «Нохчийн-оьрсийн, оьрсийн-нохчийн онлайн дошам «ДикДошам», которым можно пользоваться через Интернет на сайтах отдела и Академии наук (http://ps95.ru/dikdosham/). Это приложение включает материал следующих словарей:

  1. Мациев А.Г. Нохчийн-оьрсийн дошам;
  2. Карасаев А.Т., Мациев А.Г. Оьрсийн-нохчийн дошам;
  3. Умархаджиев С.М., Ахматукаев А.А. Нохчийн-оьрсийн, оьрсийн-нохчийн математикин  терминийн дошам;
  4. Абдурашидов Э.Д. Нохчийн-оьрсийн, оьрсийн-нохчийн юридически терминийн дошам;
  5. Берсанов Р.У. Нохчийн-оьрсийн адаман анатомин дошам;
  6. Берсанов Р.У. Оьрсийн-нохчийн адаман анатомин дошам;
  7. Умархаджиев С.М., Асхабов Х.И., Бадаева А.С., Вагапов Ӏ.Д., Израилова Э.С., Султанов З.А., Астемиров А.В. Оьрсийн-нохчийн, нохчийн-оьрсийн компьютерийн лексикин дошам;
  8. Байсултанов Д.Б. Нохчийн-оьрсийн дошам

Совместно с отделом языка и литературы создается тезаурус чеченского языка.

Для работы по созданию электронной лексической базы созданы 7 компьютерных программ, на которые в Федеральной службе по интеллектуальной собственности получены Свидетельства государственной регистрации программ для ЭВМ (http://ps95.ru/noxchijn-respublikin-%D3%8Filmanijn-akademin-pajde-semiotikin-otdelan-belxan-korta-zham%D3%8Fash/).

Проводится исследовательская работа по организации компьютерного чтения чеченских текстов. По результатам всех этих разработок сотрудниками отдела опубликованы статьи в научных журналах. Для организации на компьютере автоматической проверки тестов создана электронная база чеченского языка (словник), содержащая около 2,5 миллиона слов.

Таким образом, проведена не только работа, направленная на чеченскую локализацию компьютерных программ, но и подготовлены специалисты для практической реализации проекта.

Проект фактически уже реализован: компьютеры отдела прикладной семиотики проверяют орфографию чеченских текстов, подчеркивают неправильные слова и предлагают варианты замены.

Только для того, чтобы любой человек мог настроить свой компьютер на проверку чеченских текстов, подготовленные в отделе программы должны быть встроены в редактор Word коммерческой компании Microsoft. Для доступа к коду редактора текстов Microsoft Word нужно получить разрешение компании Microsoft. На наше обращение в офис Microsoft нам было предложено для определения востребованности проекта выложить идею в чат сайта компании Microsoft для голосования.

Идея получила около 11 тыс. голосов (https://word.uservoice.com/forums/304924-word-for-windows-desktop-application/suggestions/32108578-chechen-spelling-dictionary). Ни одна идея, выложенная на этот чат, не получала такую высокую поддержку.Теперь остается ждать реакции компании Microsoft.

Для полной реализации проекта «Чеченская локализация компьютерных программ» мы очень нуждаемся в поддержке Главы Чеченской Республики Рамзана Ахматовича Кадырова.

 

Ещё раз хотим подчеркнуть, что в данном проекте речь идет только о внедрении чеченского языка в компьютерные технологии. Об изменении орфографии и грамматики чеченского языка речь не идет.

Все наши разработки, компьютерные программы, электронные словари выложены на сайте Академии наук ЧР (http://ps95.ru/) и находятся в свободном доступе.

Чеченский язык в программе Microsoft Word

Одна из наиболее важных задач отдела прикладной семиотики – создание программы проверки правописания текстов на чеченском языке.

С момента открытия в отделе проводились работы в этой области по всем направлениям: от выявления существующих проблем чеченской орфографии до составления алгоритмов формальных моделей слово- и формообразования в чеченском языке. Читать далее…

Русско-чеченский, чеченско-русский словарь компьютерной лексики

Как известно, когда язык начинает осваивать новую для него сферу, он совершает еще один шаг в своем развитии, поскольку его носителям приходится искать новые языковые средства, формы, расширяются сферы пользования языком. Внедрение же языка в сферу информационных технологий – один из процессов способствующих наиболее активному его развитию. В современном мире образование, наука, искусство, общественные институты – все эти сферы обслуживаются средствами информационных технологий. Даже если пользователь работает с программой, не имеющей отношение непосредственно к языку, его взаимодействие с ней возможно только посредством языковых средств: интерфейс, настройки, параметры программы – все это реализуется и контролируется только посредством языка. Поэтому сферы пользования языком, который функционирует в компьютерных технологиях, значительно расширяются. Читать далее…

Чеченский онлайн словарь GoldenDict

Setup GoldenDict1.01
Скачано: 38, размер: 0, дата: 12.Дек.2017

Разработчик: OPS-ANCHR
Поддерживаемые ОС: Windows XP, Windows Vista, Windows 7, Windows 8
Версия: 1.01
Дата выхода: 2015
Разрядность: x32 – x64
Язык: Русский

 

Чеченское правописание в Microsoft Word

Приглашение на открытое голосование на официальном форуме поддержки Microsoft 

Отдел прикладной семиотики Академии наук Чеченской Республики работает над организацией проверки правописания чеченского языка в Microsoft Word.

Для реализации проекта необходим сбор голосов пользователей. В связи с чем, просим вас принять участие в открытом голосовании на официальном форуме Microsoft.

Для этого перейдите по ссылкеhttps://word.uservoice.com/…/32108578-chechen-spelling-dict… и проследуйте прилагаемой инструкции, состоящей из 3-х легких шагов:

instr

Работа над тезаурусом чеченского языка

tez12 ноября прошло заседание совместного семинара отдела прикладной семиотики и отдела языка и литературы. Доклад сделали ведущий научный сотрудник отдела прикладной семиотики Асхабов Хаважи и младший научный сотрудник отдела языка и литературы Абдулкадыров Адам. Доклад был посвящен вопросам создания тезауруса чеченского языка, а также разработки средств для внедрения сведений из тезауруса в сфере информационных технологий. В настоящее время Абдулкадыров Адам работает над составлением чеченского тезауруса, Асхабов Хаважи – над разработкой цифровой оболочки для словарного материала, с которым работает А. Абдулкадыров. Ранее Абдулкадыров А. определил некоторые особенности, которые должны присутствовать в программе для работы с тезаурусом.
Читать далее…

Научить компьютер говорить по-чеченски

Одной из задач, поставленных перед отделом на перспективу, является внедрение чеченского языка в сферу средств распознавания и синтеза речи. Говоря другими словами, требуется научить компьютер грамотно читать голосом чеченский текст, а также понимать голосовые команды на чеченском языке, поступающие извне. Разработки в области искусственного интеллекта вообще являются одними из наиболее сложных и трудоемких в сфере информационных технологий. Работа, проводимая в отделе, также потребует основательных исследований в сфере языка,  компьютерной лингвистики, а также ставит трудоемкие и интересные задачи перед программистами.

Израиловой Элисе, старшему научному сотруднику отдела, было поручено провести исследования в данном направлении и определить основные исходные задачи и потребности для реализации этого проекта. Израилова Э.С. представила доклад «Методы синтеза и распознавания речи». Все способы синтеза речи, как отметила докладчик, можно подразделить на группы: параметрический синтез, компиляционный (компилятивный) синтез, синтез по правилам, синтез на основе нейронных сетей. Читать далее…

Разработка чеченской клавиатуры

kbd1

12 октября прошло очередное заседание научного семинара отдела прикладной семиотики АН ЧР. На заседании обсудили текущие задачи, выполняемые в настоящее время сотрудниками отдела. В их числе и вопросы распространения чеченского языка в мобильных операционных системах. В последнее время делаются первые шаги в этом направлении. Например, в системе IOS можно настроить телефон таким образом, чтобы дни недели отображались на чеченском языке. В Google Play также можно найти клавиатуру с чеченской буквой «Ӏ», разработанную пользователем Argyn. Есть также Beta-версия SwiftKey, подготовленная М. Бекаевым и И. Хасахановым. Кроме того, можно найти приложения с вложенными чеченскими словарями. Читать далее…

Наверх