Лаборатория анализа и моделирования информационных процессов – Институт информационных и вычислительных технологий

ИНТЕЛЛЕКТУАЛЬНЫЕ ОБЛАЧНЫЕ ТЕХНОЛОГИИ

На современном этапе развития информационных технологий стоит задача их интеллектуализации. Ведущие мировые эксперты пришли к заключению, что дальнейшее качественное развитие компьютерных технологий невозможно без применения технологий искусственного интеллекта. Решением проблемы интеллектуализации окружения человека занимаются ведущие научно-исследовательские институты и компании с мировым именем (показать на фоне исследовательскую лабораторию робототехники и логотипы мировых ИТ компаний Samsung, IBM, Microsoft, Intel). Решение данной задачи позволит перевести взаимодействие человека и окружающих его технических устройств на качественно новый уровень.

В Институте проблем информатики и управления осуществляется разработка технологий искусственного интеллекта по четырем основным направлениям (стоит ведущая от неё на фоне слева 4 прямоугольника с названием технологий):

1) Автоматическое распознавание речи;

2) Синтез речи по тексту;

3) Автоматическая обработка и понимание текстов на естественном языке;

4) Машинное зрение на основе 3D технологий.

Первые три технологии относятся к области обработки данных на естественном языке. Разработка данных технологий осуществляется на основе казахского языка.

Одним из основных направлений интеллектуализации сферы информационных технологий является интенсификация применения передовых человеко-машинных интерфейсов.

Наиболее естественным для человека являются речевые интерфейсы взаимодействия. Для их реализации используются технологии синтеза и распознавания речи. Широкому внедрению данных технологий препятствует недостаточное качество и эффективность реализующих их алгоритмов. Данное обстоятельство обуславливается комплексом причин, во главе которых стоит сложность их качественной реализации. Эффективное решение таких задач, как распознавание речи и образов, семантического анализа текста, однозначно требует применение технологий близких к технологиям искусственного интеллекта.

Рассмотрим разрабатываемую в ИПИУ систему синтеза казахской речи по тексту. По своей сути данная система является электронным казахскоязычным диктором. В систему синтеза речи загружается произвольный текст на казахском языке. После завершения процесса синтеза можно услышать, как компьютер читает данный текст естественным человеческим голосом, соблюдая все знаки препинания, правильно расставляя ударения, делая паузы в нужных местах и акцентируя интонацией значимые фрагменты текста. Синтезированная речь может быть воспроизведена через звуковые динамики компьютера. Также имеется возможность сохранения синтезированной речи во внешний мультимедийный файл для последующего воспроизведения на внешнем проигрывающем устройстве. Имеется возможность настройки множества различных параметров синтеза. Синтез может быть осуществлён различными голосами (мужским, женским, детским), с различным тембром и интонацией.

Демонстрация системы 3-х мерного компьютерного зрения

Основные области применения разрабатываемых в ИПИУ технологий 3-х мерного компьютерного зрения:

Робототехника
3D сканирование
Идентификация личности по форме лица
Распознавание жестов
Дистанционное зондирование земли
Автоматическое наведение на цель

Разработанные в ИПИУ технологии нацелены на развитие казахстанских отечественных инноваций в виде законченных программно-технических средств. При этом используются новейшие достижения в области информационных технологий и робототехники для интеллектуализации окружающих человека устройств. Решение данной задачи способствует переводу взаимодействия человека и окружающих его технических устройств на качественно новый уровень.

Демонстрация системы синтеза

Следующим направлением в области развития речевых технологий является разработка системы автоматического распознавания казахской речи. С её помощью можно осуществлять речевой ввод текстовых данных в компьютер. Данная система имеет три основных режима работы:

Распознавание слитной речи;
Распознавание отдельных речевых команд.
Идентификация диктора по голосу.

При распознавании слитной речи человек читает в микрофон произвольный текст на казахском языке, а компьютер печатает его на своём экране. При этом имеется возможность сохранения напечатанного текста в отдельный файл, его последующего редактирования, передачи по электронной почте и выполнения любых других типовых операций с текстом. Система автоматического распознавания речи может оказать существенную помощь в любых ситуациях, где необходимо осуществлять автоматический перевод устной речи говорящего в электронное текстовое представление: стенографирование выступлений, совещаний, монологов, телефонных разговоров.

Демонстрация системы распознавания слитной речи

Режим распознавания отдельных речевых команд может быть использован для управления различными устройствами. Например, бытовой техникой или роботами.

Демонстрация системы распознавания речевых команд

В системах информационной безопасности и контроля доступа может быть использован режим идентификации диктора по голосу. В данном режиме система распознавания осуществляет идентификацию личности человека по произнесённой им короткой фразе.

Демонстрация системы идентификации личности по голосу

С использованием разработанных в ИПИУ технологий синтеза и распознавания речи имеется возможность построения компьютерных систем способных вести диалог с пользователем на естественном казахском языке.

Основные области применения разрабатываемых в ИПИУ речевых технологий:

Робототехника
Говорящие интеллектуальные устройства
«Умный дом»
Языковые обучающие системы
“Голосовые переводчики”
Аудио-книги
Системы телефонии (Call-центры)
Информационные киоски
Системы информационной безопасности
Криминалистическая экспертиза голоса
Системы помощи немым и незрячим людям

Следующим важным направлением, над которым ведётся работа в ИПИУ, является “Автоматическая обработка текстов на казахском языке”. В рамках данного направления осуществлена разработка лексического и морфологического анализаторов казахских текстов (показать демонстрацию). Также осуществлено формирование и классификация лексической базы данных казахского языка, которая на данный момент насчитывает порядка 150 тысяч лексических единиц литературного казахского текста (показывается БД). Сформирован полный словарь казахских аффиксов (показывается словарь аффиксов) и осуществлена формализация правил словообразования на основе аффиксальных соединений (показываются блок-схемы и графики). Данный процесс алгоритмизирован в рамках морфологического анализатора. В последствии на основе разработанных лексического и морфологического анализаторов реализована система автоматической проверки орфографии для казахских текстов, которая может быть встроена в текстовые офисные пакеты.

Демонстрация системы проверки орфографии

В настоящее время ведётся интенсивная работа по созданию синтаксического и семантического анализаторов. Данные анализаторы будут использованы при создании систем интеллектуального поиска текстовой информации на казахском языке по её смысловому содержанию. Также на их основе будет осуществлена реализация системы автоматической проверки грамматических и синтаксических ошибок в казахских текстах.

Основные области применения технологий автоматической обработки текстов:

Системы извлечения знаний из текстов
Автоматическое реферирование текстов
Автоматическая классификация текстов
Машинный перевод (Каз-Англ. ; Каз-Рус);
Интеллектуально-поисковая система

В целях реализации поручения Президента РК о переводе казахской письменности на латиницу в ИПИУ осуществлена реализация системы автоматического перевода казахских текстов с кириллицы на латиницу (показать на фоне как работает данная система).

Данные разработки будут способствовать расширению сферы применения казахского языка на основе современных информационных технологий. Они могут использоваться в делопроизводстве, web и мобильных приложениях, а также в облачных технологиях. Это будет способствовать повышению престижа государственного языка и повышению его востребованности.

Четвертым направлением, получившим развитие в ИПИУ, являются технологии 3-х мерного компьютерного зрения. Термин «компьютерное зрение» имеет много синонимов: машинное зрение, распознавание зрительных образов, анализ изображений и т. д. Однако смысл, скрывающийся за всеми этими определениями, один — это попытка научить компьютер видеть мир глазами человека, воспринимать его как человек и выполнять в связи с этим различные действия так же, как делал бы это человек, тем самым, подменяя или полностью исключая последнего. Необходимость в этом возникает в ситуациях, связанных с риском для жизни, и бывает обусловлена особенностями человека как живого организма, которому свойственно быстро утомляться, пропускать через себя ограниченный объем информации, а также обрабатывать данные с относительно низкой скоростью.

Процесс компьютерного зрения представляет собой сложную технологическую цепочку, включающую получение цифрового изображения, обработку изображения с целью выделения значимой информации на изображении и анализ этого предобработанного изображения для решения определенной задачи.

Одними из новых областей применения систем машинного зрения являются автономные транспортные средства, включая подводные, наземные (роботы, машины), воздушные. Уровень автономности изменяется от полностью автономных (беспилотных) до транспортных средств, где системы, основанные на компьютерном зрении, поддерживают водителя или пилота в различных ситуациях. Примерами таких систем могут быть система предупредительной сигнализации о препятствиях на машинах и системы автономной посадки самолетов.

По этой ссылке вы можете протестировать функциональные возможности нашего облачного сервиса

Подробнее