На современном этапе развития информационных технологий стоит задача их интеллектуализации. Ведущие мировые эксперты пришли к заключению, что дальнейшее качественное развитие компьютерных технологий невозможно без применения технологий искусственного интеллекта. Решением проблемы интеллектуализации окружения человека занимаются ведущие научно-исследовательские институты и компании с мировым именем (показать на фоне исследовательскую лабораторию робототехники и логотипы мировых ИТ компаний Samsung, IBM, Microsoft, Intel). Решение данной задачи позволит перевести взаимодействие человека и окружающих его технических устройств на качественно новый уровень.
В Институте проблем информатики и управления осуществляется разработка технологий искусственного интеллекта по четырем основным направлениям (стоит ведущая от неё на фоне слева 4 прямоугольника с названием технологий):
1) Автоматическое распознавание речи;
2) Синтез речи по тексту;
3) Автоматическая обработка и понимание текстов на естественном языке;
4) Машинное зрение на основе 3D технологий.
Первые три технологии относятся к области обработки данных на естественном языке. Разработка данных технологий осуществляется на основе казахского языка.
Одним из основных направлений интеллектуализации сферы информационных технологий является интенсификация применения передовых человеко-машинных интерфейсов.
Наиболее естественным для человека являются речевые интерфейсы взаимодействия. Для их реализации используются технологии синтеза и распознавания речи. Широкому внедрению данных технологий препятствует недостаточное качество и эффективность реализующих их алгоритмов. Данное обстоятельство обуславливается комплексом причин, во главе которых стоит сложность их качественной реализации. Эффективное решение таких задач, как распознавание речи и образов, семантического анализа текста, однозначно требует применение технологий близких к технологиям искусственного интеллекта.
Рассмотрим разрабатываемую в ИПИУ систему синтеза казахской речи по тексту. По своей сути данная система является электронным казахскоязычным диктором. В систему синтеза речи загружается произвольный текст на казахском языке. После завершения процесса синтеза можно услышать, как компьютер читает данный текст естественным человеческим голосом, соблюдая все знаки препинания, правильно расставляя ударения, делая паузы в нужных местах и акцентируя интонацией значимые фрагменты текста. Синтезированная речь может быть воспроизведена через звуковые динамики компьютера. Также имеется возможность сохранения синтезированной речи во внешний мультимедийный файл для последующего воспроизведения на внешнем проигрывающем устройстве. Имеется возможность настройки множества различных параметров синтеза. Синтез может быть осуществлён различными голосами (мужским, женским, детским), с различным тембром и интонацией.
Демонстрация системы 3-х мерного компьютерного зрения
Основные области применения разрабатываемых в ИПИУ технологий 3-х мерного компьютерного зрения:
Разработанные в ИПИУ технологии нацелены на развитие казахстанских отечественных инноваций в виде законченных программно-технических средств. При этом используются новейшие достижения в области информационных технологий и робототехники для интеллектуализации окружающих человека устройств. Решение данной задачи способствует переводу взаимодействия человека и окружающих его технических устройств на качественно новый уровень.
В целях реализации поручения Президента РК о переводе казахской письменности на латиницу в ИПИУ осуществлена реализация системы автоматического перевода казахских текстов с кириллицы на латиницу (показать на фоне как работает данная система).
Данные разработки будут способствовать расширению сферы применения казахского языка на основе современных информационных технологий. Они могут использоваться в делопроизводстве, web и мобильных приложениях, а также в облачных технологиях. Это будет способствовать повышению престижа государственного языка и повышению его востребованности.
Четвертым направлением, получившим развитие в ИПИУ, являются технологии 3-х мерного компьютерного зрения. Термин «компьютерное зрение» имеет много синонимов: машинное зрение, распознавание зрительных образов, анализ изображений и т. д. Однако смысл, скрывающийся за всеми этими определениями, один — это попытка научить компьютер видеть мир глазами человека, воспринимать его как человек и выполнять в связи с этим различные действия так же, как делал бы это человек, тем самым, подменяя или полностью исключая последнего. Необходимость в этом возникает в ситуациях, связанных с риском для жизни, и бывает обусловлена особенностями человека как живого организма, которому свойственно быстро утомляться, пропускать через себя ограниченный объем информации, а также обрабатывать данные с относительно низкой скоростью.
Процесс компьютерного зрения представляет собой сложную технологическую цепочку, включающую получение цифрового изображения, обработку изображения с целью выделения значимой информации на изображении и анализ этого предобработанного изображения для решения определенной задачи.
Одними из новых областей применения систем машинного зрения являются автономные транспортные средства, включая подводные, наземные (роботы, машины), воздушные. Уровень автономности изменяется от полностью автономных (беспилотных) до транспортных средств, где системы, основанные на компьютерном зрении, поддерживают водителя или пилота в различных ситуациях. Примерами таких систем могут быть система предупредительной сигнализации о препятствиях на машинах и системы автономной посадки самолетов.
По этой ссылке вы можете протестировать функциональные возможности нашего облачного сервиса