Повышение точности мультиязычного распознавания речи за счет применения искусственных нейронных сетей на этапе акустического и языкового моделирования.
Актуальным для решения различных производственно-хозяйственных задач является развитие технологий мультиязычного автоматического распознавания речи и применение искусственных нейронных сетей для глубокого обучения.
Научная значимость планируемых исследований заключается в развитии методов распознавания и глубокого обучения. Планируется проведение комплексного исследования существующих методов распознавания и искусственных нейронных сетей с последующим выбором наиболее эффективных методов применительно к мультиязычному автоматическому распознаванию речи. Исследования будут ориентированы на интеллектуализацию процесса распознавания в целом с применением глубоких нейросетевых алгоритмов, скрытых марковских моделей, алгоритмов распознавания речи.
В качестве социально-экономического эффекта в процессе реализации проекта ожидаются в повышении качества и в увеличении степени адаптации современных речевых технологий к национальным языкам. Как следствие, будет происходить большее внедрение речевых технологий в повседневную жизнь людей, что в свою очередь приведёт к увеличению их качества жизни (это особенно важно для людей с ограниченными возможностями в развивающихся странах).
Конечной целью создания мультиязычного автоматического распознавания речи с использованием глубоких нейронных сетей, способной распознавать речь в акустическом сигнале с эффективностью, не меньшей по сравнению с аналогичной способностью человека. В ходе развития науки и техники в сфере разработки системы мультиязычного автоматического распознавания речи наблюдается значительный прогресс. Размер корпуса вырос до 2000 часов.
Анализ существующих систем распознавания речи, а также в разработка математических моделей и алгоритмов для решения поставленной задачи по разработке технологии мультиязычного автоматического распознавания речи.
Государственные структуры, ответственные за расширение области применения национальных языков на базе информационных технологий; производители мобильных телефонов (увеличение числа потенциальных покупателей за счёт внедрения речевых технологий на национальных языках); сотовые операторы и банки (call-центры с поддержкой голосовых функций, голосовая аутентификация); сектор производства различных устройств с поддержкой голосовых функций (“говорящие” книги, говорящие игрушки, устройства для “умного дома”).
Результаты проекта были внедрены в ТОО «Национальный инновационный центр».
Мамырбаев Ө.Ж. Қазақ ауызекі сөйлеуін автоматты өңдеу: Монография. – ҚР БҒМ ҒК Ақпараттық және есептеуіш технологиялар институты. – 2020. – 142 б.
1 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Мекебаев Н.О. Методы и модели автоматического распознавания речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 210 с.
2 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Жумажанов Б.Ж., Мекебаев Н.О. Автоматическое распознавание речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 104 с.
– мультиязычный корпус казахского и русского языков;
– методы предварительной обработки речевых сигналов, акустические и языковые модели, автоматический транскриптор;
– мультиязычная система автоматического распознавания речи.