enrukz
enrukz

Ғылыми жоба: №AP05131207 Терең нейрондық желілерді қолдана отырып, сөйлеуді автоматты түрде тану технологиясын жасау (2018-2020)

Жобаның мақсаты:

Aкустикалық және тілдік модельдеу кезеңінде жасанды нейрондық желілерді қолдану арқылы сөйлеуді көп тілді танудың дәлдігін арттыру.

Зерттеу міндеттері:

  • Сөйлеуді тану саласындағы дамудың аналитикалық шолуы;

  • Орыс және қазақ тілдері үшін сөйлеу және мәтін корпусын әзірлеу және жобалау;

  • Жасанды нейрондық желілерді пайдалана отырып, акустикалық және тілдік модельдерді әзірлеу;

  • Сөйлеуді автоматты түрде танудың көптілді жүйесін әзірлеу және тестілеу.

Әр түрлі өндірістік және экономикалық мәселелерді шешудің өзекті мәселесі-сөйлеуді автоматты түрде танудың көптілді технологияларын дамыту және терең білім алу үшін жасанды нейрондық желілерді қолдану.

Жоспарланған зерттеулердің ғылыми маңыздылығы тану және терең оқыту әдістерін дамыту болып табылады. Қолданыстағы тану әдістері мен жасанды нейрондық желілерді кешенді зерттеу жоспарлануда, содан кейін сөйлеуді көптілді автоматты түрде тануға қатысты ең тиімді әдістерді таңдау жоспарлануда. Зерттеулер терең нейрондық желі алгоритмдерін, жасырын Марков модельдерін, сөйлеуді тану алгоритмдерін қолдана отырып, тану процесін интеллектуализациялауға бағытталған.

Жобаны іске асыру процесінде әлеуметтік-экономикалық тиімділік ретінде қазіргі сөйлеу технологияларының сапасын арттыру және Ұлттық тілдерге бейімделу дәрежесін арттыру күтілуде. Нәтижесінде, адамдардың күнделікті өміріне сөйлеу технологияларын көбірек енгізу орын алады ,бұл өз кезегінде олардың өмір сүру сапасының артуына әкеледі (бұл дамушы елдердегі мүмкіндігі шектеулі адамдар үшін өте маңызды).

Акустикалық сигналда сөйлеуді адамның ұқсас қабілетінен кем емес тиімділікпен тануға қабілетті терең нейрондық желілерді қолдана отырып, сөйлеуді автоматты түрде тануды құрудың түпкі мақсаты. Сөйлеуді көптілді автоматты тану жүйесін дамыту саласында ғылым мен техниканың дамуы барысында айтарлықтай прогресс байқалады. Корпус көлемі 2000 сағатқа дейін өсті.

Жаңалығы:

Сөйлеуді танудың қолданыстағы жүйелерін талдау, сонымен қатар көп тілді сөйлеуді автоматты тану технологиясын жасау мәселесін шешу үшін математикалық модельдер мен алгоритмдерді әзірлеу.

Қолдану саласы:

Ақпараттық технологиялар базасында Ұлттық тілдерді қолдану саласын кеңейтуге жауапты мемлекеттік құрылымдар; ұялы телефон өндірушілер (Ұлттық тілдерде сөйлеу технологияларын енгізу есебінен әлеуетті сатып алушылар санын ұлғайту); ұялы операторлар мен банктер (дауыстық функцияларды қолдайтын call-орталықтар, дауыстық аутентификация); дауыстық функцияларды қолдайтын әртүрлі құрылғыларды өндіру секторы (“”кітаптар, ойыншықтар, “ақылды үйге”арналған құрылғылар).

Енгізу:

Жоба нәтижелері ЖШС “Ұлттық инновациялық орталық” енгізілді.

Жарияланымдар:

  1. Kalimoldayev M., Mamyrbayev O., Mekebayev N., Kydyrbekova A. Algorithms for detection gender using neural networks // International Journal of Circuits, Systems and Signal. – 2020. – № 14. – P. 154 – 159 (Scopus).
  2. Orken Mamyrbayev, Keylan Alimhan, Bagashar Zhumazhanov, Tolganay Turdalykyzy, Farida Gusmanova End-to-End Speech Recognition in Agglutinative Languages // ACIIDS. – 2020. – Р. 391-402 // https://doi.org/10.1007/978-3-030-42058-1_33 (Scopus and Web of Science IF – 0.3, Q4).
  3. Keylan Alimhan, Orken Mamyrbayev, Aigerim Erdenova, Almira Akmetkalyeva Global output tracking by state feedback for high-order nonlinear systems with time-varying delays // Cogent Engineering. – 2020. – № 7 (1711676). – P. 1 – 13 // https://doi.org/10.1080/23311916.2020.1711676 (Scopus, Процентил – 76).
  4. Orken Mamyrbayev, Alymzhan Toleu, Gulmira Tolegen, Nurbapa Mekebayev Neural architectures for gender detection and speaker identification // Cogent Engineering. – 2020. – № 7 (1727168). – P. 1 – 13 // https://doi.org/10.1080/23311916.2020.1727168 (Scopus, Процентиль – 76).
  5. Kydyrbekova Aizat, Othman Mohamed, Mamyrbayev Orken, Akhmediyarova Ainur, Bagashar Zhumazhanov Identification and authentication of user voice using DNN features and i-vector // Cogent Engineering. – 2020. – № 7 (1751557). – P. 1–21 // https://doi.org/10.1080/23311916.2020.1751557 (Scopus, Процентиль – 76).
  6. Orken Zh. Mamyrbayev, Keylan Alimhan, Beibut Amirgaliyev, Bagashar Zhumazhanov, Dinara Mussayeva, Farida Gusmanova Multimodal systems for speech recognition // Int. J. Mobile Communications. -2020. – Vol. 18, № 3. – P. 314 – 326. (Web of Science IF – 1.3, Q3)
  7. М.Н. Қалимолдаев, О.Ж. Мамырбаев, Н.О. Мекебаев, М. Тұрдалыұлы Машиналық оқытуды қолдануда дауыстың гендерлік жіктелінуі // ҚазҰТЗУ хабаршысы. -2019. – № 6 (136). – Б. 229 – 233.
  8. О. Мамырбаев, А. Шаяхметова, А. Кыдырбекова, М. Турдалыулы Интегральный подход распознавания речи для агглютинативных языков // Вестник Алматинского университета энергетики и связи. – 2020. – № 1 (48). – С. 93 – 102.
  9. Мамырбаев О.Ж., Othman M., Ахмедиярова А.Т., Кыдырбекова А.С. Конфиденциальность и безопасность организации от инсайдерских атак, с использованием голосовой биометрики // Научные тенденции: Вопросы точных и технических наук. Сб. научных трудов по матер. XXVIII междунар. науч. конф. – СПб, 2020. – С. 15 – 22.
  10. Mamyrbayev O., Akhmediyarova A., Kydyrbekova A., Short-term voice verification of the i-vector // Матер. науч. конф. ИИВТ МОН РК «Современные проблемы информатики и вычислительных технологий». – Алматы, 2020. – С. 9-13.
  11. Mamyrbayev O., Oralbekova D. Modern trends in the development of speech recognition systems // News of the National academy of sciences of the republic of Kazakhstan. – 2020. – Vol. 4, № 332. – P. 42 – 51 // doi.org/10.32014/2020.2518-1726.64
  12. Mamyrbayev O., Turdalyuly M., Mekebayev N., Alimhan K., Kydyrbekova A., Turdalykyzy T. Automatic Recognition of Kazakh Speech Using Deep Neural Networks // ACIIDS. – 2019. – Р. 465-474. https://doi.org/10.1007/978-3-030-14802-7_40 (Scopus).
  13. Alimhan K., Kalimoldayev M.N., Adamov A.A., Mamyrbayev O., Tasbolatuly N., Smolarz A. Further Results on Output Tracking for a Class of Uncertain High-Order Nonlinear Time-Delay Systems // Przegląd Elektrotechniczny. – 2019. – № 9 (5). – P. 88 – 91.
  14. Mamyrbayev O., Tudalyuly M., Mekebayev N., Mukhsina K.,  Keylan A., BabaAli B., Nabieva G., Duisenbayeva A., Akhmetov B. Continuous Speech Recognition of Kazakh Language // International Conference on Applied Mathematics, Computational Science and Systems Engineering. – Italy, 2019. – V. 24.
  15. Mamyrbayev O., Mekebayev N., Turdalyuly M., Oshanova N., Medeni T.I., Yessentay A. Voice Identification Using Classification Algorithms // Intelligent System and Computing. IntechOpen, DOI: 10.5772/intechopen.88239.– 2019.
  16. Мамырбаев О.Ж., Мекебаев Н.О., Тұрдалыұлы М., Ахметов И. MFCC негізіндегі дикторды анықтау жүйесі // ҚазҰТЗУ хабаршысы. – 2019. – № 2. – Б. 155-160.
  17. Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Мекебаев Н.О. Обзор методов идентификации и аутентификации пользователей по голосу // Матер. науч. конф. ИИВТ КН МОН РК «Инновационные IT и Smart-технологии», посв. 70-летнему юбилею проф. Утепбергенова И.Т. – Алматы, 2019. – Б. 315-321.
  18. Қалимолдаев М.Н., Мамырбаев О.Ж., Мекебаев Н.О., Тұрдалыұлы М. Машиналық оқуды қолдануда дауыстың гендерлік жіктелінуі // Матер. науч. конф. ИИВТ МОН РК «Современные проблемы информатики и вычислительных технологий». – Алматы, 2019. – С. 51-57.
  19. Мамырбаев О.Ж., Тұрдалыұлы М., Мекебаев Н.О., Тұрдалықызы Т., Шаяхметова А.С. Автоматическое распознавание казахской речи с использованием DNN // Вестник КБТУ. – 2019. – № 2 (49). – С. 134-142.
  20. Мамырбаев О.Ж., Кыдырбекова А.С., Ахмедиярова А.Т., Тұрдалыұлы М., Мекебаев Н.О. Систематический обзор и анализ особенностей идентификации по голосу // Вестник КБТУ. – 2019. – № 2 (49). – С. 120-133.
  21. Мамырбаев О.Ж., Тұрдалықызы Т., Тұрдалыұлы М. Сөйлеуді танудың әлі шешілмеген мәселелері // Матер. IV междунар. науч.-практ. конф. «Информатика и прикладная математика», посв. 70-летнему юбилею проф. Биярова Т.Н., В. Вуйцика и 60-летию проф. Амиргалиева Е.Н. – Алматы, 2019. – Б. 91 – 94.
  22. Мамырбаев О.Ж., Тұрдалықызы Т., Тұрдалыұлы М. Идентификация диктора используя MFFC // Матер. IV междунар. науч.-практ. конф. «Информатика и прикладная математика», посв. 70-летнему юбилею проф. Биярова Т.Н., В.Вуйцика и 60-летию проф. Амиргалиева Е.Н. – Алматы, 2019. – Б. 384 – 392.
  23. Bagher BabaAli, Waldemar Wojcik, Oken Mamyrbayev, Mussa Turdalyuly, Nurbapa Mekebayev. Speech Recognizer-Based Non-Uniform Spectral Compression for Robust MFCC Feature Extraction // Przeglad Elektrotechniczny. – 2018. – № 6 (94). – P. 90-93.
  24. Мамырбаев О.Ж. , Мекебаев Н.О., Тұрдалыұлы М. Сөйлеулерді тану үрдісінде MFCC алгоритмін қолдану // ҚазҰТЗУ хабаршысы. – 2018. – № 2 (126). – Б. 389-392.
  25. Мамырбаев О.Ж., Мекебаев Н.О., Тұрдалыұлы М. Генетикалық алгоритм көмегімен сөйлеуді автоматты танудағы гендерлік сәйкестендіру // Алматы энергетика және байланыс университетінің хабаршысы. – 2018. – спец. вып. – Б. 120-129.
  26. Мамырбаев О.Ж., Тұрдалыұлы М., Мекебаев Н.О. Система распознавания слитной казахской речи на основе глубоких нейронных сетей // Вестник Алматинского университета энергетики и связи. – 2018. – спец. вып. – С. 130-135.
  27. Мамырбаев О.Ж., Турдалыулы М., Мекебаев Н.О., Алимхан К., Набиева Г.С., Мамырбаев Б.Ж. Фонетически представительный текст для создания систем автоматического распознавания казахской речи // Наука и Мир. – 2018. – Т. 2, № 6 (58).  – С. 49-52.

Авторлық куәліктер:

  1. А.к. № 1425 System of automatic creation vocabulary for ASR / Мамырбаев О.Ж., Тұрдалыұлы М., Мекебаев Н.О., Сейтқали Б.Н., Дуйсенбаева А.Ж. 22.01.2019.
  2. А.к. № 7844. Мультиязычное распознавание речи MultiSpeech Мамырбаев / О.Ж., Тұрдалыұлы М., Тұрдалықызы Т., Кыдырбекова А.С., Мекебаев Н.О., Сейтқали Б., Ахметов Б.С. 2020. – 1с.

Монографиялар:

Мамырбаев Ө.Ж. Қазақ ауызекі сөйлеуін автоматты өңдеу: Монография. – ҚР БҒМ ҒК Ақпараттық және есептеуіш технологиялар институты. – 2020. – 142 б.

Кітаптар:

1 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Мекебаев Н.О. Методы и модели автоматического распознавания речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 210 с.

2 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Жумажанов Б.Ж., Мекебаев Н.О. Автоматическое распознавание речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 104 с.

Алынған нәтижелер:

– қазақ және орыс тілдерінің көптілді корпусы;

– сөйлеу сигналдарын алдын ала өңдеу әдістері, акустикалық және тілдік модельдер, Автоматты транскриптор;

– сөйлеуді автоматты түрде танудың көптілді жүйесі.