Aкустикалық және тілдік модельдеу кезеңінде жасанды нейрондық желілерді қолдану арқылы сөйлеуді көп тілді танудың дәлдігін арттыру.
Сөйлеуді тану саласындағы дамудың аналитикалық шолуы;
Орыс және қазақ тілдері үшін сөйлеу және мәтін корпусын әзірлеу және жобалау;
Жасанды нейрондық желілерді пайдалана отырып, акустикалық және тілдік модельдерді әзірлеу;
Сөйлеуді автоматты түрде танудың көптілді жүйесін әзірлеу және тестілеу.
Әр түрлі өндірістік және экономикалық мәселелерді шешудің өзекті мәселесі-сөйлеуді автоматты түрде танудың көптілді технологияларын дамыту және терең білім алу үшін жасанды нейрондық желілерді қолдану.
Жоспарланған зерттеулердің ғылыми маңыздылығы тану және терең оқыту әдістерін дамыту болып табылады. Қолданыстағы тану әдістері мен жасанды нейрондық желілерді кешенді зерттеу жоспарлануда, содан кейін сөйлеуді көптілді автоматты түрде тануға қатысты ең тиімді әдістерді таңдау жоспарлануда. Зерттеулер терең нейрондық желі алгоритмдерін, жасырын Марков модельдерін, сөйлеуді тану алгоритмдерін қолдана отырып, тану процесін интеллектуализациялауға бағытталған.
Жобаны іске асыру процесінде әлеуметтік-экономикалық тиімділік ретінде қазіргі сөйлеу технологияларының сапасын арттыру және Ұлттық тілдерге бейімделу дәрежесін арттыру күтілуде. Нәтижесінде, адамдардың күнделікті өміріне сөйлеу технологияларын көбірек енгізу орын алады ,бұл өз кезегінде олардың өмір сүру сапасының артуына әкеледі (бұл дамушы елдердегі мүмкіндігі шектеулі адамдар үшін өте маңызды).
Акустикалық сигналда сөйлеуді адамның ұқсас қабілетінен кем емес тиімділікпен тануға қабілетті терең нейрондық желілерді қолдана отырып, сөйлеуді автоматты түрде тануды құрудың түпкі мақсаты. Сөйлеуді көптілді автоматты тану жүйесін дамыту саласында ғылым мен техниканың дамуы барысында айтарлықтай прогресс байқалады. Корпус көлемі 2000 сағатқа дейін өсті.
Сөйлеуді танудың қолданыстағы жүйелерін талдау, сонымен қатар көп тілді сөйлеуді автоматты тану технологиясын жасау мәселесін шешу үшін математикалық модельдер мен алгоритмдерді әзірлеу.
Ақпараттық технологиялар базасында Ұлттық тілдерді қолдану саласын кеңейтуге жауапты мемлекеттік құрылымдар; ұялы телефон өндірушілер (Ұлттық тілдерде сөйлеу технологияларын енгізу есебінен әлеуетті сатып алушылар санын ұлғайту); ұялы операторлар мен банктер (дауыстық функцияларды қолдайтын call-орталықтар, дауыстық аутентификация); дауыстық функцияларды қолдайтын әртүрлі құрылғыларды өндіру секторы (“”кітаптар, ойыншықтар, “ақылды үйге”арналған құрылғылар).
Жоба нәтижелері ЖШС “Ұлттық инновациялық орталық” енгізілді.
Мамырбаев Ө.Ж. Қазақ ауызекі сөйлеуін автоматты өңдеу: Монография. – ҚР БҒМ ҒК Ақпараттық және есептеуіш технологиялар институты. – 2020. – 142 б.
1 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Мекебаев Н.О. Методы и модели автоматического распознавания речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 210 с.
2 Мамырбаев О.Ж., Кыдырбекова А.С., Тұрдалыұлы М., Жумажанов Б.Ж., Мекебаев Н.О. Автоматическое распознавание речи. – Институт информационных и вычислительных технологий КН МОН РК. – 2020. – 104 с.
– қазақ және орыс тілдерінің көптілді корпусы;
– сөйлеу сигналдарын алдын ала өңдеу әдістері, акустикалық және тілдік модельдер, Автоматты транскриптор;
– сөйлеуді автоматты түрде танудың көптілді жүйесі.