Лаборатория интеллектуального анализа больших данных

Зав. лабораторией к.т.н.,

ассист.проф. Пак Александр Александрович. h-index: 7

Кадровый состав (количественный и качественный состав)

Терехов Алексей Геннадьевич – к.т.н., ВНС, h-index:8

Джаксылыкова Асель Булатовна – НС, докторант, h-index:3

Цель лаборатории

Развитие методов интеллектуального анализа данных и машинного обучения для решения прикладных и фундаментальных задач в различных отраслях. Основные направления деятельности включают:

  • разработку алгоритмов машинного обучения;
  • исследование методов анализа больших данных;
  • применение технологий искусственного интеллекта в промышленности, экологии и медицине;
  • интеграцию искусственного интеллекта в цифровые решения.

Нынешнее состояние и успехи (грамоты, награды и т.д)
Участие в грантах:

Коллектив лаборатории участвовал в следующих грантах:

  1. AP05132760 Разработка методов глубокого обучения семантического вероятностного вывода – успешно завершен.
  2. AP09260670 Разработка методов и алгоритмов увеличения входных данных для модификации векторных представлений слов – успешно завершен.
  3. AP14871214 Разработка методов машинного обучения для повышения связности текста в аннотациях, полученных методами экстрактивного суммаризирования – успешно завершен.
  4. AP23489782 AutoCorrection: обучение с подкреплением от искусственного интеллекта для разработки самокорректирующихся языковых моделей – в процессе выполнения (КБТУ).

Участие в качестве исполнителя в следующих проектах:

  1. AP05134241 Мониторинг территории Синьцзян-Уйгурского автономного района Китайской Народной Республики в пределах трансграничных речных бассейнов и зависимых территорий на основе спутниковой информации – успешно завершен.
  2. AR05134227 Моделирование сложных систем методами графодинамики и дискретной дифференциальной геометрии – успешно завершен.
  3. BR11265420 Разработка экспертной системы поддержки принятия решений в космической отрасли – успешно завершен.

Видение лаборатории на ближайшие 3 года в контексте ИИ и коммерциализации.

Лаборатория ставит перед собой амбициозные задачи в области развития и коммерциализации искусственного интеллекта:

  • Создание собственных продуктов ИИ: Разработка интеллектуальных систем для анализа данных в медицине, экологии и промышленности с целью их дальнейшей коммерциализации.
  • Развитие коллабораций: Углубление сотрудничества с ведущими мировыми лабораториями и компаниями, работающими в области ИИ.
  • Привлечение инвестиций: Участие в грантовых конкурсах и инвестиционных программах по поддержке стартапов в области искусственного интеллекта.
  • Обучение и подготовка кадров: Создание образовательных программ и курсов по искусственному интеллекту для магистратуры и бизнеса.
  • Разработка специализированных ИИ-решений для отечественного рынка:
  • автоматизированные системы мониторинга;
  • интеллектуальный анализ текстов и документов;
  • системы предсказательного анализа для промышленности.

Перспективы развития.

Лаборатория планирует расширение и укрепление своих позиций в научной и коммерческой сферах:

  • Научные перспективы:
    • Развитие алгоритмов самообучающихся систем ИИ;
    • Исследование гибридных методов машинного обучения, сочетающих вероятностные и детерминированные модели.
  • Технологические перспективы:
    • Внедрение разработок в государственные и коммерческие проекты.
    • Развитие AI-driven систем для цифровых двойников в промышленности.
  • Коммерциализация:
    • Создание стартапов на основе разработанных технологий;
    • Лицензирование интеллектуальной собственности и программных продуктов.
  • Участие в международных проектах:
    • Привлечение международного финансирования;
    • Сотрудничество с европейскими и азиатскими партнёрами в рамках программ AI for Sustainable Development.

Проект: AP05132760-OT-19 Разработка методов глубокого обучения семантического вероятностного вывода

В 2018-2020 годах в Институте информационных и вычислительных технологий мы с коллегами разработали методы и алгоритмы глубокого обучения для структурирования медицинских данных.

Разработанные нами методы и алгоритмы могут быть применены в цифровых рабочих процессах в медицине, а именно, для преобразования унаследованных / архивных данных в цифровую форму. Необходимость такого преобразования заключается в том, что архивные данные содержат историю болезни пациента, которая имеет решающее значение для диагностики пациента.

Полученные результаты апробированы в статьях открытого доступа, конференциях, патентах. Также мы получили свидетельства об авторских правах на программное обеспечение.

Авторские свидетельства:

Патенты:

Сотрудниками Института информационных и вычислительных технологии Комитета Науки Министерства образования и науки Республики Казахстан, в рамках проекта ГФ АР05134241 за 2018-2020 гг. были разработаны:

– методы спутниковых оценок загрузки магистральных водных каналов Кара-Ертис- Карамай и Кара-Ертис – Урумчи, которые безвозвратно перебрасывают воду трансграничной (Казахстан -КНР) реки Кара-Ертис во внутренние районы КНР (Джунганская равнина). Потенциальный объем переброски оценивается в 2,8 куб.км; фактический, средний многолетний в 1 куб.км.

– методы спутниковых оценок запасов воды в рабочих частях водохранилищ Китайского сектора бассейна р.Иле. Запущенные в работу в 2006-2007 гг. в СУАР КНР гидроэлектростанции с крупными водохранилищами (Капшагайское на реке Текес и Жарынтайское на реке Каш) способны аккумулировать до 30% годового стока р. Иле. В средние и маловодные годы сезонное пополнение этих резервуаров способно вызывать неожиданные, острые, антропогенные маловодья реки Иле на границе с Казахстаном. В методике дистанционной оценки запасов воды в водохранилищах КНР заинтересован РГП «Казгидромет» (имеется акт внедрения). Мониторинг заполнения водохранилищ важен для прогноза водности р.Иле на границе Казахстан-КНР. В перспективе, после подписания соглашения с КНР о делении трансграничных водных ресурсов, Казахстану потребуются объективные технологии контроля над исполнением соглашения, в том числе и основанные на спутниковой информации.

Проводились научные работы по оценке водопотребления в период 2002-2020 гг. на поливной пашне в Джунгарской равнине, в зоне влияния водных каналов Кара-Ертис – (Карамай и Урумчи). В ходе работ по проекту на текущий момент вышло из печати 11 статей в научных изданиях входящих в базу Скопус.

Обладая технологиями дистанционного (спутникового) мониторинга водных объектов в связи с ЧС был проанализирован режим работы Сардобинского водохранилища (Узбекистан), с момента его строительства 2017 году и до разрушения боковой дамбы 1 мая 2020 года. Потеря 680 млн. м3 воды 1 мая привела к затоплению 600 кв. км территории Узбекистана и Казахстана. Полученные результаты апробированы в виде статей в высокорейтинговых журналах и международных конференциях