Лаборатория интеллектуального анализа больших данных

Зав. лабораторией к.т.н.,

ассист.проф. Пак А.А.

Цель лаборатории — исследование научных методов анализа и обработки больших данных, а именно совершенствование и применение методов для поиска и извлечения новых знаний и закономерностей, недоступных перед обработкой и анализом традиционных алгоритмов.

Основные задачи лаборатории:

  • применение элементов машинного обучения в проектировании информационной системы подбора рекомендаций для клиентов;
  • разработка корпоративной базы данных для интегрированной информационной структуры специализированных систем (экологической и др. систем);
  • проектирование, эксплуатация и разработка программного обеспечения для высокопроизводительных вычислительных систем, вычислительных кластеров и суперкомпьютеров.
  • расширение экспериментальных и производственных площадок вычислительных экспериментов с применением суперкомпьютера (КазНУ, КазНТУ и др).

Основные направления научной деятельности лаборатории:

  • методы Data Mining;
  • смешение и интеграция данных;
  • применение машинного обучения;
  • прогнозная аналитика.

Полученные результаты

Разработан комплекс информационно — логистических моделей и методов управления транспортными перевозками. Разработана пространственно-сетевая база данных на основе графовой модели в системе перевозок для эффективного планирования и управления перевозками и моделирования дорожных карт.

Спроектирована информационная система процесса восстановления почв, загрязненных ксенобиотиками. Разработана корпоративная база данных, содержащая информации о загрязненных пестицидами территориях, о количестве устаревших пестицидов на этих территориях и уровне загрязнения почв хлорорганическими пестицидами.

Проект: AP05132760-OT-19 Разработка методов глубокого обучения семантического вероятностного вывода

В 2018-2020 годах в Институте информационных и вычислительных технологий мы с коллегами разработали методы и алгоритмы глубокого обучения для структурирования медицинских данных.

Разработанные нами методы и алгоритмы могут быть применены в цифровых рабочих процессах в медицине, а именно, для преобразования унаследованных / архивных данных в цифровую форму. Необходимость такого преобразования заключается в том, что архивные данные содержат историю болезни пациента, которая имеет решающее значение для диагностики пациента.

Полученные результаты апробированы в статьях открытого доступа, конференциях, патентах. Также мы получили свидетельства об авторских правах на программное обеспечение.

Авторские свидетельства:

Патенты:

Сотрудниками Института информационных и вычислительных технологии Комитета Науки Министерства образования и науки Республики Казахстан, в рамках проекта ГФ АР05134241 за 2018-2020 гг. были разработаны:

– методы спутниковых оценок загрузки магистральных водных каналов Кара-Ертис- Карамай и Кара-Ертис – Урумчи, которые безвозвратно перебрасывают воду трансграничной (Казахстан -КНР) реки Кара-Ертис во внутренние районы КНР (Джунганская равнина). Потенциальный объем переброски оценивается в 2,8 куб.км; фактический, средний многолетний в 1 куб.км.

– методы спутниковых оценок запасов воды в рабочих частях водохранилищ Китайского сектора бассейна р.Иле. Запущенные в работу в 2006-2007 гг. в СУАР КНР гидроэлектростанции с крупными водохранилищами (Капшагайское на реке Текес и Жарынтайское на реке Каш) способны аккумулировать до 30% годового стока р. Иле. В средние и маловодные годы сезонное пополнение этих резервуаров способно вызывать неожиданные, острые, антропогенные маловодья реки Иле на границе с Казахстаном. В методике дистанционной оценки запасов воды в водохранилищах КНР заинтересован РГП «Казгидромет» (имеется акт внедрения). Мониторинг заполнения водохранилищ важен для прогноза водности р.Иле на границе Казахстан-КНР. В перспективе, после подписания соглашения с КНР о делении трансграничных водных ресурсов, Казахстану потребуются объективные технологии контроля над исполнением соглашения, в том числе и основанные на спутниковой информации.

Проводились научные работы по оценке водопотребления в период 2002-2020 гг. на поливной пашне в Джунгарской равнине, в зоне влияния водных каналов Кара-Ертис – (Карамай и Урумчи). В ходе работ по проекту на текущий момент вышло из печати 11 статей в научных изданиях входящих в базу Скопус.

Обладая технологиями дистанционного (спутникового) мониторинга водных объектов в связи с ЧС был проанализирован режим работы Сардобинского водохранилища (Узбекистан), с момента его строительства 2017 году и до разрушения боковой дамбы 1 мая 2020 года. Потеря 680 млн. м3 воды 1 мая привела к затоплению 600 кв. км территории Узбекистана и Казахстана. Полученные результаты апробированы в виде статей в высокорейтинговых журналах и международных конференциях