Разработка методов и алгоритмов интеллектуальной ГИС многокритериального анализа данных системы здравоохранения

Информация о проекте

Разработка методов и алгоритмов интеллектуальной ГИС многокритериального анализа данных системы здравоохранения (AP09259587 )

Цель проекта 

Разработка моделей, алгоритмов и методов, интеллектуальной геоинформационной системы мультикритериальной поддержки принятия решений в сфере здравоохранения на базе моделей объяснимого машинного обучения, NLP, ГИС с применением социальной, медицинской и экономической информации. 

Задачи проекта

  1. Разработка методов формирования наборов данных для решения задач оценки здравоохранения методами машинного обучения и визуализации в среде ГИС.
  2. Разработка моделей и методов анализа социального влияния здравоохранения на основе автоматического сбора и обработки медиа информации.
  3. Разработка моделейметодовалгоритмов мультикритериального анализа решений (MCDA) на основе медицинских, экономических и медиа данных в среде ГИС.

Достигнутые результаты

Разработана архитектура системы сбора. распределённого хранения и обработки, структурированной и неструктурированной медиа информации. Предложена концептуальная схема и программно-аппаратная архитектура информационной системы IGISMA. Конечной целью системы является предоставление аналитических инструментов для статистического анализа структурированных и неструктурированных данных по системе здравоохранения, включая модуль геопространственной визуализации, а также модуль выработки рекомендаций на основании интерпретации предиктивных моделей.

Проведены предварительные эксперименты в прототипе системы, результаты которых описаны в работе [K. O. Yakunin, S. B. Murzakhmetov, R. R. Musabayev, R. I. Mukhamediyev News Popularity Prediction Using Topic Modelling // 2021 IEEE Int. Conf. on Smart Information Systems and Technologies. –Nur-Sultan, 2021. – P. 1-4., doi: 10.1109/SIST50301.2021.9465884]

Разработаны индикаторы качества, включающие экономические, медицинские и социальные показатели оценки организаций здравоохранения Предложенная система индикаторов включает 24 универсальных и 7 обобщенных индикаторов качества.

Начата разработка наборов данных объемом от сотен до тысяч элементов, описывающих организации здравоохранения на основе медицинских и экономических показателей. Сформирован корпус новостных публикаций СМИ России и Казахстана. В него входят социальные сети (VK.com, YouTube, Instagram и Telegram) и более 20 новостных сайтов. Общее количество новостей: 4 233 990 документов из разных источников в Казахстане и 2 027 963 документа из разных источников в России; Даты публикации — с 2000 по 2021 год.

Результаты экспериментов с указанным набором данных описаны в работе [K. O. Yakunin et al. Reflection of the COVID-19 pandemic in mass media //2021 IEEE Int. Conf. on Information and Digital Technologies (IDT). – Slovakia, 2021. – P. 260-263. https://ieeexplore.ieee.org/abstract/document/9497572]

Разработан набор данных, состоящий из 1200 записей, содержащий статистические данные по эпидемиологической ситуации в связи с пандемией COVID-19 и описывающий организации здравоохранения на основе медицинских и экономических показателей. Данный набор данных апробирован для оценки свойств учреждений здравоохранения. Результаты опубликованы в работе

[M. Yelis, Y. Kuchin, A .Symagulov, E. Muhamedieva Explainable machine learning for healthcare decision-making tasks //The 19th int. scientific. conf. Information technologies and management 2021. — Riga, 2021. —  P. 56-58.  -https://www.ismaitm.lv/images/Files/Theses/2021/01_NC/23_ITM2021_Yelis_Kuchin_Symagulov_Muhamedieva.pdf]

Выполнен сравнительный анализ существующих методов объяснения результатов работы алгоритмов машинного обучения. Показано использование методов объяснения результатов работы МL, описаны проблемы оценки влияния свойств объекта на работу модели ML, объясняется интерпретируемость и объяснимость моделей ML,  показано применение интерпретаторов моделей машинного обучения в контуре системы поддержки принятия решений.

В качестве перспективного средства выбраны так называемые агностические модели, то есть модели объяснений, не зависящие от модели машинного обучения.

Выявлены недостатки моделей объяснения:

Предложена модель поддержки принятия решений MCDSS&BBE (multi criteria decision support system based on black boxes explainer) которая апробирована в задаче анализа показателей учреждений среднего образования и медицины.

По результатам анализа опубликована статья в издании, рекомендованном КОКСОН [Сымагулов А., Кучин Я., Елис М., Жумабаев А., Абдуразаков А. Методы интерпретация черных ящиков машинного обучения и их применение для создания систем поддержки принятия решений // Известия НАН РК. Серия физико-математических наук. – 2021. – №5(339). – С. 91–99. — https://journals.nauka-nanrk.kz/physics-mathematics/article/view/2576]

Структура системы ИГИСМА
Публикации
  1. Kirill Yakunin, Ravil I. Mukhamediev, Elena Zaitseva , Vitaly Levashenko, Marina Yelis, Adilkhan Symagulov 1,2, Yan Kuchin, Elena Muhamedijeva, Margulan Aubakirov and Viktors Gopejenko. Mass media as a mirror of the COVID-19 pandemic//Computation. – 2021. (CiteScore highest quartile = Q2, JCR — Q2, CiteScore =2.9, CiteScore highest percentile=69%) 
  2. Сымагулов А. и др. МЕТОДЫ ИНТЕРПРЕТАЦИИ ЧЕРНЫХ ЯЩИКОВ МАШИННОГО ОБУЧЕНИЯ И ИХ ПРИМЕНЕНИЕ ДЛЯ СОЗДАНИЯ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ //Известия НАН РК. Серия физико-математических наук. – 2021. – №. 5. – С. 91-99. http://89.250.84.46/physics-mathematics/article/view/2576
  3. K. O. Yakunin, S. B. Murzakhmetov, R. R. Musabayev and R. I. Mukhamediyev, «News Popularity Prediction Using Topic Modelling,» 2021 IEEE International Conference on Smart Information Systems and Technologies (SIST), 2021, pp. 1-4, doi: 10.1109/SIST50301.2021.9465884.
  4. Yakunin K. et al. Reflection of the COVID-19 pandemic in mass media //2021 International Conference on Information and Digital Technologies (IDT). – IEEE, 2021. – С. 260-263. https://ieeexplore.ieee.org/abstract/document/9497572
  5. M Yelis, Y Kuchin, A Symagulov, E Muhamedieva Explainable machine learning for healthcare decision-making tasks //The 19th INTERNATIONAL SCIENTIFIC CONFERENCE INFORMATION TECHNOLOGIES AND MANAGEMENT 2021 April 22-23, 2021, ISMA University of Applied Science, Riga.- c. 56-58.
  6. https://www.ismaitm.lv/images/Files/Theses/2021/01_NC/23_ITM2021_Yelis_Kuchin_Symagulov_Muhamedieva.pdf
  7. «Reflection of the COVID-19 pandemic in mass media» 13th International Conference on Intelligent Decision Technologies. Accepted for publication. Yakunin K.O. 1,2, Murzakhmetov S.B. 1, Musabayev R.R. 1, Mukhamediyev R.I.1,2 2021 IEEE International Conference on Smart Information Systems and Technologies (2021 IEEE SIST)

Рабочая группа

Ravil Mukhamedyev Principal invistegator Scopus ➔  ORCID ➔ Publications ➔ Kirill Yakunin Lead software engineer Scopus ➔  ORCID ➔ Publications ➔ Yan Kuchin Senior research scientist Scopus ➔  ORCID ➔ Publications ➔ Elena Mukhamedyeva Research scientist Scopus ➔ ORCID ➔ Publications ➔  
  Renat Mustakayev Software engineer Scopus  ORCID  Publications  Marina Yelis Junior research scientist Scopus ➔ ORCID ➔ Publications ➔   Adilkhan Symagulov Engineer Scopus ➔ ORCID ➔ Publications ➔