Разработка методов и алгоритмов интеллектуальной ГИС многокритериального анализа данных системы здравоохранения (AP09259587 )
Цель проекта
Разработка моделей, алгоритмов и методов, интеллектуальной геоинформационной системы мультикритериальной поддержки принятия решений в сфере здравоохранения на базе моделей объяснимого машинного обучения, NLP, ГИС с применением социальной, медицинской и экономической информации.
Задачи проекта
Достигнутые результаты
Разработана архитектура системы сбора. распределённого хранения и обработки, структурированной и неструктурированной медиа информации. Предложена концептуальная схема и программно-аппаратная архитектура информационной системы IGISMA. Конечной целью системы является предоставление аналитических инструментов для статистического анализа структурированных и неструктурированных данных по системе здравоохранения, включая модуль геопространственной визуализации, а также модуль выработки рекомендаций на основании интерпретации предиктивных моделей.
Проведены предварительные эксперименты в прототипе системы, результаты которых описаны в работе [K. O. Yakunin, S. B. Murzakhmetov, R. R. Musabayev, R. I. Mukhamediyev News Popularity Prediction Using Topic Modelling // 2021 IEEE Int. Conf. on Smart Information Systems and Technologies. –Nur-Sultan, 2021. – P. 1-4., doi: 10.1109/SIST50301.2021.9465884]
Разработаны индикаторы качества, включающие экономические, медицинские и социальные показатели оценки организаций здравоохранения Предложенная система индикаторов включает 24 универсальных и 7 обобщенных индикаторов качества.
Начата разработка наборов данных объемом от сотен до тысяч элементов, описывающих организации здравоохранения на основе медицинских и экономических показателей. Сформирован корпус новостных публикаций СМИ России и Казахстана. В него входят социальные сети (VK.com, YouTube, Instagram и Telegram) и более 20 новостных сайтов. Общее количество новостей: 4 233 990 документов из разных источников в Казахстане и 2 027 963 документа из разных источников в России; Даты публикации — с 2000 по 2021 год.
Результаты экспериментов с указанным набором данных описаны в работе [K. O. Yakunin et al. Reflection of the COVID-19 pandemic in mass media //2021 IEEE Int. Conf. on Information and Digital Technologies (IDT). – Slovakia, 2021. – P. 260-263. https://ieeexplore.ieee.org/abstract/document/9497572]
Разработан набор данных, состоящий из 1200 записей, содержащий статистические данные по эпидемиологической ситуации в связи с пандемией COVID-19 и описывающий организации здравоохранения на основе медицинских и экономических показателей. Данный набор данных апробирован для оценки свойств учреждений здравоохранения. Результаты опубликованы в работе
[M. Yelis, Y. Kuchin, A .Symagulov, E. Muhamedieva Explainable machine learning for healthcare decision-making tasks //The 19th int. scientific. conf. Information technologies and management 2021. — Riga, 2021. — P. 56-58. -https://www.ismaitm.lv/images/Files/Theses/2021/01_NC/23_ITM2021_Yelis_Kuchin_Symagulov_Muhamedieva.pdf]
Выполнен сравнительный анализ существующих методов объяснения результатов работы алгоритмов машинного обучения. Показано использование методов объяснения результатов работы МL, описаны проблемы оценки влияния свойств объекта на работу модели ML, объясняется интерпретируемость и объяснимость моделей ML, показано применение интерпретаторов моделей машинного обучения в контуре системы поддержки принятия решений.
В качестве перспективного средства выбраны так называемые агностические модели, то есть модели объяснений, не зависящие от модели машинного обучения.
Выявлены недостатки моделей объяснения:
Предложена модель поддержки принятия решений MCDSS&BBE (multi criteria decision support system based on black boxes explainer) которая апробирована в задаче анализа показателей учреждений среднего образования и медицины.
По результатам анализа опубликована статья в издании, рекомендованном КОКСОН [Сымагулов А., Кучин Я., Елис М., Жумабаев А., Абдуразаков А. Методы интерпретация черных ящиков машинного обучения и их применение для создания систем поддержки принятия решений // Известия НАН РК. Серия физико-математических наук. – 2021. – №5(339). – С. 91–99. — https://journals.nauka-nanrk.kz/physics-mathematics/article/view/2576]
Рабочая группа
Ravil Mukhamedyev Principal invistegator Scopus ➔ ORCID ➔ Publications ➔ | Kirill Yakunin Lead software engineer Scopus ➔ ORCID ➔ Publications ➔ | Yan Kuchin Senior research scientist Scopus ➔ ORCID ➔ Publications ➔ | Elena Mukhamedyeva Research scientist Scopus ➔ ORCID ➔ Publications ➔ | |
Renat Mustakayev Software engineer Scopus ➔ ORCID ➔ Publications ➔ | Marina Yelis Junior research scientist Scopus ➔ ORCID ➔ Publications ➔ | Adilkhan Symagulov Engineer Scopus ➔ ORCID ➔ Publications ➔ |