enrukz
enrukz
Email : gulmira.tolegen.cs@gmail.com

Төлеген Гүлмира

Научный сотрудник РГП на ПХВ «Института информационных и вычислительных технологий» КН МОН РК

Биография

Төлеген Гүлмира в 2013 году окончила Нанкинский университет (Nanjing University, Nanjing, China) по специальности «Компьютерные науки и технологии».

В 2013-2016 гг. обучалась и закончила магистратуру Университета Фудань (Fudan University, Shanghai, China) по специальности «Вычислительная техника и программное обеспечение».

Опыт исследовательской работы:

С 2013 по 2016 гг работала в должности младший научный сотрудник лаборатории Shanghai Key Laboratory of Intelligent Information Processing, Fudan University.

С 2016 по 2017 гг. работала в должности младший научный сотрудник лаборатории National Laboratory Astana, Назарбаев Университет.

С 2017 по 2018 гг. работала в должности научный сотрудник лаборатории Knowledge Engineering Group, Университет Цинхуа.

С 2018 г. работает в должности научный сотрудник РГП на ПХВ «Института информационных и вычислительных технологий» КН МОН РК.

Обладает обширными исследовательскими интересами, в том числе в области искусственного интеллекта, машинного обучения, оптимизации, изучения представлений, тематического моделирования, кластеризации, инженерии знаний, интеллектуального анализа данных, обработки речевых сигналов и обработки естественных языков.

Научные труды

  • Tolegen G., Toleu A., & Zheng, Xiaoqing. (2016). Named entity recognition for kazakh using conditional random fields. Proceedings of the 4-thInternational Conference on Computer Processingof Turkic Languages TurkLang 2016, Izvestija KGTUim.I.Razzakova, pp.118_127(https://nur.nu.edu.kz/handle/123456789/2234)

  • Toleu A., Tolegen G., & Makazhanov A. (2017). Character-aware neural morphological disambiguation. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL), Association for ComputationalLinguistics, Vancouver, Canada, pp. 666–67.DOI:10.18653/v1/P17-2105 (Scopus, Web of Science)
  • Toleu A., Tolegen G., Makazhanov A.: Character-based deep learning models for token and sentence segmentation. In: Proceedings of the 5th International Conference on Turkic Languages Processing (TurkLang 2017). Kazan, Tatarstan, Russian Federation (October 2017)

  • Toleu A., Tolegen G., Mussabayev R.: KeyVector Unsupervised Keyphrase Extraction Using Weighted Topic via Semantic Relatedness // Computación y Sistemas, 2019. -Vol. 23(3). -P. 861–869 // doi: 10.13053/CyS-23-3-3264 (Scopus Percentile = 24, Web of Science IF – 0.53)

  • Toleu A., Tolegen G., Mussabayev R. Comparison of Various Approaches for Dependency Parsing // 15th International Asian School-Seminar on Optimization Problems of Complex Systems (OPCS 2019), IEEE, 2019, Article number 8880244, pp. 192-195 (Scopus)

  • Tolegen Gulmira and Toleu Alymzhan and Orken Mamyrbayev and Rustam Mussabayev. Neural Named Entity Recognition for Kazakh.arXiv:2007.13626. (https://arxiv.org/pdf/2007.13626.pdf)

  • Toleu A., Tolegen G., Mussabayev R. (2020) Deep Learning for Multilingual POS Tagging. In Advances in Computational Collective Intelligence. ICCCI 2020. Communications in Computer and Information Science (Scopus), vol 1287. Springer, Cham. https://doi.org/10.1007/978-3-030-63119-2_2.

  • Orken Mamyrbayev, Toleu Alymzan., Tolegen Gulmira., & Nurbapa Mekebayev (2020) Neural architectures for gender detection and speaker identification, Cogent Engineering, 7:1, DOI: 10.1080/23311916.2020.1727168. (Scopus percentile = 69)

  • Tolegen G., Toleu A., Mussabayev R. Voted-Perceptron Approach for Kazakh Morphological Disambiguation // Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020), Language Resources and Evaluation Conference (LREC 2020), European Language Resources Association (ELRA), pp. 258–264 (https://www.aclweb.org/anthology/2020.sltu-1.36/)