enrukz
enrukz
Email : gulmira.tolegen.cs@gmail.com

Төлеген Гүлмира

ҚР БҒМ ҒК “Ақпараттық және есептеу технологиялары институты” ғылыми қызметкері

Өмірбаяны

Төлеген Г. 2013ж. Нанкин университетінің (Nanjing University, Nanjing, China) «Компьютерлік ғылым және технологиялар» мамандығын бойынша бакалавр тамамдаған.

2013-2016 жылдары Фудан Университетінің (Fudan University, Shanghai, China) «Есептеуіш техника және бағдарламалық қамтамасыз ету» мамандығы бойынша магистратураны бітірді.

Ғылыми жұмыс тәжірибесі:

2013 және 2016 жылдар аралығында Фудан Университетінің, «Shanghai Key Laboratory of Intelligent Information Processing» зертханасында кіші ғылыми қызметкері міндетін атқарды.

2016 және 2017 жылдар аралығында Назарбаев Университетінің «National Laboratory Astana»» зертханасында кіші ғылыми қызметкері міндетін атқарды.

2017 және 2018 жылдар аралығында Цинхуа университетінің «Knowledge Engineering Group» зертханасында ғылыми қызметкері міндетін атқарды.

2018 жылдан бері ҚР БҒМ ҒК «Ақпараттық және есептеуіш технологиялары институтында» ғылыми қызметкері міндетін атқарып келеді.

Төлеген Г. ғылыми бағыттағы қызығушылығы кең көлемді. Олар  негізінен жасанды интеллект, машиналық оқыту, optimization, representation learning, topic modeling, кластерлеу, knowledge инженериясы, data mining, сөйлеу сигналын өңдеу және natural language processing қамтитыды.

Ғылыми еңбектер

  • Tolegen G., Toleu A., & Zheng, Xiaoqing. (2016). Named entity recognition for kazakh using conditional random fields. Proceedings of the 4-thInternational Conference on Computer Processingof Turkic Languages TurkLang 2016, Izvestija KGTUim.I.Razzakova, pp.118_127(https://nur.nu.edu.kz/handle/123456789/2234)

  • Toleu A., Tolegen G., & Makazhanov A. (2017). Character-aware neural morphological disambiguation. Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL), Association for ComputationalLinguistics, Vancouver, Canada, pp. 666–67.DOI:10.18653/v1/P17-2105 (Scopus, Web of Science)
  • Toleu A., Tolegen G., Makazhanov A.: Character-based deep learning models for token and sentence segmentation. In: Proceedings of the 5th International Conference on Turkic Languages Processing (TurkLang 2017). Kazan, Tatarstan, Russian Federation (October 2017)

  • Toleu A., Tolegen G., Mussabayev R.: KeyVector Unsupervised Keyphrase Extraction Using Weighted Topic via Semantic Relatedness // Computación y Sistemas, 2019. -Vol. 23(3). -P. 861–869 // doi: 10.13053/CyS-23-3-3264 (Scopus Percentile = 24, Web of Science IF – 0.53)

  • Toleu A., Tolegen G., Mussabayev R. Comparison of Various Approaches for Dependency Parsing // 15th International Asian School-Seminar on Optimization Problems of Complex Systems (OPCS 2019), IEEE, 2019, Article number 8880244, pp. 192-195 (Scopus)

  • Tolegen Gulmira and Toleu Alymzhan and Orken Mamyrbayev and Rustam Mussabayev. Neural Named Entity Recognition for Kazakh.arXiv:2007.13626. (https://arxiv.org/pdf/2007.13626.pdf)

  • Toleu A., Tolegen G., Mussabayev R. (2020) Deep Learning for Multilingual POS Tagging. In Advances in Computational Collective Intelligence. ICCCI 2020. Communications in Computer and Information Science (Scopus), vol 1287. Springer, Cham. https://doi.org/10.1007/978-3-030-63119-2_2.

  • Orken Mamyrbayev, Toleu Alymzan., Tolegen Gulmira., & Nurbapa Mekebayev (2020) Neural architectures for gender detection and speaker identification, Cogent Engineering, 7:1, DOI: 10.1080/23311916.2020.1727168. (Scopus percentile = 69)

  • Tolegen G., Toleu A., Mussabayev R. Voted-Perceptron Approach for Kazakh Morphological Disambiguation // Proceedings of the 1st Joint SLTU and CCURL Workshop (SLTU-CCURL 2020), Language Resources and Evaluation Conference (LREC 2020), European Language Resources Association (ELRA), pp. 258–264 (https://www.aclweb.org/anthology/2020.sltu-1.36/)