Интернет желілерінде қазақ, орыс және ағылшын тілдеріндегі құқыққа қайшы мәтіндерді автоматты анықтау жүйесінің ақпараттық моделін құру. Ақпараттық модельге «Құқыққа қайшы Интернет-контент» онтологиясы, мәтіндердің мамандандырылған корпустары және мемлекеттік қызмет аналитиктерін құқыққа қайшы мазмұнды мәтіндерді анықтау бойынша қолдауға арналған экстремистік және криминалды мазмұнды мәтіндерді іздеу мен талдаудың бағдарламалық құралдары кіреді.
машиналық оқыту әдістерін бір мезгілде қолдануға және пәндік аймақтың онтологиясынан алынған саралау белгілерін күшейтуге негізделген Интернеттің мәтіндік мазмұнын семантикалық талдаудың жаңа кешенді тәсілінде жатыр.
Жоба сонымен қатар құрылымдалмаған құжаттардан фактілерді алудың логикалық-лингвистикалық моделіне негізделген «Құқыққа қайшы интернет-контент» лингвистикалық онтологиясын автоматты түрде генерациялау әдістемесін әзірлеуді қамтиды.
Бұл модельді пайдалану қылмыстық боялған мәтіндерден тұратын құрылған мәтіндік корпустан алынған объектілермен және олардың арасындағы қатынастармен онтологияны толтыруды автоматтандыруға мүмкіндік береді.
Жобаны жүзеге асыру барысында Қазақстан Республикасында алғаш рет үш тілде: қазақ, орыс және ағылшын тілдерінде құқыққа қайшы интернет-мәтіндік контенттің пәндік саласының онтологиясын әзірлеу көзделуде. Айта кету керек, әлемдік ашық дереккөздерде мұндай онтологиялар туралы практикалық қолдану үшін жеткілікті ақпарат жоқ.
онтологиялық тәсіл негізінде қазақ, орыс және ағылшын тілдеріндегі құқыққа қайшы мәтіндік ақпаратты автоматты түрде іздеу және талдау үлгілері мен әдістері.
бұл жобаны жүзеге асыру қазақ, орыс және ағылшын тілдеріндегі мәтіндерді мағыналық өңдеудің тиімділігін арттыруға мүмкіндік береді; құрылған жоғары мамандандырылған онтология «Құқыққа қайшы интернет-контент» қазақ тілінің жаңа лингвистикалық ресурсын білдіреді, ол кейінгі әзірлемелердің ғылыми әлеуетін арттырады.
құқық қорғау және арнаулы мемлекеттік ұйымдар; әлеуметтік қызметтер; оқу орындары және басқа да мемлекеттік мекемелер.
Жобаны орындау барысында күтілетін негізгі нәтижелер:
1) көлемі мен құрылымы шектеулі мета-онтологияны білдіретін қазақ, орыс және ағылшын тілдерінің құқыққа қайшы лексикасының негізгі терминологиялық тезаурусы;
2) топтық онлайн пікірталас қауымдастықтарының қылмыстық мәні бар мәтіндерінің кеңейтілген корпусы;
3) қолда бар корпусқа және OdEE мәтінінен оқиғаларды шығаруға арналған әзірленген тәсілге негізделген автоматты онтологияны генерациялау әдісі.