УНИВЕРСИТЕТ ДЕРЕКТЕРІНДЕГІ АУЫТҚУЛАРДЫ АНЫҚТАУҒА АРНАЛҒАН МАШИНАЛЫҚ ОҚЫТУ ӘДІСТЕРІ
DOI:
https://doi.org/10.56525/8w3jgv24Кілт сөздер:
машиналық оқыту, ауытқуларды анықтау, университет деректері, оқшаулағыш орман, автоэнкодер, LOF, жіктеу алгоритмдеріАңдатпа
Бұл мақала гетерогенді университет деректеріндегі ауытқуларды автоматты түрде анықтау үшін қолданылатын Машиналық оқыту әдістерін әзірлеуге және кешенді талдауға арналған. Зерттеудің өзектілігі академиялық ортадағы цифрлық деректер көлемінің қарқынды өсуіне, сондай-ақ академиялық адалдықты, желілік трафик деректерінің бұзылуы немесе ақпараттық қауіпсіздікке төнетін қатерлерді куәландыратын типтік емес мінез-құлық үлгілерін жедел анықтау қажеттілігіне байланысты.
Жұмыста аномалияларды анықтаудың теориялық негіздері жүйеленген, соның ішінде аномалияларды түрлері бойынша жіктеу (нүктелік, контексттік, ұжымдық) және оларды анықтаудың қолданыстағы тәсілдеріне шолу. Үш негізгі алгоритмнің математикалық аппараты егжей-тегжейлі сипатталған: белгілер кеңістігін кездейсоқ бөлуге негізделген оқшаулағыш орман әдісі (isolation Forest); аномалия өлшемі ретінде қайта құру қатесін пайдаланатын автоэнкодерлерге негізделген нейрондық желі тәсілі; сондай-ақ объектінің жергілікті ортаға қатысты ауытқу дәрежесін бағалайтын жергілікті шығару факторының алгоритмі (Local Outlier Factor, LOF).
Эксперименттік зерттеулер оқу үлгерімін, сабаққа қатысуды, LMS жүйелеріндегі белсенділікті және қаржылық операцияларды қамтитын нақты университет деректерінде жүргізілді. Салмақты дауыс беру негізінде барлық үш алгоритмнің нәтижелерін біріктіретін кешенді ансамбльдік тәсіл ұсынылды. Precision, Recall және F1-score көрсеткіштері бойынша әдістерді салыстырмалы бағалау жүргізілді. Нәтижелер жалған позитивтердің минималды деңгейінде ауытқуларды анықтаудың жоғары дәлдігін көрсетеді, бұл ұсынылған тәсілдің нақты университеттік ортада практикалық қолданылуын растайды.




