Preview

Вестник кибернетики

Расширенный поиск

РЕШЕНИЕ ЗАДАЧИ КЛАССИФИКАЦИИ ДОКУМЕНТОВ ВУЗА НА ОСНОВЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА

https://doi.org/10.34822/1999-7604-2021-1-12-19

Полный текст:

Аннотация

Рассмотрена задача классификации текстовых документов высшего учебного заведения с помощью следующих методов машинного обучения: метода Байеса, метода k-ближайших соседей, метода дерева решений, метода опорных векторов. Исследование проведено с использованием языка программирования Python, в качестве исходных данных был использован набор документов Сибирского государственного автомобильно-дорожного университета.
Выполнена предварительная обработка документов с отнесением их к одному из четырех классов: приказ, распоряжение, письмо, извещение о вакантном месте. Проведен сравнительный анализ результатов классификации каждого метода машинного обучения по таким метрикам, как правильность алгоритма классификации, точность, полнота, F-мера, время работы алгоритма. Разработаны рекомендации по применению ансамбля методов, показавших наилучшие результаты, для оптимизации работы классификатора документов.

Об авторе

А. Л. Ткаченко
Сибирский государственный автомобильно-дорожный университет, Омск, Россия
Россия

E-mail: tanaleo@mail.ru



Список литературы

1. Ткаченко А. Л. Обзор методов интеллектуального анализа документов // Информационные технологии и автоматизация управления : материалы XI Всерос. науч.-практ. конф. Омск, 2020. С. 2018–2027.

2. Кажемский М. А., Шелухин О. И. Многоклассовая классификация сетевых атак на информационные ресурсы методами машинного обучения // Тр. учеб. заведений связи. 2019. Т. 5, № 1. С. 107–115.

3. Рубцова Ю. С. Методы и алгоритмы построения информационных систем для классификации текстов социальных сетей по тональности : дис. … канд. техн. наук. Новосибирск, 2019. 141 с.

4. Zhang X., Zhao J., LeCun Y. Character-level Convolutional Networks for Text Classification // Neural Information Processing Systems. 2015. Vol. 28. P. 649–657.

5. Батура Т. В. Методы автоматической классификации текстов // Программн. продукты и системы. 2017. Т. 30, № 1. С.85–99.

6. Бондарчук Д. В. Алгоритмы интеллектуального поиска на основе метода категориальных векторов: дис. … канд. техн. наук. Екатеринбург, 2016. 141 с.

7. Jiang L., Li C., Wang S., Zhang L. Deep Feature Weighting for Naive Bayes and its Application to Text Classification // Engineering Applications of Artificial Intelligence. 2016. Vol. 52. P. 26–39.

8. Серобабов А. С. Формирование диапазонов переменных экспертной системы на соответствие нормальному закону распределения // Проблемы и перспективы студ. науки. 2019. № 2. С. 3–6.

9. Nguyen L. Text Classification Based on Support Vector Machine // Dalat University Journal of Science. 2019. Vol. 9, Iss. 2. P. 3–19.

10. Оценка качества в задачах классификации. URL: https://neerc.ifmo.ru/wiki/index. php?title (дата обращения: 10.02.2021).


Для цитирования:


Ткаченко А.Л. РЕШЕНИЕ ЗАДАЧИ КЛАССИФИКАЦИИ ДОКУМЕНТОВ ВУЗА НА ОСНОВЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА. Вестник кибернетики. 2021;(1):12-19. https://doi.org/10.34822/1999-7604-2021-1-12-19

For citation:


Tkachenko A.L. SOLVING THE PROBLEM OF UNIVERSITY DOCUMENTS CLASSIFICATION BASED ON INTELLECTUAL ANALYSIS METHODS. Proceedings in Cybernetics. 2021;(1):12-19. (In Russ.) https://doi.org/10.34822/1999-7604-2021-1-12-19

Просмотров: 15


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1999-7604 (Online)