УДК 004.89
Пальмов С.В., к.тн., доцент
доцент
кафедра информационных систем и технологий
ФГБОУ ВО ПГУТИ доцент
кафедра информационных технологий ФГБОУ ВО «СамГТУ» Россия, Самара
РАЗРАБОТКА АНАЛИТИЧЕСКОГО МОДУЛЯ НА ОСНОВЕ МАШИНЫ ОПОРНЫХ ВЕКТОРОВ
Аннотация: Методы искусственного интеллекта являются эффективным инструментом, однако существует зависимость качества результатов от предметной области. Следовательно, актуальным будет такое программное обеспечение, которое позволит пользователю настроить его «под себя». Целью работы являлось создание решения указанного типа. Использовались методы опорных векторов, высокоуровневого программирования и сравнительного анализа. Заявленное программное обеспечение было разработано и протестировано; получены положительные результаты, подтверждающие возможность его практического использования.
Ключевые слова: машина опорных векторов, искусственный интеллект, Python, машинное обучение, классификация.
Palmov S. V., candidate of technical sciences, associate professor
associate professor Department of Information Systems and Technologies State University of Telecommunications and Informatics
associate professor Department of Information Technologies Samara State Technical University
Russia, Samara
DEVELOPMENT OF A SUPPORT VECTOR MACHINE-BASED
ANALYTICAL MODULE
Abstract: Artificial intelligence methods are powerful tools, but the quality of the results obtained can depend on the specific subject area. Therefore, there is a need for software that can be customized to suit the needs of individual users. The aim of this paper was to develop such a solution using support vector machines, high-level programming, and benchmarking. The
resulting software was developed, tested, and found to be suitable for practical use.
Keywords: support vector machine, artificial intelligence, Python, machine learning, classification.
Введение
Современное общество испытывает все большую потребность в средствах автоматизации. Технологии интеллектуальной обработки данных являются одним из инструментов, позволяющим решить указанную задачу. Однако явная корреляция между методом и предметной областью (метод «X» наилучшим образом подходит для области «Y») отсутствует. Это приводит к необходимости разработки средств автоматизации (программного обеспечения) в формате, позволяющим пользователю корректировать настройки, исходя из данных, которые требуется обработать. Следовательно, можно утверждать, что работа, посвященная созданию приложения, обладающее упомянутыми возможностями, будет актуальна.
Цель работы была сформулирована так: разработка программного обеспечения (аналитической системы) на основе метода искусственного интеллекта (машина опорных векторов), с возможностью настройки значений его гиперпараметров.
Методы и исследование
В работе были использованы следующие методы.
Машина опорных векторов (Support Vector Machine) - один из лучших алгоритмов классификации, сравнимый по качеству работы с нейронными сетями [1].
Язык высокоуровневого программирования Python. С его помощью была реализована заявленная аналитическая система (АС) «Модуль «SVM» (см. рис.1).
Сравнительный анализ применялся для оценки качества работы АС.
0 Модуль "SVM" Основное меню
Настройка гиперпараметров Настройка режима работы Регуляризация! 1,0 Сжатие!
Ядро:
□
X
Да
rbf
Степень: Гамма:
coefO:
3
Вероятность: Останов:
Да
0,001
scale
Макс, число итераций: -1
0.0
Форма решающей функции: ovr
Рис. 1. Интерфейс АС «Модуль «SVM»
Результаты исследования
Для оценки качества работы системы был проведен эксперимент. Исходными данными послужил набор «Голосование депутатов конгресса» [2], значения полей которого были перекодированы в числовой формат. Использовалась перекрестная проверка с k, равным трем; метрика оценки качества - F1 [3]. Было выполнено четыре прогона для следующих значений параметра «Ядро»: «rbf», «linear», «poly» и «sigmoid». Результаты представлены в табл. 1.
Таблица 1. Результаты эксперимента
Тип ядра F1
rbf 0,9496
linear 0,9375
poly 0,9320
sigmoid 0,3794
Заключение
Как видно из представленных результатов, последний тип ядра продемонстрировал худшее качество, в разы отличающееся от прочих. Остальные позволили построить очень эффективные модели (значение F1 - около единицы). Именно возможность настройки гиперпараметров позволила достигнуть данного результат. Таким образом, можно утверждать, что цель работы достигнута, а созданная АС может применяться для решения практических задач.
Использованные источники:
1. Воробжанский, Н. Н. Использование метода опорных векторов в классификации изображений / Н. Н. Воробжанский // 2017. - № 5(92). - С. 11-18.
2. Пальмов, С. В. Сравнение классификационных возможностей алгоритмов С4.5 и С5.0 / С. В. Пальмов, А. А. Мифтахова // Инфокоммуникационные технологии. - 2015. - Т. 13, № 4. - С. 467-471. -DOI 10.18469/ikt.2015.13.4.18.
3. F-measure: A forecasting-led time series distance measure in large-scale forecasting of video services performance / Y. Zhuo, J. You, H. Xue, J. Wang // 2018. - Vol. 14, No. 6. - P. 2175-2188. - DOI 10.24507/ijicic.14.06.2175.