УДК 519.87
РЕШЕНИЕ ЗАДАЧ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ МЕТОДАМИ АНАЛИЗА ДАННЫХ
Н. А. Челноков1, В. В. Становов2
1Краевая школа-интернат по работе с одаренными детьми «Школа космонавтики» Российская Федерация, 662971, Красноярский край, г. Железногорск, ул. Красноярская, 36, а/я 222 E-mail: chebreko@gmail.com 2Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: vladimirstanovov@yandex.ru
Рассматривается решение задачи классификации изображений. Было проведено сравнение эффективности используемых методов классификации с помощью программы RapidMiner. Представлено сравнение показателей точности методов классификации.
Ключевые слова: данные, классификация, проверка подлинности банкнот, обработка изображений, нейронная сеть, дерево решений, k-ближайших соседей, метод опорных векторов, случайный лес.
SOLVING IMAGE CLASSIFICATION PROBLEMS WITH DATA ANALYSIS METHODS
N. A. Chelnokov1, V. V. Stanovov2
1Regional boarding school for talented children "Cosmonautics school" P.O.B. 222, 36, Krasnoyarskaya Str., Zheleznogorsk, Krasnoyarskiy kray, 662971, Russian Federation
E-mail: chebreko@gmail.com 2Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: vladimirstanovov@yandex.ru
The solution of the problem of classification of images is considered. The effectiveness of the classification methods used was compared with the RapidMiner program. Comparison of accuracy indicators of classification methods is presented.
Keywords: data, classification, banknote authentication, image segmentation, neural network, decision tree, k-nearest neighbors, support vector method, random forest.
Распознавание образов довольно распространённая задача, служащая для идентификации предметов, явлений, сигналов и ситуаций. Значительная часть задач обработки информации и анализа данных связана с изображениями. Задача подобного характера может возникнуть в любой из сфер жизнедеятельности, начиная от медицины заканчивая космонавтикой. В качестве примера можно привести обработку и анализ данных изображений объектов, получаемых со спутников.
Данная задача также очень актуальна для разработки автопилотируемых автомобилей. Есть 5 видов датчиков такие как: камеры, радары, лидары, ультразвук, инфракрасные камеры. На данный момент баланс перекошен в пользу камер и радаров, которые на двоих занимают 85 рынка в деньгах. В этом нет ничего удивительного, ведь только камеры могут распознать дорожную разметку и знаки, а также по картинке с камеры возможна прямая классификация объектов. Для
Актуальные проблемы авиации и космонавтики - 2018. Том 2
этого необходимо создавать высокоточные программы для классификации изображений с камер, так как любая ошибка может привести к трагическим последствиям.
Работа осуществлялась в программе RapidMiner [1]. Были использованы 2 базы данных и 5 методов классификации для обучения системы распознавания изображений:
1. Нейронная сеть (Neural Network, NN) [2].
2. Метод опорных векторов (Support Vector Method, SVM) [3].
3. k-ближайших соседей (k-Nearest Neighbors, k-NN) [4].
4. Дерево решений (Decision Tree, DT) [5].
5. Случайный лес (Random Forest, RF) [6].
И 2 базы данных:
1. data banknote authentication [7].
2. Image Segmentation [8].
Также для улучшения эффективности были созданы ансамбли из 3 лучших, 3 худших, всех оптимизированных и всех неоптимизированных методов классификации.
Для каждого метода и ансамбля была применена кросс-валидация [10; 11]. Скользящий контроль или кросс-проверка или кросс-валидация) - процедура эмпирического оценивания обобщающей способности алгоритмов, обучаемых по прецедентам.
Фиксируется некоторое множество разбиений исходной выборки на две подвыборки: обучающую и контрольную. Для каждого разбиения выполняется настройка алгоритма по обучающей подвыборке, затем оценивается его средняя ошибка на объектах контрольной подвыборки. В таком случае исходные данные были разделены на 10 частей. Один из блоков используется для тестирования модели, а остальные 9 - для обучения, процесс повторяется 10 раз.
T-тест Стьюдента [11; 12] определяет, значимость различий эффективности методов. T-критерий Стьюдента - общее название для статистических тестов, в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух выборках. Нулевая гипотеза предполагает, что средние равны (отрицание этого предположения называют гипотезой сдвига).
Методы были оптимизированными генетическим алгоритмом со следующими ресурсами: 5 индивидов 50 поколений.
1. k-NN: k.
2. Decision Tree: minimal_size_for_split; maximal_depth.
3. SVM: C.
4. Neural Net: training_cycles; learning_rate.
5. Random Forest: number of trees.
Результаты представлены в таблице.
Результаты сравнения эффективности методов и ансамблей по Г-критерию Стьюдента (-Opt - оптимизированный метод, -Nopt - неоптимизированный метод)
Базы данных Data banknote authentication Image segmentation
Наиболее эффективные методы NN Opt 1.000 +/- 0.000 NN Nopt 1.000 +/- 0.000 RF Nopt 0.999 +/- 0.002 K-NN Opt 0.994 +/- 0.006 NN Opt 0.997 +/- 0.003 NN Nopt 0.996 +/- 0.004
Наименее эффективные методы DT Opt 0.598 +/- 0.127 DT Nopt 0.600 +/- 0.133 RF Opt 0.889 +/- 0.067 DT Opt 0.871 +/- 0.040 DT Nopt 0.870 +/- 0.038 SVM Nopt 0.916 +/- 0.050
Наиболее эффективный ансамбль 3Best 1.000 +/- 0.000 Best/Worst 0.996 +/- 0.004
Наименее эффективный ансамбль Optim 0.993 +/- 0.005 Noptim 0.994 +/- 0.004
По результатам Т-теста, оптимизированная и неоптимизированная нейронная сеть оказались наиболее эффективными при решении задач классификации подлинности банкнот. Для Image Segmentation наиболее эффективной также оказалась оптимизированная нейронная сеть.
Высокая эффективность при решении задач классификации изображений говорит о том, что на базе платформы RapidMiner высокоэффективные классификаторы изображений. Необходимо продолжать разрабатывать алгоритмы интеллектуального анализа данных для решения проблемы классификации изображений.
Библиографические ссылки
1. RapidMiner [Электронный ресурс]. URL: https://rapidminer.com (дата обращения: 14.03.2018).
2. Neural Net [Электронный ресурс]. URL: https://docs.rapidminer.com/studio/operators/ modeling/predictive/neural_nets/neural_net.html (дата обращения: 27.03.2018).
3. SVM [Электронный ресурс]. URL: https://docs.rapidminer.com/latest/studio/operators/ modeling/predictive/support_vector_machines/support_vector_machine.html (дата обращения: 27.03.2018).
4. k-NN [Электронный ресурс]. URL: https://docs.rapidminer.com/studio/operators/modeling/ predictive/lazy/k_nn.html (дата обращения: 27.03.2018).
5. Decision Tree [Электронный ресурс]. URL: https://docs.rapidminer.com/studio/operators/ modeling/predictive/trees/parallel_decision_tree.html (дата обращения: 27.03.2018).
6. Random Forest [Электронный ресурс]. URL: https://docs.rapidminer.com/latest/studio/ operators/modeling/predictive/trees/parallel_random_forest.html (дата обращения: 27.03.2018).
7. Data banknote authentication [Электронный ресурс]. https://archive.ics.uci.edu/ml/ datasets/banknote+authentication (дата обращения: 19.03.2018).
8. Image Segmentation [Электронный ресурс]. URL: https://archive.ics.uci.edu/ml/datasets/ Image+Segmentation (дата обращения: 21.03.2018).
9. X-Validation [Электронный ресурс]. URL: https://docs.rapidminer.com/studio/operators/ validation/x_validation.html (дата обращения: 02.04.2018).
10. X-Validation [Электронный ресурс]. URL: http://www.machinelearning.ru/wiki/ index.php?title=CV (дата обращения: 02.04.2018).
11. t-критерий Стьюдента [Электронный ресурс]. URL: http://www.machinelearning.ru/ wiki/index.php?title=%D0%9A%D1%80%D0%B8%D1%82%D0%B5%D1%80%D0%B8%D0%B9_ %D0%A1 %D 1%82%D1 %8C%D1%8E%D0%B4%D0%B5%D0%BD%D1%82%D0%B0 (дата обращения: 07.04.2018).
12. T-Test [Электронный ресурс]. URL: https://docs.rapidminer.com/studio/operators/ validation/performance/significance_tests/t_test.html (дата обращения: 07.04.2018).
© Челноков Н. А., Становов В. В., 2018