Научная статья на тему 'Анализ эффективности алгоритмов интеллектуального анализа данных для решения задачи распознавания изображений со спутников'

Анализ эффективности алгоритмов интеллектуального анализа данных для решения задачи распознавания изображений со спутников Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
67
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / DATA MINING / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / ARTIFICIAL NEURAL NETWORK / МАШИНА ОПОРНЫХ ВЕКТОРОВ / SUPPORT VECTOR MACHINE / К-БЛИЖАЙШИХ СОСЕДЕЙ / K-NEAREST NEIGHBORS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Потапов М.П.

Проводится анализ эффективности алгоритмов интеллектуального анализа данных (ИАД) для решения задач распознавания изображений со спутника.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF DATA MINING ALGORITHMS EFFICIENCY FOR SOLVING IMAGES RECOGNITION PROBLEM

We compare the efficiency of data mining algorithms for solving of images recognition problem.

Текст научной работы на тему «Анализ эффективности алгоритмов интеллектуального анализа данных для решения задачи распознавания изображений со спутников»

Секция ««Математические методы моделирования, управления и анализа данных»

УДК 001.57

АНАЛИЗ ЭФФЕКТИВНОСТИ АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ РЕШЕНИЯ ЗАДАЧИ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ

СО СПУТНИКОВ

М. П. Потапов

Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, пр. Свободный, 79 E-mail: mpotapov94@mail.ru

Проводится анализ эффективности алгоритмов интеллектуального анализа данных (ИАД) для решения задач распознавания изображений со спутника.

Ключевые слова: интеллектуальный анализ данных, искусственные нейронные сети, машина опорных векторов, к-ближайших соседей.

ANALYSIS OF DATA MINING ALGORITHMS EFFICIENCY FOR SOLVING IMAGES

RECOGNITION PROBLEM

M. P. Potapov

Siberian Federal University 79, Svoboniy Av., Krasnoyarsk, 660041, Russian Federation E-mail: mpotapov94@mail.ru

We compare the efficiency of data mining algorithms for solving of images recognition problem.

Keywords: data mining, artificial neural network, support vector machine, k-nearest neighbors.

В настоящее время проблема лесных пожаров стоит в ряду глобальных экологических проблем. Возникновение пожара в лесной местности чаще всего приводит к страшным последствиям. Возникнувший пожар очень тяжело ликвидировать, так как он с большой скоростью распространяется по местности. Поэтому важно обнаружить пожар на начальной стадии возникновения. Наиболее эффективным методом для обнаружения пылающей местности является анализ информации, полученной со спутника, что позволяет не только обнаружить пожары, но и проводить их первичную классификацию, а также прогнозировать дальнейшее распространение пожаров. Для анализа информации, получаемой со спутников, применяются множество алгоритмов интеллектуального анализа данных. Наиболее распространёнными из них являются:

1) метод k-ближайших соседей (k-NN) - объект будет отнесен к тому классу, который наиболее распространен среди соседей данного элемента [1];

2) метод опорных векторов (SVM), основная идея которого заключается в разделение n-мерного пространства точек n-1 плоскостью, равноудаленной от точек, принадлежащих разным классам [1];

3) искусственные нейронные сети (ANN) [2]. На вход искусственного нейрона поступает множество сигналов, которые являются выходами других нейронов, каждый из которых умножается на соответствующий весовой коэффициент, далее все произведения суммируются, что определяет значение, подаваемое на вход нейрона.

Сравним эффективность, упомянутых выше алгоритмов интеллектуального анализа данных, для решения задач распознавания изображений со спутников.

Для сравнения будем использовать данные о лесных пожарах на северо-востоке Португалии [3]. Данная задача является задачей регрессии и содержит 517 примеров. Исходная выборка была разбита на тестовую (30 %) и обучающую (70 %). В качестве меры эффективности алгоритмов будем использовать среднеквадратическую ошибку. Результаты работы всех алгоритмов были усреднены по 50 запускам, для их последующей статистической обработки.

Актуальные проблемы авиации и космонавтики - 2016. Том 1

В таблицах 1-3 приведены результаты работы алгоритмов с различными вариантами настроек в виде среднеквадратической ошибки на тестовой выборке, усредненной по всем запускам, и разброс результатов в квадратных скобках. По данным табл. 1 можно сделать вывод, что лучший результат показал алгоритм машин опорных векторов с типом ядра «апоуа». По данным табл. 2 можно сделать вывод, что нейронные сети показали лучший результат при использовании двух скрытых слоев и 2000 итераций обучения. По данным табл. 3 можно сделать вывод, что алгоритм к-№К показал лучший результат при использовании к = 5. В табл. 4 приведены лучшие результаты работы алгоритмов.

Таблица 1

Результаты алгоритма 8УМ

Тип ядра radial polynomial neural anova epachnenikov multiquadric

Ошибка 54.5087 [11.4006; 112.4726] 57.1785 [10.3487; 109.9978] 75.2743 [45.2615; 116.8180] 50.0969 [12.8968; 108.5955] 61.1687 [19.3369; 109.8738] 61.3193 [16.0865; 111.9949]

Таблица 2

Результаты для нейронных сетей

Количество Среднеквадратическая ошибка

скрытых слоев 500 итераций обучения 2000 итераций обучения

92.71884 64.9253

1 [29.1836; 144.3868] [20.7962; 110.1068]

56.2946 53.56207

2 [14.9154; 111.5886] [18.0947; 111.4553]

55.7222 68.67958

3 [19.0594; 112.9786] [28.0921; 110.8881]

Таблица 3

Результаты алгоритма к-КК

Количество соседей Среднеквадратическая ошибка

1 128.8367

[45.4074; 282.3587]

3 139.2544

[49.4120; 260.5549]

5 122.5406

[42.1003; 214.8462]

Таблица 4

Результаты лучших вариантов алгоритмов

Алгоритм Среднеквадратическая ошибка

k-NN 122.5406

[42.1003; 214.8462]

Neural Net 53.56207

[18.0947; 111.4553]

SVM 50.0969

[12.8968; 108.5955]

По результатам выполненного исследования можно сделать вывод, что для задач распознавания изображений со спутников наиболее высокую эффективность показал алгоритм машин опорных векторов. Однако его эффективность существенно зависит от выбора настроек, который является достаточно ресурсоемкой процедурой и требует автоматизации, например при помощи самоконфигурируемого генетического алгоритма [4] или кооперативного бионического алгоритма [5]. Кроме того искусственные нейронные сети несущественно уступили методу опорных векторов, хотя в данном исследовании рассматривались только простейшие персептроны обучаемые с помощью классического алгоритма обратного распространения ошибки. В этой связи необходимо рассмотреть нейронные сети произвольной архитектуры, которые могут быть получены при помощи эволюционных алгоритмов [4; 6].

Секция «Математические методы моделирования, управления и анализа данных»

Библиографические ссылки

1. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP. / А. А. Барсе-гян, М. С. Куприянов, В. В. Степаненко, И. И. Холод // Санкт-Петербург : БХВ, 2007. 336 с.

2. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. 1992. 184 с.

3. Lichman M. UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science. 2013.

4. Semenkin E., Semenkina M., Panfilov I. Neural network ensembles design with self-configuring genetic programming algorithm for solving computer security problems. In: Advances in Intelligent Systems and Computing. 2013. Vol. 189. Pp. 25-32.

5. Co-operation of biology related algorithms for support vector machine automated design. / Sh. Akhmedova, E. Semenkin, T. Gasanova, W. Minker // Proceedings of 1st International Conference on Engineering and Applied Sciences Optimization. 2014. Pp. 1831-1837.

6. Brester Ch. Yu., Semenkin E. S. Development of adaptive genetic algorithms for neural network models multicriteria design // Вестник СибГАУ. 2013. № 4(50). С. 99-103.

© Потапов М. П., 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.