Научная статья на тему 'Категоризация изображений на основе самоорганизующейся нейронной сети'

Категоризация изображений на основе самоорганизующейся нейронной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
213
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЧЕСКАЯ КАТЕГОРИЗАЦИЯ / AUTOMATIC CATEGORIZATION / САМООРГАНИЗУЮЩАЯСЯ НЕЙРОННАЯ СЕТЬ / SELF-ORGANIZING INCREMENTAL NEURAL NETWORK

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Проскурин А.В.

Предложен метод автоматической категоризации изображений на основе самоорганизующейся нейронной сети ESOINN. Представлены экспериментальные результаты исследования метода и его основные преимущества.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATIC IMAGE CATEGORIZATION BASED ON SELF-ORGANIZING INCREMENTAL NEURAL NETWORK

The method of automatic image categorization based on self-organizing neural network ESOINN is presented. This method can be trained during the life cycle. The experiments show the precision of categorization up to 93-95%.

Текст научной работы на тему «Категоризация изображений на основе самоорганизующейся нейронной сети»

многочисленные методики компенсирования таких вариаций, задача по улучшению и упрощению методов локализации остается крайне актуальной. Решение этой задачи позволит использовать системы локализации лиц в реальном времени без существенных затрат вычислительных мощностей.

В данной работе рассматривается метод классификации текстур с помощью локальных бинарных шаблонов (ЛБШ), развитие и возможности данного оператора и способы его применения к задаче локализации лиц на изображении.

При достаточно небольшом объёме вычислений метод ЛБШ инвариантен к изменениям в условиях освещения и небольшим поворотам изображения [2; 4]. Благодаря чему данный метод является наиболее перспективной основой для разработки алгоритма локализации лиц на изображениях, полученных при неблагоприятных условиях съемки.

В ходе работы был предложен алгоритм на основе метода ЛБШ для построения дескриптора лица и поиска похожей последовательности на изображении для локализации. Так как лицо является сложной структурой, для более точной локализации необходимо разделять изображение на участки и применять метод ЛБШ к каждому из них.

Метод ЛБШ учитывает лишь наличие тех или иных локальных особенностей объекта, но не учитывает их взаимное расположение [3]. Был разработан и протестирован программный модуль, реализующий данный алгоритм.

Эксперименты с использованием выборки изображений различного размера и освещенности показали удовлетворительную скорость и точность локализации. Было замечено, что скорость локализации зависит только от размера входного изображения и не зависит от сложности фона и условий сьемки. Это позволяет применять метод для решения различных задач, где на каждое вычисление отводится ограниченное количество времени.

В дальнейшем планируется оптимизация алгоритма и усложнение программного модуля путем компо-

зиции различных методов для повышения быстродействия и надежности локализации.

Библиографические ссылки

1. Jafri R., Arabnia H. R. A Survey of Face Recognition Techniques // Journal of Information Processing Systems, 2009. P. 41-67.

2. Maenpaa T. The Local Binary Pattern Approach to Texture Analysis - Extensions and Applications // Oulu University Press, 2003. P. 35-52.

3. Maturana D., Mery D., Soto A. Face Recognition with Local Binary Patterns, Spatial Pyramid Histograms and Naive Bayes Nearest Neighbor classification // In Proc. of the XXVIII Intern. Conf. of the Chilean Computer Science Society. IEEE CS Society. 2009. P. 98-121.

4. Ojala T., Pietikainen M., Maenpaa T. Multiresolution Gray-scale and Rotation Invariant Texture Classification with Local Binary Patterns // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002. P. 971-987.

References

1. Jafri R., Arabnia H. R. A Survey of Face Recognition Techniques // Journal of Information Processing Systems, 2009. p. 41-67.

2. Maenpaa T. The Local Binary Pattern Approach to Texture Analysis - Extensions and Applications // Oulu University Press, 2003. p. 35-52.

3. Maturana D., Mery D., Soto A. Face Recognition with Local Binary Patterns, Spatial Pyramid Histograms and Naive Bayes Nearest Neighbor classification // In Proc. of the XXVIII International Conference of the Chilean Computer Science Society, IEEE CS Society, 2009. p. 98-121.

4. Ojala T., Pietikainen M., Maenpaa T. Multiresolution Gray-scale and Rotation Invariant Texture Classification with Local Binary Patterns // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002. p. 971-987.

© Подпорин Ф. М., 2014

УДК 004.932

КАТЕГОРИЗАЦИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ САМООРГАНИЗУЮЩЕЙСЯ НЕЙРОННОЙ СЕТИ

А. В. Проскурин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-таП: Proskurin.AV.WOF@gmail.com

Предложен метод автоматической категоризации изображений на основе самоорганизующейся нейронной сети ЕБОШЫ. Представлены экспериментальные результаты исследования метода и его основные преимущества.

Ключевые слова: автоматическая категоризация, самоорганизующаяся нейронная сеть.

Программные средства и информационные технологии

AUTOMATIC IMAGE CATEGORIZATION BASED ON SELF-ORGANIZING INCREMENTAL NEURAL NETWORK

A. V. Proskurin

Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation Е-mail: Proskurin.AV.WOF@gmail.com

The method of automatic image categorization based on self-organizing neural network ESOINN is presented. This method can be trained during the life cycle. The experiments show the precision of categorization up to 93-95 %.

Keywords: automatic categorization, self-organizing incremental neural network.

В последнее десятилетие во многих областях человеческой деятельности наблюдается резкий рост генерации изображений. В связи с этим возникла необходимость в их автоматической категоризации. Большинство алгоритмов, предложенных для решения данной проблемы, основано на представлении изображений в виде наборов визуальных слов [1]. Для их формирования традиционно используется алгоритм ^-средних, однако в работе [2] показано, что применение самоорганизующейся нейронной сети ESOINN эффективнее. При этом существует ряд особенностей, из-за которых не рационально использовать классические методы категоризации изображений (такие как BoVW (Bag-of-Visual-Words) и машина опорных векторов). Во-первых, в результате работы сети каждое сформированное визуальное слово представляется с помощью набора связанных узлов, таким образом описывая топологию кластера. Во-вторых, сеть ESOINN способна автоматически адаптироваться под новые данные и не требует переобучения. В связи с этим актуальна разработка метода категоризации изображений, учитывающего эти особенности.

Предложенный в этой работе метод категоризации изображений основан на алгоритме формирования визуальных слов, представленном в работе [2], в который были внесены модификации. Изменения связаны с добавлением к обучающим изображениям меток категорий и в большей степени затронули этап кластеризации. Разработанный метод включает два алгоритма: обучение нейронной сети и категоризацию изображений. Каждый алгоритм состоит из трех этапов. Рассмотрим их подробнее.

При обучении нейронной сети на первом этапе осуществляется разбиение обучающих изображений на регионы размером 16 х 16 пикселов. С каждым регионом ассоциируется метка категории, к которой относилось изображение. На следующем этапе полученные регионы описываются с помощью набора визуальных признаков, включающего цветовые, текстурные и фрактальные признаки. Более подробно ознакомиться с использованным вектором признаков можно в работе [2]. На последнем этапе извлеченные векторы признаков и ассоциированные с ними метки категорий подаются на вход модифицированной самоорганизующейся нейронной сети ESOINN (далее -cESOINN). Кратко рассмотрим эту модификацию.

cESOINN начинает работу с выбора случайным образом двух входных векторов в качестве начальных узлов сети. При этом по сравнению с оригинальным

алгоритмом в каждый узел добавлен набор счетчиков категорий count_ctg, отображающий количественное значение принадлежности узла той или иной категории. Когда на вход сети подан вектор и ассоциированная с ним метка категории ctg, сеть находит два ближайших узла (победитель и второй победитель).

Используя пороговые критерии подобия (максимальное расстояние между двумя связанными узлами), сеть определяет, относится ли входной вектор к тому же самому кластеру, что и победитель или второй победитель. Если расстояние между входным вектором и победителем или вторым победителем будет больше соответствующих им порогов подобия, входной вектор вставляется в сеть как первый узел нового класса. При этом счетчик категории count_ctgctg устанавливается равным 1. В случае если входной вектор определен как принадлежащий к кластеру победителя или второго победителя, создается новая связь между победителем и вторым победителем с «возрастом» равным 0, а «возраст» всех связей, соединенных с победителем, увеличивается на 1.

На следующем этапе обновляется плотность узла-победителя, определяемая с помощью среднего расстояния между победителем и связанными с ним узлами. После этого счетчик количества побед узла-победителя увеличивается на 1, а векторы весов победителя и его узлов-соседей смещаются в сторону входного вектора. В модифицированный алгоритм также было добавлено увеличение счетчика категории count_ctgctg победителя на 1, а узлов-соседей на 0,01. На следующем шаге удаляются все связи, «возраст» которых превышает заранее предустановленное значение agemax.

Если период обучения сети еще не закончен, то на вход сети подается новый входной вектор. В противном случае удаляются связи в перекрывающихся областях. На последнем этапе удаляются узлы, имеющие двух или меньше топологических соседей и низкую плотность. Подробное описание оригинального алгоритма ESOINN можно найти в работе [3].

При категоризации новых изображений они также разбиваются на регионы размером 16 х 16 пикселов, из которых затем извлекаются векторы низкоуровневых признаков. После этого определяется принадлежность каждого вектора тому или иному кластеру. Вектор подается на вход сети, после чего осуществляется поиск ближайшего узла win. Если расстояние до него больше порога подобия, то считается, что входной вектор является шумом, и он отбрасывается. В про-

тивном случае входному вектору присваивается набор счетчиков категорий, каждый элемент которого вычисляется по следующей формуле:

count_ctgctg = count_ctg™ + + Y, count_ctgctg • weight,

i^N ■

"win

где Nwin - узлы, связанные с узлом win; weight - весовой коэффициент, равный 0,1.

После ассоциирования с векторами изображения счетчиков категорий вычисляется их среднее значение. Изображению присваивается категория, имеющая наибольшее количественное значение.

Для проверки предложенного метода использовалась база изображений COREL 1000, состоящая из 10 тематических наборов по 100 изображений в каждом. При этом для обучения использовалось по 60 изображений каждой категории, а остальные 40 - для тестирования. Параметры сESOINN были установлены следующим образом: X = 200, agemax = 50, c = 0,1, c2 = 1,0. Вычисления повторялись 20 раз, после чего точность усреднялась. В таблице приведены числовые данные по точности категоризации для каждой категории изображений.

Средние значения точности категоризации изображений из базы COREL

Категории изображений Точность, % Категории изображений Точность, %

Африка 81,1 Слоны 90,4

Пляжи 85,5 Цветы 98,3

Здания 80,7 Лошади 95,8

Автобусы 94,9 Горы 77,3

Динозавры 98,8 Еда 93,1

Среднее значение 89,6

Как видно из приведенных данных, предложенный метод способен разделить изображения на категории с точностью от 77,3 до 98,8 %. При этом система, раз-

работанная на основе этого метода, способна обучаться в течение жизненного цикла, без необходимости повторных вычислений. В дальнейших работах планируется разработать быстрый алгоритм сегментации изображений на однородные прямоугольные регионы, используя локальный показатель однородности.

Библиографические ссылки

1. Bosch A., Zisserman A. Scene classification using a hybrid generative / discriminative approach // IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 30(4). 2008. P. 712-727.

2. Проскурин А. В. Формирование визуальных слов для автоматического аннотирования изображений на основе самоорганизующейся нейронной сети // Цифровая обработка сигналов и ее применение : 16-я междунар. конф. В 2 т. Т. 2. М., 2014. С. 487-491.

3. Shen F., Ogura T., Hasegawa O. An enhanced self-organizing incremental neural network for online unsupervised learning // Neural Networks. 2007. Vol. 20, No. 8. P. 893-903.

References

1. Bosch A., Zisserman A. Scene classification using a hybrid generative / discriminative approach. IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 30(4). 2008. P. 712-727.

2. Proskurin A. V., 16-ya mezhdunarodnaya konferentsiya "Tsifrovaya obrabotka signalov i ee primenenie" (16 International conference "Digital signal processing and applications"). Moscow, 2014. T. 2. P. 487-491.

3. Shen F., Ogura T., Hasegawa O. An enhanced self-organizing incremental neural network for online unsupervised learning. Neural Networks. Vol. 20, No. 8. 2007. P. 893-903.

© Проскурин А. В., 2014

УДК 519.68

ГИБРИДНЫЙ ЭВОЛЮЦИОННЫЙ АЛГОРИТМ ДЛЯ АВТОМАТИЧЕСКОГО ГЕНЕРИРОВАНИЯ НЕЙРОСЕТЕВЫХ КЛАССИФИКАТОРОВ

О. Е. Семенкина, О. Э. Семенкина

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: oleese@mail.ru, semenkina.olga@mail.ru

Разработан, реализован и исследован гибридный эволюционный алгоритм, использующий для настройки структуры нейронной сети самоконфигурируемый генетический алгоритм, а для настройки весовых коэффициентов - стайный алгоритм оптимизации. Показана эффективность применения метода самоконфигурации к стохастическим алгоритмам при решении задач классификации.

Ключевые слова: самоконфигурирование, генетический алгоритм, классификация, стайный алгоритм, нейронные сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.