Научная статья на тему 'Применение карт Кохонена для восстановления слабо структурированных изображений'

Применение карт Кохонена для восстановления слабо структурированных изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
176
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕКОНСТРУКЦИЯ ИЗОБРАЖЕНИЙ / КАРТЫ КОХОНЕНА / KOHONEN MAPS / IMAGE RESTORATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Болгов А.Н.

Рассматривается одно из решений задачи восстановления фоновых пикселей изображения, базирующееся на алгоритме на основе карт Кохонена. Приводится адаптация алгоритма восстановления на основе карты Кохонена и восстановления пикселей фонового пространства изображения на основе обученной карты. Разработана архитектура мультиагентной системы и приведены результаты экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USAGE OF KOHONEN MAPS FOR RESTORATION OF WEAK STRUCTURED IMAGE

One of solutions of the restoration of background pixels of image based on Kohonen map algorithm is considered. Adaptation of algorithm for training Kohonen map and restoration of the background pixel space by using trained map is given. Architecture of MAS-IR is designed and experimental results are shown.

Текст научной работы на тему «Применение карт Кохонена для восстановления слабо структурированных изображений»

Одним из глобальных признаков является уклон подписи, который является отношением между длиной подписи и ее шириной с учетом фактора давления. Данный признак используется в качестве имитации нажатия пера при обработке статической подписи [2]. Для построения вектора признаков также используются и другие характеристики:

1. Наклонная подписи отображает три основных уклона подписи: правый (КО), вертикальный (УК) и левый (ЬЕ), = {КО, УК, ЬЕ}.

2. Отношение между длиной подписи и ее шириной GF2 включает в себя пять отношений: значительно меньше (БМ), меньше (БТ), равно (ЕТ), больше (ЬТ) и значительно больше (ЬМ), GF2 = {БМ, БТ, ЕТ, ЬТ, ЬМ}.

3. Соотношение ширины подписи к средней ширинеGFзOтображает три типа: малое (ЬШ), нормальное (ИШ), высокое (ЯШ), GF3 = {ЬШ, ИШ, ЯШ}.

4. Соотношение длины подписи к средней длинеGF4Oтображает три типа: малое (ЬЬ), нормальное (ИЬ), высокое (ЯЬ), GF4 = {ЬЬ, ИЬ, ЯЬ }.

5. Окружность с максимальным радиусом, описывающая изображение подписи, GF5 включает в себя два параметра: центр координат (хс, ус) в эвклидовом пространстве с максимальным радиусом (Ктах),

GF5 = {(Хс, Ус), Ктах}.

6. Глубина нажатия пера GF6 вычисляется как отношение между фрактальной размерностью и скелетом подписи (ЕБ), каждая характеристика описывается квадратом площадью 16x16 пикселей. Нормализованное изображение подписи представляется в виде квадратной сетки данной размерности и описывает множество GF6, включающее в себя соотношениеЕБ для каждой ячейки сетки, GF6 = {ЕБ1, ЕБ2, ..., ЕБп}. Скелетное представление подписи, изображенное на рисунке, является эффективным методом для того, чтобы найти структурное соотношение между основными компонентами объекта (в данном случае подпись).

В задаче распознавания подписи строится дерево решений, включающее в себя векторы GF1 ... GF6, и на различных иерархических уровнях выгружаются образцы эталона подписи, которые в дальнейшем помещаются в базу данных.

При задаче идентификации человека по его подписи дерево решений помогает найти процентное соотношение изображения подписи и его эталона.

Скелет изображения подписи

Библиографические ссылки

1. Баранов Р. П. Идентификация личной подписи человека // Решетневские чтения : материалы XV Междунар. науч. конф. В 2 ч. Ч. 2. Красноярск, 2011. С.603-604

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений : пер. с англ. М. : Техносфера, 2005. 1072 с.

References

1. Baranov R. P. Identifikatsiya lichnoy podpisi cheloveka // V materialah XV mezhdunarodnoy nauchnoy konferentsii "Reshetnevskie chteniya". V 2 ch., Ch. 2. Krasnoyarsk, 2011. S. 603-604

2. Gonsales R., Vuds R. Tsifrovaya obrabotka izobrazheniy : per. s angl. M. : Tehnosfera, 2005. 1072 s.

© Баранов Р. П., 2014

УДК 004.932.2

ПРИМЕНЕНИЕ КАРТ КОХОНЕНА ДЛЯ ВОССТАНОВЛЕНИЯ СЛАБОСТРУКТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ

А. Н. Болгов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: anbolgov@gmail.com

Рассматривается одно из решений задачи восстановления фоновых пикселей изображения, базирующееся на алгоритме на основе карт Кохонена. Приводится адаптация алгоритма восстановления на основе карты Кохонена и восстановления пикселей фонового пространства изображения на основе обученной карты. Разработана архитектура мультиагентной системы и приведены результаты экспериментов.

Ключевые слова: реконструкция изображений, карты Кохонена.

Решетневскуе чтения. 2014

USAGE OF KOHONEN MAPS FOR RESTORATION OF WEAK STRUCTURED IMAGE

A. N. Bolgov

Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation E-mail: anbolgov@gmail.com

One of solutions of the restoration of background pixels of image based on Kohonen map algorithm is considered. Adaptation of algorithm for training Kohonen map and restoration of the background pixel space by using trained map is given. Architecture of MAS-IR is designed and experimental results are shown.

Keywords: image restoration, Kohonen maps.

Системы обработки видео - популярные программные средства, функциональность которых растет при их использовании в автоматическом режиме. Такие системы основаны на алгоритмах обработки изображений и видео, кластеризации, нейронных сетей. Объектом данного исследования является цифровая реконструкция малых областей с «пропущенной» текстурой. «Пропуски» в текстурах могут являться результатом удаления нежелательного объекта с изображения конечным пользователем. Данная область не может превышать 5-10 % от площади области кадра. Автоматическая процедура восстановления таких областей - главная цель программных инструментов видеоредактора [1].

Процесс реконструкции на основе самоорганизующихся карт Кохонена состоит из двух этапов: обучение карты и восстановление данных на основе карты [2]. Детализация этих шагов выглядит следующим образом:

- первоначальное построение карты Кохонена, «пропуски» не учитываются при обучении;

- входной вектор данных с «пропущенным» элементом подается на вход обученной карте и поиск соответствующего узла в карте.

Эффективность реконструкции «пропусков» на стыке нескольких текстур увеличивается при восстановлении каждой смежной текстуры по отдельно обученной карте. Для этого требуется еще один дополнительный шаг сегментации исходного изображения [3].

Архитектура мультиагентной системы состоит из 4 типов агентов и представлена на рис. 1.

Агент-оператор (Agent-Operator) - единственный агент-человек в системе. Интерфейсный агент (Interface Agent) - программный агент, обеспечивающий взаимодействие всех других агентов системы. Группа обучающих агентов (Learning Agent) - агенты, которые выполняют процесс обучения карт Кохонена. Группа агентов восстановления (Inpainting Agent) -агенты, производящие реконструкцию текстур по обученным картам.

Рис. 1. Архитектура мультиагентной системы восстановления изображения

Результаты реконструкции изображения представлены на рис. 2. Приводятся результаты восстановления без учета сегментации и с применением таковой.

а б в г

Рис. 2. Исходное изображение (а); сегментированное изображение (б); восстановленное изображение (в); восстановленное изображение с предварительной сегментацией (г)

Таблица 1

Точность восстановления

Точность восста- Число Тестовая выборка

новления агентов 1 2 3 4 5 6 7 8 9 10

MSE, % 1 агент 4 агента 3,04 4,14 4,24 5145 6,25 2,55 7,35 3,26 18,38 16,17 20,73 17,95 33,06 27,78 36,24 29,18 60,83 45,61 64,13 46,82

PSNR, дБ 1 агент 4 агента 41,29 39,29 41,95 39,68 38,16 40,06 37,84 39,93 35,48 37,48 34,13 36,32 33,92 35,69 33,72 34,95 32,06 33,49 31.93 32.94

SSIM, % 1 агент 4 агента 96,42 95,72 95,46 94,79 98,09 97,84 97,64 97,89 74,84 69,93 73,42 70,57 75,61 80,07 74,38 79,54 73,44 75,73 72,45 74,85

Таблица 2

Быстродействие этапов реконструкции

Быстродействие, мс Число агентов Тестовая выборка

1 2 3 4 5 6 7 8 9 10

Этап обучения 1 агент 5,244 5,792 6,613 6.024 5,270 5,421 6,022 5,388 6,278 5,995

2 агента 4,004 4,102 4,931 5,102 4,259 4,195 4,126 4,271 5,180 4,619

4 агента 2,360 2,178 3,042 2,325 2,678 2,392 2,778 2,347 3,017 2,735

8 агентов 3,401 3,533 4,415 4,589 3,582 3,682 3,349 3,411 4,790 3,925

Этап восстанов- 1 агент 3,710 3,792 3,944 4,024 4,683 4,421 4,128 4,388 3,725 3,995

ления 2 агента 3,004 3,102 2.931 3,102 3,269 3,195 3,126 3,271 2,584 2,615

4 агента 2,092 2,178 2.163 2,325 2,292 2,392 2,090 2.147 1,687 1,735

8 аген- 2,401 2,533 2,415 2,589 2,582 2,682 2,349 2,411 1,801 1,925

тов

Результаты в части точности восстановления представлена в табл. 1.

Полученные результаты позволяют судить о том, что мультиагентная конфигурация обеспечивает высокие показатели точности, особенно для изображений со сложным структурным составом.

Результаты быстродействия системы представлены в табл. 2.

Мультиагентный подход позволяет добиться высокой вычислительной эффективности процесса восстановления изображения. Оптимальное число агентов - 4, так как дальнейшее увеличение числа агентов налагает дополнительные накладные расходы на коммуникацию агентов [4].

Процесс восстановления реконструкции основан на пространственной информации, и самоорганизующиеся карты Кохонена наилучшим образом подходят для решения этой задачи как инструмент кластеризации без учителя. Данное исследование помогло выявить слабые стороны алгоритма карт Кохонена, и были предложены решения по их устранению. Предварительная сегментация изображения позволяет добиться высоких результатов в реконструкции гомогенных текстур. Мультиагентный подход позволяет также увеличить точность получаемых результатов реконструкции по метрикам MSE, PSNR, SSIM. Кроме этого, основным преимуществом большого числа локальных обработчиков-агентов является увеличенная

вычислительная емкость системы, что позволяет увеличить производительность процесса реконструкции. Однако процесс увеличения агентов ограничен коммуникационными затратами для взаимодействия агентов.

Библиографические ссылки

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений / пер. с англ. под ред. П. А. Чочиа. М. : Техносфера, 2006. 1072 с.

2. Форсайт Д. А., Понс Дж. Компьютерное зрение. Современный подход. М. : Вильямс, 2004. 928 с.

3. Яне Б. Цифровая обработка изображений : пер. с англ. М. : Техносфера, 2007. 584 с.

4. Kohonen T. Self-Organizing Maps. New York : Springer Series in Information Sciences, 2001. 501 p.

References

1. Gonsalez R. Digital image processing. Moscow, Technosphera, 2006, 1072 p.

2. Forsait D. Computer Vision. Modern approach. Moscow, Williams, 2004, 928 p.

3. Yane B. Digital image processing. Moscow, Technosphera, 2007, 584 p.

4. Kohonen T. Self-Organizing Maps. New York, Springer Series in Information Sciences, 2001, 501 p.

© Болгов А. Н., 2014

i Надоели баннеры? Вы всегда можете отключить рекламу.