Научная статья на тему 'Применение вейвлет-преобразования для поиска изображений по образцу'

Применение вейвлет-преобразования для поиска изображений по образцу Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
378
97
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / ИНФОРМАЦИОННЫЕ СИСТЕМЫ / ПОИСК ИЗОБРАЖЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шаронов Анатолий Васильевич, Новоселов Сергей Викторович

В работе рассматривается применение дискретного вейвлет-преобразования в информационных системах для поиска изображений по предъявляемым пользователем образцам, которыми могут быть как аэрофотоснимки, так и другие фотоизображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE APPLICATION OF WAVELET TRANSFORM FOR IMAGE SEARCHING WITH SAMPLE

In this paper the application of discrete wavelet transform for image searching in the information systems with samples which would be aerophotos or another type of images.

Текст научной работы на тему «Применение вейвлет-преобразования для поиска изображений по образцу»

2009

НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Авиационные электросистемы и авионика

№ 148

УДК 519.92

ПРИМЕНЕНИЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ДЛЯ ПОИСКА ИЗОБРАЖЕНИЙ ПО ОБРАЗЦУ

А.В. ШАРОНОВ, С.В. НОВОСЕЛОВ

В работе рассматривается применение дискретного вейвлет-преобразования в информационных системах для поиска изображений по предъявляемым пользователем образцам, которыми могут быть как аэрофотоснимки, так и другие фотоизображения.

Ключевые слова: вейвлет-преобразование, информационные системы, поиск изображений.

1. Введение

Задача распознавания изображений является одной из наиболее актуальных задач при анализе результатов аэрофотосъемки и поиске требуемых аэрофотоснимков. К настоящему моменту времени разработано множество алгоритмов распознавания изображений и поиска изображения по образцу. Одним из наиболее популярных является использование нейронных сетей [1,2], которые работают с полными изображениями, при этом затраты на сравнение каждой части изображения связаны сразу с несколькими сравнительными операциями, что в результате выливается в огромные временные затраты и затраты оперативной памяти информационной системы. В этой связи интерес представляет задача разработки алгоритма, который не только хранил бы изображения в сжатом виде, экономя ресурсы информационной системы, но и позволял бы быстро осуществлять поиск требуемого изображения по предъявляемому образцу. В статье предлагается метод формирования алгоритма поиска изображения по образцу, основанный на дискретном двумерном вейвлет-преобразовании.

2. Постановка задачи

Разрабатывается алгоритм распознавания изображения, удовлетворяющий следующим требованиям: поиск по образцу осуществляется по сжатому; поиск изображений осуществляется, даже если предъявляемый образец сильно искажен.

В [3] показана возможность восстановления изображения с требуемой точностью, а также возможность извлечения фрагментов, сжатых с помощью алгоритма вейвлет-преобразования, без использования всей информации об изображении.

3. Формирование алгоритма поиска изображения

С точки зрения пользователя, задачи поиска изображений в базе данных по образцу возникают тогда, когда:

- пользователь располагает изображением плохого качества (например, отсканированное изображение с низким разрешением) и хочет найти это же изображение в базе, но с более высоким разрешением;

- пользователь располагает искаженным изображением, например изображением, показанным на рис. 1, и хочет найти такое же изображение без дефектов (рис. 1) [4];

- пользователь располагает нарисованным от руки эскизом, например таким, который показан на рис. 2, и хочет найти его оригинал [4].

1а 1б

Рис 1. Фотография (б), разыскиваемая в базе данных по образцу (а)

2а 2б

Рис. 2. Изображение (б), разыскиваемое в базе данных по образцу (а)

Очевидно, что для решения подобной задачи необходимо ввести некоторую меру различия (метрику), которая позволила бы осуществлять поиск изображения в базе данных по образцу. Пусть эта метрика выбрана так, что

Ь

I А

А )2

N2

(1)

где А и Иу - пиксели матрицы искомого изображения и предъявляемого образца соответственно; N - размерность квадратной матрицы изображения.

Основная идея метода заключается в том, чтобы сравнивать не сами изображения, а их образы, хранящиеся в базе данных и сжатые с помощью вейвлет-преобразования (DWT) [5]. В этом случае метрика (1) принимает вид

I (ъ3 - )2

г , 3

(N * )2

(2)

где н’у и Ъ - вейвлет-коэффициенты искомого изображения и предъявляемого образца соответственно; N - размерность той части матрицы изображения, по которой осуществляется сравнение, причем N < N.

Алгоритм производит сравнение уменьшенных копий изображений, хранящихся в левом верхнем углу их матриц [6]. Таким образом, вместо того, чтобы сравнивать матрицы изображений размером (200х200), он производит сравнение матриц размером только (50х50).

Двукратное вейвлет-преобразование М размерности (200х200), соответствующей размерности исходного изображения рис. 1(а), переводит матрицу Н изображения в Н1, а последнюю -в матрицу Н2:

Н = (М • Нт )т ; Н 2 = М • Н1,

где

М

V С у

.5 0. 0.5 0 0. .0 0

0 0 0.5 0.5 . .0 0

0 0 0 0. . 0.5 0.5

0.5 -0.5 0 0. .0 0

0 0 0.5 .5 0. - .0 0

0 0 0 0. . 0.5 -0.

матрица размерности (200х200),

(0.5 0.5 0 0

0 0 0.5 0.5

Ж-

0 0 ^ 00

0000

.. 0.5 0.5

у

матрица размерности (100х200),

(0.5 -0.5 0 0

0 0 0.5 -0.5

О =

0 0 ^ 00

0000

0.5 -0.5

у

- матрица размерности (100х200).

На рис. 3 показаны изображения, сжатые с помощью вейвлет-преобразования, исходный вид которых был представлен на рис. 1.

3а 3б

Рис. 3. Исходная искаженная (а) и искомая (б) фотографии, сжатые вейвлет-преобразованием

Предлагаемый алгоритм работает следующим образом:

1. Предъявляемый пользователем образец подвергается вейвлет-преобразованию.

2. Производится сравнение попарно преобразованного образца с изображениями, также сжатыми вейвлет-преобразованием и хранящимися в таком виде в базе данных. При этом мера различия Ь* вычисляется только для пикселей верхней левой части матриц изображения.

3. Изображения, мера различия у которых с образцом оказалась наименьшей, выбирается из базы данных.

V

4. Выбранные изображения восстанавливаются обратным вейвлет-преобразованием, задаваемым матрицей М-1 размерности (100х100). Обратное вейвлет-преобразование переводит матрицу Н4 сжатого изображения в матрицу Н3, а последнюю - в матрицу Н2 по прави-

лу Й3 = М-1#*, Н2 = (М~1Й*т) , где

(0.5 0.5 0 0

0 0 0.5 0.5

М =

( Ж Л

0

0

0 Л 0

00 0.5 -0.5 00

0

0

0

0

0.5

0

0

0

0.5

0.5 0.5

00

0

0

0.5 -0.5

- матрица размерности (100х100),

у

Ж

(0.5 0.5 0 0

0 0 0.5 0.5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 0 Л

00

матрица размерности (50х100),

О =

V0 0 0 0 ... 0. .5 0.

(0.5 -0.5 0 0 ... 0 0 Л

0 0 0.5 -0.5 ... 0 0

V 0 0 0 0 ... 0.5 -0.5,

матрица размерности (50х100).

5. Найденные и восстановленные обратным вейвлет-преобразованием изображения предъявляются пользователю для принятия окончательного решения.

Иллюстрация последовательности действий при решении задачи поиска изображений в базе данных информационной системы приведена на рис. 4.

0

Рис. 4. Иллюстрация последовательности действий при поиске изображения по образцу

4. Пример работы алгоритма

Для подтверждения работоспособности сформированного алгоритма решается задача поиска исходного изображения по эскизу в базе данных, в которой хранится несколько эталонов (рис. 5) [7].

5.1а 5.1 б

5.2а 5.2б

5.3а 5.3б

5.4а 5.4б

Рис. 5. Эталоны изображений хранящиеся в базе данных (а - исходные, б - сжатые)

Для поиска изображения пользователь предъявляет нарисованный от руки эскиз, который представлен на рис. 6.

і

Рис. 6. Эскиз, предъявляемый пользователем для поиска изображения Тогда алгоритм будет работать следующим образом:

1. Осуществляется сжатие эскиза вейвлет-преобразованием, результат которого показан на рис.7.

Рис. 7. Сжатый эскиз

2. Вычисляются меры различия в соответствии с введенной метрикой (2) между эскизом и эталонами из базы данных.

Результаты этих вычислений сведены в табл. 1.

Таблица 1

Вычисленные меры различия эталонов и эскиза

Номер эталона Рисунок эталона Мера различия

1 К. 109.065

2 139.140

3 ф 63.340

4 ' ' ' 51.147

3. Анализ результатов, приведенных в табл. 1, показывает, что, поскольку эскиз являлся нечетким запросом для поиска искомого изображения, предъявляемому эскизу больше всего соответствуют эталоны 3 и 4. При этом пользователь, ознакомившись с предлагаемыми системой вариантами, может зрительно вспомнить детали изображения и выбрать окончательный вариант.

5. Временные затраты на реализацию сформированного алгоритма

Пусть в базе данных информационной системы хранится q изображений размерностью (пхп), тогда временные затраты Т^0,1, q, п) на поиск изображений вычисляются следующим образом:

Т(^, I, q, п) = ^ ■ I ■ q ■ п2, (3)

1

где ^ = — - время одной элементарной операции, с;

И

к - частота микропроцессора, Гц;

I = а ■ 1а + т ■ 1т (4) - число всех элементарных операций, затрачиваемых на сравнение каждого пикселя 2-х изображений;

а - число сложений;

т - число умножений;

1а и 1т - число элементарных операций, затрачиваемых на сложение и умножение соответственно.

Сравним теперь временные затраты на решение задачи поиска изображений по сжатым вейвлет-преобразованием образцам в зависимости от количества изображений, хранящихся в базе данных. Для упрощения вычислений предположим, что все изображения имеют размерность (п х п), где п = 128, а используемый микропроцессор имеет частоту 1 ГГц, тогда время одной операции будет 1 нс. При этом для алгоритма, сравнивающего сжатые изображения, п=32 (т.к. размерность уменьшенной копии после двукратного вейвлет-преобразования в 4 раза меньше размерности исходного изображения).

Если считать, что сложение в среднем состоит из 5 элементарных операций, а умножение -

из 25 [8], а исходя из формул (1) и (2) при сравнении двух пикселей должно выполняться две

операции сложения и одна операция умножения, то

I = 2 ■ 5 +1-25 = 35. (4)

Подставляя значения в формулу (3) получим следующие зависимости для расчета временных затрат:

- для алгоритма со сравнением полных изображений

Т(4) = 0.573q (мс); (5)

- для алгоритма со сравнением изображений, сжатых вейвлет-преобразованием

Т2^) = 0.036q (мс). (6)

График временных затрат представлен на рис. 8

10

Т1(ч), с

тзд, С

5

0

0 5000 1'104 1.5-10+ 2-10*

0 ч 20000

Рис. 8. Изменение общего количества затраченного времени Т от числа изображений д в базе для алгоритмов сравнения полных изображений (пунктир) и изображений, сжатых вейвлет-преобразованием (сплошная линия)

Зависимость временных затрат от размеров изображений п при фиксированном числе хранящих изображений в базе данных q = 20000 будет вычисляться:

- для алгоритма со сравнением изображений полностью

Т1(п) = 0.0007л2 (с);

- для алгоритма со сравнением изображений, сжатых вейвлет-преобразованием

Тг(п) = 0.0007■ М (с).

График затрат представлен на рис. 9.

Рис. 9. Зависимость общего количества затраченного времени Т от размерности изображений п для алгоритмов сравнения полных изображений (пунктир) и изображений, сжатых вейвлет-преобразованием (сплошная линия)

6. Выводы

Анализ результатов решения модельной задачи поиска изображения по предъявляемому эскизу, выполненному от руки, подтверждает работоспособность сформированного алгоритма. Рассмотренная модельная задача иллюстрирует наихудший вариант образца, поскольку любой другой образец будет иметь большее сходство с искомым оригиналом. При этом значительно сокращаются временные затраты. Для баз данных с малым количеством изображений это различие практически неощутимо. Если в базе данных хранится порядка 20000 изображений размерностью (128х128), то алгоритм поиска, сравнивающий полные изображения будет работать

11 секунд, в то время как алгоритм, сравнивающий сжатые с помощью вейвлет-преобразования изображения - только 0.82 секунды. При многократном возрастании размерности изображений разница во временных затратах на решение поставленной задачи еще больше увеличится. Например, при сравнении изображений размерностью (1024х1024) она составит соответственно 734 и 45.8 секунд.

Работа выполнена при поддержке РФФИ по проектам № 07-08-00261 и 09-08-0699.

ЛИТЕРАТУРА

1. Визильтер Ю. В., Желтов С. Ю., Князь В. А., Ходарев А. Н. Обработка и анализ цифровых изображений с примерами на LabVIEW и IMAQ Vision. - ДМК-Пресс, 2008.

2. Красильников Н. Н. Цифровая обработка изображений. - М.: ВШ, 2001.

3. Шаронов А.В., Новоселов С.В. Построение алгоритма формирования модели рельефа подстилающей поверхности геоинформационной измерительной системой // Вестник МАИ. - 2009. - Т.16, №1. - С. 95-100.

4. Ссылка: http://image062.mvlivepage.ru/

5. Charles A. Poynton (2003). Digital Video and HDTV: Algorithms and Interfaces //Morgan Kaufmann.

6. Шокуров А. В., Михалёв А. В. Оптимальное использование вейвлет-компонент // Успехи мат. наук.— 2007. - Т. 62, № 4. - С. 171.

7. Ссылка: http://www.vfleur.ru

8. Гашков С.Б. Системы счисления и их применение. - МЦНМО, 2004.

THE APPLICATION OF WAVELET TRANSFORM FOR IMAGE SEARCHING WITH SAMPLE

Sharonov A.V., Novosyolov S.V.

In this paper the application of discrete wavelet transform for image searching in the information systems with samples which would be aerophotos or another type of images.

Сведения об авторах

Шаронов Анатолий Васильевич, 1937 г.р., окончил МАИ им. С. Орджоникидзе (1959), доктор технических наук, профессор, заведующий кафедрой «Информационные технологии» МАИ, автор более 150 научных работ, область научных интересов - формирование алгоритмов математической обработки информации.

Новоселов Сергей Викторович, 1984 г.р., окончил МАИ (ГТУ) (2007), аспирант кафедры «Информационные технологии» МАИ (ГТУ), автор 3 научных работ, область научных интересов - формирование алгоритмов обработки изображений и цифровых моделей рельефа.

i Надоели баннеры? Вы всегда можете отключить рекламу.