Научная статья на тему 'Оценка эффективности алгоритмов поиска похожих изображений с индексацией на основе преобразований Хаара и значений цветовых гистограмм'

Оценка эффективности алгоритмов поиска похожих изображений с индексацией на основе преобразований Хаара и значений цветовых гистограмм Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
144
44
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Белоконь А.В., Проскурин А.В., Фаворская М.Н.

Рассматриваются алгоритмы поиска изображений на основе цветовых гистограмм и вейвлетов Хаара с применением принципа «Золотого сечения» из области фотографического искусства. В работе приведены результаты расчетов эффективности этих алгоритмов, полученные на основе их испытаний на тестовых последовательностях изображений, состоящих из изображений различных разрешений и классов контента.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценка эффективности алгоритмов поиска похожих изображений с индексацией на основе преобразований Хаара и значений цветовых гистограмм»

Секция «Информационные системы и технологии»

Регистр атор

мастер

печать

tmcLtidei, - Л квитанции

i прием заказа )

«¿nehfdev

Рис. 1. Диаграмма прецедентов

Рис. 2. Диаграмма классов

© Алехина М. С., 2013

УДК 004.652

А. В. Белоконь, А. В. Проскурин Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ОЦЕНКА ЭФФЕКТИВНОСТИ АЛГОРИТМОВ ПОИСКА ПОХОЖИХ ИЗОБРАЖЕНИЙ С ИНДЕКСАЦИЕЙ НА ОСНОВЕ ПРЕОБРАЗОВАНИЙ ХААРА И ЗНАЧЕНИЙ

ЦВЕТОВЫХ ГИСТОГРАММ

Рассматриваются алгоритмы поиска изображений на основе цветовых гистограмм и вейвлетов Хаара с применением принципа «Золотого сечения» из области фотографического искусства. В работе приведены результаты расчетов эффективности этих алгоритмов, полученные на основе их испытаний на тестовых последовательностях изображений, состоящих из изображений различных разрешений и классов контента.

В связи с глобальной информатизацией общества и развитием компьютерных сетей объемы мультимедийной информации в сети Internet стремительно рас-

тут. Растет и количество изображений. Однако этот стремительный рост вынуждает человечество использовать разнообразные поисковые алгоритмы [1; 2] для

Актуальные проблемы авиации и космонавтики. Информационные технологии

выборки класса изображений, необходимых для решения возникших задач. Современные поисковые системы предоставляют пользователям сервисы для поиска изображений. В основе работы данных сервисов заложены как алгоритмы поиска, так и алгоритмы индексации изображений. При этом, несмотря на уровень совершенства современных поисковых сервисов, результаты работы данных систем не всегда могут удовлетворить пользователя. Это в первую очередь связано несовершенством методов индексации изображений (основанной либо на текстовом описании, либо на содержании изображений) или неправильной интерпретацией поисковых образов (изображений или текста). Ситуацию осложняют действия недобросовестных SEO-специалистов, создающих заведомо ложные ключевые слова для изображений. Следующей проблемой современного общества является проблема авторского права. В контексте работы с изображениями особенно остро стоит проблема с авторскими правами в области профессиональной фотографии. Нелегальное использование работ фотографов распространено повсеместно, особенно в России. Для противодействия нарушению авторских прав и упрощения процедуры доказательства собственности возможно использование специализированных алгоритмов индексации и поиска фотоизображений.

Поиск изображений в современных системах осуществляется на основе «сигнатур» или индексов изображений, которые формируются путем вычисления низкоуровневых характеристик изображений, в качестве которых обычно выступают цветовые, текстурные, и геометрические признаки [3]. В рамках исследования был разработан программный продукт. В программном продукте сигнатуры изображений вычислялись для определенных областей изображений. Формирование областей осуществлялось на основе канонического принципа «золотого сечения» в фотографической композиции. Согласно этому принципу на изображении формируется 5 квадратных блоков с размерностью, кратной степени двойки таким образом, что центры четырех блоков расположены в точках «золотого сечения», а центр пятого блока находится в центре изображения. При формировании индекса на основе цветовых характеристик для каждой области осуществляется квантование цветового пространства по компоненте H цветовой модели HSV на 10 оттенков согласно идеологии представления цветов Манселла. В квантованном цветовом пространстве для каждого блока строится нормализованная гистограмма, являющаяся сигнатурой области. При формировании индекса, основанного на текстурных характеристиках, для каждого канала в пространстве RGB в каждой области вычисляется пирамида преобразований Хаара. Аппроксимирующие матрицы вершин пирамид преобразований Хаара принимаются в качестве сигнатур областей. Поиск изображений по образу заключается в вычислении метрики E76 для сигнатур изображения-образа поиска и сигнатур целевых изображений. Результатом поиска будут являться те изображения, чьи расстояния по метрике E76 между сигнатурами отличаются не более, чем на

100 % минус точность поиска в процентах от найденного образа с минимальным расстоянием.

Для оценки эффективности алгоритмов поиска использовались характеристики точности и релевантности [3]. Так точность поиска вычислялась согласно формуле (1):

Р =

A

A + B

(1)

где А - число релевантных изображений, полученных в процессе поиска; В - число нерелевантных изображений, полученных в процессе поиска.

Релевантность результатов поиска определялась согласно формуле (2):

A

A + C

(2)

где A - число релевантных изображений, полученных в процессе поиска; C - число потенциально релевантных изображений, не найденных в процессе поиска.

В качестве исходного материала для тестирования использовались изображения различных разрешений, относящихся к 5 разным группам по типу контента. Поиск производился на группе образов, состоящей из изображений как одного разрешения, так и нескольких разрешений одновременно.

В результате исследований был сделан вывод о том, что разработанные алгоритмы обладают достаточно высокой точностью, близкой к 100 % (почти всегда в результате поиска содержатся исходные изображения). Однако, алгоритмы имеют низкую степень релевантности - порядка 20 % при использовании сигнатур, построенных на основе текстурных характеристик и порядка 40 % при использовании сигнатур, построенных на основе цветовых гистограмм. Низкая степень релевантности алгоритмов поиска была обусловлена особенностью вычисления размерностей областей, которая кратна величине, равной степени двойки, в результате чего при незначительном увеличении разрешения изображений значительно увеличивались области для построения индексов, что вызывало значительные различия сигнатур этих областей. В целом же, при изменении разрешения изображений без изменения размера индексируемых областей, было выявлено, что разрешение поискового образа слабо влияет на результат поиска.

Библиографические ссылки

1. Singaravelan S., Murugan D. Survey on Content Based Image & Infor-mation Retrieval // International Journal Of Computational Engineering Research. Vol. 2. № 1. 2012. P. 168-171.

2. Datta R., Joshi D., li J. Image Retrieval: Ideas, Influences, and Trends of the New Age //ACM Computing Surveys. Vol. 40. No. 2. Article 5, 2008. 60 p.

3. Singha М., Hemachandran K. Content Based Image Retrieval using Color and Texture // Signal & Image Processing : An International Journal. Vol. 3. № 1. 2012. P. 39-57.

© Белоконь А. В., Проскурин А. В. 2013

i Надоели баннеры? Вы всегда можете отключить рекламу.