Научная статья на тему 'Методы сравнения и анализа изображений'

Методы сравнения и анализа изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1532
215
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Киреев А. М.

В современном мире ежедневно происходит значительный рост объемов информации. Оперирование данными без использования специальных средств становится очень затруднительно.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Киреев А. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотр
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы сравнения и анализа изображений»

МЕТОДЫ СРАВНЕНИЯ И АНАЛИЗА ИЗОБРАЖЕНИЙ

© Киреев А.М.*

Брянский государственный технический университет. г. Брянск

В современном мире ежедневно происходит значительный рост объемов информации. Оперирование данными без использования специальных средств становится очень затруднительно. Поэтому методы и алгоритмы индексирования, обработки и поиска начинают играть существенную роль для данной отрасли знаний. Особенно эта тенденция заметна в области обработки графической информации. На сегодняшний день остро встает вопрос развития средств поиска изображений по содержанию - методов и алгоритмов, которые производят обработку и поиск изображений только на основе внутренних характеристик изображений (таких как цвет, текстура, форма, контур).

Среди практических задач, в которых уже сегодня достаточно сложно обойтись без методов поиска изображений на основе автоматически выделенного набора характеристик, можно отнести такие задачи, как поиск в сети интернет, пользовательские и дизайнерские коллекции полиграфия, защита авторских прав.

Все эти применения характеризуются наличием больших объемов обрабатываемых коллекций изображений, которые нельзя просмотреть в ручном режиме. Для данных задач характерна большая ресурсоёмкость, в том числе и время обработки, поэтому разрабатываются новые алгоритмы, которые позволяют снизить нагрузку на компьютер и потратить как можно меньше времени на поставленную задачу [2].

Особенно эта тема актуальна в сети Internet, т.к. где требуется высокая скорость решения проблемы. Существующие онлайновые сервисы поиска похожих картинок умеют искать по готовому образцу и по запросу. TinEye Photodate Яндекс.Картинки и тд. Но все они не совершенны и не позволяют получать результат со 100 % точностью.

Существуют несколько важных причин, которые не позволяют алгоритмам работать со 100 % эффективностью, такие как:

1. Масштаб (Предметы, которые мы воспринимаем как одинаковые, на самом деле занимают разную площадь на разных изображениях);

2. Место (Интересующий нас объект может находиться в разных местах изображения);

3. Фон и помехи (Предмет, который мы воспринимаем как что-то отдельное, на изображении никак не выделен, и находится на фоне

* Кафедра ИИПО. Научный руководитель: Копелиович Д.И., доцент кафедры «Информатика и программное обеспечение», кандидат технических наук, доцент.

других предметов. Кроме того, изображение не идеально и может быть подвержено всякого рода искажениям и помехам);

4. Проекция, вращение и угол обзора (Один и тот же объект может давать совершенно разную картинку, в зависимости от поворота или расстояния до него).

Среди алгоритмов анализа изображений заметное место занимает «Метод попиксельного сравнения», который позволяет получать довольно неплохие результаты, при соотношении количества ложноположительных срабатываний к скорости работы алгоритма.

Алгоритм метода заключается в следующем [1]:

&

I

Рис. 1. Исходное изображение

1. Уменьшить размер. Самый быстрый способ избавиться от высоких частот - уменьшить изображение. В данном случае мы уменьшаем его до 8 х 8, так что общее число пикселей составляет 64. В изображениях высокие частоты обеспечивают детализацию, а низкие частоты показывают структуру. Большая, детализированная фотография содержит много высоких частот. В очень маленькой картинке нет деталей, так что она целиком состоит из низких частот.

Рис. 2. Уменьшенное изображение

2. Убрать цвет. Маленькое изображение переводится в градации серого, так что хэш уменьшается втрое: с 64 пикселей (64 значения красного, 64 зелёного и 64 синего) всего до 64 значений цвета.

3. Найти среднее. Вычислите среднее значение для всех 64 цветов.

4. Цепочка битов. Это самое забавное: для каждого цвета вы получаете 1 или 0 в зависимости от того, он больше или меньше среднего.

5. Постройте хэш. Переведите 64 отдельных бита в одно 64-битное значение. Порядок не имеет значения, если он сохраняется постоянным (я записываю биты слева направо, сверху вниз).

-

= 8f373714acfcf4d0

Рис. 3. Итоговый Xэш

Итоговый хэш не изменится, если картинку масштабировать, сжать или растянуть. Изменение яркости или контраста, или даже манипуляции с цветами тоже сильно не повлияет на результат. И самое главное: такой алгоритм очень быстрый!

Если вам нужно сравнить две картинки, то просто строите хэш для каждой из них и подсчитываете количество разных битов (это расстояние Хэм-минга). Нулевое расстояние означает, что это, скорее всего, одинаковые картинки (или вариации одного изображения). Дистанция 5 означает, что картинки в чём-то отличаются, но в целом всё равно довольно близки друг к другу. Если дистанция 10 или больше, то это, вероятно, совершенно разные изображения.

К недостаткам данного алгоритма, можно отнести его плохую чувствительность при сравнении слабо контрастных изображений, а также изображений без крупномасштабных особенностей (контурные рисунки, изображения текста).

Также недостатком данного подхода можно считать квадратическую зависимость времени исполнения алгоритма в зависимости от общего числа изображений.

Другим качественно новым подходом к анализу изображений является метод точек (метод SURF). Данный алгоритм позволяет обрабатывать значительно более сложные изображения, чем метод попиксельно сравнения, однако требует больших вычислительных мощностей и сложной программной реализации. Этот подход показывает хорошие результаты при значительных изменениях в исходном изображении, таких как изменение проекции, угла поворота, масштаба, уровня яркости, качества сжатия JPEG

Алгоритм заключается в следующем:

1. Поиск особых точек изображения

2. Создание их дескрипторов, инвариантных к масштабу и вращению. (Это значит, что описание ключевой точки будет одинаково, даже если образец изменит размер и будет повернут).

Метод ищет особые точки с помощью матрицы Гессе. Детерминант матрицы Гессе (т.н. гессиан) достигает экстремума в точках максимального изменения градиента яркости. Он хорошо детектирует пятна, углы и края линий. Для каждой ключевой точки считается направление максимального изменения яркости (градиент) и масштаб, взятый из масштабного коэффициента матрицы Гессе.

Рис. 4. Особые точки изображения

После нахождения ключевых точек, SURF формирует их дескрипторы. Дескриптор представляет собой набор из 64(либо 128) чисел для каждой ключевой точки. Эти числа отображают флуктуации(направление максимального изменения яркости) градиента вокруг ключевой точки.

К недостаткам метода можно отнести плохое качество работы с объектами простой формы и без ярко выраженной текстуры [4].

Распознавание дубликатов на основе методов анализа изображений является очень актуальной темой и используется во многих областях науки и промышленности. Данные подходы позволяют найти в сети Интернет сайты, в которых содержится информация, находящаяся под защитой авторского права, или данные, представляющие угрозу государственной безопасности. Одним из наиболее важных применений является обработка изображений в медицине. Эта область характеризуется получением информации из видеоданных для постановки медицинского диагноза пациентам. Другой прикладной областью компьютерного зрения является промышленность. Здесь информацию получают для целей поддержки производственного процесса. Примером может служить контроль качества, когда детали или конечный продукт автоматически проверяются на наличие дефектов. Военное применение является, пожалуй самой большой областью компьютерного зрения. Очевидными примерами являются обнаружение вражеских солдат и транспортных средств и управление ракетами. Одними из новых областей применения являются автономные транспортные средства, включая подводные, наземные (роботы, машины), воздушные [3].

Список литературы:

1. Байгарова Н.С., Бухштаб Ю.А., Евтеева Н.Н., Корягин Д.А. Некоторые подходы к организации содержательного поиска изображений и видео-

информации. - М.: Институт прикладной математики им. Келдыша РАН, 2002.- 24 с.

2. ht:tp://m.wikipedia.org/wiki/Компьютерное зрение.

3. ht:tp://ru.wikipedia.org/wiki/Пbиск изображений по содержанию.

4. Байгарова Н.С., Бухштаб Ю.А. Методы индексирования и поиска визуальных данных. Препринт Института прикладной математики им. М.В. Келдыша РАН. - 2000. - N 7.

i Надоели баннеры? Вы всегда можете отключить рекламу.