Научная статья на тему 'ПОИСК ИЗОБРАЖЕНИЙ ПО СОДЕРЖАНИЮ'

ПОИСК ИЗОБРАЖЕНИЙ ПО СОДЕРЖАНИЮ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
24
10
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Акеньшин Д. А.

Цель статьи - проанализировать существующие варианты методов поиска изображений по содержанию, выявить объективные плюсы и минусы по сравнению друг с другом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПОИСК ИЗОБРАЖЕНИЙ ПО СОДЕРЖАНИЮ»

Таблица 2

Влияние праздников на развитие стран_

Страна По развитию По количеству праздников

США 1 13

Япония 2 11

Германия 3 8

Финляндия 4 3

Нидерланды 5 10

Великобритания 6 9

Сингапур 7 14

Канада 8 16

Дания 9 4

Австралия 10 7

В заключении можно сделать следующие выводы: количество выходных и праздничных дней не влияет на общее развитие страны; количество выходных и праздничных дней несет в себе определенные финансовые потери (но для некоторых стран они могут являться очень существенными).

Использованные источники:

1. FORBES. Праздник всегда с ними: какие страны больше всего отдыхают / [Электронный ресурс]: Режим доступа - URL: http://m.forbes.ru/article.php?id=236601 (дата обращения: 22.10.2014)

2. TOP-10. Самые инновационно развитые страны мира / [Электронный ресурс]: Режим доступа - URL: http://top10x.ru/top-10-samyie-innovatsionno-razvityie-stranyi-mira-2013-14/ (дата обращения: 16.11.2014)

3. Портал про гостиничный бизнес / [Электронный ресурс]: Режим доступа -URL: http://spb.prohotel.ru/news-208197/0/ (дата обращения: 16.11.2014)

Акеньшин Д.А. аспирант

Бийский технологический институт (филиал) ФГБОУВПО "Алтайский государственный технический университет им. И.И. Ползунова"

Россия, г. Бийск ПОИСК ИЗОБРАЖЕНИЙ ПО СОДЕРЖАНИЮ

Аннотация

Цель статьи — проанализировать существующие варианты методов поиска изображений по содержанию, выявить объективные плюсы и

минусы по сравнению друг с другом. В то время, как информационные технологии всё глубже проникают в обыденную жизнь, пользователи больше не могут быть удовлетворены поиском изображений только лишь по набору ранее привязанных к изображениям ключевых слов. Однако изображения могут быть найдены и по содержанию, под которым понимается цвета, их распределение, наличие

объектов и их расположение.

В данный момент поиск изображений по ключевым словам не всегда даёт именно тот результат, который ищет пользователь, так как эти ключевые слова вносятся в базу поисковой системы либо администраторами сайта и могут не соответствовать действительности, либо модераторами поисковой системы.

Имеющиеся базы изображений представляют собой миллионы проиндексированных файлов, имеющих ключевые слова и, для получения результатов поиска, необходимо иметь способ, который является более эффективным, чем простой визуальный поиск. Зачастую, для этого используются базы данных, построенные на основе текстовых атрибутов проиндексированных изображений. При обычном поиске этими атрибутами могут являться как дата создания изображения, так и присутствующие на нём люди либо текстовое описание изображения. Соответственно для поиска изображений можно представить в виде запроса на языке SQL:

SELECT * FROM IMAGEBD

WHERE CATEGORY="Бийский технологический институт"

Рис.1. Результаты поиска по запросу "Бийский технологический

институт"

По результатам запроса становится ясно, что все полученные результаты, хоть и имеют указанные ключевые слова, но фактически бесполезны для пользователя.

Приняв, что использование ключевых слов не обеспечивает достаточной эффективности, мы рассмотрим ряд других методов поиска изображений.

Одним из методов поиска изображений является пример результата, подразумевающий под собой, что система производит поиск на основе предоставленного пользователем входного изображения. Алгоритмы, составляющие систему, могут иметь различные способы описания и работы с входным изображением, но все результирующие экземпляры изображений должны иметь общие элементы с входом, указанным пользователем.

Пользователь имеет возможность предоставить системе на вход как простой грубый набросок, который представляет собой набор простых геометрических фигур или размеченные цветом области, того, что он желает

получить в результате, так и существующее изображение.

При данном способе построения запросов не возникает трудностей, связанных с представлением изображения набором слов.

Для определения сходства изображения указанного в поисковом запросе с изображением из базы данных графических файлов, применяется некоторая мера расстояния или характеристики, которые позволяют получить численную оценку сходства изображений. Характеристики сходства изображений можно разделить на три основные группы:

1. Цвет

2. Текстура

3. Форма

Характеристики цветового сходства позволяют сравнить цветовое содержание двух изображений или одного изображения с параметрами, которые задаются в поисковом запросе. Например, пользователь может указать процентное соотношение цветов в искомых изображениях.

Наиболее популярный способ поиска изображений основан на сопоставлении цветовых гистограмм. Идея метода заключается заключается в следующем: все имеющееся множество цветов разбивается на набор не пересекающихся, полностью покрывающих его подмножеств, которое называется базовой палитрой. Далее, для изображения формируется гистограмма, которая отражает, какую долю каждое подмножество занимает в общей цветовой гамме изображения. Для сравнения же самих гистограмм подмножеств вводится понятия расстояния между ними.

Существует ещё одна возможная мера расстояния, которая основана на цветовом макете. Смысл этой меры заключается в том, что при формировании поискового запроса пользователь обычно получает пустую сетку, разбитую на ячейки, в каждую из которых он может занести какой-либо цвет.

Характеристики сходства на основе цветового макета, в которых используется закрашенная сетка, требуют наличие как минимум двух закрашенных сеток. Эта мера обеспечивает сравнение каждой клетки сетки, которая указывается в поисковом запросе, с клеткой сетки искомого изображения из базы данных.

Метод описания текстуры работает со сравнением текстурных образцов, которые присутствуют на изображении, а так же учитывает их расположение относительно друг друга. Для определения текстуры используются графические единицы, которые в последствии объединяются в множетсва. Текстура как сущность сложно поддаётся формальному описанию из-за многообразия, поэтому, для простоты понимания,их представляют в виде двухмерного массива, в котором содержится изменение яркости, контрастности, направления градиента.

Метод описания формы представляет собой описание геометрической формы отдельных областей изображения. Для этого сначала выделяют

контур выбранной области изображения. Такое сегментирование изображения может происходить автоматически на основе ранее созданных графических примитивов, что упрощают реализацию алгоритма поиска. Недостаток этого метода заключается в том, что небольшие объекты в этом случае исключаются из рассмотрения.

По примерным подсчетам количество проиндексированных изображений в сети Интернет составляет порядка 1016 экзепляров, что, при наличии гибкого алгоритма поиска изображений позволит пользователям получать более точные результаты поиска. Один из главнейших направлениев развития поиска является поиск изображений по графическому содержанию, так как он является прикладным не только для сети Интернет, но и для картографических, медицинский, аналитических и военных целей.

Использованные источники:

1. Aly M., Munich M., Perona P. Distributed Kd-Trees for Retrieval from Very Large Image Collections// British Machine Vision Conference (BMVC), 2011

2. Bawa M., Condie T. Ganesan P.// LSH Forest : Self-Tuning Indexes for Similarity Search// ACM, Performance Evaluation, 2005, P.651-660

3. Shakhnarovich G., Indyk P. Nearest-Neighbor Methods in Learning and Vision: Theory and Practice. The MIT Press, Cambridge, Massachussets, London, England, 2005, pp. 247

4. Shapiro Linda Computer Vision. — Upper Saddle River, NJ: Prentice Hall, 2001. — ISBN 0-13-030796-3

5. Dzung L. Pham, Chenyang Xu, and Jerry L. Prince (2000): «Current Methods in Medical Image Segmentation», Annual Review of Biomedical Engineering, volume 2, pp 315—337

6. Ron Ohlander, Keith Price, and D. Raj Reddy (1978): «Picture Segmentation Using a Recursive Region Splitting Method», Computer Graphics and Image Processing, volume 8, pp 313—333

7. Witkin, A. P. «Scale-space filtering», Proc. 8th Int. Joint Conf. Art. Intell., Karlsruhe, Germany,1019—1022, 1983

i Надоели баннеры? Вы всегда можете отключить рекламу.