Научная статья на тему 'СРАВНИТЕЛЬНЫЙ АНАЛИЗ СОВРЕМЕННЫХ СИСТЕМ ПОИСКА ГРАФИЧЕСКОЙ ИНФОРМАЦИИ'

СРАВНИТЕЛЬНЫЙ АНАЛИЗ СОВРЕМЕННЫХ СИСТЕМ ПОИСКА ГРАФИЧЕСКОЙ ИНФОРМАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
73
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСКОВАЯ СИСТЕМА / ПОИСК ИЗОБРАЖЕНИЙ / ПОИСК ГРАФИЧЕСКОЙ ИНФОРМАЦИИ / КОНТЕНТНЫЙ ПОИСК

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дегтярев Ю.С., Шпирюк К.С.

В статье рассмотрено понятие поисковой системы и ее основные задачи. Выделены методы поиска, на которых основываются системы поиска графической информации. Построена развернутая модель гомеостата, позволяющая рассматривать различные способы поиска изображений. Также построена универсальная схема взаимодействия, показывающая процесс оценки эффективности сравниваемых поисковых систем. Результатом статьи является сравнительный анализ систем поиска графической информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE ANALYSIS OF THE MODERN RESEARCH SYSTEMS OF IMAGE INFORMATION

The article considers the concept of a research system and its main objectives. It highlights the research methods which the research systems of image information are based on. It contains a detailed model of homeostat which allows considering different ways of image research. It also has a universal scheme of interaction which shows the assessment process of the compared research systems effectiveness. The result of the article is the comparative analysis of the modern research systems of image information.

Текст научной работы на тему «СРАВНИТЕЛЬНЫЙ АНАЛИЗ СОВРЕМЕННЫХ СИСТЕМ ПОИСКА ГРАФИЧЕСКОЙ ИНФОРМАЦИИ»

Degtyarev Y.S. student master

2 course, The faculty of elite education and magistracy

Omsk State Technical University

Russia, Omsk Shpiruk K.S. student master

2 course, The faculty of elite education and magistracy

Omsk State Technical University

Russia, Omsk

COMPARATIVE ANALYSIS OF THE MODERN RESEARCH SYSTEMS OF IMAGE INFORMATION

Abstract:

The article considers the concept of a research system and its main objectives. It highlights the research methods which the research systems of image information are based on. It contains a detailed model of homeostat which allows considering different ways of image research. It also has a universal scheme of interaction which shows the assessment process of the compared research systems effectiveness. The result of the article is the comparative analysis of the modern research systems of image information.

Keywords: search system, image search, graphic information search, context search, content search.

Визуальная информация сегодня занимает не меньшую долю в общем количестве доступной информации, чем текстовая. Появились огромные, постоянно растущие базы данных изображений, как у отдельного пользователя, так и у различных организаций. Непрерывно расширяющимся электронным архивом является и глобальная сеть Интернет. В этих условиях весьма актуальными становятся вопросы навигации среди этой массы информации, а также быстрого и точного поиска нужных пользователю изображений. Основной целью статьи является анализ существующих систем поиска изображений.

Под поисковой системой понимается программное обеспечение, состоящее из базы данных документов, снабженной пользовательским интерфейсом, позволяющим пользователю получить упорядоченное подмножество этих документов как ответ на его поисковый запрос. Основная задача поисковой системы заключается в выборе наилучшего возможного подмножества в ответ на конкретный запрос, т.е. множества документов, которые наиболее соответствуют тому, что ищет пользователь (обычно в порядке убывания релевантности) [1].

Системы, реализующие возможность поиска графической информации, в настоящий момент используют методы поиска, которые могут быть разделены на два направления:

1. контентный поиск (поиск по содержанию) - поиск изображений на основе визуальных особенностей, таких как цвет и текстура [2];

2. контекстный поиск (поиск по текстовым аннотациям) - поиск изображений на основе обработки и анализа текстовой информации, формировании описаний и присвоении этого описания соответствующим изображениям [3].

При помощи развернутой модели гомеостата (способ построения которой описан в [4]) можно сформировать модель процесса поиска изображений (рис. 1). Из данной модели видно, что: высший орган управления (ВОУ) - пользователь поисковой системы; местный регулятор (МР) - поисковая система; регулятор и исполнитель (РИ) 1 - блок контекстного поиска; РИ 2 - блок контентного поиска; объект, над которым ведется работа (О) - работа с поисковой системой; блок дополнительной активации и адаптации (БДАА) - справочная информация по работе с системой.

Рис. 5. Развернутая модель гомеостата Для блока контекстного поиска регулятором и исполнителем являются текстовый запрос и результат, для блока контентного поиска - признаки изображения и результат. Выражение работы с поисковой системой в модели гомеостата позволяет рассматривать различные способы поиска изображений.

В таблице 1 представлена рейтинг популярности поисковых систем за 2016 год. Рейтинг оценивается как доля поискового трафика, генерируемая данной поисковой системой в русскоязычном интернете. Количество трафика поисковой системы оценивается по данным крупнейших в России сервисов интернет-статистики: Яндекс.Метрика, SpyLog/Openstat,

LiveIntemet, Hotlog, Рейтинг@Май.га, а также на основании статистики компании SEO-AUDITOR [5].

Таблица 2

Рейтинг популярности поисковых систем за 2016 год (в %)_

01. 02. 03. 04. 05. 06. 07. 08. 09. 10. 11.

2016 2016 2016 2016 2016 2016 2016 2016 2016 2016 2016

Яндекс 49,8 50,3 50,3 51,1 50,5 49,7 49,6 49,2 48,5 48,1 47,8

Google 41,9 41,7 41,8 41,9 42,5 44,3 43,6 45,6 36,4 46,8 46,8

Mail.ru 6,01 5,97 5,76 5,56 5,57 5,55 4,85 3,81 3,82 3,88 3,99

Рамблер 1,69 1,68 1,67 0,60 0,60 0,57 0,57 0,49 0,50 0,46 0,50

Bing 0,70 0,53 0,48 0,41 0,40 0,42 0,37 0,38 0,34 0,35 0,33

Yahoo! 0,19 0,19 0,18 0,27 0,29 0,32 0,28 0,28 0,19 0,28 0,26

QIP 0,09 0,09 0,09 0,10 0,11 0,11 0,09 0,05 0,06 0,07 0,08

Как видно из таблицы 1 - в настоящее время существует достаточно систем поиска изображений. В связи с этим следует провести сравнительный анализ популярных систем с целью выявления наиболее часто реализуемого подхода и других функций, облегчающих поиск изображений.

Процесс оценки эффективности сравниваемых систем представлен на рис. 2 в виде универсальной схемы взаимодействия (способ построения которой описан в [4]).

Рис. 6. Универсальная схема взаимодействия

Для сравнительного анализа были выбраны поисковые системы, описанные ниже.

1) Яндекс - поисковая система компании Яндекс. Наиболее популярна в России. Реализует как контекстный, так и контентный подходы. Результаты поиска могут быть отфильтрованы по следующим параметрам: размер изображения, ориентация, тип, цвет, формат файла, время появления, поиск на определенном сайте. На результаты поиска можно накладывать фильтры для ограничения показа нежелательного контента.

2) Google - поисковая система компании Google. Представляет реализацию контекстного и контентного подходов. Поиск осуществляется по

всем сайтам, которые входят в базу данных Google. При контекстном поиске система находит все изображения, так или иначе помеченные искомым словосочетанием. Контентный поиск можно произвести, указав путь к изображению или выбрав изображение на локальном диске компьютера. Поисковая система поддерживает поиск идентичных изображений с другими размерами. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, цвет, тип, тема, время появления. Присутствует возможность фильтрации нежелательного контента.

3) Mail - поисковая система компании Mail.ru. Представляет собой реализацию контекстного подхода. Набор параметров фильтрации результатов поиска достаточно небольшой: размер изображения и цвет. Безопасного поиска не предусмотрено. В настоящее время для поиска изображений портал Mail.ru использует разработки компании Google.

4) Rambler - поисковая система компании Rambler. Реализация только контекстного подхода. Реализована возможность ввода голосовых запросов. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, время появления, цвет. Присутствует безопасный поиск, именуемый в данном случае семейным фильтром. В настоящее время поиск по изображениям в Rambler осуществляется с использованием разработок компании Яндекс.

5) Bing - поисковая система компании Microsoft. Представляет собой реализацию только контекстного подхода. Результаты поиска могут быть отфильтрованы по ряду параметров: размер изображения, цвет, стиль, макет, люди. Поисковая система Bing оснащена механизмом безопасного поиска, предотвращающего выдачу нежелательного контента. Присутствует возможность поиска изображений, идентичных найденному, но другого размера. Сотрудниками компании Microsoft также опубликовано большое количество работ, посвященных вопросам поиска и обработки изображений.

6) Yahoo! - поисковая система компании «Yahoo!». Реализован только контекстный подход. Результаты поиска могут быть отфильтрованы по ряду параметров: время появления, размер изображения, цвет. Сотрудниками и при участии Yahoo! опубликовано большое количество работ, посвященных вопросам поиска изображений.

7) QIP - поисковая система компании МедиаМир. Реализованы как контекстный, так и контентный подходы. Результаты поиска могут быть отфильтрованы по цвету и размеру. Предусмотрен безопасный поиск.

8) TinEye - специализированная поисковая система, осуществляющая поиск изображений по визуальному образцу. В качестве результатов поиска пользователь получает список найденных изображений и их краткую характеристику. В специальном окне можно сравнить искомое и найденное изображения. Результаты поиска могут быть упорядочены по: наибольшему соответствию, наибольшему отличию, наибольшему разрешению. Поиск осуществляется по изображениям, наиболее похожим на оригинал.

9) PicSearch - поисковая система компании Picsearch. Позволяет

пользователю при помощи введенных ключевых слов находить соответствующие изображения. Предоставляется также возможность производить поиск по анимациям или определенным размерам изображений, используя функции расширенного поиска.

Сравнительный анализ рассматриваемых систем поиска графической информации представлен в таблице 2.

Таблица 3

Сравнительный анализ систем поиска графической информации

Характеристики

Кон- Кон- Анализ Поиск Поиск Поиск Поиск Поиск Безопас

Система текст- тент- содер- по по по по на ный по-

ный ный жания ма- дате типу лю- сайте иск

поиск поиск кету лицен зии дям

Яндекс + + + + + - + + +

Google + + + + + + + + +

Mail.ru + - + - - - - - -

Рамблер + - + + - - + + +

Bing + - + + + + + - +

Yahoo! + - + - - - - - +

QIP + + + - - - - - +

TinEye - + - - + - - - -

PicSearch + - - + - - + - -

Сравнительный анализ систем поиска изображений показал, что в основе большинства систем лежит контекстный подход. Тем не менее, эти системы в той или иной степени проводят анализ содержания найденных изображений. Подобный анализ используется для выбора изображений определенной цветовой гаммы, определенного содержания и т.д.

Поиск изображений по типу лицензии реализован лишь в поисковых системах Google и Bing. Данный вид поиска позволяет искать изображения, которые выложены в открытый доступ с возможностью использования сторонними лицами и компаниями. Наличие поиска по типу лицензии весьма полезно для владельцев веб-сайтов (компаний и частных лиц), следовательно, создание поисковых систем, реализующих такой поиск остается актуальным.

Возможность поиска изображений по определенному сайту или домену предоставляют только Яндекс, Google и Рамблер. В большинстве случаев эти поисковые системы справляются со своей задачей лучше, чем встроенный поиск на сайтах. Развитие этого вида поиска в остальных поисковых системах является рациональным решением.

В результате сравнительного анализа становится очевидным, что поисковая система от корпорации Google предоставляет широчайший набор инструментов для поиска графической информации и является самой совершенной на сегодняшний день.

Использованные источники:

1. Кириллов А. Поисковые системы: компоненты, логика и методы ранжирования // Бизнес-информатика. - 2009. - №4. - С. 51-59.

2. Devireddy S.K. Content Based Image Retieval // Computer Sciences and Telecommunications. - 2009. - №5. - P. 10-27.

3. Десятников И., Утробин В. Построение архитектуры баз данных для задачи поиска изображений // Вестник Нижегородского университета им. Н.И. Лобачевского. - 2012. - №5-2. - С. 321-327.

4. Разумов В.И. Категориально-системная методология в подготовке ученых: Учеб. пособие. - Омск: Омск. гос. ун-т, 2004. - 277 с.

5. Рейтинг поисковых систем на 2016 год // SEO-AUDITOR [Электронный ресурс]. URL: http://www.gs.seo-auditor.com.ru/sep/2016/ (дата обращения 04.01.2017)

УДК 004.4'24

Шмелев А.Н., к.пед.н.

доцент

кафедра информатики и информационных технологий

Шварчук А.А. студент магистратуры ФГБОУВПО «Тульский государственный педагогический

университет им. Л.Н. Толстого»

Россия, г. Тула5 АНАЛИЗ СИСТЕМ УПРАВЛЕНИЯ КОНТЕНТОМ САЙТОВ Аннотация: Статья посвящена анализу систем управления контентом. Рассматривается понятие «Система управления содержимым (контентом)», их виды. Производиться сравнение наиболее популярных систем: Joomla, WordPress, 1C Битрикс, MODX, Drupal. В конце статьи делается вывод, о наиболее походящей системе управления контентом сайтов для информационного сайта.

Ключевые слова: Система управления содержимым (контентом), CMS, системы управления веб-содержимым, HTML, сайт.

Shmelev A. N., the PhD in Pedagogical sciences., associate Professor associate Professor of computer science and information technology

Svarchuk, A. A. student

FGBOU VPO " Tula State Lev Tolstoy Pedagogical University" Russia, Tula

Annotation: The article is devoted to analysis of content management systems. Discusses the concept of "content management System ", and their views. Be comparing the most popular systems: Joomla, WordPress, 1C Bitrix, MODX, Drupal. At the end of the article the conclusion about the most appropriate web

i Надоели баннеры? Вы всегда можете отключить рекламу.