Научная статья на тему 'Особенности построения распределенных баз данных изображений'

Особенности построения распределенных баз данных изображений Текст научной статьи по специальности «Общие и комплексные проблемы естественных и точных наук»

146
7
Поделиться

Похожие темы научных работ по общим и комплексным проблемам естественных и точных наук , автор научной работы — Золотовский В.Е., Шевченко Д.А.,

Текст научной работы на тему «Особенности построения распределенных баз данных изображений»

УДК 681.3.06:519

В.Е. Золотовский, Д.А. Шевченко

ОСОБЕННОСТИ ПОСТРОЕНИЯ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ ИЗОБРАЖЕНИЙ

Стремительный рост мультимедийной составляющей в общем объеме хранимой и обрабатываемой информации в самых различных сферах в последнее время приводит, в частности, к актуальности задачи упорядочивания, обработки и поиска изображений в накопленных данных. Данная задача непосредственно связана с задачей идентификации изображений, подходы и методы решения которой рассматриваются вот уже на протяжении ряда лет. Известно несколько различных методик. В их числе метод трасс, зонно-комбинаторный [1], корреляционно-экстремальные методы [2], нейросетевые методы. В части, касаемой идентификации человеческих лиц, а также отпечатков пальцев, очень хорошо зарекомендовали себя биометрические методы идентификации, основанные на опыте, полученном из криминалистики [3,4].

Особенностью решения задачи идентификации применительно к рассматриваемой сфере баз данных изображений является быстродействие алгоритмов и компактность данных, что критично с учетом больших объемов обрабатываемых данных. Наилучшим решением здесь считается нахождение некоторого компактного вектора характерных признаков изображения, с помощью которого возможно быстрое сравнение двух изображений. База данных, в свою очередь, содержит такие векторы, по которым и производится поиск нужного изображения. Практика показывает, что наиболее точные методы (т.е. с минимальными показателями ошибок при идентификации) одновременно являются и самыми медленными, что понятно, поскольку они максимально учитывают все особенности анализируемых изображений. К таким методам относятся и методы трасс, и корреляционные методы, и нейросетевые подходы (в данном случае сама процедура распознавания достаточно коротка во времени, однако процесс обучения нейросети длителен, также для идентификации требуется, по сути, все исходное изображение).

С выбором вектора возникает несколько проблем, которые решаются разными способами. Во-первых, это оценка достоверности поиска, поскольку компактность вектора подразумевает неполноту' описания изображения. Здесь возможны как отказы, т.е. когда не выбирается изображение, достоверно имеющееся в БД, так и ошибки, когда выбирается не то изображение. Данная проблема зачастую решается созданием в ходе поиска выбранным методом предварительной выборки на всем множестве обрабатываемых изображений. Затем на данной выборке проводится окончательная идентификация с использованием более точных, но и более затратных с точки зрения времени и машинных ресурсов методов (корреляционные методы или методы идентификации на нейросетевых технологиях). Второй проблемой здесь является оценка диапазона предварительной выборки, которая может быть решена с использованием определенным образом вы-

бранных порогов для функции классификации [5]. Сама функция и все пороговые коэффициенты подбираются, как правило, экспериментально для выбранного метода.

Рассмотрим наиболее известные примеры методик формирования подобных компактных описаний изображений, в частности применительно к человеческим лицам, поскольку в этом направлении есть хорошие показатели идентификации. Это биометрический метод, основанный на теории характерных точек для человеческих лиц [4], метод деформируемых эталонов [5], а также методы вычисления математических моментов. Последние методы еще недостаточно хорошо изучены и известны лишь общие положения, так, были предложены вычисления ковариационных моментов, а также статистических моментов для изображения [6]. На последнем методе хотелось бы остановиться подробнее.

Было сделано предположение о возможности представления предварительно обработанного и приведенного к битовому виду изображения в виде некоторой реализации случайного процесса. Далее было сделано предположение о равновероятном появлении как «значащих», так и «незначащих» точек изображения. Характеристикой же данного представления из теории вероятностей может служить функция распределения. Однако в общем виде описать данную функцию есть достаточно нетривиальная задача, к тому же редко практически исполнимая. Поэтому в качестве описания данного случайного процесса можно выбрать известные численные характеристики распределения - моменты различных порядков [7]. Предлагаемый метод формирования характеристических признаков изображения имеет в своей основе предположение о возможности представления изображения, преобразованного в битовое (черно-белое), в виде реализации двумерного случайного процесса. Построение вектора признаков основано на выделении на изображении характерных для него областей и вычислении массива численных характеристик распределения для каждой из областей.

Такими характеристиками распределения согласно классической теории вероятностей [7] являются начальные или центральные моменты, вычисляемые для каждой из осей на плоскости

Математическое ожидание по осям: шх =^Х;р; ; шу = > где пхт

1=1 j=l

- размеры анализируемой области изображения.

п

ш

п

Центральные

моменты

Б-порядка: щ = £(х; -тх)5р; ;

1=1

т

Второй центральный момент известен как дисперсия;

п

т

°Х =1>1-тх)2Р;; °у = Е(У^ту)2р_|.

1=1

j=l

Третий и четвертый моменты (5=3 и 4 соответственно) рассматриваются несколько преобразованными: коэффициент асимметрии (скошенность) распре-

Цт .---

деления: Бк = —4-, где а = У Э (среднеквадратичное отклонение); коэффициент

о"3

эксцесса (крутость) распределения: Ех = ^ - 3 .

а

Во всех вышеприведенных формулах вероятность появления !-й «значащей» точки изображения вычисляется, исходя из предположения о равновероятности появления как «значащей», так и «незначащей» точек на анализируемом фрагменте. Также необходимо учитывать уже участвовавшие в вычислении точки и отбрасывать их. Итак, имеем:

Вероятность появления «значащей» точки: р/; = — —,

п-1

где п - общее количество точек в ряду для данной оси, 1 - позиция текущей рассматриваемой точки. Тогда общая вероятность того, что х-я выбранная точка будет «значащей» с учетом того, что все остальные считаем «незначащими», равна: Р1 = рг, х(] -щх). С учетом равновероятного появления данного события окончательно формула для вычисления вероятности появления «значащей» точки для 0,5(п-1-1)

данной оси равна: р^ =----------—.

(п-0"

При таком подходе целесообразно рассматривать преобразованное растровое черно-белое изображение в виде битовой плоскости из черных и белых еди-. ниц изображения (пикселов), «значащим» может быть выбран любой из двух цветов. Можно также сказать, что анализируемые фрагменты изображения представляют собой матрицы размерности самих фрагментов, состоящие из единиц и нулей. Таким образом, каждая из вышеприведенных характеристик рассчитывается

1 п

по осям по формуле: в = —УС, , где в - рассчитываемый момент для оси (X

т,=|

или У), т х п - размерность фрагмента.

Зависимости значений Ех от смещений относительно центра поля показаны на рисунке.

-15 -10 -5 0 5 10 15

смещении пи X

Круг 45 ——--Круг 51 —■—Квадрат 80 —А—Квадрат 90*1

Важной задачей становится определение необходимых и достаточных условий применения на этапе идентификации данного набора признаков и ограничения, накладываемые при этом. В ходе экспериментальных исследований на простейших геометрических фигурах (квадрат, круг, прямоугольник, эллипс, треугольник и пр.) была поставлена задача попытаться определить, какими свойствами обладает построенный вектор признаков, какова точность описания объекта, можно ли установить степень подобия для фигур и, в конечном итоге, использовать эти данные для проверки на сложных изображениях. В ходе проверки гипотезы о точности описания изображения набором числовых статистических характеристик на геометрических фигурах были получены следующие результаты. Анализировалось поле 300x300 пикселов с расположенными на нем фигурами. Оценивались числовые характеристики, рассчитанные для каждой из фигур в зависимости от смещения от центра поля, размеров и ориентации на плоскости. Основные результаты экспериментов:

каждая из классов фигур (с одинаковой геометрией) обладает уникальной совокупностью характеристик;

фигуры одного класса, но с разными смещениями но осям различаются лишь в части характеристик для изменяемых координат для данной оси;

характеристики фигур одного класса (с одинаковой геометрией), но с разными размерами, практически (с очень малыми отклонениями) совпадают для моментов нечетных степеней (М, $);

характеристики фигур одного класса различны для разномасштабных фигур при повороте фигуры относительно ее центра.

На основании этого можно сделать вывод о том, что для идентификации фигуры необходимо иметь полный набор числовых характеристик. Причем именно моменты четных порядков позволяют наиболее точно идентифицировать класс

фигуры. На рис. 1 приведены графики крутости для наиболее критичного случая, когда сравнивались близкие по геометрии фигуры, квадрат и круг с равными площадями.

При этом наилучшим с этой точки зрения является момент четвертого порядка (крутость) и для него были более детально рассмотрены отклонения для этой же пары фигур. Наилучшие показатели имеют фигуры, расположенные в центре анализируемого поля или на небольших отклонениях от центра. Проведены также эксперименты с искажениями, вносимыми в геометрию фигур, для оценки устойчивости характеристик для классов и возможностей идентификации. На первом этапе исследований результаты показывают, что искажения, затрагивающие до 20% площади анализируемой фигуры, значительно влияют на рассчитываемые характеристики. Однако исследования здесь еще предстоит продолжить, равно как и произвести детальные оценки для сложных объектов, в том числе и фрагментов человеческих лиц.

Данный анализ позволяет сделать некоторые вывод относительно принципов построения и структуры БД изображений. При занесении образа в БД необходимо рассчитать компактный вектор признаков тем или иным методом. Поиск и идентификация изображения производится в два этапа: на первом проводится первичная выборка на всем множестве изображений в БД путем сравнения векторов искомого и всех поочередно изображений, границы выборки в центре анализируемого поля или на небольших отклонениях от центра. Проведены также эксперименты с искажениями, вносимыми в геометрию фигур для оценки устойчивости характеристик для классов и возможностей идентификации. На первом этапе исследований результаты показывают, что искажения, затрагивающие до 20% площади анализируемой фигуры значительно влияют на рассчитываемые характеристики. Однако исследования здесь еще предстоит- продолжить, равно как и произвести детальные оценки для сложных объектов, в том числе и фрагментов человеческих лиц.

Данный анализ позволяет сделать некоторые вывод относительно принципов построения и структуры БД изображений. При занесении образа в БД необходимо рассчитать компактный вектор признаков тем или иным методом. Поиск и идентификация изображения производится в два этапа: ка первом проводится первичная выборка на всем множестве изображений в БД путем сравнения векторов искомого и всех поочередно изображений, границы выборки определяются весовыми коэффициентами и порогами, подобранными для функции отображения на подмножество выборки. Далее на выбранном подмножестве с использованием более точных алгоритмов определяется окончательный «кандидат». Эффективность данного подхода за счет снижения объемов анализируемых данных (компактных векторов) проявляется, прежде всего, на распределенных БД, распределенных на некотором множестве серверов, таким образом, чтобы запросы, отправленные с клиента, обрабатывались параллельно на множестве серверов баз данных, включенных в комплекс хранения изображений. Так, компании М1гоб (www.miros.com) и Ушопкз (www.faceit.com) уже предлагают продукты с использованием технологии построения векторов биометрическим методом.

Предлагаемый метод статистических числовых характеристик представляется

интересным с точки зрения повышения компактности вектора и повышения

быстродействия поиска.

ЛИТЕРАТУРА

1. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка изображений. - М.: Высшая школа, 1983.

2. Baron R.J. Mechanism of human facial recognition. - Int.J.Man Machines Studies, 1981, vol. 15, pp.138-179.

3. Зинин A.M., Кирсанова Л.З. Криминалистическая фотопортретная экспертиза. - М.: Наука, 1991.

4. Глазунов А.С. Автоматическое распознавание идентификация лиц. - Тр. изд-ва Академии МВД, 1997, с.91-103.

5. Белоцгрковскай О.М., Глазунов А.С., Щенников ВВ., Компьютерное распознавание

человеческих лиц. - Успехи современной радиоэлектроники, №8, 1997, с. 3-17.

6. Костюк А.К. Разработка и исследование системы идентификации и цифровой обработки изображений на основе микропроцессорных вычислительных систем. - Таганрог, ТРТУ, 1997.

7. Вентцель Е.С. Теория вероятностей - М.: Высшая школа, 1998.

УДК 519.7

А.В. Аграновский, В.В. Булаев, Н.А. Ромоданов

БАЗА ДАННЫХ ДЛЯ ХРАНЕНИЯ ИНФОРМАЦИИ, ПОЛУЧЕННОЙ ИЗ 11ЧТЕ1^ЕТ

Каждый пользователь Ыегпег, безусловно, хотя бы раз в жизни сохранил на своем компьютере документ, найденный в Сети. Большинство же регулярно “сливает” себе объекты, представляющие собой совершенно разные структуры -от НТМЬ-документов до программного обеспечения. Некоторые пользователи предпочитают хранить у себя копии \\^еЬ-сайтов, причем со всей историей изменений. Очевидно, что объем информации быстро увеличивается и со временем может стать совершенно не управляемым. Налицо проблема хранения и оперативного поиска получаемой информации. Для решения данной проблемы подходит любая реляционная СУБД, имеющая возможность хранить ВЬОВ-объекты.

Не останавливаясь на конкретной СУБД, перейдем к структуре базы данных. Отметим, что кроме единичных объектов, таких как графические изображения или текстовые файлы, требуется хранить и некоторые структуры объектов, например, иерархию НТМЬ-страниц, представляющую собой \УеЬ-сайт. Следовательно, сразу возникает несколько очевидных сущностей: во-первых, собственно объект, являющийся единицей информации нашей базы данных; во-вторых, тип этого объекта, например, аудиофайл; в-третьих, сущность, реализующая собой иерархическую связь объектов; и, в-четвертых, категории, к которым относится