Научная статья на тему 'Проблема построения базы данных для системы поиска и распознавания изображений'

Проблема построения базы данных для системы поиска и распознавания изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
271
57
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гарячевская Ирина Васильевна, Любченко Валентин Анатольевич, Путятин Евгений Петрович

Рассматриваются вопросы построения базы данных, ее отличия от традиционных баз. Описываются варианты сокращения избыточности изображений, возможность внедрения нового концептуального подхода, основанного на структурном представлении изображений и новых методах обработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гарячевская Ирина Васильевна, Любченко Валентин Анатольевич, Путятин Евгений Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Problems of database development for system of search and recognition of the images

In this article an aspects of image search system modeling and the database as a base of this system were described. New methods of image storage, that can decrease database volume and increase the speed of image processing, were also described.

Текст научной работы на тему «Проблема построения базы данных для системы поиска и распознавания изображений»

УДК 591.713

ПРОБЛЕМА ПОСТРОЕНИЯ БАЗЫ ДАННЫХ ДЛЯ СИСТЕМЫ ПОИСКА И РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ

ГАРЯЧЕВСКАЯИ.В., ЛЮБЧЕНКО В.А., ПУТЯТИН Е.П._____________________________

Рассматриваются вопросы построения базы данных, ее отличия от традиционных баз. Описываются варианты сокращения избыточности изображений, возможность внедрения нового концептуального подхода, основанного на структурном представлении изображений и новых методах обработки.

1. Особенности построения баз данных изображений

Представление информации в базах данных изображений (БДИ) имеет ряд существенных отличий от традиционных баз данных.

1. Основным типом в БДИ являются пространственные данные, что порождает ряд проблем как практического (проблемы емкости запоминающего устройства, быстродействия), так и семантического характера (проблема описания): требуются специальные хранилища данных, а также набор более агрегированных операций по их описанию и обработке, так как семантика изображений существенно отличается от семантики других типов данных.

2. Поскольку двумерное изображение представляет собой “непрерывную сущность” в двух измерениях, то это может потребовать хранения в БДИ очень большого количества логических связей. В общем случае количество логических связей определяется требуемой степенью детализации при разделении изображения на составляющие его элементы. В одних применениях БДИ может иметь небольшое количество простых связей, таких как пространственные или временные отношения между отдельными изображениями (географическое положение, история развития), или не иметь вообще никаких связей. В других, более сложных применениях, логические связи между изображениями (или частями изображений) могут отражать значительное количество слабо формализуемых отношений.

Для решения некоторых задач необходимо совместное использование как пространственных, так и непространственных данных, поэтому при формировании БДИ возникает дополнительная проблема их интеграции. В разных графических информационных системах интеграция данных проводится различными способами, но в этом случае проблема эффективной интеграции пространственных и непространственных данных в одной БДИ до сих пор полностью не решена.

3. Возросшая сложность решаемых задач и требование эффективности их выполнения обуславли-

вают необходимость множественного (частичного и альтернативного) представления изображений.

Таким образом, гибкая БДИ должна поддерживать данные в различных представлениях и обеспечивать автоматическое преобразование представлений одних и тех же данных. Так как многие структуры данных критичны к новым применениям, то фундаментальные концепции построения традиционных баз данных — интеграция данных и их независимость от прикладных программ — приобретают еще большее значение.

4. Изображения наряду с большой информационной емкостью обладают и большой информационной избыточностью. Поэтому одна из основных проблем обработки заключается в извлечении из исходных изображений лишь необходимой информации, т.е. в ее сжатии [1].

2. Классификация структур данных

В процессе развития систем обработки изображений появилось несколько концепций и подходов к представлению изображений, а также большое количество структур данных для реализации этих представлений. Следует отметить, что в основном каждому виду представления соответствует своя группа структур данных, реализующих его. Поэтому классификация способов представления изображения и структур данных осуществляется по одним и тем же аспектам.

Исходным моментом при классификации способов представления изображений является разделение их на позиционное, структурное и комбинированное.

При позиционном представлении плоскость изображения разбивается с помощью прямоугольной сетки на элементы одинакового размера (квадраты), которые для рассматриваемого приложения являются наименьшими неделимыми частями изображения. В качестве значения этого элемента берется некоторая его характеристика. Таким образом, при позиционном представлении взаимное расположение хранимых элементов соответствует расположению квадратов разложения исходного изображения. В зависимости от вида взаимосвязей между хранимыми элементами позиционное представление делится на матричное, пирамидальное и дерево квадратов. Наиболее широко позиционное представление применяется для хранения полутоновых изображений. Общим его недостатком является требование большой емкости памяти.

Проблема увеличения объема данных не может быть решена лишь количественными методами, т. е. использованием более мощных вычислительных средств. Поэтому в последнее время для сокращения избыточности изображений и эффективного его представления изучается возможность применения новых концептуальных подходов, одним из которых является широко распространенное структурное представление изображений и основанные на них методы обработки. Структурное представление, основанное на описании сложного изобра-

40

РИ, 2002, № 1

жения, их элементов, свойств и отношений между ними, позволяет уменьшить время выполнения некоторых операций обработки изображений и емкость требуемой памяти.

Очень часто полутоновое изображение является исходным для обработки, но в тех применениях, в которых широко используются методы распознавания образов и классификации, его позиционное представление довольно неудобно для их реализации.

Одной из основных проблем распознавания и классификации является определение признаков, а следовательно, и удобных способов описания объектов. Методы выделения признаков можно эффективно использовать для сжатия изображений, а некоторые способы уменьшения избыточности можно рассматривать как примеры описания изображений.

Таким образом, уже само структурное описание изображений является частью решения проблем их распознавания, классификации и сжатия.

При структурном описании изображения исходят из предпосылки, что его можно представить набором объектов. Под объектом понимается набор некоторых базисных элементов. Базисные элементы представляются набором графических примитивов, а также набором отношений внутри каждой группы этих компонентов, задающих их упорядоченность. Структурное описание изображения можно разделить на описание его в терминах объектов и их отношении и описание формы отдельно взятого объекта.

Структурное представление изображения обладает следующими достоинствами:

• значительное уменьшение требуемой емкости запоминающего устройства, так как в БДИ вместо изображений хранятся только их описания;

• значительное сокращение времени обработки, поскольку для многих применений достаточно знать лишь структурные отношения между компонентами изображения.

И, наконец, целую группу способов представления изображения составляют комбинированные способы, в которых для представления одного изображения одновременно используется как позиционное, так и структурное представление. Объединение представлений может быть выполнено на уровне одной структуры или с помощью организации двух и более БДИ и связей между ними.

Точность и адекватность представления двумерных данных соответствующей структурой, а следовательно, и область ее применения зависят от разрешающей способности структуры и ее типа [2].

Организация БД хранения изображений (объектов) представлена на рисунке.

Требования к такой БД касаются: хранения данных, средств обработки, специального технического обеспечения. Основное требование — это ее ориентация на введение графических данных, т.е. данных, для интерпретации или ссылок на которые требуется, как минимум, две координаты, что порождает ряд проблем. Система обслуживающей БД должна формировать динамические индексы, сортировать выделенную информацию и давать быстрые ответы.

3. Построение модели объектов-связей

Для эффективной реализации базы данных требуется классификация связей. В соответствии с тем, сколько объектов из одного набора может ассоциироваться со сколькими объектами из другого набора, выбирается вид связи.

Характеристика однозначности связи обозначает степень ассоциации типов сущностей. Если экземпляр сущности Z соотносится не более чем с одним

РИ, 2002, № 1

41

экземпляром другой сущности Y, то связь является однозначной по данному типу сущности.

Ассоциативность связи определяется через однозначность в обратном направлении относительно Z. Известно, что существует четыре возможных типа ассоциации сущности Z с сущностью Y: один к одному, один ко многим, много к одному, многие ко многим [3].

Применительно к БДИ использование моделей объектов-связей может выглядеть так:

1. Набор объектов “ТЕМАТИЧЕСКИЙ РАЗДЕЛ” с атрибутами:

— название раздела;

— описание раздела.

2. Набор объектов “ОБЪЕКТ” с атрибутами:

— название объекта;

— описание объекта.

3. Набор объектов “РИСУНОК” с атрибутами:

— центр тяжести по X;

— центр тяжести по Y;

— геометрический центр тяжести по X;

— геометрический центр тяжести по Y;

— площадь рисунка;

— изображение.

4. Набор объектов “ПРИМИТИВЫ” с атрибутом:

— название примитива.

5. Набор объектов “ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ” с атрибутами:

— название характеристики;

— описание характеристики;

— значение характеристики.

Между наборами объектов в рассматриваемой БД существуют такие связи:

1. Связь “ОБЪЕКТ относится к ТЕМАТИЧЕСКОМУ РАЗДЕЛУ”, тип отображения М:1 (много объектов относится к одному разделу).

2. Связь “ОБЪЕКТ состоит из РИСУНКОВ”, тип отображения — 1 :М (один объект имеет несколько изображений).

3. Связь “ОБЪЕКТ содержит ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ”, тип отображения - M:N (один объект может иметь несколько технических характеристик и одни и те же технические характеристики могут относиться к различным объектам).

4. Связь “РИСУНОК характеризуется ПРИМИТИВАМИ”, тип отображения — M:N (рисунок может содержать несколько примитивов и один примитив может характеризовать несколько рисунков).

Заключение

Поиск изображений в базе данных представляет собой трудную и до конца не решенную задачу. Одна из главных причин возникающих проблем связана с многозначностью представления одного и того же эталонного изображения вследствие действия геометрических искажений и помех. Это требует разработки дополнительных процедур нормализации и распознавания изображений в процессе поиска.

Другие проблемы, хотя и не носят принципиального характера, тем не менее порождают значительные дополнительные трудности и постановки новых задач в отличие от буквенно-цифровых баз данных. Это связано с тем, что хранение изображений и признаков объектов, а также связи между ними занимают большое количество памяти и процесс обработки становится более длительным. Проблема увеличения объема данных не может быть решена лишь количественными методами, т.е. использованием более мощных вычислительных средств. Поэтому для сокращения избыточности изображений и эффективного его представления возможно внедрение рассмотренного в данной статье нового концептуального подхода, основанного на структурном представлении изображений и новых методах обработки.

Литература: 1. Чукин Ю.В. Структура данных для представления изображений // Зарубежная радиоэлектроника, 1983. №8. С. 85-108. 2. Чукин Ю.В. Графические информационные системы // Зарубежная радиоэлектроника, 1985. №10. С. 31-55. 3. Ульяман Дж. Основы систем баз данных: Пер. с англ. М.: Финансы и статистика, 1983. 334 с.

Поступила в редколлегию 18.10.2001

Рецензент: д-р техн. наук, проф. Сироджа И.Б.

Гарячевская Ирина Васильевна, аспирант кафедры информатики ХНУРЭ. Научные интересы: проблемы поиска, цифровой обработки и распознавания изображений. Адрес: Украина, 61000, Харьков, ул. Ахсарова, 17, 31, тел. 37-24-18. e-mail: Ga_irisha@mail.ru

Любченко Валентин Анатольевич, аспирант кафедры информатики ХНУРЭ. Научные интересы: проблемы цифровой обработки изображений, нормализации, аффинные преобразования и распознавания изображений. Адрес: Украина, 61166, Харьков. пр. Ленина, 14.

Путятин Евгений Петрович, д-р техн. наук, проф., зав. кафедрой информатики ХНУРЭ. Научные интересы: цифровая обработка изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.

42

РИ, 2002, № 1

i Надоели баннеры? Вы всегда можете отключить рекламу.