Научная статья на тему 'К вопросу об использовании формальных грамматик при распознавании объектов в сложных сценах'

К вопросу об использовании формальных грамматик при распознавании объектов в сложных сценах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
63
18
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фаворская М.Н.

Раскрывается взаимосвязь между задачами структурного описания и распознавания объектов в сложных сценах. Рассматриваются способы построения грамматик описания изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT USING OF FORMAL GRAMMARS FOR OBJECT RECOGNITION IN COMPLEX SCENES

The interconnection between tasks of structure description and object recognition in complex scenes is discussed. Methods of grammar design for images description are considered.

Текст научной работы на тему «К вопросу об использовании формальных грамматик при распознавании объектов в сложных сценах»

Решетневские чтения

координаты x уже были добавлены, то, соответст- оси OY вверх и вниз, пока либо не будут достиг-

венно, добавлять эту точку нельзя. После добав- нуты края, либо не наберется нужное количество

ления соответствия текущей строки, совершается точек. После этого уточняются соответствия до

проход по строкам от середины изображения по субпиксельной точности.

I. V. Toupitsyn

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

A SIMPLE ALGORITHM OF STROKE COMBINATION WITH HEURISTICS FOR POORLY TEXTURED AREAS

A simple method of reconstruction of intermediate foreshortenings at the stereoshooting, based on calculation offactor of conformity is presented. Advantages and lacks of this method are considered.

© Тупицын И. В., 2009

УДК 004.93'1; 004.932

М. Н. Фаворская

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

К ВОПРОСУ ОБ ИСПОЛЬЗОВАНИИ ФОРМАЛЬНЫХ ГРАММАТИК ПРИ РАСПОЗНАВАНИИ ОБЪЕКТОВ В СЛОЖНЫХ СЦЕНАХ

Раскрывается взаимосвязь между задачами структурного описания и распознавания объектов в сложных сценах. Рассматриваются способы построения грамматик описания изображений.

Существует целый класс задач, в которых особую важность приобретает информация о структуре объектов сцены (видеонаблюдение в закрытых помещениях, в местах большого скопления людей с целью предотвращения террористических актов, управление движением робототехни-ческих комплексов в условиях реальной обстановки и т. д.). При этом объекты сцены, как правило, сложны и характеризуются большим количеством признаков. В этом случае целесообразно построить иерархическое описание структуры сцены. Процесс распознавания осуществляется после идентификации простых элементов объекта и составления описания объекта в терминах этих элементов, а непосредственное распознавание состоит в синтаксическом анализе описания объекта.

Задача описания объекта тесно связана с задачей его распознавания, поскольку элементы описания можно использовать в качестве признаков объекта, а само описание служит основой для распознавания. Однако эти задачи имеют различную информационную природу. Так, распознавание образов базируется на основных положениях теории экстраполяции, при этом используются методы экстраполяции функций и теории решений. Структурное же описание основано на применении аппарата математической лингвистики

или теории формальных грамматик, используются аналогии между структурой объекта и синтаксисом языка. Применять аппарат математической лингвистики для описания структуры объектов можно только после того, как произведена сегментация изображения объектов сцены, установлены элементы для описания типичных фрагментов и найдены методы их поиска. Распознавание при таком подходе состоит в синтаксическом анализе или грамматическом разборе некоторой фразы, описывающей объект, и заключается в проверке - является ли фраза синтаксически и семантически правильной по отношению к заданной грамматике.

Предполагается, что грамматика должна содержать три составляющие:

- множество непроизводных элементов, из которых составляются рассматриваемые изображения;

- множество предикатов, описывающих структурные отношения между непроизводными элементами, которые являются аргументами предикатов;

- множество правил подстановки, каждое из которых должно состоять из трех частей: наименование определяемого образа, списка переменных составных частей образов и условий, которым должны удовлетворять составные части.

Информатика и информационно-управляющие системы

Структурный подход целесообразен в том случае, если непроизводные элементы представляют собой простые и легко обнаруживаемые элементы изображения. Правила конструирования композиций из непроизводных элементов обычно задают с помощью специальных грамматик (грамматик описания изображений). Грамматическое правило (правило подстановки) может быть применено любое число раз, что позволяет достаточно компактно выражать основные структурные характеристики бесконечного множества предложений. Язык, формирующий структурное описание изображений в терминах множества непроизводных элементов и конструирования композиций этих элементов, называют языком описания изображений.

Пусть XI, X2, ..., Xn - заданное множество изображений, имеющих общую синтаксическую структуру. Задача состоит в том, чтобы при данных непроизводных элементах и предикатах построить грамматику, которая является некоторым приближением заданного множества изображений. Вначале выявляют структуру изображения, задаваемую непроизводными элементами и предикатами. Если один или более предикатов оказываются истинными, то с помощью некоторых правил подстановки строится объект (подобраз), отражающий некоторые свойства образа. Такая процедура построения подобразов из непроизводных элементов повторяется до тех пор, пока не исчерпаются все возможности. Затем проверяют все подобразы на наличие непроизводных элементов. Подобразы, не удовлетворяющие этому требованию, исключаются из дальнейшего рассмотрения. Далее формируется грамматика

п

О = • О,., где Gi - грамматика, выбранная для

1=1

описания изображения X., которая модифицируется в соответствии с правилами, исключающими

из множества О все многократные вхождения какого-либо правила подстановки, кроме одного.

Можно предложить следующие операторы преобразования изображения для построения непроизводных элементов:

- операторы, преобразующие исходное изображение в другое изображение с помощью фильтров, например, операторы выделения контуров;

- операторы, определяющие цвет, яркость и текстурные свойства областей на изображении;

- операторы, вычисляющие характеристики объектов на изображении, например, площадь, диаметр, центр тяжести;

- операторы, выделяющие часть изображения, например, линии, точки схода двух и более линий и т. д.;

- операторы преобразования одних числовых характеристик изображения в другие характеристики, например, разность, отношение.

В процессе кластеризации элементов по каждой характеристике формируется некоторая система логических переменных. После этого осуществляется выбор функций от логических переменных, которые разделяют исходное изображение на классы. Далее строится описание разделяемых образов с помощью блока построения описания. Тем самым определяется окончательная грамматическая система языка для анализа изображений, близких тем изображениям, которые предъявлялись в процессе обучения. Также система имеет несколько этапов поиска новых логических переменных. На первом этапе определяется описание в терминах, характеризующих изображение в целом, на втором этапе в описание включаются термины, характеризующие части изображения, на третьем этапе - термины, характеризующие более крупные части изображения.

M. N. Favorskaya

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

ABOUT USING OF FORMAL GRAMMARS FOR OBJECT RECOGNITION

IN COMPLEX SCENES

The interconnection between tasks of structure description and object recognition in complex scenes is discussed. Methods of grammar design for images description are considered.

© Фаворская М. Н., 2009

i Надоели баннеры? Вы всегда можете отключить рекламу.