Научная статья на тему 'Схема синтеза логических моделей изображений, допускаемых эффективными распознающими операторами'

Схема синтеза логических моделей изображений, допускаемых эффективными распознающими операторами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
160
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Схема синтеза логических моделей изображений, допускаемых эффективными распознающими операторами»

СХЕМА СИНТЕЗА ЛОГИЧЕСКИХ МОДЕЛЕЙ ИЗОБРАЖЕНИЙ, ДОПУСКАЕМЫХ ЭФФЕКТИВНЫМИ РАСПОЗНАЮЩИМИ

ОПЕРАТОРАМИ*

В рамках Дескриптивного Подхода к распознаванию изображений вводится класс логических преобразований (Класс Дескриптивных Логических Преобразований - ДЛТ-класс), обеспечивающих переход от исходного изображения, являющегося объектом анализа/распознавания, к формализованному описанию этого изображения и получение на основе последнего решения задачи распознавания. Процесс решения задачи распознавания изображений включает два основных этапа: а) приведение изображения к виду, удобному для распознавания; б) применение к “приведенному” изображению эффективного распознающего алгоритма. ДЛТ-класс включает преобразования двух типов. Преобразования ДЛТ-1 переводят исходное изображение в описание, задаваемое дизъюнктивной нормальной формой. Преобразования ДЛТ-2 представляют собой распознающие операторы логической модели Алгоритмов Распознавания, Основанных на Вычислении Оценок, и обеспечивают собственно процесс распознавания. ДЛТ-класс обладает следующими важными достоинствами: а) в процессе распознавания используется локальная и глобальная информация, воспроизводимая изображением; б) используемые распознающие операторы являются вычислительно эффективными; в) логическое описание изображения обладает устойчивостью относительно масштабных и структурных деформаций.

1. ВВЕДЕНИЕ

При работе с изображениями правильный результат достигается в том случае, если анализ основан на использовании некоторого формализованного описания изображения. Должным образом его представляющего, в максимальной степени соответствующего априорным знаниям и совместимого с решаемой задачей. В этом смысле синтез формализованного описания изображения является оптимизационной задачей, причем ее решение должно обладать устойчивостью, удовлетворять временным и другим ресурсным ограничениям, определяемым характером прикладной задачи, и, по возможности. Допускать перенос на новые ситуации.

Дескриптивный Подход к Анализу и Пониманию Изображений (ДПИ) был предложен в 80-е и развит в 90-е годы с тем, чтобы сделать возможным использование

1 Работа, результаты которой ихчожены в данной статье, частично финансировалась Российским фондом фундаментальных исследований (проект N 93-01-00480) и частично Международным научным фондом и Правительством Российской Федерации (грант N .16 Р100).

методов математической теории распознавания образов при решении задач анализа и понимания изображений |1,2|. ДПИ предусматривает использование специальных методов для приведения изображения к виду, удобному для распознавания, и методов, обеспечивающих реализацию многоэтапных процессов решения задач описания, анализа, распознавания и понимания изображений. Отличительными чертами ДПИ служат:

введение специальных типов признаков для описания изображений (непроизводные элементы, логические и параметрические признаки, дескрипторы);

использование альтернативных классов моделей изображений (порождающие модели, параметрические модели и процедурные модели); декомпозиция задачи;

использование как локальной, так и глобальной информации, содержащейся в изображении;

параллельное использование в процессе анализа порождающей и параметрической моделей изображения.

Данная работа посвящена одной из основных проблем, возникающих в связи с развитием и использование ДПИ - разработке методов и построения и преобразования моделей изображений, предназначенных для решения задач понимания изображений, в частности для:

выбора, выделения и определения значений дескриптивных признаков; синтеза моделей изображений на языке дескриптивных признаков; применения двухмерных Алгоритмов, Основанных на Вычислении Оценок (2-мерных АВО) [3], для решения задач распознавания при представлении изображений с помощью дескриптивных моделей.

В соответствии с методологией ДПИ процесс решения задачи распознавания изображений состоит из двух основных этапов:

приведение изображения к виду, удобному для распознавания; применение к “приведенному” изображению эффективного алгоритма распознавания.

Это означает, что при решении задач анализа, распознавания и понимания изображений всегда необходимо сначала получить некоторое формальное описание (модель) изображения, а затем преобразовать эту модель с помощью соответствующего алгоритма, а именно, такого алгоритма, который допускает данную модель (может се обработать ).

Для того, чтобы система понимания изображений работала удовлетворительным образом, она должна быть способной извлекать и использовать как локальную, так и глобальную информацию, содержащуюся в анализируемом изображении. При этом глобальная информация обеспечивает контекстную составляющую анализа, которая может играть чрезвычайно существенную роль в идентификации, классификации и распознавании объектов обрабатываемой сцены. Иерархический метод логического анализа изображений, рассматриваемый в данной статье, предусматривает согласованное использование (“слияние”) локальной и глобальной информации, обеспечивая распознавание основных объектов сцены, анализ ее пространственной структуры и понимание анализируемого изображения как таковое.

Введен класс логических преобразований - Класс Дескриптивных Логических преобразований ( ДЛТ-класс ), обеспечивающих переход от исходного изображения, являющегося объектом анализа/распознавания, к формализованному описанию этого изображения и получение на основе последнего решения задачи распознавания.

Процесс решения задачи распознавания изображений включает два основных

этапа:

а) приведение изображения к виду, удобному для распознавания;

б) применение к “приведенному” изображению эффективного распознающего алгоритма.

ДЛТ-класс включает преобразования двух типов. Преобразования ДЛТ-1 переводят исходное изображение в описание, задаваемое дизъюнктивной нормальной формой (ДНФ-описание). Этот класс обеспечивает выполнение следующих операций над изображением:

выбор структурирующего элемента и его применение к анализируемому изображению;

задание логических переменных (непроизводных элементов изображения);

обнаружение заданных непроизводных элементов в локальных окрестностях изображения, выделенных с помощью структурирующего элемента (выполняется для всех локальных окрестностей изображения);

построение локального логического описания ( логического описания уровня 0 ) для фрагмента изображения ( логического описания локальной окрестности ) в форме элементарной конъюнкции ( выполняется для всех локальных окрестностей изображения );

задание узловых булевых функций ( логических описаний уровня 1 ) для набора смежных локальных окрестностей;

построение логического описания уровня 1 для фрагмента изображения, соответствующего выбранной конфигурации смежных локальных окрестностей, в форме ДНФ - дизъюнкции логических описаний уровня 0 ( выполняется для всех узловых булевых функций уровня 1 );

минимизация узловых булевых функций уровня 1 ( выполняется для всех узловых булевых функций уровня 1 );

задание узловых булевых функций ( логических описаний уровня 2 ) для наборов смежных фрагментов изображения, описываемых узловыми булевыми функциями уровня 1);

построение логического описания уровня 2 для фрагмента изображения, соответствующего выбранной конфигурации смежных! фрагментов изображения, описываемых узловыми булевыми функциями уровня I), в форме ДНФ - дизъюнкции логических описаний уровня 1 ( выполняется для всех узловых булевых функций уровня 2 );

минимизация узловых булевых функций уровня 2 ( выполняется для всех узловых булевых функций уровня 2 );

выполнение шагов ( 8 - 10 ), обеспечивающих построение логических описаний Фрагментов изображения высших уровнен в форме ДНФ;

построение логического описания в форме ДНФ для изображения в целом; минимизация логического описания изображения - построение логической модели изображения в форме сокращенной или минимальной ДНФ.

Преобразования ДЛТ-2 представляют собой распознающие операторы логической модели Алгоритмов Распознавания, Основанных на Вычислении Оценок (АВО) [3], и их реализация и представляет собой собственно процесс распознавания.

Этот класс обеспечивает выполнение следующих операций над изображением: выбор ортогональных конъюнкций, входящих в ДНФ-описания изображения(й), в качестве опорных множеств логического подкласса АВО, допускающего использование системы опорных множеств с произвольной структурой; вычисление оценок близости для отдельных опорных множеств, входящих в систему опорных множеств алгоритма, с помощью распознающих операторов логического подкласса АВО ( выполняется для всех опорных множеств, образующих систему опорных множеств алгоритма распознавания );

агрегация оценок, полученных с помощью распознающих операторов для отдельных подмножеств, в единую оценку для анализируемого изображения (или фрагмента изображения) по выбранной системе опорных множеств;

применение какого-либо стандартного решающего правила к агрегированной оценке для изображения/набору оценок для фрагментов изображения.

ДЛТ-класс обладает следующими важными достоинствами:

в процессе распознавания используется локальная и глобальная информация, воспроизводимая изображением;

используемые распознающие операторы являются вычислительно эффективными; логическое описание изображения обладает устойчивостью относительно масштабных и структурных деформаций.

2. ДЕСКРИПТИВНЫЙ ПОДХОД К РАСПОЗНАВАНИЮ ИЗОБРАЖЕНИЙ

Теоретическая основа для обработки информации, представленной в виде изображений, была получена посредством специализации известного Алгебраического Подхода к Распознаванию Образов и Прогнозированию [4]. Обоснование, аксиоматизация и разработка Дескриптивного Подхода вызваны возникшими в последние годы практическими потребностями в регуляризации и систематизации методов обработки, анализа, распознавания и понимания изображений 11,2]. ДПИ явился основой для создания дескриптивной теории распознавания изображений и реализации ее методов и средств.

Необходимым условием успеха разработки автоматизированных систем анализа видеоданных, основанных на знаниях, является определение и разработка моделей трех типов:

a) модели, представляющие знания об изображениях;

b) модели, представляющие знания, содержащиеся в изображениях ( заданные/представленные ) в виде изображений;

с) модели преобразований, допускаемых моделями типов "а” и “Ь”.

В таком случае естественной необходимостью является введение моделей изображений, ориентированных на решение задач распознавания, и эффективных методов и средств приведения изображений к виду, удобному для распознавания, обеспечивающих сохранение специфики ( преимуществ ) изображения как способа представления информации. Изучение этой проблемы показало, что единственным путем к ее разрешению могла бы служить теория распознавания изображений, связывающая воедино природу изображения, приложения распознавания изображений, методологию распознавания образов, модели изображений ( в частности, представляющие изображения в виде, удобном для распознавания ), алгоритмы распознавания изображений и технологические схемы распознавания изображений.

ДПИ позволяет решать задачи, связанные с построением формализованных описаний изображений как объектов распознавания и с синтезом процедур распознавания, допускающих дескриптивные формализованные описания изображений. Решение указанных задач основано на представлении организации, структуры и семантического содержания изображения как результата таких порождающих процедур, с помощью которых анализируемое изображение может быть построено из непроизводных элементов и других объектов, выделяемых на изображении на отдельных уровнях иерархической схемы анализа. Поскольку такой метод характеризации изображения является операциональным, то в целом процесс обработки, анализа и распознавания изображения рассматривается как реализация на изображении некоторого набора преобразований. Последнее, естественно, относится и к процессу синтеза формализованного описания изображения - модели изображения, реализуемому в рамках процесса решения задачи распознавания в качестве одного из его неотъемлемых этапов. В целом этот процесс можно трактовать как траекторию решения задачи распознавания изображения. Преобразования, реализации которых образуют траекторию, определяются на классах эквивалентности множества изображений; каждый из классов эквивалентности представляет собой некоторый ансамбль допустимых изображений. Эти ансамбли также определяются дескриптивно: с помошью наборов прототипов и наборов порождающих преобразований, обладающих функциональной полнотой относительно соответствующих классов эквивалентности.

Основные постулаты Дескриптивной Теории Распознавания Изображений отражают характеристические свойства изображения как средства представления и воспроизведения информации и специфику структуры и реализации процесса распознавания изображений:

а) построение формального описания изображения как объекта распознавания рассматривается в качестве самостоятельной математической задачи, которая ставится и решается в рамках процесса распознавания ( классическая методология распознавания образов обычно не предполагает постановки и решения такой задачи; если же эта задача возникает, то ее постановка и решение выполняются за пределами собственно процесса распознавания );

b) формальное описание изображения должно сохранять преимущества, возникающие именно в результате использования изображения для представления и воспроизведения информации:

* формальное описание изображения должно сохранять его “изобразительный” характер. т.е. при построении описания изображение не должно “разрушаться”;

* формальное описание изображения должно представлять собой некоторую математическую/символьную конструкцию;

* построение формального описания изображения должно основываться на:

• последовательном использовании порождающих

процедур;

• последовательном воспроизведении иерархической

структуры изображения как объекта распознавания;

• уюте отношений, связывающих элементы описаний ( дескрипторы ), непроизводными элементами и характерными объектами, относящимися к отдельным уровням иерархии;

• учете отношений, связывающих элементы описаний ( дескрипторы ), непроизводными элементами и характерными объектами, относящимися к различным уровням иерархии;

• воспроизведении двойственности иерархической

структуры изображения, выражающейся в наличии масштабной и морфологической иерархий;

c) между порождающими процедурами построения формального описания изображения и процедурами распознавания существует двойственная связь, возникающая в связи с тем, что в силу иерархичности процесса распознавания ( промежуточный ) результат распознавания представляет собой некоторое формальное описание следующего уровня, которое становится объектом распознавания на следующем этапе;

с!) процесс распознавания реализуется в виде некоторой последовательности преобразований, применяемых к последовательно порождаемым формальным описаниям изображения, относящимся к его фрагментам и/или соответствующим иерархическим уровням представления;

с) управление процессом распознавания осушесталяется с помощью механизма Реверсивного Алгебраического Замыкания [2|;

О реализация процесса распознавания в виде траектории ( последовательности ) преобразований текущих формальных описаний позволяет использовать для управления этим процессом информацию, полученную при сопоставлении/идентификации текущих формальных описаний в пределах иерархических уровней и относящихся к различным уровням иерархии.

%) использование в процессе распознавания знаний о предметной области, о характере задачи, о физических и геометрических особенностях

13Х

изображенной сцены, об универсальных, логических, математических и физических законах, о способах и аппаратуре, использованных для регистрации, получения, построения и воспроизведения изображения, о природе и характеристиках анализируемого изображения, о целях, методах и средствах анализа.

Итак, концепция, положенная в основу ДПИ, предусматривает стандартную организацию процедур представления и преобразования информации при распознавании изображений. Структура процесса распознавания является иерархической. На каждом уровне выбираются, отыскиваются ( обнаруживаются ) или вычисляются непроизводные элементы, характерные объекты, признаки и дескрипторы и в результате обработки этих элементов текущих ( соответствующих данному уровню ) описаний с помощью порождающих процедур синтезируются промежуточные модели ( формальные описания ) анализируемого изображения. При выборе средств формирования - элементов - описания существенно используются знания ( см. выше - п. “ё” ). Структура процесса распознавания отражает специфику структуры модели алгоритма распознавания изображении ( модель содержит оператор приведения изображения к виду, удобному для распознавания, распознающий оператор и решающее правило ), необходимость перехода из пространства формальных описаний в пространство агрегированных оценок и использование в качестве средства управления процессом механизма реверсивного алгебраичес кого зам ы кан ия.

3. АЛГОРИТМЫ РАСПОЗНАВАНИЯ, ОСНОВАННЫЕ НА ВЫЧИСЛЕНИИ

ОЦЕНОК

Одной из важнейших проблем в распознавании образов и анализе изображений является выбор оптимального или приемлемого алгоритма для решения некоторой прикладной задачи. Рассмотрим один из методов, позволяющий выполнять такой выбор, на примере известного класса алгоритмов распознавания - АВО.

Оптимизация выбора сводится к поиску в некотором заданном множестве алгоритмов распознавания {/4} такого алгоритма Д, который обеспечивает

максимизацию некоторого функционала качества алгоритма распознавания.

Поскольку процедуры оптимизации должны выполняться в некотором заданном пространстве, то для синтеза оптимального алгоритма распознавания необходимо определить соответствующий класс алгоритмов, в котором предполагается решать задачу оптимизации, таким образом, чтобы оптимизация была практически осуществима. Эго означает, что:

a) необходимо ввести модель алгоритма, обеспечивающее некоторое единообразное представление для достаточно богатого класса алгоритмов;

b) эта модель должна задаваться некоторым множеством параметрических объектов, характеризующих выбранный класс алгоритмов распознавания.

Такая модель позволяет ввести взаимно-однозначное соответствие между множеством алгоритмов распознавания и некоторым множеством численных параметров, т.с. соответствие между некоторым классом алгоритмов распознавания и некоторой областью многомерного параметрического пространства.

Работа алгоритмов класса АВО основана на вычислении оценок сходства, выполняющих роль характеристик “близости” распознаваемого объекта и некоторого эталона ( эталонов ). Вычисление этих оценок сходства заключается в сопоставлении объектов, для которых определяется степень сходства, по некоторой системе ансамблей признаков - некоторой системе подмножеств заданного множества признаков.

Пусть задано множество М объектов СО. На этом множестве существует разбиение

m

на конечное число подмножеств ( классов ) fi*, i =1.........т. М = [JQ,. Разбиение

М определено нс полностью. Задана лишь некоторая информация /0 о классах fir.

Объекты со задаются значениями некоторых признаков лг(, j = 1........N . Описание /(<о)

некоторого объекта со определяется совокупностью значений признаков х(> / = 1....N .

Задача распознавания состоит в том, чтобы указать для некоторого объекта со',

представленного на распознавание, его принадлежность к одному из классов

Д. i = 1.......m. Если введен способ оценивания близости отдельных частей описания

/(ft/) и соответствующих частей описаний |/ (ftJ°‘ )Ы'И} . то можно сформировать оценку ’’обобщенной близости" объекта со’ и множеств объектов J и |со°‘ |

соответственно:

г((<у) = ГП| -Г*, (3.1)

где Г*5, и Г" - значения соответств>тощих оценок близости.

Описания объектов представленных на распознавание, преобразовываются

алгоритмом распознавания из класса АВО в числовую матрицу {Г }(ы1 m - матрицу

оценок. Процедура преобразования включает два этапа:

a) вычисление оценок для объекта а)' по каждой из строк таблицы обучения;

b) вычисление агрегированных оценок для объекта со' по каждому из классов £1 таблицы обучения на основе оценок, вычисленных на 1-м этапе.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того, чтобы найти решение - получить результат распознавания - необходимо применить решающее правило к матрице оценок.

Процедура вычисления оценок Г (ft/) в АВО основана на подсчете числа

совпадений соответствующих различных частей (b,.........b, j описания I(со') и частей

(а, ...аг j описаний /(<у ) из таблицы обучения TN т, г = г , + 1...........г, i =1 ,т.

Эти частичные описания состоят из признаков х().........х, и использ>тотся в качестве

опорного множества Su е алгоритма из класса АВО ( S4 ).

Зададим некоторую систему опорных множеств S4 = (S,...........5,) на множестве

признаков < х,.......xN> и исключим из последнего некоторые признаки. Обозначим

усеченные описания как Sftj'.Srylt...,S<yr . Близость описаний Sco' и

Sco, устанавливается следующим образом: частичные описания Sco, = (а,...........а,) и

= (Ь,....Ь,) считаются подобными, если выполняются не менее б неравенств вида

|в; - Ь.| < ег ) = 1.<7, где f,.e^.S - порога близости.

Оценка близости объекта со' классу П. в целом имеет следующий вид:

Г(<у\П) =---------- X Z1») ( 3.2 )

ri г\ - 1 -s.es*'-г.-1

Класс АВО, в принципе, не налагает каких-либо офаничений на вил системы опорных множеств. Выбор системы опорных множеств должен отражать структуру конкретной задачи распознавания, природу, происхождение и характер исходных данных; в значительной мере этот выбор определяется знанием и пониманием пол ьзо вате л с м соответствующей предметной области. Важнейшим преимуществом класса АВО является возможность применять вычислительно эффективные формулы для подсчета оценок Г(й/.Г2,) для некоторых систем опорных множеств специального вида

[3].

4. ЭФФЕКТИВНЫЕ ФОРМУЛЫ ДЛЯ ВЫЧИСЛЕНИЯ ОЦЕНОК БЛИЗОСТИ В АЛГОРИТМАХ КЛАССА АВО ДЛЯ СЛУЧАЯ ЛОГИЧЕСКОГО ПРЕДСТАВЛЕНИЯ

СИСТЕМЫ ОПОРНЫХ МНОЖЕСТВ

При решении задач распознавания иногда заранее известно, что некоторые признаки наиболее важны, либо наиболее интересны, либо лучше других поддаются измерению. Это означает, что в определенных случаях систему опорных множеств алгоритма АВО можно задать “точно”. При этом появляется возможность включать в систему опорных множеств множества различной мощности, задавать допустимые и запрещенные комбинации признаков, избегать использования всех непустых опорных множеств и т.д.. В данном разделе демонстрируется, что АВО располагает эффективной формулой вычисления оценок близости для случая произвольной системы опорных множеств.

Теорема 4.1. Если система опорных множеств алгоритма АВО 5^ образована несколькими непересекающимися подмножествами множества признаков (х,.......xN )

S/4 =иS..S, f|5 =0.i *j (4.1 ) '

и

то

Г= (4.2)

и

где ГА (co',Qt) - оценка близости, полученная алгоритмом А, ГАи (со', fl) - оценка близости, полученная алгоритмом А для опорного множества Su.

Для вывода эффективной формулы вычисления оценок близости для случая произвольной системы опорных множеств необходимо ввести характеристическую булеву Функцию системы опорных множеств алгоритма и установить взаимно-однозначное соответствие между подмножествами множества признаков и вершинами единичного А-мерного булева куба.

Теорема 4.2. Если множество единиц характеристической булевой функции системы опорных множеств соответствует некоторому интервалу единичного N-мерного булева куба, то

ГК.О,) = —1— X (4.2)

Г| Г1-1 ы.'еО,

где (Ог - “активный ” объект из таблицы обучения ( постоянные части описаний таких объектов идентичны по используемому критерию близости ), г - число

неравенств вида |а(. — Ь;| й єі, 3 = 0, выполненных на переменных частях описаний.

Таким образом, система опорных множеств включает все признаки, входящие в ДНФ характеристической булевой функции без отрицания, не включает признаки, входящие в ДНФ характеристической булевой функции с отрицанием; опорные множества, содержащие и не содержащие остальные признаки, могут входить в систему опорных множеств АВО.

5. ЛОГИЧЕСКИЕ МОДЕЛИ ИЗОБРАЖЕНИЙ, ПРЕДСТАВЛЯЮЩИЕ ЛОКАЛЬНУЮ И ГЛОБАЛЬНУЮ ИНФОРМАЦИЮ ИЗОБРАЖЕНИЯ

Данный раздел посвящен методу построения модели изображения в форме ДНФ. Вначале определим ряд понятий, необходимых для описания метода и модели.

Определение 5.1.

2(1) = {1, <г>, <Я >, <Р >/,

где 2(1) - задача анализа изображений, I - заданное изображение, <і> - нача.аьные условия ( тип изображения, тип задачи, масштабные коэффициенты, семантические параметры, ... ), </?> - логические отношения и ограничения, <Р> - вычисляемый предикат ( “решение ” ).

Утверждение 5.1.

га) = г(ят*г(Рю,

где 2(ЯЯГ) - задача приведения заданного изображения к виду, удобному дм распознавания, 2(РЯ) - задача распознавания.

Определение 5.2. ИЯЕ-изображением называется формализованное описание изображения, допускаемое распознающим оператором.

Определение 5.3. Непроизводной задачей 2(ЯЯЕ) называется задача, решение которой обеспечивается применением некоторого допустимого дескриптивного преобразования.

Опреде.\ение 5.4.

0(1) = (/(Т)*$(1))'К/(2(1)),

где И(1) - некоторое дескриптивное преобразование, Б(1) - структурирующий элемент дескриптивного преобразования, К/(2(1) - ядро дескриптивного преобразования.

Утверждение 5.2. Любая 2(ЯЯЕ) допускает декомпозицию на последоватеяьность непроизводных ( эта посіедовательность образует траекторию решения задачи

приведения изображения к виду, удобному для распознавания ).

Рассмотрим метод приведения изображения к виду, удобному для распознавания, обеспечивающий построение ЛЛ/'-изображения в виде ДНФ-модели изображения. Такая модель допускается распознающим оператором АВО вида ( 4.2 ).

Опишем предлагаемый метод приведения изображения в виде стандартизированной алгоритмической схемы. Для получения ДНФ-модели изображения необходимо последовательно ( с учетом внутренних циклов ) применить к изображению преобразования класса ДЛТ-1:

выбор структурирующего элемента и его применение к анализируемому изображению;

задание логических переменных (непроизводных элементов изображения); обнаружение заданных нспроизводных элементов в локальных окрестностях изображения, выделенных с помощью структурирующего элемента (выполняется для всех локальных окрестностей изображения);

построение локального логического описания ( логического описания уровня 0 ) для фрагмента изображения ( логического описания локальной окрестности ) в форме элементарной конъюнкции ( выполняется для всех локальных окрестностей изображения );

задание узловых булевых функций ( логических описаний уровня 1 ) для набора смежных локальных окрестностей;

построение логического описания уровня 1 для фрагмента изображения, соответствующего выбранной конфигурации смежных локальных окрестностей, в форме ДНФ - дизъюнкции логических описаний уровня 0 ( выполняется для всех узловых булевых функций уровня 1 );

минимизация узловых булевых функций уровня 1 ( выполняется для всех узловых булевых функций уровня 1 );

задание узловых булевых функций ( логических описаний уровня 2 ) для наборов смежных фрагментов изображения, описываемых узловыми булевыми функциями уровня 1);

построение логического описания уровня 2 для фрагмента изображения, соответствующего выбранной конфигурации смежных] фрагментов изображения, описываемых узловым)! булевыми функциями уровня 1), в форме ДНФ - ДИЗЪЮНКЦИИ логических описаний уровня 1 ( выполняется для всех узловых булевых функций уровня 2 );

минимизация узловых булевых функций уровня 2 ( выполняется для всех узловых булевых функций уровня 2 );

выполнение шагов (8-10 ), обеспечивающих построение логических описаний фрагментов изображения высших уровней в форме ДНФ;

построение логического описания в форме ДНФ для изображения в целом; минимизация логического описания изображения - построение логической модели изображения в форме сокращенной или минимальной ДНФ.

Проиллюстрируем применение метода на простом примере. Рассмотрим изображение, содержащее простые геометрические объекты нескольких типов ( окружности, треугольники, многоугольники и т.п. ) ( Рис. 5.1 ). Выберем в качестве

структурирующего элемента Б(1) решетку с квадратными ячейками и определим ядро дескриптивного преобразования К/(2(1) как конъюнкцию ( для нулевого уровня ) и как ДНФ ( для высших уровней логической пирамиды описаний ).

Рассмотрим применение схемы шаг за шагом.

Шаг 1. Выбор структурирующего элемента ( Рис. 5.1 ).

Шаг 2. Наложение структурирующего элемента на изображение ( Рис. 5.1 ).

Шаг 3. Задание логических переменных - непроизводных элементов изображения ( Рис. 5.1 ) _____

х, О О; х2 О А; х3 <=>0,Д.

Шаг 4. Определение наличия непроизводных элементов, соответствующих заданным логическим переменным , в локальных окрестностях изображения, выделенных с помощью структурирующего элемента ( Рис. 5.1 ).

Шаг 5. Построение моделей уровня “0” , определяемых логическими функциями /,°.../,° ( элементарные конъюнкции ), для всех локальных окрестностей изображения (

Рис. 5.1 ): /,° = Х,Х2Х3; /2° = х,х2х3; /з° = х,х2х3; /4° = Х1Х2Х3

/5° = х,х2х3; /б" = х,х2х3; /7° = х,х2х3; /8° = Х1Х2Х3

/9° = х,х2^}; ■МО = х,х2х3; /,1° II *1 ы*' X Ч>1 /° = Х1Х2Х3

/,? = х^хз; /° ■'14 = х,х2х3; /,5° = х,х2х3; /° ■»1б = Х1Х2Х3

Шаг 6. Задание узловых логических функций уровня “1” , определяющих

модели уровня “1” ( Рис. 5.2 ):

/1 _ /0. /• _ /0 /1 _ ! 0 /1 г 0

/] — V }, . /г - V }, . п ~ V 1, ; /4 — V т,

‘ = 1.2.5.6 I =2,3.6.7 (=3.4.7.8 1 = 5.6.9.10

А’ = V /Л/б* = V = V /Л/е’ = V /Л/’ = V /Л

1 = 6.7,10.11 1=7.8.11.12 1 = 9.10.13.14 1 = 10.11.14.15 1 = 11,12.15.16

Шаг 7. Построение ( в том числе минимизация ) моделей изображения уровня “1” в форме ДНФ:

/1’ = х з; /\ = *1*2Х3 х1*2! Л* = Х1Х2Х3 V *1*2* 31/4’ = Х1Х2Х3 У Х1Х2 V Х1Х2Х31

Д1 = *1*2 У х1х2хз:/б = Х1Х2 V Х1Х2Х3 Ч/ Х1Х2Х3:Л' = Х1Х3 V х1х2хз:/в =

= х,х2х} vx1X2XJ;/9, =Х2Х3.

Шаг 8. Задание узловых логических функций уровня “2” /,2...................../42, определяющих

модели уровня “2” ( Рис. 5.2 ):

Шаг 9. Построение ( в том числе минимизация ) моделей изображения уровня “2” в форме ДНФ:

/,2 = х, V ху V х,х2хз;/,2 = х2 V х,х2 V х,х2х};/з2 = х, V х,х3;/42 = х, V х2хг V х,х2х3

Шаг 10. Задание узловых логических функций уровня “3” /,\/23, определяющих

модели уровня “3” ( Рис. 5.2 ):

/ 3 _ * 12, / 3 _ г\

*1 ~ V /( > *2 ~ V *1 •

1 = 1 1 = 1.3.7.9

Шаг 11. Построение ( в том числе минимизация ) моделей изображения уровня “3” в форме ДНФ ( в данном примере модели уровня “3” определяют модель изображения в целом и данный шаг схемы является завершающим:

/,3 = х, V х2 V х3; /23 = х3 V х,х2х? V х)х2х3.

Построенная модель изображения отражает информацию о содержании и структуре изображения и допускается распознающим оператором АВО. Конъюнкции, входящие в состав ДНФ-модели изображения, могут использоваться для задания опорных множеств алгоритма.

'I, {' ■ N

'г 2 ' 1, О . Гм IIО

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г, * По

Г 1 7 1 /'' ' 8 1,

Рис. 5.1 Рис, 5.2

6. ЗАКЛЮЧЕНИЕ

Из полученных результатов следует, что и построение эффективной формулы, моделирующей работу распознающего оператора АВО для случая произвольного задания системы опорных множеств алгоритма, и синтез ДНФ-модели изображения, и задание компактной системы опорных множеств связаны с задачей построения кратчайшей ортогональной ДНФ или с задачей синтеза такой ДНФ, в которой каждый интервал имеет небольшое число пересечений с соседними. Для построения соответствующей простой

формулы можно рекомендовать следующий метод, идея которого раскрывается на примере построения эффективной формулы для распознающего оператора.

1) по системе опорных множеств алгоритма строится

характеристическая булева функция;

2) с помощью одного из приближенных методов синтезируется достаточно простая ортогональная ДНФ характеристической функции алгоритма;

3) если получение ортогональной ДНФ приемлемой сложности

оказывается возможным, то по ней строится эффективная формула для реализации распознающего оператора; сложность формулы прямо пропорциональна числу элементарных конъюнкций в ортогональной ДНФ;

4) в тех случаях, когда ни кратчайшей, ни сравнительно простой

ортогональной ДНФ получить не удается, применяется приближенный метод синтеза, обеспечивающий минимизацию числа взаимных пересечений

интервалов, входящих в покрытие системы опорных множеств;

5) если это число действительно оказывается небольшим, по полученной ДНФ синтезируется эффективный распознающий оператор; сложность оператора показательно зависит от числа взаимно неортогональных пар элементарных конъюнкций и ДНФ;

6) если и последняя ДНФ оказывается весьма сложной, следует считать, что данный метод не позволяет построить простой эффективный распознающий оператор в классе АВО.

Методы и алгоритмы, изложенные в работе, являются примерами практического вклада ДПИ в разработку проблемы понимания изображений. Показано, что формальную модель изображения можно строить в виде ДНФ-описания. Этот результат существенен с точки зрения эффективности процедур распознавания изображений, поскольку было также показано, что возможность выделения эффективного подкласса АВО связана с представлением системы опорных множеств алгоритма с помощью простой ортогональной ДНФ.

Заметим также, что рассмотренную стандартизованную схему синтеза логической модели изображения следует считать лишь первым шагом на пути разработки системы стандартизированных схем, обеспечивающих синтез моделей изображения на основе дескрипторов иной математической природы.

ЛИТЕРАТУРА

1 I.B.Gurevitch. The Descriptive Framework for an Image Recognition Problem // Proceedings of The 6th Scandinavian Conference on Image Analysis (Oulu, June 19 - 22, 1989): in 2 volumes: V.

1 . Partem Recognition Society of Finland. 1989, pp. 220 - 227.

2. I.B.Gurevitch. Descriptive Technique for Image Description, Representation and Recognition // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications in the USSR. 1991, v.l, N 1. pp. 50 - 53.

3. Yu.I.Zhuravlev, I.B.Gurevitch. Pattern Recognition and Image Recognition // Pattern Recognition and Image Analysis: Advances in Mathematical Theory and Applications in the USSR. 1991, v.l, N 2, pp. 149 - 181.

4. Ю.И.Журавлев. Об алгеоранческом подходе к решению задач распознавания и классификации. - В кн. Проблемы кибернетики. Вып. 33. - М.: Наука, 1978, с. 5 - 68.

ВНИМАНИЮ ЧИТАТЕЛЕЙ!

Международный центр научной и технической информации принимает подписку на Международный научно-практический журнал

ПРЕДПРИНИМАТЕЛЬСТВО. ОКРУЖАЮЩАЯ СРЕДА» /ЭПОС/

№1(4), 2(5)

: ;

ECONOMICS. ENTREPRENEURSHIP. ECOLOGY" "WIRTSCHAFT. UNTERNEHMEN. UMWELT"

Главный редактор: академик D.П. Можин

Важность издания такого журнала определяется тем, что до настоящего времени проблемы эффективного и устойчивого развития экономики, проблемы активизации предпринимательской деятельности и проблемы окружающей среды рассматривались, изучались и освещались в печати изолированно, вне их теснейшей взаимосвязи. Вследствие этого страдали все указанные направления общественного развития.

Главной задачей журнала как раз и является научное обоснование необходимости комплексного, взаимоувязанного рассмотрения этих проблем, содействие интеграции экономики, предпринимательства и экологии в единую метасистему общественного развития и поиск путей оптимального управления этой сложной системой.

Журнал "ЭПОС" способствует обмену деловой информацией между российскими и иностранными предпринимателями, учеными и специалистами в области консалтинга. Гарантией этого является мощный теоретический и научно-практический потенциал основных учредителей журнала - Академии экономических наук и предпринимательской деятельности России и Комиссии по изучению производительных сил и природных ресурсов РАН.

Издается с 1993 года.

Цена одного номера 3 USD или эквивалент в рублях по курсу ЦБ РФ

на момент оплаты.

Заказы принимаются по адресу:

Россия. 125252, Москва, ул. Куусинена, 216, МЦНТИ. Сектор организации, подготовки и распространения изданий. Телекс 411925 МСЫТ1. Факс (095) 9430089. Телефоны для справок: 198-72-10, 198-73-41.

i Надоели баннеры? Вы всегда можете отключить рекламу.