Научная статья на тему 'Проблема распознавания изображений'

Проблема распознавания изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
734
97
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Путятин Евгений Петрович

Доклад на торжественном собрании научной общественности ХНУРЭ 2 ноября 2001 года, посвящённом 75-летию со дня рождения академика НАН Украины Владимира Логвиновича Рвачева.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблема распознавания изображений»

чение такой модели - очень сложная проблема из-за невозможности описания не только характеристик создаваемой системы, ее отдельных компонентов, последовательности выполняемых работ на каждом этапе проектирования, получаемых технических решений, но и описания функций разработчиков, применяемых методологий, технологий, методов, инструментальных средств. Для реализации указанной проблемы используются два способа исследований, позволяющих достичь желаемого результата. Первый предусматриваетдекомпозицию проблемы, объекта на отдельные фрагменты с определением не только фрагментов, но и связей между ними. Естественно, для получения математической модели описания жизненного цикла использование методов и инструментальных средств при создании системы крайне затруднительно и возможно применение для отдельных не связанных фрагментов. Поэтому наиболее приемлемым является второй способ, а именно категорно-функторный, подразумевающий проецирование создаваемой системы на “родственные” ей системы и по свойствам проекций (отображений) устанавливающий внутреннюю структуру элементов ее жизненного цикла в виде категорий. Наличие категорий элементов цикла дает возможность получить математическую модель проектирования системы в виде композиции функторов. Фактически такая математическая модель описывает процесс создания сложной информационной системы на макроуровне. Однако дальнейшее уточнение модели, подразумевающее определение объектов в виде структурированных множеств и морфизмов между ними, с последующей разработкой соответствующих алгоритмов, позволяет перейти от макропроектирования к микропроектированию. Это в определенной мере дает возможность формализовать указанную проблему и снизить потери по используемым ресурсам, так как имеется возможность от концептуального проектирования перейти к физическому путем моделирования данного процесса. На основе категорно-фун-кторной модели имеется возможность построить имитационную модель процесса проектирования, подразумевая задание цели, функций, ограничений и получение параметров создаваемой системы в виде результатов от реализуемых функций.

Однако физическое проектирование будет эффективным при применении типовых проектных решений в рамках применяемых информационных технологий. Применение индустриальной информаци-

УДК 681. 007.05:51

ПРОБЛЕМА РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ

ПУТЯТИН Е.П.

Доклад на торжественном собрании научной общественности ХНУРЭ 2 ноября 2001 года, посвящённом 75-летию со дня рождения академика НАН Украины Владимира Логвиновича Рвачева.

За полувековой период достигнуты фантастические результаты вычислительной техники. Это достижения в области микроминиатюризации, сетевых техноло-

онной технологии SSADM (Structured System Analysis and Design Method) регламентирует и поддерживает стадии предпроектных исследований и проектирования информационной системы. Модель SSADM представлена набором иерархических схем, описывающих модули, стадии и этапы. Применение CASE-технологий в виде гибкого инструментария позволяет скорректировать процесс проектирования при изменении внешних условий. Однако данные технологии, используемые программные средства, пакеты не полностью покрывают все стадии проектирования ИС. Кроме того, приобретение, освоение современных зарубежных программных средств требует значительных финансовых, трудовых и временных ресурсов. Существующие стандарты на разработку информационных систем, а именно ЕОСТ 34.000-90 и руководящие документы РД 50-89, определяют перечень рабочих документов проектирования, но не содержат ответов на вопросы ЧТО и КАК делать, с КЕМ и КАК взаимодействовать в процессе проектирования, ставя в трудное положение разработчиков.

Поэтому в настоящее время процесс разработки и проектирования сложных систем требует решения ряда проблем: разработка и совершенствование существующих технологий создания ИС; разработка методик макро- и микропроектирования, покрывающих жизненный цикл ИС; совершенствование существующих и разработка соответствующих инструментальных средств поддержки процессов проектирования (отсутствуют инструментальные средства поддержки разработки математического комплекса ИС); доработка стандартов по проектированию ИС (ЕОСТ 34); разработка методов, моделей по прогнозированию параметров создаваемой системы; оценка затрат на соответствующих этапах ЖЦ ИС; разработка формализованной модели описания ЖЦ ИС и отдельных его этапов; разработка показателей создаваемой ИС и методики их оценки.

Решение данных проблем позволит перейти от индивидуализации создания сложных информационных систем к стандартным, типовым проектным решениям, что существенно сэкономит используемые ресурсы и сократит сроки их проектирования.

Поступила в редколлегию 12.11.2001

Левыкин Виктор Макарович, д-р техн. наук, профессор, заведующий кафедрой информационно-управля-ющих систем ХНУРЭ. Адрес:Украина, 61166, Харьков, пр. Ленина, 14.______________________________

гий, машинной графики, мультимедийных возможностей, не говоря о быстродействии и объемах памяти. Однако успехи в области компьютерного зрения и слуха являются несоизмеримыми и представляются куда более скромными. Этот дисбаланс становится всё нетерпимее в условиях возрастания потребностей в создании интеллектуальных систем, снабжённых зрением и слухом и конкурирующих с возможностями человека, тем более что с инженерной стороны особых проблем нет: современные видео- и цифровые камеры по разрешающей способности вполне сопоставимы с сетчаткой глаза. Проблема - в отсутствии универсальных математических моделей и алгоритмов обработки и распознавании изображений, сравнимых по возможностям с интеллектом человека.

РИ, 2001, № 4

9

Прежде чем распознать изображение, необходимо его выделить или, как говорят, сегментировать. Сегментация как процедура поиска однородных, например, по яркости, цвету или текстуре, областей весьма трудная и до конца не решённая задача. Для конкретных задач разработаны частные методы: на базе пороговых различий в яркости (если они стабильные), путём учета связности соседних отчётов при наличии устойчивой пространственной корреляции изображений (методы центроидного связывания, слияния-расщепления, водоразделов), на базе анализа контуров, если они достаточно чёткие. Для сегментации путём выявления регулярных свойств повер-хностей(текстур) применяют статистические мето-ды(на базе матриц совпадений) и структурные (на базе мозаик Вороного). Особый интерес представляет использование информации о цвете, причём более эффективной оказывается сегментация в цветовой системе: тон, насыщенность, светлота, которая соответствует зрению человека, чем в энергетической системе каналов красного, зелёного и синего цветов.

Выделенные изображения подлежат распознаванию (возможно, после проведения процедур улучшения или реставрации). Наиболее надежно эта задача решается сравнением входных изображений с эталонами (группа корреляционных методов), а наиболее быстро — сравнением их признаков. Непреодолимые трудности возникают, если входные изображения поступают на вход в изменённом ракурсе, повёрнутые или с разными масштабами. Тогда признаковые методы становятся ненадёжными, а корреляционные — нереализуемыми ввиду огромного количества вычислений.

В таких ситуациях, типичных для систем технического зрения транспортных роботов, телевизионных следящих систем и т.д., на помощь приходят методы нормализации, когда вначале определяются неизвестные параметры преобразований (искажений) входных изображений, затем путём нормализации они приводятся к стандартному (эталонному) виду, после чего происходит их распознавание сравнением с эталонами или их признаками.

В простейшем случае контурных или силуэтных изображений (фигур) задачи нормализации могут трактоваться как обратные задачи геометрии. Например, найти три точки преобразованного изображения, чтобы аффинные преобразования привести к стандарту или по четырём точкам идентифицировать проективные преобразования. Трудности решения задач нормализации неизмеримо возрастают для полутоновых и цветных изображений.

УДК 519.7

АЛГЕБРАИЗАЦИЯ ЛОГИКИ КАК

КАТАЛИЗАТОР

ИНФОРМАТИЗАЦИИ

ШАБАНОВ-КУШНАРЕНКО Ю.П._____________

Доклад на торжественном собрании научной общественности Харьковского национального университета радиоэлектроники 2 ноября 2001 года, посвященном 75-летию со дня рождения академика НАН Украины Владимира Логвиновича Рвачева.

10

Например, для цветного изображения понятие контур не вкладывается в известную схему превышения некоторого порога яркости на участках повышенного градиента. Нет рациональных процедур свертки каналов красного, зеленого и синего для получения контура с минимальными погрешностями. Основной инструмент пространственного дифференцирования оказывается в этом случае малоэффективным.

Для сложных преобразований изображений разумным подходом к их нормализации является метод декомпозиции. Вначале были изучены методы построения нормализаторов для простых преобразований: параллельных смещений, поворотов, изменений масштабов, косых сдвигов, зеркальных отображений, перспективы, центрального проектирования. Оказалось, что для базовых преобразований существует много подходящих нормализаторов, отличающихся между собой трудоёмкостью в реализации, помехозащищённостью, наконец, применимостью в конкретных технических системах. При сложных преобразованиях не все базовые нормализаторы пригодны для использования. Возникла проблема синтеза сложных нормализаторов из простых. Неоценимую помощь в решении этой задачи оказал аппарат теории групп и их представлений, позволивший с единых позиций взглянуть на простые и сложные преобразования и выработать условия синтеза. Возникли новые понятия координатных и следящих нормализаторов, а также параллельной, последовательной и смешанной процедур. Методы распознавания, основанные на нормализации, представляются наиболее универсальными и продуктивными для изображений произвольного вида.

Таким образом, на основе естественной иерархичности процедуры распознавания, а также с учетом зависимости конечного результата (качества распознавания) от эффективности промежуточных этапов получена относительно универсальная схема распознавания. На первом этапе применяются наименее трудоёмкие признаковые алгоритмы для решения задачи о неэквивалентности изображений и эталонов. На втором этапе оставшиеся изображения подвергаются нормализации. На третьем — нормализованные изображения классифицируются одним из конструктивных способов.

Поступила в редколлегию 12.11.2001

Путятин Евгений Петрович, д-р техн. наук, профессор, зав. каф. информатики ХНУРЭ, засл. деят. науки и техники Украины. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-94-19 (раб.)

Первая научно-техническая революция содействовала усилению физических возможностей человека за счет создания механизмов и машин. Она потребовала интенсивного изучения внешнего по отношению к человеку физического мира и развития числовой математики. Вторая научно-техническая революция призвана содействовать усилению интеллектуальных возможностей людей путем совершенствования искусственного интеллекта. Она требует объективного изучения внутреннего психологического мира человека и развития математики интеллекта, в роли которой выступает логическая математика.

РИ, 2001, № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.