Научная статья на тему 'Особенности обработки изображений в информационных системах'

Особенности обработки изображений в информационных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
243
50
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Щепилов Е. В., Валенбахова Ю. В., Гончарова Н. П.

В работе рассматриваются особенности обработки изображений в современных информационных системах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Щепилов Е. В., Валенбахова Ю. В., Гончарова Н. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Особенности обработки изображений в информационных системах»

Список литературы:

1. Тихоненков В.А. Температурные погрешности тензорезисторных датчиков и методы их компенсации: учеб. пособие для студентов спец. 19.03 и 55.15 / В.А.Тихоненков, А.И. Тихонов; Гос. ком. Рос.Федерации по высш. образованию. Ульянов. гос. техн. ун-т. - Ульяновск: УлГТХ 1996. - 148 с.

2. Годзиковский В.А. Метрологические характеристики тензорезисторных датчиков силы общепромышленного назначения и для весовой техники. - М.: ЦНИИТЭИ приборостроения, 1983. - 51 с.

3. Осадчий Е.П. Проектирование датчиков для измерения механических величин / Под общ. ред. Е.П. Осадчего. - М.: Машиностроение, 1979. - 480 с.

4. Ренне В.Т. Электрические конденсаторы. - изд. 3-е, перераб. - Ленинград: Энергия, 1969. - 592 с.

5. Справочник по электротехническим материалам. Т. 2 / Под ред. Ю.В. Корицкого, В.В. Пасынкова, Б.М. Тареева. - изд. 2-е, перераб. - М.: Энергия, 1974. - 583 с.

ОСОБЕННОСТИ ОБРАБОТКИ ИЗОБРАЖЕНИЙ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

© Щепилов Е.В., Валенбахова Ю.В., Гончарова Н.П.

Воронежский институт высоких технологий, г. Воронеж

В работе рассматриваются особенности обработки изображений в современных информационных системах.

Трудно найти другую сферу инженерной деятельности, успехи в которой за полувековой период были бы сравнимы с достижениями в области вычислительной техники. Это, прежде всего, фантастические результаты в области роста быстродействия компьютеров, объемов оперативной и внешней памяти, микроминиатюризации, сетевых технологий, распределенных баз данных, машинной графики и мультимедийных систем.

Тем не менее, достижения в области компьютерного зрения и слуха являются несоизмеримыми и представляются куда более скромными. Этот дисбаланс становится все более нетерпимым в условиях возрастания потребностей в создании интеллектуальных систем, снабженных зрением и слухом и приближающихся по возможностям к человеку. В развитых странах наметился значительный рост публикаций и финансирования в направлении ликвидации этого противоречия.

Все большее распространение получили системы автоматизированного ввода информации через различные типы сканеров (ручные, листовые, барабанные, графические планшеты, дигитайзеры, факс-модемы), а также цифровые фото- и видеокамеры. При этом по разрешающей способности

такие системы ввода вполне приближаются к зрению человека или животных, а с учетом быстродействия ближайшей технической моделью глаза, очевидно, являются видео- и цифровые фотокамеры. Так матрица цифровой фотокамеры обеспечивает разрешение десятки мегапикселей на кадр, а современным высокопроизводительным компьютерам вполне доступна несложная обработка в реальном масштабе времени, например, пространственная плоско-параллельная корреляция.

Тем не менее, возможности интеллектуального анализа изображений с помощью компьютеров оставляют желать большего. Необходимость углубленной их обработки и распознавания требуют, по крайней мере, две области технических приложений; робототехника и экспертные системы. Промышленные роботы, снабженные компьютерным зрением позволяют сравнительно быстро к дешево производить переналадку производства на выпуск новой продукции, а транспортные роботы благодаря зрению обеспечивают надежную ориентацию в пространстве. Экспертные системы, опирающиеся на базы данных, включающие изображения, для поиска и распознавания заданных объектов требуют быстрого и надежного анализа оцифрованной видеоинформации в специализированных архивах изображений либо в базах Интернет.

Какие возможности предлагают современные стандартные программные средства в этой области? Наиболее распространенные пакеты растровой и векторной графики (Adobe Illustrator, Photo Shop, Corel Draw, Corel Photo Paint, 3D Studio Max, Maya и др.) обладают мощными средствами создания изображений, в том числе объемных и динамических, однако, обработка ограничивается фактически подавлением случайных помех и муа-ров с помощью ограниченного набора фильтров (типа сглаживающих и медианных). Значительного прогресса достигла обработка документов со сканера.

Таким образом, успехи по распознаванию букв и цифр в документах и текстах впечатляют, также как и другие значительные достижения по анализу изображений специального вида (например, распознавание треков ядерных частиц, идентификация автомобилей-нарушителей по фотоснимкам, анализ и распознавание сигналов в медицине и геологии). Однако, универсальных методов обработки изображений, сравнимых по эффективности с интеллектуальными возможностями человека, еще не найдено, что стимулирует активную деятельность ученых в этом направлении [1, 2].

Обработка изображений с целью их распознавания является одной из центральных и практически важных задач при создании систем искусственного интеллекта.

Проблема носит явно выраженный комплексный иерархический характер и включает ряд основных этапов: восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание. Такой важный обязательный этап как понимание (интерпретация) изображений включается частично в этап сегментации и окончательно решается на этапе распознавания.

Основным элементом любой задачи распознавания изображений является ответ на вопрос: относятся ли данные (входные) изображения к классу изображений, который представляет данный эталон? Казалось бы, ответ можно получить, сравнивая непосредственно изображение с эталонами (или их признаки). Однако возникает ряд трудностей и проблем, специфических, в особенности, при создании систем технического зрения (СТЗ):

- изображения предъявляются на сложном фоне;

- изображения эталона и входные изображения отличаются положением в поле зрения;

- входные изображения не совпадают с эталонами за счет случайных помех;

- отличия входных и эталонных изображений возникает за счет изменения освещенности, подсветки, локальных помех;

- эталоны и изображения могут отличать геометрические преобразования, включая такие сложные как аффинные и проективные.

Для решения задачи в целом и на отдельных ее этапах применяются различные методы сегментации, нормализации и распознавания.

Операция предобработки применяется практически всегда после снятия информации с видеодатчика и преследует цель снижения помех на изображении, возникших в результате дискретизации и квантования, а также подавления внешних шумов. Как правило, это операции усреднения и выравнивания гистограмм.

Сегментация обычно понимается как процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный до конца для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур.

При существовании стабильных различий в яркостях отдельных областей поля зрения применяются пороговые методы. Метолы наращивания областей эффективны при наличии устойчивой связности внутри отдельных сегментов. Метод выделения границ хорошо применять, если границы достаточно четкие и стабильные. Перечисленные методы служат для выделения сегментов по критерию однородных яркостей. Заметим, что один из самых эффективных методов наращивания областей предполагает выбор стартовых точек либо с помощью оператора (алгоритм центроидного связывания), либо автоматически. Эффективным здесь представляется метод водоразделов, основанный на поиске локальных минимумов с последующей группировкой вокруг них областей по связности.

Все методы весьма приемлемы с точки зрения вычислительных затрат, однако, для каждого из них характерна неоднозначность разметки точек в реальных ситуациях из-за необходимости применения эвристик (выбор порогов совпадения яркостей, выбор цифровых масок и т.д.). Заслуживает

внимания в связи с этим предложенный метод многозначной разметки, основанный на комбинации различных приемов для снижения неопределенности. Важное практическое значение имеют допускающие параллельную обработку алгоритмы ускорения процесса разметки на основе логического анализа соседних элементов.

Список литературы:

1. Handbook of pattern recognition and computer vision / Chen C.H., Rau L.F. and Wang P.S.P. (eds.). - Singapore; New Jersey; London; Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. - 984 p.

2. Shalkoff R.J. Digital image processing and computer vision. - New York; Chichester; Brisbane; Toronto; Singapore: John Wiley & Sons, Inc., 1989. - 489 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.