Распознавание и обработка графических изображений для передачи в телекоммуникационных системах

Лялин В.Е.; Титов В.А.; Пивоваров И.В.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дворкович А. В., Дворкович В. П., Мохин Б. Н. Единые принципы сжатия цветных динамических изображений различного разрешения // Цифровая обработка сигналов. 1999. №1.

2. Цифровая обработка телевизионных и компьютерных изображений / Под. ред. Ю. Б. Зубарева, В. П. Дворковича. -М.: МЦМТИ, 1997.

3. Радченко Ю. С., Радченко М. Ю. Оптимальные быстрые алгоритмы представления изображений в базисе ортогональных полиномов // Тр. I Междунар. конф. «Цифровая обработка сигналов и ее применения» Б8РЛ’98. -М.: 1998. Т. III.

4. Радченко Ю. С., Кожин А. Ю., Радченко М. Ю. Обнаружение и оценка параметра сдвига сжатых с помощью ортогональных полиномов сигналов // Радиотехника. 1999. №6.

5. Ермоленко Т., Шевчук В. Алгоритмы сегментации с применением быстрого вейвлет-преобразования // Статьи, принятые к публикации на сайте международной конференции Диалог’2003. www.dialog-21.ru.

6. Васильева Л.Г., Жилейкин Я.М., Осипик Ю.И. Преобразования Фурье и вейвлет-преобразование. Их свойства и применение // Вычислительные методы и программирование. 2002. №2.

7. Залманзон Л.А. Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях. _М.: Наука, 1989.

8. Дзядык В.К. Об эффективном построении многочленов, которые осуществляют близкое к наилучшему приближению функций ех, 8тх и др. //УМЖ. 1973. Т.25. №4.

9. СэломонД. Сжатие данных, изображений и звука. -М.: Техносфера, 2004.

В.Е. Лялин, В.А. Титов, И.В. Пивоваров

РАСПОЗНАВАНИЕ И ОБРАБОТКА ГРАФИЧЕСКИХ ИЗОБРАЖЕНИЙ

ДЛЯ ПЕРЕДАЧИ В ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМАХ

Бурное развитие телекоммуникационных систем привело к резкому расширению возможностей получения, хранения и обработки информации. Одной из наиболее удобных форм представления информации являются графические образы, или графические изображения (ГИ). Очевидно, что насколько бы ни расширялись возможности интеллектуальных телекоммуникационных платформ, всегда возникает потребность оперирования объектами большего объема, чем эти платформы могут обеспечить.

В настоящее время наиболее узким звеном для передачи графической информации являются цифровые каналы связи: их пропускная способность ограничивает возможности быстрой передачи больших объемов информации за короткое время передачи. Кроме того, достигнутые результаты в области цифровых методов представления и сжатия изображений, тем не менее, не решают в полной мере задачу их эффективного представления, что делает поиск эффективного представления изображений актуальным. Одним из путей ее решения представляется разработка интеллектуальных технологий обработки изображений, обеспечивающих не формализованное их кодирование, а распознавание их пространственной структуры, которая и является носителем заключенной в них информации, поскольку возможности извлечения полезной информации из изображений целиком и полностью определяются их пространственно-структурными свойствами и характеристиками.

Изображения являются трудными для анализа объектами ввиду неограниченной сложности их структуры и высокой степени изменчивости - разнообраз-

ных и трудноконтролируемых трансформаций и искажений, возникающих в процессе их формирования.

Одним из методов, позволяющих эффективно решать задачу анализа структуры ГИ, является метод центроидной фильтрации, разработанный в работах [1,2,4,5]. Представленные в них результаты применения метода центроидной фильтрации показывают высокую эффективность метода, но оставляют открытыми вопросы построения методики определения настраиваемых параметров цен-троидного фильтра и учета факторов искажений изображений, влияния шумов и помех и таких интегральных характеристик ГИ, как плотность размещения структурных элементов (СЭ) и их контекстных взаимосвязей. Поэтому представляет интерес исследование свойств центроидного преобразования с целью обеспечения максимальной эффективности его применения для анализа структуры ГИ. Само центроидное преобразование основано на использовании так называемых пространственно-структурных параметров (ПСП) - функционалов специального вида, построенных таким образом, что бы их значения явным образом зависели от параметров преобразований, действующих в трактах формирования и регистрации изображений.

Центроидное преобразование изображений заключается в построчном и постолбцовом сканировании растра изображения скользящим интервалом заданной длины. В каждом положении интервала вычисляются значения ПСП, которые связываются со средней точкой интервала.

В результате формируется три пары производных изображений (в каждой паре - изображения, полученные при «горизонтальном» и «вертикальном» сканировании растра скользящим интервалом): изображения масс АГ(х,у), АВ(х,у); изображения центроидов, СГ(х,у), СВ(х,у); изображения диссипаций НГ(х,у), НВ(х,у). Изображения центроидов модифицируются следующим образом:

СГ О» = И 5 (х - Сг О» ) • 5(у)йхйу; СВ (?,») = Л 5 ( х) • 5(у - Св (?, »))^у, где интегрирование производится по всему полю изображения. Результатом цен-троидного преобразования изображения являются шесть производных изображений АГ(х,у), АВ(х,у), С Г(х,у), С В(х,у), НГ(х,у), НВ(х,у), которые являются исходным материалом для последующего анализа структуры изображения. В силу свойств ПСП, полученные производные изображения позволяют наиболее эффективно обнаружить и распознать элементы структуры исходного изображения. Это обусловлено тем, что значения ПСП на выходе центроидного фильтра проявляют селективные эффекты по отношению к СЭ изображения. Действие этих эффектов показано на рис. 1. Из рисунка видно, что при прохождении скользящим интервалом импульса, соответствующего в сканограмме СЭ, значения всех ПСП стабилизируются в некоторой точке фиксации, которая под воздействием шумов и помех размывается в кластер. Размеры этого кластера - группы объектов с общими признаками - могут быть оценены величиной среднеквадратического отклонения (СКО). Поэтому последующая обработка может заключаться в задании порога обнаружения линий на изображениях центроидов и оценке характеристик этих линий по значениям масс и диссипаций. При этом указанная выше модификация центроидных изображений обеспечивает накопление веса обнаруживаемых центроидов импульсных сигналов (соответствующих сечениям линий на изображении) при перемещении скользящего интервала (рис. 1).

Как показали результаты экспериментального исследования, пороговая схема распознавания проявляет низкую устойчивость по отношению к помехам и шумам, поскольку под воздействием шумов и помех происходит распределение накапливаемых весов центроидов по области, окружающей точку фиксации, т.е. точка фиксации «размывается» в кластер.

Рис.1. Проявление селективного эффекта центроидного фильтра по отношению к структурным элементам изображения

Поскольку веса в этих точках принимают значения, меньшие значения веса в самой точке фиксации (приблизительно во столько раз, во сколько раз растиражировалась точка фиксации по кластеру), то пороговая схема обнаружения будет срабатывать только при низких значениях порога. Уменьшение величины порога приводит к тому, что вероятность ложного распознавания элементов структуры возрастает, поскольку шумы и помехи как бы «просачиваются» сквозь пороговый детектор. Даже при низком уровне шумов, не препятствующих нормальному визуальному восприятию элементов ГИ, ошибки распознавания настолько велики, что в синтезированном изображении различить эти элементы на фоне возникающих шумоподобных структур становится не всегда возможным. Поэтому более целесообразной представляется схема распознавания, основанная на разделении кластеров и определении включенности значений ПСП в эти кластеры. Реализация этой схемы требует априорного определения местоположений и размеров кластеров в пространстве значений ПСП. Местоположение кластеров есть математическое ожидание соответствующих значений ПСП, а размеры определяются величиной СКО. Величина математического ожидания может быть рассчитана с помощью соотношений для базовых элементов структуры изображений либо определена путем прямых вычислений на фрагментах изображений, содержащих эти элементы. С точки зрения практической реализации последний способ наиболее предпочтителен, так как предполагает прямое определение местоположений кластеров по фрагментам реальных изображений, которые не всегда поддаются аналитическому описанию в форме базовой модели.

В частности, для некоррелированного аддитивного гауссова шума вычисленные размеры кластеров определяются среднеквадратическими отклонениями, которые являются функциями величины среднеквадратического отклонения шума и шага дискретизации растра. Задача оценки размеров кластеров для коррелиро-

ванных шумов значительно сложнее. И проблема здесь состоит в том, что определение характера корреляций требует предварительного исследования свойств этих шумов, что на практике не всегда возможно. Поэтому более целесообразным здесь представляется принятие решений о принадлежности к кластерам путем сравнения расстояния в пространстве ПСП между центром кластера и текущими значениями ПСП при каждом фиксированном положении скользящего интервала. Таким образом, воздействие шумов и помех учитывается при распознавании в оценках размеров кластеров. Влияние регулярных пространственно-частотных искажений также учитывается путем корректировки величин ПСП структурной детали изображения в соответствии с выражениями их значений для свертки /1(')*/2(). При наличии

свойства консервативности системы формирования и регистрации изображений и при несмещенности центроида ее импульсного отклика учет пространственночастотных искажений сводится к аддитивной коррекции величины диссипации.

Для повышения надежности процедур анализа пространственной структуры изображений, для обеспечения улучшения качества изображений был разработан метод обработки изображений, основанный на адаптивном цветотоновом преобразовании (АЦТП) [1,3,4,6,7,8], которое позволяет произвести цветовую стратификацию изображений, что дает возможность их эффективного кодирования для хранения и передачи по цифровым каналам связи.

Суть метода в том, что для каждого изображения производится статистический анализ распределения значений цветовых компонент (ЦК) (в пространстве ИДБ или каком-либо ином). При этом выявляются кластеры значений ЦК, которые в дальнейшем используются для распознавания значений ЦК каждого пикселя изображения. В результате формируется набор слоев двухградационных изображений, каждый из которых соответствует одному из выявленных кластеров. Этот набор слоев может быть эффективно закодирован, а само изображение легко восстанавливается с помощью простой процедуры декодирования. При этом наблюдается эффект улучшения качества изображения, обусловленный тем, что выявленные кластеры, как правило, описывают искажения, имеющие характер помех и шумов. В наибольшей степени этот эффект проявляется для ГИ, характеризующихся использованием дискретных цветотоновых шкал в процессах их формирования. В силу того, что полученные бинарные слои выделяют ЦК структурных элементов изображений, упрощаются процедуры анализа их пространственной структуры, поскольку в каждом слое СЭ обнаруживаются и распознаются с достаточно высокой надежностью.

Оверлейные операции «сшивки» слоев при восстановлении изображения не снижают достигнутые показатели надежности, что особенно характерно для ГИ, формируемых с использованием различных легенд или систем условных знаков. Ограниченность набора используемых графических форм позволяет даже повысить вероятность распознавания СЭ при оверлейных операциях. Как видно из рис.2, для данного изображения отчетливо проявляется эффект кластеризации значений ЦК. Кроме того, из рисунка видно, что для значительной области пространства ЯвБ характерен низкий уровень плотности значений ЦК. Визуально это воспринимается, как своеобразный диффузный «межкластерный газ». Наличие этого эффекта может снизить надежность выявления кластеров, поскольку нет четкой границы между кластерами и окружающей их межкластерной диффузной средой.

Для повышения надежности выявления кластеров была разработана методика обработки изображений с целью «сжатия» кластеров и подавления межкластерной диффузной среды. Идея обработки основана на том, что для большинства пар соседних пикселей имеет место их принадлежность к одному кластеру.

в - Проекция ИБ г - Проекция вБ

Рис. 2. Исходное ГИ и двумерные проекции распределений значений его ЦК

Поэтому анализ близости значений ЦК в сочетании с анализом связности групп пикселей на растре позволяет исключить пиксели, относящиеся к межкластерной среде, а для оставшихся связанных групп пикселей произвести корректировку значений их ЦК за счет осреднения по соседним пикселям, что приближает значения ЦК к центрам соответствующих кластеров.

Реализация процедуры заключается в том, что изображение сканируется окном размером 3х3 пикселя и в каждом положении окна вычисляются средние зна-

™: *0 = 9 £я. , , В0 = 9 £ В .

9 1=1 9 1 = 1 9 i=1

Далее сравниваются все значения ЦК всех пикселей окна с полученными средними. Если результат сравнения хотя бы в одном случае превосходит пороговое значение р: > р , |^. - Ц,| > р, |В. - В0| > р , 1 = 1, 2, ..., 9, то пиксель

относится к межкластерной среде и исключается из дальнейшего анализа. В противном случае значения центрального пикселя заменяются на полученные средние. Результатом обработки является изображение (рис.3), где также показаны проекции распределений значений ЦК. Как видно, межкластерная среда подавляется, и кластеры отчетливо проявляются. Кластеры надежно выделяются при использовании пороговой схемы как односвязные области на проекциях распределений значений ЦК, для которых значения плотности распределения превосходят заданный порог. Причем кластеры слабо зависят от величины порога в широком

интервале изменения его значений. Это позволяет объективизировать значение порога установкой его в середине интервала, а критерием определения интервала служит мера постоянства суммы интегралов распределений значений ЦК по всем обнаруженным односвязным областям на проекциях распределений значений ЦК.

а - Изображение б - Проекция RG

в - Проекция RB г - Проекция GB

Рис. 3. Результат обработки изображения и двумерные проекции распределений

значений его ЦК

После выявдения кластеризованных пикселей и их сортировки по кластерам, их описание формируется как параметризованные эксзначения ЦК - mRj, mGj, mBj (j - индекс кластера), описывающие местоположение кластеров в пространстве ЦК, и величины их стандартных отклонений aRj, aGj, aBj , определяющие габариты кластеров в единицах стандартных отклонений (рис.4). Близкой к оптимальной будет следующая схема распознавания ЦК R, G, B пикселей изображения:

j * = arg min max (R - mjj aRJ,\G - mGJ\/ aGJ, | В - mjj aBJ), где индексу j* соответствуют ЦК соответствующего цветового слоя mRj, mGj, mBj.

И

Рис. 4. Кластеры в пространстве цветовых компонент Я, О, В

Результат распознавания ЦК представлен на рис.5 в виде бинарных изображений, соответствующих выявленным кластерам.

Рис.5. Цветовые слои изображения

При АЦТП из цветного изображения формируется монохромное.

Реализация методики разработанного АЦТП состоит из двух этапов:

- собственно цветотоновое преобразование (ЦПТ), осуществляющее преобразование цветного ГИ в монохромное без потери информации о ЦК изображения, поскольку значения тонов, присваиваемые распознанным цветам, размещаются равномерно во всем диапазоне их изменения от 0 до 255;

- восстановление цветного изображения из монохромного с помощью об -ратного тоноцветового преобразования по значениям распознанных цветов исходного ГИ. При сравнении изображений, полученных в результате АЦТП, с изображениями, получаемыми отключением цветов с помощью стандартного ЦТП, можно установить, что качество производного черно-белого изображения, получаемого с помощью АЦТП, существенно выше. Этот эффект объясняется тем, что при АЦТП цветовые различия воспроизводятся более контрастными тоновыми пере -ходами. Сравнение исходного изображения и изображения, полученного после тоноцветового преобразования, показывает улучшение качества восстановленного цветного изображения по сравнению с исходным (рис.6). Это происходит за счет того, что пикселям изображений придаются значения «чистых» цветов без шумов и помех. На гистограммах полученных характеристик цветов СКО равно нулю, и они представляют собой один пик значения.

) Ь25,0

’

эр

Рис. 6. Исходное изображение (а) и результат АЦТП (б)

Следовательно, можно говорить, что метод АЦТП позволяет получать тоновую копию изображения, воспроизводящую все цветовые различия исходного изображения с возможностью восстановления цветного изображения за счет использования прямых и обратных цветотоновых шкал; получать изображение без графических дефектов, которые обусловлены процессами его формирования; проводить цветокоррекцию исходного ГИ с учетом индивидуального восприятия цвета каждым человеком; уменьшать количество цветов, присутствующих в изображении, до нескольких десятков.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка изображений. — М.: Высшая школа, 1983. — 295с.

2. Бакут П.А., Колмогоров П.С. Сегментация изображений: Методы выделения границ областей // Зарубежная радиоэлектроника. 1987. № 10. С. 25-46.

3. Галичанин А.А., Мурынов А.И., Лялин В.Е. и др. Адаптивное цветотоновое преобразование графических изображений // Математическое моделирование и интеллектуальные системы. 2003. № 2. С. 25-38.

4. Дуда Р., Харт П. Распознавание образов и анализ сцен. - М.: Мир,1976. -512с.

5. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений // Искусственный интеллект. Кн. 2. Модели и методы. - М.: Радио и связь, 1990. - 304с.

6. Лепихов Ю.Н., Пивоваров И.В. Адаптивное цветотоновое преобразование графических изображений // Надежность и качество: Труды Международного симпозиума: в 2-х ч. Ч. II / Под. ред. Н.К. Юркова - Пенза. 2004. С. 474-477.

7. Лепихов Ю.Н., Пивоваров И.В. Обработка изображений на основе адаптивной цветовой стратификации // Информационные технологии в науке, социологии, экономике и бизнесе: Материалы 31 Междунар. конф. - Украина, Крым, Ялта-Гурзуф.: Прилож. к журн. «Открытое образование». 2004. С.44-45.

8. Пивоваров И.В. Метод адаптивной цветовой стратификации графических изображений // Проблемы техники и технологии телекоммуникаций: Материалы Пятой Меж-дунар. НТК. Самара. 2004. С. 149-151.

ФОРМИРОВАНИЕ МУЛЬТИЧАСТОТНЫХ ИЗОБРАЖЕНИЙ В ЭЛЕКТРОИМПЕДАНСНЫХ ТОМОГРАФИЧЕСКИХ ИЗОБРАЖЕНЯХ

Тело человека можно представить как объемный проводник, состоящий из множества тканей с разными электрическими свойствами. В отличие от металлических проводников, электрическая проводимость биологических тканей зависит от передвижения ионов больше, чем от носителей электрического заряда. При присутствии электрического поля ток проводимости 1с развивается в результате передвижения подвижных ионов внутри водных носителей. Следовательно, этот ток связан с содержанием ионов и их изменчивостью в отдельных тканях, которое называется проводимостью ткани ст. Изменчивость ионов также зависит от температуры и было установлено, что проводимость увеличивается примерно на 1 - 3 % с каждым градусом увеличения температуры ткани.

Связанный заряд внутри тканей дает увеличение сложных диэлектрических свойств и, таким образом, ток смещения ^ способствует изменению переменных во времени электрических свойств. Если между двумя гранями куба ткани пропустить синусоидальное напряжение V, результатом будет электрический ток 1с и 1^

где ст - электрическая проводимость, ю = 2^ ^ - частота синусоидального напряжения), е0 - диэлектрическая проницаемость вакуума, е - относительная диэлектрическая проницаемость.

В зависимости от изменения частоты приложенного поля проводимость и относительная диэлектрическая проницаемость различных тканей колеблются в широком диапазоне. На рис. 1 показано поведение электрического тока обычной биологической ткани.

Диэлектрическая постоянная связана с размерами, в которых связанный заряд может перемещаться или поляризоваться под влиянием электрического поля. Каждый поляризуемый объект внутри ткани будет представлен в отдельности откликом характеристики и, таким образом, распределение относительной диэлектрической проницаемости дает увеличение комплексной функции модели.

Е.В.Мирошниченко

1с = ^,

1(1 = ^ее0 ,

(1)

(2)

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лялин В. Е., Титов В. А., Пивоваров И. В.

Текст научной работы на тему «Распознавание и обработка графических изображений для передачи в телекоммуникационных системах»