Научная статья на тему 'Применение фракталов для обработки изображений в телевизионных автоматических системах'

Применение фракталов для обработки изображений в телевизионных автоматических системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
555
186
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мартышевский Юрий Васильевич

Рассмотрены возможности применения фракталов для обработки изображений в телевизионных автоматических системах. Исследован алгоритм фрактального сжатия монохромных телевизионных изображений. Полученные результаты показывают эффективность алгоритма применения в мобильных телевизионных автоматических системах для передачи изображений по телекоммуникационным каналам.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мартышевский Юрий Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение фракталов для обработки изображений в телевизионных автоматических системах»

УДК 621.397 Ю.В. Мартышевский

Применение фракталов для обработки изображений в телевизионных автоматических системах

Рассмотрены возможности применения фракталов для обработки изображений в телевизионных автоматических системах. Исследован алгоритм фрактального сжатия монохромных телевизионных изображений. Полученные результаты показывают эффективность алгоритма применения в мобильных телевизионных автоматических системах для передачи изображений по телекоммуникационным каналам.

Телевизионные автоматические системы (TAC) предназначены для определения координат и слежения за объектами, находящимися в поле зрения телевизионного датчика. Исключительная особенность телевизионного изображения (большой объем представляемой информации, пространственная и временная избыточность) выгодно отличают TAC от радиоэлектронных систем подобного назначения благодаря высокой точности определения координат, малым габаритам и пассивному характеру работы.

Обработка изображения телевизионного кадра в TAC включает фильтрацию, сегментацию изображения на составляющие объект — фон, выделение объекта и оценку координат информативной точки (ИТ) его изображения. Под ИТ изображения объекта обычно принимаются координаты его центра тяжести. Полученные в каждом кадре оценки координат объекта фильтруются с применением фильтра Калмана. Отдельно в мобильных применениях TAC стоит задача передачи изображения лоцируемого объекта или сцены по каналу связи.

Возросшие требования к функциональным возможностям TAC и, в первую очередь, работа в сложной фоноцелевой обстановке требуют применения для обработки изображений новых нетрадиционных методов.

Одним из таких методов является использование метода фракталов — направление вычислительной математики, открытое американским исследователем Бенуа Мандельбротом [1].

Существует несколько определений понятия фракталов, одно из них дал Мандельброт, определив фракталы как структуры, состоящие из частей, которые в каком-то смысле подобны целому. При этом существует такое понятие, как самоаффинные фракталы (точные) и самоподобные (статистические).

Математический формализм теории фракталов стремительно осваивается всеми областями науки и наполняет многие области исследования новым содержанием. Рассмотрим некоторые из них.

Моделирование изображений фона (сцен). Известно эффективное применение фракталов в компьютерной графике для моделирования фоновых изображений. Фоноцелевая обстановка моделируется в виде аддитивно аппликативной комбинации изображений фона и объекта. При этом могут использоваться как синтезированные изображения в виде поверхности Фос-са [2], так и видеозаписи. Использование такого подхода позволяет достаточно просто проводить полунатурные исследования и испытания работы TAC в различной фоноцелевой обстановке.

Сегментация. Для сегментации изображений на основе фрактальной размерности FD используется тот факт, что изображения природных ландшафтов и натуральных сцен (облачные покровы, лесные пейзажи, водоразделы рек) характеризуются величиной фрактальной размерности. Фрактальная размерность двумерного изображения FD больше его топологической размерности TD, FD > TD. В то же время FD искусственных объектов равна их топологической размерности. Проведенные исследования показали, что использование FD позволяет выделять объекты с контрастом 0,05, расположенные на подстилающей поверхности типа «пересеченная местность» [3]. Фрактальная размерность успешно применена и для идентификации биологических объектов, в частности изображений радужной оболочки глаза при решении задачи иридодиагностики [4].

В статье приводятся результаты исследования алгоритма фрактального сжатия телевизионных изображений.

Фрактальное сжатие изображений. Фрактальное сжатие изображений относится к методу сжатия с потерями, т.е. качество восстановленного изображения отличается от исходного

на определенную (заранее принятую) величину потерь (погрешности). Величина потерь определяется решаемой TAC задачей или, в общем случае, особенностями человеческого зрения, связанными с ограниченной разрешающей способностью восприятия цвета, критической частотой мельканий и т.п.

Основными параметрами алгоритмов сжатия являются коэффициенты сжатия К^ и асимметрии Кас. Первый определяется отношением объемов исходного и сжатого изображений, а второй — отношением времени сжатия к времени восстановления.

Известные алгоритмы сжатия изображений с потерями JPEG и MPEG, использующие дискретное косинусное преобразование (ДКП), кодирование по Хаффману характеризуются почти одинаковым временем сжатия и восстановления.

При фрактальном сжатии используется принципиально новая идея — не близость яркости локальных областей изображения, а подобие разных по размеру его областей. Это, безусловно, наиболее прогрессивный подход на сегодняшний день. Коэффициент сжатия фрактальных алгоритмов достигает 2000. Причем большие коэффициенты достигаются на реальных изображениях.

Идею фрактального сжатия изображений предложили Барнсли и Слоан, доказавшие на основе системы итерационных функций Iterate Function System (IFS) теорему склейки (Collage Theorem) [5].

Преобразование системой IFS в пространстве изображения рассматривается следующим образом. Если изображение определено в виде [3(Х), Л], где 3(Х) — пространство, состоящее

из непустого множества X, ah — дистанция Хаусдорфа, то /FS-преобразование W : 3(Х) —» 3(Х) определяется в виде

W(B) = U W¡(B) для всех В е 3(Х).

i=i

Это преобразование имеет единственную фиксированную точку А 6 3(Х) , удовлетворяю-

N

щую условию А = W{A) = у W¡ (А), для всех В е 3(Х) имеем lim W (В) = А. Фиксирован-

¡=1 п-»<®

ная точка А называется аттрактором. Преобразование W называется сжимающим, если для любых двух точек PlfP2 е X на расстояние d выполняется условие

d(W(Px),W{P2)) < Sd(P1,P2) для S < 1. Теорема склейки формулируется следующим образом: если дана система IFS {Ж,: i = 1, 2, ... N} и эта IFS вызывает контрактивное преобразование W с аттрактором А,

следовательно, для всех В е 3(Х) выполняется условие

h(B,A)<(l-S)'1h

B,{JWt(B)

i=1

Приведенное выражение показывает, что если для изображения В можно найти систему IFS, удовлетворяющую свойству контрактивности, сходящуюся в В, то аттрактор IFS А также сходится в В, а задача сжатия изображения сокращается до проверки аттрактора каждого преобразования, сходящегося в изображение, и нахождения хорошего приближения для изображения.

Однако при сжатии изображений натуральных сцен трудно найти точку аттрактора для всего изображения. Выходом из этого явилась предложенная Jaquing [6] частично трансформируемая система функций piecewise transformation system (PTS), использующая трансформацию изображения по частям.

Целью работы является исследование алгоритма фрактального сжатия статических телевизионных изображений на основе PTS-функций.

Алгоритм фрактального сжатия состоит из следующих этапов.

1. Исходное изображение разбивается на непересекающиеся доменные блоки Dtj и большие по размерам ранговые области Щ (рис. 1), покрывающие все изображение.

2. Каждая ранговая область подвергается /^-преобразованию и для нее по минимуму меры сходства (близости) находится доменный блок.

3. Коэффициенты каждого //"^-преобразования записываются в виде числового файла.

^ '*• -н N ч \

V = м

ж.

X + с

У f

, где М — коэффициент масштаба; ф — угол поворота ранго-

Рис. 1 — Разделение изображения на доменные блоки и ранговые области

Почти все существующие схемы кодирования используют аффинные преобразования вида

соэф -этф этф соэф

вой области; си/ — величины переноса. X

Аффинные преобразования просто реализуются и интуитивно имеют хорошую интерпретацию при IFS-трансформации изображений. В итоге файл сжатого изображения содержит заголовок, в котором записаны установочные параметры изображения (размеры доменов и ранговых областей, величина меры сходства и тела файла), в котором размещены коэффициенты /^-преобразования.

Алгоритм восстановления изображения состоит из следующих этапов:

1) формируется стартовое изображение, в общем случае произвольное;

2) формируется дополнительное изображение, разбитое на блоки, соответствующие доменам исходного изображения, расположение доменов описано в заголовке сжатого файла. Стартовое и дополнительное изображения должны быть одинакового размера. Стартовое изображение разбивается на ранговые области, которые отображаются в домены дополнительного изображения в соответствии с коэффициентами /^-преобразования файла сжатого изображения;

3) стартовое и дополнительное изображения меняются местами (т.е. теперь стартовое изображение разбивается на ранговые области, а дополнительное — на доменные блоки) и повторяется п. 2;

4) количество итераций алгоритма при восстановлении изображения по пп. 2 и 3 повторяется до полного восстановления исходного изображения.

При проведении исследований алгоритма использовалось монохромное изображение «ЛЕНА» размером 256 х 256 пикселей с 256 уровнями квантования яркости (рис. 2) и ограниченное количество аффинных преобразований

D = R»M»F»K,

где D — домен; R — ранговая область; F — группа из 8 изометрических преобразований: 4 поворота на 0°, 90°, 180°, 270° и 4 отражения относительно горизонтальной, вертикальной и двух диагональных осей; коэффициент масштабирования М принимался кратным 21; К — преобразование яркости ранговой области

где £[ ] — символ усреднения яркости по ранговой области или домену; aD и ап — среднее квадратическое отклонение (СКО) яркости в доменном блоке и ранговой области соответственно.

В качестве меры близости между доменным блоком Dtj и ранговой областью Щ применялось евклидово расстояние

5 = ^-N

N-1N-1

¡=0 !=0

Качество восстановленного изображения субъективно оценивалось по разности исходного с восстановленным. При этом считалось, что качество восстановления обратно

пропорционально степени подобия разностного изображения исходному. Чем больше детерминированной информации содержалось в разностном изображении, выраженной в субъективной узнаваемости изображения (просматривались контуры или очертания), тем хуже считалось качество восстановленного. Заметим, что при исследованиях сознательно для объективности оценки не применялись какие-либо дополнительные методы обработки, позволяющие улучшить качество восстановленного изображения, а коэффициент сжатия определялся по объему, занимаемому заголовком и коэффициентами IFS без их дополнительной компрессии.

Исследование алгоритма проводилось при размерах доменных блоков 2 х 2 и 4 х 4, ранговых областей 4 х 4, 8 х 8 и 16 х 16 пикселей. Результаты исследования алгоритма приведены на рис. 2-4.

Рис. 2 — Результаты исследования алгоритма: а — исходное изображение; б — первая итерация восстановления; в — восстановленное изображение; г — разность между исходным и восстановленным

На рис. 2,а показано исходное изображение, на рис. 2,6 — результат первой итерация восстановления изображения при размерах доменных блоков 2x2, а ранговых областей — 4x4. На рис. 2,в — восстановленное изображение после четырех итераций алгоритма восстановления, а на рис. 2,г — разность между исходным и восстановленным изображениями. Отметим, что качество восстановленного изображения хорошее, на разностном изображения контуры «ЛЕНЫ» едва заметны. При этом коэффициент сжатия составил 3,7.

Установлено, что увеличение ранговых областей до размера 8x8 пикселей позволяет достичь Ксж = 10,4 без ухудшения качества изображения, при этом время сжатия изображения «ЛЕНА» на IBM PC Р1(760) составляло 27 минут, а коэффициент асимметрии равнялся 40.

На рис. 3 показано восстановленное изображение при размерах доменов 4 х 4, а ранговых областей 16 х 16. В этом случае коэффициент сжатия достигает величины 14,3. Однако на изображении уже просматривается блочная структура ухудшающая качество его восприятия.

Очевидно, что коэффициент Ксж пропорционален отношению размеров ранговой области к доменному блоку.

Одним из путей повышения Ксж является использование ранговых областей разного размера. В качестве критерия, определяющего размеры ранговых областей, использовалась величина СКО яркости локальных участков изображения. Варьирование величиной порога позволило изменять размеры ранговых областей. Таким образом размеры ранговых областей адаптивно изменялись (кратно 21) в зависимости от распределения яркости по полю изображения.

Результаты адаптивной дискретизации (разделении) изображения «ЛЕНА» на ранговые области приведены на рис. 4. На рисунке показано расположение ранговых областей разного размера при различии СКО яркости между ними в 20 уровней квантования.

Рис. 3 — Восстановление изображения Рис. 4 — Адаптивная дискретизация

изображения на ранговые области

Результаты исследования показывают, что при адаптивной дискретизации изображения (диапазоне изменения размеров ранговых областей от 4 х 4 до 16 х 16) коэффициент сжатия достигает Ксж = 15,4, при этом качество изображения практически не ухудшается, а время работы алгоритма сжатия уменьшается на 15 %.

Исключительная особенность фракталов позволяет, используя их масштабные свойства, увеличивать или уменьшать размеры восстанавливаемого изображения. На рис. 5,а показан увеличенный в 6 раз фрагмент изображения «ЛЕНА», а на рис. 5,6 тот же фрагмент увеличен с использованием для интерполяции полинома второго порядка. Анализ приведенных результатов показывает, что качество увеличенного фрактальным способом фрагмента изображения лучше, чем при традиционно используемых в пакетах обработки изображений приемов.

Рис. 5 — Увеличенный фрагмент изображения: а — с помощью фрактального способа; б — интерполяция полиномом второго порядка

Заключение

Исследования показали:

• алгоритм фрактального сжатия достаточно просто реализуется, хотя характеризуется большими временными затратами;

• для восстановления изображения достаточно 4-5 итераций, это дает коэффициент асимметрии равным 45, поэтому особенно выгодно использование фрактального сжатия в мобильных применениях TAC;

• хорошее качество восстановленного изображения наблюдается при Ксж = 10,4, а при адаптивной дискретизации Ксж =15,4, при этом время сжатия уменьшилось на 15 %;

• применение фрактального сжатия изображений в ТАС позволит уменьшить требования к телекоммуникационным каналам для передачи изображения.

В дальнейшей работе предполагается использовать более сложный метод преобразования яркости ранговых областей, оптимизировать алгоритм для уменьшения времени работы за счет использования целочисленной арифметики, повышения коэффициента сжатия, а также реализовать и исследовать алгоритм фрактального сжатия динамических изображений на сигнальном процессоре ADSP BF531.

Автор выражает благодарность профессору университета города Сидней (Австралия) Дану С. Попеску (Dan С Popescu) за консультации.

Литература

1. Mandelbrot В. The Fractal Geometry of Nature / В. Mandelbrot. - W.H. Freeman and Co. : NY, 1977.

2. Мартышевский Ю.В. Полунатурное моделирование работы ТАС средствами Mat LAB / Ю.В. Мартышевский // Телевидение: передача и обработка изображений. Санкт Петербург, 4-я Международная конференция 24-26 мая 2005. - С. 65-66.

3. Мартышевский Ю.В. Сегментация изображений на основе фрактальной размерности и логического связывания / Ю.В. Мартышевский // PIERS 98 13-17 July, 1998. - France, Nantes. - P. 1185.

4. Мартышевский Ю.В. Фрактальная размерность радужной оболочки глаза / Ю.В. Мартышевский // МЕТРОМЕД. СПб. 19-22 июня 1995. - С. 122-123.

5. Barnsley M.F. A better way to compress images / M.F. Barnsley and D. Sloan. Alan. -Byte 13(1), (1988). - P. 215-224.

6. Jacquin A.E. A novel fractal block coding technique for digital images / A.E. Jacquin // Proc. IEEE Intl. Conf. on ASSP(1990). - P. 112-117.

Мартышевский Юрий Васильевич

Д-р техн. наук, проф. каф. радиотехнических систем ТУСУРа Телефон: 8(3822) 41 36 70, 76 38 16 Эл. почта: yvmart@mail2000.ru

Yuri V Martishevsky

Application of fractals for images processing in TV automatic control systems

Possibilities of fractals application for images processing in TV automatic control systems are considered. An algorithm of fractals compression of monochrome TV images is investigated. The obtained results show efficiency of the algorithm application in transportable TV automatic control systems for images transfer in telecommunication channels.

i Надоели баннеры? Вы всегда можете отключить рекламу.