УДК 621.383.8:621.396.96:621.396.6
ІНФОРМАЦІЙНА ОЦІНКА ВИДІЛЕННЯ ФРАГМЕНТІВ КОЛЬОРОВИХ ЗОБРАЖЕНЬ
ІВАНЮК В.Г., КАПШІЙ О.В., КОСАРЕВИЧ Р.Я., ЛАУГ.
виділення ФЗ, який враховує ці властивості. Розглянемо зображення, елементи якого заповнюють апертуру поля LL і визначимо кількість інформації в цьому зображенні [1]:
I = LxLylAfxrMy log(1 + -2) +
5 r
+ AfxgAfyg log(1 + -L) + f Afyb log(1 + -L)} , (1)
S g 5 b
Розглядається задача виділення фрагментів кольорових зображень на основі їхнього інформаційного опису з використанням інформації простору кольору. Детально описується перехід від формули кількості інформації зображення до алгоритму її використання при оцінці фрагментів зображення.
1. Вступ
При обробці кольорових зображень, зокрема тих, котрі несуть інформацію про фізичні процеси (металографія [3], біологія, гістологія і т.д.), виникає проблема виділення інформації, закодованої за допомогою кольору [2]. Базуючись на кластери-зації зображення згідно з його кольорами, можна аналізувати просторовий розподіл різних речовин у зразку матеріалу, що дає додаткову інформацію про досліджуваний фізичний процес (зварювання, корозія тощо). Так, при дослідженні процесу зварювання важливою є інформація про взаємне розташування компонентів реакції і їх кількісний склад. Ці дані можна отримати з кольорового зображення досліджуваного зразка.
Для зручності використаємо такі скорочення. Клас фрагментів зображення (ФЗ), в яких закодована корисна для дослідника інформація, скорочено будемо називати класом інформації (КЛІ), а такі фрагменти зображення — інформативними фрагментами (ІФ). Клас фрагментів зображення, в яких закодована решта інформації, скорочено будемо називати класом завад (КЗД), а самі фрагменти -фрагментами завад (ФЗД). Для кожного конкретного досліджуваного зображення постає завдання прийняття рішення про належність фрагмента цього зображення певному класу.
2. Мета роботи
Розробити методи та алгоритми якісного й кількісного аналізу мікроструктури матеріалів на основі кольорових зображень, отриманих з допомогою електронного мікроскопа.
3. Інформаційна оцінка елементів зображення
В даній роботі розглядається процедура виділення ІФ зображення. Для цього зображення аналізується як у просторі кольору (ПК), так і в ще двох напрямках: в площині зображення та в його двомі-рному частотному просторі. Ці напрямки перетинаються і мають кількісний відбиток у кількості інформації (КІ) зображення.
Розглянемо формулу КІ для кольорового зображення. На її основі знайдемо формулу ФЗ, проаналізуємо її властивості з точки зору можливостей використання в алгоритмі і побудуємо алгоритм
де Afxt, Afyt (t є {r,g,b}) — величини, що відповідають ширині частотної смуги коливань параметрів r(x,y), g(x,y), b(x,y), які характеризують просторовий розподіл відповідно червоного, зеленого та синього кольорів зображення, по осях x і
у; 51 = , t є {r,g,b}, t мін та t макс - мінімаль-
t макс
не і максимальне значення відповідного параметра r(x,y), g(x,y) та b(x,y).
Перед проведенням аналізу приймемо:
Afxr = Afyr = Afxg = Afyg = Afxb = Afyb ;
Lx = Ly ; (2)
5 r =5g =5b .
З врахуванням (2) формула (1) приймає таку форму:
I = 3LgxAfglog(1 +1/5g), (3)
тут коефіцієнт 3 враховує розмірність векторного простору кольору.
Нехай фрагмент зображення (rz(x, у)), який належить КЗД зображення, має кількість інформації:
Iz = 3Lgxrz fzloga + 18 gz) , (4)
де Afxrz — ширина частотної смуги коливань
параметра rz(x,y), який характеризує просторовий розподіл ФЗ, що належать КЗД зображення, по осі
x (у); Lg.j.z — просторова зона, яку займає цей ФЗ:
5 rz =
rz м
'rz„
(5)
де rz мін (rz макс) — мінімальне (максимальне) значення параметра rz(x, у).
Розрахуємо приріст інформації ДІ = I - Irz в ФЗ поза ФЗД, який визначає КІ у ІФ:
g1
Д! = 3{2LxALxAf^ log(1 +-y) +
S g
g1
+ 2Lgx ALx Afxr A(Afxr) log(1 + -y) +
Sg
+ Lgx Afxr A[log(1 + -g)]},
S 2
(6)
122
РИ, 2004, № 3
де ALX Lx Lxrz , A(Afxr) Afxr Afxrz , а ко ефіцієнт A[.] третьої складової:
1 1
Дi =A[log(1 + —)] = -2.88^_(Sr -5rz). /у)
Sr 1 + 8 j.
Розглянемо вираз (6). Його перша складова буде більша від нуля, якщо прямокутник із сторонами Lx і ALX містить пікселі, тобто Lxrz < Lx. Друга складова виразу (6) буде більша від нуля, якщо прямокутник із сторонами Afxr і A(Afxr) містить
пікселі, тобто Afxrz < Afxr . Третя складова виразу (6) буде більша від нуля, якщо, згідно з (7):
Sr <Srz . (8)
Розглянемо:
r ■
Д8г =8r -Srz =А . (9)
rMaKC
Нехай верхня межа діапазону rMaKC має зміни, а гмін фіксована, тоді:
r
ASr =- ArMaKc , (10)
Гмякс
де ^rMaKc rMaKc rz макс •
Для того щоб виконувалася умова (8), необхідно, щоб rMaKC > rzMaKC , а це в свою чергу означає, що третя складова в (6) додатна. З врахуванням (7) і (10), а також приймаючи 82 << 1, кількість інформації фрагмента зображення, який належать КІ (6), прийме таку форму:
21
Д! = 6{LxALxAfxT log(1 + ^т) +
21 + L2x Afxr A(Afxr) log(1 + -=-)+ S 2
+ 1.44L2x Afxr }.
(11)
r
Розглянемо третю складову виразу (11). Пікселі зображення, кольори яких не належать ArMaKC, при процедурі виділення фрагмента зображення відкидаються, тобто в алгоритмі потрібно визначити відстань:
Ar rMaKC r, (12)
а потім порівняти її з максимальною. Пікселі не будуть відкидатися, якщо:
Дг < ArMaKC аб° A^rMaKc < ArMaKc/ rMaKC . (13) Враховуючи (11), умова (13) трансформується в:
864LxAfxr A^rMaKc < 864LxAfxr AlMaKc/ rMaKc .(14)
В такому вигляді вона може трактуватись, як розрахунок КІ пікселя і порівняння її з максимальною КІ за третьою складовою (11). Для випадку
(13) порівняння виконується у відносних одиницях, а для (14) — у бітах, що фізично відповідає суті КІ ФЗ. Якщо умова (13) виконується, піксель належить ІФ у ПК.
Розглянемо (13) для випадку, коли остання умова про рівність у (2) не виконується. При цьому основну увагу зосередимо на зміні третьої складової (11). Як витікає з (1) і (11), вона трансформується у таку форму:
АЦ = 2.88L2x М2 £
te{r,g,b}
At MaKc t MaKc
(15)
Отже для того, щоб перевірити, чи належить піксель зображення з координатами r , g, b до ІФ, необхідно визначити відстані:
At = t MaKc - U є {r,g,b} , (16)
а потім перевірити виконання умов:
At <AtMaKC,t e{r,g,b} . (17)
З умов (17) видно, що у ПК виділяється куб, в якого кожна сторона описується діапазоном ArMaKC, Ag MaKC , Ab MaKC . Положення однієї з вершин цього куба в ПК визначається координатами rMaKC, gMaKC , bMaKC . Цей куб і є характеристикою ІФ у ПК. Для визначення приналежності пікселя зображення з координатами r , g , b до інформативного фрагмента необхідно перевірити, чи належить кожна з трьох координат пікселя відповідній стороні куба (17). Ці умови можна представити в еквівалентній формі:
_Д^ <^0^ ,t є {r,g,b} .
t MaKC t MaKC
(18)
Визначення умов (18) спирається на використання координат rMaKc , g mokc , b mokc , які належать границі фрагменту. Спробуємо трансформувати умови (18) у більш “симетричну” форму. Зауважимо, що положення куба у ПК рівнозначно задається і координатами центра куба re , ge, be. Нехай
різНиця МІЖ re і rMaKc, ge і gMaKC , be і b mokc
практично незначна і має порядок одиниці відсотка. Тоді:
— <^MaKC-,t e{r,g,b}.
te te
(19)
Використовуючи координати re , ge, be, змінимо визначення відстані (12):
At = д/(t(x,y)-te)2,t є{r,g,b} . (20)
Врахувавши те, що ми тепер працюємо з максимальною відстанню, яка рівна половині розміру сторони куба, підставимо отримані результати у (18):
— <^MaKC ,t є {r, g,b}.
te te
(21)
РИ, 2004, № 3
123
З (21) видно, що для визначення приналежності пікселя зображення з координатами r , g, b до інформативного фрагмента необхідно розрахувати середню точку re , ge, be і визначити відстань до середньої точки (20) по кожній стороні куба. Якщо вона менша, ніж половина сторони куба, то по досліджуваній координаті піксель належить кубу. Якщо по трьох координатах є належність, то піксель належить кубу. Таким чином, визначаючи відстань, за допомогою кубічних форм можна описувати інформативні фрагменти в ПК. В цьому випадку в ПК куб описується координатами свого центра і розмірами половини сторони. Слід звернути увагу на таку обставину - для визначення належності пікселя зображення до куба використовується відстань, яка обраховується по кожній координаті трьохмірного ПК, тобто використовуються три окремі форми зв’язку між двома точками ПК. Однак доцільніше оперувати з однією формою зв’язку. Для цього перемножимо нерівності для кольорів r та g в (21):
4 ArAg ; AfMaKC Ag макс (22)
rege rege . ( )
Проаналізуємо ліву частину (22). Нехай Ar/re = (1+ Д)Ag/ge , тоді Ar/Ag = (1 + A)re/ge , звідки, за умови, що |Д| < 1, Ag/Дг и (1 - A)ge/re . Просумувавши два останні вирази, отримаємо:
— + ^ = (1+ Д)-^ + (1 -Д)-^
Ag Ar ge re '
Звідси
потім
Дг2 +Ag2 ArAg
Дг2 + Ag2
2 2 "
re + ge
2 2 ^ + Д ІЄ_
rege
ArAg
rege
rege
(1+д )
re + go
9 9
ArAg Дг2 + Ag2
і нарешті
rege
2 2 re + ge
Таким чином, у площині простору кольору можна ввести форму зв’язку між двома точками:
Р =
ArAg
rege
Дг2 +Age
e e
re + ge
а в цілому просторі кольору така форма зв’язку між точками прийме вигляд:
Р =
' EAtV zte
te{r,g,b} / te{r,g,b}
(23)
Числівник в (23) — це евклідова метрика:
R = Z (t(x,y) - te)2
■\|te{r,g,b} ’
(24)
де r(x, y), g(x, y) та b(x, y) — координати відповідно по осі червоного, зеленого та синього в просторі кольору, що відповідають пікселю в точці з просторовими координатами х, у.
124
Знаменник в (23) — це відстань до точки з координатами re , ge, be від початку координат
Re = / Zt°
Vte{r,g,b} ■
Використання форми зв’язку (23) дозволяє модернізувати умови (21) таким чином:
R/Re <Rмакс/Re . (25)
Визначимо параметр R макс . Для цього визначимо значення, які приймають r(x,y), g(x,y) та b(x,y) на границях куба:
t(x,y) = te + 0.5Atмакс, t є {r,g,b} . (26)
Тоді:
R
макс
= 0.5
1 Z (Atмакс )Є te{r,g,b}
(27)
Нарешті представимо модернізовані умови у такій формі:
? 2 R м
aL2x Af2R- < bLex f r
Re Re
(28)
де константи a та b зводять умову до порівняння кількості інформації.
4. Застосування
Один з варіантів спрощеного алгоритму виділення ІФ має такий вигляд. Виділення ІФ зображення проводиться у кілька етапів. На першому етапі задаються просторові зони, в яких знаходяться ІФ, що цікавлять дослідника Sxl,Sxe,...,Sxn с LxLy . На другому етапі виділяються ІФ у частотних
смугах Д fxi Д fyb Д ІХд А ^2:, ..., A fxk A fyk с A fx A fy.
На третьому етапі виділяються ІФ у кулях у просторі кольору.
Нехай ІФ зосереджений на зображені таким чином, що його можна накрити однією кулею. Задається еталонний колір re , ge, be і навколо нього у просторі кольору формується куля з радіусом R макс (27), а точніше з відносним радіусом:
Рмакс _ Rмакс/Re . (29)
Задавши радіус рмакс у відносних одиницях, умову (25) переведемо у:
р = R/Re <Рмакс . (30)
Визначивши для кожного пікселя відносний радіус р , проводять фільтрацію і на вихідне зображення переносять лише ті пікселі, кольори яких належать кулі з радіусом р макс (умова (30)).
Проводячи візуальний аналіз вихідного зображення та міняючи радіус кулі, що накриває дані в просторі кольору, оператор добивається виділення на зображенні потрібних йому кольорів (потрібного ІФ).
РИ, 2004, № 3
Кольори пікселів ІФ і кольори пікселів завад можуть мати спільні зони. Аналіз такого випадку розподілу наразі не буде проводитися. Лише зауважимо, що в цьому випадку, для покращення визначення ІФ, необхідно скористатись розподілом значень його пікселів в околі центру ІФ.
Другий варіант алгоритму побудований на основі аналізу гістограми зображення у ПК. Нехай визначена гістограма:
S = S(r,g,b). (31)
Нехай заданий пороговий рівень гістограми Sj. Для значень r , g, b в просторі кольору K, для яких S(r,g,b) > Sj, введемо множину: vj с ПК , яка є проекцією гістограми у ПК. Оскільки гістограма є чотирьохмірною, то візуальний аналіз гістограми можна провести частково, по порогових проекціях Vj .
Розглянемо дію алгоритму для однієї координати простору g у випадку, коли ІФ зображення зосереджений у одній частині простору кольору і його можна накрити кулею. В цьому випадку проекції vj будуть представляти собою дискретизовані відрізки. На основі рівня відсічки Sj формується початкове зображення Z1, яке буде містити як кольори ІФ, так і кольори завад.
Далі задається пороговий рівень Ssl, який починає зменшуватися до тих пір, поки оператор не зафіксує появи кольорів виключно ІФ. Цей рівень запам’ятовується. Оператором визначається довжина відрізка, який охоплює у ПК кольори на вихідному зображені, як початкова, і інтерактивно визначається центр відрізка, або колір, який має максимальне значення на гістограмі. Далі на початковому зображені Z1, вважаючи обрану точку центру відрізка центром шуканого ІФ, починають збільшувати розмір відрізка. Пікселі початкового зображення Zi, кольори яких попадають у збільшений відрізок, висвічуються на вихідному зображенні. Збільшення відрізка триває до моменту, поки не припиниться поява нових кольорів пікселів ІФ.
Описані вище алгоритми, а також інші алгоритми, побудовані на основі виведення, були реалізовані у вигляді інтерактивної програми. Програма використовується для обробки зображень мікроструктури матеріалів, отриманих з допомогою електронного мікроскопа.
На зображенні, яке подається на вхід системи, оператором виділяється просторова зона зображення, в якій на наступному етапі роботи програми буде проводитись фільтрація. Програма використовує цю зону для виділення на зображенні просторових інформативних фрагментів.
На наступному етапі обробки зображення у виділеній його зоні оператор визначає центри інфор-
мативних фрагментів - кольори, що визначають інформацію, потрібну користувачеві. В режимі локального застосування евклідової метрики ці кольори вважаються центрами куль у просторі кольору. На зображенні залишаються лише ті пікселі, кольори яких належать кулям з радіусом R макс (27), а точніше з відносним радіусом рмакс (29), який задається оператором. Решта пікселів вихідного зображення заміняється одним, наперед заданим кольором, наприклад чорним.
5. Висновок
На основі інформаційних засад та апарату евклідо -вої метрики створений алгоритм визначення належності пікселів зображення інформаційному фрагменту, описаному одночасно в площині зображення і у просторі кольору. Використання цього алгоритму та засад, на яких він побудований, дозволить, в перспективі, скоротити час обробки кольорових зображень, а також створити метод їх більш компактного опису.
Література: 1. Беленький Я.Е., Кошевой В.В. Системы пространственно-временного преобразования информации / Под ред. д.т.н. Я. Е. Беленького. К: Наук. думка, 1979. 252с. 2. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. 790 с. 3. Myshkin N.K., Kong H, Grigoriev A. Ya, Yoon E.-S. The use of color in wear debris analysis// Wear, Vol. 251 (2001), Issues 1-12. Р. 1218-1226.
Надійшла до редколегії 21.05.2004
Рецензент: д-р техн. наук, ст. н. с. Лукін В.В.
Іванюк Віталій Григорович, інженер відділу “Методи та системи обробки, аналізу та ідентифікації зображень” Фізико-механічного інституту ім.Г.В.Карпенка НАНУ. Наукові інтереси: обробка та розпізнавання кольорових зображень, системи контролю високовольтних трансформаторів. Адреса: Україна, 79601, Львів, вул.Наукова, 5а, тел:65-45-30. e-mail: [email protected]
Капшій Олег Вірославович, аспірант, інженер відділу “Методи та системи обробки, аналізу та ідентифікації зображень” Фізико-механічного інституту ім.Г.В.Карпенка НАНУ. Наукові інтереси: обробка та розпізнавання зображень, сегментація, теорія інформації. Захоплення: радіотехніка, комп’ютерна техніка, програмування, туризм. Адреса: Україна, 79601, Львів, вул. Наукова, 5а, тел:65-45-30. e-mail: [email protected]
Косаревич Ростислав Ярославович, канд. техн. наук, науковий співробітник відділу “Методи та системи обробки, аналізу та ідентифікації зображень” Фізико-механічного інституту ім.Г.В.Карпенка НАНУ. Наукові інтереси: обробка та розпізнавання зображень. Адреса: Україна, 79601, Львів, вул.Наукова, 5а. e-mail: [email protected]
Лау Габріела, здобувач Державного університету “Львівська політехніка”. Наукові інтереси: обробка та розпізнавання кольорових зображень. Адреса: Україна, 79601, Львів, вул.Наукова, 5а.
РИ, 2004, № 3
125