УДК 681.518:004.93.1'
А. С. ДОВБИШ, К. В. АЛТИНН1КОВА
1€РАРХ1ЧНИЙ АЛГОРИТМ РОЗП1ЗНАВАННЯ ЕЛЕКТРОНОГРАМ
Розглядаеться iнформацiйно-екстремальний ieрархiчний алгоритм розпiзнавання елек-тронограм, одержаних в електроннiй мжроскопп в режимi м^одифракцп, який дозволяе тдвищити функцiональну ефективнiсть навчання системи при збшьшент потужностi алфавиту класiв. Оброблення електронограм в полярних координатах дозволило зробити алгоритм iнварiантним до зсуву та повороту.
Вступ
Розтзнавання одержаних в електроннш мшроскопп в режим1 мшродифракци електроног -рам е важливою науково-практичною задачею [1], актуальною в металургшнш та х1м1чнш промисловосп, геологи, кристалографп та шших галузях. 1снуюч1 аналггико-геометричт методи розтзнавання електронограм [2] вимагають значних часових витрат i потребують високого р1вня квал1ф1кацИ особи, що приймае ршення. Бшьшють вщомих машинних алго-ршмв розтзнавання зображень [2-4] ор1ентовано на розв'язання модельних задач, яю виключають перетин клас1в, характеризуются невисокою достов1рн1стю розтзнавання i потребують на тдготовчому етат навчання нормал1зацп апрюрно деформованих образ1в, що на практищ, як правило, е ускладненим.
Одним ¡з шлях1в виршення ще1 проблеми е використання щей i метод1в шформацшно-екстремально! штелектуально' технологи (1Е1-технологп), що грунтуеться на максим1зацп шформацшно! спроможносп системи розтзнавання шляхом введення в процес навчання додаткових шформацшних обмежень [5]. У працях [6,7] дослщжувалися у рамках 1Е1-технологп питання анал1зу i синтезу систем розтзнавання електронограм за не1ерарх1чним алгоритмом, який е чутливим до збшьшення потужносп алфавiту клашв розтзнавання. У статп розглядаеться питання стиснення та оброблення вщеошформацп в шформацшно-екстремальних алгоритмах навчання системи розтзнавання електронограм, як мають iерархiчну структуру.
1. Постановка задачi
Розглянемо задачу загального синтезу системи розтзнавання зображень. Нехай ефек-тивтсть навчання розтзнаванню реалiзацiй класу хт, т = 1,М, характеризуеться значен-ням Ет критерiю функцюнально' ефективностi (КФЕ). Вщома навчальна матриця МП = = 1, п, де - кщьюсть ознак розпiзнавання i випробувань вщповщно. Рядок матриц {утт)1 И = 1^} утворюе .¡-ту реалiзацiю образу, а стовпець{у^^ и = 1,п} -навчальну ви61рку з генерально' сукупност значень ь1 ознаки розпiзнавання. Треба для структурованого вектора параметр!в функцюнування системи розпiзнавання §т =<ёт,1,-,ёт,я,-,ёт,д >, як будемо називати параметрами навчання i для яких вщом1 обмеження ^ Яд) ^ 0, шляхом оргашзаци послщовних iтерацiйних процедур знайти екстремальт значення координат вектора ят, що забезпечують максимум КФЕ навчання системи розтзнавання:
*
Етах = ПИхЕт, (1)
де в - область допустимих значень параметр!в навчання.
На етат екзамену треба за побудованими на етат навчання системи розтзнавання виршальними правилами визначити належтсть реалiзацil образу, що розпiзнаеться, до
вщповщного класу розпiзнавання ¡з заданого алфавггу { хт }.
Метою роботи е пiдвищення достов1рносп та оперативностi розпiзнавання електронограм за 1Е1- технологiею при збшьшент потужносп алфавiту класiв розпiзнавання.
2. Алгоритм навчання системи розтзнавання
Математичну (категоршну) модель процесу навчання системи розтзнавання за 1Е1-технологieю подамо у виглядi дiаграми вiдображень множин. При обгрунтувант гiпотези
нечпгсох компактносп мае мiсце нечiтке розбиття с & , де & - простр ознак розтзна-
вання. Введемо оператор 6 нечггко! факторизацп простору ознак: 9 : У ^ щ|М| i оператор
класифшацп V : ^ I''', який перевiряе основну статистичну гiпотезу про належтсть
реалiзацiй {
Дй и=
1, п } нечiткому класу хт . Тут 1- кiлькiсть статистичних гшотез. Опера-
тор у: I' 1 1 ^ 3| ч I шляхом оцшки статистичних гiпотез формуе множину точнюних характеристик 3' ч де ч=12 - кiлькiсть точнюних характеристик. Оператор Ф: 3ч' ^ Е обчислюе множину значень шформацшного КФЕ, який е функцюналом точнiсних характеристик. Контур оптимiзацil геометричних параметрiв нечiткого розбиття шляхом пошуку
максимуму КФЕ навчання розтзнаванню реалiзацiй класу хт замикаеться оператором г: Е ^И.
Структурну дiаграму вiдображень множин у процес навчання за базовим iнформацiйно-екстремальним алгоритмом показано на рис. 1.
и ф
Ф
3
'ч '
V
Т х С х & х Z
У ■
I
Рис. 1. Д1аграма ввдображень множин у процеа навчання системи розтзнавання Оператор и: Е ^ О х Т х & х Ъ регламентуе процес навчання i дозволяе ошгашзувати параметри його плану, якi визначають, наприклад, обсяг i структуру випробувань, чер-говiсть розгляду класiв розтзнавання та шше.
Вхiдною iнформацiею для навчання за базовим алгоритмом е багатовимiрна навчальна
матриця || у т>т)± I т = 1,М; 1 = = 1,п||, де М,^п- кiлькiсть класiв, ознак розпiзнавання
та векторiв-реалiзацiй класiв вщповщно; система полiв контрольних допускiв {8К1} на
ознаки розпiзнавання i рiвнi селекцп {р т} координат еталонних векторiв-реалiзацiй, якi за замовчуванням дорiвнюють 0,5 для всiх клашв розпiзнавання. Основнi етапи реатзацп алгоритму:
1. Побудова iерархiчноl структури алфавпу класiв розпiзнавання. При цьому перший ярус структури складаеться з типових представниюв якюно вiдмiнних класiв електроног-
рам, якi визначають алфавiт клашв розпiзнавання {Хт,"1}, а наступш яруси - з представникiв !х класiв та пiдкласiв. Кожна гшка вищого ярусу утворюе страту, яка визначае свш алфавiт
класiв розтзнавання {Хкг)т}, де к, г - номери страт i яруав вiдповiдно.
2. Для кожного класу будуеться спектрограма яскравосп шляхом оброблення електро-нограми у полярних координатах за умови, що центр електронного пучка приймаеться за центр електронограми.
3. Для кожного алфавггу формуеться вхщна навчальна матриця II ук',)т,1 11(г), вектори-реалiзацil яко! утворюються шляхом квантування у часi вщповщно1 спектрограми яскравостi.
4. Для кожного алфавпу формуеться бiнарна навчальна матриця || хк',)т,1 ||(г), елементи яко! дорiвнюють
г
У
6
1 '
(,) I1- * укв„.1 К,,;
^ =1 0,1*ук,)т,1 «8к,1. (2)
5.Формування масиву еталонних двiйкових векторiв {хк,т,, | т = 1,М, 1 = 1,N}, елементи якого визначаються за правилом:
к,т,1
1 п
1- * 1I "В
>Рк,т;
Н (3)
0, 1* еке,
де Рк )п - рiвень селекцп координат вектора хк,т 6 Хкг,т .
6. Розбиття множини еталонних векторiв на пари найближчих «сусщв»: ЭТк|т =<хт , Х1 >,
де Х1 - еталонний вектор сусiднього класу Хк,т, за таким алгоритмом:
а) структуруеться множина еталонних векторiв, починаючи з вектора х1 базового класу
Х°, який характеризуе найбiльшу функцiональну ефективнiсть системи розпiзнавання;
б) будуеться матриця кодових вщстаней мiж еталонними векторами розмiрностi М х М;
в) для кожного рядка матриц кодових вщстаней знаходиться мшмальний елемент, який належить стовпчику вектора, найближчого до вектора, що визначае рядок. За наявносп декшькох однакових мiнiмальних елементiв вибираеться з них будь-який, оскшьки вони е ршноправними;
г) формуеться структурована множина елементiв попарного розбиття {ЭТк|т | т = 1,М}, яка задае план навчання.
7. Оптимiзацiя кодовое' вiдстанi ёкг)т вiдбуваеться за рекурентною процедурою. При
цьому приймаеться Е^ (0) = 0 .
8.Процедура закшчуеться при знаходженнi максимуму КФЕ в робочш областi визначен-
ня його функцп: Ек(т = тахЕт, де{d} = {d1,...,dk ,...,dmax} 6 [0;d(xm © х1) -1] - множина радь
ушв концентрованих гiперсфер, центр яких визначаеться вершиною еталонного вектора
хк,т 6 Хк,т . При цьому множина № е так само множиною крокiв навчання системи розпiзнавання.
Таким чином, базовий алгоритм навчання е нерацшною процедурою пошуку глобального максимуму шформацшного КФЕ в робочш обласп визначення його функцп:
<(т=агё1т}хЕк(гт. (4)
{d} V '
Параметри навчання системи розтзнавання за базовим алгоритмом - оптимальш кодовi
вiдстанi {dk(m} i оптимальнi еталоннi вектори-реалiзацil {х^} для заданого алфавну {Хкг)т}
е обов'язковими вхiдними даними для функцiонування системи розтзнавання в режимi екзамену, тобто безпосереднього прийняття рiшень.
Таким чином, основною функщею базового алгоритму навчання у рамках 1Е1-технологп е обчислення на кожному крощ навчання шформацшного КФЕ i органiзацiя пошуку його глобального максимуму в робочш обласп визначення функцп критерда з метою визначення оптимальних геометричних параметрiв розбиття простору ознак на класи розтзнавання.
Як критерш оптимiзацil параметрiв навчання у рамках 1Е1-технологп може розглядатися будь-яка статистична шформацшна мiра, яка е функцюналом вiд точнiсних характеристик. Широкого використання в алгоритмах навчання набула модифшащя шформацшно1 мiри Кульбака [7], в якш розглядаеться вщношення правдоподiбностi у виглядi логарифмiчного вщношення повно1 ймовiрностi правильного прийняття ршень Р1 до повно1 ймовiрностi по-
милкового прийняття ршень Р:. Для рiвноймовiрних гiпотез, що характеризуе найбшьш важкий у статистичному розумiннi випадок прийняття ршень, мiру Кульбака подамо у вигщщ
Р
т-(г) 1 -ч.к.ш ,
[Р1,к,ш Р:,к,ш ] =
= ^
1,к,ш 2,к,ш
а к,ш + Р к
к,ш + ^2,к.
Р,к,ш = 0,5О1,к,ш + 0,5Б2,к,ш Р:,к,ш = 0,5а кш + 0,5Рк,ш-
) - (ак,ш +Рк,ш)] =
= ^
Г 2 - (ак,ш + Рк,ш) ^ а к,ш + Р к,ш
[2 - (ак,ш + Рk,ш)],
(5)
де 01,к,ш,0
к,ш э-^.к.ш > "-к.ш = Рк.ш
Рк,ш - точнiснi характеристики розпiзнавання реалiзацiй класу {Хкг)ш }:
перша i друга достовiрностi, помилки першого та другого роду вiдповiдно. 3. Реалiзацiя ieрархiчного алгоритму розтзнавання електронограм
Для реалiзащl прикладу роботи системи розтзнавання електронограм використовува-лись отримаш на просвiчуючому електронному мiкроскопi електронограми, зображет на рис. 1.
ш
б
а
в
г
д е ж з
Рис. 2. Електронограми: а - моза!чного монокристалу; б - з Юкучьлшями; в - текстури; г - полжри-сталу; д - алюмшш; е - №С1; ж - тодораюту; з - золота
Оброблення електронограм, зображених на рис. 2, здшснювалось у полярних координатах, як дозволяють зробити електронограми, що дослщжуються, iнварiантними до зсуву i повороту. При оброблент зображень в полярних координатах рядок навчально! матрицi -вектор-реалiзацiя образу формувався з ознак розтзнавання, як обчислювалися за формулою
N
©,=^, (6) N
де ©, - числове значення спектра в , -му радiусi кола зчитування, , = 1Д; 6. - значення
яскравосп в . -му шксел^ 1 = 1, N; N - загальна кшьюсть пiкселiв у колi зчитування. Було побудовано ieрархiчну структуру, яка зображена на рис. 2.
Рис. 3. Ieрархiчна структура алфавиу клаав розпiзнaвaння На першому ярус 1ерарх1чно! структури (рис. 3) розташовано чотири класи основних титв електронограм: монокристалу - клас X® (електронограми з рефлексами у вигляд1
плям), з Юкучьлшями - клас Х2), текстури - клас Х3) (з рефлексами у вигляд1 дуг) та полшристалу - клас Х® (концентричш кшьця). На другому ярус розташоваш: тодороют -клас Х(21), золото - клас Х^ та алюмшш - клас х421) I №С1 - клас х422 .
Базовий алгоритм навчання проводився при значенш параметра поля контрольних до-пусюв 5 дор1внюе 15. Графш залежносп усередненого КФЕ вщ рад1уса контейнера для
класу х4!) зображений на рис. 4.
Б'
-1(4)
Рис. 4. Графк залежносп КФЕ вiд радуса контейнера для класу х4!)
Свила дшянка на графшу рис. 4 визначае робочу область, в якш проводиться пошук глобального максимуму КФЕ (5). Анал1з графша показуе, що максимальне значення КФЕ для класу досягаеться при значенш рад1уса контейнера - = 37 { становить 2,53. При цьому мають мюце таю точнюш характеристики: перша достов1ршсть Б1=0.9, друга достов1ршсть
Б2=0,9, помилка першого роду а = 0,1, помилка другого роду в = 0,1.
Середне значення КФЕ тсля проведення навчання для першого ярусу 1ерарх1чно! структури дор1внюе Б = 2,01.
З метою перев1рки працездатносп розробленого 1ерарх1чного алгоритму в режим1 екза-мену на моштор комп'ютера електронного растрового мшроскопа РЕМ-103М виробництва ВАТ «8е1шЬ> (Суми, Украша) транслювалася електронограма алюмшш, яка в 1ерарх1чнш структур1 (див. рис. 3) знаходиться у другому ярус (клас х42)). Результати екзамену наведено на рис. 5.
Анал1з рис. 5 показуе, що у режим1 екзамену електронограма, що розтзнавалася, була правильно вщнесена до вщповщного класу за максимальним значенням геометрично! (дистанцшно!) функцп належносп реал1зацп образу вщповщному гшерсферичному контейнеру I обчислювалася за формулою
(г) i d(xk,m © X(j))
^ k,m = 1--d*-, (8)
dk,m
*(r) (j) • v(r) ...
де xk-, xu; - еталоннии вектор-реал1зац1я класу Xk,m i реал1зац1я класу, що розп1знаеться, в1дпов1дно; dk« - оптимальниИ рад1ус контеИнера класу X^ , побудованиИ на етап1 навчання.
Рис. 5. 1нтерфеИс програми в режим1 проведения екзамену
Таким чином, 1ерарх1чниИ алгоритм екзамену складасться з посл1довних процедур визна-чення максимально! функц1! належност1 (8) реал1зац1!, що розп1знаеться, класу першого ярусу 1ерарх1чно! структури, переходу на в1дпов1дну страту другого ярусу, визначення максимально! функцп належност1 для алфав1ту клас1в ц1е! страти 1 так до тих п1р, поки не буде знаИдено ф1нальну вершину, яка не утворюе свою страту.
Висновки
1. Запропоновано 1ерарх1чниИ 1нформац1Ино-екстремальниИ алгоритм розтзнавання елек-тронограм, одержаних в електронн1И м1кроскоп1! у режим1 м1кродифракц1!, якиИ шляхом оптим1зац1! у процес1 навчання параметр1в функц1онування за 1нформац1Иним критер1ем дозволяе пщвищити достов1рн1сть розтзнавання та зменшити чутлив1сть системи до зб1льшен-ня потужност1 1нформац1Иного фонду електронограм. При цьому оброблення електронограм у полярних координатах дозволяе забезпечити 1нвар1антн1сть алгоритму розтзнавання до !х зсуву та повороту.
2. У перспектив! при розширенн1 1нформац1Иного фонду електронограм для побудови безпомилкових за навчальною виб1ркою вир1шальних правил необх1дно зд1Иснювати оптим-1зац1ю додаткових просторово-часових параметр1в функц1онування системи розп1знавання.
Список лiтератури: 1. Томас Г., Гориндж М.Дж. Просвечивающая электронная микроскопия материалов: Пер. с англ. / Под ред.. Б.К. ВаИнштеИна. М.:Наука. 1983. 320 с. 2. Васильев В.И. Распознающие системы: Справочник. 2-е изд., перераб. и доп. Киев: Наук. думка. 1983. 422 с. 3. Duda R. O., Hart P. E., Stork D. G. Pattern Classification, second ed. John Wiley & Sons, New York, 2001. 738 p. 4. Shalkoff R.J. Digital image processing and computer vision. New York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989. 489 p. 5. Краснопоясовський А.С. 1нформацшниИ синтез штелектуальних систем керування, що навчаються: Пщхщ, що грунтуеться на метод1 функцюнально-статистичних випробувань. Суми: Видавництво СумДУ, 2003. 257 с. 6. Краснопоясовський А.С., Козинець М.В., Шелехов 1.В. Розтзнавання електронограм в електроннш мшроскопп // Открытые информационные и компьютерные интегрированные технологии. Харьков: Нац. аэрокосмическиИ ун-т «ХАИ», 2002. Вып. 12. С. 140-146. 7. ДовбишА.С., Мартиненко С.С. 1нформатИно-екстремальниИ метод розтзнавання електронограм // В1сник СумДУ. Техтчт науки, 2009. №2. С. 85-91.
Надшшла до редколегИ 14.11.2009 Довбиш Анатолш Степанович, д-р техн. наук, професор, завщувач кафедри шформатики Сумського державного утверситету. Науков1 штереси: шформащИниИ аиалiз 1 синтез штелектуальних систем, що навчаються (самонавчаються). Адреса: Укра!на, 40035, Суми, вул. Заливна, 7, кв. 40, р.т. (0542) 77-08-27, e-mail: [email protected].
Алтиншкова Катерина BamiiBHa, астрантка кафедри шформатики Сумського державного утверситету. Науков1 1нтереси: шформацшниИ анал1з 1 синтез штелектуальних систем, що навчаються (самонавчаються). Захоплення та хоб1 туризм та плавання. Р.т. (0542) 77-0827, e-mail: [email protected].