УДК 004.383.3
ТЕОРЕТИЧН1 ОСНОВИ Р03П13НАВАННЯ БАГАТОМ1РНИХ ОБРА31В У ХЕММ1НГ0В0МУ ПР0СТ0Р1
Б.Б. Крултовський1, А.1. Сидор2, О.М. Заставний3, Я.М. Николайчук4
Викладено теоретичнi основи розшзнавання образiв у двовимiрному Хеммшгово-му простора ОбГрунтовано перспективу застосування оцшки зважено' модульно' Хем-мiнговоí вщд^ розпiзнавання образiв шляхом сигнальних рештастих моделей у дво-вимiрному Хеммшговому просторi. Показано недолiки та функщональш обмеження в> домих методiв у задачах оцшки Хеммшгово' вiддалi багатомiрних образiв. Запропоно-вано метод опрацювання сигналiв двомiрного Хеммiнгового простору, у вузлах якого юнують багатовимiрнi об'екти, на основi кодування решiтчастих даних у теоретико-числовому базис Крестерсона.
Ключов1 слова: Хеммшговий простiр, розшзнавання, образи, сигнали.
Вступ. Теорiя розшзнавання обр^в е важливим iнструментом шформа-цшно! технологи опрацювання сигналiв та вдентифшаци станiв складних об'ектiв управлшня. Серед рiзних пiдходiв побудови алгоржмв розпiзнавання образiв широкого застосування набули методи розшзнавання одномiрних обра-зiв у Хеммiнговому просторi (ХП). Перспективним напрямком розвитку теори та вдосконалення методiв розпiзнавання образiв у ХП е кодування багатомiр-них об'екив у його вузлах та розширення теоретичних засад шляхом вдосконалення методiв кодування багатомiрних даних на основi рiзних теоретико-число-вих базиив.
У сучасних монiторингових системах розподшених об'ектiв управлiння, до яких належить, наприклад, монiторинг водних ресурсiв певного географiчно-го регiону, постае задача дiагностування монiторингових даних у неабстрак-тних вузлах ХП [1]. Поняття неабстрактного ХП пiд час мониторингового ска-нування географiчноi' територи полягае в тому, що вiддалi мiж вузлами не е од-наковими i не вiдображаються у виглядi квадратiв. Отже, цей ХП математично трансформуеться в абстрактний ХП, який видаеться у виглядi двомiрноl решгг-часто! функци без iдентифiкацii рiзних вiддалей мiж вузлами, що спрощуе математику задач розпiзнавання образiв у ХП згiдно з класичною теорiею матриць.
Водночас, iснуючi методи формалiзацii ХП практично не дають змоги розв'язувати задачi розпiзнавання багатомiрних образiв. Успiшне вирiшення цiеi' задачi також ускладнюеться обмеженою швидкодiею процесорних засобiв, якi, як правило, реалiзують арифметику двiйковоi' системи числення теоретико-числового базису Радемахера. Отже, виршення науково-техшчних задач роз-робки техшчних засобiв та процесорiв розпiзнавання багатовимiрних образiв у ХП е актуальною науково-прикладною задачею.
Теоретичнi основи методiв рочмпнаваннн обрамв. Розпiзнавання об-разiв (об'ектiв, сигналiв, процесiв, ситуацiй чи явищ) - це задача вдентифжаци об'екта або визначення його властивостей за зображенням (оптичне розтзна-
1 доц. Б.Б. Крултовський, канд. техн. наук - Тернотльський НЕУ;
2 астр. А.1. Сидор - Тернотльський НЕУ;
3 викл. О.М. Заставний, канд. техн. наук - Тернотльський НЕУ;
4 проф. Я.М. Николайчук, д-р техн. наук - Тернотльський НЕУ
вання), за аудюзаписом (акустичне розпiзнавання) чи за шшими характеристиками (наприклад, розшзнавання гармонiчних сигналiв).
Методика вiднесення елемента до якого-небудь образу е виршальним правилом метрик, якi вiдображають спосiб визначення вiдстанi мiж елементами ушверсально!' множини. Чим менша ця ввдстань, тим бiльш схожими е об'екти. Елементи образу задаються у виглядi набору чисел, а метрика - у виглядi фун-кцп. Ввд вибору представлення образiв i реалiзащl метрики залежить ефектив-нiсть програми, один алгоритм розшзнавання з рiзними метриками буде поми-лятись з рiзною частотою. Образи можуть бути представлен бiнарними та бага-торiвневими векторними кодами, двовимiрними та багатовимiрними матрицями згiдно з виразами:
Ох = (аи-1,аи_2,...,аи...,ао); Охх =
1 а12 а21 а22
а1т а2т
; Оххх = а
(1)
ап1 ап1 ••• апт
Вибiр способу кодування образiв впливае на обчислювальну та апаратну складнiсть !х розшзнавання, що враховуеться пiд час розв'язання конкретних задач розпiзнавання та вдентифжацп образiв• Загальну структуру системи розшзнавання та етапи в процесi и розроблення показано на рис. 1.
Система розшзнавання Рис. 1. Структура системи розшзнавання
Важливими е таю типи задач розшзнавання: задача розшзнавання - ввд-несення пред'явленого об'екта за його описом до одного iз заданих класiв (нав-чання з учителем); задача автоматично!' класифжацп - розбиття множини об'ек^в ситуацiй, явищ за 1х описом на систему непересiчних класiв (таксоно-мiя, кластерний аналiз, самонавчання); задача вибору шформативного набору ознак тд час розпiзнавання; задача приведення вихвдних даних до зручного для розшзнавання вигляду; динамiчне розпiзнавання i динамiчна класифiкацiя - за-дачi 1 i 2 для динамiчних об,ектiв; задача прогнозування - суть попереднш тип, в якому ршення повинно вiдноситись до деякого моменту в майбутньому.
Задачi розпiзнавання складаються з двох етапiв: перетворення вихвдних даних до зручного для розшзнавання вигляду; розшзнавання (вказання прина-лежност об'екта визначеному класу). Пiд час виконання задач розшзнавання образiв потрiбно: вводити поняття аналоги об'ектiв i формулювати правила, на основi яких об'ект зачисляеться в один i той же клас або в рiзнi класи; оперува-ти набором прецедентiв-прикладiв, класифiкацiя яких вiдома i якi у виглядi формалiзованих описiв можуть бути представленi алгоритмом розшзнавання для налаштування на задачу в процесi навчання; будувати формальнi теорп та
застосовувати класичш математичш методи. Видiляють такi методи розтзна-вання образiв: перебору, в цьому випадку проводиться порiвняння з базою да-них, де для кожного виду об'екив представленi вс можливi модифiкацii ввдоб-раження; аналiз та диференцiацiя компонентiв образу; використання штучних нейронних мереж; генетичнi алгоритми.
Метод перебору характеризуеться найбiльшою обчислювальною та часовою складнiстю i може застосовуватись в тому випадку, коли число класiв образу е сюнчене, тобто не перевищуе заданого числа. Метод аналiзу та дифе-ренцiацii компонентiв образу характеризуеться полiномiальною складнiстю, ба-зуеться на теори моделювання у Байeсiвському пiдходi та в застосуванш кодо-вих вщдалей Хеммiнгового простору. Метод використання штучних нейронних мереж Грунтуеться на принципах навчання та рекурсивно! асимптотично! складноси. Методи на основi використання генетичних алгоритмiв Грунтують-ся на принципах еволюцшного пошуку i поеднують комп'ютерне моделювання генетичних процемв у природних i штучних системах. Важливим компонентом методiв та iнформацiйних технологiй розтзнавання образiв е попередне !х об-роблення та перетворення. Формалiзацiя ввдомих методiв розпiзнавання одно-мiрних образiв описуеться такими функцiоналами (табл. 1) [3].
Табл. 1. Функцюнали методгв розтзнавання одномщтих образгв
№
Формула
ач Ч £( х'к - хк)
<% = ( X - х]) 5-1( X- х])
Чк -х}к\
- хгк х]к\
2
3
4
р
5
к-1
У табл. 1: d^j - значення Евктдово! вiдстанi мiж ¡-тим i ]-тим об'ектами; хгк - чисельне значення к-то! ознаки для ¡-того об'екта; х]к- чисельне значення кто! ознаки для]-того об'екта; 2 - кiлькiсть ознак, якими описуються об'екти.
З кластерного анатзу вiдомо, що "вiдстанню мiж об'ектами" (тобто мь рою схожоси, близькостi об'ектiв мiж собою за виею сукупнiстю використову-ваних ознак) може слугувати деяка величина d¡j, яка задовольняе таю аксюми: 1. dij>0 (позитивнiсть вiдстанi); 2. dij>dji (симетрiя); 3. dij+djk> dik (нерiвнiсть три-кутника); 4. Якщо d¡j не дорiвнюе 0, то г не дорiвнюе ] (розрiзнюванiсть нето-тожних об'ектiв); 5. Якщо d¡j=0, то ¡=] (нероздiльнiсть тотожних об'ектiв).
Замiсть звичайно! Евклiдово'i ввдсташ використовують И квадрат d¡2. Ок-рiм цього, у рядi випадкiв використовують "зважену" Евклiдову вщстань, при обчисленнi яко1 для окремих доданюв використовують ваговi коефiцiенти. Уза-гальненi ступеневi вiдстанi Мiнковського використовують будь-яю числа "p", обгрунтоване значення якого конкретизуеться в окремих випадках розтзнавання образiв. Якщо р=2, отримують звичайну Евклiдову вiдстань. Вираз для уза-гальненоi' метрики Мшковського матиме вигляд (див. табл. 1, № 2).
Отже, манхеттенська ввдстань е сумою модул1в р1зниць в1дпов1дних оз-нак об'екив. Спрямувавши р до несюнченноси, отримаемо метрику "домшу-вання" або Sup-метрику (див. табл. 1, № 3). Метрика Мшковського фактично е великим имейством метрик, що включае 1 популяршш1 метрики. Проте юнують методи обчислення ввдсташ м1ж об'ектами, що принципово в1др1зняються в1д метрик Мшковського. Важлившою з них е т. зв. вщстань Махаланобюа, яка мае достатньо специф1чш властивосп. Вираз для ще! метрики (див. табл. 1, № 4).
Тут через XI \ X/ позначено вектор-стовпщ значень змшних для г-того 1 /того об'екив. Символ Т у вираз1 (хг - X/)т позначае операщю транспонування вектора. Символом позначено загальну внутршньогрупову дисперсшно-кова-р1ацшну матрицю. А символ -1 над 5 означае, що потр1бно обернути матрицю 5. На вщмшу в1д метрики Мшковського 1 Евклвдово! метрики, ввдстань Махала-нобюа через матрицю дисперсш-ковар1ацш 5 пов'язана з корелящями змшних. Коли кореляци м1ж змшними дор1внюють нулю, ввдстань Махаланобюа екшва-лентна квадрату Евклвдово! ввдсташ. У раз1 використання дихотом1чних (що ма-ють всього два значення) яюсних ознак, широко використовують зважену ввд-стань Хеммшга (див. табл. 1, № 5), що дор1внюе числу несшвпадань значень ввдповвдних ознак для г-того 1 /-того об'екив.
Анал1з досввду застосування р1зних метод1в розтзнавання образ1в у р1з-них сферах опрацювання сигнал1в та цифрових даних дае змогу констатувати таке: 1. В1дом1 методи вузькоспец1ал1зоваш 1 не характеризуются ушверсаль-шстю до р1зних образ1в; 2. Кореляцшш методи найбшьш ефективш, але за виз-наченням деяких автор1в вважаються низькошвидюсними та апаратно-складни-ми, оскшьки передбачають складне попередне статистичне оброблення образ1в, зокрема обчислення математичного спод1вання, дисперси, автокореляцшно! функци; 3. В1дом1 методи розшзнання у Хеммшговому простор1 недостатньо ефективш, оскшьки використовуються для образ1в, яю описуються бшарними векторами, а також не враховують можливють застосування р1зних аналгеичних вира-з1в взаемокореляцшних функцш та можливостей кодування даних у р1зних ТЧБ.
Устхи у розробленш високопродуктивних швидкодтачих спецпроцесо-р1в кореляцшного опрацювання сигнал1в на основ1 р1зних ТЧБ [1], потужш можливоси сучасно! м1кроелекгрошки 1 САПР створюють широю можливоси розвитку теори та ефективного застосування метод1в розтзнавання багатор1в-невих образ1в у ХП, що визначае високий р1вень актуальноси розв'язання цих задач на основ! спецпроцесор1в та кодових систем р1зних ТЧБ.
Розширення поняття хеммшгово! в1ддал1 та аналггики оцшки Хеммшгово! в1ддал1 на основ1 математичних вираз1в р1зних взаемокореляцшних функцш. В1дома аналггика класичних авто- та взаемокореляцшних функцш, яю використовуються в кореляцшних методах розтзнавання образ1в [2]:
1. Теор1я кореляцшних моделей SD:
1 п 1 п
• знаков^ Нхх(/) =~ I sign(xi) х .^п(хг+ /), Нху(/) =- I sign(xi) х sign(yi+ /);
п i=1 -1 Щ=1 -1
1 п 1 п
• релейнi: Рхх(/) = xi х ^(х^/), РхуЦ) = ^^ xi х sign(yi+/);
1 п 1 п
• коварiцiйнi: КххЦ) -- I хг х хг+ /, Кху(]) - - Е хг х у+ /;
п ¡=1 J ' п ¡-1 7
1 п 1 п
• кореляцiйнi: Яхх(]) - - I -х/' х хс/+ /, ^ху(/) - _ I ххг х у>г+ /;
п ¡-1 п/ -1
1 п 2 1 п 2
• структурнi: ахх(/') - - Е (х- - x¡+ /)2 Оху(]) - - Е (x¡ - y¡+ /)2;
п ¡-1 J п ¡-1 7
1 п 1 п
• модульнi: Охх(]) - - I I ху - х^ /1, Оху(]) - - Е I ху - y¡+ /1;
п ¡-1 ■> п ¡-1 7
1 п „ 1 п „
• еквiвалентностi: Рхх(]) - - I ¿хх, Рху(/) - - I 2ху .
п ¡-1 п ¡-1
Теоретичш закони розтзнавання образ1в на основi спектрального косинусного перетворення Фур'е та рiзних теоретико-числових базишв.
Розтзнавання образ1в може виконуватися на основ1 обчислення функцш взаемокореляцп м1ж автокореляцшною та базисною функщею теоретико-числового базису Фур'е, Радемахера, Галуа та Крестенсона. Приклади ортогональних функцш названих базиЫв наведено на рис. 2.
Уолша
Рис. 2. Системы ортогональных функцш ТЧБ
Вир1шення задачi оцшки Хеммшгово!' вiддалi. Вир1шення проблеми вдосконалення метод1в оброблення сигнал1в кореляцп пропонуе основш мож-ливосл для тдвищення ефективноси алгоритм1в 1 процеЫв розтзнавання обра-з1в в Хеммшговому простор1 [4], що наведено в табл. 2.
Табл. 2. Алгоритм розтзнавання в одновим1рному Хемм1нговому простор1
1 N-1, . „ 1 N-1 _ 1 ^ _ 2
- — /Е0 Щ - |е/ - х/||; ХРР - — /10 ЩЬ х1)); ХР2С - I Щ - 22(е/, х/)) ;
N ХКК -
-01 * 1 * N -1 /-0 1 1 1 N -1 /-о
1 N-1 1 N-1 : 1 N-1
-У щ/-в/-х/; ХСК --У щ ■ (е/ - х/)2; ХОР --У 2:(щ/,| е/ - х/1;
N -1 У 1 1 N -1 У 1 N -1 уУо
1 N-1 1 N-1 1 N-1
Х^2С - —- У (щ - 22(е/, х/))2; ХКР --— £ 2?(щ е/ ■ х1); ХКО - — X I Щ - е/ ■ х/1;
М -1 /-0 М -1 /-0 М -1 /-0
1 N-1 1 N-1 1 N-1
ХРК --— £ щ ■ г(е/,х/); ХСР - -— X (е/ -х/)2); ХСО - -— X I Щ -(е/ -х/)2 |; М -1 /-0 ^ -1 /-0 ^ -1 /-0
1 N-1 1 N-1 1 N-1
ХРК --— X щ ■ %/, х/); ХРО --— X I Щ/ - *(е/, х/) |; ХР2К - —- X Щ ■ ^2(е/, х/). ^ - 1 /-0 ^ - 1 /-0 ^ - 1 /-0
Теоретичш основи розтзнавання образе у двомiрному Хеммiнгово-му просторi. Синтез стандартизовано!' матрищ формування пакетiв багатомiр-них даних у ТЧБ Крестерсона дае змогу формалiзувати процеси розтзнавання образiв у Хеммiнговому просторi [3, 6] (рис. 3).
31 32 .... ез ГбДтоаР^,); Мк= ... [йй(тоаРя);. 1=1 В,.= у; щ = 1(тос1Р,); т, е 0,Р, -1
Т(Ь1,Ь2, ... Ьп) ви-1
3 ,
\Ык
Оп-2 еп-1 еп
т
Рис. 3. Синтезована матриця двомiрного ХП формування багатомiрнuх даних на основi 1х побудовиу теоретико-числовому базиа Крестенсона
Аналггичш вирази проце^в та алгоршгшв розтзнавання образiв на осно-вi рiзних взаемокореляцтних функцiй та теоретико-числових бази^в у двомiр-ному Хеммiнговому просторi наведено у табл. 3.
Табл. 3. АналШичт вирази оцтки двомiрного Хеммтгового простору
1 N-1N-1 _ 1 N-1N-1
х°°=^-г Е Е К-\еа- х4; Т Т \еи- ха|);
я - 1 1=0 а=0 М - 1 1=0 а=0
1 N -1N-1 _ 1 N-1N-1
хк° = ^"Г Е Е К- еа ■ хч\; х^к = ^"Г Т Т Ка ■ ха);
я -11=0 а=0 7У -11=0 а=0
_ 1 N -1N-1 „ 1 N-1N-1
=^-т Т Т К - х,])\; хРО=—— Е Е К - ха)\;
м -1 г=0 а=0 ^ -11=0 а=0
_ 1 N-1N-1 _ 1 N-1N -1
х^к=~т—л Т Т К • ^(еа' хи); хк^=~т—л Т Т Фа % • хи);
^ -1 =0 у=0 ^ -1 1=0 а=0
1 N-1N-1
ХР2О = — ЕЕ К - ^ ха)
^ -1 г=0 у=0
Математичнi вирази розтзнавання образiв у двомiрному ХП, як буду-ються на основi обчислень модульно! рiзницi, не мютять алгоритмiчно склад-них операцiй, що створюе перспективу застосування таких ощнок Хеммшгово! вiддалi для побудови високопродуктивних спецпроцесорiв [5].
Висновок. Викладено теоретичт основи методiв розпiзнавання образiв в одномiрному та двомiрному ХП на основi аналiтики рiзних взаемокореляцтних функцiй та ТЧБ. Аналiз аналггичних виразiв розпiзнавання образiв у двовимiрному ХП демонструе наявнiсть таких операцШ: визначення знаку, вщ-нiмання, модульно! рiзницi, пiднесення до квадрата, перемноження, порiвняння, визначення меншого iз двох, сумування та цшочисельного дiлення.
Можливють реалiзацií такого класу спецпроцесорiв на основi кодових систем ТЧБ Радемахера, Крестенсона та т. потребуе вщповщного синтезу !х базових компонентiв типу: АЦП, регiстрiв пам'ятi та зсуву, лiчильникiв, квадра-торiв, перемножувачiв, пристро!в матрично-модульних операцiй та асощатив-но! пам'ятi.
Лггература
1. НиколайчукЯ.М. Проблеми структуризацп iнформатики мониторингу нафтових родо-вищ та захисту водних ресурсiв Карпат / Я.М. Николайчук, Б.Б. Крулiковський, Н.Я. Возна, Г.Я. Процюк // Вiсник нащонального унiверситету водного господарства та природокористуван-ня. - Сер.: Технiчнi науки. - Рiвне : Вид-во НУВГП. - 2015. - Вип. 3 (71), ч. 2. - С. 259-265.
2. Nykolaichuk Yaroslav. Integratet Theori of Analytically Defined and Multifunctional Data Structuring / Yaroslav Nykolaichuk, Nataliia Vozna // CADSM, 2015. - Pp. 147-152.
3. Zavedyuk T. The method of detection of transients in power systems based on neural processor square-pulse conversion of harmonic signals / T. Zavedyuk, Y. Nykolaychuk // Proceedings of the 6-th International Conference "Advanced Computer Systems and Networks: Design and Application" (ACSN'2013). - September 16-18, 2013. - Lviv, Ukraine. - Pp. 171-172.
4. НиколайчукЯ.М. Методи спектрального косинусного перетворення Фур'е для розшзна-вання сигналiв у Хеммшговому простер на основi рiзних кореляцшних функцш та теоретико-числових базиав / Я.М. Николайчук, В.Я. nix, Т.О. Заведюк, Н.Я. Возна // Вюник Нащонального ушверситету "Львiвська полiтеxнiка". - Сер.: Електрошка. - Львiв : Вид-во НУ "Львiвська поль теxнiка". - 2013. - С. 89-99.
5. НиколайчукЯ.М. Коди поля Галуа: теорiя та застосування : монографш / Я.М. Николайчук. - Терношль : Вид-во "Тернограф", 2012. - 575 с.
Надшшла до редакцп 24.03.2016 р.
Круликовский Б.Б., Сыдор А.И., Заставный О.М., Ныколайчук Я.М. Теоретические основы распознавания многомерных образов в Хемминго-вом пространстве
Изложены теоретические основы распознавания образов в двумерном Хемминго-вом пространстве. Обоснована перспектива применения оценки взвешенного модульного Хеммингового расстояния распознавания образов путем сигнальных решетчатых моделей в двумерном Хемминговом пространстве. Показаны недостатки и функциональные ограничения известных методов в задачах оценки Хеммингового расстояния многомерных образов. Предложен метод обработки сигналов двумерного Хеммингово-го пространства, в узлах которого существуют многомерные объекты, на основе кодирования решетчатых данных в теоретико-числовом базисе Крестенсона.
Ключевые слова: Хемминговое пространство, распознавание, образы, сигналы.
Krulikovskyy B.B., Sydor A.I., Zastavnyy O.M., Nykolaychuk Ya.M. Theoretical Basis for Multidimensional Patterns Recognition in Hamming Space
This paper contains the theoretical bases of patterns recognition in two-dimensional Hamming space. The perspective of application of modular weighted Hamming distance of patterns recognition evaluation by using signal lattice modules in two-dimensional Hamming space is grounded. The weaknesses and functional limitations of known methods in the tasks of Hamming distance of multidimensional patterns evaluation are shown. The method of processing of two-dimensional Hamming space signals in the nodes is proposed, where the multidimensional objects exist on the basis of lattice data in Kresterson theoretical-numerical basis coding.
Keywords: Hamming space, recognition, patterns, signals.