Научная статья на тему 'ЗАСТОСУВАННЯ ПОЛіНОМіВ КУНЧЕНКА ДЛЯ АНАЛіЗУ СТАТИСТИЧНИХ ДАНИХ'

ЗАСТОСУВАННЯ ПОЛіНОМіВ КУНЧЕНКА ДЛЯ АНАЛіЗУ СТАТИСТИЧНИХ ДАНИХ Текст научной статьи по специальности «Математика»

CC BY
68
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СРАВНЕНИЕ С ЭТАЛОНОМ / ПРОСТРАНСТВО С ПОРОЖДАЮЩИМ ЭЛЕМЕНТОМ / ПОЛИНОМ КУНЧЕНКО / МИКРОФАЙЛ / TEMPLATE MATCHING / SPACE WITH A GENERATIVE ELEMENT / KUNCHENKO POLYNOMIALS / MICROFILE

Аннотация научной статьи по математике, автор научной работы — Чертов О. Р., Тавров Д. Ю.

В работе рассмотрены теоретические начала и практические аспекты использования полиномов приближения в пространстве с порождающим элементом (пространстве Кунченко) для анализа статистических данныхI

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n the paper, we discuss theoretical basics and practical aspects of applying approximation polynomials in a space with a generative element (a Kunchenko space) to statistical data analysis

Текст научной работы на тему «ЗАСТОСУВАННЯ ПОЛіНОМіВ КУНЧЕНКА ДЛЯ АНАЛіЗУ СТАТИСТИЧНИХ ДАНИХ»

У po6omi розглянуто теоретичш засади та практичш аспекти використання полi-HOMie наближення в просторi з породжу-ючим елементом (просторi Кунченка) для аналiзу статистичних даних

Ключовi слова: порiвняння з еталоном, простiр iз породжуючим елементом, полi-

ном Кунченка, мкрофайл

□-□

В работе рассмотрены теоретические начала и практические аспекты использования полиномов приближения в пространстве с порождающим элементом (пространстве Кунченко) для анализа статистических данных

Ключевые слова: сравнение с эталоном, пространство с порождающим элементом,

полином Кунченко, микрофайл

□-□

In the paper, we discuss theoretical basics and practical aspects of applying approximation polynomials in a space with a generative element (a Kunchenko space) to statistical data analysis

Keywords: template matching, space with a generative element, Kunchenko polynomials, microfile

УДК 004.931:517.518.3

ЗАСТОСУВАННЯ ПОЛ1НОМ1В КУНЧЕНКА ДЛЯ АНАЛ1ЗУ СТАТИСТИЧНИХ ДАНИХ

О.Р. Чертов

Кандидат техычних наук, доцент*

Д.Ю. Тавров

Астрант*

*Кафедра прикладноТ математики Нацюнальний техшчний уыверситет УкраТни «КиТвський

пол^ехшчний шститут» пр. Перемоги, 37, м. КиТв

Вступ

В останнг десятилитя великого поширення здо-була галузь обробки цифрово! гнформацп, пов'язана з пошуком окремих наперед визначених властивостей чи образiв у деякому заданому масивi даних. Задачi такого типу належать до розпгзнавання образiв (pattern recognition) [1, 2].

Потреба мати справу з такого роду завданнями постае в доволi рiзних сферах людсько! дiяльностi: вгд забезпечення машинного зору та розтзнавання людського почерку до гнтелектуального аналiзу даних. У данш робот зосередимо увагу на таких задачах, де образ чи властивгсть, якг ми хочемо вiднайти в пито-мому масивi даних, вiдомi заздалеггдь, причому на-лежний образ називатимемо шаблоном чи еталоном. Вiдповiдний напрям дослгджень мае назву порiвняння чи спгвставлення з еталоном (template matching).

Зазвичай, постановка тако! задачi включае в себе данг для аналiзу, деякий шаблон для пошуку та, можли-во, область, на якiй потрiбно здiйснювати такий пошук. При цьому потрiбно як правильно обрати представлен-ня вхiдних даних, так i визначити критерп, за якими вгдбуватиметься спгвставлення шаблону з сигналом.

Даш можна представити ргзними способами. Це може бути звичайний цифровий сигнал або двовимгр-не графгчне зображення (при чому, в останнгй час було запропоновано низку пгдходгв до зведення двовимгр-них зображень до одновимгрних: див., наприклад, [3]).

У ргзних джерелах можна знайти розмайий набгр пгдходгв, метрик та вгдстаней, якг можна використо-вувати при поргвняннг з еталоном. Наприклад, за-стосовують такг пгдходи, як принцип оптимальностг

Белмана (Bellman) [4], пгдхгд гз вгдстанню редагуван-ня для аналгзу символьних рядкгв [5], а також пгдхгд гз використанням кореляцгй ([6, 7]).

Даний напрямок активно розвиваеться й донинг, зокрема, зовсгм нещодавно було запропоновано аль-тернативний спосгб забезпечення пошуку шаблонгв гз використанням технологи найближчого сусгда [8].

У данш роботг ми пропонуемо новий метод по-шуку заздалеггдь визначеного шаблону в цифровому сигналг, який базуеться на застосуваннг полгномгв Кунченка, та обговорюемо можливгсть використання цього методу для перевгрки статистичних ггпотез пгд час опрацювання статистичних даних.

Постановка завдання

Маемо (двовимiрний) масив статистичних даних, отриманих у результат визначеного статистичного спостереження, наприклад, перепису населення. 1снуе припущення про наявнiсть у розподШ значень окремих атрибутiв певних закономiрностей (шаблонiв). Потрiбно перевiрити справедливость цього припущення шляхом побудови полiномiв наближення в просторi з породжуючим елементом.

1. Загальш теоретичш вщомоси

1.1. Побудова полiномiв наближення в просторi з породжуючою функщею

У роботi [9] Ю.П. Кунченком було докладно представлено процедуру побудови полiномiв наближення

в просторi з породжуючою функцieю i наведено низку прикладiв, якi переконливо шдтверджують ефектив-нiсть такого шдходу для апроксимацii функцiй. У даному пщроздШ торкнемося основних моментiв i на-ведемо найважливiшi результати, отримаш Ю.П. Кун-ченком та необхщш для викладення подальшого мате-рiалу. За детальнiшою iнформацieю можна звернутися до монографп [9].

Отже, нехай задано так звану породжуючу функ-цiю f(x) , визначену на промiжку [a,d]. Тодi, введемо впорядковану множину породжених функцш наступ-ного вигляду:

иу(х) = цт[f(x)], х еМ] , (1)

де ЦуО - дiйснi функцii, пiдiбранi певним чином.

Якщо ввести на цш множинi лiнiйнi операцii дода-вання та множення на число, то множина в«х лшшних комбiнацiй породжених функцш сформуе лiнiйний простiр.

Осюльки деякi з породжених функцiй (1) можуть виявитися лшшно залежними, пропонуемо визначити просторово утворюючу множину функцш, утворену як об'еднання множини лшшно незалежних породжених функцш iз (1). Вщповщно, лшшний простiр, утворений на такш множинi, називатимемо лшшним простором над незалежними породженими функщя-ми (лiнiйним простором Кунченка) та позначатимемо його через LFKu.

Визначимо в просторi LFKu скалярний добуток

двох елеменпв звичним чином:

а а

К(х)>ик(х)) = 1 Цу(х)-ик(хМх = 1 ик^(х)]ах . (2)

а а

1з формули (2) випливае визначення вщсташ мiж двома елементами лшшного простору Кунченка як норми рiзницi двох функцiй:

4 фу(х) - ик(х)|2 = }[иу(х) - ик(х)]2^.

(3)

Якщо для вах породжених функцiй, що утворюють простiр LFKu, можна ввести скалярний добуток (2), то такий проспр називатимемо простором LFKu зi ска-лярним добутком.

Проспр LFKu, у якому множина породжених функцш складаеться пльки з лшшно незалежних, попарно (повшстю чи частково) неортогональних функцш, називатимемо простором (Кунченка) з породжуючим елементом. Шд частковою неортогональнiстю породжених функцш розумiемо ситуацiю, коли одна iхня непорожня частина е попарно неортогональною, а шша - попарно ортогональною.

Надал^ значення скалярного добутку (2) також називатимемо корелянтою двох функцш иу(х) i ик(х) розмiру (у,к) , яку позначатимемо наступним чином:

^ = | иу(х). Uk(x)dx.

ВД- Xб„иу(х) = боио(х) + Xбупу(х) .

Якщо розглянути задачу мiнiмiзацii ввдсташ мiж полiномом Кунченка (5) та основною функщею иь(х) :

рЬр = 1 [иь(х) - Рг(х)]2^,

(6)

то можна показати [9, с. 75-76], що коефщенти бу, у Ф 0 знаходяться з наступноi системи лiнiйних рiвнянь:

ЁбЛ,к = V = 1,Г, V Ф Ь,

(7)

к=1 к*Ь

де центрованi кореляти Fуk = ^ук -¥у и0(х)|| ,

А Ф

| иу(х)' u0(x)dx

и0(х)2 Ги2(х)

I и2(хМх

Коефiцiент б0 повинен дорiвнювати наступному виразу:

бо = ^ь -Ё бу^у .

У=1

уфЬ

(8)

Якщо шдставити коефiцiенти (7-8) у вираз (6), то ми отримаемо:

С2ЬР = -.Ь (9)

де так звана шфоркуна полiнома (5) мае вигляд

Л ^у.Ь = ХХ бУбк^ ,к .

у=1 у=1 к=1

у*Ь у*Ь к*Ь

Нарештi, уведемо чисельний показник якостi на-ближення полшомом (5) основноi функцii иь(х):

ег = а-"-. (10)

I(иь(х)-^ь ■ ио(х))2ах

(4)

Також, виберемо деяку породжену функщю иь(х), яку назвемо основною. Тод^ можна утворити так званий полшом Кунченка iз породжених функцш иу(х), у Ф ь, як назвемо доповнювальними:

у=1 у*Ь

(5)

Коефвдент (10) називатимемо коефiцiентом ефек-тивноси наближення полiнома з доповнювальних функцш до основноi функцii. Що ближче даний коефь цiент до 1, то краще е наближення полшомом Кунченка вiдповiдноi функцii [9, с. 86].

Варто зазначити, що осюльки множина доповнювальних функцш складаеться з повшстю або частково неортогональних функцш, а основна функщя не входить до множини доповнювальних, то ситуащя, за я^ коефвдент ефективносп (10) дорiвнюе 1, можлива пльки в граничному випадку, коли порядок полшома Кунченка г прямуе до нескшченность

1.2. Застосування ще! побудови полiномiв Кунченка до задачi розпiзнавання шаблону в сигналi

Розглянемо модифiкацiю описаного вище шдходу до побудови полшома Кунченка, виходячи з потреб задачi розшзнавання певного шаблону в сигналь

Спочатку визначимо, яю вхщш данi ми повинш мати для розв'язання поставленоi задачi, а потiм ука-жемо для них мшце в схем^ запропонованiй Ю.П. Кун-ченком [9].

Отже, для виконання розшзнавання конкретного образу в деякому сигналi ми повинш мати сам сигнал s(x), визначений на промiжку [а,а], а також певний функцюнальний шаблон ш(х), х е[а^] . За таких по-чаткових даних нам потрiбно отримати вiдповiдну кiлькiсну оцiнку схожост обраного шаблону на сигнал для аналiзу.

Таким чином,

- у якост ochobhoï функцп Bi3bMeMO початковий сигнал: ub(x) = s(x) ;

- у якосп доповнювальних функцiй потрiбно взяти лшшно незалежнi та частково неортогональнi на про-мiжку [a,d] функцiональнi перетворення шаблону:

uv(x)=цЛш(х)];

- юльюсною характеристикою схожостi шаблону та сигналу може слугувати коеф^ент ефективносп (10).

Проте, дану схему можна застосувати до ощнки схожостi двох функцш, визначених тiльки на одному й тому ж промiжку. У багатьох практичних задачах довжина шаблону значно коротша за довжину сигналу, тому шнуе потреба у визначенш дiлянок сигналу, яю вiдповiдають якнайбiльшiй близькостi до шаблону.

Розглянемо сигнал s(x), який визначено на про-мiжку [a,d], та шаблон ш(х) визначений на шшому промiжку [i,j] ç [a,d]. При цьому для нас непринци-пово, яких конкретно значень набувають числа i та j; важливо лише, що обидва щ числа лежать на промiжку [a,d], i довжина промiжку [i,j] фжсована. Тодi, можна здiйснити процедуру побудови полшома Кунченка для кожноï д^янки початкового сигналу s(x) довжиною I i - j|, яку ми назвемо вжном.

У результат^ ми отримаемо множину значень кое-фiцiентiв ефективностi:

E = {e(x)} Vx e[a,d - i + j +1], (11)

яку назвемо ефективною множиною, а графж, що представляе значення з ще! множини, називатимемо ефектограмою. Аналiзуючи ефектограму, можна виз-начити, якi д^янки сигналу i наскiльки вiдповiдають запропонованому шаблону.

1.3. Використання полiномiв Кунченка при аналiзi статистичних даних мiкрофайлiв

Процедуру побудови полiномiв наближення Кунченка разом iз чисельним показником якосп такого наближення в виглядi коефiцieнту ефективностi можна застосовувати до аналiзу статистичних даних.

Якщо первиннi статистичнi данi зведено до мжро-файлу (див. табл. 1), де кожному респонденту rk, k = 1,ц спiвставлено значення zkn атрибутiв un, n = 1,n , то можна скористатися визначеннями, запропонованими в роботах [10] та [11]. Зокрема, для нас принциповими е поняття сутшсних (vital), тобто найважливших iз погляду розв'язуваноï задачi, атрибутiв та !хшх комбь нацiй i параметризуючих (parameter) атрибупв, тобто атрибутiв, за значеннями яких будуеться розподш сутшсних комбiнацiй значень.

Таблиця 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Дат мкрофайлу, оформленi в виглядi таблиц

бiнацiï. Тодi, вiдповiдно до [10], можна збудувати юль-кiсний сигнал, який складаеться з юлькостей повторень конкретноï пари «сутшсна комбiнацiя - параметризуюче значення». У контекстi поставленоï задачi по розтзна-ванню шаблону в деякому сигналу у якосп такого юль-кiсного сигналу вiзьмемо сигнал s(x) iз тieю додатковою умовою, що параметризуючi значення повинш бути впо-рядкованi за певним заздалепдь визначеним правилом (наприклад, якщо параметризуючим атрибутом е «вж», то ввдповвдш значення можна впорядкувати за зростан-ням). Звiсно, окрiм юльюсного сигналу можна взяти будь-який шший масив даних, який у тш чи iншiй мiрi задовольняе вимоги конкретного дослвдження.

У якостi ж шаблону ш(х) можна вибирати таю функщональш залежностi, якi було отримано шляхом певного попереднього аналiзу статистичних даних. Тобто, шшими словами, полшоми Кунченка зручно використовувати для перевiрки певних статистичних гiпотез по розпод^у значень сутнiсних атрибутiв вщ-повщно до деяких практичних мiркувань.

У наступному роздШ ми запропонуемо деюлька конкретних практичних прикладiв застосування ви-кладеноï iдеï.

2. Практичнi результати

2.1. Визначення початкового сигналу для аналiзу

Для демонстрацп можливостей запропонованого методу з застосуванням полгномгв Кунченка до пошу-ку певних шаблонових закономгрностей у статистич-них даних, ми виргшили взяти 5-вгдсотковг мгкроданг, що стосуються перепису населення, проведеного Бюро перепису США [12] у 2000 р. При цьому ми виргшили обмежитися даними по штату Калгфорнгя як най-чисельнгшому за населенням та найпотужнгшому за економгчним розвитком.

У силу загальних мгркувань (велика вибгрка не-залежних випадкових величин), розподгл середнього доходу домогосподарства в залежностг вгд вгку голо-ви останнього повинен бути достатньо близький до нормального. Тому поставимо бгльш складну задачу: спробуемо вгдшукати в указаному розподглг дглянки, що мають розподгл, близький до нормального. 1сну-вання декглькох таких дглянок може свгдчити про те, що дослгджуваний розподгл утворений декглькома нормально розподгленими величинами. Щоб перевг-рити наявнгсть тако! ситуацп, нам потргбно спочатку збудувати вгдповгдний сигнал для аналгзу.

У якостг такого сигналу s(x) ми виргшили взяти дещо модифгковану версгю кглькгсного сигналу, опи-саного в попередньому роздглг. Для сформування цьо-го сигналу, ми визначили наступнг атрибути:

- за сутнгсний атрибут ми вибрали атрибут «Family Total Income in 1999" ("Сукупний дохгд родини в 1999 р.»), котрий повнгстю вгдповгдае нашгй постановцг задачг, оскгльки мгстить вичерпну гнформацгю про ргвень доходу конкретно! сгм'! за 1999 р.;

- у якостг параметризуючого атрибуту ми взяли атрибут «Age» («Вгк»), тому що значення саме цього атрибуту нам потргбно використовувати для впоряд-кування значень кглькгсного сигналу.

Визначивши вгдповгднг атрибути, ми пгдрахували середнгй дохгд на родину по всгх респондентах одного

атрибути

U1 U2 U3

респонденты Г1 z11 Z12 Z13

Г2 Z21 Z22 Z23

rm Zm1 Zm2 Zm3

Нехай, iз мiркувань конкретно! практично! задачу визначено i сутнiснi, i параметризуючi атрибути та ком-

в1ку, 1, впорядкувавши отриман1 значення за зростан-ням вжу респондента, сформували вщповщний сигнал s(x) (див. рис. 7а). Варто зазначити, що на рис. 7 перший ввдлж ввдповщае вжу в 15 роюв (осюльки в мжрофайл! не було виявлено жодного голови домого-сподарства молодше). Таким чином, довжина нашого модельного сигналу складае 75 значень.

У наступному тдроздШ ми розглянемо т функщ-ональш шаблони, як було використано для розв'язан-ня поставлено! на початку розд1лу задачь

2.2. Шаблони для використання при побудовi по-лiнома Кунченка

Осюльки нашою основною задачею е перев1рка п-потези про нормальний розпод1л значень вщповщного сигналу s(x) , то першим 1 основним шаблоном було

1 - 2 /9

взято класичну гауиану у^х) = <— е х' . При цьому,

•\/2п

через те, що нас щкавлять у першу чергу локальш особливост ввдповщного сигналу, ми виршили обме-жити носш вщповщно! експоненти в1др1зком [-3, 3]. Вщлжи з цього в1др1зку було взято з кроком 0,2. Таким чином, ми отримуемо шаблон довжиною в 31 вщлж, що щлком дозволяе, використовуючи тдхщ ¿з «пла-ваючим вжном», запропонований у шдроздШ 1.2, виз-начити наявшсть у початковому сигнал! певних ознак нормальност! розпод1лу його окремих д1лянок. Графж вщповщного шаблону представлено на рис. 1.

Окр1м зазначеного шаблону, ми виршили взяти також два шш1 шаблони, щоб додатково перев1ри-ти коректшсть застосування полшом1в Кунченка до розв'язання поставлено! задачь

Один ¿з цих шаблошв у певному сена схожий на вщповщник ¿з рис. 1, а другий мае зовам шшу форму та структуру.

У якост1 шаблону, який за своею формою та власти-востями нектотно в1др1зняеться вщ гауиани в контекст! поставлено! задач!, ми взяли функщю у 2(х) = 1-1 х | , визначену на тш же дискретнш множин! значень, що й перший шаблон. Вщповщний графж представлено на рис. 2.

Шаблони з рис. 1 та рис. 2 мають одну стльну рису - вони ушмодальш, ¿з чико вираженим максимумом. Таким чином, здаеться майже очевидним, що результа-ти застосування обох шаблошв до початкового сигналу можуть дати близью результати.

У якост! шаблону, який зовим не схожий на обидва вказаш вище, ми взяли функщю у3(х) = sin4x, знову таки, визначену на тому самому носи. I'! графж представлено на рис. 3.

Даний шаблон вщр!зняеться вщ попередшх на-явшстю одразу деюлькох екстремум1в, таким чином, швидше за все, результати його застосування до побу-дови полшома Кунченка будуть дещо шакшь

У наступному тдроздШ ми розглянемо конкретн! результати побудови вщповщних полшом!в Кунченка, а також спробуемо визначити основш особливост! за-пропонованого методу.

2.3. Результати побудови полiномiв Кунченка на основi запропонованих шаблонiв

У силу нев1дпов1дност1 довжин сигналу s(x) та шаблошв у1(х), у 2(х), у 3(х) потр1бно використовувати тдхщ ¿з «плаваючим вжном», тобто будувати окремий полшом Кунченка в кожному вжш довжиною в 31 ввд-л1к. У результат!, зпдно з тдрозд1лом 1.2, ми отримаемо

ефектограму, котра покаже, з якою ефектившстю було побудовано полшом Кунченка в тому чи шшому вжш.

Рис. 1. Графiк першого шаблону у1(х) для побудови полiнома Кунченка

Рис. 2. Графк другого шаблону у2(х) для побудови полшома Кунченка

Рис. 3. Графк третього шаблону у3(х) для побудови полшома Кунченка

Рис. 4. Ефектограма, отримана за результатами наближення початкового сигналу шаблоном у1(х)

Рис. 5. Ефектограма, отримана за результатами наближення початкового сигналу шаблоном у 2(х)

Потр1бно розв'язати систему лшшних р1внянь (7), коефщ1ентами яко! е центрован корелянти. У рамках даного дослщження при обчисленш скалярного добут-ку шаблону та д1лянки сигналу ми використовували формулу трапецш для шдрахунку штеграла таблично задано! функцп. 1з цими уточненнями, система р1в-нянь мае наступний вигляд:

Рис. 6. Ефектограма, отримана за результатами наближення початкового сигналу шаблоном у 3(х)

Для першого шаблону у1(х) ефектограма мае вигляд, представлений на рис. 4.

Анал1зуючи вигляд дано! ефектограми, мож-на вщразу визначити, що найб1льшо! ефективно-ст1 було досягнуто в вщлжу 25 (що вщповщае вжу в 40 рок1в), при цьому коефщ1ент ефективност1 дор1внюе е = 0,9368 (ус1 результати в цш робот презентуються з чотирма знаками шсля коми, хоча обчислення прово-дилися з1 значно б1льшою точшстю). Якщо звернутися до рис. 7, а, то суто в1зуально шдтвердити цей результат достатньо складно. Це свщчить про велику прак-тичну користь в1д використання полшом1в Кунченка при визначенш вщповщних шаблошв.

Також, згвдно з рис. 4, фактично, що дал1 ми вщ-даляемося в1д зазначеного вщлжу, то меншими ста-ють вщповщш коефщ1енти ефективность Це дозволяе зробити висновок, що в сигнал! s(x) присутня едина д1лянка, близька до обраного шаблону. А осюльки сам шаблон е гаус1аною, то це свщчить про те, що в ство-ренш початкового сигналу брала участь лише одна нормально розпод1лена випадкова величина.

Для демонстрацп основних кроюв 1з побудови полшома Кунченка, пропонуемо зосередитися на деяко-му одному вжш в 31 вщлж, осюльки процес побудови полшома Кунченка в ус1х шших вжнах абсолютно аналопчний. У якост1 такого вжна пропонуемо взяти вжно, що починаеться з вщлжу 25, тобто вжно, що в1д-повщае найб1льшому коефщ1енту ефективность У даному випадку ми маемо наступний шаблон: у1 =(0,0044, 0,0079, 0,0136, 0,0224, 0,0355, 0,0540, 0,0790, 0,1109, 0,1497, 0,1942, 0,2420, 0,2897, 0,3332, 0,3683, 0,3910, 0,3989, 0,3910, 0,3683, 0,3332, 0,2897, 0,2420, 0,1942, 0,1497, 0,1109, 0,0790, 0,0540, 0,0355, 0,0224, 0,0136, 0,0079, 0,0044) 1таку д1лянку сигналу:

з25-55 =104 ■ (7,1647, 7,3292, 7,4860, 7,6912, 7,7397, 7,8440, 8,0223, 8,1808, 8,2318, 8,6000, 8,5164, 8,7085, 9,1391, 9,0642, 9,2785, 9,4966, 9,3023, 9,3524, 9,3858, 8,9799, 8,7503, 8,8685, 8,6178, 8,1136, 7,8374, 7,8823, 7,4795, 7,0684, 6,7641, 6,6724, 6,5417).

Отже, збудуемо полшом Кунченка 5-! степеш на основ1 шаблону у1(х). Варто зазначити, що порядок полшома для дано! конкретно! задач! не становить суттевого значення. Як було показано в [9, гл. 4], на практищ в б1льшост1 випадюв вже за 6 члешв полшома Кунченка досягаеться гарна апроксимащя, ! середньоквадратична вщстань м1ж цим полшомом та основною функщею s(x) близька до нуля.

Для побудови полшома Кунченка потр1бно спочат-ку визначити породжеш функцп (1). У вс1х прикладах 1з ще! статт1 ми вир1шили брати ступенев1 перетворен-ня ввдповщного шаблону в якост] породжених функ-щй: иу(х) = цу[уi(x)] = у"(х), V = 0,5, 1 = 1,3 .

0,5817 0,2250 0,0824 0,0303 0,0112

0,2250 0,0924 0,0350 0,0132 0,0050

0,0824 0,0303

0,0350 0,0132

0,0136 0,0052

0,0052 0,0020

0,0020 0,0008

0,0112 0,0050 0,0020 0,0008 0,0003

\ 'a1 N ' 32462,812 4

а2 11899,5728

«3 = 4251,7946

а4 1542,2809

/ ,«5 , ч 567,3478 ,

Розв'язок даноï системи наступний:

а = (а1, а2,а3,а4,а5) =

= 107 ■ (0,0272, -0,2071, 0,8779, -1,7866, 1,4059) '

Тепер, на ochobî цього розв'язку, зпдно з (8), можна отримати коефвдент при нульовiй степенi шаблону: а0 = 0,0068 107.

Таким чином, ми отримали полiном Кунченка, який мае наступний вигляд:

5

R5(x) = а0 +X«vVÏ (x) =

v=1

= 107 ■ (0,0068 + 0,0272y1(x)-0,2071 v2(x)+

+0,8779v3(x)-1,7866vi(x) +1,4059 v5(x)).

Тепер ми можемо обчислити шфоркуну полшома Кунченка:

5

J5 = XavFVjb = 107 ■ (0,0272 ■ 32462,812-

V=1

-0,2071 ■ 11899,5728+0,8779 ■ 4251,7946-1,7866 1542,2809+1,4059 ■ 567,3478) =1,9360 109.

На основi цiеï шфоркуни можна обчислити коефь цiент ефективносп (10):

J5 1,9360 109

JK(x)-Vb ■ uc(x))2dx

2,0665 10!

= 0,9368

Використовуючи вищенаведену схему, можна по-будувати полшом Кунченка для кожноï д^янки початкового сигналу довжиною в 31 вщлж. При цьому, очевидно, буде отримано множину полiномiв, носи яких частково перекриваються. Тодi, для сформу-вання результуючого полiнома потрiбно залишити вiдлiки тих полiномiв, яю було збудовано з бiльшою ефектившстю.

Якщо застосувати наведену схему до в«х запропо-нованих шаблонiв, то отримаемо вщповщш ефектограми. На рис. 4, 5 i 6 зображено ефектограми, отримаш за результатами побудови полшома Кунченка з застосу-ванням шаблошв V1(x), V2(x) та V3(x) вiдповiдно.

Спiвставлення рис. 4 та 5 показуе, що шаблони V1(x) i V2(x) однаково сильно представлен в по-чатковому сигналi на однiй i тiй же д^янщ. З iншого боку, результати наближення сигналу s(x) третiм шаблоном значно гiршi (максимальна ефективнiсть дорiвнюе 0,0442). 1з цього можна зробити висновок, що в початковому сигналi дшсно мали мiсце певнi особли-востi, схожi на перший та другий шаблони. I це вдалося ввднайти за допомогою полiномiв Кунченка.

Щоб порiвняти полiноми Кунченка, отриманi з за-стосуванням усiх трьох шаблошв, ми представили !х на рис. 7.

вж

г)

Рис. 7. Початковий сигнал (а) та полшоми Кунченка, отриманi з застосуванням шаблону V1(x) (б), у2(x) (в) та Уз(х) (г)

Також, варто окремо зазначити, що при виборi шаблонiв для побудови полiномiв Кунченка основну роль грае форма та структура шаблону, тобто шаблони можна брати з точшстю до деякого сталого множника та деякого сталого доданку. Так, зокрема, якщо взяти шаблон, що дорiвнюe у4(x) = \/2лу1(х), то нев'язка мiж вiдповiдними ефектограмами мае порядок 10-14. Бшьше того, у якоси сталого множника можна взяти навиь -1. У такому випадку результати побудови полшома Кунченка будуть узагалi тотожш.

Це в першу чергу пояснюеться тим, що основну роль тд час пошуку коефвденпв вiдповiдного поль нома грае розв'язання системи лiнiйних рiвнянь (7), розв'язок яко! не змшюеться вiд помноження обох ча-стин системи на константу.

Висновки

За результатами детального розгляду можливостей полiномiв Кунченка по виявленню локальних осо-

бливостей у цифровому сигнал^ та на основi аналiзу результатiв, отриманих на основi використання рiзних шаблонiв, ми дшшли до наступних висновкiв:

- полшоми Кунченка дшсно е потужним шстру-ментом по виявленню локальних структурних осо-бливостей у цифрових сигналах, що можна з устхом використовувати для пошуку заздалегiдь визначених шаблошв у деякому масивi даних;

- полшоми Кунченка будуються на основi ефектив-ного алгоритму, який легко застосовуеться на прак-тицi; бiльше того, в якост шаблонiв для полiномiв Кунченка можна використовувати шаблони з точшстю до сталого множника та сталого доданку;

- полшоми Кунченка можна ефективно застосо-вувати для аналiзу статистичних даних, як було показано в данш роботу зокрема, для визначення навиь iз точшстю до вщлжу дшянок сигналу, розподiлених ввдповщно до деяко! статистично! гiпотези;

- полшоми Кунченка не е ушверсальним мехашзмом; як було показано в данш стат, важливим етапом засто-сування полiномiв Кунченка е вдалий пiдбiр шаблону, а також коректний аналiз вiдповiдноï ефектограми.

Лiтература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Горелик А.Л. Методы распознавания / А.Л. Горелик, В.А. Скрипкин. - М.: Высшая школа, 1989. - 232 с.

2. Theodoridis S. Pattern Recognition / S. Theodoridis, K. Koutroumbas. - Academic Press, 2008. - 984 p.

3. Lin Y.-H. Template matching using the parametric template vector with translation, rotation and scale invariance / Y.-H. Lin, C.-H. Chen // Pattern Recognition. - 2008. - V.41, No.7. - P. 2413-2421.

4. Bellman R.E. Dynamic Programming / R.E. Bellman. - Princeton: University Press, 1957. - 366 p.

5. Damerau F.J. A technique for computer detection and correction of spelling errors / F.J. Damerau // Communications of the ACM. - 1964. - Vol. 7(3). - P. 171-176.

6. Briechle K. Template Matching Using Fast Normalized Cross Correlation / K. Briechle, U.D. Hanebeck // Proceedings of SPIE: Optical Pattern Recognition XII. - 2001. - Vol. 4387. - P. 95-102.

7. Lewis J.P. Fast Template Matching / J.P. Lewis // Vision Interface. - 1995. - P. 120-123.

8. Bhatia N. Survey of Nearest Neighbor Techniques / N. Bhatia, A. Vandana // International Journal of Computer Science and Information Security. - 2010. - Vol. 8, No. 2. - P. 302-305.

9. Кунченко Ю.П. Полиномы приближения в пространстве с порождающим элементом / Ю.П. Кунченко. - К.: На-укова думка, 2003. - 243 с.

10. Chertov O. Group Anonymity / O. Chertov, D. Tavrov // IPMU-2010 [(eds.) E. Hullermeier., R. Kruse, and F. Hoffmann]. - Heidelberg: Springer, 2010. - Communications in Computer and Information Science, vol. 81. - P. 592-601.

11. Чертов О.Р. Групова аношмшсть даних / O.P. Чертов // Зб. наук. праць Вшськового шституту телекомушка-щй та шформатизацй НТУУ «КП1». - К.: В1Т1 НТУУ «КП1», 2010. - Вип. 1. - С. 130-139.

12. U.S. Census 2000. 5-Percent Public Use Microdata Sample Files [Електронний ресурс]. - Режим доступу:http:// www.census.gov/Press-Release/www/2003/PUMS5.html.

i Надоели баннеры? Вы всегда можете отключить рекламу.