Научная статья на тему 'Видобування продукційних правил на основі негативного відбору'

Видобування продукційних правил на основі негативного відбору Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
102
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
вибірка / діагностування / модель контролю якості / негативний відбір / продукційне правило / sample / diagnostics / model of quality control / negative selection / production rule / выборка / диагностирование / модель контроля качества / отрицательный отбор / продукционное правило

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Олійник А. О.

Вирішено завдання розробки математичного забезпечення для автоматизації видобування набору знань у вигляді продукційних правил з навчальних вибірок даних. Об’єктом дослідження є процес побудови моделей неруйнівного контролю якості. Предмет дослідження становлять методи видобування продукційних правил на основі негативного відбору для синтезу моделей контролю якості. Мета роботи: створення методу синтезу продукційних правил на основі негативного відбору, що полягає в обробці даних навчальної вибірки, яка характеризується істотною відмінністю кількості екземплярів, що відносяться до різних класів. Запропоновано метод синтезу продукційних правил на основі негативного відбору для випадку нерівномірного розподілу екземплярів класів вибірки, який при генерації набору детекторів використовує відому інформацію про екземпляри всіх класів вибірки, враховує інформацію про індивідуальну значущість ознак, як форму детектора використовує гіперкуб максимально можливого об’єму. Розроблений метод дозволяє виключати малозначущі і надлишкові ознаки з вибірки, скоротивши тим самим простір пошуку і час виконання методу, а також формувати набір детекторів з високими апроксимаційними й узагальнюючими здібностями. Запропонований метод за рахунок підвищення узагальнюючих властивостей синтезованих моделей шляхом скорочення числа детекторів і умов антецедентів також підвищує інтерпретабельність моделі, скорочує її розмірність (структурну і параметричну складність), обсяг використовуваної пам’яті і підвищує швидкодію моделі при послідовній реалізації обчислень. Проведено експерименти з дослідження властивостей запропонованого методу. Результати експериментів дозволяють рекомендувати запропонований метод для використання на практиці.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PRODUCTION RULES EXTRACTION BASED ON NEGATIVE SELECTION

The problem of mathematical support development is solved to automate the extraction knowledge as production rules from the training data samples. The object of study is the process of constructing models of non-destructive quality control. The subject of study are methods of production rules extraction based on negative selection for synthesis of quality control models. The purpose of the work is to develop a method of production rules synthesis on the basis of a set of detectors is in the handling of data of training sample, characterized by a substantial number of instances of distinction belonging to different classes. A method for the synthesis of production rules on the basis of negative selection in the case of uneven distribution of instances of the sample classes is proposed. The developed method allows to exclude irrelevant and redundant features from the sample, thereby reducing the search space and time of execution of the method, as well as generate a set of detectors with high approximation and generalization capability. The proposed method improves the generalizing properties of synthesized model and its interpretability. The software implementing proposed method is developed. The experiments to study the properties of the proposed method are conducted. The experimental results allow to recommend the proposed method for use in practice.

Текст научной работы на тему «Видобування продукційних правил на основі негативного відбору»

УДК 004.93

Олшник А. О.

Канд. техн. наук, доцент, доцент кафедри програмних засобiв, Запорiзький нац/ональний техшчний ушверситет,

Запорiжжя, УкраТна

ВИДОБУВАННЯ ПРОДУКЦ1ЙНИХ ПРАВИЛ НА ОСНОВ1 _НЕГАТИВНОГО В1ДБОРУ_

Виршено завдання розробки математичного забезпечення для автоматизаци видобування набору знань у виглядi продукцiйних правил з навчальних вибiрок даних. Об'ектом дослiдження е процес побудови моделей неруйшвного контролю якостi. Предмет дослщження становлять методи видобування продукцiйних правил на основi негативного вiдбору для синтезу моделей контролю якосп. Мета роботи: створення методу синтезу продукцшних правил на основi негативного вщбору, що полягае в обробцi даних навчально1 вибiрки, яка характеризуеться ютотною вiдмiннiстю кiлькостi екземплярiв, що вщносяться до рiзних класiв. Запропоновано метод синтезу продукцшних правил на основi негативного вщбору для випадку нерiвномiрного розпод^ екземплярiв класiв вибiрки, який при генераци набору детекторiв використовуе вщому iнформацiю про екземпляри вах класiв вибiрки, враховуе iнформацiю про шдивщуальну значущiсть ознак, як форму детектора використовуе гшеркуб максимально можливого об'ему. Розроблений метод дозволяе виключати малозначущi i надлишковi ознаки з вибiрки, скоротивши тим самим прогар пошуку i час виконання методу, а також формувати набiр детекторiв з високими апроксимацiйними й узагальнюючими здiбностями. Запропонований метод за рахунок пiдвищення узагальнюючих властивостей синтезованих моделей шляхом скорочення числа детектс^в i умов антецедентiв також пiдвищуе штерпретабельшсть моделi, скорочуе 11 розмiрнiсть (структурну i параметричну складнiсть), обсяг використовувано! пам'ятi i пiдвищуе швидкодiю моделi при послiдовнiй реалiзацil обчислень. Проведено експерименти з дослщження властивостей запропонованого методу. Результати експерименпв дозволяють рекомендувати запропонований метод для використання на практищ.

Ключовi слова: вибiрка, дiагностування, модель контролю якостi, негативний вiдбiр, продукцiйне правило.

НОМЕНКЛАТУРА

Е - помилка розшзнавання на навчальних даних (£ =< Р,Т >);

Е{ - помилка розшзнавання на тестових даних;

т - номер ознаки (характеристики) об'екта;

М - кшьюсть ознак виб1рки £;

N (ртп) - кшьюсть екземпляр1в виб1рки £, значення т-1 ознаки яких, належать п-му штервалу д1апазону 11 змши;

^^ (рт) - кшьюсть штервал1в, на яю розбиваеться д1апазон значень т-1 ознаки рт;

N(ртп, 11) - кшьюсть екземпляр1в виб1рки £, значення вихщного параметра Т яких дор1внюе ^ (належать 1-му штервалу д1апазону його змши Ц ) за умови, що значення 1х т-1 ознаки належить п-му штервалу ртп;

Nint (Т) - кшьюсть можливих значень (1нтервал1в, на яю розбиваеться д1апазон значень) виидного параметра Т;

N^1 - кшьюсть ггерацш роботи методу;

Ntq- кшьюсть екземпляр1в виб1рки £ =< Р, Т >, значення вихщного параметра (д яких дор1внюе /о;

Ntq - кшьюсть екземпляр1в виб1рки £ =< Р, Т >, значення вихщного параметра (д яких дор1внюе ^;

Nt,tq / =/0 - кшьюсть екземпляр1в тестово1 виб1р-ки, що розшзнаш як «сво1» ( = ф, але реально вщно-сяться до класу «чужих» ((д = (¿);

Nt,tq =/0 - кшьюсть екземпляр1в тестово1 виб1рки, що вщносяться до класу «чужих» (tq = (о );

Nt,tq /^ =^ - кшьюсть екземпляр1в тестово1 виб1р-

ки, що розшзнаш як «чужЬ> (tq = (о ), але реально вщносяться до класу «сво1х» (= ^);

Nt,tq - кшьюсть екземпляр1в тестово1 виб1рки, що

вщносяться до класу «сво1х» (tq = Ч);

Р - наб1р вхщних характеристик (ознак) об'еклв у виб1рщ £ =< Р, Т >;

Pqm - значення т-1 ознаки g-го екземпляра виб1рки £; рт min - мшмальне значення т-1 ознаки у виб1рцц рт тах - максимальне значення т-1 ознаки у виб1рцц Р,tq =tí /tq =/о - шов1ртстъ помилки вщнесення до класу «сво1х» (tq = tí ) за умови, що екземпляр реально вщно-ситься до класу «чужих» (tq = );

Pt,tq =/о /^ =t¡ - 1мов1ршсть помилки вщнесення до класу «чужих» (tq = (о) за умови, що екземпляр реально

вщноситься до класу «сво1х» (tq = ^);

q - номер екземпляра (об'екта) у виб1рщ £; 2 - кшьюсть екземпляр1в виб1рки £; р(ртп) - шовхртсть того, що значення ознаки рт екземпляр1в виб1рки £ потрапить у п-й штервал д1апазо-ну 11 змши;

р(ртп, 11) - умовна хмовхрнхсть того, що значення вихщного параметра Т буде дор1внюе tl (потрапить у 1-й штервал Ц) за умови, що т-а ознака рт потрапить у п-й штервал ртп;

£ = < Р, Т > - навчальна виб1рка; t - час роботи методу, мс;

tq е Т' - значення вих^дного параметра q-го екземпляра; Т - множина значень вихщного параметра у виб1рщ £ =< Р,Т >;

Т' - множина можливих значень вихщного параметра Т.

© Олшник А. О., 2015

БОТ 10.15588/1607-3274-2016-1-5

р-К8К 1607-3274. Радюелектронжа, шформатика, управлiння. 2016. № 1 е-ЕЗБЫ 2313-688Х. Каёю Е1еойоп^, Сошриег Баепое, Сопйо1. 2016. № 1

ВСТУП

У процес побудови моделей прийняття ршень для неруйшвного контролю якоста, техшчного та медичного д1агностування, розтзнавання образ1в [1-4] можуть ви-никати ситуацп, коли велика частина шформацп в на-вчальнш виб1рщ даних вщноситься до одного класу (наприклад, переважна бшьш1сть вироб1в взноситься до одного класу придатноста) [5, 6].

У таких випадках для формал1зацп опимв дослщжува-них об'еклв або процемв доцшьно синтезувати модел1 на основ1 штучних 1мунних систем [7-9], що характери-зуються можливостями навчання на основ1 екземпляр1в тшьки одного класу, а також високим р1внем адаптацп. Для виршення задач, що характеризуются 1стотною в1дмшшстю кшькост1 екземпляр1в, що в1дносяться до р1зних клашв, пропонуеться використовувати штучш 1мунш системи, що працюють на основ1 принцитв негативного вщбору [10-13], що передбачае побудову набору детектор1в (обчислювальних елеменлв), здатних до розтзнавання невщомих екземпляр1в [14-16]. Такий шдид дозволяе виявляти аномалп або випадков1 змши в д1агно-стованих об'ектах [7, 10], а також розтзнавати екземпля-ри чужих кламв (кламв об' еклв, екземпляри яких не представлен в навчальнш виб1рщ) [8, 12, 15].

Проте вщом1 методи синтезу штучних 1мунних систем на основ1 негативного вщбору [8-16] генерують над-лишкову кшьюсть детектор1в (можливих ршень задач1), висувають значш вимоги до обчислювальних ресурмв ЕОМ, як правило, використовують шформащю тшьки про один клас екземпляр1в («сво!х», придатних [ т.п.), не враховуючи при цьому дат про екземпляри шших кламв. Отже, актуальною е розробка метод1в синтезу штучних 1мунних систем на основ1 негативного вщбору, вшьних вщ зазначених недолтв. Кр1м того, д1агностичш модел1 на основ1 штучних 1мунних систем характеризуються низьким р1внем узагальнення. Не дивлячись на те, що детектори (правила) 1мунно! системи по окремоста е легкими в сприйнятл [ розумшш людиною, через низький р1вень узагальнення, система детектор1в мае велику розм1ршсть, 1, отже, е складною для сприйняття й анал1зу людиною, що в цшому призводить до зниження штерп-ретабельност д1агностично! модел1 на основ1 1мунних систем.

Метою роботи е створення методу синтезу продук-цшних правил на основ1 негативного вщбору, що поля-гае в обробщ даних навчально! виб1рки, яка характеризуемся 1стотною вщмшшстю кшькост1 екземпляр1в, що вщносяться до р1зних кламв.

1 ПОСТАНОВА ЗАДАЧ1

Нехай задана навчальна множина £ = < Р, Т >. Наб1р Р представляеться у вигляд1 матриц Р = (рдт ,

т = 1, 2, ..., М, q = 1, 2, ..., Q. Наб1р значень вих1дного

параметра представляеться у вид1 вектора

Т = ^ \

менти tq е Т' якого приймаються значення з множини

Т'. У задачах неруйшвного контролю якост \ розтзна-вання образ1в множина Т' , як правило, складаеться з двох

елеменлв Т' = {0, tl}, що визначають клас придатност виробу, наприклад при tq = ^ q-й вир1б вважаеться при-датним, при tq = ^ - некондицшним).

При цьому кшьюсть екземпляр1в виб1рки £ =< Р, Т > одного класу (наприклад, екземпляр1в класу некондицш-них tq = t1) ютотно вщр1зняеться вщ кшькост екземпляр1в шшого класу, що визначаеться нер1вшстю (1):

0 * \ =t0 << \ =tl, (1) де \ =?0 + \=tl = Q.

Тод1 на основ1 задано! виб1рки £ =< Р,Т > необхщно синтезувати наб1р ЯБ = {ги1е1,ги1в2,...,гы1е^к} про-дукц1й Рг ^ Тг, що дозволяе забезпечити прийнятний р1вень похибки розтзнавання Е, розраховано! як в1дно-шення к1лькост1 Nег неправильно розтзнаних за допо-могою набору правил ЯБ спостережень виб1рки £ до загально! кшькоста екземпляр1в Q (2):

N

Q

(2)

2 ОГЛЯД Л1ТЕРАТУРИ

Методи негативного выбору використовують проце-си позитивно! та негативно! селекцп, зд1йснюван1 тд час дозр1вання Г-л1мфоцит1в, використовуються для класиф-1кац1! та розп1знавання в задачах, де простар стан1в моде-люеться на основ1 наявних знань [10-13, 16]. В основ1 роботи модел1 негативного в1дбору [10-13, 16] лежить поведшка Г-кл1тин, що забезпечуе терпим1сть 1мунно! системи орган1зму до власних кл1тин. При цьому Г-клгги-ни мають здатн1сть розп1знавати практично будь-яю (не-в1дом1 !м рашше) антигени. У терм1нах теор1! 1мунно! системи антигеном називають будь-який екземпляр, який може бути розп1знаний системою [7-9].

Основне завдання, яке виршуеться за допомогою модел1 негативного в1дбору, полягае у виявленш в1дм1нно-стей м1ж двома класами об'ект1в \ в проведенш подаль-шо! двокласово! класифжацп [11, 16]. З погляду д1агнос-тування це завдання можна розглядати як завдання вияв-лення аномал1й або випадкових змш у стан1 д1агностованих об'ект1в.

Чисельш детектори використовуються в тих випадках, коли стан системи можна представити у вигляд1 вектора ознак, значення яких нормал1зоваш \ знаходяться в д1апа-зон1 в1д 0 до 1. Методи негативного вщбору [10, 11, 16] засноваш на використанш чисельного представлення детектор1в, що призводить до бшьш компактного подан-ня даних та прискорюе генерац1ю детектор1в, а також використовують класичш принципи класиф1кац1! для виз-начення належност1 детектора до придатних або дефект-них екземпляр1в.

Проте використання чисельних детектор1в у в1домих методах негативного добору приводить до р1зних проблем, таких як неможлив1сть задати заздалепдь розм1ри детектор1в \ !х к1льк1сть, неможлив1сть передбачити зб1жшсть методу, в результат! чого можлив1 ситуац1!, коли оптимальний наб1р детектор1в так \ не буде отриманий.

еле-

Потреба усунення недолiкiв вiдомих методiв обумовлюе необхщшсть розробки нового методу негативного вщбо-ру, здатного синтезувати набiр детектс^в за даними навчально! вибiрки, що мiстить iнформацiю про екземпляри рiзних класiв.

3 МАТЕР1АЛИ ТА МЕТОДИ

Як вiдзначено вище, вiдомi методи негативного вщбо-ру [8-16] мають такi недолiки, як генеращя надлишково! кiлькостi детекторiв, використання iнформацi! про екземпляри тшьки одного класу, низька штерпретабельшсть синтезованого набору рiшень у виглядi детектс^в. Крiм того, бiльшiсть методiв, заснованих на принципi негативного вщбору, в якостi детекторiв використовують гшерс-фери з фiксованим радiусом, який визначае область простору ознак, що покриваеться детектором. Вибiр вели-чини радiуса гшерсфери-детектора являе собою дуже складну задачу, оскiльки при великих значеннях радiуса знижуеться точшсть розпiзнавання, а при низьких значеннях збшьшуеться кiлькiсть генерованих детектс^в, що у свою чергу знижуе узагальнюкш властивостi синтезо-вано! моделi у виглядi набору детекторiв штучно! iмун-но! мережi.

Наявнiсть зазначених недолив обумовлюе не-обхiднiсть висування iстотних вимог до обчислювальних ресуршв ЕОМ при використаннi вiдомих метсдав негативного вiдбору, що, у свою чергу, знижуе швидюсть пошуку рiшення i, у деяких випадках, не дозволяе знайти прийнятне ршення.

Для усунення зазначених недолтв доцшьно викори-стовувати метод синтезу продукцшних правил на основi негативного выбору для випадку нерiвномiрного розпо-дшу екземплярiв класiв вибiрки, у якому пропонуеться:

- при генерацi! набору детекторiв

АВ = \ЛЬЪЛЬ2,...,ЛЬМль ) використовувати вiдому

шформащю про екземпляри обох кламв Т' = {/0, /1), що дозволить сформувати набiр детекторiв з великими ап-роксимацiйними й узагальнюючими властивостями;

- використовувати шформащю про шдив^уальну значущiсть Ут ознак рт, що дозволить виключити мало-значущi та надлишковi ознаки з вибiрки £ =< Р,Т >;

- як форму детектора використовувати гшеркуб максимально можливого обсягу. На вiдмiну вiд вщомих ме-тодiв негативного вiдбору, у яких в якоста форми детектора використовуеться гшерсфера, це дозволить виключити необхщшсть вирiшення ресурсномютко! задачi пошуку оптимальних радiусiв гшерсфер детекторiв.

У розробленому методi на початковому етат пропонуеться ощнювати значущiсть ознак рт стосовно вихщ-ного параметра Т, що дозволить виявити i виключити з подальшого розгляду малозначущi ознаки, скоротивши тим самим проспр пошуку i час виконання методу. Як вiдзначено вище, у цш роботi розглядаеться задача, у якш вихiдна вибiрка £ =< Р,Т > характеризуеться дискретною кшьюстю класiв Т' = {/0, /1). Тому для оцiнювання значущостi ¥т ознак рт доцiльно застосовувати кри-терп, що дозволяють виконувати оцiнку шформативноста ознак стосовно дискретного вихiдного параметра Т [2, 4,

17-22]. Як такий критерш пропонуеться використовувати ентротю ознаки [4, 17] як характеристику, що вщоб-ражае стутнь невизначеност стану об'екта й обчис-люеться за формулою (3):

Nint (Pm )( Nint(T)

Vm = - Z P\Pmn ) Zp(Pm«, tl )log2 P(Pmn, tl) n=1 I l=1

(3)

де

p(Pmn ) = ^ ; p(Pmn, l ) = .

Q N (Pmn )

Ознаки Pm, значення iндивiдуальноï шформативноста яких нижче мiнiмально допустимоï (Vm < Vmin), вважа-ються малошформативними i виключаються з вибiрки S =< P,T >.

Крiм того пропонуеться ощнити взаемозв'язок ознак як шформатившсть однiеï з них стосовно шшо^ що дозволить виявити групи взаемозалежних ознак, у кожнш з який залишити тiльки одну високо iнформативну ознаку, а iншi ознаки, пов'язанi з нею у груш можна виключити з подальшого розгляду, оскшьки вони е надлишковими, ускладнюють процес синтезу дiагностичних моделей i знижують ïх iнтерпретабельнiсть. Для оцiнювання шфор-мативност ознак мiж собою Vmd пропонуеться також використовувати ентротю ознак, використовуючи формулу (3) i вважаючи при цьому одну з ознак Pd вихщ-ним параметром T (попередньо штервал значень ознаки, що вважаеться вихщним параметром Pd, розбиваеть-

ся на Njnt (T ) дискретних iнтервалiв).

Пiсля оцiнювання iнформативностi ознак стосовно шших ознак з вибiрки S виключаються ri з них, для яких ^нують аналоги (у випадку, якщо значення взаемноï iнформативностi ознак бшьше максимально припусти-

моï Vmd > Vmax).

Далi виконуеться побудова множини детекторiв -структур, що дозволяють визначити, чи вщноситься ощ-нюваний екземпляр до деякого класу Важливо вщзначи-ти, що при використанн принципiв негативного вiдбору детектори, що будуються на основi класу T ' = t{, дозволяють виявити з невiдомих екземплярiв такi, якi не вщно-сяться до вщповщного класу t1 [9, 11, 13]. Тому для фор-мування множини детекторiв у задачi розпiзнавання, в якiй вихiдний параметр приймае два значення t1 (клас «своïх») i t0 (клас «чужих»), необхщно з вхiдноï вибiрки S =< P, T > сформувати вибiрки S0 i S1 з екземплярiв, що вiдносяться до клашв t' i t0, в^пов^но: S1 =<P,T = tj > (вибiрка «своïх» екземплярiв) i S0 =< P, T = t0 > (вибiрка «чужих» екземплярiв).

Шсля цього виконуеться формування першого кандидата в детектори Ab1 =< A¿1 min, Ab1max >e AB1, де

Ab1min = {Ab11mm, Ab12min,•••, Ab1M min } i

Ab1max ={Ab11max, Ab12max,..., Ab1M max } - вiДПовiДно, набори мiнiмальних i максимальних значень m-х ознак

кандидата в детектори Ab1 ( Ab1m min = min (Pqm ),

q=1,2,..., Qi

p-ISSN 1607-3274. Радюелектронжа, шформатика, управлiння. 2016. № 1 e-ISSN 2313-688X. Radio Electronics, Computer Science, Control. 2016. № 1

Abimmax = max (pqm), m = 1,2,...,M, Qx - юльюсть q=1,2,..., Qi

екземплярiв у вибiрцi Si), представленого у виглядi гшер-куба. Множина ABi дeтeктоpiв Abk формуеться на ос-HOBi набору «сво!х» eoeMnrapiB Si i дозволяе виявляти серед невщомих eкзeмпляpiв «чужЬ>, тобто таю, яю не вiдносяться до класу t[.

Потiм для кожного q-го екземпляра sq вибipки Si =< P,T = ti > визначаеться його вiдповiднiсть кандидату в детектори Abk за формулою (4):

eq

(yAbk, sq ) =

1 i M{\{Ahm mm < pqm M^km max > pqm )}| = M:

m=1

M

0 I Z 1 (AAbkm min < pqm )л (Abkm max > pqm )}} Ml

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(4)

M

Де сУма Z1 (Abkm min < pqm )л (Abkm max > pqm )} вИЗШ-m=1

чае кшьюсть вщповщностей значень ознак fqm q-го екземпля-

ра

кандидату

M

v m=1

Abk.

Z1 (Abkm min < pqm MAbkm max > pqm )} | = M, то вва-

Якщо

жаеться, що екземпляр sq =< pqm, tq > вщповщае кандидату в детектори Abk (знаходиться усередит простору пперкуба з

координатами Ab1min ={^11!^ Ab12min, .. ., Ab1M min } 1

Ab1max = {Ab11max, Ab12max,•••, Ab1M max }

Якщо юнуе хоча б один екземпляр

sq =< pqm, tq = /1 >е S1, для якого eq(Abk, sq )= 1, то вва-жаеться, що кандидат Abk активуеться при сшвставленш його з екземпляром sq i, отже, не може бути детектором. Тому при виконанш умови (5)

35q е S: eq(Abk,Sq)= 1 (5)

вiдбуваеться етап до навчання кандидата Abk. Метою даного етапу е перетворення кандидата в детектори Abk таким чином, щоб у вибiрцi S1 не iснувало екземплярiв, при зютавленш з якими вiдбувалася би активащя детектора Abk. Для цього вибираеться кортеж одше! з ознак Abkm =< Abkm min, Abkm max >, за якими кандидат у детектори Abk збшаеться з екземпляром sq. Далi перетворюеть-ся одне з граничних значень m-i ознаки кандидата Abk:

Abkmmin = pqm + nn(Abkmmax - Abkmmin), якщо

rnd > 0,5 (rnd = rand[0;1) - випадково згенероване число в дiапазонi [0;i)), у противному випадку -

Abkmmax = pqm — nn(Abkmmax -Abkmmin), у результат чого об'ем пперкуба Abk зменшуеться таким чином, що екземпляр sq розташовуеться поза простором, опи-суваним кандидатом у детектори Abk. Коефiцiент nn за-даеться користувачем як параметр методу в iнтервалi

Пп е (0;1]. Чим бшьше значення даного коефiцiента, тим бшьше вiдстань мiж екземплярами вибiрки S1 i гшерку-бом детектора Abk.

Пiсля перетворення граничних значень Abkm =< Abkm min, Abkm max > одше1 з ознак кандидата в детектори Abk, вт повторно перевiряеться з кожним екземпляром вибiрки S1 на виконання умови (5). При виконанш умови (5) аналогiчним чином ввдбуваеться повтор-не перетворення граничних значень одше! з ознак кандидата Abk. I так доти, поки буде виконуватися умова (5).

Шсля того, як у множит S1 =< P,T = /1 > не зали-шиться екземплярiв Sq, при зiставленнi з якими активь зуеться кандидат Abk, виконуеться етап оцiнювання при-стосованостi кандидата Abk до узагальнення. При вико-ристаннi принципiв негативного вщбору формуеться

множина детекторiв AB1 ={Ab1, Ab2,..., AbNAb }, що доз-воляють з високою точнiстю визначити належнiсть ек-земплярiв Sq вибiрки S до визначеного класу [10-16]. Тому як критерш ощнювання будемо використовувати характеристики (6) i (7), що дозволяють оцiнити здатнiсть детектора Abk до узагальнення даних:

1M

G^bk)= - Е

bkm max

Ab,

m =1 pm max

- Ab

km min

(6)

M

11 i(Abkm max Abkm min )

G2 (Abk ) = m=n-'

11 (pm max — pm min ) m=1

(7)

{pqm ) та p,

та pm max = max (pqm ).

де pm min min \Hqm

q=1,2,..., gl

Критерп (6) i (7) вщображають частину детектора, що покриваеться за допомогою, простору пошуку. Критерiй

Gl(Abk) показуе середню частку простору, що покриваеться детектором, у кожному з M вимiрiв простору ознак. Критерш G2(Abk) вщображае об'емну частину простору, що покриваеться.

Чим бшьше значення критерпв Gi(Abk) i G2(Abk), тим бшьш велику частину простору пошуку покривае детектор. Отже, якщо значення критерто ощнювання

якост узагальнення G(Abk) вище граничного Gmin

(G(Abk)> Gmin), то вважаеться, що кандидат Abk характеризуемся високими узагальнюючими здiбностями, може бути детектором i додаеться в множину детекторiв:

AB1 = AB1 U {Abk }.

Створення нових кандидатiв Abk здшснюеться доти, поки не будуть досягнул критерп закiнчення пошуку. Як таю критерп можуть бути використанi точшсть розшзна-вання E(S), досягнення максимально припустимо!

m=1

m min

кiлькостi детекгс^в (NAb = |AB| > NAbmax), перевищен-ня максимальне припустимого часу пошуку (t > tmax).

Отриманий у результатi негативного вщбору набiр

детекторiв AB1 = {Ab1,Ab2,...,AbNAb } описуе область простору пошуку S1, комплементарну областi простору, у яюй розташована множина «своïх» екземплярiв S^ При цьому множина AB1 = {Ab1, Ab2,.., AbNAb } характеризуемся високими апроксимацiйними й узагальню-ючими здiбностями.

Аналогiчним чином можна сформувати набiр детек-торiв ABo для множини So. Проте, у задачах з нерiвном-iрним розподшом екземплярiв класiв вибiрки S =< P, T >, коли кшьюсть екземплярiв одного класу Q1 = Ntq =t1 iстотно перевищуе кшьюсть екземплярiв

iншого класу Qo = Ntq =t'0 (Qo << Q1), можуть виникнути проблеми з генеращею детекторiв, що адекватно вщоб-ражають простар екземплярiв So (можуть бути згенеро-ванi детектори Abk у видi гiперкубiв занадто великого обсягу, що не зможуть узагальнити дат генеральноï су-купностi). Це обумовлено невеликою (недостатньою) кiлькiстю екземплярiв у вибiрцi So (Qo << Q1), а iнодi i майже повною ïхньою вiдсутнiстю.

Тому в цш роботi при генерацiï детекгс^в для екземп-лярiв So пропонуеться використовувати шформащю про розмiри детектс^в, побудованих на основi вибiрки S1. При цьому детектори будуть вiдображати iнформацiю про наявнiсть у гiперкубi екземплярiв вибiрки So (а не про ïх вiдсутнiсть, як при класичному негативному вiдборi), i, отже, по суп будуть цiлком вщждадати детекторам, що побудованi ранiше для вибiрки S1 на основi негативного вщбору й мiстять iнформацiю про областа простору пошуку, у яких не розташовуються екземпляри S1

Детектори Abвибiрки So генеруються таким чином, щоб ïх центри вiдповiдали координатам екземплярiв Sk =< Pkm, tk = to >e So вибiрки So , а розмiри граней ïх гiперкубiв вiдповiдали аналогiчним розмiрам детекторiв, створених на основi даних вибiрки S1. Отже, координати

детектора Ab,(o) =< Ab,(o) ■ ,Ab,(o) > визначаються " r km km min ' km max

за формулами (8)-(9):

AB1 ={4b1, Ab2,.„, AbNAb }, використовуючи формулу (1o):

Abkmmin = Pkm " \ AAbm

Abk(mmax = Pkm +1AAb

2

(8)

(9)

де AAbm - середня довжина граней детекторiв AB1 ={4b1, Ab2,.„, AbNb }, створених

на осжда множи-

ни S1. Величину AAbm пропонуеться обчислювати, ви-ходячи з шформацп про детектори

AAbm = -

1

( NAb M

Z Z((Abkm max — Abkm min ) k=1 m=1

. (1o)

NAbM

Потiм виконуеться зiставлення згенерованих детек-торiв Ab^ з екземплярами вибiрки S1, використовую-чи формулу (4), при виконанш умови (5) вiдбуваеться перетворення детекторiв Abk° аналогiчно описаному вище етапу донавчання. Пiсля цього обчислюеться значення одного з критерпв G^b^ ) ощнювання здатностi детектора до узагальнення даних (6)-(7), i, у випадку, якщо його значення вище граничного, детектор Abk(o) додаеться

в множину ABo = ABo U Af^}.

У такий спосiб генеруеться набiр детекторiв ABo, що

описуе, як i набiр AB1, область простору пошуку S1, комплементарну област розташування множини екземп-лярiв S1. Тому розпiзнавальна модель може бути представлена у виглядi множини детекгс^в AB = ABo U ABj, що дозволяють розпiзнавати належнiсть невiдомих ек-земплярiв s'q =< P'qm,t'q — ? >i S до класу «чужих», тоб-то вiдносити ïх до класу to : tq = to.

З метою тдвищення рiвня iнтерпретабельностi отри-маноï розпiзнавальноï моделi представленоï у виглядi

набору AB = {Ab1,Ab2,..., AbNAb } детекторiв, пропонуеться на осжда набору AB сформувати множину продукцшних правил PRr : Pr ^ Tr, у яких лiва частина Pr iмплiкацiï являе собою набiр умов вигляду (11) «Якщо (P1 e [Abk1min;Abk1

max 1)л(р2 6 [Abk 2min;

Abk2max])л- a(pm 6 \Abmmin;AbkM max ]) » (11) а права частина Tr метить значення вихщного параметра T при виконанш r-го набору умов Pr (11).

При формуванш набору правил PR в антецедент правила Pr будемо включати тшьки ri границ ознак, для яких вони не е граничними значеннями, тобто

Abkm min * min Jpqm) iAbkm max * max (Pqm ). q=1,2,..., Q q=1,2,..., Q 4

Наприклад, для детектора вигляду

Abk ={< 5,7 >,< 8,P2

max >, < P3 m

, P3m

>, <

4,6 >}

буде сформоване правило PRk вигляду: Якщо

(P1 > 5 л P1 < 7) л (P2 > 8) л (p4 > 4 л P4 < б), то вiднести екземпляр до класу «чужих» (T * ^1). Як видно, у правило не ввiйшли в явному виглядi верхня границя ознаки P2 i цшком ознака P3, оскiльки вiдповiднi значення детектора знаходяться на мш1мальнш i максимальнiй границях ознак i не впливають на яюсть розпiзнавання. Кр1м того, вик-лючення таких значень iз правила PRk знижуе його складнiсть, пiдвищуючи в такий споаб iнтерпретабельнiсть правила.

p-ISSN 1607-3274. Радюелектронжа, шформатика, управлшня. 2016. № 1 e-ISSN 2313-688X. Radio Electronics, Computer Science, Control. 2016. № 1

Використовуючи такий шдхщ, на ochobî кожного k-го детектора Abk виконуеться побудова свого правила, фор-муючи в такий спошб множину PR, що складаеться з Маь продукщйних правил PRr : Pr ^ Tr.

Таким чином, запропонований метод синтезу продукщйних правил на основ1 негативного вщбору для ви-падку нер1вном1рного розподшу екземпляр1в клаив виб-1рки при генерацiï набору детектор1в використовуе вщо-му iнформацiю про екземпляри вшх класiв вибiрки, враховуе шформащю про iндивiдуальну значущiсть ознак, як форму детектора використовуе гшеркуб максимально можливого обсягу, що дозволяе виключати ма-лозначущi i надлишковi ознаки з вибiрки, скоротивши тим самим простiр пошуку i час виконання методу, а також формувати набiр детекторiв з високими апроксимащй-ними й узагальнюючими здiбностями.

Запропонований метод за рахунок шдвищення уза-гальнюючих властивостей синтезованих моделей шляхом скорочення кiлькостi детекторiв i умов антецедента також шдвищуе iнтерпретабельнiсть моделi, скорочуе ïï розмiрнiсть (структурну i параметричну складнiсть), обсяг використовуваноï пам'ятi i пiдвищуе швидкодто моделi при послiдовнiй реалiзацiï обчислень.

4ЕКСПЕРИМЕНТИ

Для перевiрки працездатностi запропонованого методу синтезу продукщйних правил на осжда негативного вщбору було розроблено комп 'ютерну програму, що реалiзуе запропонований метод. За допомогою розроб-леного програмного забезпечення розв'язувалася задача дiагностування лопаток газотурбшних авiацiйних дви-гунiв [23]. Лопатки характеризувалися значеннями спекав потужност загасаючих коливань пiсля ударно -го збудження, якi використовувалися як вхщш ознаки. Експертно було визначено класи якостi лопаток: придатнi (кондищйш) i дефектнi (некондицшт). Кожна лопатка була описана 10240 ознаками, що характеризували спектр потужностi загасаючих коливань. Для скорочення простору пошуку на осжда цих ознак були отримаш штучнi ознаки-згортки, у результатi чого сформовано набiр р, який складаеться зi штучних 80 ознак.

Отримана вибiрка спостережень S =< P,T >, воче-видь, не е статистично репрезентативною, оскшьки не вiдображае реального розподiлу частот клаив (у гене-ральнiй сукупност придатних лопаток суттево бiльше,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

шж дефектних). При цьому дефектнi лопатки (tq = ¿1) у наявнш вибiрцi S представляють типовi випадки некон-дицiйностi, що забезпечуе тополопчну репрезента-тивнiсть дефектних лопаток у вибiрцi. А всi можливi випадки класу придатних (tq = t0) неможливо представити у вибiрцi з практичноï точки зору. Тому виникае не-обхiднiсть на основi наявноï вибiрки S =< P,T > з не-рiвномiрним розподшом екземплярiв по класах побуду-вати дiагностичну модель, що дозволяе виконувати техн-iчне дiагностування лопаток авiадвигунiв на основi заданого набору вимiрювань.

Вибiрка S =< P,T > метить 42 екземпляри, що харак-теризують дефектнi лопатки, i 72 екземпляри придатних.

Запропонований метод синтезу продукщйних правил на основi негативного вщбору ж^внювався з ^нуючи-ми методами негативного вщбору, що синтезують набiр детекторiв тiльки на осжда «своïх» екземплярiв вибiрки S1 ç S. Тому за допомогою запропонованого методу задача дiагностування лопаток газотурбшних авiацiйних двигунiв розв'язувалася два рази:

- з використанням пiдвибiрки (S1 ç S), що мiстить iнформацiю тiльки про некондицiйнi екземпляри («своïх»);

- з використанням усiеï вихiдноï вибiрки S =< P,T >.

Як тестова вибiрка St використовувалася вибiрка, що

мiстить шформащю про 273 екземпляри (261 екземпляр придатних виробiв, що вщносяться до класу tq = t0, i 12 екземплярiв дефектних виробiв, що вщносяться до класу tq = t1).

Також виконано порiвняння запропонованого методу з шшими методами, що дозволяють вирiшувати за-дачi розпiзнавання образiв. Для цього розв'язувалася описана вище задача дiагностування лопаток газотурбь нних авiацiйних двигушв. Дослiджувалися властивостi i характеристики таких розтзнавальних моделей:

- модель у виглядi набору продукцiйних правил, син-тезованих за допомогою запропонованого методу на осжга негативного вiдбору з урахуванням шформатив-ностi ознак;

- нейромережева модель прямого поширення, що складаеться з трьох шарiв нейронiв, побудована на ос-новi методу зворотного поширення помилки. На пер-шому шарi нейромережi знаходилося п'ять нейрошв, на другому - три нейрони, на третьому - один нейрон. Нейрони першого i другого шару мали лопстичну сиг-моïдну функщю активацiï, третього - граничну функщю активацiï;

- модель у виглядi набору детекторiв, побудована за допомогою методу негативного вщбору з маскуванням детекторiв [16].

При цьому використовувалася вся навчальна вибiр-ка S =< P,T > обсягом 114 екземплярiв (42 екземпляри, що характеризують дефектш лопатки, i 72 екземпляри придатних) при побудовi першоï i другга моделi, i части-на вибiрки ( S1 ç S) при побудовi моделi на осжда набору детекторiв за допомогою методу негативного выбору з маскуванням, оскшьки даний метод припускае роботу з екземплярами тшьки одного класу 5 РЕЗУЛЬТАТИ

Результати експерименлв з порiвняння запропонованого методу з шшими методами негативного вщбору

наведено в табл. 1. Pt,tq =t1 /tq =t'0 й Pt,tq=t0/tq =t; помилки

вiднесення до класу «своïх» tq = t1 («чужих», tq = t0) за умови, що екземпляр реально вщноситься до класу «чужих» tq = t0 («своïх», tq = ¿1) обчислюються за формулами (12) i (13), вщповщно:

N,

P,tq =tJ / ¿q =¿0

t,tq =¿1 /1q =¿0

Nt t =t'

(12)

N

Р ' '

¡^д = ¡0 1.д =¡1

1,1д =¡0 1.д =¡1

N.

(13)

1,1д =¡1

Результати ж^вняння рiзних моделей при виршенш задачi дiагностування лопаток газотурбiнних авiацiйних двигунiв [23] наведено в табл. 2, де Nрагат — критерш, що визначае параметричну складшсть моделi. Критерiй Nрагат розраховувався як кшьюсть параметрiв моделi: загальна кшьюсть параметрiв АЬ^т т;п i АЬ^т тах в моделях на основi продукцiй i на основi набору детекторiв [16], загальна кшьюсть настроюваних параметрiв (ваго-вих коефiцiентiв) - у нейромережевiй модел^

6 ОБГОВОРЕННЯ

Як видно з табл. 1, прийнятне значення помилки роз-пiзнавання Е забезпечив метод з маскуванням детекторiв [16] ( Е = 0,018) i запропонований метод синтезу про-дукцiйних правил на основi негативного вiдбору (МСППНВ). Низькi значення помилки розпiзнавання заз-начених методiв забезпечувалися за рахунок широкого покриття синтезованими детекторами област «сво!х» екземплярiв вибiрки 51 с . При цьому запропонований метод МСППНВ, що синтезував набiр детектс^в на основi екземплярiв усiх класiв вибiрки 5 =< Р,Т >, забезпечив бшьш прийнятнi результати (Е = 0,009) у по-рiвняннi з набором детекторiв, синтезованим тiльки з використанням екземплярiв класу «сво!х» 51 с 5 (Е = 0,026). Менш прийнятнi значення помилки розтз-навання Е показали метод з цензуруванням [13] (Е = 0,070) i модель У-Бйе^ог [14, 15] (Е = 0,035), що св^ить про недостатшсть покриття синтезованими детекторами областа «сво!х» екземплярiв 5} с 5.

За результатами експерименлв видно, що при вико-ристаннi методу з цензуруванням [13] i моделi У-Эе1ес1;ог [14, 15] генеруеться найбшьша кiлькiсть детектс^в NAb = 207 i NAb = 41, вiдповiдно), що негативно впли-

вае на час навчання I i витрати обчислювальних ресурсiв комп'ютера. Метод з маскуванням детекгс^в [16] i запропонований метод синтезу продукцшних правил на основi негативного вiдбору (при використанш вибiрки 51 с 5) згенерували ютотно меншу кiлькiсть детекторiв (NАЬ = 19 i Nаь = 20, вщповщно), що свiдчить про бiльш ефективну роботу цих методiв. Зокрема, метод МСППНВ використовуе апрюрну iнформацiю про значущiсть оз-нак на початковому етапi i виключае з подальшого розг-ляду малозначущi i надлишковi ознаки, що дозволяе ско-ротити простiр пошуку i створювати набiр з невелико! юлькост детекторiв на основi високошформативних оз-нак, що характеризуеться високими апроксимацiйними й узагальнюючими здiбностями.

Для аналiзу узагальнюючих здiбностей дослщжува-

них методiв використовувалися критерi! Е{ ,

Pt,tg =¡11¡д =¡0 i Pt,tg =¡01¡д =¡1 , що характеризують помилки розтзнавання й iмовiрностi прийняття помилкових рiшень на тестових даних. Як видно з табл. 1, помилки

розтзнавання на тестових даних Е{ у моделей, синтезо-ваних за допомогою запропонованого методу МСППНВ, ютотно нижче помилок моделей, побудованих за допо-могою вiдомих методiв [13]—[16] (Е{ = 0,136, Е{ = 0,077, Е{ = 0,055 для метседв [13], [14, 15] i [16], вщповщно). Це пояснюеться використанням в якост критерпв ощнюван-

ня кандидатiв у детектори характеристик 0{АЬ^), що дозволяють ощнювати здатнiсть детекторiв до узагаль-нення даних. Запропонований метод синтезу продукцшних правил на осжда негативного вщбору дозволив до-сягти рiвнiв помилки Е{ = 0,037 (при використанш час-тини вибiрки 51 с 5) i Е{ = 0,011 (при використанш повно!

вибiрки 5 =< Р,Т >).

Важливо вiдзначити, що в силу специфши розв'язу-вано! задачi дiагностування лопаток газотурбiнних авiа-цiйних двигунiв дуже високу щну мае iмовiрнiсть по-

Таблиця 1 — Результати експерименлв з пор1вняння запропонованого методу з шшими методами негативного вщбору

Метод мс Е ^д =¡1 1 ¡д =¡0 ^^ =¡0 1 ¡д Ц

Метод з цензуруванням [ 13] 207 50 27,3 0,070 0,126 0,333 0,136

Модель У-Эе!еск>г [14, 15] 41 50 24,1 0,035 0,069 0,250 0,077

Метод з маскуванням детектор1в [16] 19 14 13,2 0,018 0,054 0,083 0,055

Метод синтезу продукцшних правил на основ!

негативного вщбору МСППНВ (використовувалася 20 12 12,1 0,026 0,038 0 0,037

виб1рка 51 с 5)

Метод синтезу продукцшних правил на основ!

негативного вщбору МСППНВ (використовувалася 31 19 13,7 0,009 0,011 0 0,011

вийрка 5 =< Р,Т > )

Таблиця 2 — Результати пор1вняння р1зних моделей

Модель N 1 у рагат Е Pt,tд = ¡1 1 ¡д = ¡0 Р ,tg =¡0 1 ¡д =¡1 Е

Модель у вигляд1 набору продукцшних правил, синтезованих за допомогою запропонованого методу 652 0,009 0,011 0 0,011

Нейромережева модель прямого поширення 427 0,018 0,065 0,167 0,070

Модель у вигляд1 набору детектор1в, побудована за допомогою методу негативного вщбору з маскуванням детектор1в [16] 804 0,018 0,054 0,083 0,055

р-^Ы 1607-3274. Радюелектронжа, шформатика, управлшия. 2016. № 1 е-^Ы 2313-688Х. Каёю Е1е^гоп^, Computer Science, Control. 2016. № 1

милки Р, =I I, =,< вщнесення до класу «чужих» (=

10 / tq 11 ^

придатних) за умови, що екземпляр реально вщноситься до класу «сво1х» (tq = Ч, дефектних). Це обумовлено тим, що вщнесення дефектних лопаток ав1адвигушв до класу придатних може коштувати людських житта. Як видно з табл. 1, запропонований метод МСППНВ, на в1дм1ну вщ юнуючих, на тестових даних показав нульовий р1вень 1мо-в1рност1 помилки Р( t /1 , що св1дчить про його ви-

соку ефектившсть для розв'язання под1бних задач. Нульовий р1вень 1мов1рност1 помилки Р( t /=tí при вико-

ристанш запропонованого методу пояснюеться:

- високим р1внем покриття типових екземпляр1в класу tq = ^ за допомогою згенерованого набору детектор1в

отриманого з використанням апрюрно1 шформацп про значущ1сть ознак;

- високими узагальнюючими зд1бностями синтезо-ваного набору детектор1в, що обумовлено застосуван-ням в якост критер1ю ощнювання детектор1в характеристик (6) \ (7), що дозволяють оцшити здатшсть детектор1в ЛЬк до узагальнення даних.

Як видно з табл. 2,

к1льк1сть параметр1в N рагат мо-

дел1 у вигляд1 набору продукцшних правил, синтезова-них за допомогою запропонованого методу (Nрагат = 652), менше, шж в аналопчнш модели побу-довано1 за допомогою методу негативного выбору з маскуванням детектор1в [16] (Nрагат = 804). Це обумовлено тим, що при використанш запропонованого методу середнш розм1р згенерованих детектор1в менше, ос-кшьки в процес негативного вщбору використовуеться апрюрна шформащя про значущ1сть ознак. Це дозволяе виявляти \ виключати з подальшого розгляду малозна-чущ1 \ надлишков1 ознаки, що ускладнюють процес синтезу д1агностичних моделей \ знижують 1х штерпрета-бельшсть. Таким чином, пор1вняння значень р1зних кри-терпв, представлених у табл. 2, показуе, що модель у вигляд1 набору продукцшних правил, синтезованих за допомогою запропонованого методу МСППНВ, е бшьш простою \ зрозумшою в пор1внянш з моделлю, створе-ною за допомогою методу [16]. Апроксимацшш й уза-гальнююч1 зд1бност1 модел1, синтезовано1 на основ! методу МСППНВ, також е бшьш високими, про що св1дчать

значення критер11в E, ^ , Р^ =tí /^ =(0 1 Pt,tq / ^ =tí.

Пор1вняння модел1 на основ1 методу МСППНВ [ ней-ромережево1 модел1 дозволяе зробити висновок про те, що модель, побудована за допомогою запропонованого методу, характеризуеться бшьш високими узагальнюючими й апроксимацшними зд1бностями (критерп Е, Е( ,

=tí / 1 ^^ / =^). Однак, кшьюсть параметр1в

Nрагат модел1 на основ1 методу МСППНВ (Nрагат = 652) е дещо бшьшою, шж у нейромережевш модел1 Шрагат = 427). Це пояснюеться тим, що нейро-

мережева модель представляеться у вигляд1 множини нейрошв, яю пов'язаш м1ж собою певним чином [ харак-

теризуються ваговими коефщентами як налагоджува-ними параметрами. А кожен нейрон, по суп, вщповщае деякш функцп багатьох аргумента. При цьому така модель е досить складною для сприйняття лю диною. Не див-лячись на бшьше значення критер1ю N рагат, модель у вид1 набору продукцшних правил, синтезованих за допомогою запропонованого методу, е бшьш штерпретабель-ною у пор1внянш з нейромережевою моделлю, оскшьки продукцшш правила вигляду «Якщо умова, то д1я» е знач-но бшьш зрозумшими \ зручними для сприйняття люди-ною, шж наб1р коефщента, що вщображаються стушнь зв'язюв нейрошв у нейромережевш моделг

Таким чином, результати експеримента показали, що запропонований метод за рахунок використання апрюр-но1 шформацп \ виключення малозначущих \ надлишко-вих ознак з виб1рки дозволяе скорочувати простар пошу-ку \ час виконання методу, а також синтезувати розтзна-вальн1 модел1 у вигляд1 набору детектор1в з високими апроксимац1йними й узагальнюючими зд1бностями. Кр1м того за рахунок тдвищення узагальнюючих влас-тивостей синтезованих моделей шляхом скорочення кшькоста детектор1в \ умов антецедент1в тдвищуе 1нтерп-ретабельн1сть модел1, скорочуе 11 розм1ршсть 1, отже, обсяг використовувано1 пам'ят1. ВИСНОВКИ

У робот1 виршено актуальне завдання автоматизацИ синтезу продукцшних правил на основ! негативного вщбору для випадку нер1вном1рного розпод1лу екземп-ляр1в клас1в виб1рки.

Наукова новизна роботи полягае в тому, що запропо-новано метод синтезу продукцшних правил на основ1 негативного вщбору для випадку нер1вном1рного розпо-д1лу екземпляр1в клас1в виб1рки, який при генерацИ набору детектор1в використовуе в1дому 1нформац1ю про екземпляри вс1х клас1в виб1рки, враховуе шформащю про 1ндив1дуальну значущ1сть ознак, як форму детектора використовуе гшеркуб максимально можливого об'ему, що дозволяе виключати малозначущ1 \ надлишков1 ознаки з виб1рки, скоротивши тим самим проспр пошуку \ час виконання методу, а також формувати наб1р детек-тор1в з високими апроксимацшними й узагальнюючими зд1бностями. Запропонований метод за рахунок тдви-щення узагальнюючих властивостей синтезованих моделей шляхом скорочення числа детектор1в \ умов антецедента також тдвищуе штерпретабельшсть модел1, скорочуе 11 розм1ршсть (структурну \ параметричну складшсть), обсяг використовувано1 пам'ят1 \ тдвищуе швидкодж> модел1 при посл1довн1й реал1зацп обчислень.

Практична ц1нн1сть отриманих результата полягае в тому, що виконано експериментальне дослщження запропонованого методу \ його пор1вняння з вщомими аналогами, а також виршено практичну задачу д1агносту-вання лопаток газотурбшних ав1ац1йних двигун1в.

Перспективи подальших досл1джень полягають у зас-тосуванш запропонованого п1дходу до видобування знань у вигляд1 набору продукц1йних правил з навчаль-них виб1рок даних при синтез! нейро-нечгтких моделей для виршення практичних задач неруйн1вного контролю якостг

ПОДЯКИ

Роботу виконано при частковш пiдтримцi ]шжнарод-

ного проекту «Centers of Excellence for young

RESearchers» (CERES) програми «Tempus» Свропейсь-

ко! Комюп (реестрацшний номер 544137-TEMPUS-1-2013-

1 -SK-TEMPUS-JPHES).

СПИСОК ЛГГЕРАТУРИ

1. Ding S. X. Model-based fault diagnosis techniques: design schemes, algorithms, and tools / S. X. Ding. - Berlin : Springer, 2008. -473 p. DOI: 10.1007/978-3-540-76304-8.

2. ASM handbook. - Vol. 17: Nondestructive evaluation and quality control. - Cleveland : ASM International, 1997. - 1607 p.

3. Diagnosis and fault-tolerant control / [M. Blanke, M. Kinnaert, J. Lunze, M. Staroswiecki]. - Berlin : Springer, 2006. - 672 p. DOI: 10.1007/978-3-662-05344-7.

4. Price C. Computer based diagnostic systems / C. Price. - London : Springer, 1999. - 136 p. DOI: 10.1007/978-1-4471-0535-0.

5. Denton T. Advanced automotive fault diagnosis / T. Denton. -London : Elsevier, 2006. - 271 p. DOI: 10.4324/9780080462585.

6. Ukil A. Intelligent Systems and Signal Processing in Power Engineering / A. Ukil. - Berlin : Springer, 2007. - 372 p. DOI: 10.1007/978-3-540-73170-2.

7. Ishida Y Immunity-based systems: a design perspective / Y Ishida. -Berlin : Springer, 2004. - 177 p. DOI: 10.1007/978-3-662-07863-1.

8. Segel L. A. Design principles for immune system and other distributed autonomous systems / L. A. Segel, I. R. Cohen. - New York : Oxford University Press, 2001. - 428 p.

9. Flower D. In silico immunology / D. Flower, J Timmis. - New York : Springer, 2007. - 451 p. DOI: 10.1007/978-0-387-39241-7.

10. A new cluster based real negative selection algorithm / W. Chen, T. Li, J. Qin [et al.] // Information and automation. - 2011. -Vol. 86. - P. 125-131. DOI: 10.1007/978-3-642-19853-3_18.

11. Esponda F. Negative representations of information / F. Esponda, S. Forrest, P. Helman // International Journal of Information Security. - 2009. - Vol. 8, № 5. - P. 331-345. DOI: 10.1007/ s10207-009-0078-1.

12. Gonzalez F. The effect of binary matching rules in negative selection / F. Gonzalez, D. Dasgupta, J. Gomez // Genetic and Evolutionary Computation: conference GECCO-2003, Chicago, 9-11 July 2003: proceedings. - Berlin-Heidelberg : Springer-Verlag, 2003. - P. 195-206. DOI: 10.1007/3-540-45105-6 25.

13. Ong A. An adaptive anomaly detection system using data mining and artificial immune system / A. Ong. - London : King's College London, 2007. - 348 p.

14. Gonzalez F. A. Anomaly detection using real-valued negative selection / F. A. Gonzalez, D. Dasgupta // Journal of Genetic Programming and Evolvable Machines. - 2003. - Vol. 4, № 4. -P. 383-403. DOI: 10.1023/a:1026195112518.

15. Chmielewski A. Simple method of increasing the coverage of nonself region for negative selection algorithms / A. Chmielewski, S. T. Wierzchon // Computer Information Systems and Industrial Management Applications: 6th International Conference CISIM'07, Elk, 28-30 June 2007: proceedings. - Los Alamitos : IEEE Computer Society, 2007. - P. 155-160. DOI: 10.1109/ cisim.2007.60.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16. Интеллектуальные информационные технологии проектирования автоматизированных систем диагностирования и распознавания образов : монография / [Субботин С. А., Олейник Ан. А., Гофман Е. А., Зайцев С. А., Олейник Ал. А.; под общ. ред. С. А. Субботина]. - Харьков : Компания СМИТ, 2012. -318 с.

17.Clarke B. Principles and theory for data mining and machine learning / B. Clarke, E. Fokoue, H. H. Zhang. - New York : Springer, 2009. - 781 p. DOI: 10.1007/978-0-387-98135-2.

18.Bishop C.M. Pattern recognition and machine learning /

C. M. Bishop. - New York : Springer, 2006. - 738 p. DOI: 10.1108/03684920710743466.

19. Analysis and design of intelligent systems using soft computing techniques / eds.: P. Melin, O. R. Castillo, E. G. Ramirez, J. Kacprzyk. - Heidelberg : Springer, 2007. - 855 p. DOI: 10.1007/ 978-3-540-72432-2.

20. Encyclopedia of machine learning / [eds. C. Sammut, G. I. Webb]. -New York : Springer, 2011. - 1031 p. DOI: 10.1007/978-0-38730164-8.

21. Russel S. Artificial intelligence: a modern approach / S. Russel, P. Norvig. - New Jersey: Prentice Hall, 2009. - 1152 p.

22. Intelligent data analysis: an introduction / [eds. M. Berthold,

D. J. Hand]. - New York: Springer Verlag, 2007. - 525 p.

23. Интеллектуальные средства диагностики и прогнозирования надежности авиадвигателей : монография / [Дубровин В. И., Субботин С. А., Богуслаев А. В., Яценко В. К.]. - Запорожье: ОАО «Мотор-Сич», 2003. - 279 с.

Стаття надшшла до редакцп 09.01.2016.

Шсля доробки 26.01.2016.

Олейник А. А.

Канд. техн. наук, доцент, доцент кафедры программных средств, Запорожский национальный технический университет, Запорожье, Украина

ИЗВЛЕЧЕНИЕ ПРОДУКЦИОННЫХ ПРАВИЛ НА ОСНОВЕ НЕГАТИВНОГО ОТБОРА

Решена задача разработки математического обеспечения для автоматизации извлечения знаний в виде набора продукционных правил из обучающих выборок данных. Объектом исследования являлся процесс построения моделей неразрушающего контроля качества. Предмет исследования составляют методы извлечения продукционных правил на основе отрицательного отбора для синтеза моделей контроля качества. Цель работы: создание метода синтеза продукционных правил на основе множества детекторов, заключающегося в обработке данных обучающей выборки, характеризующейся существенным отличием числа экземпляров, относящихся к разных классам. Предложен метод синтеза продукционных правил на основе отрицательного отбора для случая неравномерного распределения экземпляров классов выборки, который при генерации набора детекторов использует известную информацию об экземплярах всех классов выборки, учитывает информацию об индивидуальной значимости признаков, в качестве формы детектора использует гиперкуб максимально возможного объема. Разработанный метод позволяет исключать малозначимые и избыточные признаки из выборки, сократив тем самым пространство поиска и время выполнения метода, а также формировать набор детекторов с высокими аппроксимационными и обобщающими способностями. Предложенный метод за счет повышения обобщающих свойств синтезируемых моделей путем сокращения числа детекторов и условий антецедентов также повышает интерпретабельность модели, сокращает ее размерность (структурную и параметрическую сложность), объем используемой памяти и повышает быстродействие модели при последовательной реализации вычислений. Разработано программное обеспечение, реализующее предложенный метод. Проведены эксперименты по исследованию свойств предложенного метода. Результаты экспериментов позволяют рекомендовать предложенный метод для использования на практике.

Ключевые слова: выборка, диагностирование, модель контроля качества, отрицательный отбор, продукционное правило.

p-ISSN 1607-3274. PagioeneKTpomKa, rn^opMaTHKa, ynpaBmHHA. 2016. № 1 e-ISSN 2313-688X. Radio Electronics, Computer Science, Control. 2016. № 1

Oliinyk A.

PhD., Associate Professor, Associate Professor of Department of Software Tools, Zaporizhzhya National Technical University, Zaporizhzhya, Ukraine

PRODUCTION RULES EXTRACTION BASED ON NEGATIVE SELECTION

The problem of mathematical support development is solved to automate the extraction knowledge as production rules from the training data samples. The object of study is the process of constructing models of non-destructive quality control. The subject of study are methods of production rules extraction based on negative selection for synthesis of quality control models. The purpose of the work is to develop a method of production rules synthesis on the basis of a set of detectors is in the handling of data of training sample, characterized by a substantial number of instances of distinction belonging to different classes. A method for the synthesis of production rules on the basis of negative selection in the case of uneven distribution of instances of the sample classes is proposed. The developed method allows to exclude irrelevant and redundant features from the sample, thereby reducing the search space and time of execution of the method, as well as generate a set of detectors with high approximation and generalization capability. The proposed method improves the generalizing properties of synthesized model and its interpretability. The software implementing proposed method is developed. The experiments to study the properties of the proposed method are conducted. The experimental results allow to recommend the proposed method for use in practice.

Keywords: sample, diagnostics, model of quality control, negative selection, production rule.

REFERENCES

1. Ding S. X. Model-based fault diagnosis techniques: design schemes, algorithms, and tools. Berlin, Springer, 2008, 473 p. DOI: 10.1007/ 978-3-540-76304-8.

2. ASM handbook. Vol. 17: Nondestructive evaluation and quality control. Cleveland, ASM International, 1997, 1607 p.

3. Blanke M., Kinnaert M., Lunze J., Staroswiecki M. Diagnosis and fault-tolerant control. Berlin, Springer, 2006, 672 p. DOI: 10.1007/978-3-662-05344-7.

4. Price C. Computer based diagnostic systems. London, Springer, 1999, 136 p. DOI: 10.1007/978-1-4471-0535-0.

5. Denton T. Advanced automotive fault diagnosis. London, Elsevier,

2006, 271 p. DOI: 10.4324/9780080462585.

6. Ukil A. Intelligent Systems and Signal Processing in Power Engineering. Berlin, Springer, 2007, 372 p. DOI: 10.1007/9783-540-73170-2.

7. Ishida Y. Immunity-based systems: a design perspective. Berlin, Springer, 2004, 177 p. DOI: 10.1007/978-3-662-07863-1.

8. Segel L.A., Cohen I. R. Design principles for immune system and other distributed autonomous systems. New York, Oxford University Press, 2001, 428 p.

9. Flower D., Timmis J. In silico immunology. New York, Springer,

2007, 451 p. DOI: 10.1007/978-0-387-39241-7.

10. Chen W., Li T., Qin J. [et al.] A new cluster based real negative selection algorithm, Information and automation, 2011, Vol. 86, pp. 125-131. DOI: 10.1007/978-3-642-19853-3_18.

11. Esponda F., Forrest S., Helman P. Negative representations of information, International Journal of Information Security, 2009, Vol. 8, No. 5, pp. 331-345. DOI: 10.1007/s10207-009-0078-1.

12. Gonzalez F., Dasgupta D., Gomez J. The effect of binary matching rules in negative selection, Genetic and Evolutionary Computation: conference GECCO-2003, Chicago, 9-11 July 2003: proceedings. Berlin-Heidelberg, Springer-Verlag, 2003, pp. 195-206. DOI: 10.1007/3-540-45105-6_25.

13. Ong A. An adaptive anomaly detection system using data mining and artificial immune system. London, King's College London, 2007, 348 p.

14. Gonzalez F. A., Dasgupta D. Anomaly detection using real-valued negative selection, Journal of Genetic Programming and Evolvable Machines, 2003, Vol. 4, No. 4, pp. 383-403. DOI: 10.1023/a: 1026195112518.

15. Chmielewski A., Wierzchon S. T. Simple method of increasing the coverage of nonself region for negative selection algorithms, Computer Information Systems and Industrial Management Applications: 6th International Conference CISIM'07, Elk, 2830 June 2007: proceedings. Los Alamitos, IEEE Computer Society, 2007, pp. 155-160. DOI: 10.1109/cisim.2007.60.

16. Subbotin S. A., Olejnik An. A., Gofman E. A., Zajcev S. A., Olejnik Al. A.; pod obshh. red. S. A. Subbotina Intellektual'nye informacionnye tehnologii proektirovanija avtomatizirovannyh sistem diagnostirovanija i raspoznavanija obrazov: monografija. Har'kov, Kompanija SMIT, 2012, 318 p.

17. Clarke B. Fokoue E., Zhang H. H. Principles and theory for data mining and machine learning. New York, Springer, 2009, 781 p. DOI: 10.1007/978-0-387-98135-2.

18. Bishop C. M. Pattern recognition and machine learning. New York, Springer, 2006, 738 p. DOI: 10.1108/ 03684920710743466.

19. eds.: Melin P., Castillo O. R., Ramirez E. G., Kacprzyk J. Analysis and design of intelligent systems using soft computing techniques. Heidelberg, Springer, 2007, 855 p. DOI: 10.1007/978-3-54072432-2.

20. eds. Sammut C., Webb G. I. Encyclopedia of machine learning. New York, Springer, 2011, 1031 p. DOI: 10.1007/978-0-38730164-8.

21. Russel S., Norvig P. Artificial intelligence: a modern approach. New Jersey, Prentice Hall, 2009, 1152 p.

22. eds. Berthold M., Hand D. J. Intelligent data analysis: an introduction. New York, Springer Verlag, 2007, 525 p.

23. Dubrovin V. I., Subbotin S. A., Boguslaev A. V., Jacenko V. K. Intellektual'nye sredstva diagnostiki i prognozirovanija nadezhnosti aviadvigatelej : monografija. Zaporozh'e, OAO «Motor-Sich», 2003, 279 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.