11. Смоленцев, Н. К. Основы теории вейвлетов. Вейвлеты в MATLAB I Н. К. Смоленцев. - М. : ДМК Пресс, 2005. -304 с.
12. Дьяконов, В. П. Вейвлеты. От теории к практике I
В. П. Дьяконов - М. : СОЛОН-Пресс, 2002. - 440 с.
13 Zunino, L. Wavelet Entropy of Stochastic Processes I L. Zunino, D. G. Perez, M. Garavaglia, O. A. Rosso II Physica A. -2007. - V 379, N. 2. - Р 503-512.
14. PhysioNet: the research resource for complex physiologic signals [Электронный ресурс] - Режим доступа: www.physionet.org
Стаття надійшла до редакції 19.05.2011.
Кротких С. С., Кіріченко Л. О.
ДОСЛІДЖЕННЯ ВИКЛИКАНИХ ПОТЕНЦІАЛІВ У ЕЕГ ЛЮДИНИ ЗА ДОПОМОГОЮ ДИСКРЕТНОГО ВЕЙ-ВЛЕТ-ПЕРЕТВОРЕННЯ
В роботі за допомогою дискретного вейвлет-перетворен-ня проведено аналіз змінювання частотної структури елект-
роенцефалограми з викликаними потенціалами після впливу стимулу. Було реалізовано метод визначення часу реакції на стимул, який заснований на оцінюванні вейвлет-ентропії та відносної вейвлет-ентропии сегментів енцефалограми.
Ключові слова: Електроенцефалограма, викликані потенціали, дискретне вейвлет-перетворення, спектр вейвлет-енергії, вейвлет-ентропія, відносна вейвлет-ентропія.
Krotkih S. S., Kirichenko L. O.
ANALYSIS OF EVENT-RELATED POTENTIALS OF EEG SIGNAL USING DISCRETE WAVELET TRANSFORM
In this work we use discrete wavelet transform for analyzes the frequency structure of EEG signal with evoked potentials after effect of stimulus. The method for determining the response time to a stimulus, based on the evaluation of the wavelet entropy and relative wavelet entropy EEG, has been implemented.
Key words: еlectroencephalogram, evoked potentials, discrete wavelet transform, wavelet energy spectrum, wavelet entropy, relative wavelet entropy.
УДК004.853+004.832
Литвин В. В.
Канд. техн. наук, доцент Національного університету «Львівська політехніка»
МОДЕЛЮВАННЯ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ ПІДТРИМКИ ПРИЙНЯТТЯ РІШЕНЬ З ВИКОРИСТАННЯМ ОНТОЛОГІЧНОГО ПІДХОДУ
Досліджено функціонування інтелектуальних систем підтримки прийняття рішень, ядром баз знань яких є онтології. Розглядаються інтелектуальні агенти чотирьох типів. Для кожного типу розроблено метрику, яку використовують для визначення реле-вантності пропонованих системою рішень.
Ключові слова: інтелектуальна система підтримки прийняття рішень, інтелектуальний агент.
АНАЛІЗ ДОСЛІДЖЕНЬ ТА ПОСТАНОВКА ПРОБЛЕМИ В ЗАГАЛЬНОМУ ВИДІ
Технологія інтелектуальних систем підтримки прийняття рішень (ІСППР) є одним із найрозвинутіших напрямків штучного інтелекту. Дослідження у цій області полягають у розробці автоматизованих інформаційних систем, які застосовуються у тих областях діяльності людини, які вимагають логічного міркування, певної майстерності та досвіду.
Сучасний рівень розвитку ІСППР відбувається у двох напрямках розроблення інтелектуальних агентів (ІА) [1]:
- ІА, засновані на прецедентах (англійською - Case-Based Reasoning, або CBR);
- ІА планування діяльності (пошук у просторі станів).
Вибір ІА залежить від задачі. Метод виведення за прецедентами ефективний, коли основним джерелом знань про задачу є досвід, а не теорія; рішення не є унікальними для конкретної ситуації, а можуть бути використані
© Литвин В. В., 2011
в інших випадках; метою розв’язування задачі є отримати не гарантований вірний розв’язок, а кращий з можливих. Виведення, засноване на прецедентах, є методом побудови ІСППР, які приймають рішення щодо даної проблеми або ситуації за наслідками пошуку аналогій, що зберігаються в базі прецедентів [2]. Такий прецедент називають релевантним. З математичної точки зору серед
елементів множини прецедентів Рг = {Р^, РГ2,...РГ^} релевантним Рг^ є прецедент для якого відстань до поточної ситуації 5і є найменшою, тобто
Ргк = а^шіп d (Ргг, 5).
І
ІА планування діяльності повинен досягнути цільового стану. Насамперед він повинен побудувати план досягнення цього стану із всіма можливими альтернативами. Процес планування ґрунтується на декомпозиції. Задача планування 2Р містить 3 складові [3]: множину
станів St, множину дій A, множину цільових станів Goal (станів мети); тобто
ZP = (St, А , Goal^ .
Отже, для планування діяльності ІА повинен вміти оцінювати стани та дії.
Як бачимо для обох класів ІСППР необхідна метрика. У першому випадку для оцінювання релевантності прецедентів, у другому випадку - для оцінювання релевант-ності станів. Від способу визначення цієї метрики напряму залежить ефективність функціонування ІА. На наш погляд такий спосіб повинен базуватись на чіткому і аргументованому стандарті баз знань. У галузі інженерії знань таким стандартом стали онтології [4]. Тому нами запропоновано для побудови метрики використовувати онтології.
Під моделлю онтології О розуміють трійку вигляду:
O = (C, R, F),
де С - поняття; R - відношення між поняттями; F - інтерпретація понять та відношень (аксіоми). Аксіоми встановлюють семантичні обмеження для системи понять та відношень.
На сьогодні розрізняють три типи онтологій: пред-метно-орієнтовані (Domain-oriented), орієнтовані на прикладну задачу (Task-oriented) та загальні онтології (Top-level).
Мета роботи - побудувати моделі функціонування інтелектуальних систем підтримки прийняття рішень, які базуються на онтологіях в залежності від класу задач.
Постановка задачі. Побудувати метрики для оцінювання релевантності прецедентів в задачах пошуку аналогій та оцінювання релевантності станів для задач пошуку цільового стану. Ці метрики повинні базуватись на онтологіях. Апробувати отримані моделі функціонування ІСППР шляхом розроблення прикладних ІСППР.
КЛАСИФІКАЦІЯ ПРИКЛАДНИХ ЗАДАЧ З ТОЧКИ ЗОРУ ЇХ МЕТРИЗАЦІЇ
Проаналізувавши клас задач, для яких розробляють ІСППР, можна зробити висновок, що всі задачі можна поділити на два підкласи. Існує клас задач для яких суттєве значення понять (властивостей). Сюди відносяться задачі діагностики захворювань, розпізнавання образів, класифікація явищ на основі збору даних, тощо. Такі задачі назвемо ознаковими. Для іншого класу задач не є суттєвим значення понять, а скоріше їх семантика або частотність зустрічання термінів в тексті і т. д. Сюди можна віднести кластеризацію інформаційних ресурсів, класифікацію текстів згідно УДК, інтелектуальні пошукові системи, реферування та анотування текстових документів. Такий клас задач назвемо семантичними задачами. В результаті отримаємо поділ ІСППР за двома вимірами так, як це зображено на рис. 1. У кожній чверті перераховано окремі задачі, які попадають у відповідний клас.
Діагностика ЯЗ т її Планування діяльності
захворювань, о Cl підприємств та
Розпізнавання образів, 6 установ, ігри (шахи.
11 роги оз) 'eat not О а шашки, .../ гра на
спортивних подій,... Е біржі, ...
Прецедент
Іптел ектуальна пошукова система, класифікація текстових документів,...
З о-
і У
ТО Сі.
£ ■=
u
О
Планування
Реферування та анотування текстових документів, ...
Рис. 1. Класи задач, для розв’язування яких використовують ІСППР
Для ефективного функціонування ІА необхідно побудувати метрику, на основі якої визначати релевантність станів чи прецедентів. На наш погляд побудова такої метрики напряму залежить від класу задач: семантичні вони чи ознакові.
Отже, загалом, на нашу думку, виділяється чотири різних класи задач, які розв’язують ІСППР. Зріз за напрямами потребує дві різні функціональні моделі (пошук релевантних прецедентів та планування діяльності), зріз за типом задачі - використання двох різних метрик для розв’ язування цих задач та оцінки якості отриманих роз-в’ яз-ків. Далі розглянемо всі ці класи задач, однак, насамперед введемо поняття адаптивної онтології.
Ефективність адаптації онтології бази знань до особливостей предметної області визначають закладені в її структуру елементи та механізми її адаптації шляхом самонавчання під час експлуатації. Одним з підходів до реалізації таких механізмів є автоматичне зважування понять бази знань (БЗ) та семантичних зв’язків між ними під час самонавчання. Цю роль беруть на себе коефіцієнти важливості понять та зв’язків [5]. Коефіцієнт важливості поняття (зв’язку) - це чисельна міра, котра характеризує значущість певного поняття (зв’язку) у конкретній предметній області і динамічно змінюється за певними правилами у процесі експлуатації системи. Отже, ми розширимо поняття онтології, ввівши в її формальний опис коефіцієнти важливості понять та відношень. Тому таку онтологію ми будемо визначати як п’ятірку:
О = (Є, Я, ^, Ж, Ь),
де Ж- важливість понять Є; Ь - важливість відношень Я.
Визначену, таким чином, онтологію будемо називати адаптивною, тобто такою, що адаптується до ПО за рахунок модифікації понять та коефіцієнтів важливості цих понять і зв’язків між ними [6]. Така онтологія однознач -но представляється у вигляді зваженого концептуального графа (КГ) [7]. Тому метрику ми будемо будувати, використовуючи зважені КГ.
МЕТРИЗАЦІЯ ІНТЕЛЕКТУАЛЬНИХ АГЕНТІВ, БАЗОВАНИХ НА ПРЕЦЕДЕНТАХ
Вочевидь, що в залежності від прецеденту ваги понять різні. Тобто насправді Ж- вектор вимірності кількості прецедентів Ж=(Ж1,Ж2,_,ЖЛ,). Надалі будемо розглядати лише один прецедент, тобто нижній індекс у вазі понять опускатимемо.
Побудуємо метрику для семантичних задач, які використовують прецеденти. Нами пропонується визначати відстань між прецедентом і ситуацією, як суму відстаней між найважливішими поняттями прецедента та поточного випадку. Таких важливих понять може бути одне, два; однак якщо їх є більше-рівне трьох, то нами пропонується вибирати перші три. Ця кількість визначена на основі опитувань експертів різних ПО і вважається ними оптимальною. У такому випадку ми маємо 3 центри ваг
12 3
і-го прецедента ргі , рг , ргі і 3 центри ваг поточної ситуації 51,5 2,53. Тоді існує 9 різних відстаней й (рі/, 5к ), _/=1,2,3; к=1, 2, 3. Вибираємо 3 найменші з них та їх сумуємо. Отримана таким чином сума й буде відстанню між прецедентом та поточною ситуацією. Найважливішим є поняття, яке є центром ваг КГ. Центром ваг КГ є поняття, середня відстань від якого до всіх інших понять є найменшою. Вочевидь, що визначена таким чином відстань залежатиме від того як ми визначимо відстань між двома суміжними вершинами КГ. Для цього пропонується визначати відстані між вершинами, що з’ єднані зв’язком як
Q
dj, =-j Lj (W + W,)
(1)
де та Wj - коефіцієнти важливості вершин С і та С'■ відповідно; - коефіцієнт важливості зв’язку між вершина-
ми; 0> - константа, яка залежить від конкретної онтології. Приймемо, що Ьіі = да, тоді йи = 0.
Далі знаходимо центри ваг концептуального графа.
Це перші три вершини для яких середня відстань й є найменшою:
d * = min d, .
(2)
Середня відстань dt для вершини С . обчислюється згідно формули:
I d*
(З)
*
де п - кількість вершин графа; а, - найкоротший шлях між вершинами Сі та С, який обчислюється за допомогою відомих алгоритмів, наприклад Форда, Дейкстри, Флойда-Уоршалла [8].
Далі згідно концептуального графа, що задає онтологію прецедента шукаємо відстань від даного прецедента до поточної ситуації. Якщо поняття поточної ситуації не входять в концептуальний граф, то онтологію даного прецедента доповнюємо онтологією всього ІА до якого входить цей прецедент. Якщо ж необхідне поняття далі не входить в онтологію ІА, то його відсутність зумовлює ріст відстані до безмежності, що означає не близькість прецедента із поточною ситуацією.
Зазначимо, що пропонована таким чином відстань задовольняє трьом аксіомам метрики [З].
Ефективність розробленої відстані покажемо на прикладі аналізу анотацій наукових статей. Розглянемо три анотації статей.
1. The work js carrjed out jn a djrectjon of jnformatjon technologies development focused on the natural language information processing. On position of author offered model the problem of putting a language material in order with the help of the uniform standard, it is considered rather significant for the given class of technologies. It is one of the central problem on way of development of the effective technologies for language information processing. (ШІ, № 4, 2004, с. б13)
Відповідний концептуальний граф першої анотації поданий на рис. 2.
2. The article presents the basic concepts on researchjng and solvjng the task of automatjc knowledge retrieval from text documents. Industrial system that solves the stated above task is described as well as one of its main application. (ШІ, №S, 2004, с. бб8).
Відповідний концептуальний граф матиме вигляд, як наведено на рис. З.
S. The paper is dedicated to the problem of automated text consistency analysis. It is proposed to implement text consjstency vja text logjc analysjs wjth the attractjon of the knowledge of appljcatjon domajn, natural language and normative base. (ШІ, № S, 2004, с. бб0).
Концептуальний граф третьої анотації наведений на рис. 4.
Значення ваг понять та зв’язків взято із тестової онтології «напряму комп’ютерних наук» для прецеденту «штучний інтелект». У випадках, коли у графі немає зв’язку, вагу такого зв’язку вважали рівною З, що є середнім значенням ваги зв’язків. Користуючись формулою (1), в якій Q приймалося рівним 100, отримаємо зважені графи, які наведено на рис. З.
Використовуючи алгоритм Дейкстри та роблячи відповідні обчислення за формулами (2) та (З), отримаємо, що центрами ваг відповідних графів є:
d1 = {11}= {'technologies'}, d 2 = {4}= {'system'}, d З = {з}= {'knowledge'}.
1-й і З-й тексти легко зв’язуються за допомогою вершини ‘natural_language’ (З-а в 1-му тексті і 7-а в З-му
1 З
тексті). Тоді d5 и = 0,42; d^ 7 = 0,2З . А відстань мі
між
9З
1 - work
2 - direction
3 - information technologies
4 - focus
5 - natural_language
6 - information
7 - author
8 - model
9 - problem
10 - material
11 - technologies
12 - language
13 - standard
Рис. 2. Концептуальний граф 1-ї анотації
18,7
3,1
45,3
1 - work
2 - direction
3 - information technologies
4 - focus
5 - natural_language
6 - information
7 - author
8 - model
9 - problem
10 - material
11 - technologies
12 - language
13 - standard
Рис. 3. Концептуальний граф 2-ї анотації
Рис. 5. Зважені графи для трьох анотацій
1-м і 3-м текстом тоді рівна 0,б5.
d13 = 0,42 + 0,23 = 0,б5.
2-й і 3-й тексти легко зв’язуються за допомогою вершини ‘knowledge’ (7-а в 2-му тексті і 5-а в 3-му тексті).
Тоді, d4,7 = 0,71, що є відстаню між 2-м та 3-м текстом, оскільки ‘knowledge’ - центр ваг 3-го графа. Тобто
d 23 = 0,71.
Для обчислення відстані між 1-м і 2-м текстом скористаємося 3-м текстом, оскільки в перших двох немає спільних вершин. Тоді
d12 = d13 + d 23 = 0,б5 + 0,71 = 1,3б .
Отже, найближчими за змістом є 1-й і 3-й текст, найдальшими є 1-й і 2-й текст.
Побудуємо метрику для ознакових задач, які використовують прецеденти.
Нехай множина прецедентів Рг={Рг1, Рг2,..., Ргм} описується характеристиками (властивостями) Х={хр х2, ., хм}. Б- домен властивості х, - коефіцієнт важливості влас-
тивості х і прецедента Рг. Значення властивості х . позначатимемо і . = г( х.). Отже
Pr ^ х і=к =
Ч~ zi\, xi2 = zi 2 ,..., xik = zik f, де
= zk } де zij є Di<.
Позначимо I . - множина індексів властивостей прецедента Рг . . Тоді відстань між прецедентом Рг . та поточною ситуацією £ визначається як:
d і = Z ф( z і, , zS),
1 і:
(4)
де іц - значення властивості х ц прецедента Рг.; 1 - значення властивості хц поточної ситуації £; IЦ - множина індексів важливих властивостей прецедента Рг ; Iі = 1.1 ^Iі2 ^... ^їм, ; N. - кількість властивостей, необхідних розглянути щоб прийняти рішення стосовно прецедента Рг, Тобто
Ii1 = Vs!
Ii2 = V ^2
is1 = argmax w ,
iieIi
is2 = argmax w,{
h eI, 1 is1
.s3 = argmax w4
h eI,1 S1 2
Розглянемо функцію ф(Е, п). Очевидно, що Е - може бути діапазоном, тобто нечіткою підмножиною Е с Б, де Б - універсальна множина; числовим значенням або нечисловим значенням. В залежності від цього ф(Е, п) визначається по своєму, а саме:
ф(1, п) =
1 -Ц| (n), I - нечітка множина, ^•||-n|, 1 , n - числові значення,
1 - ц(|, n), I, n - нечислові значення,
(5)
де Це (п) - коефіцієнт впевненості того, що п належить нечіткій підмножині Е; X - числова величина, яка залежить
від ПО, щоб добуток X • |Е - п є [0, і]; ц(Е п) є[0Д] - нечітка величина подібності значень Е та п. Наприклад ц(Е,п) = 1, якщо Е = п , ц(Е,п) = 0,9, якщоЕ~п , ц(Е,п) = 0 , якщо Е ^ п.
Розглянемо приклад функціонування ІА в області медицини, а саме захворювань опорно-рухового апарату. За основу візьмемо результати досліджень, що одержали у Львівському Національному медичному університеті ім. Данила Галицького Е. Х.Заремба й О. О. Зімба. З деякими з них можна ознайомитися в [9]. Прецедентами є можливі захворювання. Для прикладу розглянемо три хвороби: Рг={‘Ревматизм’, ‘Артрит’, ‘Подагра’}.
Провівши онтологічний інжиніринг ПО, ми одержали множину властивостей, які необхібно дослідити та їх важливість в залежності від прецеденту. Наведемо деякі з них: Х={Ступінь недиференційованоїдисплазіїсполучної тканини, Концентрація ендотеліну-1 у плазмі крові, Температура, Біль у суглобі}. Розглянемо детальніше ці ознаки. Домен першої є нечислові значення, другої і третьої - відрізки, четвертої - бінарне значення. Так
БСндст = {слабк^ ^ред^ сильне} БК е п к=[0; 3,5]
БТ =[36,42], Д, ={ Так(1),Немає(0)}. Зна-
1 емпература •- 7 -17 Ьіль_у_суглобі 4 \ /? \ ■>;
чення цих ознак для ревматизму: ТемператураРевматизм= ={(36|0), (37|0,6), (38|1), (39|1), (40|0,7)} - нечітка множиша, Біль у суглоба =«Так(1)».
^ ^ Ревматизм 4 '
Важливість цих властивостей (коефіцієнти Щ) ми одержали методами статистичного аналізу (було досліджено 110 пацієнтів). Так для захворювання на ревматизм важливими симптомами є: наявність лади (^=0,7), астенічна статура (^=0,65), тонка шкіра (^=0,45), сколіоз (^=0,35). Перший симптом являє собою бінарну величину, що приймає значення з множини {Так(1),Немає(0)}, дві наступні - нечіткі величини, що приймають значення
з відрізка [0; 1] (зрозуміло, що 0 - відсутність симптому,
1 - повна впевненість у його наявності) і четвертий симптом теж нечітка змінна, тільки її носій - відрізок [0;3]. Для ревматизму приймаємо такі значення симптомів:
2 =1, 2 =1, г =1, г є[1,5; 3].
лади 7 ас 7 тк 7 сколіоз
Нехай при обстеженні пацієнта У ми одержали такі значення властивостей у ., у , у , у . Тоді відстань
лади ас тк сколіоз
до прецедента ‘Ревматизм’ вимірюється як:
^ревматизм = 0,7-\1-УЛади\+0,65-\1-Уас\+°45-\1--Утк\+0,35"\1- М- [1,5;3](усколіоз)\'
Аналогічним чином можна виміряти відстань до інших захворювань (‘Артрит’, ‘Подагра’). Пацієнт хворий тим захворюванням, відстань до якого є найменшою.
МЕТРИЗАЦІЯ ІНТЕЛЕКТУАЛЬНИХ АГЕНТІВ ПЛАНУВАННЯ ДІЯЛЬНОСТІ
Розглянемо спочатку ознакові задачі. Нехай v(St(i)) -оцінка стану St(i). ak - перехід із стану St(i) в стан St(j), використовуючи альтернативу а k. Наприклад, для зняття захисного покриття з поверхні трубопроводу можна використати три альтернативи: механічний, хімічний або
термічний спосіб зняття захисного покриття. v(ak) -
оцінка дії ak. Стан мети Goal визначається необхідністю деякій підмножині ознак X досягнути певних значень z(x, Goal) Vx є X .
Будь-який стан St (i) задається своєю множиною ознак Yi, які набувають значень z(y, St(i)) Vy є Yi.
Для оцінки стану St (i) необхідно здійснити відображення у множини ознак та їх значень стану St(i) в множину ознак та значень стану Goal за рахунок онтології, тобто
у: Y X. (6)
Тоді оцінка стану v(St(i)) обчислюється
v(St(i)) = d(St(i), Goal) = ^ wx<$(z(x, St(i)), z(x, Goal)),(7)
хєХ
де wx - важливість ознаки x в адаптивній онтології, функція Ф така ж як у формулі (5).
Вочевидь, що чим оцінка стану менша, тим стан кращий.
У наших дослідженнях для вибору дій ІА ми спиратимемось на раціональність агента як прагнення мінімізувати витрати ресурсів для досягнення кінцевого стану.
Тому вважатимемо, що кожна дія aij однозначно визначається витратами ресурсів gfj (ціна переходу зі стану
в стан), де k = 1, 2,..., nt. nt - кількість альтернатив аk для здійснення переходу aij . Кожна з альтернатив характеризується витратами ресурсів та терміном експлуатування. Інформація про альтернативи та витрати ресурсів повинна зберігатися в онтології. Інформація про значення ознак та виграш від переходу в стан (терміни експлуатування тощо) зберігається в базі даних. Вочевидь, що можуть появлятися нові альтернативи, тому інтелектуальному агенту необхідно постійно відстежувати наукові видання з метою їх пошуку та заносити в онтологію.
Оцінка дії прямопропорційна витраті ресурсів, тобто:
v(4) = E • gij, (8)
де E - скалярна величина, яка зводить вимір оцінки дії до одного виміру з оцінкою станів.
Загалом рішення стосовно вибору дії на основі альтернативи здійснюємо згідно формули:
0(4) = fflv(ak) + (1 -ra)v(St( j)), (9)
де ю є [0,1] - частка альтернативі, яку ІА віддає в процесі прийняття рішення, інша частка належить стану в який він перейде. Перехід здійснюємо у той стан для якого 0(aikj ) найменше.
Після оцінки дій та станів, задача вибору шляху зводиться до задачі асинхронного динамічного програмування [10]. Використовуючи методи придатні для розв’язування таких задач, знаходимо розв’ язок у вигляді шляху переходу з початкового у кінцевий стан.
Для семантичних задач про стан мети Goal наперед щось важко сказати. Наприклад, для задачі реферування текстових документів станом мети є кінцевий реферат, однак ми лише можемо собі уявляти як він приблизно має виглядати. Оцінка стану в такій задачі співпадає з оцінкою важливості семантичної одиниці (слово, лексема, речення), залежно від задачі. Нами запропоновано для таких задач будувати метрику на основі зважування міри TF-IDF онтологією ПО [11]. Тобто
v(St) = (TF - IDF) •W. (10)
Така оцінка містить істотні переваги у порівнянні з іншими оцінками, оскільки у ній одночасно враховується як частотний аналіз зустрічання термінів у тексті (TF-IDF), так і специфіка предметної області до якої належить тематика цього тексту. Новий стан для задач реферування полягає в додаванні у квазіреферат нових речень. Детальніше ця задача нами розглянута у [11].
МЕТОДИ ЗАДАННЯ ВАГ ВАЖЛИВОСТІ ПОНЯТЬ ТА ЗВ’ЯЗКІВ
Розглянемо методи задання початкових коефіцієнтів важливості понять та зв’язків та їх модифікацію в процесі функціонування інтелектуального агента для розв’язування ознакових та семантичних задач.
Методи задання початкових ваг (коефіцієнтів важливості) понять та зв’язків:
- за рахунок експертних оцінок;
- присвоєння випадковим чином;
- за рахунок аналізу (статистичного, інтелектуального) інформаційних джерел, які описують ПО в якій функціонує ІА.
Окрім того, ці ваги можуть мати обмеження на величину, наприклад їх значення знаходяться у відрізку [0, 1] (ймовірнісні методи), або без обмежень на величину (на-громаджувальні методи). Оскільки онтологія формує собою таксономію понять, то використовуючи мову
об’єктно-орієнтованого підходу, кожне поняття являє собою клас.
Для семантичних задач нами запропоновано такий метод обчислення ваг класів:
1. Повна вага Ж) класу онтології дорівнює сумі власної ваги Ж0) , ваги підкласів Ж?) та ваги суміжних класів Жп) (класів, зв’язаних з даним класом не І8-Л зв’язком):
Ж) = Ж 0) + Ж?) + Жп), (11)
де Ж?) = ^ Жск+1 ■ к - вага к підкласів)-го класу і-го
к
рівня, причому для кореневого класу рівень і = 0;
Жск+1 = Ж0к+1 + Ж4+1 - вага класу Ск+1; Ь), к - вага
зв’язку між класами Є) та Є]+^.
Перерахунок окремих компонент повної ваги класу відображено на схемі (рис. 6).
2. У момент внесення на і+1 -й рівень нового підкласу
йому присвоюється власна вага Ж 0)+1, рівна половині власної ваги класу вищого і-го рівня:
W 0i+1 = - W 0/
У 2 У
(12)
Вага класу Жс) та усіх батьківських класів аж до кореневого збільшується на величину ваги новостворено-го підкласу:
Wcm = Wcm + W0j+1, Vm < i.
(13)
3. Під час встановлення зв’язку між поняттями к1 та к2 між відповідними вершинами графа онтології з’являється ребро, а до ваги суміжних класів Жп1 додається вага Жс2 і навпаки - до Жп2 додається вага нового суміжного до нього класу Жс1, так що:
Wnj =£Wck • Lj, k
k
(14)
Повторне встановлення зв’язків приводить до появи кратних ребер у графі.
i-ии рівень
і+1-ий рівень
4. Кратність ребер відображає частоту зустрічання V пари семантично пов’язаних понять Ь+ = V • Ьі. Кратні ребра після перерахунку не збільшують валентність вершини.
5. Вага екземпляра БЗ дорівнює повній вазі його класу.
Таким чином, визначена модель онтології БЗ дає змогу розраховувати вагові коефіцієнти своїх компонентів у процесі їх додавання, вилучення і використання під час експлуатації системи, завдяки чому реалізує механізм адаптації до заданої користувачем ПО [12].
Зауважимо, що насправді коефіцієнти важливості понять та зв’язків між ними є векторними величинами розмірності кількості прецедентів або різних тематик визначених в конкретній ПО. Так, якщо ми розглядаємо задачу класифікації текстових документів, то в межах онтології має описуватись кілька різних тем. Тому коефіцієнти важливості понять залежать від тематики. Нехай
онтологія О описує т тем ПО - 77?і, 7%2,...,Ткт, тоді коефіцієнти ваг понять є вектор, компонентами якого є відповідні значення в залежності від теми, тобто
Ж = (№ь №2 ...,Жт). Для процесу автоматизованого реферування наперед треба вибрати тему, до якої належатиме текстовий документ, що опрацьовується, щоб система використовувала правильні ваги [13].
Розглянемо визначення ваг понять для ознакових задач на основі інтелектуального аналізу даних, а саме на основі побудови дерева рішень (ДР). Як відомо ознакові задачі дозволяють для пошуку релевантних прецедентів будувати ДР [14]. Однак, ДР не є панацеєю, оскільки згадувані ознаки, що лежать на відповідній гілці, що задає прецедент, не гарантують врахування повної множини ознак, які необхідно врахувати для знаходження релевантного прецедента. Нами пропонується використовувати ДР для визначення ваг базових термінів, які задають деякий прецедент, а потім на основі онтології ПО розвинути отримані ваги на всю онтологію для відповідного прецедента. Тоді для пошуку релевантного прецедента слід використовувати значення тих п понять, які для відповідного прецедента мають найбільші ваги.
Розглянемо гілку дерева рішень. Вершини (ознаки) цієї гілки знаходяться на к рівнях. Вочевидь, що чим вищий рівень, тим значуща ознака, яка на цьому рівні знаходиться. Ця евристична думка має бути відображена в значеннях ваг цих ознак. Крім того, пропонується ці ваги нормувати, тобто щоб їх сума для кожного прецедента (гілки) була рівна 1.
Розглянемо два способи визначення ваг базових ознак, які задовольняють вищі описані два припущення.
1 спосіб. Арифметичні ваги. Визначаються як відношення різниці (к+1) рівня дерева та рівня, на якому знаходиться ознака до суми всіх рівнів гілки, тобто базуються на сумі арифметичної прогресії:
к +1 — і к +1 — і
Рис. 6. Схема перерахунку окремих компонент повної ваги класу
к (1 + k )k
L j
j=1
w
2 спосіб. Геометричні ваги. Базуються на сумі геометричної прогресії:
2
k-і
2 k -1
Отримані на основі ДР ваги назвемо вагами базових ознак прецедента і позначимо таку множину ваг . Тепер необхідно їх розвинути на всю онтологію ПО, використовуючи таксономію понять онтології, відношення між поняттями та їх інтерпретацію. Математично (формально) цей процес запишемо у вигляді:
Wb
W.
(15)
Розмноження ваг на всю онтологію залежить від визначення (аксіоматизації) класів, їх ієрархії (вертикальний зв’язок) та горизонтальних зв’язків. У роботі [15] типам зв’язків присвоєні такі коефіцієнти важливості: для зв’язку типу спеціалізації («IS-А») - а = 0,9 ; для узагальнення («kind-of») - Y = 0,4; для причинного зв’язку («сaused-by») - Реву = 0,3; для характеризуючого зв’язку («сharacterized-by») - pwrt = 0,2 . Саме такі значення ми використовували під час розроблення вище описаних прикладних ІСППР.
Отже, загалом процес функціонування ІСППР на основі онтологій складається із кроків, наведених на рис. 7. Для його зображення використано діаграму діяльності (UMLActivity) [1б].
Для розроблення ІСППР було обрано такі програмні засоби (ПЗ):
- Для побудови онтології - редактор онтологій Protege ;
- Для запису правил бази знань - SWRL, який входить в Protege ;
- База даних - СКБД MySQL;
- Модуль керування процесом розв’язування задачі -мова програмування РНР.
В залежності від типу задачі в базі даних зберігаються: перелік прецедентів та відповідних до них рішень, ваги важливості понять адаптивної онтології, типи відношень та їх ваги, значення ознак, історія значень ознак (для задач планування).
ВИСНОВКИ
Розроблено математичні моделі функціонування інтелектуальних систем підтримки прийняття рішень в залежності від класу задачі. Всі ці моделі використовують метрику для знаходження релевантних прецедентів або визначення релевантності станів. Для побудови таких метрик використовуються онтології. З цією метою у загальноприйнятий трьохелементний кортеж, який задає онтологію (множина понять, відношень та їх інтерпретація), авторами додано дві скалярні величини (важливість понять та відношень), які використовуються для обчислення необхідних відстаней. Розглянуто способи завдання початкових коефіцієнтів важливості понять та зв’язків, зокрема на основі інтелектуального аналізу даних.
Розглянуті чотири класи задач. Визначено перелік задач, які входять до цих класів. Наведено приклади функціонування окремих інтелектуальних систем, які базуються на розроблених моделях.
СПИСОК ЛІТЕРАТУРИ
1. Каменнова, М. С. Корпоративные информационные системы: технологии и решения I М.С.Каменнова II Системы Управления Базами Данных. - 1995. - № 3. - С. 88-99.
w
Рис. 7. Діаграма діяльності ІСППР на основі онтологій
2. Funk, P. Advances in Case-Based Reasoning I P. Funr, P. A. Gonz 5lez-Calero II 7th European Conference, ECCBR 2004. - Madrid, Spain. - P. 375-380.
3. Рассел, С. Искусственный интеллект I С. Рассел, П. Нор-виг. - М. ; СПб. ; К. : Вильямс, 200б. - 1408 с.
4. Gruber, T. R. A translation approach to portable ontologies I T.R.Gruber II Knowledge Acquisition. - 1993. - N 5 (2). -P. 199-220.
5. Інтелектуальні системи, базовані на онтологіях II Д. Г. Досин, В. В. Литвин, Ю. В. Нікольський, В. В. Пасічник. - Львів : Цивілізація, 2009. - 414 с.
6. Литвин, В. В. Мультиагентні системи підтримки прийняття рішень, що базуються на прецедентах та використовують адаптивні онтології I В. В. Литвин II Радіоелектроніка, інформатика, управління. - 2009 . - № 2 (21). -С. 120-12б.
7. Sowa, J. Conceptual graphs for a database interface I J.Sowa
II IBM Journal of Research and Development. - Vol. 20. -№ 4. - 197б. - Р. 33б-357.
8. Свами, М. Графы, сети и алгоритмы I М. Свами, К. Тхула-сираман. - М. : Наука, 1984. - 408 с.
9. Литвин, В. В. Проектування інтелектуальних агентів прийняття рішень в просторі ознак з використанням онтологічного підходу I В. В. Литвин, Р. Р. Даревич, Д. Г. Досин, Н. В. Шкутяк II Штучний інтелект. - 2010. -№ 3. - С. 254-2б2.
10. Скобелев, В. Г. Локальные алгоритмы на графах I В. Г.Ско-белев. - Донецк : ИПММ НАН Украины, 2003. - 217 с.
11. Крайовський, В. Я. Основні підходи до розроблення нро-граммного комплексу автоматичного реферування текстових документів I В. Я. Крайовський В. В. Литвин, Н. Б. Шаховська II Інститут проблем моделювання в енергетиці. -2009. - Випуск 51. - С. 178-18б.
12. Даревич, Р Р Оцінка подібності текстових документів на основі виз-начення інформаційної ваги елементів бази знань I Р. Р. Даревич, Д. Г. Досин, В. В. Литвин,
З. Т. Назарчук II Штучний інтелект. - 200б. - № 3. -С. 500-509.
13. Литвин, В. В. Метод автоматизованого реферування текстових документів з використанням онтологій I
B. В. Литвин, В. А. Гайдін, О. Ю. Пшеничний II Складні системи і процеси. - Запоріжжя. - 2009. - № 1. - С. 81-87.
14. Цвєтков, А. М. Разработка алгоритмов индуктивного вывода с использованием деревьев решений I А. М. Цветков II Кибернетика и системный анализ. - № 1. - 1993. -
C. 174-178.
15. Bulskov, H. On Querying Ontologies and Databases I
H. Bulskov, R. Knappe, R. Andreasen II FQAS. - 2004. -P. 191-202.
16. Фаулер, М. UML в кратком изложении I М. Фаулер, К. Скотт. - М. : Мир, 1999. -340 с.
Стаття надійшла до редакції 02.12.2010.
Лытвын В. В.
МОДЕЛИРОВАНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ С ИСПОЛЬЗОВАНИЕМ ОНТОЛОГИЧЕСКОГО ПОДХОДА
Исследовано функционирование интеллектуальных систем поддержки принятия решений, ядром баз знаний которых являются онтологии. Рассматриваются интеллектуальные агенты четырех тинов. Для каждого тина разработана метрика, которая используется для определения релевантности предлагаемых системой решений.
Ключевые слова: интеллектуальная система поддержки принятия решений, интеллектуальный агент.
Lytvyn V. V.
INTELLIGENT DECISION SUPPORT SYSTEMS MODELING USING ONTOLOGICAL APPROACH
The functioning of intelligent decision support systems with knowledge base based on ontology is investigated. Four types of intelligent agents are considered. Metrics for each of them is developed and used to determine the relevance of solutions proposed by the system.
Keywords: Intelligent Decision Support System, Intelligent Agent.
УДК 004.3 Баркалов А. А.1, Зеленева И. Я.2, Цололо С. А.3, Биайрак Х.4
1 Д-р техн. наук, профессор Донецкого национального технического университета гз Канд. техн. наук, доцент Донецкого национального технического университета
4 Аспирант Донецкого национального технического университета
УМЕНЬШЕНИЕ ПЛОЩАДИ МАТРИЧНОЙ СХЕМЫ УСТРОЙСТВА _____________________УПРАВЛЕНИЯ С РАЗДЕЛЕНИЕМ КОДОВ___________________________________________________
В статье предложена модель композиционного микропрограммного устройства управления с разделением кодов, ориентированная на реализацию логической схемы устройства в базисе заказных матриц. В модели используется представление адреса вершины алгоритма управления в виде конкатенации кодов ОЛЦ и кода компоненты ОЛЦ. Этот подход позволяет уменьшить число входов и выходов схемы формирования функций возбуждения.
Ключевые слова: композиционное устройство управления, матричная схема, операторная линейная цепь (олц), разделение кодов.
ВВЕДЕНИЕ са и алгоритмы управления [1]. Если алгоритм управле-
При реализации схемы устройства управления (УУ) ния представлю лишйнот граф-схем°й алгоритма
необходимо учитывать особенности элементного бази- (ГСА) то для его Реализации целесообразно использо-
© Баркалов А. А., Зеленева И. Я., Цололо С. А., Биайрак Х., 2011