УДК 004.8
05.00.00. Технические науки
АСК-АНАЛИЗ КЛАССОВ ВИНА ПО ЕГО СВОЙСТВАМ НА ОСНОВЕ ДАННЫХ РЕПОЗИТОРИЯ UCI
Луценко Евгений Вениаминович
д.э.н., к.т.н., профессор
Scopus Author ID: 57191193316
РИНЦ SPIN-код: 9523-7101
prof. lutsenko @gmail. com
Кубанский государственный аграрный
университет имени И.Т.Трубилина, Краснодар,
Россия
Бруяко Анжелика Андреевна студентка группы: ПИ 1301 [email protected]
Кубанский государственный аграрный университет имени И.Т.Трубилина, Краснодар, Россия
Создание систем искусственного интеллекта является одним из важных и перспективных направлений развития современных информационных технологий. Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей этих систем. В данной работе рассмотрено решение задачи идентификации классов уровней оплаты сотрудников фирмы по их характеристикам. Для достижения поставленной цели необходимы свободный доступ к тестовым исходным данным и методика, которая поможет преобразовать эти данные в форму, которая необходима для работы в системе искусственного интеллекта. Удачным выбором является база данных тестовых задач для систем искусственного интеллекта репозитория UCI. В данной работе использована база данных «Wine Data Set» из банка исходных данных по задачам искусственного интеллекта - репозитория UCI. При этом наиболее достоверной в данном приложении оказались модели INF4, основанная на семантической мере целесообразности информации А.Харкевича при интегральном критерии «Сумма знаний». Точность модели составляет 0,916, что заметно выше, чем достоверность экспертных оценок, которая считается равной около 70%. Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется F-критерий Ван Ризбергена и его нечеткое мультиклассовое обобщение, предложенное проф.Е.В. Луценко (L-мера)
Ключевые слова: ИССЛЕДОВАНИЕ ЗАВИСИМОСТИ ОПЛАТЫ СОТРУДНИКОВ АПК ОТ ИХ ХАРАКТЕРИСТИК Doi: 10.21515/1990-4665-124-004
UDC 004.8 Technical sciences
ASC-ANALYSIS OF WINE CLASSES DUE TO THEIR PROPERTIES BASED ON DATA FROM THE UCI REPOSITORY
Lutsenko Eugeny Veniaminovich
Dr.Sci.Econ., Cand.Tech.Sci., professor
Scopus Author ID: 57191193316
RSCI SPIN-code: 9523-7101
prof. [email protected]
Kuban State Agrarian University, Krasnodar,
Russia
Brujako Anzhelika Andreevna Student
Kuban State Agrarian University, Krasnodar, Russia
Creation of artificial intelligence systems is one of important and perspective directions of development of modern information technology. As there are many alternatives to artificial intelligence systems, there is a need to evaluate mathematical models of these systems. In this work, we present a solution of the problem of identifying classes of salary levels of employees depending on their characteristics. To achieve this goal it requires free access to test the source data and methodology, which will help to convert the data into the form needed for work in artificial intelligence systems. A good choice is a database of test problems for systems of artificial intelligence of UCI repository. In this work we used the database called "Wine Data Set" from the Bank's original task of artificial intelligence from repository UCI. The most reliable in this application was the model of the INF4 based on semantic, according to A. Kharkevich, integral criteria of "Amount of knowledge". The accuracy of the model is 0,916, which is much higher than the reliability of expert evaluations, which is equal to about 70%. To assess the reliability of the models in the ASC-analysis and the system of "Eidos" we used the F-criterion of van Ritbergen and fuzzy multiCLASS generalization proposed by Professor E. V. Lutsenko (L-measure)
Keywords: INVESTIGATION OF THE DEPENDENCE OF PAYMENT OF AIC EMPLOYEES FROM THEIR CHARACTERISTICS
СОДЕРЖАНИЕ
ВВЕДЕНИЕ..........................................................................................................................................................2
1. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ.................................................................................................3
1.1. Описание решения................................................................................................................................3
1.2. Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel.................................................................................................................................................................3
1.3. Синтез и верификация статистических и интеллектуальных моделей..............................1
1.4. Виды моделей системы «Эйдос»......................................................................................................2
1.5. Результаты верификации моделей..................................................................................................4
2. РЕШЕНИЕ ЗАДАЧ В НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ...................................................10
2.1. Решение задачи идентификации.................................................................................................... 10
2.2. Поддержка принятия решений с п мощью SWOT и PEST матриц и диаграмм.................. 13
2.3. Наглядное отображение эмпирических закономерностей с помощью когнитивных функций......................................................................................................................................................... 15
ЗАКЛЮЧЕНИЕ.................................................................................................................................................21
ЛИТЕРАТУРА...................................................................................................................................................22
ВВЕДЕНИЕ
Создание систем искусственного интеллекта является одним из важных и перспективных направлений развития современных информационных технологий. Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей этих систем. В данной работе рассмотрено решение задачи идентификации классов вина.
Для достижения поставленной цели необходимы свободный доступ к тестовым исходным данным и методика, которая поможет преобразовать эти данные в форму, которая необходима для работы в системе искусственного интеллекта. Удачным выбором является база данных тестовых задач для систем искусственного интеллекта репозитория UCI.
В данной работе использована база данных «Wine Data Set» из банка исходных данных по задачам искусственного интеллекта - репозитория UCI.
Для решения задачи используем стандартные возможности Microsoft Office Word и Excel, блокнот, а также систему искусственного интеллекта "Эйдос- Х++".
1. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ
1.1. Описание решения
В соответствии с методологией АСК-анализа решение поставленной задачи проведем в четыре этапа:
1. Преобразование исходных данных из HTML-формата в промежуточные файлы MS Excel.
2. Преобразование исходных данных из промежуточных файлов MS Excel в базы данных системы "Эйдос".
3. Синтез и верификация моделей предметной области.
4. Применение моделей для решения задач идентификации, прогнозирования и исследования предметной области.
1.2. Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel
Из банка исходных данных по задачам искусственного интеллекта -репозитория UCI получаем исходную информацию по базе данных «Wine Data Set http://archive.ics.uci.edu/ml/datasets/wine», которую оставим без изменений.
Общее описание задачи: Файл «wine.names»:
1. Title of Database: Wine recognition data
Updated Sept 21, 1998 by C.Blake : Added attribute information
2. Sources:
(a) Forina, M. et al, PARVUS - An Extendible Package for Data Exploration, Classification and Correlation. Institute of Pharmaceutical
and Food Analysis and Technologies, Via Brigata Salerno, http://ej .kubagro.ru/2016/10/pdf/04.pdf
16147 Genoa, Italy.
(b) Stefan Aeberhard, email: [email protected]
(c) July 1991
3. Past Usage:
(1)
S. Aeberhard, D. Coomans and O. de Vel,
Comparison of Classifiers in High Dimensional Settings, Tech. Rep. no. 92-02, (1992), Dept. of Computer Science and Dept. of Mathematics and Statistics, James Cook University of North Queensland. (Also submitted to Technometrics).
The data was used with many others for comparing various classifiers. The classes are separable, though only RDA has achieved 100% correct classification.
(RDA : 100%, QDA 99.4%, LDA 98.9%, 1NN 96.1% (z-transformed data)) (All results using the leave-one-out technique)
In a classification context, this is a well posed problem with "well behaved" class structures. A good data set for first testing of a new classifier, but not very challenging.
(2)
S. Aeberhard, D. Coomans and O. de Vel, "THE CLASSIFICATION PERFORMANCE OF RDA"
Tech. Rep. no. 92-01, (1992), Dept. of Computer Science and Dept. of Mathematics and Statistics, James Cook University of North Queensland. (Also submitted to Journal of Chemometrics).
Here, the data was used to illustrate the superior performance of the use of a new appreciation function with RDA.
4. Relevant Information:
-- These data are the results of a chemical analysis of
wines grown in the same region in Italy but derived from three different cultivars.
The analysis determined the quantities of 13 constituents found in each of the three types of wines.
-- I think that the initial data set had around 30 variables, but for some reason I only have the 13 dimensional version. I had a list of what the 30 or so variables were, but a.) I lost it, and b.), I would not know which 13 variables are included in the set.
-- The attributes are (dontated by Riccardo Leardi, [email protected] )
1) Alcohol
2) Malic acid
3) Ash
4) Alcalinity of ash
5) Magnesium
6) Total phenols
7) Flavanoids
8) Nonflavanoid phenols
9) Proanthocyanins
10)Color intensity
11)Hue
12)OD28 0/OD315 of diluted wines
13)Proline
5. Number of Instances
class 1 59
class 2 71
class 3 48
6. Number of Attributes
13
7. For Each Attribute:
All attributes are continuous
No statistics available, but suggest variables for certain uses (e.g. for which are NOT scale invariant)
NOTE: 1st attribute is class identifier (1-3)
8. Missing Attribute Values:
None
9. Class Distribution: number of instances per class
class 1 59
class 2 71
class 3 48
Обучающая выборка: Таблица 1 - wine.data
to standardise us with classifiers
№ Class Alcohol Malic acid Ash Alcalinity of ash Magnesium Total phenols Flavanoids Nonfla_ vanoid phenols Proanth_ ocyanins Color intensity Hue OD280 /OD315 of diluted wines Proline
1 Class 1 14 2 2 16 127 3 3 0 2 6 1 4 1065
2 Class 1 13 2 2 11 100 3 3 0 1 4 1 3 1050
3 Class 1 13 2 3 19 101 3 3 0 3 6 1 3 1185
4 Class 1 14 2 3 17 113 4 3 0 2 8 1 3 1480
5 Class 1 13 3 3 21 118 3 3 0 2 4 1 3 735
6 Class 1 14 2 2 15 112 3 3 0 2 7 1 3 1450
7 Class 1 14 2 2 15 96 3 3 0 2 5 1 4 1290
8 Class 1 14 2 3 18 121 3 3 0 1 5 1 4 1295
9 Class 1 15 2 2 14 97 3 3 0 2 5 1 3 1045
10 Class 1 14 1 2 16 98 3 3 0 2 7 1 4 1045
11 Class 1 14 2 2 18 105 3 3 0 2 6 1 3 1510
12 Class 1 14 1 2 17 95 2 2 0 2 5 1 3 1280
13 Class 1 14 2 2 16 89 3 3 0 2 6 1 3 1320
14 Class 1 15 2 2 11 91 3 4 0 3 5 1 3 1150
15 Class 1 14 2 2 12 102 3 4 0 3 8 1 3 1547
16 Class 1 14 2 3 17 112 3 3 0 1 7 1 3 1310
17 Class 1 14 2 3 20 120 3 3 0 2 6 1 3 1280
18 Class 1 14 2 3 20 115 3 3 0 2 7 1 3 1130
19 Class 1 14 2 2 17 108 3 4 0 2 9 1 3 1680
20 Class 1 14 3 3 15 116 3 3 0 2 5 1 3 845
21 Class 1 14 2 2 16 126 3 3 0 2 6 1 4 780
22 Class 1 13 4 3 19 102 2 2 0 2 5 1 4 770
23 Class 1 14 2 2 17 101 3 3 0 2 4 1 4 1035
24 Class 1 13 2 3 18 95 2 2 0 1 4 1 4 1015
25 Class 1 14 2 3 20 96 3 3 0 2 4 1 4 845
26 Class 1 13 2 3 25 124 3 3 0 2 4 1 3 830
27 Class 1 13 2 3 16 93 3 3 0 1 5 1 3 1195
28 Class 1 13 2 2 17 94 2 2 0 1 4 1 3 1285
29 Class 1 14 2 3 19 107 3 3 0 2 5 1 3 915
30 Class 1 14 2 2 16 96 3 2 0 2 5 1 4 1035
31 Class 1 14 2 3 23 101 3 3 0 2 6 1 3 1285
32 Class 1 14 2 2 19 106 3 3 0 2 7 1 3 1515
33 Class 1 14 2 2 17 104 2 3 0 2 4 1 3 990
34 Class 1 14 2 3 20 132 3 3 1 1 5 1 3 1235
35 Class 1 14 2 3 19 110 2 3 0 2 4 1 3 1095
36 Class 1 13 2 2 21 100 3 3 0 2 5 1 3 920
37 Class 1 13 2 3 16 110 3 3 0 1 5 1 3 880
38 Class 1 13 2 3 18 98 2 2 0 1 4 1 3 1105
39 Class 1 13 2 2 16 98 2 3 0 1 4 1 3 1020
40 Class 1 14 4 3 13 128 3 3 0 2 5 1 4 760
41 Class 1 14 2 2 16 117 3 3 0 2 6 1 3 795
42 Class 1 13 4 2 19 90 2 3 0 1 4 1 3 1035
43 Class 1 14 2 3 15 101 3 4 0 2 5 1 4 1095
44 Class 1 13 4 2 18 103 3 3 0 2 4 1 3 680
45 Class 1 13 2 2 17 107 3 3 0 2 5 1 3 885
46 Class 1 14 4 2 19 111 3 3 0 1 5 1 3 1080
47 Class 1 14 4 2 16 102 3 3 0 2 5 1 3 1065
48 Class 1 14 2 2 16 101 3 3 0 2 6 1 3 985
49 Class 1 14 2 2 19 103 3 3 0 2 6 1 3 1060
50 Class 1 14 2 2 17 108 3 4 0 2 9 1 3 1260
51 Class 1 13 2 2 12 92 3 3 0 3 7 1 3 1150
52 Class 1 14 2 3 17 94 2 3 0 2 6 1 3 1265
53 Class 1 14 2 2 14 111 4 4 0 2 7 1 3 1190
54 Class 1 14 2 3 17 115 3 3 0 2 6 1 3 1375
55 Class 1 14 2 2 16 118 3 3 0 2 6 1 3 1060
56 Class 1 14 2 2 21 116 3 3 0 2 6 1 3 1120
57 Class 1 14 2 2 16 118 3 3 0 2 6 1 3 970
58 Class 1 13 2 3 17 102 3 3 0 2 6 1 3 1270
59 Class 1 14 1 3 17 108 3 4 0 2 7 1 3 1285
60 Class 2 12 1 1 11 88 2 1 0 0 2 1 2 520
61 Class 2 12 1 2 16 101 2 1 1 0 3 1 2 680
62 Class 2 13 1 2 17 100 2 1 1 1 6 1 2 450
63 Class 2 14 1 2 18 94 2 2 0 1 4 1 2 630
64 Class 2 12 1 2 19 87 4 3 0 2 4 1 3 420
65 Class 2 12 1 3 19 104 2 2 0 1 3 1 2 355
66 Class 2 12 1 3 18 98 2 3 0 2 5 1 2 678
67 Class 2 13 1 2 15 78 3 3 0 2 5 1 3 502
68 Class 2 12 1 2 20 78 2 2 0 1 5 1 3 510
69 Class 2 13 1 2 17 110 3 1 1 0 3 1 2 750
70 Class 2 12 1 2 17 151 2 1 0 3 3 1 3 718
71 Class 2 12 2 2 20 103 1 1 0 1 3 1 2 870
72 Class 2 14 2 3 25 86 3 3 0 2 3 1 3 410
73 Class 2 13 2 2 24 87 2 2 0 1 4 1 3 472
74 Class 2 13 2 3 30 139 3 3 0 2 3 1 4 985
75 Class 2 12 1 2 21 101 3 2 0 2 3 1 3 886
76 Class 2 12 2 2 16 97 2 2 0 1 4 1 2 428
77 Class 2 13 1 2 16 86 2 2 0 1 5 1 2 392
78 Class 2 12 3 2 18 112 2 1 0 1 3 1 3 500
79 Class 2 12 1 2 15 136 2 2 0 3 3 1 2 750
80 Class 2 13 4 2 23 101 3 3 0 2 3 1 3 463
81 Class 2 12 1 2 19 86 2 2 0 1 3 1 3 278
82 Class 2 13 2 2 19 86 2 3 0 2 4 1 3 714
83 Class 2 12 1 3 24 78 2 2 0 1 2 1 3 630
84 Class 2 13 4 2 23 85 2 2 1 2 5 1 2 515
85 Class 2 12 1 3 18 94 2 2 0 2 3 1 3 520
86 Class 2 13 1 2 18 99 2 2 0 1 3 1 3 450
87 Class 2 12 2 2 23 90 2 2 0 2 2 1 2 495
88 Class 2 12 2 3 26 88 2 2 0 1 3 1 3 562
89 Class 2 12 2 2 22 84 2 2 0 1 3 1 3 680
90 Class 2 12 1 2 24 70 2 2 0 1 2 1 3 625
91 Class 2 12 2 2 19 81 2 2 1 2 2 1 2 480
92 Class 2 12 2 2 22 86 1 1 1 2 4 1 3 450
93 Class 2 13 2 2 21 80 1 1 1 2 3 1 2 495
94 Class 2 12 3 2 18 88 2 2 0 2 2 1 3 290
95 Class 2 12 2 2 18 98 3 2 0 1 3 1 3 345
96 Class 2 12 2 2 19 162 3 2 0 3 3 1 3 937
97 Class 2 12 2 3 22 134 2 1 0 2 3 1 2 625
98 Class 2 12 1 2 16 85 3 3 0 2 3 1 3 428
99 Class 2 12 1 2 19 88 4 4 0 2 5 1 3 660
100 Class 2 12 3 2 18 88 3 3 0 3 2 1 3 406
101 Class 2 12 2 2 18 97 2 2 0 1 3 1 3 710
102 Class 2 13 1 2 19 88 1 1 0 1 2 1 3 562
103 Class 2 12 2 2 21 98 3 2 0 1 3 1 3 438
104 Class 2 12 2 2 20 86 3 2 0 1 2 1 2 415
105 Class 2 13 2 2 21 85 2 2 0 1 3 1 4 672
106 Class 2 12 3 2 22 90 2 2 1 1 3 1 3 315
107 Class 2 12 2 2 19 80 2 2 0 2 3 1 3 510
108 Class 2 13 2 2 23 84 1 2 0 2 3 1 2 488
109 Class 2 12 1 2 19 92 2 2 0 2 3 1 3 312
110 Class 2 12 1 3 20 94 3 3 0 2 3 1 3 680
111 Class 2 11 4 2 20 107 3 3 0 4 3 1 3 562
112 Class 2 13 2 2 21 88 3 2 0 1 2 1 3 325
113 Class 2 12 3 3 20 103 2 2 1 1 4 1 3 607
114 Class 2 11 1 3 21 88 2 2 0 1 3 1 2 434
115 Class 2 12 1 3 23 84 3 2 0 1 3 1 3 385
116 Class 2 11 2 2 22 85 2 2 1 2 2 2 3 407
117 Class 2 12 1 2 21 86 2 2 0 2 2 1 3 495
118 Class 2 12 2 2 23 108 2 2 0 2 2 1 3 345
119 Class 2 13 3 2 16 80 2 1 0 1 3 1 2 372
120 Class 2 12 3 2 19 87 2 2 0 2 1 1 3 564
121 Class 2 11 2 2 20 96 3 3 0 2 3 1 3 625
122 Class 2 12 2 3 29 119 3 5 0 2 6 1 4 465
123 Class 2 12 4 3 27 102 2 2 0 2 2 1 3 365
124 Class 2 13 6 2 22 86 3 3 0 2 3 1 3 380
125 Class 2 12 4 2 21 82 3 3 0 3 3 1 4 380
126 Class 2 12 2 2 21 85 3 3 0 1 3 1 3 378
127 Class 2 12 2 2 22 86 3 3 0 2 4 1 3 352
128 Class 2 12 2 3 29 92 2 2 1 2 3 1 2 466
129 Class 2 12 2 2 25 88 2 2 0 2 2 1 3 342
130 Class 2 12 4 2 22 80 2 2 0 1 3 1 3 580
131 Class 3 13 1 2 18 122 2 1 0 1 4 1 1 630
132 Class 3 13 3 2 20 104 1 1 0 1 5 1 1 530
133 Class 3 13 2 2 24 98 1 1 0 1 6 1 1 560
134 Class 3 13 4 2 22 106 2 1 0 1 5 1 1 600
135 Class 3 13 1 2 18 85 2 1 1 1 5 1 2 650
136 Class 3 13 2 2 19 94 2 1 1 1 7 1 2 695
137 Class 3 12 5 3 21 89 1 0 1 1 4 1 1 720
138 Class 3 13 6 3 25 96 2 1 1 1 5 1 2 515
139 Class 3 13 4 2 20 88 2 0 1 1 6 1 2 580
140 Class 3 13 3 3 24 101 2 1 1 1 5 1 2 590
141 Class 3 13 3 3 21 96 2 1 1 1 5 1 2 600
142 Class 3 13 3 2 20 89 1 1 0 1 6 1 2 780
143 Class 3 14 3 3 24 97 2 1 1 1 4 1 2 520
144 Class 3 14 5 2 20 92 2 1 0 1 4 1 2 550
145 Class 3 12 4 2 19 112 1 1 0 1 8 1 2 855
146 Class 3 13 4 2 21 102 2 1 0 1 4 1 2 830
147 Class 3 14 5 2 20 80 1 0 0 1 5 1 1 415
148 Class 3 13 5 2 22 86 2 1 0 1 8 1 2 625
149 Class 3 13 3 2 22 92 2 1 0 1 8 1 2 650
150 Class 3 13 4 2 22 113 1 1 0 1 9 1 1 550
151 Class 3 14 3 3 24 123 1 2 0 1 9 1 1 500
152 Class 3 13 3 2 22 112 1 1 0 1 11 0 1 480
153 Class 3 13 2 3 26 116 2 1 0 2 7 1 1 425
154 Class 3 13 3 2 19 98 2 1 1 2 11 1 2 675
155 Class 3 13 1 2 20 103 1 1 1 1 8 1 2 640
156 Class 3 13 5 2 22 93 2 1 1 2 8 1 1 725
157 Class 3 14 4 2 20 89 2 1 0 2 9 1 2 480
158 Class 3 12 3 3 27 97 2 1 1 1 8 1 2 880
159 Class 3 14 2 3 25 98 3 1 1 3 13 1 2 660
160 Class 3 13 2 3 23 89 3 1 1 2 12 1 2 620
161 Class 3 12 4 2 21 88 2 1 1 1 8 1 2 520
162 Class 3 14 3 3 20 107 2 1 1 1 6 1 2 680
163 Class 3 13 3 3 22 106 2 1 1 1 6 1 2 570
164 Class 3 13 3 2 19 106 1 1 0 1 5 1 2 675
165 Class 3 14 3 2 22 90 1 1 0 1 10 1 2 615
166 Class 3 14 4 2 23 88 1 0 1 1 7 1 2 520
167 Class 3 13 4 3 23 111 2 1 0 1 11 1 2 695
168 Class 3 13 3 2 20 88 1 1 0 1 10 1 2 685
169 Class 3 14 3 3 25 105 2 1 0 2 9 1 2 750
170 Class 3 13 5 3 25 112 2 1 0 1 9 1 2 630
171 Class 3 12 3 2 19 96 1 0 0 1 6 1 2 510
172 Class 3 13 2 2 20 86 1 1 0 1 10 1 2 470
173 Class 3 14 3 2 20 91 2 1 0 1 10 1 2 660
174 Class 3 14 6 2 21 95 2 1 1 1 8 1 2 740
175 Class 3 13 4 2 23 102 2 1 0 1 7 1 2 750
176 Class 3 13 4 2 20 120 2 1 0 1 10 1 2 835
177 Class 3 13 3 2 20 120 2 1 1 1 9 1 2 840
178 Class 3 14 4 3 25 96 2 1 1 1 9 1 2 560
Поскольку ввод исходных данных в систему «Эйдос» планируется осуществить с помощью ее универсального программного интерфейса импорта данных из внешних баз данных, который работает с файлами MS Excel, то преобразуем данные из html-файла в xls-файл, для чего выполним следующие операции.
Скопируем получившуюся таблицу из MS Word в MS Excel и запишем ее с именем: Inp_data.xls в папку: c:\Aidos-X\AID_DATA\Inp_data\. В файле Inp_data.xls добавим пустую колонку на позиции «A» и автоматически пронумеруем все строки. В результате получим таблицу исходных данных, полностью подготовленную для обработки в системе «Эйдос» и записанную в нужную папку в виде файла нужного типа с нужным именем.
Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос".
Для загрузки базы исходных данных в систему «Эйдос» необходимо воспользоваться универсальным программным интерфейсом для ввода данных из внешних баз данных табличного вида, т.е. режимом 2.3.2.2 (рисунок 1):
О 2.3.2.2. Универсальный программный интерфейс импорта данных а систему "5ЙДОС-Х+
1=1 : -fiH
Автоматическая формализация предметной области: генерация классификационных и описательных шкал и градаций, а также обучающей и распознаваемой выборки на основе базы исходных данных: "1пр_с]а1а"
Задайте параметры:
Стандарт XLS -файла
Задайте тип Файла исходных данных: "lnp_data'
RUS'''-':M'S'Exeel-2003' Г •. (•••:•, Excel-20G7(2G10) Г DBF -DBASE IV [DEiF/NTX) Стандарт DBF-Файла
CSV -iComiina-Separafed Values Стандарт CSV-файла
Задайте диапазон столбцов классификационных шкал: Начальный столбец классификационных шкал: ]
Конечный столбец классификационных шкал: ' 2
<• Н ули и пробелы считать 0 Т СУ Т СТ В И Е М данных Нули и пробелы считать ЗНАЧЕНИЯМИ данных (7 Создавать БД средних по классам "!пр_^«ЩЙШ® Требования к Файлу исходных данных
Задайте диапазон столбцов описательных шкал:— Начальный столбец описательных шкал: Конечный сголбец описательных шкал:
Задайте режим1
f* Формализации предметной области (на основе "Inp da'a") С Генерации распознаваемой выборки (на основе "lnp_rasp")
V Равные интервалы с разным числом наблюдений
• Разные интервалы с равным числом наблюдений
Задание параметров Формирования сценариев или способа интерпретации текстовых полей "lnp_daia": » Не применять сценарный метод АСК-анализа и спец.интерпретацию ТХТ-полей Г Применить сценарный метод прогнозирования АСК-анализа С Применить специальную интерпретацию текстовых полей "lnp_daia"
Пояснения по режиму
Не применять сценарный метод АСК-анализа и спец.интерпретацию ТХТ-пояей:
Сценарный метод АСК-анализа:
Записи Файла исходных данных lnp_daia" рассматриваются казкдая сама по себе независимо друг от друга
Спец.интерпретация ТХТ-полей
.Значения текстовых полей Файла исходных данных
"! no data" рассматриваются как целое
15
Задайте способ выбора размера интервалов:
Какие наименования ГРАДАЦИЙ числовых шкал использовать:
» Только интервальные числовые значения (например
Г' Топько наименования интервальных числовых значений (например
V И интервальные числовые значения, и их наименования (например
"1 Ш5Э873.0000С0(]. 178545.6868667}"] "Минимальное")
"Минимальное: 1/3-!53873.П|]00П0С. 178545.GGGGGG7}"
Пк
Cancel
Рисунок 1. Экранная форма Универсального программного интерфейса импорта данных в систему "Эйдос" (режим 2.3.2.2.)
В экранной форме, приведенной на рисунке 1, задать настройки, показанные на рисунке:
- "Задайте тип файла исходных данных Inp_data": "XLS - MS Excel-2003";
- "Задайте диапазон столбцов классификационных шкал": "Начальный столбец классификационных шкал" - 2, "Конечный столбец классификационных шкал" - 2 (последний столбец в таблице);
- "Задайте диапазон столбцов описательных шкал": "Начальный столбец описательных шкал" - 3, "Конечный столбец описательных шкал" - 12;
- "Задание параметров формирования сценариев или способа интерпретации текстовых полей": "Не применять сценарный метод АСК-анализа и спец.интерпретацию ТХТ-полей".
После нажать кнопку "ОК". Далее открывается окно, где размещена информация о размерности модели (рисунок 2). В этом окне необходимо нажать кнопку "Выйти на создание модели".
2322.. Задание размерности модели системы "ЭЙДОС-Х-ь+п | □ ||~В~||1
ЗАДАНИЕ В ДИАЛОГЕ РАЗМЕРНОСТИ МОДЕЛИ
Суммарное количество градаций классификационным и описательным шкал: [3 ;■: 65]
Тип шкалы Количество Количество Среднее Количество Количество Среднее
классифи- градаций количество описательным градаций количество
кационных классифи- градаций шкал описательных градаций
шкал кационным на класс.шкалу шкал на опис. шкалу
Числовые 0 0 0,00 13 65 5,00
Текстовые 1 3 3,00 0 0 0,00
ВСЕГО: 1 3 3,00 13 65 5,00
Зааайте число интервалов (градаций) в шкале:
В описательным шкалах: И 5
Пересчитать шкалы и градации Параметры числ.шкал и градаций Выйти на создание модели
Рисунок 2. Задание размерности модели системы "Эйдос"
Далее открывается окно, отображающее стадию процесса импорта данных из внешней БД "Inp_data.xls" в систему "Эйдос" (рисунок 3), а также прогноз времени завершения этого процесса. В том окне необходимо дождаться завершения формализации предметной области и нажать кнопку "ОК".
Рисунок 3. Процесс импорта данных из внешней БД "Inp_data.xls"
в систему "Эйдос"
В результате формируются классификационные и описательные шкалы и градации, с применением которых исходные данные кодируются и представляются в форме эвентологических баз данных. Этим самым полностью автоматизировано выполняется 2-й этап АСК- анализа «Формализация предметной области». Для просмотра классификационных шкал и градаций необходимо запустить режим 2.1 (рисунок 4).
О 2.1, Классификационные шкалы и градации. Текущая модель: "INF1"
Код шкалы Наименование классификеционной шкалы |
И CL4SS
<1 14
Помощь Доб.шкалу Доб.грац.шкалы Копир.шкалу К
И VvLld.-l
2 2/3-Class 2
Рисунок 4. Классификационные шкалы и градации (фрагмент)
Для просмотра описательных шкал и градаций необходимо запустить режим 2.2 (рисунок 5), а обучающей выборки - режим 2.3.1. (рисунок 6):
Рисунок 5. Описательные шкалы и градации (фрагмент)
(•) 2,3.1. Ручной ввод-корректировка обучающей выборки, Текущая модель: "11ЧР1"
К 2 2
4 4
6 6
8 3 8 3
1±Г
Квд объекта Класс 1 Класс 2 Класс 3 Класс 4
1 ^^Н
Щ
ЬГ ±-
Кцд объекта Признак 1 I Признак 2 Признак 3 Признак 4 Признак 5 I Признак 6 Признак 7
7 14 16 25 23 35
1 37 45 49 53 60 65 0
ьг
Помощь Скопировать обуч.выб. в расп. Добавить объект Добавить классы Добавить признаки Удалить объект Удалить классы Удалить признаки Очистить БД
Рисунок 6. Обучающая выборка (фрагмент) Тем самым создаются все необходимые и достаточные предпосылки для выявления силы и направления причинно-следственных связей между значениями факторов и результатами их совместного системного воздействия (с учетом нелинейности системы [10]).
Ниже приведены классификационные и описательные шкалы и градации создаваемых моделей.
ПАРАМЕТРЫ ШКАЛ И ГРАДАЦИЙ С АДАПТИВНЫМИ ГРАНИЦАМИ И ПРИМЕРНО РАВНЫМ КОЛИЧЕСТВОМ НАБЛЮДЕНИЙ ПО ГРАДАЦИЯМ с коррекцией ошибки округления числа наблюдений по интервалу градации при переходе к следующей градации
КЛАССИФИКАЦИОННАЯ ШКАЛА: код: [ 1], наим.: "CLASS", тип/число градаций в шкале: "Равное число событий в интервалах"/3
1 Наим.градации: 1/3-Class 1
2 Наим.градации: 2/3-Class 2
3 Наим.градации: 3/3-Class 3
ШКАЛА: код: [ 1] , наим.: "ALCOHOL набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
1 Наим. градации: 1/5- {11 0300000, 12 2500000} , размер интервала= 1 2200000, расч. /факт число наблюдений на градацию: 35/35
2 Наим. градации: 2/5- {12 2500000, 12 7200000} , размер интервала= 0 4700000, расч. /факт число наблюдений на градацию: 35/35
3 Наим. градации: 3/5- {12 7200000, 13 2700000} , размер интервала= 0 5500000, расч. /факт число наблюдений на градацию: 36/36
4 Наим. градации: 4/5- {13 2700000, 13 7500000} , размер интервала= 0 4800000, расч. /факт число наблюдений на градацию: 36/36
5 Наим. градации: 5/5- {13 7500000, 14 8300000} , размер интервала= 1 0800000, расч. /факт число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 2], наим.: "MALIC ACID", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
6 Наим.градации:
7 Наим.градации:
8 Наим.градации:
9 Наим.градации: 10 Наим.градации:
1/5-{0.7400000, 2/5-{1.5000000, 3/5-{1 .7300000, 4/5-{2 .1200000, 5/5-{3.3700000,
1.5000000}, размер интервала=0.7600000,
1.7300000}, размер интервала=0.2300000,
2.1200000}, размер интервала=0.3900000,
3.3700000}, размер интервала=1.2500000,
5.8000000}, размер интервала=2.43 00000,
расч./факт.число наблюдений на градацию: 35/35
расч./факт.число наблюдений на градацию: 35/35
расч./факт.число наблюдений на градацию: 36/36
расч./факт.число наблюдений на градацию: 36/36
расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 3], наим.: "ASH", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
11 Наим.градации:
12 Наим.градации:
13 Наим.градации:
14 Наим.градации:
15 Наим.градации:
1/5-{1.3600000, 2/5-{2.1700000, 3/5-{2.3000000, 4/5-{2.4100000, 5/5-{2 .6100000,
2.1700000}, размер интервала=0.8100000,
2.3000000}, размер интервала=0.1300000,
2.4100000}, размер интервала=0.1100000,
2.6100000}, размер интервала=0.2000000,
3.2300000}, размер интервала=0.6200000,
расч./факт.число наблюдений на градацию: 35/35
расч./факт.число наблюдений на градацию: 35/35
расч./факт.число наблюдений на градацию: 36/36
расч./факт.число наблюдений на градацию: 36/36
расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 4], наим.: "ALCALINITY OF ASH"
16 Наим.градации: 1/5-{10.6000000, 16.7000000}
17 Наим.градации: 2/5-{16.7000000, 18.5000000}
18 Наим.градации: 3/5-{18.5000000, 20.0000000}
19 Наим.градации: 4/5-{20.0000000, 22.0000000}
20 Наим.градации: 5/5-{22.0000000, 30.0000000}
набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
размер интервала= размер интервала= размер интервала= размер интервала= размер интервала=
6.1000000, расч./факт.число наблюдений на градацию: 35/35
1.8000000, расч./факт.число наблюдений на градацию: 35/35
1.5000000, расч./факт.число наблюдений на градацию: 36/36
2.0000000, расч./факт.число наблюдений на градацию: 36/36
8.0000000, расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 5],
21 Наим.градации:
22 Наим.градации:
23 Наим.градации:
24 Наим.градации:
25 Наим.градации:
"MAGNESIUM", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
1/5-{ 70.0000000, 88.0000000}
2/5-{ 88.0000000, 94.0000000}
3/5-{ 94.0000000, 101.0000000}
4/5-{101.0000000, 111.0000000}
5/5-{111.0000000, 162.0000000}
размер интервала= размер интервала= размер интервала= размер интервала= размер интервала=
18.0000000, расч./факт.число наблюдений на градацию: 35/35
6.0000000, расч./факт.число наблюдений на градацию: 35/35
7.0000000, расч./факт.число наблюдений на градацию: 36/36
10.0000000, расч./факт.число наблюдений на градацию: 36/36
51.0000000, расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 6], наим.: "TOTAL PHENOLS", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
26 Наим.градации: 1/5-{0.9800000, 1.6500000}
27 Наим.градации: 2/5-{1.6500000, 2.0200000}
28 Наим.градации: 3/5-{2.02 00000, 2.5000000}
29 Наим.градации: 4/5-{2.5000000, 2.8600000}
30 Наим.градации: 5/5-{2.86 00000, 3.8800000}
размер интервала=0.6700000, расч./факт.число наблюдений на градацию: 35/35
размер интервала=0.3700000, расч./факт.число наблюдений на градацию: 35/35
размер интервала=0.4800000, расч./факт.число наблюдений на градацию: 36/36
размер интервала=0.3600000, расч./факт.число наблюдений на градацию: 36/36
размер интервала=1.0200000, расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 7], наим.: "FLAVANOIDS", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
наим.
31 Наим. градации: 1/5- {0 3400000, 0 8300000}, размер интервала= 0 4900000, расч. / факт число наблюдений на градацию: 35/35
32 Наим. градации: 2/5- {0 8300000, 1 6900000}, размер интервала= 0 8600000, расч. / факт число наблюдений на градацию: 35/35
33 Наим. градации: 3/5- {1 6900000, 2 4300000}, размер интервала= 0 7400000, расч. /факт. число наблюдений на градацию: 36/36
34 Наим. градации: 4/5- {2 4300000, 2 9800000}, размер интервала= 0 5500000, расч. /факт. число наблюдений на градацию: 36/36
35 Наим. градации: 5/5- {2 9800000, 5 0800000}, размер интервала= 2 1000000, расч. /факт. число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 8] , наим. : "NONFLAVANOID PHENOLS", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в
интервалах"/5
36 Наим. градации: 1/5- {0 1300000, 0 2600000}, размер интервала= 0 1300000, расч. /факт. число наблюдений на градацию: 35/35
37 Наим. градации: 2/5- {0 2600000, 0 3000000}, размер интервала= 0 0400000, расч. /факт. число наблюдений на градацию: 35/35
38 Наим. градации: 3/5- {0 3000000, 0 3900000}, размер интервала= 0 0900000, расч. /факт. число наблюдений на градацию: 36/36
39 Наим. градации: 4/5- {0 3900000, 0 4800000}, размер интервала= 0 0900000, расч. /факт. число наблюдений на градацию: 36/36
40 Наим. градации: 5/5- {0 .4800000, 0 6600000}, размер интервала= 0 1800000, расч. /факт. число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 9], наим.: "PROANTHOCYANINS"
41 Наим.градации:
42 Наим.градации:
43 Наим.градации:
44 Наим.градации:
45 Наим.градации:
1/5-{0.4100000, 1.06 00000}
2/5-{1 .0600000, 1.4100000}
3/5-{1 .4100000, 1.6600000}
4/5-{1 .6600000, 1.9800000}
5/5-{1.9800000, 3.5800000}
набл.на шкалу (всего): 178, размер интервала=0.6500000, размер интервала=0.3500000, размер интервала=0.2500000, размер интервала=0.3200000, размер интервала=1.6000000,
тип/число градаций в шкале: расч./факт.число наблюдений расч./факт.число наблюдений расч./факт.число наблюдений расч./факт.число наблюдений расч./факт.число наблюдений
"Равное число событий в интервалах"/5
на градацию: на градацию: на градацию: на градацию: на градацию:
35/35 35/35 36/36 36/36 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 10] , наим.
46 Наим.градации: 1/5-{ 1.2800000, 2.9000000}
47 Наим.градации: 2/5-{ 2.9000000, 3.9500000}
48 Наим.градации: 3/5-{ 3.9500000, 5.2500000}
49 Наим.градации: 4/5-{ 5.2500000, 6.9000000}
50 Наим.градации: 5/5-{ 6.9000000, 13.0000000}
"COLOR INTENSITY", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
размер интервала= 1.6200000, расч./факт.число наблюдений на градацию: 35/35
размер интервала= 1.0500000, расч./факт.число наблюдений на градацию: 35/35
размер интервала= 1.3000000, расч./факт.число наблюдений на градацию: 36/36
размер интервала= 1.6500000, расч./факт.число наблюдений на градацию: 36/36
размер интервала= 6.1000000, расч./факт.число наблюдений на градацию: 36/36
ОПИСАТЕЛЬНАЯ ШКАЛА: код: [ 11],
51 Наим.градации:
52 Наим.градации:
53 Наим.градации: Наим.градации:
"HUE", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в интервалах"/5
ОПИСАТЕЛЬНАЯ ШКАЛА: интервалах"/5
54
55 Наим.градации: ,: [ 12],
1/5-{0 .4800000, 0.73 00000}
2/5-{0 .7300000, 0.9060000}
3/5-{0 . 9060000, 1.04 00000}
4/5-{1 .0400000, 1.1500000}
5/5-{1.1500000, 1.7100000}
размер интервала=0.2500000, расч./факт.число наблюдений на градацию: 35/35
размер интервала=0.1760000, расч./факт.число наблюдений на градацию: 35/35
размер интервала=0.1340000, расч./факт.число наблюдений на градацию: 36/36
размер интервала=0.1100000, расч./факт.число наблюдений на градацию: 36/36
размер интервала=0.5600000, расч./факт.число наблюдений на градацию: 36/36
"OD280/OD315 OF DILUTED WINES", набл.на шкалу (всего): 178, тип/число градаций в шкале: "Равное число событий в
56 Наим. градации: 1/5- {1 2700000, 1 7500000}, размер интервала= 0 4800000, расч. /факт. число наблюдений на градацию: 35/35
57 Наим. градации: 2/5- {1 7500000, 2 5000000}, размер интервала= 0 7500000, расч. /факт. число наблюдений на градацию: 35/35
58 Наим. градации: 3/5- {2 5000000, 2 8800000}, размер интервала= 0 3800000, расч. /факт. число наблюдений на градацию: 36/36
59 Наим. градации: 4/5- {2 8800000, 3 2600000}, размер интервала= 0 3800000, расч. /факт. число наблюдений на градацию: 36/36
60 Наим. градации: 5/5- {3 2600000, 4 0000000}, размер интервала= 0 7400000, расч. /факт. число наблюдений на градацию: 36/36
ШКАЛА: код: [ 13] , наим.: 'PROLINE" набл.на шкалу (всего) : 178, тип /число градаций в шкале: " Равное число событий в интервалах "
61 Наим. градации: 1/5- { 278 .0000000, 470. 0000000}, размер интервала= 192. 0000000, расч. /факт. число наблюдений на градацию: 35/35
62 Наим. градации: 2/5- { 470 .0000000, 600 0000000}, размер интервала= 130 0000000, расч. /факт. число наблюдений на градацию: 35/35
63 Наим. градации: 3/5- { 600 .0000000, 735 0000000}, размер интервала= 135 0000000, расч. /факт. число наблюдений на градацию: 36/36
64 Наим. градации: 4/5- { 735 .0000000, 1045. 0000000}, размер интервала= 310 0000000, расч. /факт. число наблюдений на градацию: 36/36
65 Наим. градации: 5/5- { 1045 .0000000, 1680. 0000000}, размер интервала= 635 0000000, расч. /факт. число наблюдений на градацию: 36/36
наим.
наим.
1.3. Синтез и верификация статистических и интеллектуальных моделей
Далее запускаем режим 3.5, в котором задаются модели для синтеза и верификации, а также задается модель, которой по окончании режима присваивается статус текущей (рисунок 7).
3.5, Выбор моделей для синтеза и верификаи
Задайте стат.модели н модели знаний для синтеза и верификации Статистические базы:
частный критерий: количество встреч сочетаний: "класс-признак" у объектов обуч.выборк^ ■ частный критерий: усл. вероятность 1-го признака среди признаков объектов ¡-го класса - частный критерий: условная вероятность ¡-го признака у объектов ¡-го класса
F ПТЙЙГ ф 2. PRC1 W 3. PRC2 Базы знаний:
К? 4. INF1 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC1 f? 5. INF2 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC2 К? 6. INF3 - частный критерий: Хи-квадрат, разности между фактическими и ожидаемыми абс.частотами
7. ÍNF.4 - частный критерий: ROI (Return On Investment); вероятности из PR CI W 8. INF5 - частный критерий: FUJI (Return On Investment); вероятности из PRC2 [í? Э. INF6 - частный критерий: разн.усл.и безусл.вероятностей; вероятности из PRC1 f? 10.INF7 - частный критерий: разн.усл.и безусл.вероятностей; вероятности из PRC2
Текущая модель
Г ABS Г PRC1 Г PRC2
(* INF1 Г INF2 Г INF3 Г INF4 Г INF5 Г IWF6 Г INF7
Параметры Копирования обучающей выборки в распознаваемую: Какие объекты обуч. выборки копировать; (* Копировать всю обучающую выборку С Копировать только текущий объект С Копировать каждый 14-й объект С" Копировать N случайных объектов С Копировать все объекты от N1 до N2 С Вообще не менять распознаваемую выборку
Пояснение по алгоритму вериФ^_ацйи_|-
Удалять из обуч.выборки скопированные объекты: (* Не удалять С Удалять
- Подробнее |-
Измеряется внутренняя достоверн. модели
Для каждой заданной модели выполнить: £• Синтез и верификацию Г" Только верификацию
Ok
Cancel
Рисунок 7. Выбор моделей для синтеза и верификации, а также текущей модели
В данном режиме имеется много различных методов верификации моделей, в том числе и поддерживающие бутстрепный метод. Но мы используем параметры по умолчанию, приведенные на рисунке 10. Стадия процесса исполнения режима 3.5 и прогноз времени его окончания отображаются на экранной форме, приведенной на рисунке 8.
Рисунок 8. Синтез и верификация статистических моделей
и моделей знаний
Интересно заметить (см. рисунок 8), что синтез и верификация всех 10 моделей на данной задаче заняли 56 секунд. При этом верификация (оценка достоверности моделей) проводилась на всех 178 примерах наблюдения из обучающей выборки. В результате выполнения режима 3.5 созданы все модели, со всеми частными критериями, перечисленные на рисунке 8, но ниже мы приведем лишь некоторые из них (таблицы 2, 3, 4).
1.4. Виды моделей системы «Эйдос»
Рассмотрим решение задачи идентификации на примере модели ЮТ1, в которой рассчитано количество информации по А.Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак.
По сути, частные критерии представляют собой просто формулы для преобразования матрицы абсолютных частот (таблица 2) в матрицы условных и безусловных процентных распределений, и матрицы знаний (таблицы 3 и 4).
Таблица 2 - Матрица абсолютных частот (модель ABS (фрагмент)
С) 5,5. Модель: "1. ABS - частный критерий: количество встреч сочетаний: "Ютасс-признак" у объектов обуч.выборки"
Km признака Н аимёноБание-опййагёлЪной. Шкалы и градации 1. шяз Ш CLASS/i 2. CLASS Ц®: .3. CLASS cL«sa Cy.tt'i Среднее- Среди.
■ ШаЮШ ШШШШ8 laaoücpin! "34 •ъ 37 i? .wi Ш , K4
2 АВДР'НО L-2/H12.2500BÜp; 12 iBDOODOJ 17 ■? .34 Ii.33.9 14.(12
3 ALCDH0 L-3/5-Л 2.7200000.13.2700000} 11 6 18 35 11.667 6 «8
4 ALÖHOL-4/5-{13Ä№:№5ÜÄ0}: 19 ■3 14 ■35 12 ': »0 8 185
5 ALC0H0L-5V5-(1^SWKt®lIie 1 6 36 li , wti 14 , №
Б MALIC ACID-1 [РЩДДЦ | к? 3 .35 11 6,0 13,.Иг?
7 MALIC ACID-2/Hi.50OOO0O,:1.7300000} 22 16 2 40 13.333 10 -263
Ш KIMimMK 2.1200000} 21 9 4 ■31 t-fiäSs ■10; WS
9 malic AciD-4/s-jaiteooüoo, гзЩЩЦ i 10 ■si 12 , OWi 8 , IBS
Р MALIC АСЮ-5/5-Ш7ЩЩ5.8ЙЩЕр i 9 гг .3« 12 ,ЦЩ 7, Щ
11 ASH-1 /5-{1.3600000. 2.17O0O0Ä в ■26 2 36 12.000 12,490
12 зшйшшйййшайй® 19 Ii ■з-а и; щщ 5; 292
13 ASg§/5-<2.3000000, ä.ii 00000} it 7 14 ■31 йда 3X12
14 aSH-4/5-{2.41Wffl]0:.2®00QCnJj; 17 11 10 .38 12.667 .3,786
15: ASH«/?£»OOOffiU 3-2300000} 15 8 11 34 11.333 3 , 512
16 ÄräuisiTY-'oF ASHI /5 {i оМий ■ ... 27 8 ■35 ■11 : jt? ■13; « 68
1? Иг "itt -т nirni ишЦИШ ¿'5 16 6 ■36 12 , OWi '5 , 196
ft ЙЩЩШУ С!РА^ЗЛ-Ш5[ИОО[10-.гО.ПОООООО}' ... 12 14 14 40 1.3 ,.3,3.3 1 155
13 ALCALINITY OFASH-4/5-{20.0000000.2.2-.0000000}: ... a 18 13 34 11.333 7 . 638
Таблица 3 - Матрица информативностей (модель INFI) в битах (фрагмент)
С) 5,5. Модель: "4. IWF1 - частный критерий: количество знаний по А.Харкевичу; вероятности из PRC1" |[~В
% Н аимёнорание-опййагёлЪной. Шкалы ц градации 1. C1ASS Щ ЩщйС 2: .ÜASS Ш OAS;.S: fe'iiS: IP ClAffii Сумма Среднее Средн. г,Б4др. 1.ТКД
В ALt8HOLj'®'il.Ö3OO0O(). 12.2500000} ■0 ..17 i -0 . 2.4:6 -0.075 -0.025 0 /209
2 АЩШ0Ь2/5-{122500000; 12.7200000! 0 .1;41 -0.055 0 ,0.9 b 0 ВД 0 .101
3 ALCOHCL-3/5-}12.7200000.18.2700000} -0.011 -0.173 0 , 112 -0.052 -0.017 ■0 .15-3
4 sÄÄ0L-4/5-{13 27ljtjffifiSSSiÄ 0.095 -0.320 0/B7S -0 160 -0 ■'B,'2'3i
5 AttOHaL-5/5-}13.75O0OOO, 14.8300000} 0.182 -0.. 545 -0 .098 -0 . 4.6-2 -0.154 0 /367
Б MALIC ACID 1 ^йяошоо.д-.нйойД: -'0..Д72 ». OS'S -0 235 -0.272 -о /0?! П.
7 MAUCfSD-2/5-{1 .5000000,1.7300000} 0 .104 0 . D01 -0.345 -0.241 -0.080 ■0 ,3fS
Ш ЙЙЙ ACID-3/5-Й-.ДШЙ. 2.1200000} 0 .146 ditsifö -0..I34 -<tt:3Öä -0 . Ш 'В,'29 t
9 MALIC ACID-4Ä:i2:'liOOOOO, З.ЗЭЕМЙ, -0.178 -о. Щ 0 ,15« -0.094 -0.031 ■feÖS
щ MALIC ACID 5/5 O'SiClOOro, 5.8000000} --¡¡.141 -Q .аде 0 , 1.58 -'a/ijB -0.02& 0 .161
11 ASH-1 /HI .3600000, 2.1700000} -0.082 В . Iii -0.323 -0.284 -0.095 0 .22.3
12 eSSiSSB г.зоооОош: - 0 074 0.041 0/009 чНИ -0 00-8 0 . 05 9
13 Asi^HSIilS йШМШ -0.006 -0.116 0 , 106 -0.016 -0.OOS 0 ..III
14 ASH-4/5-{2.41()Offl]0»iaOOQOOJ: 0 061 -0/0.6A ча/ю.в -й,щ? -0.003 0.06 3
15 ASH-5/5-{2 6100000. 3.2300000} 0 . O S® -0.108 ■0V037 -о.oi3 -0.004 0 . B?1
16' ЛетиЙГГУ 0 F ASH-1 /5-{10.8000000, ТБЭТСОО... 0 173 0. [159 0.020 '0,14 4
Ii ALQALINI T'Y/0 F AS H-2/5 {1 ЕЛ^ШШШбЯ. - 0 047 0 . 0G9 -0 098 -0.043 -0.014 0 . 0 7'5
ft ttimwifliiн '3/5'(i ЧМММ ■ -0/020 a.Lffil 0 0 . 002 0 . 045
19 ALCALINITY OF ASH-4/5-{20.0000000.22.11£10ШО . -».•271 0 . 0:5.8 ■O'.BTI -0 141 -0 047 : 0 .194
_Таблица 4 - Матрица знаний (модель 1ЫРЗ ) (фрагмент)
О 5.5. Модель: "6.INF3 - мастный критерий: Хи-квадрат, разности между фактическими и ожидаемыми абс.частотами"
Квд признака Наименование описательной шкалы и градации 1. CLASS- Hj CLASS-. 1 г CLASS 2/3 CLASS 2 .3. CLASS-3/3 CLASBJS Сумма Среднее Средн. квацр. ОТ^Д,
■ ALCO Н Ü L-1 /5А1.0300000,12.2500000} --12 .'264 19 242 -6.973 16.872
2 ALCGHCiL:2/5-{12.2500000,12./200000} -11 ..2;'.70 13 433 -2.169 12.496
3 ALCGriüL-3/5-{12.7200000.13.2700000} -0.601 -7 . 961 8 . 562 3 . 273
4 ALCO Н 0 L-4/5-{13.2700000,13.7500000} 7.067 -11 . 360 4 : 29-2 9.935
5 ALCGHClL-5/5:{1 3.7500000,14.8300000} 17 067 -13.360 -3-. 703 15.549
е MALIC ACID-1 /5-Ш.7400000, 1.5000000} -6.60'1 13 . 03:9 -6.433 11 ..29.3
7 MALIC ACID:-2-/5-{1-.5000000, 1.7300000} 3.742 0 . 045 -8.737 3 . 764
3 MALIC ACID-3/Я1.7300000, 2.1200000} 10.72S -3-. 365 —.7. 360 9 . 500
3 MALIC ACID-4/5-{2.1200000, 3.3700000} -6 Л -З Д -4.360 11 ."2 9:2 9 864
10 MALIC ACID-5/5;{3.3700000, 5.3000000} -5/93.3 -5.360 11 ,.2'92 9 . 733
11 as н -1 /5-0. збооооо, 2.1700000} -3.93« 11.640 -7 . 703 10 .256
т itts'i 700000, 2.3000000} -3-.927 ■3. 444 0 433 3.709
1.3' .AS'H-3>5-{2.;300000CI, 2.4100000} -0 ,'275 -5 . 365 5 . 640 5 . 503
14 ASH-4/5-{2.41 ooooo, z.s\ 00000} 4.404 -4.157 -0.247 4 ..286
15 ASH «®{2:6100000, 3.2300000} '3.7-30 -5.562 1 . 331 4 . 909
16 ALttLINITY CFASH-1 /5-{10.6000000,16.700000.. IS.399 -5.961 -9.433 13.449
17 ALQALINITY 0 F ASH -2/5-.Й 6.7000000,18.500000... "3.. 0 6 7 0 640 -I 703 "3.. 43:3
13 AL CALINITY G F ASH;3?ÜiL-!1-8.5000000,20.000000... -1.258 -1 . 955 '3 . 213 2 . 805
13 ALCAUN1TY 0 F ASH -4/.5--[20.0ОТ00Ш, 22 000000 -8 270 4 -430 3 ..331 7 . 16-8
i
Помощь
1.5. Результаты верификации моделей
Результаты верификации (оценки достоверности) моделей, отличающихся частными критериями с двумя приведенными выше интегральными критериями приведены на рисунке 9.
Рисунок 9. Оценки достоверности моделей
Наиболее достоверной в данном приложении оказались модели INF1, INF2, INF4 и INF5 при интегральном критерии «Семантический резонанс
знаний». При этом достоверность модели в соответствии с F-мерой Ван Ризбергена составляет 0,916, что является очень хорошим результатом. Таким образом, уровень достоверности прогнозирования с применением модели выше, чем экспертных оценок, достоверность которых считается равной примерно 70%. Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется F-критерий Ван Ризбергена, а также L-критерий, предложенный проф.Е.В.Луценко [11] и являющийся нечетким мультиклассовым обобщением F-критерия (рисунок 10).
Также обращает на себя внимание, что статистические модели, как правило, дают более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, и практически никогда - более высокую. Этим и оправдано применение моделей знаний и интеллектуальных технологий. На рисунке 11 приведены частные распределения уровней сходства и различия для верно и ошибочно идентифицированных и неидентифицированных ситуаций в наиболее достоверной модели INF4.
С) Помощь по режимам: 4.1.3.6, 4.1.3.7, 4.1.3.8, 4-1-3.10: Виды прогнозов и меры достоверности моделей в системе "Эйдос-Х++" — □ X
помощь по режимам: 4.1.3.6, 4.1.3.7, 4.1.3.8, 4.1.3.10: виды прогнозов и меры достоверности моделей в системе "Эйдос-Х++". положительный псевдопрогноз.
предположим, модель дает такой прогноз: выпадет 1, 2, 3, 4, 5 или б. в этом случае у нее будет 10036 достоверность идентификации, т.е. не будет ни одного объекта, не отнесенного к тому классу, к которому он действительно относится, но при этом будет очень большая ошибка ложной идентификации, т.к. огромное количество объектов будет отнесено к классам, к которым они не относятся Си именно за счет этого у модели и будет очень высокая достоверность идентификации), ясно, что такой прогноз бесполезен, поэтому он и назван мной псевдопрогнозом.
отрицательный псевдопрогноз.
Представим себе, что мы выбрасываем кубик с 6 гранями, и модель предсказывает, что не выпадет: 1, 2, 3, 4, 5 и 6, а что-то из этого естественно выпало, конечно, модель дает ошибку в прогнозе в том плане, что не предсказала, что выпадет, зато она очень хорошо угадала, что не выпадет, но ясно, что выпадет что-то одно, а не все, что предсказано, поэтому такого рода предсказания хорошо оправдываются в том, что не произошло и плохо в том, что произошло, т.е. в этом случае у модели будет 100* достоверность не идентификации, но очень низкая достоверность идентификации.
идеальный прогноз.
Если в случае с кубиком мы прогнозируем, что выпадет, например 1, и соответственно прогнозируем, что не выпадет 2, 3, 4, 5, и 6, то это идеальный прогноз, имеющий, если он осуществляется, 100% достоверность идентификации и не идентификации, идеальный прогноз, который полностью снимает неопределенность о будущем состоянии объекта прогнозирования, на практике удается получить крайне редко и обычно мы имеем дело с реальным прогнозом.
реальный прогноз.
на практике мы чаще всего сталкиваемся именно с этим видом прогноза. Реальный прогноз уменьшает неопределенность о будущем состоянии объекта прогнозирования, но не полностью, как идеальный прогноз, а оставляет некоторую неопределенность не снятой. Например, для игрального кубика делается такой прогноз: выпадет 1 или 2, и, соответственно, не выпадет 3, 4, 5 или б. понятно, что полностью на практике такой прогноз не может осуществиться, т.к. варианты выпадения кубика альтернативны, т.е. не может выпасть одновременно и 1, и 2. Поэтому у реального прогноза всегда будет определенная ошибка идентификации, соответственно, если не осуществится один или несколько из прогнозируемых вариантов, то возникнет и ошибка не идентификации, т.к. это не прогнозировалось моделью, теперь представите себе, что у вас не 1 кубик и прогноз его поведения, а тысячи, тогда можно посчитать средневзвешенные характеристики всех этих видов прогнозов.
таким образом, если просуммировать число верно идентифицированных и не идентифицированных объектов и вычесть число ошибочно идентифицированных и не идентифицированных объектов, а затем разделить на число всех объектов то это и будет критерий качества модели (классификатора), учитывающий как ее способность верно относить объекты к классам, которым они относятся, так и ее способность верно не относить объекты к тем классам, к которым они не относятся, этот критерий предложен и реализован в системе "эйдос" проф. Е.в.луценко в 1994 году, эта мера достоверности модели предполагает два варианта нормировки: {-1, +1} и {О, 1}: L1 - С tp + tn - fp - fn ) / С tp +■ tn + fp +■ fn ) (нормировка: {-1,+1})
l2=(1+(tp+tn-fp-fn)/(tp+tn+fp+fn))/2 (нормировка: { 0, 1})
где: tp - истино-положительное решение; tn - истино-отрицательное решение; fp - ложно-положительное решение; fn - ложно-отрицательное решение;
классическая F-мера достоверности моделей 8ан Ризбергена:
precision = тр/(tp+fp) - точность модели; Recall = tp/qtp+FN) - полнота модели; F-inera - 2*(Precision*Recan)/(Prec1siom-RecaTl).
В АСК-анализе и системе "Эйдос" предлагается L-мера, представляющая собой нечеткое мультиклассовое обобщение классической F-меры достоверности моделей Ван Ризбергена:
SPrecision - stp/(stp+sfp) - нечеткая мультиклассовая точность модели; SRecall = stp/(stp+sfn) - нечеткая мультиклассовая полнота модели;
L-mera = 2*(SPrecision*SRecan)/(SPrecisiorH-SRecan) - нечеткая мультиклассовая достоверность модели, где:
stp - сумма модулей сходства истино-положительных решений; stn - сумма модулей сходства истино-отрицательных решений; sfp - сумма модулей сходства ложно-положительных решений; sfn - сумма модулей сходства ложно-отрицательных решений.
Рисунок 10. Виды прогнозов и принцип определения достоверности моделей по авторскому варианту метрики, сходной с F-критерием
■100 ;эр -80 Щ -60 .50 -40 -30. -20 -10 0 10 20' 30 40 50 60 7В: 80 90 100
--Част распр цр Сл ПШИЕГЧНи идент.и иешдектиф иГгь.ектиБ--Чест.распр.урск.ВЕРНО ицент.и нещентиФ.оСтьектов
Среднее модулей ур.Ы.ОШИБ. |лае!-гг и неиденг.о6ье'ктоБ=12.008 Среднее модулей ур.с^,ШЕРН 0 тент, и не,^1енг о(уьектоБ-39.437
С;.!
Рисунок 11. Частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний объекта
моделирования в модели ШЕ4
Из рисунка 11 видно, что:
- наиболее достоверная модель Г№Р4 лучше определяет непринадлежность объекта к классу, чем принадлежность (что видно также из рисунка 9);
- модуль уровня сходства-различия в наиболее достоверной модели Г№Р4 для верно идентифицированных и верно неидентифицированных объектов значительно выше, чем для ошибочно идентифицированных и ошибочно неидентифицированных. Это верно практически для всего диапазона уровней сходства-различия, кроме небольших по модулю значений в диапазоне от 0 до 20% уровня сходства. Для больших значений уровней сходства-различия (более 20%) также различие между верно и ошибочно идентифицированными и неидентифицированными ситуациями очевидно и позволяет их безошибочно разделить. На этом и основано
нечеткое мультиклассовое обобщение Б-меры, предложенное проф.Е.В.Луценко (Ь-мера) [11].
Любые данные о наблюдениях можно считать суммой истинного значения и шума, причем ни первое, ни второе неизвестны. Поэтому имеет смысл сравнить созданные модели с чисто случайными моделями, совпадающими по основным характеристикам. В системе «Эйдос» есть лабораторная работа № 2.01: «Исследование ЯМО-модели при различных объемах выборки». Если данная работа устанавливается при отсутствии текущего приложения, то все параметры создаваемых моделей задаются вручную, если же текущая модель существует, как в нашем случае, то все основные ее параметры определяются автоматически (рисунок 12).
—Автоматическое определение параметров И МО-модели на основе текущего приложения-
Наименование текущего приложения: Приложение, созданное путем ввода данын из БД 1пр_с1а1а. Это название можно скоррект
4 <- Оценка среднего количества классов, к которым относится объект обучающей выборки
3 <- Среднее количество градаций в классификационной шкале (округлено до целых)
5 < - Среднее количество градаций в описательной шкале (округлено до целык)
Н МО-модель - это модель, в которой принадлежность объектов обучающей выборки к классам является случайной, как и признаки объектов. Для генерации случайный кодов классов и признаков используется числовой генератор равномерно распределенным случайным чисел. При автоматическом определении параметров ЯШ -модели на основе текущей модели количество классов, признаков и объектов обучающей выборки в И МО-модели будет таким же, как в текущей модели. Среднее количество классов, к которым относится объект обучающей выборки и среднее количество признаков у него также будет совпадать с этими характеристиками объектов обуч.выборки текущей модели.
Информацию об объектах обучающей выборки текущей модели можно считать суммой полезной информации о них (полезный сигнал) и шума. Е ПГ-Ю-модели вся информация представляет собой шум. Поэтому сравнение этих моделей, не отличающихся перечисленными параметрами, позволяет оценить влияние значимой информации и шума на результаты, в частности убедиться в наличии самой этой значимой информации, т.е. закономерностей в предметной области, а также оценить эффективность различных стат.моделей и моделей знаний и интегральных критериев для выявления и исследования этой значимой информации, знаний и закономерностей. При увеличении объема обучающей выборки в ИИО-модели вероятность верной идентификации стремится к вероятности случайного угадывания, а в реальной модели к некоторому пределу, превосходящему вероятность случайного угадывания и характеризующему эффективность модели
Ok | Cancel
Рисунок 12. Экранная форма управления созданием случайных моделей, совпадающих с текущей по размерностям основных баз данных
На рисунке 13 показано частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний в случайной модели Г№Р4.
Часг.распр.ур.ск.ОШИБСЧпО идент.и нещенги^.оСуьектов .--Част.распр.ур ен:ВЕРНО кцеьгт.и нещенгиФ.оСуьектов
Среднее модулей чрсхИШИЬ ййёЦ и неидент.оЁгьектов=1 ЬН.'У ...... ■ ■ Среднее модулей ур.сх,ЁЕРНО цдент.и не1щенг о&ьектов=29.961
Рисунок 13. Частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний в случайной модели ШБ4
Совершенно очевидное различие частотных распределений уровней сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний объекта моделирования и случайной модели (рисунки 11 и 13) объясняется тем, что в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны. Если же такой информации в модели нет, то и распределение получается типа, приведенного на рисунке 13.
На рисунке 14 приведены данные по достоверности статистических и когнитивных моделей, созданных на основе случайной выборки.
tí 4.1.3£. Обобщ.форма по достов.моделей гтри равн.инт.крит.. Текущая модель: "IMF4" [--т- ]] О [ЙёД
ft ■■ - Интегральный критерий «М, Число истинс- Число истинс- Число лежи... Число ложн... Точность Полнота F-мера Сумма модул... Сумма модул... Сумма Модул... Сумма м —'
решений (TP) решений (TN) решений (FP) решений (FN) Ризбергена решений (STP) решений (STN) решений (SFP) решений
178 154 174 182 24 0.458 0. 865 0 .599 63.060 42.045 45.882 3
1. АВЭ ■ частный критерий: количество встреч сочетаний: "мае... Сумма абс.частот по признак... 178 178 356 0.333 1. 000 0 .500 140.741 253.250
2. РИС1 ■ частный критерий: усл. вероятность ко признака сред... Корреляция усяотн.частот с о... 178 154 174 182 24 0.458 0. 865 0 .599 63.060 42.045 45.882 3
2. РИС1 ■ частный критерий: усл. вероятность 1-го признака сред... Сумма исл-отчастот по приз... 178 178 356 0.333 1. 000 0 .500 148.335 272.588
3. РЯС2 ■ частный критерий: условная вероятность ¡ го признака... Корреляция усяотн.частот с о... 178 154 174 182 24 0.458 0. 865 0 .599 63.059 42.045 45.881 3
3. РИС2 ■ частный критерий: условная вероятность ¡-го признака... Сумма асл.отн.частот по приз... 178 178 356 0.333 1. 000 0 .500 148.335 272.588
4. *JF1 ■ частный критерий: количество знаний по А.Харкевичу; в... Семантический резонанс зна... 178 148 218 138 30 0.517 0. 831 0 .638 48.082 60.917 23.018 4
4 ЧГ1 - частный критерий: количество знаний по А.Харкевичу; в... Сумма знаний 178 125 294 62 53 0.668 0. 702 0 .685 24.402 79.414 7.261 7
5 NF2 ■ частный критерий: количество знаний по АХаркевичу; в... Семантический резонанс зна... 178 148 218 138 30 0.517 0. 831 0 .638 48.082 60.917 23.018 4
5 NF2 - частный критерий: количество знаний по А.Харкевичу; в... Сумма знаний 178 12S 294 62 S3 0.668 0 . 7.02 0 . 685 24.402 79.414 7.261 7
6 NF3 ■ частный критерий: Xи-квадрат, разности между Фактич... Семантический резонанс зна... 178 145 238 118 33 0.551 0. 815 0 .658 49.447 64.785 20.813 5
6 NF3 ■ частный критерий: Хи-квадрат. разности между Фактич... Сумма знаний 178 145 238 118 .33 0.551 0. 815 0 .658 45.997 60.236 19.357 5
7. NF4 ■ частный критерий: ROI (Retuin 0n Irivestment); вероятно... Семантический резснанс зна... 178 142 236 12D 36 0.542 0. 798 0 .615 49.203 64.051 20.423 5
7— NF4 - частный критерий: ROI (Retuin 0n Irivestment); вероятно... с„„„„,„и11 178 143 237 119 35 0 . 546 0 . 803 0 . 650 38.632 50.495 16.134 4
8 NF5 - частный критерий: ROI IReluin On Iriveslmenl); вероятно... С........... 178 143 237 119 35 0.546 0. 803 0 .650 38.632 50.495 16.134 4
9. NF6 ■ частный критерий: разнусли безуслвероягностей; вер... Семантический резснанс зна... 178 145 238 118 33 0.551 0. 815 0 .658 49.447 64.785 20.813 5
9 MF6 - частный критерий: разнусл.и безус л. вероятностей; вер... с„„„„,„и„ 178 178 145 145 238 238 118 118 33 33 0.551 0.551 0. 815 0. 815 0 .658 0 .658 38.648 49.447 50.646 64.785 16.520 20.813 5
10.INF7 - частный критерий: разнесли без*сл.вероятностей; ее... с,...... 178 145 238 118 33 0.551 0. 815 0 .658 38.648 50.646 16.520 „
»I 1 ►
Помощь
Рисунок 14. Достоверность статистических и когнитивных моделей, созданных на основе случайной выборки
На основе его сравнения с рисунком 9 можно сделать следующие выводы:
- достоверность лучшей модели INF5, отражающей реальный объект моделирования, примерно на 34% выше, чем аналогичной случайной модели (0,916/0,685=1,337);
- различие между достоверностью статистических моделей и моделей знаний, созданных на основе случайной выборки, значительно меньше, чем у моделей, отражающих реальный объект моделирования;
- в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны, причем примерно 1/3 достоверности обусловлена отражением в реальных моделях закономерностей предметной области, а 2/3 достоверности обусловлено наличием шума в исходных данных. На основании этого можно предположить, что в исходных данных уровень сигнала о реальных причинно-следственных связях в моделируемой предметной области примерно в два раза ниже уровня шума.
2. РЕШЕНИЕ ЗАДАЧ В НАИБОЛЕЕ ДОСТОВЕРНОЙ
МОДЕЛИ
2.1. Решение задачи идентификации
В соответствии с технологией АСК-анализа зададим текущей модель ЮТ4 (режим 5.6) (рисунок 15) и проведем пакетное распознавание в режиме 4.2.1 (рисунок 16):
Рисунок 15. Экранные формы режима задания модели в качестве текущей
Рисунок 16. Экранная форма режима пакетного распознавания
в текущей модели
В результате пакетного распознавания в текущей модели создается ряд баз данных, которые визуализируются в выходных экранных формах, отражающих результаты решения задачи идентификации и прогнозирования.
Режим 4.1.3 системы «Эйдос» обеспечивает отображение результатов идентификации и прогнозирования в различных формах:
1. Подробно наглядно: "Объект - классы".
2. Подробно наглядно: "Класс - объекты".
3. Итоги наглядно: "Объект - классы".
4. Итоги наглядно: "Класс - объекты".
5. Подробно сжато: "Объект - классы".
6. Обобщенная форма по достоверности моделей при разных интегральных критериях.
7. Обобщенный статистический анализ результатов идентификации по моделям и интегральным критериям.
8. Статистический анализ результатов идентификации по классам, моделям и интегральным критериям.
9. Распознавание уровня сходства при разных моделях и интегральных критериях.
10.Достоверность идентификации классов при разных моделях и интегральных критериях.
Ниже кратко рассмотрим некоторые из них.
На рисунках 17 и 18 приведены примеры прогнозов высокой и низкой достоверности частоты и классов ирисов в наиболее достоверной модели Г№Р4 на основе наблюдения предыстории их развития:
(Э 4.1.3,1, Визуализация результатов распознавании в отношении; "Объект-классы", Текущая модель; | |||и£3и>|
Распознаваемые объекты Интегральный критерий сходства: "Семантический резонанс знаний"
|| Код Наим. объекта ■'•■"-"' Код ¡Наименование класса Сходство Сюяст.по -
1 Объект обучающей выборки... 1 Классификационная шкала_1 Л-Градация классификационной... 72.05... »
2 Объект обучающей выборки... 2 Классификационная шкала_1 Л -Градация классификационной... -31.26... ямами
3 Объект обучающей выборки... 3 Классификационная шкала_1 Л -Градация классификационной... -40.82... тпшги
4 Объект обучающей выборки...
5 Объект обучающей выборки...
6 Объект обучающей выборки...
Объект обучающей выборки...
8 Объект обучающей выборки...
Э Объект обучающей выборки...
<: >\
10 Объект обучающей выборки... Интегральный критерий сходства: "Сумма знаний"
11 Объект обучающей выборки... Км I Наименование класса Сходство л
12 Объект обучающей выборки... 3 Классификационная шкала_1 Л-Градация классификационной... 53.83... V ■■■■11111111111111111111111
13 Объект обучающей выборки... Классификационная шкала_1 Л-Градация классификационной... -31,10... агпги
14 Объект обучающей выборки... 2 Классификационная шкала_1/1-Градация классификационной... -32,53... жатая'
15 Объект обучающей выборки...
16 Объект обучающей выборки...
17 Объект обучающей выборки...
18 Объект обучающей выборки...
18 Объект обучающей выборки...
20 Объект обучающей выборки... *
<1 И
Помощь | 9 классов | Классы сМахМ1п УрСх | 9 классов с.МахМЬУрСх | ВСЕ классы | ВКЛ. Фильтр по класс.шкале | ВЫКЛ.фильтр по класс.шкале | ГраФ.диаграмг.
Рисунок 17. Пример идентификации классов вина в модели Г№Р4
(Э 4.1.3,1, Визуализация результатов распознавании в отношении; "Объект-классы", Текущая модель; | |||и£3и>|
Распознаваемые объекты Интегральный критерий сходства: "Семантический резонанс знаний"
|| Код 1 Наим. объекта - Код Наименование класса Сходство Сходство л
46 Объект обучающей выборки... 3 Классификационная шкала_1 Л-Градация классификационной... 66.89... « ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
47 Объект обучающей выборки... 1 Классификационная шкала_1 Л -Градация классификационной... -27.89...
48 Объект обучающей выборки... 2 Классификационная шкала_1 Л-Градация классификационной... -37.81...
48 Объект обучающей выборки...
50 Объект обучающей выборки...
51 Объект обучающей выборки...
52 Объект обучающей выборки...
53 Объект обучающей выборки...
54 Объект обучающей выборки...
<: ч
55 Объект обучающей выборки... Интегральный критерий сходства: "Сумма знаний"
56 Объект обучающей выборки... КйД Наименование класса Сходство — -
57 Объект обучающей выборки... 3 Классификационная шкала_1 Л-Градация классификационной... 47.82... V 11111111111111111111111111
58 Объект обучающей выборки... 1 Классификационная шкала_1 Л-Градация классификационной... -18.65... НИШ
59 Объект обучающей выборки... 2 Классификационная шкала_1/1-Градация классификационной... -36.49... ||||||||||||||||||||||||||||||||||||
60 Объект обучающей выборки...
61 Объект обучающей выборки...
62 Объект обучающей выборки...
63 Объект обучающей выборки...
64 Объект обучающей выборки...
65 Объект обучающей выборки...
•1 ► 1 , ■Ип УрСх И 1
Помощь | 9 классов | Классы с МахЬ | 9 классов с.МахМЬ УрСх | ВСЕ классы | ВКЛ. Фильтр по класс.шкале | ВЫКЛ.Фильтр по класс.шкале | ГраФ.диаграмь
Рисунок 18. Пример идентификации классов вина в модели Г№Р4
2.2. Поддержка принятия решений с п мощью SWOT и PEST
матриц и диаграмм
SWOT-анализ является широко известным и общепризнанным методом стратегического планирования. Однако это не мешает тому, что он подвергается критике, часто вполне справедливой, обоснованной и хорошо аргументированной. В результате критического рассмотрения SWOT-анализа выявлено довольно много его слабых сторон (недостатков), источником которых является необходимость привлечения экспертов, в частности для оценки силы и направления влияния факторов. Ясно, что эксперты это делают неформализуемым путем (интуитивно), на основе своего профессионального опыта и компетенции. Но возможности экспертов имеют свои ограничения и часто по различным причинам они не могут и не хотят это сделать. Таким образом, возникает проблема проведения SWOT-анализа без привлечения экспертов. Эта проблема может решаться путем автоматизации функций экспертов, т.е. путем измерения силы и направления влияния факторов непосредственно на основе эмпирических данных. Подобная технология разработана давно, ей уже около 30 лет, но она малоизвестна - это интеллектуальная система «Эйдос». Данная система всегда обеспечивала возможность проведения количественного автоматизированного SWOT-анализа без использования экспертных оценок непосредственно на основе эмпирических данных [12]. Результаты SWOT-анализа выводились в форме информационных портретов. В версии системы под MS Windows: «Эйдос-Х++» предложено автоматизированное количественное решение прямой и обратной задач SWOT-анализа с построением традиционных SWOT-матриц и диаграмм (рисунок 21).
1 д I m
4.4,8. Количественный автоматизированный SWOT-анализ классов средствами АСК-анализа в системе "Эйдос1"
Выбор класса, соответствующего будущему состоянию объекта управления
Код Наименование класса •*•
1 1 /З-Class 1
2 2/3-Class 2
3 3/3-Class 3
ж
ЭТ/ОТ-анализ класса: 1 "Ш-ааээ 1" в модели: 7 "ШР4"
Способствующие факторы и сила их влияния Препятствующие факторы и сила их влияния
Наименование Фактора и его интервального значения Сила влияния
■ Ш PROLINE-5/5-{1 045.0000000,1G80.0000000} 2. 017
ALC0 H 0 L-5/5-Î13.7500000,14.8300000} 1. 430
35 FLAVAN 01D S -5/5-{2.8800000,5.0800000} 1. 414
1G ALCALI NITY OF ASH-1/5-{10.6000000,18.7000000} 1. 327
30 TOTAL PHEN0LS-5>5-{2.8G00000, 3.8800000} 1. 155
60 OD280/OD315 OF DILUTED WINES-5/5-{3 2E00000,4.00.. 1. 069
8 MALI С AGI D -3/5-{1.7300000,2.1200000} 1. 044
54 HUE-4/5-Î1.0400000,1.1500000} 1. 044
34 FLAVAN 01D S -4/5-{2.4300000,2.9800000} 1. 038
49 COLO R IN T E N 9I ТУ-4У5-{5.2500000, 8.9000000} 0. 927
29 TOTAL PH E NO LS -4У5-{2.5000000, 2.8600000} 0. 875
48 COLOR IN T E N SI TY-3/5-{3.8500000, 5.2500000} 0. 760
< ►
Наименование Фактора и его интервального значения Си/ia влияния
IJONFLAVANOID PHENOLS-5У5-{0.4800000, 0.8600000} ... -о. .909
63 PR 0 LI N Е -3/5-{600.0000000, 735.0000000} -0. .B2S
20 ALCALINIТУ 0FASH-5/5-{22.0000000,30.0000000} -0. .317
18 ALCALINITY 0 F AS H -4/5-{20.0000000,22.0000000} -0. .734
39 I JONFLAVANOID PHENOLS-4/5-{0.3900000, 0.4800000} ... -о. r €65
9 MALIC ACID -4У5-{2.1200000,3.3700000} -0. .581
6 MALIC ACI D -1 /5-{0.7400000,1.5000000} -0. .S69
10 MALIC ACI D -5/5-{3.3700000,5.8000000} -0. , 497
33 FLAVANOIDS-3/5-{1.6900000, 2.4300000} -о. ,483
52 HUE -2/5-{0.7300000,0.9060000} -0. .397
42 PR DAN T H □ CYANIN S -2У5-{1.0600000,1.4100000} -0. .397
47 CO LO R 1N TENS 1 TY-2/5-{2.9000000, 3.9500000} -0. .379
г*
ВКЛЮЧИТЬ Фильтр по Фактору
ВЫКЛЮЧИТЬ Фильтр по Фактору
ВКЛЮЧИТЬ Фильтр по Фактору
ВЫКЛЮЧИТЬ Фильтр по Фактору
Помощь
Abs Prc1 Pio2 Inf1 Inf2 Inf3 Inl4 Inf5 inie Inf7
Нейрон
SWOT-диаграмма
Интегральная когнитивная карта
С) 4.4.8. Количественный SWOT-анализ классов средствами АСК-анализа. (С) Универсальная когнитивная аналитическая система "ЭЙДОС-Х**"■4|в=»|»В»|МЗИ|
SWOT-ДИАГРАММА КЛАССА: "[1] 1/3-С1_А55 1" В МОДЕЛИ: "1^4" Приложение: "АСК-анализ классов вина по его свойствам на основе данных репозитория иСГ
СПОСОБСТВУЮЩИЕ значения факторов и сила их влияния Шкала: [1] CLASS Класс: [1] 1/3-Class 1 ПРЕПЯТСТВУЮЩИЕ значения факторов и сила их влияния:
[13] PROLINE [65] 5/5-{1045.0000000,1680.0000000} 1=2.017 1=0.909 [8] NONFLAVANOID PHENOLS [40] 5/5-{0.4800000, 0.6600000}
[1] ALCOHOL [5] 5/5-{13.7500000,14.8300000} 1=1.430 1=0.020 [13] PROLINE [63] 3/5-{600.0000000, 735.0000000}
[7] FLAVANOIDS [35] 5/542.9800000, 5.0800000} »до 1=0.017 [4] ALCALINITY OF ASH [20] 5/5422.ООООООО, 30.0000000}
[4] ALCALINITY OF ASH [16] 1/5-{10.6000000,16.7000000} 1=1.327 1=0.734 [4] ALCALINITY OF ASH [10] 4/542O.OOOOOOO, 22.0000000}
[6] TOTAL PHENOLS [30] 5/5-{2.8600000, 3.8800000} 1=1.155 1=0.665 [8] NONFLAVANOID PHENOLS [39] 4/54О.З9ООООО, 0.4800000}
[12] OD280/OD315 OF DILUTED WINES [60] 5/5-{3.2600000,4.0000000} 1=1.069 1=0.501 [2] MALIC ACID [9] 4/542.1200000, 3.3700000}
[2] MAUC ACID [8] 3/5-{1.7300000,2.1200000} 1=1.044 1=0.569 [2] MALIC ACID [6] 1/540.7400000, 1.5000000}
Рильтр по факторам ВЫКЛЮЧЕН. Диапазон кодов значений: 1-65 Фильтр по факторам ВЫКЛЮЧЕН. Диапазон кодов значений: 1-65
СИСТЕМА ДЕТЕРМИНАЦИИ КЛАССА ФАКТОРАМИ И ИХ ЗНАЧЕНИЯМИ: я в состояние. соотвествУюЩее классу, отражается линиями с <t орма создана: 12.12.2016-10:03:24
nPFnflTrTR4millMF о ъекта управлен» ЯЗИГИНРГПГ0 ЦВе Толщина линии отражает степень влияния
_J||J ILIUM ........I...... ПГСПЛТ.ТОЛ.ЩП ill |H liny объекта управяенн в состояние, соотвествующее классу, отображается линиями св язи СИНЕГО цвета. лщина линии отражает степень влияния.
Рисунок 21. Пример SWOT-матрицы и SWOT-диаграммы в модели INF4
2.3. Наглядное отображение эмпирических закономерностей с помощью когнитивных функций
Рассмотрим режим 4.5, в котором реализована возможность визуализации когнитивных функций для любых моделей и любых сочетаний классификационных и описательных шкал (рисунок 19)
Ф 4.5. Визуализация когнитивны к санкций
Что такое когнитивная Функция:
Визуализация прямых, обратный, позитивных, негативных, попностью и частично редуцированныхкогнитивных Функций Ког нитивная Функция представляет собой графическое отображение силы и направления влияния различных значений некоторого Фактора на переходы объекта управления в будущие состояния, соответствующие классам. Когни тнвные Функции представляют собой новый перспективный инструмент отражения и наглядной визуализации закономерностей и эмпирических законов Разработка содержательной научной интерпретации когнитивных Функций представляет собой способ познания природы, общества и человека. Когнитивные Функции могут быть: прямые, отражающие зависимость классов от признаков, обобщающие информационные портреты признаков; обратные, отражающие зависимость признаков от классов, обобщающие информационные портреты классов; позитивные, показывающие чему способствуют система детерминации; негативные, отражающие чему препятствуют система детерминации; средневзвешенные, отражающие совокупное влияние всех значений Факторов на поведение объекта (причем в качестве весов наблюдений используется количество информации в значении аргумента о значениях Функции) различной степенью редукции или степенью детерминации, которая отражает в графической Форме (в Форме полосы] количество знаний в аргументе о значении Функции и является аналогом и обобщением доверительного интервала. Если отобразить подматрицу матрицы знания, отображая цветом силу и направление влияния каждой градации некоторой описательной шкалы на переход объекта в состояния, соответствующие классам некоторой классиоикацион ной шкалы то поручим нередуцированную когнитивную Функцию. Когнитиеныз Функции являются наиболее развитым средством изучения причинно-следственных зависимостей в моделируемой предметной области, предоставляемым системой "Эйдос". Необходимо отметить, ^о на вид функций влияния математической моделью СК-анализа не накладывается никаких ограничений, б частности, они могут быть и не дифференцируемые. См.. Луценко Е.В. Метод визуализации когнитивных Функций - новый инструмент исследования эмпирических данных большой размерности / Е В Луценко, А П Грунев. Д.К. Бандык Щ Полкгтематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. -№03(87) С. 240 - 282. - Шифр Информрегистрэ: 0421100012\0077. , 2,888 у.п.л. - Режим доступа: http://ei.kubaarQ.ru/2011 ~ЩвШ 8.рбГ
Задайте нужный режим:
Визуализации когнитивных функций Скачать подборку публикаций по когнитиеным Функциям
Литератур.ссылки на статьи по когнитивным Функциям Скачать подборку публикаций по управлению знаниями
Рисунок 19. Экранная форма режима 4.5 системы «Эйдос-Х++» «Визуализация когнитивных функций»
Применительно к задаче, рассматриваемой в данной работе, когнитивная функция показывает, какое количество информации содержится в различных значениях факторов о том, что объект моделирования перейдет в те или иные будущие состояния. Когнитивным функциям посвящено много работ автора, но наиболее новой и
обобщающей из них является работа [26]. Поэтому здесь не будем останавливаться на описании того, что представляют собой когнитивные функции в АСК-анализе. На рисунках 20. приведены визуализации всех когнитивных функций данного приложения для модели Г№Р4.
Рисунок 20. Визуализация когнитивных функций для обобщенных классов и всех описательных шкал для модели ЮТ4
Когнитивные функции являются графической визуализацией содержательных феноменологических моделей, формируемых интеллектуальной системой «Эйдос» и являются непосредственной основой для разработки научных гипотез, содержательно объясняющих причины существования отраженных в этих функциях эмпирических закономерностей.
ЗАКЛЮЧЕНИЕ
Так как существует множество систем искусственного интеллекта, то возникает необходимость сопоставимой оценки качества их математических моделей. Одним из вариантов решения этой задачи является тестирование различных системы на общей базе исходных данных, для чего очень удобно использовать общедоступную базу репозитория иС1. В данной работе приводится развернутый пример использования базы данных репозитория иС1 для оценки качества математических моделей, применяемых в АСК-анализе и его программном инструментарии системе искусственного интеллекта «Эйдос». При этом наиболее достоверной в данном приложении оказались модели ШБ4, основанная на семантической мере целесообразности информации А.Харкевича при интегральном критерии «Сумма знаний». Достоверность модели составляет 0,916, что заметно выше, чем достоверность экспертных оценок, которая считается равной около 70%. Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется с Б-критерий и его нечеткое мультиклассовое обобщение, предложенное проф.Е.В.Луценко (Ь-критерий) [11]. Также обращает на себя внимание, что статистические модели в данном приложении дают примерно на 21% более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, что, как правило, наблюдается и в других приложениях. Этим и оправдано применение моделей знаний.
На основе базы данных иС1, рассмотренной в данной работе, построить модели прогнозирования не с помощью АСК-анализа и реализующей его системы «Эйдос», а с применением других математических методов и реализующих их программных систем, то можно сопоставимо сравнить их качество.
Литература
1. Луценко Е.В. Методика использования репозитория UCI для оценки качества математических моделей систем искусственного интеллекта / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. - №02(002). С. 120 - 145. - IDA [article ID]: 0020302012. - Режим доступа: http://ej.kubagro.ru/2003/02/pdf/12.pdf, 1,625 у.п.л.
2. Луценко Е.В. АСК-анализ, моделирование и идентификация живых существ на основе их фенотипических признаков / Е.В. Луценко, Ю.Н. Пенкина // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: Куб- ГАУ, 2014. - №06(100). С. 1346 - 1395. - IDA [article ID]: 1001406090. - Режим доступа: http://ej.kubagro.ru/2014/06/pdf/90.pdf, 3,125 у.п.л.
3. Луценко Е.В. Теоретические основы, технология и инструментарий автоматизированного системно-когнитивного анализа и возможности его применения для сопоставимой оценки эффективности вузов / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрно- го университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: Куб- ГАУ, 2013. - №04(088). С. 340 - 359. - IDA [article ID]: 0881304022. - Режим доступа: http://ej.kubagro.ru/2013/04/pdf/22.pdf, 1,25 у.п.л.
4. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002. - 605 с.
5. [Электронный ресурс]. Статья "baza dannix sotrudnikov": http://allexcel.ru/gotovye-tablitsy-excel-besplatno, свободный. - Загл. с экрана. Яз. анг.
6. Сайт профессора Е.В.Луценко [Электронный ресурс]. Режим доступа: http://lc.kubagro.ru/, свободный. - Загл. с экрана. Яз. рус.
7. Луценко Е.В. 30 лет системе «Эйдос» - одной из старейших отечественных универсальных систем искусственного интеллекта, широко применяемых и развивающихся и в настоящее время / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. -№10(054). С. 48 - 77. - Шифр Информрегистра: 0420900012\0110, IDA [article ID]: 0540910004. - Режим доступа: http://ej.kubagro.ru/2009/10/pdf/04.pdf, 1,875 у.п.л.
8. Луценко Е.В. Универсальная когнитивная аналитическая система «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2012. - №09(083). С. 328 - 356. - IDA [article ID]: 0831209025. - Режим доступа: http://ej.kubagro.ru/2012/09/pdf/25.pdf, 1,812 у. п. л.
9. Луценко Е.В. Прогнозирование количества и классов солнечных вспышек на основе их предыстории по данным репозитория UCI с применением АСК-анализа и интеллектуальной системы «Эйдос» / Е.В. Луценко, А.Ю. Боровко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный
ресурс]. - Краснодар: КубГАУ, 2014. - №10(104). С. 1309 - 1370. - IDA [article ID]: 1041410099. - Режим доступа: http://eJ.kubagro.ru/2014/10/pdf/99.pdf, 3,875 у.п.л.
10. Луценко Е.В. Моделирование сложных многофакторных нелинейных объектов управления на основе фрагментированных зашумленных эмпирических данных большой размерности в системно-когнитивном анализе и интеллектуальной системе «Эйдос-Х++» / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. -№07(091). С. 164 - 188. - IDA [article ID]: 0911307012. - Режим доступа: http://eJ.kubagro.ru/2013/07/pdf/12.pdf, 1,562 у.п.л.
11. Луценко Е.В. Нечеткое мультиклассовое обобщение классической F-меры достоверности моделей Ван Ризбергена в АСК-анализе и системе «Эйдос» / Луценко Е.В. // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2016. - №09(123). - Режим доступа: http://eJ.kubagro.ru/2016/09/pdf/01.pdf, 1,813 у.п.л. - IDA [article ID]: 1231609001. http://dx.doi.org/10.21515/1990-4665-123-001
12. Луценко Е.В. Количественный автоматизированный SWOT- и PEST-анализ средствами АСК-анализа и интеллектуальной системы «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №07(101). С. 1367 - 1409. - IDA [article ID]: 1011407090. - Режим доступа: http://eJ.kubagro.ru/2014/07/pdf/90.pdf, 2,688 у.п.л.
13. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с. ISBN 978-594672-757-0. http://elibrarv.ru/item.asp?id=21358220
Literatura
1. Lucenko E.V. Metodika ispol'zovaniJa repozitoriJa UCI dlJa ocenki kachestva matematicheskih modeleJ sistem iskusstvennogo intellekta / E.V. Lucenko // PolitematicheskiJ setevoJ JelektronnyJ nauchnyJ zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (NauchnyJ zhurnal KubGAU) [JelektronnyJ resurs]. - Krasnodar: KubGAU, 2003. - №02(002). S. 120 - 145. - IDA [article ID]: 0020302012. - Rezhim dostupa: http://eJ.kubagro.ru/2003/02/pdf/12.pdf, 1,625 u.p.l.
2. Lucenko E.V. ASK-analiz, modelirovanie i identifikaciJa zhivyh sushhestv na osnove ih fenotipicheskih priznakov / E.V. Lucenko, Ju.N. Penkina // PolitematicheskiJ setevoJ JelektronnyJ nauchnyJ zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (NauchnyJ zhurnal KubGAU) [JelektronnyJ resurs]. - Krasnodar: Kub- GAU, 2014. -№06(100). S. 1346 - 1395. - IDA [article ID]: 1001406090. - Rezhim dostupa: http://eJ.kubagro.ru/2014/06/pdf/90.pdf, 3,125 u.p.l.
3. Lucenko E.V. Teoreticheskie osnovy, tehnologiJa i instrumentariJ avtomati-zirovannogo sistemno-kognitivnogo analiza i vozmozhnosti ego primeneniJa dlJa sopostavimoJ ocenki Jeffektivnosti vuzov / E.V. Lucenko, V.E. Korzhakov // PolitematicheskiJ setevoJ JelektronnyJ nauchnyJ zhurnal Kubanskogo gosudarstvennogo agrarno- go universiteta (NauchnyJ zhurnal KubGAU) [JelektronnyJ resurs]. - Krasnodar: Kub- GAU, 2013. - №04(088). S. 340 - 359. - IDA [article ID]: 0881304022. - Rezhim dostupa: http://eJ.kubagro.ru/2013/04/pdf/22.pdf, 1,25 u.p.l.
4. Lucenko E.V. AvtomatizirovannyJ sistemno-kognitivnyJ analiz v upravlenii aktivnymi ob#ektami (sistemnaJa teoriJa informacii i ee primenenie v issledovanii
jekonomicheskih, social'no-psihologicheskih, tehnologicheskih i organizacionno-tehnicheskih sistem): Monografija (nauchnoe izdanie). - Krasnodar: KubGAU. 2002. - 605 s.
5. [Jelektronnyj resurs]. Stat'ja "baza dannix sotrudnikov": http://allexcel.ru/gotovye-tablitsy-excel-besplatno, svobodnyj. - Zagl. s jekrana. Jaz. ang.
6. Sajt professora E.V.Lucenko [Jelektronnyj resurs]. Rezhim dostupa: http://lc.kubagro.ru/, svobodnyj. - Zagl. s jekrana. Jaz. rus.
7. Lucenko E.V. 30 let sisteme «Jejdos» - odnoj iz starejshih otechestvennyh universal'nyh sistem iskusstvennogo intellekta, shiroko primenjaemyh i razvivajushhihsja i v nastojashhee vremja / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2009. - №10(054). S. 48 - 77. - Shifr Informregistra: 0420900012\0110, IDA [article ID]: 0540910004. - Rezhim dostupa: http://ej.kubagro.ru/2009/10/pdf/04.pdf, 1,875 u.p.l.
8. Lucenko E.V. Universal'naja kognitivnaja analiticheskaja sistema «Jejdos- H++» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2012. - №09(083). S. 328 - 356. - IDA [article ID]: 0831209025. -Rezhim dostupa: http://ej.kubagro.ru/2012/09/pdf/25.pdf, 1,812 u.p.l.
9. Lucenko E.V. Prognozirovanie kolichestva i klassov solnechnyh vspyshek na osnove ih predystorii po dannym repozitorija UCI s primeneniem ASK-analiza i intellektual'noj sistemy «Jejdos» / E.V. Lucenko, A.Ju. Borovko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. -№10(104). S. 1309 - 1370. - IDA [article ID]: 1041410099. - Rezhim dostupa: http://ej.kubagro.ru/2014/10/pdf/99.pdf, 3,875 u.p.l.
10. Lucenko E.V. Modelirovanie slozhnyh mnogofaktornyh nelinejnyh ob#ektov upravlenija na osnove fragmentirovannyh zashumlennyh jempiricheskih dannyh bol'shoj razmernosti v sistemno-kognitivnom analize i intellektual'noj sisteme «Jejdos-H++» / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №07(091). S. 164 - 188. - IDA [article ID]: 0911307012. - Rezhim dostupa: http://ej.kubagro.ru/2013/07/pdf/12.pdf, 1,562 u.p.l.
11. Lucenko E.V. Nechetkoe mul'tiklassovoe obobshhenie klassicheskoj F-mery dostovernosti modelej Van Rizbergena v ASK-analize i sisteme «Jejdos» / Lucenko E.V. // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2016. - №09(123). - Rezhim dostupa: http://ej.kubagro.ru/2016/09/pdf/01.pdf, 1,813 u.p.l. - IDA [article ID]: 1231609001. http://dx.doi.org/10.21515/1990-4665-123-001
12. Lucenko E.V. Kolichestvennyj avtomatizirovannyj SWOT- i PEST-analiz sredstvami ASK-analiza i intellektual'noj sistemy «Jejdos-H++» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №07(101). S. 1367 - 1409. - IDA [article ID]: 1011407090. - Rezhim dostupa: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 u.p.l.
13. Orlov A.I., Lucenko E.V. Sistemnaja nechetkaja interval'naja matematika. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s. ISBN 978-5-94672757-0. http://elibrary.ru/item.asp?id=21358220