Научный журнал КубГАУ, №104(10), 2014 года
1
УДК 303.732.4
ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА И КЛАССОВ СОЛНЕЧНЫХ ВСПЫШЕК НА ОСНОВЕ ИХ ПРЕДЫСТОРИИ ПО ДАННЫМ РЕПОЗИТОРИЯ UCI С ПРИМЕНЕНИЕМ АСК-АНАЛИЗА И ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ «ЭЙДОС»
Луценко Евгений Вениаминович д.э.н., к.т.н., профессор
Кубанский государственный аграрный университет, Россия, 350044, Краснодар, Калинина, 13, [email protected]
Боровко Антон Юрьевич
студент группы ПИ1101 факультета прикладной информатики
Кубанский государственный аграрный университет, Россия, 350044, Краснодар, Калинина, 13,
В статье описан численный пример создания в среде системы «Эйдос» интеллектуального приложения, предназначенного для прогнозирования количества солнечных вспышек разных классов на основе предыстории их развития. В качестве исходных данных использована база данных репозитория UCI
Ключевые слова: ПРОГНОЗИРОВАНИЕ ХАРАКТЕРИСТИК СОЛНЕЧНЫХ ВСПЫШЕК НА ОСНОВЕ ИХ ПРЕДЫСТОРИИ С ПРИМЕНЕНИЕМ АСК-АНАЛИЗА И ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ «ЭЙДОС» ПО ДАННЫМ РЕПОЗИТОРИЯ UCI
СОДЕРЖАНИЕ
1. КРАТКАЯ ТЕОРИЯ..............................................................................................2
1.1. Проблематика...........................................................................................2
1.2. Исходные данные........................................................................................2
1.3. Инструментарий.........................................................................................3
1.4. Метризация шкал........................................................................................3
2. СИНТЕЗ И ВЕРИФИКАЦИЯ МОДЕЛЕЙ.................................................................................4
2.1. Описание решения.......................................................................................4
2.2. Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel........................4
2.3. Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"......13
2.4. Скачивание и инсталляция системы «Эйдос»..............................................................15
2.5. Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос" 18
2.6. Синтез и верификация статистических и интеллектуальных моделей........................................22
2.7. Частные критерии и виды моделей системы «Эйдос».......................................................23
2.8. Ценность описательных шкал и градаций для решения задач идентификации и прогнозирования...............26
2.9. Интегральные критерии системы «Эйдос».................................................................27
2.10. Результаты верификации моделей.......................................................................29
3. РЕШЕНИЕ ЗАДАЧ ИДЕНТИФИКАЦИИ И ПРОГНОЗИРОВАНИЯ В НАИБОЛЕЕ ДОСТОВЕРНОЙ МОДЕЛИ.................................35
4. ИССЛЕДОВАНИЕ МОДЕЛИРУЕМОЙ ПРЕДМЕТНОЙ ОБЛАСТИ ПУТЕМ ИССЛЕДОВАНИЯ ЕЕ МОДЕЛИ...................................38
4.1. Информационные портреты классов и признаков...........................................................38
4.2. Когнитивные функции...................................................................................41
4.3. SWOT и PEST матрицы и диаграммы.......................................................................45
4.4. Нелокальные нейроны...................................................................................48
4.5. Семантические сети классов и признаков................................................................49
4.6. Когнитивные диаграммы классов и признаков.............................................................55
ЗАКЛЮЧЕНИЕ.....................................................................................................57
ЛИТЕРАТУРА.....................................................................................................58
UDC 303.732.4
FORECASTING THE NUMBER AND THE CLASSES OF SOLAR FLARES BASED ON THEIR BACKGROUND ACCORDING TO THE UCI REPOSITORY USING ASC-ANALYSIS AND "EIDOS" INTELLIGENT SYSTEMS
Lutsenko Eugeny Veniaminovich Dr.Sci.Econ., Cand.Tech.Sci., professor
Kuban State Agrarian University, Krasnodar, Russia
Borovko Anton Yurievich
student of the Faculty of applied Informatics
Kuban State Agrarian University, Krasnodar, Russia
The article describes a numerical example of creating intellectual application designed to predict solar flares of different classes on the basis of the history of their development in the environment of "Eidos" system. As the source data, we used the database of UCI repository
Keywords: FORECASTING CHARACTERISTICS
OF solar flares based on their history with use of asc-analysis and intelligent systems "EIDOS"
ACCORDING UCI REPOSITORY
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
2
1. Краткая теория
1.1. Проблематика
Создание систем искусственного интеллекта является одним из важных и перспективных направлений развития современных информационных технологий. Так как существует множество альтернатив систем искусственного интеллекта, то возникает необходимость оценки качества математических моделей этих систем. В работах [1, 2, 17] рассматривалось решение этой задачи для оценки качества модели, реализованной в универсальной автоматизированной системе «Эйдос», представляющей собой программный инструментарий автоматизированного системнокогнитивного анализа (АСК-анализ) [3, 4]. Данная статья является продолжением этого подхода.
Для достижения поставленной цели необходимы свободный доступ к тестовым исходным данным и методика, которая поможет преобразовать эти данные в форму, которая необходима для работы в системе искусственного интеллекта. Удачным выбором является база данных тестовых задач для систем искусственного интеллекта репозитария UCI: http://archive.ics.uci.edu/ml/datasets.html. «Репозиторий UCI (UCI Machine Learning Repository) — крупнейший репозиторий реальных и модельных задач машинного обучения. Содержит реальные данные по прикладным задачам в области биологии, медицины, физики, техники, социологии, и др. Задачи (наборы данных, data set) именно этого репозитория чаще всего используются научным сообществом для эмпирического анализа алгоритмов машинного обучения. Репозиторий UCI создан в университете г.Ирвин (Калифорния, США).»1
1.2. Исходные данные
В данной работе использована база данных "Solar Flare Data Set ": http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/ [5] из банка исходных данных по задачам искусственного интеллекта - репозитария UCI, который создан, развивается и поддерживается сотрудниками Школы информатики и компьютерных исследований Калифорнийского университета США. На момент написания работы этот банк включает в себя 290 баз исходных данных по различным задачам.
1 См., например: http://www.machinelearning.ru/wiki/index.php?title=UCI
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
3
1.3. Инструментарий
Для решения задачи используем стандартные возможности Microsoft Office Word и Excel, а также систему искусственного интеллекта "Эйдос-Х++".
Математическая модель системы "Эйдос" была разработана в 1979 и впервые прошла экспериментальную апробацию в 1981 году. С 1981 по 1992 система "Эйдос" неоднократно реализовалась на платформе Wang (на компьютерах Wang-2200C). Для IBM-совместимых персональных компьютеров система "Эйдос" впервые реализована в 1992 году и с тех пор совершенствуется постоянно, вплоть до настоящего времени [6, 7, 8].
1.4. Метризация шкал
Измерительные шкалы - это инструмент создания формальных моделей реальных объектов, а так же и инструмент, который позволяет повысить степень формализации этих моделей до такого уровня, при котором возможна их реализация на компьютерах [9].
Чем выше степень формализации модели, тем точнее решаются различные задачи с использованием этих моделей, тем проще использовать модели для проектирования различных систем и их создания, а также тем более точные и развитые математические методы могут применяться в этих моделях.
Однако если разные факторы измеряются в различных единицах измерения, то результат сравнения объектов будет зависеть от единиц измерения факторов, что недопустимо. Поэтому возникает проблема сопоставимости результатов измерений разнородных величин (измеряемых в разных единицах измерения) в шкалах различных типов (номинальных, порядковых и числовых).
В АСК-анализе и его инструментарии интеллектуальной системе "Эйдос" эта проблема решается путем метризации шкал [9]. Система «Эйдос» в настоящее время поддерживает 7 способов метризации всех типов шкал, которые обеспечивают корректную совместную сопоставимую количественную обработку разнородных по своей природе факторов, различных единиц измерения. Факторы описываются шкалами, а значения факторов - градациями шкал. В АСК-анализе все они рассматриваются с единой точки зрения: сколько информации содержится в их значениях о переходе объекта, на который они действуют, в определенное состояние, при этом направление влияния и сила значений факторов измеряется в одних общих для факторов единицах измерения (единицах количества информации). По этой причине можно складывать силу и направление влияния всех действующих на объект значений факторов, и определять результат их совместного влияния на объект. При этом объект является нелиней-
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
4
ным, а факторы взаимодействуют друг с другом внутри него (не выполняется принцип суперпозиции).
Измерение - Отображение реальных объектов в формальных шкалах. Система "Эйдос" представляет - средство для построения и применения измерительных инструментов в различных предметных областях. В ней реализованы разнообразные технологии метризации, которые позволяют любые свойства объектов (количественные и качественные) исследовать в наиболее сильных абсолютных шкалах знаний.
2. Синтез и верификация моделей
2.1. Описание решения
В соответствии с методологией АСК-анализа решение поставленной задачи проведем в четыре этапа:
1. Преобразование исходных данных из HTML-формата в промежуточные файлы MS Excel.
2. Преобразование исходных данных из промежуточных файлов MS Excel в базы данных системы "Эйдос".
3. Синтез и верификация моделей предметной области.
4. Применение моделей для решения задач идентификации, прогнозирования и исследования предметной области.
2.2. Преобразование исходных данных из HTML-формата в файл исходных данных MS Excel
Из банка исходных данных по задачам искусственного интеллекта -репозитария UCI получаем исходную информацию по базе данных "Solar Flare Data Set ", которую оставим без изменений [5].
Общее описание задачи:
(файл: «flare.names» по адресу: http: //archive.ics.uci.edu/ml/machine -l earning-databases/sol ar-fl are/fl are. names)
1. Title: Solar Flare database
2. Source Information
-- Donor: Gary Bradshaw <[email protected]>
-- Date: 3/89
3. Past Usage:
-- Gary Bradshaw: (Class Attributes were collapsed to 0 and >0)
-- See the past-usage file for a note written by Gary Bradshaw
4. Relevant Information:
-- The database contains 3 potential classes, one for the number of times a
certain type of solar flare occured in a 24 hour period.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
5
-- Each instance represents captured features for 1 active region on the sun.
-- The data are divided into two sections. The second section (flare.data2)
has had much more error correction applied to the it, and has consequently been treated as more reliable.
5.
6. 7.
Number of Instances: flare.data1:
Number of attributes: 13 (includes
Attribute Information:
1. Code for class (modified Zurich
2. Code for largest spot size
3. Code for spot distribution
4. Activity
5. Evolution
6. Previous 24 hour flare activity
323, flare.data2: 1066 3 class attributes)
class)
code
(A,B,C,D,E,F,H)
(X,R,S,A,H,K)
(X,O,I,C)
1 = reduced, 2 = unchanged) 1 = decay, 2 = no growth,
3 = growth)
1 = nothing as big as an M1
2 = one M1,
3 = more activity than one
M1)
7. Historically-complex (1 = Yes, 2 = No)
8. Did region become historically complex on this pass across the sun's disk (1 = yes, 2 = no)
9. Area (1 = small , 2 = large)
10. Area of the largest spot (1 = <=5, 2 = >5)
From all these predictors three classes of flares are predicted, which are represented in the last three columns.
11. C-class flares production in the following 24 hours
12. M-class flares production in the following 24 hours
13. X-class flares production in the following 24 hours
by this region (common flares) by this region (moderate flares) by this region (severe flares)
Number
Number
Number
8. Missing values: None
9. Class Distribution:
flare.data1:
0 1 2 4 Total
C-class flares 287 29 7 0 323
M-class flares 291 24 6 2 323
X-class flares 316 7 0 0 323
flare.data2:
0 1 2 3 4 5 6 7 8 Total
C-class flares 884 112 33 20 9 4 3 0 1 1066
M-class flares 1030 29 3 2 1 0 1 0 0 1066
X-class flares 1061 4 1 0 0 0 0 0 0 1066
Обучающая выборка
На сайте UCI по адресу: http: //archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/ представлено два набора данных:
- «flare.datal» по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/flare.data1 (323 записи за период с 02/13/69 по 03/27/69);
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
6
- «flare.data2» по адресу: http://archive.ics.uci.edu/ml/machine-leaming-databases/solar-flare/flare.data2 (1066 записей за период с 08/19/78 по 12/23/78).
Мы объединим эти данные и обработаем их совместно в одной модели. Фрагмент исходных данных «flare.data1» приведен в таблице 1:
Таблица 1 - DATA1; 1969 FLARE DATA (02/13/69 to 03/27/69) (фрагмент)
C S O 1 2 1 1 2 1 2 0 0 0 B X O 1 3 1 1 2 1 1 0 0 0
D S O 1 3 1 1 2 1 2 0 0 0 F K I 1 3 1 2 2 1 2 0 0 0
C S O 1 3 1 1 2 1 1 0 0 0 B X O 1 2 1 1 2 1 1 0 0 0
D S O 1 3 1 1 2 1 2 0 0 0 H R X 1 2 1 1 1 1 2 0 0 0
D A O 1 3 1 1 2 1 2 0 0 0 B X I 1 3 1 1 2 1 1 0 0 0
D A O 1 2 1 1 2 1 2 0 0 0 C R I 1 3 1 1 2 1 2 0 0 0
D A O 1 2 1 1 2 1 1 0 0 0 B X O 1 3 1 1 2 1 1 0 0 0
D A O 1 2 1 1 2 1 2 0 0 0 B X O 1 3 1 1 2 1 2 0 0 0
D K O 1 3 1 1 2 1 2 0 0 0 D A I 1 3 1 2 2 1 2 0 0 0
C R O 1 3 1 1 2 1 1 0 0 0 D A O 1 3 1 1 2 1 2 1 0 1
B X O 1 3 1 1 2 1 1 0 0 0 B X O 1 3 1 1 2 1 1 0 0 0
D S O 1 2 1 1 2 1 1 0 0 0 D A I 1 3 1 1 2 1 2 0 0 0
C H I 1 3 1 1 2 1 2 0 0 0 B X O 1 3 1 1 2 1 2 0 0 0
D R O 1 3 1 1 2 1 1 0 0 0 D R O 1 3 1 1 2 1 2 0 0 0
B X O 1 2 1 1 2 1 1 0 0 0 D A O 1 2 1 1 2 1 1 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0 C A I 1 3 1 1 2 1 1 0 0 0
D K I 1 3 1 1 2 1 2 0 0 0 D A I 1 2 1 2 2 1 1 1 0 0
D S O 1 2 1 1 2 1 2 0 0 0 D A I 2 2 3 1 2 1 2 0 0 0
D R O 1 2 1 1 2 1 1 0 0 0 D A I 1 2 1 2 2 1 2 0 0 0
C A I 1 2 1 1 2 1 2 0 0 0 B X O 1 3 1 1 2 1 1 0 0 0
C S O 1 2 1 1 2 1 1 0 0 0 D R O 1 1 1 1 2 1 1 0 0 0
Смысл этих данных следующий:2 Attribute Information:
1. Code for class (modified Zurich class) (A,B,C,D,E,F,H)
2. Code for largest spot size (X,R,S,A,H,K)
3. Code for spot distribution (X,O,I,C)
4. Activity (1 = reduced, 2 = unchanged)
5. Evolution (1 = decay, 2 = no growth, 3 = growth)
6. Previous 24 hour flare activity code (1 = nothing as big as an M1,2 = one M1,3 = more activity than one M1)
7. Historically-complex (1 = Yes, 2 = No)
8. Did region become historically complex on this pass across the sun's disk (1 = yes, 2 = no)
9. Area (1 = small, 2 = large)
10. Area of the largest spot (1: <=5, 2: >5)
From all these predictors three classes of flares are predicted, which are represented in the last three columns.
11. C-class flares production by this region in the following 24 hours (common flares); Number
12. M-class flares production by this region in the following 24 hours (moderate flares); Number
13. X-class flares production by this region in the following 24 hours (severe flares); Number
2 http://archive.ics.uci.edu/ml/datasets/Solar+Flare
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
7
Ниже приведен автоматизированный перевод наименований полей базы исходных данных, т.е. классификационных и описательных шкал и градаций:
Описательная информация:
1. Код для класса (модифицированный класс Цюрих) (A, B, C, D, E,
F, H).
2. Код для наибольшего размера пятна (X, R, S, A, H, K).
3. Код для распространения пятна (X, O, I, C).
4. Деятельность (1 = уменьшается, 2 = без изменений).
5. Эволюция (1 = распад, 2 = нет роста, 3 = рост).
6. Предыдущая 24 час вспышка активности код (1 = ничего, как большой, как М1, 2 = Один M1, 3 = больше активности, чем один M1).
7. Исторически-комплекс (1 = Да, 2 = Нет).
8. Разве региона становятся исторически комплекс на этом проходе по диску Солнца (1 = да, 2 = нет).
9. Площадь (1 = малый, 2 = большая).
10. Площадь самого большого пятна (1: <= 5, 2: > 5).
На основе всех этих характеристик развития пятна, предшествующих солнечным вспышкам, необходимо спрогнозировать количество и класс солнечных вспышек на ближашие 24 часа (включая и их отсутствие), информация о которых содержится в последних трех столбцах исходных данных:
11. Количество вспышек С-класса, произошедших в этой области в течение следующих 24 часов.
12. Количество вспышек M-класса, произошедших в этой области в течение следующих 24 часов.
13. Количество вспышек X-класса, произошедших в этой области в течение следующих 24 часов.
Таким образом, ясно, что колонки с 1 по 10 содержат описательные шкалы и градации, а с 11 по 13 - классификационные шкалы и градации.
Поскольку ввод исходных данных в систему «Эйдос» планируется осуществить с помощью ее универсального программного интерфейса импорта данных из внешних баз данных, который работает с файлами MS Excel, то преобразуем данные из html-файла в xls-файл, для чего выполним следующие операции.
1. Последовательно один за другим скопируем текст обучающей выборки с сайта UCI с адресов:
http://archive.ics.uci.edu/ml/machine-leaming-databases/solar-flare/flare.data1 и
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
8
http://archive.ics.uci.edu/ml/machine-leaming-databases/solar-flare/flare.data2 в один файл MS Word.
2. Удалим в скопированном тексте служебные надписи: «*******DATA1; 1969 FLARE DATA (02/13/69 to 03/27/69) *******», ******** DATA2; 1978 FLARE DATA (08/19/78 to 12/23/78) *****».
3. Выделим весь текст блоком, нажав Ctrl+A и выберем пункт меню: «Таблица - Преобразовать - Текст в таблицу». В открывшемся окне (рисунок 1) выберем: Разделитель - другой - пробел, и кликнем «OK».
Рисунок 1. Окно MS Word параметров преобразования текста в таблицу В результате получим таблицу 2:
Таблица 2 - Исходные данные (фрагмент)
C S O 1 2 1 1 2 1 2 0 0 0
D S O 1 3 1 1 2 1 2 0 0 0
C S O 1 3 1 1 2 1 1 0 0 0
D S O 1 3 1 1 2 1 2 0 0 0
D A O 1 3 1 1 2 1 2 0 0 0
D A O 1 2 1 1 2 1 2 0 0 0
D A O 1 2 1 1 2 1 1 0 0 0
D A O 1 2 1 1 2 1 2 0 0 0
D K O 1 3 1 1 2 1 2 0 0 0
C R O 1 3 1 1 2 1 1 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D S O 1 2 1 1 2 1 1 0 0 0
C H I 1 3 1 1 2 1 2 0 0 0
D R O 1 3 1 1 2 1 1 0 0 0
B X O 1 2 1 1 2 1 1 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D K I 1 3 1 1 2 1 2 0 0 0
D S O 1 2 1 1 2 1 2 0 0 0
D R O 1 2 1 1 2 1 1 0 0 0
C A I 1 2 1 1 2 1 2 0 0 0
C S O 1 2 1 1 2 1 1 0 0 0
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
9
B X O 1 3 1 1 2 1 1 0 0 0
F K I 1 3 1 2 2 1 2 0 0 0
B X O 1 2 1 1 2 1 1 0 0 0
H R X 1 2 1 1 1 1 2 0 0 0
B X I 1 3 1 1 2 1 1 0 0 0
C R I 1 3 1 1 2 1 2 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
B X O 1 3 1 1 2 1 2 0 0 0
D A I 1 3 1 2 2 1 2 0 0 0
D A O 1 3 1 1 2 1 2 1 0 1
B X O 1 3 1 1 2 1 1 0 0 0
D A I 1 3 1 1 2 1 2 0 0 0
B X O 1 3 1 1 2 1 2 0 0 0
D R O 1 3 1 1 2 1 2 0 0 0
D A O 1 2 1 1 2 1 1 0 0 0
C A I 1 3 1 1 2 1 1 0 0 0
D A I 1 2 1 2 2 1 1 1 0 0
D A I 2 2 3 1 2 1 2 0 0 0
D A I 1 2 1 2 2 1 2 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D R O 1 1 1 1 2 1 1 0 0 0
D A I 1 2 1 1 2 1 1 0 0 0
D S O 1 1 1 1 2 1 1 0 0 0
D S I 1 3 1 1 2 1 1 0 0 0
D A I 1 3 1 2 2 1 2 2 1 0
D A I 2 3 1 2 2 1 1 0 0 0
D A I 1 2 1 2 2 1 1 0 0 0
B X O 1 2 1 1 2 1 1 0 0 0
D S O 1 3 1 2 2 1 2 0 0 0
D S O 1 3 1 1 2 1 1 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D A O 1 3 1 2 2 1 2 0 0 0
D K C 2 3 1 2 2 1 2 1 1 0
D A I 1 3 1 2 2 1 2 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D A O 1 3 1 2 2 1 2 0 0 0
D S I 1 3 1 1 2 1 1 0 0 0
D K C 1 2 1 1 2 1 2 0 0 0
D A I 1 2 1 1 2 1 2 0 0 0
B X O 1 3 1 1 2 1 1 0 0 0
D S O 1 2 1 2 2 1 2 0 0 0
D K C 2 3 3 2 2 1 2 1 2 1
E K I 2 3 1 2 2 1 2 0 0 0
D S I 1 3 1 2 2 1 2 1 0 0
C S O 1 2 1 2 2 1 2 0 0 0
4. В полученной таблице 2:
- в самом начале добавим пустую строку, а затем перенесем в нее наименования колонок из файла общего описания задачи «flare.names», расположенного по адресу: http://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare/flare.names;
- в меню: «Файл - параметры страницы» поменяем ориентацию листа на альбомную;
- затем заменим числовые значения в колонках таблицы 2 с 4-й по 10-ю на текстовые из того же файла «flare.names». Для этого выделим бло-
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
10
ком необходимую колонку, нажмем Ctrl+H и внесем в появившееся окно информацию о том, что и на что мы меняем, а затем выберем: «Заменить все», но только в выделенном участке текста (рисунок 2):
ЕЕ
Code for blass ^modified Zurich Class) Code for largest spot size Code for spot distribution Evolution Previous 24 hour flare activity code Historically- complex Did region become historically complex on this pass across the sun's disk Area Area of the largest spot C-class flares production by this region in the following 24 hours (common flares); Number M-class flares production by this region in the following 24 hours (moderate flares); Number X-class flares production by this region in the following 24 hours (severe flares): Number
P s 0 l і 2 l 2 0 0 0
P S 0 ^^B 3 1 1 2 1 2 0 0 0
p s 0 ^^B 3 l і 2 l 1 0 0 0
P s 0 ^^B 3 l і 2 l 2 0 0 0
P A 0 ^^B 3 1 1 2 1 2 0 0 0
Ю A 0 ^^B i l і 2 l 2 0 0 0
P A 0 Найти и заменить м ф 4 0
ID A 0 ^^B 2 0
P К 0 ^^B з 0
P R 0 ^^B 3 0
В X 0 Найти: Парамет Заменить на: 0
h Ы
b s 0 2 0
p H i з эы: Вперед 0
b R 0 ^^B 3 0
s X 0 ^^B 2 1 reduced ItjI 0
в X 0 ^^B 3 0
b к I ^^B 3 0
b s 0 ^^B 4 1 Больше * II Заменить j | Заменить есе | | Найти далее | | Отмена | 0
b R 0 2 0
b A I ^^B 2 0
c S 0 1 Г 2 l 1 0 0 0
в X 0 ^^B 3 1 1 2 1 1 0 0 0
b К I ^^B 3 1 2 2 l 2 0 0 0
s X 0 ^^B з 1 1 2 l 1 0 0 0
H R X ^^B 2 1 1 1 1 2 0 0 0
в X I ^^B 3 1 1 2 l 1 0 0 0
c R I 3 1 1 2 1 2 0 0 0
в X 0 3 1 1 2 1 1 0 0 0
s X 0 з 1 1 2 l 2 0 0 0
p A I ^^B з 1 2 2 l 2 0 0 0
p A 0 ^^B 3 1 1 2 1 2 1 0 1
3
Рисунок 2. Замена числовых кодов на текстовые наименования
-5
в файле исходных данных
В последующем это улучшит читаемость и наглядность выходных форм, получаемых в системе «Эйдос».
6. Скопируем получившуюся таблицу из MS Word в MS Excel и запишем ее с именем: Inp_data.xls в папку: c:\Aidos-X\AID_DATA\Inp_data\. В файле Inp_data.xls добавим пустую колонку на позиции «A» и автоматически пронумеруем все строки.
В результате получим таблицу исходных данных, полностью подготовленную для обработки в системе «Эйдос» и записанную в нужную папку в виде файла нужного типа с нужным именем (таблица 3). В этой таблице содержатся данные 1389 наблюдений, поэтому ниже приводится лишь их фрагмент.
Полностью эти исходные данные можно скачать по адресу:
http://lc.kubagro.ru/ei data/1041410099/Inp data.xls.
3 Наименования колонок нужно сохранить в отдельной таблице и потом восстановить те из них, которые исказились в результате замены, т.к. в них были цыфры.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
11
Таблица 3 - Исходные данные (фрагмент: 80 наблюдений из 1389)
№ Code for class (modifie d Zurich class) Code for largest spot size Code for spot distribution Activity Evolution Previous 24 hour flare activity code Historically- complex Did region become historically complex on this pass across the sun's disk Area Area of the largest spot C-class (common flares) Number M-class (moderate flares) Number X-class (severe flares) Number
1 C S O reduced no growth noth. rng as b. Lg as an Ml Yes No small >5 zero zero zero
2 D S O reduced growth noth- rng as b. Lg as an Ml Yes No small >5 zero zero zero
3 C S O reduced growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
4 D S O reduced growth noth. ng as b. g as an Ml Yes No small >5 zero zero zero
5 D A O reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
6 D A O reduced no growth noth. ng as b. g as an Ml Yes No small >5 zero zero zero
7 D A O reduced no growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
8 D A O reduced no growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
9 D K O reduced growth noth. ng as b. g as an Ml Yes No small >5 zero zero zero
10 C R O reduced growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
11 B X O reduced growth noth. ng as b. g as an Ml Yes No small <=5 zero zero zero
12 D S O reduced no growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
13 C H I reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
14 D R O reduced growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
15 B X O reduced no growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
16 B X O reduced growth noth. ng as b. g as an Ml Yes No small <=5 zero zero zero
17 D K I reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
18 D S O reduced no growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
19 D R O reduced no growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
20 C A I reduced no growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
21 C S O reduced no growth noth. ng as b. g as an Ml Yes No small <=5 zero zero zero
22 B X O reduced growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
23 F K I reduced growth noth. ng as b. g as an Ml No No small >5 zero zero zero
24 B X O reduced no growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
25 H R X reduced no growth noth. ng as b. Lg as an Ml Yes Yes small >5 zero zero zero
26 B X I reduced growth noth. ng as b. g as an Ml Yes No small <=5 zero zero zero
27 C R I reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
28 B X O reduced growth noth. ng as b. g as an Ml Yes No small <=5 zero zero zero
29 B X O reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
30 D A I reduced growth noth. ng as b. Lg as an Ml No No small >5 zero zero zero
31 D A O reduced growth noth. ng as b. Lg as an Ml Yes No small >5 one zero one
32 B X O reduced growth noth. ng as b. Lg as an Ml Yes No small <=5 zero zero zero
33 D A I reduced growth noth. ng as b. g as an Ml Yes No small >5 zero zero zero
34 B X O reduced growth noth. ng as b. Lg as an Ml Yes No small >5 zero zero zero
35 D R O reduced growth noth. ng as b. g as an Ml Yes No small >5 zero zero zero
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
12
36 D A O reduced no growth nothing as big as an M1 Yes No small <=5 zero zero zero
37 C A I reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
38 D A I reduced no growth nothing as big as an M1 No No small <=5 one zero zero
39 D A I unchanged no growth more activity than one M1 Yes No small >5 zero zero zero
40 D A I reduced no growth nothing as big as an M1 No No small >5 zero zero zero
41 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
42 D R O reduced decay nothing as big as an M1 Yes No small <=5 zero zero zero
43 D A I reduced no growth nothing as big as an M1 Yes No small <=5 zero zero zero
44 D S O reduced decay nothing as big as an M1 Yes No small <=5 zero zero zero
45 D S I reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
46 D A I reduced growth nothing as big as an M1 No No small >5 two one zero
47 D A I unchanged growth nothing as big as an M1 No No small <=5 zero zero zero
48 D A I reduced no growth nothing as big as an M1 No No small <=5 zero zero zero
49 B X O reduced no growth nothing as big as an M1 Yes No small <=5 zero zero zero
50 D S O reduced growth nothing as big as an M1 No No small >5 zero zero zero
51 D S O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
52 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
53 D A O reduced growth nothing as big as an M1 No No small >5 zero zero zero
54 D K C unchanged growth nothing as big as an M1 No No small >5 one one zero
55 D A I reduced growth nothing as big as an M1 No No small >5 zero zero zero
56 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
57 D A O reduced growth nothing as big as an M1 No No small >5 zero zero zero
58 D S I reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
59 D K C reduced no growth nothing as big as an M1 Yes No small >5 zero zero zero
60 D A I reduced no growth nothing as big as an M1 Yes No small >5 zero zero zero
61 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
62 D S O reduced no growth nothing as big as an M1 No No small >5 zero zero zero
63 D K C unchanged growth more activity than one M1 No No small >5 one two one
64 E K I unchanged growth nothing as big as an M1 No No small >5 zero zero zero
65 D S I reduced growth nothing as big as an M1 No No small >5 one zero zero
66 C S O reduced no growth nothing as big as an M1 No No small >5 zero zero zero
67 D S I reduced growth nothing as big as an M1 No No small >5 zero zero zero
68 H H X reduced no growth nothing as big as an M1 No No small <=5 one zero zero
69 D S I reduced growth nothing as big as an M1 No No small >5 zero zero zero
70 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
71 B X O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
72 C R O reduced growth nothing as big as an M1 Yes No small <=5 zero zero zero
73 H S X reduced no growth nothing as big as an M1 Yes Yes small >5 zero zero zero
74 D A O reduced no growth nothing as big as an M1 No No small >5 zero zero zero
75 D K C unchanged no growth more activity than one M1 No No small >5 zero zero zero
76 D K I reduced growth nothing as big as an M1 No No small >5 zero two one
77 D S I reduced no growth nothing as big as an M1 No No small <=5 zero one zero
78 C A O reduced no growth nothing as big as an M1 No No small >5 zero zero zero
79 D S O reduced decay nothing as big as an M1 No No small >5 zero zero zero
80 H S X reduced growth nothing as big as an M1 No No small >5 zero zero zero
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
13
2.3. Этапы АСК-анализа и преобразование исходных данных в информацию, а ее в знания в системе "Эйдос"
АСК-анализ включает следующие этапы [3, 4]:
1. Когнитивная структуризация предметной области (неформализованный этап). На этом этапе решается, что мы хотим прогнозировать и на основе чего. В нашей задаче мы хотим прогнозировать продолжительность жизни пациента после перенесенного им инфаркта на основе анализа эхокардиограммы.
2. Формализация предметной области. На этом этапе разрабатываются классификационные и описательные шкалы и градации, а затем с их использованием исходные данные кодируются и представляются в форме баз событий, между которыми могут быть выявлены причинно-следственные связи.
3. Синтез и верификация моделей (оценка достоверности, адекватности). Повышение качества модели. Выбор наиболее достоверной модели для решения в ней задач.
4. Решение задач идентификации и прогнозирования.
5. Решение задач принятия решений и управления.
6. Решение задач исследования моделируемой предметной области путем исследования ее модели.
На рисунке 1 приведены автоматизированные в системе «Эйдос» этапы АСК-анализа, которые обеспечивают последовательное повышение степени формализации модели путем преобразования исходных данных в информацию, а далее в знания (рисунок 3).
Подробно этот процесс описан в работе [10]. Суть этого процесса в следующем:
1. Информация рассматривается как осмысленные исходные данные.
2. Смысл, согласно концепции Шенка-Абельсона [12] считается известным, когда выявлены причинно-следственные связи.
3. Анализ - это операция выявления смысла из исходных данных.
4. Причинно-следственные связи существуют не между элементами исходных данных, а между реальными событиями, которые они отражают (моделируют), т.е. причинно-следственные связи - это характеристика реальной области, а не абстрактных моделей. Иначе говоря, анализ самих исходных данных невозможен, а возможен только анализ событий, описанных этими исходными данными.
5. Поэтому перед анализом исходных данных необходимо предварительно преобразовать их в базы событий, т.е. в эвентологические базы.
6. Это преобразование осуществляется с помощью справочников событий, факторов и их значений, т.е. с помощью классификационных и описательных шкал и градаций, которые также необходимо разработать.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
14
7. Формализация предметной области представляет собой разработку справочников классификационных и описательных шкал и градаций и преобразование с их помощью баз исходных данных в базы событий (т.е. обучающую выборку), и является первым автоматизированным в системе «Эйдос» этапом АСК-анализа.
8. Затем следуют остальные перечисленные выше этапы АСК-анализа:
- синтез и верификация моделей и выбор наиболее достоверной из
них;
- решение в ней задач идентификации, прогнозирования, принятия решений и исследования предметной области, т.е. преобразование информации в знания.
Этап синтеза и верификации моделей завершает процесс анализа исходных данных и преобразования их в информацию, а ее в знания.
Рисунок 3. Этапы последовательного преобразования данных в информацию, а ее в знания в системе "Эйдос"
В АСК-анализе есть несколько режимов, обеспечивающих решение задачи принятия решений для управления или достижения целей, которая представляет собой обратную задачу прогнозирования: это и режим 4.2.1, позволяющий формировать информационные портреты классов, а также режим 4.4.8, поддерживающий количественный автоматизированный
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
15
SWOT и -PEST анализ, включая построение SWOT и -PEST матриц и диаграмм [13], а также режим 4.4.10, визуализирующий нейросетевую интерпретацию модели знаний системы «Эйдос» [14]. Эти режимы обеспечивают преобразование информации в знания, т.к. знания представляют собой информацию, полезную для достижения целей, т.е. по сути технологию, в частности ноу-хау [10]. Наличие цели является ключевым моментом для преобразования информации в знания. А постановка целей (целеполагание) не мыслима без мотивации, которая в настоящее время является слабо формализованным этапом.
Итак, в процессе анализа исходные данные представляются в форме базы событий, между которыми выявляются причинно-следственные связи, и, таким образом, исходные данные преобразуются в информацию, представляющую собой осмысленные данные (смысл есть знание причинно-следственных связей), а затем информация используется для достижения целей (управления), т.е. преобразуется в знания.
Формализация предметной области включает разработку классификационных и описательных шкал и градаций и преобразование с их использованием исходных данных (таблица 1) в обучающую выборку. Этот этап полностью автоматизируется программным интерфейсом системы «Эйдос» с внешними табличными базами исходных данных (режим
2.3.2.2).
Но перед выполнением этого этапа АСК-анализа, естественно, необходимо сначала скачать и установить систему «Эйдос».
2.4. Скачивание и инсталляция системы «Эйдос»
Для скачивания и инсталляции системы «Эйдос» необходимо по адресу: http://lc.kubagro.ru/aidos/ Aidos-X.htm открыть и выполнить следую-
4
щую инструкцию :
ИНСТРУКЦИЯ
по скачиванию и установке системы «Эйдос» (объем около 50 Мб)
Система не требует инсталляции, не меняет никаких системных файлов и содержимого папок операционной системы,
т.е. является портативной (portable) программой. Но чтобы она работала необходимо аккуратно выполнить следующие пункты.
1. Скачать самую новую на текущий момент версию системы «Эйдос-Х++» по ссылке: http://lc.kubagro.ru/a.rar (ссылки для обновления системы даны в режиме 6.2)
2. Разархивировать этот архив в любую папку с правами на запись с коротким латинским именем и путем доступа,
включающим только папки с такими же именами (лучше всего в корневой каталог какого-нибудь диска).
4 Имеется и форум автора системы проф.Е.В.Луценко для пользователей системы: http://proflutsenko.vdforum.ru/
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
16
3. Запустить систему. Файл запуска: 0_AIDOS-X.exe
4. Задать имя: 1 и пароль: 1 (потом их можно поменять в режиме 1.2).
5. Перед тем как запустить новый режим НЕОБХОДИМО ЗАВЕРШИТЬ предыдущий (Help можно не закрывать). Окна закрываются в порядке, обратном порядку их открытия.
Разработана программа: «0_START_AIDOS.exe», полностью снимающая с пользователя системы «Эйдос-Х++» заботу о проверке наличия и скачивании обновлений. Эту программу надо просто скачать по ссылке: http://lc.kiihagm.nl/lnstall Aidos-X/ START AIDOS.exe , поместить в папку с исполнимым модулем системы и всегда запускать систему с помощью этого файла.
При запуске программы _START_AIDOS.EXE система Эйдос не должна быть запущена, т.к. она содержится в файле обновлений и при его разархивировании возникнет конфликт, если система будет запущена.
1. Программа C)_START_AIDOS.exe определяет дату системы Эйдос в текущей папке, и дату обновлений на FTP-сервере не скачивая их, и, если система Эйдос в текущей папке устарела, скачивает обновления. (Если в текущей папке нет исполнимого модуля системы Эйдос, то программа пытается скачать полную инсталляцию системы, но не может этого сделать из-за ограниченной функциональности демо-версии библиотеки Xb2NET.DLL).
2. После этого появляется диалоговое окно с сообщением, что надо сначала разархивировать систему, заменяя все файлы (опция: «Yes to All» или «OwerWrite All»), и только после этого закрыть данное окно.
3. Потом программа 0_START_AIDOS.exe запускает обновления на разархивирование. После окончания разархивирования окно архиватора с отображением стадии процесса исчезает.
4. После закрытия диалогового окна с инструкцией (см. п.2), происходит запуск обновленной версии системы Эйдос на исполнение.
Для работы программы tD_START_AIDOS.exe необходима библиотека: Xb2NET.DLL, которую можно скачать по ссылке: http://lc.ku.ha.gro.ni/Tnstall Aidos-X/Xb2NET.DLL . Перед первым запуском этой программы данную библиотеку необходимо скачать и поместить либо в папку с этой программой, а значит и исполнимым модулем системы «Эйдос-Х++», либо в любую другую папку, на которую в операционной системе прописаны пути поиска файлов, например в папку: c:\Windows\System32\. Эта библиотека стоит около 500$ и у меня ее нет, поэтому я даю только бесплатную демо-версию, которая выдает сообщение об ограниченной функциональности, но для наших целей ее достаточно._________________________________________________________________
Лицензия:
Автор отказывается от какой бы то ни было ответственности за последствия применения или не применения Вами системы «Эйдос».
Проще говоря, пользуйтесь если понравилось, а если не понравилось - сотрите и забудьте, а лучше вообще не скачивайте.__________________________________________
По этим ссылкам всегда размещена наиболее полная на момент скачивания незащищенная от несанкционированного копирования портативная (portable) версия системы (не требующая инсталляции) с исходными текстами, находящаяся в полном открытом бесплатном доступе (объем около 50 Мб). Обновление имеет объем около 3 Мб.
Для преобразования исходных данных обучающей выборки в базы данных системы "Эйдос" необходимо файл MS Excel, который содержит
http://ej.kuhagno.nu/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
17
базу исходных данных, скопировать в папку: Aidos-X\AID_DATA\Inp_data и назвать Inp_data.xls. Этот файл организован следующим образом (рисунок 4):
Режим 2.3.2.2: Универсальный программный интерфейс импорта данных из внешней базы данных 'lnp_data.xls' в систему 'Эйдос-х++' и формализации предметной области.
■ Данный программный интерфейс обеспечивает автоматическое Формирование классификационным и описательным шкал и градаций, а также обучающей и распознаваемой выборки, т. е. Формализацию предметной области, на основе XLS или XLSX-Файла с немодными данными приведенного ниже стандарта.
- Файл немодным данным должен иметь имя: INP_DATA.XLS или INP_DATA.XLSX и может бьпъ получен в Енсе1-2003[2007-2010), а Файл распознаваемой выборки имя INP_RASP.XLS или INP_RASP.XLSX. Файлы INP_DATA.XLS [INP_DATA.XLSX) и INP_RASP.XLS или INP_RASP. XLSX] должны накалиться в папке /AIDOS-X/AID_DATA/lnp_data/ и имеют совершенно одинаковую структуру.
-1 -я строка этого Файла должна содержать наименования колонок на любом языке, в т. ч. и русском. Эти наименования должны быть во веек колонкам, при этом объединение ячеек и переносы слов не допускаются. Желательно, чтобы эти наименования были не очень длинными, т.к. к ним еще будут добавляться интервальные числовые или текстовые значения.
- Каждая строка этого файла, начиная со 2-й, содержит данные об одном объекте обучающей выборки. Если ЕксеІ-2003, в листе может быть до G553G строк и до 25Є колонок. В листе Емсе1-2007[2010) возможно до 1 048 578 строк и 1Є 384 колонок.
- Столбцы, начиная со 2-го, являются классификационными и описательными шкалами и могут бьпъ текстового (номинального] или числового типа (с десятичными знаками после запятой).
- Столбцу присваивается числовой тип, если все значения его ячеек числового типа. Если котя бы одно значение является текстовым [не числом, в т.ч. пробелом], то столбцу присваивается текстовый тип. Это означает, что нули должны бьпъ указаны нулями, а не пробелами.
-1 -й столбец содержит наименование источника данным длиной до 255 символов, но желательно, чтобы эти наименования были не очень длинными.
- Столбцы со 2-го по N-й являются классификационными шкалами (вымодными параметрами] и содержат данные о классам (будущим состояниям объекта управления], к которым принадлежат объекты обучающей выборки.
- Столбцы с N+1 по последний являются описательными шкалами (Факторами) и содержат данные о признакам (значениям Факторов), маракте-ризующим объекты обучающей выборки.
- В результате работы режима Формируется Файл INP_NAME.TXT стандарта MS DOS (кириллица), в котором наименования классификационным и описательным шкал являются СТРОКАМИ. Система формирует классификационные и описательные шкалы и градации. Для этого в каждом числовом столбце система намедиг минимальное и максимальное числовые значения и Формирует заданное количество числовым интервалов, после чего числовые значения заменяются им интервальными значениями. В текстовым столбцам система нанодит уникальные текстовые значения. Каждое УНИКАЛЬНОЕ интервальное числовое или текстовое значение считается градацией классификационной или описательной шкалы, нарактеризующей объект. С им использованием генерируется обучающая выборка, каждый объект которой соответствует одной строке Файла немодным данным N P_D АТ А и содержит коды классов, соответствующие фактам совпадения числовым или уникальным текстовым значений классов с градациями классификационным шкал и коды признаков, соответствующие Фактам совпадения числовым или уникальным текстовым значений признаков с градациями описательным шкал.
- Распознаваемая выборка Формируется на основе Файла INP_RASP аналогично, за исключением того, что классификационные и описательные шкалы и градации не создаются, а используются ранее созданные в модели, и базы распознаваемой выборки могут не включать коды классов, если столбцы классов в файле INP_RASP были пустыми. Структура файла INP_RASP должна быть такая же, как INP_DATA, т.е. они должны ПОЛНОСТЬЮ совпадать по столбцам, но могут иметь разное количество строк.
і—Принцип организации таблицы немодным данным:-
Нэи меновэние обьшэ обучающей выборки Наименование 1-й классификационной шкапы Наименование 2-й классификационной шкалы Наименование 1-й описательной шкалы Наименование 2-й описательной шкалы
1-й объект обучающей выборки Значение показателя Значение показателя Знание показателя Значение показателя
2-й объект обучающей выборки Значение показателя Значение показателя Значение показателя Значение показателя
... ... ...
0к
Cancel
Рисунок 4. Help по режиму 2.3.2.2 системы «Эйдос»
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
18
2.5. Автоматизированная формализация предметной области путем импорта исходных данных из внешних баз данных в систему "Эйдос"
Для загрузки базы исходных данных в систему «Эйдос» необходимо воспользоваться универсальным программным интерфейсом для ввода данных из внешних баз данных табличного вида (таблица 1), т.е. режимом
2.3.2.2 (рисунок 5):
Рисунок 5. Экранная форма Универсального программного интерфейса импорта данных в систему "Эйдос" (режим 2.3.2.2.)
В экранной форме, приведенной на рисунке 5, задать настройки, показанные на рисунке:
- "Задайте тип файла исходных данных Inp_data": "XLS - MS Excel-2003";
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
19
- "Задайте диапазон столбцов классификационных шкал": "Начальный столбец классификационных шкал" - 12, "Конечный столбец классификационных шкал" - 14 (три последних столбца в таблице 3)5;
- "Задайте диапазон столбцов описательных шкал": "Начальный столбец описательных шкал" - 2, "Конечный столбец описательных шкал" - 11;
- "Задание параметров формирования сценариев или способа интерпретации текстовых полей": "Не применять сценарный метод АСК-анализа и спец.интерпретацию TXT-полей".
После нажать кнопку "ОК". Далее открывается окно, где размещена информация о размерности модели (рисунок 6). В этом окне необходимо нажать кнопку "Выйти на создание модели".
Рисунок 6. Задание размерности модели системы "Эйдос"
Далее открывается окно, отображающее стадию процесса импорта данных из внешней БД "Inp_data.xls" в систему "Эйдос" (рисунок 7), а также прогноз времени завершения этого процесса. В том окне необходимо дождаться завершения формализации предметной области и нажать кнопку "ОК".
5 Классификационные шкалы могут идти либо в начале таблицы, как показано на рисунке 4, либо в конце таблицы.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
20
Рисунок 7. Процесс импорта данных из внешней БД "Inp_data.xls"
в систему "Эйдос"
В результате формируются классификационные и описательные шкалы и градации, с применением которых исходные данные (таблица 3) кодируются и представляются в форме эвентологических баз данных. Этим самым полностью автоматизировано выполняется 2-й этап АСК-анализа «Формализация предметной области». Этот режим на данных таблицы 3 выполняется довольно быстро: всего за 22 секунды.
Для просмотра классификационных шкал и градаций необходимо запустить режим 2.1 (рисунок 8):
[ 2.1. Классификационные шкалы и градации. Текущая модель: "INF4" ^ ^ 1 1=1 1 ®
1
И Код шкалы Наименование классификационной шкалы HI Код градации Наименование градации классификационной шкалы DEL A
C-CLASS (COMMON FLARES) NUMBER ... 1 Г eight ...
1 2 M-CLASS (MODERATE FLARES) NUMBER ... 2 five ...
1 3 X-CLASS (SEVERE FLARES] NUMBER ... 3 four ...
4 one ...
5 six ...
6 three ...
7 two ...
8 zero ...
-
<1 1 .► А 1 > Ґ
Помощь Доб.шкалу Доб.град.шкалы Копир.шкалу Копир.град.шкалы Копир.шкалу с град. Удал, шкалу с град. Удал.град.шкалы Удаление и перекодирование J
II II
Рисунок 8. Классификационные шкалы и градации (фрагмент)
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
21
Для просмотра описательных шкал и градаций необходимо запустить режим 2.2 (рисунок 9):
t> 2.2. Описательные шкапы, и градации, Текущая модель: TNF1"
Код шкалы Наименование описательной шкалы CODE FOR CLASS (MODIFIED ZURICH CLASS...
2 CODE FOR LARGEST SPOT SIZE ...
3 CODE FOR SPOT DISTRIBUTION ..
4 ACTIVITY ...
5 EVOLUTION ...
Є PREVIOUS 24 HOUR FLARE ACTIVITY CODE ...
7 HISTORICALLY-COMPLEX ...
8 DID REGION BECOME HISTORICALLY COMPL...
Э AREA ...
10 AREA OF THE LARGEST SPOT ...
л 1 Ш
Код градации I Наименование градации описательной шкалы
1 В ...
2 С ...
3 D ...
4 Е ...
5 F ...
Є Н ...
Л 1 d
Помощь! Доб.шкалу Доб. град, шкалы Копир.шкалу Копир.град.шкалы Копир, шкалу с град. Удал, шкалу с град. Удал.град.шкалы I Перекодировать! Очистить
Рисунок 9. Описательные шкалы и градации (фрагмент)
Для просмотра обучающей выборки необходимо запустить режим 2.3.1. (рисунок 10):
Код объекта Наименование объекте Дат а Врем Г
!! | 1 1 ...
2 2 ...
3 3 ...
4 4 ...
5 5 ...
G Б ...
7 7 ...
8 8 ...
9 9 ...
1 п Л 1 о 1 ►
Л
| Код объекта Класс 1 Класс 2 Класс 3 Класс 4 ^ИГКод объекта Признак 1 Признак 2 Признак 3 Признак 4 Признак 5 Признак В Признак 7 1 Г
1 8 14 17 0 Г1 ■ 7 2 11 15 17 21 23 28
1 27 30 32 0 0 0 0
л I ► Л и
Помощь Скопировать обуч.выб.в расп. Добавить объект Добавить классы Добавить признаки Удалить объект Удалить классы Удалить признаки Очистить БД
Рисунок 10. Обучающая выборка (фрагмент)
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
22
Тем самым создаются все необходимые и достаточные предпосылки для выявления силы и направления причинно-следственных связей между значениями факторов и результатами их совместного системного воздействия (с учетом нелинейности системы [11]).
2.6. Синтез и верификация статистических и интеллектуальных моделей
Далее запускаем режим 3.5, в котором задаются модели для синтеза и верификации, а также задается модель, которой по окончании режима присваивается статус текущей (рисунок 11):
Рисунок 11. Выбор моделей для синтеза и верификации, а также текущей модели
В данном режиме имеется много различных методов верификации моделей, в том числе и поддерживающие бутстрепный метод. Но мы используем параметры по умолчанию, приведенные на рисунке 11.
Стадия процесса исполнения режима 3.5 и прогноз времени его окончания отображаются на экранной форме, приведенной на рисунке 12.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
23
Рисунок 12. Синтез и верификация статистических моделей
и моделей знаний
Интересно заметить (см. рисунок 12), что синтез и верификация всех 10 моделей на данной задаче заняли 7 минут 25 секунд. При этом верификация (оценка достоверности моделей) проводилась на всех 1389 примерах наблюдения из обучающей выборки (таблица 3).
В результате выполнения режима 3.5 созданы все модели, со всеми частными критериями, перечисленные на рисунке 11, но ниже мы приведем лишь некоторые из них (таблицы 5, 6, 7). Но предварительно рассмотрим частные и интегральные критерии, применяемые в настоящее время в системе «Эйдос».
2.7. Частные критерии и виды моделей системы «Эйдос»
Рассмотрим решение задачи идентификации на примере модели INF1, в которой рассчитано количество информации по А.Харкевичу, которое мы получаем о принадлежности идентифицируемого объекта к каждому из классов, если знаем, что у этого объекта есть некоторый признак. Это так называемые частные критерии сходства, приведенные в таблице 4.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
24
Таблица 4 - Частные критерии знаний, используемые в настоящее время в АСК-анализе и системе «Эйдос-Х++»
Наименование модели знаний и частный критерий Выражение для частного критерия
через относительные частоты через абсолютные частоты
INF1, частный критерий: количество знаний по А.Харкевичу, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу. Относительная частота того, что если у объекта j-го класса обнаружен признак, то это i-й признак P Ij =^х Log2-j N N I j =^X Log2 —-— j NN. j
INF2, частный критерий: количество знаний по А.Харкевичу, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу. Относительная частота того, что если предъявлен объект j-го класса, то у него будет обнаружен i-й признак. P. Iv =WX Log2~^ NijN I j =^X Log2 —-— j 2 N N j
INF3, частный критерий: Хи-квадрат: разности между фактическими и теоретически ожидаемыми абсолютными частотами --- NN. I =N 1 ] l] 1j N
INF4, частный критерий: ROI - Return On Investment, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу P P - P I = j 1= j i j P P N„N I t] = 4 1 lJ N.N. i J
INF5, частный критерий: ROI - Return On Investment, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу P P - P I = j 1= j i j P P NN I] = 4 1 lJ NN i J
INF6, частный критерий: разность условной и безусловной относительных частот, 1-й вариант расчета относительных частот: Nj - суммарное количество признаков по j-му классу ll 4b i II 1
INF7, частный критерий: разность условной и безусловной относительных частот, 2-й вариант расчета относительных частот: Nj - суммарное количество объектов по j-му классу ^-ч ll l II 1
Обозначения:
i - значение прошлого параметра;
j - значение будущего параметра;
Nij - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра;
M- суммарное число значений всех прошлых параметров;
W - суммарное число значений всех будущих параметров.
Ni - количество встреч i-м значения прошлого параметра по всей выборке;
Nj - количество встреч j-го значения будущего параметра по всей выборке;
N - количество встреч j-го значения будущего параметра при i-м значении прошлого параметра по всей выборке.
Ij - частный критерий знаний: количество знаний в факте наблюдения i-го значения прошлого параметра о том, что объект перейдет в состояние, соответствующее j-му значению будущего параметра;
W- нормировочный коэффициент (Е.В.Луценко, 1979, впервые опубликовано в 1993 году [15]), преобразующий количество информации в формуле А.Харкевича в биты и обеспечивающий для нее соблюдение принципа соответствия с формулой РХартли;
Pi - безусловная относительная частота встречи i-го значения прошлого параметра в обучающей выборке;
Pij - условная относительная частота встречи i-го значения прошлого параметра при j-м значении будущего параметра.
По сути, частные критерии представляют собой просто формулы для преобразования матрицы абсолютных частот (таблица 5)6 в матрицы ус-
6 Эта таблица является также матрицей сопряженности или корреляционной матрицей.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
25
ловных и безусловных процентных распределений и матрицы знаний (таблицы 6 и 7) (проф. В.И.Лойко).
Таблица 5 - Матрица абсолютных частот (модель ABS) и условных и безусловных процентных распределений (фрагменты)
Таблица 6 - Матрица информативностей (модель INF1) в битах (фрагмент)
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
26
Таблица 7 - Матрица знаний (модель INF3) (фрагмент)
£) 5.5, Модель: "6, INF3 - частный критерий: Хи-квадрат, разности между фактическими и ожидаемыми абс.частотамм"
Кед признака Наименование описательной шкалы и градации 1. C-CLASS (COMMON FLARES) NUMBER-EIGHT 2. C-CLASS (COMMON FLARES) NUMBER-FIVE 3. C-CLASS (COMMON FLARES) NUMBER-FOUR 4. C-CLASS (COMMON FLARES) NUMBER-ONE 5. C-CLASS (COMMON FLARES) NUMBER-SIX G. C-CLASS (COMMON FLARES) NUMBER-THREE
1 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-B... -0.153 -0.611 -1.374 -6.521 -0.458 -3.053
2 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-C... -0.207 0.174 -1.860 -7.134 -0.620 -1.132
3 CODE FOR CLASS [MODIFIED ZURICH CLASS)-... -0.235 -0.942 -0.119 23.806 -0.706 3.292
4 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-E... 0.916 2.666 3.248 5.225 2.749 5.330
5 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-F... -0.037 -0.147 2.670 7.823 -0.110 1.266
6 CODE FOR CLASS [MODIFIED ZURICH CLASS)-... -0.2S5 -1.140 -2.566 -23.199 -0.855 -5.702
7 CODE FOR LARGEST SPOT SIZE-A ... 0.801 0.202 3.205 4.881 0.402 6.012
8 CODE FOR LARGEST SPOT SIZE-H ... -0.027 -0.109 -0.246 4.143 -0.082 0.453
Э CODE FOR LARGEST SPOT SIZE-K ... -0.06S -0.271 3.391 12.458 0.797 1.647
10 CODE FOR LARGEST SPOT SIZE-R ... -0.184 0.263 -1.659 -6.987 -0.553 -2.686
11 CODE FOR LARGEST SPOT SIZE-S ... -0.370 0.520 -3.330 -8.177 -0.110 -2.401
12 CODE FOR LARGEST SPOT SIZE-X ... -0.151 -0.605 -1.361 -6.317 -0.454 -3.024
13 CODE FOR SPOT DISTRIBUTION-C ... -0.039 0.844 1.650 7.518 0.883 0.222
14 CODE FOR SPOT DISTRIBUTION-I ... 0.775 0.102 2.978 18.328 0.326 8.508
15 CODE FOR SPOT DISTRIBUTIOH-O ... -0.451 0.194 -2.063 -2.648 -0.354 -3.028
18 CODE FOR SPOT DISTRIBUTION-X ... -0.285 -1.140 -2.566 -23.199 -0.855 -5.702
17 ACTIVITY-reduced ... -0.850 -1.398 -2.646 -17.784 -1.549 -4.991
„ г, 1 1
Помощь MS Excel MS Word
2.8. Ценность описательных шкал и градаций для решения задач идентификации и прогнозирования
у
Для любой из моделей системой «Эйдос» рассчитывается ценность градации описательной шкалы, т.е. признака, для идентификации или прогнозирования. Количественной мерой ценности признака в той или иной модели является вариабельность по классам частного критерия (таблица 6) для этого признака. Мер вариабельности существует много, но наиболее известными является среднее модулей отклонения от среднего, дисперсия и среднеквадратичное отклонение. Последняя мера и используется в АСК-анализе и системе «Эйдос».
В системе «Эйдос» ценность признаков нарастающим итогов выводится в графической форме.
При большом объеме обучающей выборки можно без ущерба для достоверности модели удалить из нее малозначимые признаки. Для этого в системе «Эйдос» также есть соответствующие инструменты. 7
7
Эта ценность в АСК-анализе называется также интегральной информативностью, дифференцирующей способностью и селективной силой, т.е. эти термины являются синонимами.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
27
2.9. Интегральные критерии системы «Эйдос»
Но если нам известно, что объект обладает не одним, а несколькими признаками, то как посчитать их общий вклад в сходство с теми или иными классами? Для этого в системе «Эйдос» используется 2 аддитивных интегральных критерия: «Сумма знаний» и «Семантический резонанс знаний».
Интегральный критерий «Семантический резонанс знаний» представляет собой суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3:
I = (A Li).
В выражении круглыми скобками обозначено скалярное произведение. В координатной форме это выражение имеет вид:
M
I =Z j..
i=1
где: M - количество градаций описательных шкал (признаков);
Ту = {Ту } - вектор состояния j-го класса;
Ц = {Ц} - вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
1. если i - й фактор действует;
L =
п. где: n > 0. если i - й фактордействует с истинностью п;
0. если i - й факторне действует.
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Интегральный критерий «Семантический резонанс знаний» представляет собой нормированное суммарное количество знаний, содержащееся в системе факторов различной природы, характеризующих сам объект управления, управляющие факторы и окружающую среду, о переходе объекта в будущие целевые или нежелательные состояния.
Интегральный критерий представляет собой аддитивную функцию от частных критериев знаний, представленных в help режима 3.3 и имеет вид:
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
28
1
tiij- h )(l -L)
где:
M
h
L
J OiOlM^-i
- количество градаций описательных шкал (признаков);
- средняя информативность по вектору класса;
- среднее по вектору объекта;
среднеквадратичное отклонение частных критериев знаний
вектора класса;
среднеквадратичное отклонение по вектору распознаваемого
Li =
объекта.
Ij = {Ij } - вектор состояния j-го класса;
Ц = {Ц} - вектор состояния распознаваемого объекта, включающий все виды факторов, характеризующих сам объект, управляющие воздействия и окружающую среду (массив-локатор), т.е.:
1, если i - й фактор действует;
п, где: п > 0, если i - й фактор действует с истинностью п;
0, если i - й фактор не действует.
В текущей версии системы «Эйдос-Х++» значения координат вектора состояния распознаваемого объекта принимались равными либо 0, если признака нет, или n, если он присутствует у объекта с интенсивностью n, т.е. представлен n раз (например, буква «о» в слове «молоко» представлена 3 раза, а буква «м» - один раз).
Приведенное выражение для интегрального критерия «Семантический резонанс знаний» получается непосредственно из выражения для критерия «Сумма знаний» после замены координат перемножаемых векторов их стандартизированными значениями:
I, ^ Il
I..
L ^
L - L
L
Свое наименование интегральный критерий сходства «Семантический резонанс знаний» получил потому, что по своей математической форме является корреляцией двух векторов: состояния j-го класса и состояния распознаваемого объекта.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
29
2.10. Результаты верификации моделей
Результаты верификации (оценки достоверности) моделей, отличающихся частными критериями (таблица 4) с двумя приведенными выше интегральными критериями приведены на рисунке 13:
Рисунок 13. Оценки достоверности моделей
Наиболее достоверной в данном приложении оказались модели INF4 при интегральном критерии «Сумма знаний» и модель INF5 с интегральным критерием «Резонанс знаний». При этом достоверность отнесения ситуации к классу, к которому она действительно относится, составляет 70,194%, а достоверность не отнесения ситуации к классу, к которому она не относится - 81,889%. Таким образом, уровень достоверности прогнозирования с применением модели выше, чем экспертных оценок, достоверность которых считается равной примерно 70%.
Для оценки достоверности моделей в АСК-анализе и системе «Эй-дос» используется метрика, сходная с F-критерием (рисунок 14):
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
30
Рисунок 14. Виды прогнозов и принцип определения достоверности моделей по авторскому варианту метрики, сходной с F-критерием
Также обращает на себя внимание, что статистические модели, как правило, дают более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, и практически никогда -более высокую. Этим и оправдано применение моделей знаний и интеллектуальных технологий.
На рисунке 15 приведены частные распределения уровней сходства и различия для верно и ошибочно идентифицированных и неидентифицированных ситуаций в наиболее достоверной модели INF4:
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
31
Рисунок 15. Частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний объекта моделирования в модели INF4
Из рисунка 15 видно, что:
- наиболее достоверная модель INF4 лучше определяет непринадлежность объекта к классу, чем принадлежность (что видно также из рисунка 13);
- модуль уровня сходства-различия в наиболее достоверной модели INF4 для верно идентифицированных и верно неидентифицированных объектов значительно выше, чем для ошибочно идентифицированных и ошибочно неидентифицированных. Это верно практически для всего диапазона уровней сходства-различия, кроме небольших по модулю значений в диапазоне от 0 до 15% уровня сходства. Для очень больших значений уровней сходства-различия (более 70%) также различие между верно и ошибочно идентифицированными и неидентифицированными ситуациями практически отсутствует.
Ясно, что любые данные о наблюдениях можно считать суммой истинного значения и шума, причем ни первое, ни второе неизвестны. Поэтому имеет смысл сравнить созданные модели с чисто случайными моделями, совпадающими по основным характеристикам (приведены на рисунке ). В системе «Эйдос» есть лабораторная работа № 2.01: «Исследование RND-модели при различных объемах выборки» (устанавливается из Диспетчера приложений - режима 1.3). Если данная работа устанавливается
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
32
при отсутствии текущего приложения, то все параметры создаваемых моделей задаются вручную, если же текущая модель существует, как в нашем случае, то все основные ее параметры определяются автоматически (рисунок 16).
ф 1.3. Задание параметров RND-модели ■ * ■ • і 1=1 ®
<• (Определить автометически на основе текущего приложений
С Задать произвольные параметры RND-моаели вручную —Автоматическое определение параметров RND-модели на основе текущего приложения Наименование текущего приложения: Прогнозирование количества и классов солнечным вспышек на основе им предыстории 3 <■ Количество классификационным шкал в RND_MOflenH 17 <- Количество классов (градаций классификационным шкал) в RND-мсдели 10 <■ Количество описательным шкал в RND_MQflenH 32 <■ Количество признаков (градаций описательным шкал) в RND-мшели 133Э <- Количество объектов обучающей выборки в RND-модели 4 <- Оценка среднего количества классов, к которым относится объект обучающей выборки 14 <- Оценка среднего количества признаков у объекта обучающей выборки Є <- Среднее количество градаций в классификационной шкале (округлено до целым) 3 <- Среднее количество градаций в описательной шкале [округлено до целым)
, , пмп
RND-модель - это модель, в которой принадлежность объектов обучающей выборки к классам является случайной, как и признаки объектов. Для генерации случайным кодов классов и признаков используется числовой генератор равномерно распределенным случайным чисел. При автоматическом определении параметров RND-мсдели на основе текущей модели количество классов, признаков и объектов обучающей выборки в RND-модели будет таким же, как в текущей модели. Среднее количество классов, к которым относится объект обучающей выборки и среднее количество признаков у него также будет совпадать с этими нарактеристиками объектов обуч.выборки текущей модели.
Информацию об объектах обучающей выборки текущей модели можно считать суммой полезной информации о них (полезный сигнал) и шума. В RND-модели вся информация представляет собой шум. Поэтому сравнение этих моделей, не отличающихся перечисленными параметрами, позволяет оценить влияние значимой информации и шума на результаты, в частности убедиться в наличии самой этой значимой информации, т.е. закономерностей в предметной области, а также оценить эффективность различных стат.моделей и моделей знаний и интегральных критериев для выявления и исследования этой значимой информации, знаний и закономерностей. При увеличении объема обучающей выборки в RND-модели вероятность верной идентификации стремится к вероятности случайного угадывания, а в реальной модели к некоторому пределу, превосходящему вероятность случайного угадывания и характеризующему эффективность модели и целесообразность ее применения.
0k 1 Cancel 1
Г ШШ Т .
Рисунок 16. Экранная форма управления созданием случайных моделей, совпадающих с текущей по размерностям основных баз данных
Из рисунка 17 видно, что процесс установки данной лабораторной
работы завершается за 1 минуту 27 секунд.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
33
Рисунок 17. Экранная форма, отображающая процесс установки лабораторной работы № 2.01: «Исследование RND-модели при различных объемах выборки» по образцу текущего приложения
На рисунке 18 показано частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний в случайной модели INF4:
Рисунок 18. Частное распределение сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний в случайной модели INF4
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
34
Совершенно очевидное различие частотных распределений уровней сходства-различия верно и ошибочно идентифицированных и неидентифицированных состояний объекта моделирования и случайной модели (рисунки 15 и 18) объясняется тем, что в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны. Если же такой информации в модели нет, то и распределение получается типа приведенного на рисунке 18.
На рисунке 19 приведены данные по достоверности статистических и когнитивных моделей, созданных на основе случайной выборки:
Рисунок 19. Достоверность статистических и когнитивных моделей, созданных на основе случайной выборки
На основе его сравнения с рисунком 13 можно сделать следующие выводы:
- достоверность лучшей модели INF5, отражающей реальный объект моделирования, примерно на 20% выше, чем аналогичной случайной модели;
- различие между достоверностью статистических моделей и моделей знаний, созданных на основе случайной выборки, значительно меньше, чем у моделей, отражающих реальный объект моделирования;
- в реальных моделях кроме шума есть также и информация об истинных причинно-следственных взаимосвязях факторов и их значений с одной стороны, и состояниями объекта моделирования, которые ими обуславливаются, с другой стороны, причем примерно 1/3 достоверности обусловлена отражением в реальных моделях закономерностей предметной области, а 2/3 достоверности обусловлено наличием шума в исходных данных. На основании этого можно предположить, что в исходных данных
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
35
(таблица 3) уровень сигнала о реальных причинно-следственных связях в моделируемой предметной области примерно в два раза ниже уровня шума.
3. Решение задач идентификации и прогнозирования в наиболее достоверной модели
В соответствии с технологией АСК-анализа (рисунок 3) зададим текущей модель INF4 (режим 5.6) (рисунок 20) и проведем пакетное распознавание в режиме 4,2,1 (рисунок 22):
Рисунок 20. Экранные формы режима задания модели в качестве текущей
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
36
4.1.2, Пакетное распознавание. Текущая модель: "INF4"
~||гм—т|г1=Т||^ЕЗ^|'
[—Стации исполнения процессе-------------------------------------------------------
ОПЕРАЦИЯ: ПАКЕТНОЕ РАСПОЗНАВАНИЕ В ТЕКУЩЕЙ МОДЕЛИ "INF4":
1/11: Распознавание (идентификация) 1 389-го объекта обучающей выборки из 1 389 - Готово 2/11: Исследование распределений уровней сходства верно и ошиб.идент.объектов - Готово 3/11: Создание сжатых полных форм результатов распознавания по 2-му интегр.крит. - Готово ■1/11: Создание подробной наглядной формы: "Объект-классы". Инт.Крит-корреляция - Г отово 5/11: Создание подробной наглядной формы: "Объект-классы". Инт.крит.-сумма инф. - Г отово 6/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-корреляция - Г отово 7/11: Создание итоговой наглядной формы: "Объект-класс". Инт.крит.-сумма инф. - Г отово 8/11: Создание подробной наглядной формы: "Класообъекты". Инт.крит.-корреляция - Готово 9/11: Создание подробной наглядной формы: "Класообъекты". Инт.крит.-сумма инф. - Г отово 10/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-корреляция - Г отово 11/11: Создание итоговой наглядной формы: "Класс-объекты". Инт.крит.-суммаинф.-Готово
ПАКЕТНОЕ РАСПОЗНАВАНИЕ ОБЪЕКТОВ РАСПОЗНАВАЕМОЙ ВЫБОРКИ ЗАВЕРШЕНО УСПЕШНО !
—Прогноз Бремени исполнения-------------------------------------------------------------
Начало: 08:02:42 Окончание: 8:03:45
1002
Ok
Прошло: 0:01:02
Осталось: 0:00:00
Рисунок 21. Экранная форма режима пакетного распознавания
в текущей модели
В результате пакетного распознавания в текущей модели создается ряд баз данных, которые визуализируются в выходных экранных формах, отражающих результаты решения задачи идентификации и прогнозирования.
Режим 4.1.3 системы «Эйдос» обеспечивает отображение результатов идентификации и прогнозирования в различных формах:
1. Подробно наглядно: "Объект - классы".
2. Подробно наглядно: "Класс - объекты".
3. Итоги наглядно: "Объект - классы".
4. Итоги наглядно: "Класс - объекты".
5. Подробно сжато: "Объект - классы".
6. Обобщенная форма по достоверности моделей при разных интегральных критериях.
7. Обобщенный статистический анализ результатов идентификации по моделям и интегральным критериям.
8. Статистический анализ результатов идентификации по классам, моделям и интегральным критериям.
9. Распознавание уровня сходства при разных моделях и интегральных критериях.
10. Достоверность идентификации классов при разных моделях и интегральных критериях.
Ниже кратко рассмотрим некоторые из них.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
37
На рисунках 22 и 23 приведены примеры прогнозов высокой и низкой достоверности частоты и классов солнечных вспышек в наиболее дос-
4.1.3.1. Визуализация результатов распознавания в отношении: "О&ьект-классьГ. Текущая модель: 11=1 1 0 1^Ъв| |
| Распознаваемые объекты Интегральный критерий сходства: "Семантический резонанс знаний" |
II ^ Наим, объекта в Н Код Наименование класса Сходство Ф... Сходство d
| 12... 1278 ... ■ 12 M-CASS (MODERATE FLARES] NUMBER -three ... 77,89... V
| 12... 1279 ... 16 X-CLASS (SEVERE FLARES) NUMBER -two ... 75,97... V
12... 1280 ... 7 C-CASS (COMMON FLARES) NUMBER-two ... 70,35...
и 12... 1281 ... 4 C-CLASS (COMMON FLARES) NUMBER-one ... 65,95... V
12... 1282 ... 15 X-CLASS (SEVERE FARES) NUMBER -one ... 61,36...
12... 1283 ... 13 M-CLASS (MODERATE FARES) NUMBER -two ... 60,04...
12... 1284 ... 11 M-CASS (MODERATE FARES] NUMBER -one ... 56,35...
12... 1285 ... 9 M-CASS (MODERATE FARES] NUMBER -live ... 53,52... ІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІІ
12... 1286 ... 5 C-CASS (COMMON FARES) NUMBER-$ix ... 28,52... ІІІІІІІІ III ІІІІІІІІ1111 d
12... 1287 ... 4 I ► Г
12... 1288 ... Интегральный критерий сходства: "Сумма знаний"
12... 1288 ... HI to Наименование класса Сходство ф... Сходство ±
12... 1290 ... ■ X-CASS (SEVERE FARES) NUMBER -two ... 73,63... V
12... 1291 ... 9 M-CASS (MODERATE FARES) NUMBER -live ... 70,87...
12... 1292 ... 12 M-CASS (MODERATE FARES) NUMBER -three .. 36,88... V
12... 1293 ... 13 M-CASS (MODERATE FARES] NUMBER -two ... 35,32... ІІІІІІІІ III ІІІІІІІІ III ІІІІІІІІ
12... 1294 ... 15 X-CASS (SEVERE FARES) NUMBER -one ... 32,02... llllllllllllllllllllllllllllllll
12... 1295 ... 5 C-CASS (COMMON FARES) NUMBER-six ... 23,61... ІІІІІІІІ III ІІІІІІІІ
12... 1296 ... Н 3 C-CASS (COMMON FARES) NUMBER-lour ... 13,99... lllllllllllll
12... 1297 ... 7 C-CASS (COMMON FARES) NUMBER-two ... 11,46... ІІІІІІІІ 1
12... 1288 ... А . 11 M-CASS (MODERATE FARES] NUMBER -one ... 8,607... lllllllll jd
d 1 . И Г А J >1 г
| Помощь | | 9 классов | Классы с MaxMin УрСх | 9 классов с MaxMin УрСх | ВСЕ классы | ВКЛ. Фильтр по класс.шкале : I ВЫКЛ.Фильтр по класс.шкале | Граф.диаграмма | ||
-4
Рисунок 22. Пример достоверного прогнозирования частоты и классов солнечных вспышек в модели INF4
Рисунок 22. Пример не очень достоверного прогнозирования частоты и классов солнечных вспышек в модели INF4
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
38
4. Исследование моделируемой предметной области путем исследования ее модели
Так созданные модели показали достаточно высокую адекватность, то их исследование обоснованно можно считать исследованием самой моделируемой предметной области.
Это исследование в частности включает:
- информационные портреты классов и признаков;
- когнитивные функции;
- SWOT и PEST матрицы и диаграммы;
- нелокальные нейроны;
- семантические сети классов и признаков;
- когнитивные диаграммы классов и признаков.
4.1. Информационные портреты классов и признаков
Информационный портрет класса - это список факторов, ранжированных в порядке убывания силы их влияния на переход объекта управления в состояние, соответствующее данному классу. Информационный портрет класса отражает систему его детерминации. Генерация информационного портрета класса представляет собой решение обратной задачи прогнозирования, т.к. при прогнозировании по системе факторов определяется спектр наиболее вероятных будущих состояний объекта управления, в которые он может перейти под влиянием данной системы факторов, а в информационном портрете мы наоборот, по заданному будущему состоянию объекта управления определяем систему факторов, детерминирующих это состояние, т.е. вызывающих переход объекта управления в это состояние. В начале информационного портрета класса идут факторы, оказывающие положительное влияние на переход объекта управления в заданное состояние, затем факторы, не оказывающие на это существенного влияния, и далее - факторы, препятствующие переходу объекта управления в это состояние (в порядке возрастания силы препятствования). Информационные портреты классов могут быть от отфильтрованы по диапазону факторов, т.е. мы можем отобразить влияние на переход объекта управления в данное состояние не всех отраженных в модели факторов, а только тех, коды которых попадают в определенный диапазон, например, относящиеся к определенным описательным шкалам.
Информационный (семантический) портрет фактора - это список классов, ранжированный в порядке убывания силы влияния данного фактора на переход объекта управления в состояния, соответствующие данным классам. Информационный портрет фактора называется также его се-
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
39
мантическим портретом, т.к. в соответствии с концепцией смысла системно-когнитивного анализа, являющейся обобщением концепции смысла Шенка-Абельсона, смысл фактора состоит в том, какие будущие состояния объекта управления он детерминирует. Сначала в этом списке идут состояния объекта управления, на переход в которые данный фактор оказывает наибольшее влияние, затем состояния, на которые данный фактор не оказывает существенного влияния, и далее состояния - переходу в которые данный фактор препятствует. Информационные портреты факторов могут быть от отфильтрованы по диапазону классов, т.е. мы можем отобразить влияние данного фактора на переход объекта управления не во все возможные будущие состояния, а только в состояния, коды которых попадают в определенный диапазон, например, относящиеся к определенным классификационным шкалам.
Рассмотрим информационные портреты классов в режиме 4.2.1 (рисунок 23):
Рисунок 23. Пример информационного портрета класса с кодом 13 (наблюдение 2 вспышек M-класса) в модели INF4
Из этого портрета мы можем сделать вывод о том, что на основе определений конкретных объектов обучающей выборки (т.е. конкретных онтологий), в каждом из которых были с одной стороны приведены признаки объекта, а с другой указана его принадлежность к обобщающим классам, система «Эйдос» смогла сформировать обобщенные определения классов (обобщенные онтологии), в которых для каждого класса указана степень характерности и не характерности для него всех имеющихся в модели признаков. В данном случае в качестве объектов обучающей выборки выступали наблюдения солнечных вспышек, но в принципе ими могут быть любые объекты или их состояния из любой предметной области (например,
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
40
о
[9]8 ), т.к. система «Эйдос» разрабатывалась в обобщенной постановке, независящей от предметной области.
Поставив курсор на любую строку в правом окне мы можем включить фильтр по соответствующей описательной шкале (фактору) и увидеть в информационном портрете как влияют различные значения этого фактора на ситуацию, выбранную в левом окне (рисунок 24):
9*) 4,3.1. Информационные портреты клдггпк ■ Л я * 1 1=1 1 ®
Инф.портрет класса: 13 "M-CLASS (MODERATE FLARES] NUMBER -two" в модели: 6 "INF3"
И Код Наименование класса ±l -1 zl H Код Наименование признака Значимость
1 C-CLASS (COMMON FLARES) NUMBER-eight ... 3 CODE FOR CLASS (MODIFIED ZURICH CLASS)-D 3.SS1 Г г
2 C-CLASS (COMMON FLARES) NUMBER-five ... 4 CODE FOR CLASS (MODIFIED ZURICH CLASS)-E 2.248
3 C-CLASS (COMMON FLARES) NUMBER-four ... 5 CODE FOR CLASS (MODIFIED ZURICH CLASS)-F -G.330
4 C-CLASS (COMMON FLARES) NUMBER-one ... 1 CODE FOR CLASS (MODIFIED ZURICH CLASS)-B -1.374
5 C-CLASS (COMMON FLARES) NUMBER-six ... 2 CODE FOR CLASS (MODIFIED ZURICH CLASS)-C -1.360
6 C-CLASS (COMMON FLARES) NUMBEFI-three ... s CODE FOR CLASS (MODIFIED ZURICH CLASS)-H -2.5*6
7 C-CLASS (COMMON FLARES) NUMBER-two ...
8 C-CLASS (COMMON FLARES) NUMBER-zero ...
э M-CLASS (MODERATE FLARES) NOMBER -five ...
10 M-CLASS (MODERATE FLARES) NOMBER -four ...
11 M-CLASS (MODERATE FLARES) NUMBER -one ...
12 M-CLASS (MODERATE FLARES) NUMBER -three...
13 M-CLASS (MODERATE FLARES) NUMBER -two ...
14 M-CLASS (MODERATE FLARES) NUMBER -zero ...
15 X-CLASS (SEVERE FLARES) NUMBER -one ...
18 X-CLASS (SEVERE FLARES] NUMBER -two ...
17 X-CLASS (SEVERE FLARES) NUMBER -zero ...
4 I ► 4 It
Помощь | Abs | Ргс1 | Ргс2 | Inf1 | Inf2 | Ш | Inf4 | Inf5 | InIG | Inf7 | MS Excel І В КП. Фильтр по Фактору] ВЫКЛ.Фильтр по Фактору| Вписагть в окно | Показань ВСЕ 1
м
L - - J
Рисунок 23. Пример информационного портрета класса с кодом 13 (наблюдение 2 вспышек M-класса) в модели INF3 с фильтром по фактору
Рассмотрим информационные или семантические (смысловые) портреты признаков в режиме 4.3.1. Данный режим показывает, какой смысл имеет то или иное значение фактора (признак), т.е., например, для модели INF 1: какое количество информации содержится в факте наблюдения данного значения фактора о том, что этот объект моделирования перейдет в те или иные состояния, соответствующие различным классам (рисунок 24).
Система «Эйдос» была применена во многих предметных областях: http://lc.kubagro.ru/ http://ei.kubagro.ru/a/viewaut.asp?id=11
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
41
£) 4.3.1. Информационные портреты признаков - V 1- ^ ЬйвГ
I Инф.портрет признака: 1 "CODE FOR CLASS (MODIFIED ZURICH CLASS)-BM в модели: Л "INFI"
1 Кеш. CODE FOR CLASS (MODIFIED ZURICH CLASSJ-B C-CLASS [COMMON FLARES! NUMBER-zero Значимость -
2 CODE FOR CLASS (MODIFIED ZURICH CLASSIC 14 M-CLASS (MODERATE FLARES) NUMBER -zero 0.012
3 CODE FOR CLASS (MODIFIED ZURICH CLASS)- 17 X-CLASS (SEVERE FLARES] NUMBER -zero 0.003
4 CODE FOR CLASS (MODIFIED ZURICH CLASS)-E 4 C-CLASS (COMMON FLARES] NUMBER-cne -0.139
5 CODE FOR CLASS (MODIFIED ZURICH CLASSJ-F 11 M-CLASS (MODERATE FLARES) NUMBER -one -0.271
Є CODE FOR CLASS (MODIFIED ZURICH CLASS)- 7 C-CLASS (COMMON FLARES] NUMBER-two -0.695
7 CODE FOR LARGEST SPOT SIZE-A
8 CODE FOR LARGEST SPOT SIZE-H
9 CODE FOR LARGEST SPOT SIZE-K
10 CODE FOR LARGEST SPOT SIZE-R
11 CODE FOR LARGEST SPOT SIZE-S
12 CODE FOR LARGEST SPOT SIZE-X
13 CODE FOR SPOT DISTRIBUTION-C
14 CODE FOR SPOT DISTRIBUTION-1 ...
15 CODE FOR SPOT DISTRIBUTION-O
16 CODE FOR SPOT DISTRIBUTION-X
17 ACTIVITY-ieducsd
18 ACTIVITY-ur, changed
19 EVOLUTION-decay
20 EVOLUTION-grcwth
21 EVOLUTION-nc giowlh
22 PREVIOUS 24 HOUR FLARE ACTIVITY CODE-mo
,| 23 PRPVICII 14 71 НПІIR PI iRF ACTIVITY rniTF.nnh 1 . ► d ’1 1>
Помощь 1 Abs | Prcl | Рісг| ilnfl :| Inl2 | Inl3 | Inl4 | Inl5 | InfS | Inf7 | MS Exc el | ВКЛ.Фильтр по кл.шкале | ВЫКЛ.Фильтр no ил.шкале | Вписать в окно | Показать ВСЕ 1
^ш —1
Рисунок 24. Пример информационного (семантического) портрета значения фактора (признака)
4.2. Когнитивные функции
Рассмотрим режим 4.5, в котором реализована возможность визуализации когнитивных функций для любых моделей и любых сочетаний классификационных и описательных шкал (рисунок 25).
45, Визуализация когнитивных функций
0
|—Что такое когнитивная Функция:-------------------------------------------------------------------------------------------
Визуализация прямых, обратных, позитивных, негативных, полностью и частично редуцированных когнитивных Функций Когнитивная Функция представляет собой графическое отображение силы и направления влияния различных значений некоторого Фактора на переходы объекта управления в будущие состояния, соответствующие классам. Когнитивные Функции представляют собой новый перспективный инструмент отражения и наглядной визуализации закономерностей и эмпирических законов. Разработка содержательной научной интерпретации когнитивных Функций представляет собой способ познания природы, общества и человека. Когнитивные Функции могут быть: прямые, отражающие зависимость классов от признаков, обобщающие информационные портреты признаков; обратные, отражающие зависимость признаков от классов, обобщающие информационные портреты классов; позитивные, показывающие чему способствуют система детерминации; негативные, отражающие чему препятствуют система детерминации; средневзвешенные, отражающие совокупное влияние всех значений Факторов на поведение объекта; с различной степенью редукции или степенью детерминации, которая отражает в графической Форме (в Форме полосы) количество знаний в аргументе о значении Функции и является аналогом и обобщением доверительного интервала. Если отобразить подматрицу матрицы знания, отображая цветом силу и направление влияния каждой градации некоторой описательной шкалы на переход объекта в состояния, соответствующие классам некоторой классификационной шкалы, то получим нередуцированную когнитивную Функцию. Когнитивные Функции являются наиболее развитым средством изучения причинно-следственных зависимостей в моделируемой предметной области, предоставляемым системой 'Эйдос". Необходимо отметить, что на вид Функций влияния математической моделью СК-анализа не накладывается никаких ограничений, в частности, они могут быть и не дифференцируемые. См.: Луценко Е.В. Метод визуализации когнитивных Функций • новый инструмент исследования эмпирических данных большой размерности / Е.В. Луценко, А. П. Трунев, Д.К. Бандык // Полигематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. ■ Краснодар: КубГАУ, 2011. ■ N*03(67]. С. 240-282. -ШиФрИнФормрегистра: 0421100012\0077. ,2,888 у.п.л. ■ Режим доступа: httD://ei.kubaaro.ru/2Q117Q3/Ddf/18.Ddf
і—Задайте нужный режим:-
Визуализации когнитивных функций
Скачать подборку публикаций по когнитивным Функциям
Лигерагур.ссылки на статьи по когнитивным Функциям | Скачать подборку публикаций по управлению знаниями |
Рисунок 25. Экранная форма режима 4.5 системы «Эйдос-Х++» «Визуализация когнитивных функций»
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
42
Применительно к задаче, рассматриваемой в данной работе, когнитивная функция показывает, какое количество информации содержится в различных значениях факторов о том, что объект моделирования перейдет в те или иные будущие состояния.
Когнитивным функциям посвящено много работ автора9, но наиболее новой и обобщающей из них является работа [16]. Поэтому здесь не будем останавливаться на описании того, что представляют собой когнитивные функции в АСК-анализе.
На рисунке 26 приведены визуализации всех когнитивных функций данного приложения для модели INF3:
9 См., например: http://www.twirpx.com/file/775236/
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
43
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
44
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
45
Рисунок 26. Визуализация когнитивных функций для обобщенных классов и всех описательных шкал для модели INF3
Г рафические файлы всех когнитивных функций (для всех сочетаний классификационных и описательных шкал) для модели INF3 и некоторые другие графические выходные формы данного приложения приведены по адресу: http://lc.kubagro.ru/ei data/1041410099/1.rar.
4.3. SWOT и PEST матрицы и диаграммы
SWOT-анализ является широко известным и общепризнанным методом стратегического планирования. Однако это не мешает тому, что он подвергается критике, часто вполне справедливой, обоснованной и хорошо аргументированной. В результате критического рассмотрения SWOT-анализа выявлено довольно много его слабых сторон (недостатков), источником которых является необходимость привлечения экспертов, в частности для оценки силы и направления влияния факторов. Ясно, что эксперты это делают неформализуемым путем (интуитивно), на основе своего профессионального опыта и компетенции. Но возможности экспертов имеют свои ограничения и часто по различным причинам они не могут и не хотят это сделать. Таким образом, возникает проблема проведения SWOT-анализа без привлечения экспертов. Эта проблема может решаться путем автоматизации функций экспертов, т.е. путем измерения силы и направления влияния факторов непосредственно на основе эмпирических данных. Подобная технология разработана давно, ей уже около 30 лет, но она малоизвестна - это интеллектуальная система «Эйдос». Данная система всегда обеспечивала возможность проведения количественного автоматизированного SWOT-анализа без использования экспертных оценок непосредственно на основе эмпирических данных. Результаты SWOT-анализа выводились в форме информационных портретов. В версии системы под MS Windows: «Эйдос-Х++» предложено автоматизированное количественное решение прямой и обратной задач SWOT-анализа с построением традиционных SWOT-матриц и диаграмм [13] (рисунок 27):
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
46
Рисунок 27. Пример SWOT-матрицы в модели INF3
На рисунке 28 приведена графическая SWOT-диаграмма, соответствующая SWOT-матрице, представленной на рисунке 27.
Рисунок 28. Пример SWOT-диаграммы в модели INF3
На рисунке 29 приведены примеры инвертированной SWOT-матрицы и инвертированной SWOT-диаграммы в модели INF3:
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
47
Рисунок 29. Пример инвертированной SWOT-диаграммы в модели INF3
Инвертированные SWOT-матрицы и SWOT-диаграммы показывают влияние значения фактора на поведение объекта моделирования. Отметим, что эти матрицы и диаграммы предложены автором и система «Эйдос» является на данный момент единственной системой, позволяющей проводить
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
48
соответствующий анализ непосредственно на основе эмпирических данных, причем в любой предметной области.
PEST-анализ является SWOT-анализом с более детализированной классификацией внешних факторов. Поэтому выводы, полученные на примере SWOT-анализа, можно распространить и на PEST-анализ.
4.4. Нелокальные нейроны
Нелокальные нейроны и интерпретируемые нейронные сети позволяют в наглядной форме отобразить систему детерминации будущих состояний. Нелокальный нейрон представляет собой будущее состояние объекта управления с изображением наиболее сильно влияющих на него факторов с указанием силы и направления (способствует-препятствует) их влияния. Нейронная сеть представляет собой совокупность взаимосвязанных нейронов. В классических нейронных сетях связь между нейронами осуществляется по входным и выходным сигналам, а в нелокальных нейронных сетях - на основе общего информационного поля, реализуемого семантической информационной моделью. Система «Эйдос» обеспечивает построение любого подмножества многослойной нейронной сети с заданными или выбираемыми по заданным критериям рецепторами и нейронами, связанными друг с другом связями любого уровня опосредованно-сти [14].
На рисунке 30 представлены экранная форма для задания параметров визуализации нелокальных нейронов и пример самой визуализации в модели INF3:
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
49
Рисунок 30. Пример нелокального нейрона в модели INF3
4.5. Семантические сети классов и признаков
Семантические сети классов и признаков являются графической визуализацией результатов кластерно-конструктивного анализа.
Кластерно-конструктивный анализ - это математический метод анализа данных, входящий в АСК-анализ, обеспечивающий: выявление классов, наиболее сходных по системе их детерминации и объединение их в кластеры; выявление кластеров классов, наиболее сильно отличающиеся
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
50
по системе их детерминации и построение из них полюсов конструктов классов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами; выявление факторов, наиболее сходных по детерминируемым ими классам и объединение их в кластеры; выявление кластеров факторов, наиболее сильно отличающиеся по детерминируемым ими классам и построение из них полюсов конструктов факторов, при этом остальные кластеры включаются в конструкты в качестве промежуточных между полюсами.
Состояния объекта управления, соответствующие классам, включенным в один кластер, могут быть достигнуты одновременно, т.е. являются совместимыми (коалиционными) по детерминирующим их факторам. Состояния объекта управления, соответствующие классам, образующим полюса конструкта, не могут быть достигнуты одновременно, т.е. являются противоположными по детерминирующим их факторам (антагонистическими).
Факторы, включенные в один кластер, оказывают сходное влияние на поведение объекта управления и могут, при необходимости, быть использованы для замены друг друга. Факторы, образующие полюса конструкта, оказывают противоположное влияние на поведение объекта управления.
Кластерно-конструктивный анализ классов позволяет сравнить их по сходству системы детерминации и отобразить эту информацию в наглядной графической форме семантической сети классов.
Кластерно-конструктивный анализ факторов позволяет сравнить факторы по сходству их влияния на переход объекта в будущие состояния и отобразить эту информацию в наглядной графической форме семантической сети факторов.
На рисунке 31 приведены экранные форма задания параметров кластерно-конструктивного анализа классов и признаков в различных моделях.
На рисунке 32 приведены примеры экранных форм отображения результатов кластерно-конструктивного анализа классов и признаков в различных моделях.
На рисунке 33 приведены примеры графической визуализации результатов кластерно-конструктивного анализа классов в модели INF 1.
На рисунке 34 приведены примеры графической визуализации результатов кластерно-конструктивного анализа признаков в модели INF1.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
51
Рисунок 31. Экранные формы задания параметров кластерноконструктивного анализа классов и признаков в различных моделях
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
52
t> 4.2 ,2,2, Результаты кластерно-конструїстиБного анализа .
____UUgiUaJ’
Конструкт класса: 1 "C-CLASS (COMMON FLARES) NUMBER-eight" в модели: 4 "INF1M
Код Наименование класса
1 C-CLASS (COMMON FLARES) NUMBER-eight ...
2 C-CLASS (COMMON FLARES) NUMBER-five ...
3 C-CLASS (COMMON FLARES) NUMBER-four ...
4 C-CLASS (COMMON FLARES) NUMBER-one ...
5 C-CLASS (COMMON FLARES) NUMBER-six ...
Є C-CLASS (COMMON FLARES) NUMBER-three ...
7 C-CLASS (COMMON FLARES) NUMBER-two ...
8 C-CLASS (COMMON FLARES) NUMBER-zero ...
8 M-CLASS (MODERATE FLARES) NUMBER -five ...
10 M-CLASS (MODERATE FLARES) NUMBER -four ...
11 M-CLASS (MODERATE FLARES) NUMBER -one ...
12 M-CLASS (MODERATE FLARES) NUMBER -three ...
13 M-CLASS (MODERATE FLARES) NUMBER -two ...
14 M-CLASS (MODERATE FLARES) NUMBER -zero ...
15 X-CLASS (SEVERE FLARES] NUMBER -one ...
18 X-CLASS (SEVERE FLARES] NUMBER -two ...
17 X-CLASS (SEVERE FLARES] NUMBER -zero ...
jJ I ►
N- Код класса Наименование класса Сходство
1 1 C-CLASS (COMMON FLARES) NUMBER-eight 100.000
2 Є C-CLASS (COMMON FLARES) NUMBER-three 58.278
3 10 M-CLASS (MODERATE FLARES) NUMBER -four 45.732
4 2 C-CLASS (COMMON FLARES) NUMBER-five 38.276
5 5 C-CLASS (COMMON FLARES) NUMBER-six 34.004
Є 3 C-CLASS (COMMON FLARES) NUMBER-four 33.697
7 7 C-CLASS (COMMON FLARES) NUMBER-two 33.305
8 11 M-CLASS (MODERATE FLARES) NUMBER -one 24.788
Э 4 C-CLASS (COMMON FLARES) NUMBER-one 20.675
10 8 M-CLASS (MODERATE FLARES) NUMBER -five 18.684
11 17 X-CLASS (SEVERE FLARES) NUMBER -zero 8.824
12 13 M-CLASS (MODERATE FLARES) NUMBER -two 5.836
13 12 M-CLASS (MODERATE FLARES) NUMBER -three 1.850
14 15 X-CLASS (SEVERE FLARES) NUMBER -one 1.267
15 18 X-CLASS (SEVERE FLARES) NUMBER -two -3.220
1Є 14 M-CLASS (MODERATE FLARES) NUMBER -zero -6.629
17 8 C-CLASS (COMMON FLARES) NUMBER-zero -25.708
LlJ
Помощь Abs Prc1 Prc2 Infl Inf2 Inf3 Inf4 Inf5 IntG Inf7 График ВКЛ.Фильтр по кл.шкале ВЫКЛ.Фильтр по кл.шкале Вписать в окно Показать ВСЕ
43,2,2, Результаты кластерно-конструктивного анализа
Конструкт признака: 1 "CODE FOR CLASS (MODIFIED ZURICH CLASSJ-B" в модели: 4 "INF1"
Код Наименование признака
1 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-B...
2 CODE FOR CLASS [MODIFIED ZURICH CLASSJ-C...
3 CODE FOR CUSS (MODIFIED ZURICH CUSS)-...
4 CODE FOR CUSS (MODIFIED ZURICH CUSS)-E ..
5 CODE FOR CUSS (MODIFIED ZURICH CUSS)-F...
Є CODE FOR CUSS (MODIFIED ZURICH CUSS)-...
7 CODE FOR URGEST SPOT SIZE-A ...
8 CODE FOR URGEST SPOT SIZE-H ...
Э CODE FOR URGEST SPOT SIZE-K ...
10 CODE FOR URGEST SPOT SIZE-R ...
11 CODE FOR URGEST SPOT SIZE-S ...
12 CODE FOR URGEST SPOT SIZE-X ...
13 CODE FOR SPOT DISTRIBUTION-C ...
14 CODE FOR SPOT DISTRIBUTION-I ...
15 CODE FOR SPOT DISTRIBUTION-O ...
16 CODE FOR SPOT DISTRIBUTION-X ...
17 ACTIVITY-reduced ...
18 ACTIVITY-unchanged ...
18 EVOLUTION-decay ...
20 EVOLUTION-growth ...
21 EVOLUTION-no growth ...
22 PREVIOUS 24 HOUR FURE ACTIVITY CODE-mo...
23 PRFVIHI IS 24 НПІIR FI ARF ACTIVITY CnDF-nnt
лі ►
N- Код призна... Наименование признака Сходство _1
1 1 CODE FOR CUSS (MODIFIED ZURICH CUSS)-B ... 100.000
2 12 CODE FOR URGEST SPOT SIZE-X 99.999
3 Є CODE FOR CUSS (MODIFIED ZURICH CUSS)-H ... 83.161
4 1Є CODE FOR SPOT DISTRIBUTION-X 83.161
5 28 DID REGION BECOME HISTORICALLY COMPLEX ON THIS PASS ... 67.517
Є 2 CODE FOR CUSS (MODIFIED ZURICH CUSS)-C ... 64.746
7 10 CODE FOR URGEST SPOT SIZE-R 60.417
8 11 CODE FOR URGEST SPOT SIZE-S 27.714
9 21 EVOLUTION-no growth 23.192
10 19 EVOLUTION-decay 22.565
11 17 ACTIVITY-reduced 21.834
12 26 HIS TO RICALLY-CO M PLEX-Yes 19.522
13 15 CODE FOR SPOT DISTRIBUTION-O 11.037
23 20 EVOLUTION-growth -10.650
24 29 AREA-large -10.923
25 18 ACTIVITY-unchanged -12.282
26 9 CODE FOR URGEST SPOT SIZE-K -13.188
27 8 CODE FOR URGEST SPOT SIZE-H -16.928
28 3 CODE FOR CUSS (MODIFIED ZURICH CUSSJ-D ... -17.326
2Э 7 CODE FOR URGEST SPOT SIZE-A -22.844
30 14 CODE FOR SPOT DISTRIBUTION-I -26.152
31 24 PREVIOUS 24 HOUR FURE ACTIVITY CODE-one M1 ... -38.102
32 5 CODE FOR CUSS (MODIFIED ZURICH CUSS1-F ... -40.277
Помощь Abs Prd Prc2 Infl Inf2 Inf3
Inf5 InfB Inf7 1 График 1 ВКЛ.Фильтр по кл.шкале 1 ВЫКЛ.Фильтр по кл.шкале Вписать в окно Показать ВСЕ
Рисунок 32. Примеры экранных форм отображения результатов кластерноконструктивного анализа классов и признаков в различных моделях.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
53
Рисунок 33. Примеры семантических сетей классов без фильтра и с фильтром по уровню связи в модели INF1
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
54
Рисунок 34. Примеры семантических сетей значений факторов без фильтра и с фильтром по уровню связи в модели INF1
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
55
4.6. Когнитивные диаграммы классов и признаков
Когнитивные диаграммы классов (значений факторов) - это
графические диаграммы, позволяющие отобразить в чем конкретно состоит сходство и различие любых двух классов (или любых двух значений факторов), т.е. детально увидеть структуру каждой линии связи в семантической сети. Когнитивные диаграммы представляет собой графическое изображение обобщенного коэффициента корреляции профилей классов (или факторов), при этом каждая линия, вносящая вклад в сходство или различие соответствует одному слагаемому, ее цвет - знаку, а толщина -модулю этого слагаемого.
На рисунках 35, 36 и 37, 38 приведены примеры экранных форм задания параметров когнитивных когнитивных диаграмм классов и признаков и примеры графической визуализации этих диаграмм (соответственно).
Рисунок 35. Пример экранной формы задания параметров когнитивной
диаграммы классов в модели INF3
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
56
Рисунок 36. Пример когнитивной диаграммы классов в модели INF3
Рисунок 37. Пример экранной формы задания параметров когнитивной диаграммы признаков в модели INF 1
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
57
Рисунок 38. Пример когнитивной диаграммы признаков
в модели INF3
Заключение
Так как существует множество систем искусственного интеллекта, то возникает необходимость сопоставимой оценки качества их математических моделей. Одним из вариантов решения этой задачи является тестирование различных системы на общей базе исходных данных, для чего очень удобно использовать общедоступную базу репозитория UCI.
В данной работе приводится развернутый пример использования базы данных репозитория UCI для оценки качества математических моделей, применяемых в АСК-анализе и его программном инструментарии системе искусственного интеллекта «Эйдос».
При этом наиболее достоверной в данном приложении оказались модели INF4, основанная на семантической мере целесообразности информации А.Харкевича при интегральном критерии «Сумма знаний». Уровень достоверности прогнозирования принадлежности объекта к классу с применением данной составляет 70,194%, а достоверность прогнозирования непринадлежности объекта к классу - 81,889%, что заметно выше, чем достоверность экспертных оценок, которая считается равной около 70%.
Для оценки достоверности моделей в АСК-анализе и системе «Эйдос» используется метрика, сходная с F-критерием.
Также обращает на себя внимание, что статистические модели в данном приложении дают примерно на 21% более низкую средневзвешенную достоверность идентификации и не идентификации, чем модели знаний, что, как правило, наблюдается и в других приложениях. Этим и оправдано применение моделей знаний.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
58
Ясно, что если на основе базы данных UCI, рассмотренной в данной статье, построить модели прогнозирования не с помощью АСК-анлаиза и реализующей его системы «Эйдос», а с применением других математических методов и реализующих их программных систем, то можно сопоставимо сравнить их качество.
Данная статья может быть использована как описание лабораторной работы по дисциплинам:
- Интеллектуальные системы;
- Инженерия знаний и интеллектуальные системы;
- Интеллектуальные технологии и представление знаний;
- Представление знаний в интеллектуальных системах;
- Основы интеллектуальных систем;
- Введение в нейроматематику и методы нейронных сетей;
- Основы искусственного интеллекта;
- Интеллектуальные технологии в науке и образовании;
- Управление знаниями;
- Автоматизированный системно-когнитивный анализ и интеллектуальная система «Эйдос»;
которые автор ведет в настоящее время10, а также и в других дисциплинах, связанных с преобразованием данных в информацию, а ее в знания и применением этих знаний для решения задач идентификации, прогнозирования, принятия решений и исследования моделируемой предметной области (а это практически все дисциплины во всех областях науки).
Необходимо отметить также, что все выходные формы, формируемые системой, формируются ей в автоматизированном режиме без участия экспертов и могут быть созданы на основе моделей очень больших размерностей. Система «Эйдос» была апробирована при создании моделей с нечеткими продукциями с фиксацией результатов их работы в декларативной форме при размерностях моделей 10000 классов на 10000 признаков и с обучающей выборкой до миллиона объектов, описанных до 1500 классификационных и описательных шкал. Это в десятки миллионов раз превосходит возможности самых мощных экспертных систем, к тому же не существует экспертов и даже коллективов экспертов, способных заполнить в количественной форме базы знаний таких размерностей даже в течение всей своей жизни.
Литература
1. Луценко Е.В. Методика использования репозитария UCI для оценки качества математических моделей систем искусственного интеллекта / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар:
10 http://lc.kubagro.ru/My training schedule.doc
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
59
КубГАУ, 2003. - №02(002). С. 120 - 145. - IDA [article ID]: 0020302012. - Режим доступа: http://ej.kubagro.ru/2003/02/pdf/12.pdf, 1,625 у.п.л.
2. Луценко Е.В. АСК-анализ, моделирование и идентификация живых существ на основе их фенотипических признаков / Е.В. Луценко, Ю.Н. Пенкина // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №06(100). С. 1346 - 1395. - IDA [article ID]: 1001406090. - Режим доступа: http://ej.kubagro.ru/2014/06/pdf/90.pdf, 3,125 у.п.л.
3. Луценко Е.В. Теоретические основы, технология и инструментарий автоматизированного системно-когнитивного анализа и возможности его применения для сопоставимой оценки эффективности вузов / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №04(088). С. 340 - 359. - IDA [article ID]: 0881304022. - Режим доступа: http://ej.kubagro.ru/2013/04/pdf/22.pdf, 1,25 у.п.л.
4. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002. - 605 с.
5. Репозитарий UCI [Электронный ресурс]. Статья " Solar Flares". Режим доступа: https://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare, свободный. - Загл. с экрана. Яз. анг.
6. Сайт профессора Е.В.Луценко [Электронный ресурс]. Режим доступа: http://lc.kubagro.ru/, свободный. - Загл. с экрана. Яз. рус.
7. Луценко Е.В. 30 лет системе «Эйдос» - одной из старейших отечественных универсальных систем искусственного интеллекта, широко применяемых и развивающихся и в настоящее время / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №10(054). С. 48 -77. - Шифр Информрегистра: 0420900012\0110, IDA [article ID]: 0540910004. - Режим доступа: http://ej.kubagro.ru/2009/10/pdf/04.pdf, 1,875 у.п.л.
8. Луценко Е.В. Универсальная когнитивная аналитическая система «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2012. - №09(083). С. 328 - 356. - IDA [article ID]: 0831209025. - Режим доступа: http://ej.kubagro.ru/2012/09/pdf/25.pdf, 1,812 у.п.л.
9. Луценко Е.В. Метризация измерительных шкал различных типов и совместная сопоставимая количественная обработка разнородных факторов в системнокогнитивном анализе и системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. -№08(092). С. 859 - 883. - IDA [article ID]: 0921308058. - Режим доступа: http://ej.kubagro.ru/2013/08/pdf/58.pdf, 1,562 у.п.л.
10. Луценко Е.В. Методологические аспекты выявления, представления и использования знаний в АСК-анализе и интеллектуальной системе «Эйдос» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. - №06(070). С. 233 - 280. - Шифр Информрегистра:
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
60
0421100012\0197, IDA [article ID]: 0701106018. - Режим доступа:
http://ej.kubagro.ru/2011/06/pdf/18.pdf, 3 у.п.л.
11. Луценко Е.В. Моделирование сложных многофакторных нелинейных объектов
управления на основе фрагментированных зашумленных эмпирических данных большой размерности в системно-когнитивном анализе и интеллектуальной системе «Эй-дос-Х++» / Е.В. Луценко, В.Е. Коржаков // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2013. - №07(091). С. 164 -188. - IDA [article ID]: 0911307012. - Режим доступа:
http://ej.kubagro.ru/2013/07/pdf/12.pdf, 1,562 у.п.л.
12. Луценко Е.В. Системно-когнитивный анализ как развитие концепции смысла Шенка - Абельсона / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2004. - №03(005). С. 44 - 65. - IDA [article ID]: 0050403004. - Режим доступа: http://ej.kubagro.ru/2004/03/pdf/04.pdf, 1,375
у.п.л.
13. Луценко Е.В. Количественный автоматизированный SWOT- и PEST-анализ средствами АСК-анализа и интеллектуальной системы «Эйдос-Х++» / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №07(101). С. 1368 - 1410. - IDA [article ID]: 1011407090. - Режим доступа: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 у.п.л.
14. Луценко Е.В. Системная теория информации и нелокальные интерпретируемые нейронные сети прямого счета / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2003. -№01(001). С. 79 - 91. - IDA [article ID]: 0010301011. - Режим доступа: http://ej.kubagro.ru/2003/01/pdf/11.pdf, 0,812 у.п.л.
15. Луценко Е.В. Автоматизированная система распознавания образов, математическая модель и опыт применения. В сб.: "В.И.Вернадский и современность (к 130-летию со дня рождения)". Тезисы научно-практической конференции. - Краснодар: КНА, 1993. - С. 37-42.
16. Луценко Е.В. Когнитивные функции как обобщение классического понятия функциональной зависимости на основе теории информации в системной нечеткой интервальной математике / Е.В. Луценко, А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. -№01(095). С. 122 - 183. - IDA [article ID]: 0951401007. - Режим доступа: http://ej.kubagro.ru/2014/01/pdf/07.pdf, 3,875 у.п.л.
17. Луценко Е.В. Прогнозирование продолжительности жизни пациентов, перенесших сердечный приступ, по данным эхокардиограммы на основе базы данных репозитория UCI / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №08(102). С. 1282 - 1328. - IDA [article ID]: 1021408082. - Режим доступа: http://ej.kubagro.ru/2014/08/pdf/82.pdf, 2,938 у.п.л.
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
61
Literatura
1. Lucenko E.V. Metodika ispol'zovanija repozitarija UCI dlja ocenki kachestva matematicheskih modelej sistem iskusstvennogo intellekta / E.V. Lucenko // Polite-maticheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo ag-rarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU,
2003. - №02(002). S. 120 - 145. - IDA [article ID]: 0020302012. - Rezhim dostu-pa: http://ej.kubagro.ru/2003/02/pdf/12.pdf, 1,625 u.p.l.
2. Lucenko E.V. ASK-analiz, modelirovanie i identifikacija zhivyh sushhestv na
osnove ih fenotipicheskih priznakov / E.V. Lucenko, Ju.N. Penkina // Politematiche-skij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: Kub-GAU, 2014. -
№06(100). S. 1346 - 1395. - IDA [article ID]: 1001406090. - Rezhim dostu-pa:
http://ej.kubagro.ru/2014/06/pdf/90.pdf, 3,125 u.p.l.
3. Lucenko E.V. Teoreticheskie osnovy, tehnologija i instrumentarij avtomati-
zirovannogo sistemno-kognitivnogo analiza i vozmozhnosti ego primenenija dlja so-postavimoj ocenki jeffektivnosti vuzov / E.V. Lucenko, V.E. Korzhakov // Politema-ticheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarno-go universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: Kub-GAU, 2013. -
№04(088). S. 340 - 359. - IDA [article ID]: 0881304022. - Rezhim dostupa:
http://ej.kubagro.ru/2013/04/pdf/22.pdf, 1,25 u.p.l.
4. Lucenko E.V. Avtomatizirovannyj sistemno-kognitivnyj analiz v upravle-nii
aktivnymi ob#ektami (sistemnaja teorija informacii i ee primenenie v issledo-vanii jekonomicheskih, social'no-psihologicheskih, tehnologicheskih i organizacion-no-tehnicheskih sistem): Monografija (nauchnoe izdanie). - Krasnodar: KubGAU. 2002. - 605 s.
5. Repozitarij UCI [Jelektronnyj resurs]. Stat'ja " Solar Flares". Rezhim dostupa: https://archive.ics.uci.edu/ml/machine-learning-databases/solar-flare, svobodnyj. - Zagl. s jekrana. Jaz. ang.
6. Sajt professora E.V.Lucenko [Jelektronnyj resurs]. Rezhim dostupa:
http://lc.kubagro.ru/, svobodnyj. - Zagl. s jekrana. Jaz. rus.
7. Lucenko E.V. 30 let sisteme «Jejdos» - odnoj iz starejshih otechestvennyh
universal'nyh sistem iskusstvennogo intellekta, shiroko primenjaemyh i razvivaju-shhihsja i v nastojashhee vremja / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhur-nal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2009. - №10(054). S. 48 - 77. - Shifr Informregistra: 0420900012\0110, IDA [article ID]: 0540910004. - Rezhim dostupa: http://ej.kubagro.ru/2009/10/pdf/04.pdf, 1,875 u.p.l.
8. Lucenko E.V. Universal'naja kognitivnaja analiticheskaja sistema «Jejdos-H++» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Ku-banskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelek-tronnyj resurs]. - Krasnodar: KubGAU, 2012. - №09(083). S. 328 - 356. - IDA [article ID]: 0831209025. -Rezhim dostupa: http://ej.kubagro.ru/2012/09/pdf/25.pdf, 1,812 u.p.l.
9. Lucenko E.V. Metrizacija izmeritel'nyh shkal razlichnyh tipov i sovmestnaja sopostavimaja kolichestvennaja obrabotka raznorodnyh faktorov v sistemno-kognitivnom analize i sisteme «Jejdos» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №08(092). S. 859 - 883. - IDA [article ID]: 0921308058. - Rezhim dostupa: http://ej.kubagro.ru/2013/08/pdf/58.pdf, 1,562 u.p.l.
10. Lucenko E.V. Metodologicheskie aspekty vyjavlenija, predstavlenija i ispol'zovanija znanij v ASK-analize i intellektual'noj sisteme «Jejdos» / E.V. Lucenko //
http://ej.kubagro.ru/2014/10/pdf/99.pdf
Научный журнал КубГАУ, №104(10), 2014 года
62
Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvenno-go agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Kras-nodar: KubGAU, 2011. - №06(070). S. 233 - 280. - Shifr Informregistra: 0421100012\0197, IDA [article ID]: 0701106018. - Rezhim dostupa: http://ej.kubagro.ru/2011/06/pdf/18.pdf, 3 u.p.l.
11. Lucenko E.V. Modelirovanie slozhnyh mnogofaktornyh nelinejnyh ob#ektov upravlenija na osnove fragmentirovannyh zashumlennyh jempiricheskih dannyh bol'-shoj razmernosti v sistemno-kognitivnom analize i intellektual'noj sisteme «Jej-dos-H++» / E.V. Lucenko, V.E. Korzhakov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhur-nal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2013. - №07(091). S. 164 - 188. - IDA [article ID]: 0911307012. - Rezhim dostupa: http://ej.kubagro.ru/2013/07/pdf/12.pdf, 1,562 u.p.l.
12. Lucenko E.V. Sistemno-kognitivnyj analiz kak razvitie koncepcii smysla Shenka -Abel'sona / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal Kub-GAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2004. - №03(005). S. 44 - 65. - IDA [article ID]: 0050403004. - Rezhim dostupa: http://ej.kubagro.ru/2004/03/pdf/04.pdf, 1,375 u.p.l.
13. Lucenko E.V. Kolichestvennyj avtomatizirovannyj SWOT- i PEST-analiz sredstvami ASK-analiza i intellektual'noj sistemy «Jejdos-H++» / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvenno-go agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Kras-nodar: KubGAU, 2014. - №07(101). S. 1368 - 1410. - IDA [article ID]: 1011407090. - Re-zhim dostupa: http://ej.kubagro.ru/2014/07/pdf/90.pdf, 2,688 u.p.l.
14. Lucenko E.V. Sistemnaja teorija informacii i nelokal'nye interpretirue-mye nejronnye seti prjamogo scheta / E.V. Lucenko // Politematicheskij setevoj jelek-tronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Na-uchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2003. - №01(001). S. 79 - 91. -IDA [article ID]: 0010301011. - Rezhim dostupa: http://ej.kubagro.ru/2003/01/pdf/11.pdf, 0,812 u.p.l.
15. Lucenko E.V. Avtomatizirovannaja sistema raspoznavanija obrazov, matemati-cheskaja model' i opyt primenenija. V sb.: "V.I.Vernadskij i sovremennost' (k 130-letiju so dnja rozhdenija)". Tezisy nauchno-prakticheskoj konferencii. - Krasnodar: KNA, 1993. - S. 37-42.
16. Lucenko E.V. Kognitivnye funkcii kak obobshhenie klassicheskogo ponjatija funkcional'noj zavisimosti na osnove teorii informacii v sistemnoj nechetkoj in-terval'noj matematike / E.V. Lucenko, A.I. Orlov // Politematicheskij setevoj jelek-tronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Na-uchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №01(095). S. 122 - 183. - IDA [article ID]: 0951401007. - Rezhim dostupa: http://ej.kubagro.ru/2014/01/pdf/07.pdf, 3,875 u.p.l.
17. Lucenko E.V. Prognozirovanie prodolzhitel'nosti zhizni pacientov, pere-nesshih serdechnyj pristup, po dannym jehokardiogrammy na osnove bazy dannyh repo-zitorija UCI / E.V. Lucenko // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs].
- Krasnodar: KubGAU, 2014. - №08(102). S. 1282 - 1328. - IDA [article ID]: 1021408082.
- Rezhim dostupa: http://ej.kubagro.ru/2014/08/pdf/82.pdf, 2,938 u.p.l.
http://ej.kubagro.ru/2014/10/pdf/99.pdf