УДК 303.732.4
РАЗВИТИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ «ЭЙДОС-АСТРА» СНИМАЮЩЕЕ ОГРАНИЧЕНИЯ НА РАЗМЕРНОСТЬ БАЗ ЗНАНИЙ И РАЗРЕШЕНИЕ КОГНИТИВНЫХ ФУНКЦИЙ
Луценко Евгений Вениаминович д.э.н., к.т.н., профессор
Кубанский государственный аграрный университет, Краснодар, Россия
Трунев Александр Петрович к. ф.-м. н., Ph.D.
Директор, A&E Trounev IT Consulting, Торонто, Канада
UDC 303.732.4
DEVELOPMENT OF THE ARTIFICIAL INTELLIGENCE SYSTEM "AIDOS-ASTRA” WITHOUT DATA BASE DIMENSION RESTRICTIONS AND COGNITIVE FUNCTIONS RESOLUTION
Lutsenko Evgeny Veniaminovich Dr. Sci.Econ., Cand. Tech.Sci., professor
Kuban State Agrarian University, Krasnodar, Russia
Alexander Trunev Cand.Phys.-Math.Sci., Ph.D.
Director, A&E Trounev IT Consulting, Toronto, Canada
Трунев Евгений Александрович , Eugene Trounev,
Разработчик операционных систем, Торонто, Software developer, Toronto, Canada
Канада
В статье рассматривается новая версия системы искусственного интеллекта «Эйдос-астра» для решения прикладных задач с эмпирическими данными большой размерности. Приложение, написанное на языке JAVA, обеспечивает GUI и позволяет подготовить и выполнить визуализацию матрицы информативностей без ограничений, налагаемых реализацией предыдущих версий системы «Эйдос-астра».
Ключевые слова: АВТОМАТИЗИРОВАННЫЙ СИСТЕМНО-КОГНИТИВНЫЙ АНАЛИЗ, БАЗА ЗНАНИЙ, КОГНИТИВНАЯ ФУНКЦИЯ, СЕМАНТИЧЕСКАЯ ИНФОРМАЦИОННАЯ МОДЕЛЬ
The article discusses the expansion of artificial intelligence "Aidos-Astra" for applications with the empirical data of high dimensionality. Application, written in the language JAVA, allows you to prepare and visualize the information content of the matrix without restrictions imposed by the architecture of the system "Aidos-Astra "
Keywords: COMPUTERIZED SYSTEM-COGNITIVE ANALYSIS, KNOWLEDGE BASE, COGNITIVE FUNCTION, SEMANTIC INFORMATION MODEL
Краткая предыстория исследований
Автоматизированный системно-когнитивный анализ /1/ и его инструментарий - базовая система «Эйдос» /2/ получили широкое применение в решении ряда задач, связанных выявлением знаний из эмпирических данных большой размерности и решением на их основе задач идентификации, прогнозирования, принятия решений и исследования предметной области. Как известно из теории управления поведение любой системы определяется состоянием самой системы (внутренними факторами и ее предысторией), управляющими (технологическими) факторами, а также воздействием окружающей среды. Не являются исключением и глобальные геосистемы: ноосфера (глобальные социально-экономические процессы), биосфера, геосфера, магнитосфера, атмосфера и другие, для которых внешней средой, с которой эти системы входят в непосредственное взаимодействие, является ближайшее космическое окружение нашей планеты, т.е. различные космические тела, входящие в состав Солнечной системы. Задачи математического моделирования влияния небесных тел Солнечной системы на глобальные геоситемы отличаются большой размерностью как по ис-
ходным базам данных, так и по создаваемым в процессе моделирования информационным базам и базам знаний..
Для решения этих задач была создана система «Эйдос-астра» /3-4/, позволяющая автоматически генерировать различные системы частных моделей (мультимодели), исследовать их на достоверность в разрезе по классам и с учетом этой информации наиболее эффективно использовать их для идентификации и прогозирования. Первоначально исследования авторов были посвящены выявлению и исследованию зависимости социального статуса респондентов (которых было коло 30 тысяч) от состояния космической среды на момент их рождения /16, 17, 18, 19/. Со временем проблематика исследований расширилась и преобразовалась в целое новое научное направление: «Применение технологий искусственного интеллекта для исследования влияния космической среды на поведение активных глобальных геосистем» /5/.
В качестве современной автоматизированной интеллектуальной технологии авторы применили автоматизированный системно-когнитивный анализ (АСК-анализ) и его программный инструментарий - универсальную когнитивную аналитическую систему "Эйдос" /1-2/. В состав этой системы входит подсистема _15, содержащая ряд стандартных программных интерфейсов с внешними источниками данных различных стандартов: текстовых, баз данных (БД) и графических, расширяющих сферу ее применения. Некоторые из подобных интерфейсов при своем развитии преобразовались в системы окружения, которые выполняли больше функций,
чем программный интрефейс____152, но использовались совместно с базовой
системой «Эйдос. Первоначально авторами исследования проводились с применением именно этого программного интерфейса с исходными базами данных и базовой системы «Эйдос». При этом было разработано много программных интерфейсов с различными внешними базами исходных данных, создано и исследовано большое количество различных моделей. Со временем процесс генерации системы моделей, их исследования на достоверность в разрезе по категориям, а также их использования для решения задач идентификации, был автоматизирован, что и привело к созданию системы окружения «Эйдос-астра» [5], которая включила в себя также все ранее специализированные программные интерфейсы и специальный модуль визуализации когнитивных функций [27].
В настоящее время система «Эйдос-астра» приобрела функциональную полноту и превратилась в самостоятельный инструмент исследования, который может применяться как совместно с базовой системой «Эйдос», так и независимо от нее.
Постановка проблемы, решаемой в работе
Базовая система «Эйдос» [31] была создана еще до создания операционной системы ’^пёо,№8 (в 1994 году на нее уже было получено 3 патента). В то время трудно было себе представить, что когда-то в будущем
может потребоваться более 4000 классов распознавания и 4000 признаков и были приняты технические решения, связанные с повышением быстродействия путем организации внутреннего кэширования, которые привели к соответствующему ограничению на размерности создаваемых моделей. Когда создавалась система «Эйдос-астра», то при этом очень широко использовались библиотеки процедур и функций системы «Эйдос» (и не очень много внимания уделялось интерфейсу), что привело к наличию в системе «Эйдос-астра» тех же ограничений на размерности моделей, что и в системе «Эйдос». Эти ограничения создали определенные трудности в анализе задач большой размерности, связанных, например, с анализом влияния небесных тел на сейсмические события, движение полюса Земли и магнитное поле /7-11/.
Справедливости ради необходимо отметить, что первоначально система «Эйдос-астра» разрабатывалась как инструмент для проверки научных гипотез о существовании зависимостей между параметрами космической среды и глобальными процессами ноосфере Земли и этой цели она вполне соответствовала. Кроме того указанные выше недостатки базовой системы «Эйдос» и системы «Эйдос-астра» легко преодолеваются (без переписывания исходного текста) путем использования новых версий языка программирования, на котором они были написаны (Alaska xBase++, Arctica).
Идея и путь решения поставленной проблемы
Идея решения сформулированной проблемы состоит в использовании новых перспективных средств разработки новой версии системы “Эйдос-астра».
При этом использование различных инструментальных средств имеет свои плюсы и минусы.
В частности использование Alaska xBase++ или Arctica позволяет максимально использовать уже существующий исходный текст базовой системы «Эйдос» и систем окружения и за счет этого существенно сократить трудоемкость и длительность разработки, а это очень важно, т.к. распечатка этого исходного текста 6-м шрифтом составляет около 800 страниц. Отметим, что базовая система «Эйдос» реализована в универсальной постановке, не зависящей от предметной области, а ее привязка к конкретным областям осуществляется на уровне адаптации и пересинтеза приложений, а также с использованием полнофункционального набора программных интерфейсов с внешними базами данных и различных систем окружения [1, 5, 31].
В качестве пути решения сформулированной проблемы авторами принято решение о разработке новой версии системы «Эйдос-астра» с использованием языка Java.
Java1 - это чрезвычайно перспективный язык программирования, использование которого для данной цели вполне оправданно и обоснованно не смотря на то, трудоемкость разработки выше, чем на Alaska xBase++ или Arctica, т.к. приходится не переносить существующий исходный текст, а писать исходный текст практически «с нуля».
Принято решение о реализации в новой версии данной системы всех функций существующей версии, но без ограничений на размерность моделей и в GUI, а затем о реализации в ней качественно новых возможностей, принципиально нереализуемых с применением ранее использовавшегося инструментария. По сути, идет речь не о переносе системы «Эйдос-астра» в существующей постановке, но с преодолением ограничений на размерность моделей и недостатков интерфейса, а о разработке качественно новой версии этой системы с сохранением всего лучшего, что было достигнуто в предыдущих версиях.
Первые версии системы «Эйдос-Java» уже созданы и тщательно протестированы на задачах, ранее решенных с помощью предыдущих версий системы «Эйдос-астра». Было продемонстрировано полное тождество полученных результатов, а также получены качественно новые результаты, ради которых и создавалась система. В частности были сняты ограничения на размерность модели с М173 до М36000 и по числу входных параметров с 23 до 253. Отметим, что указанные новые ограничения параметров являются условными и определяются только типом выбранных форматов файлов входных данных и оперативной памятью. Расширение системы выполнено в виде отдельного приложения ViewVibejar /12/, написанного на языке Java, снабженного блоком графической визуализации расчетных матриц, включая матрицу информативностей. Приложение ViewVibejar ориентировано на решение естественно-научных, социальноэкономических и психологических задач, связанных с распознаванием событий по астрономическим данным, описанных в работах /7-11, 13-22/ и других.
Далее рассмотрим некоторые результаты исследований, проведенных с применением системы «Эйдос-Java».
Матрица информативностей в задаче о распознавании категорий событий в поле центральных сил
Рассмотрим задачу распознавания категорий по астрономическим данным /5, 7-11/. Имеется множество событий Е, которому ставится в соответствие множество категорий К Событиями можно считать, например, землетрясения, происходящие на нашей планете ежедневно, а категориями
- число одно- (А), двух- (В) или трехкратных событий (С), магнитуда которых лежит в заданном интервале. Каждое такое событие характеризуется моментом времени и географическими координатами места его происхож-
http ://java. com/ru/download/faq/whatis java. xml
примем это рабочее название для Java-версии системы «Эйдос-астра»
дения. По этим данным можно построить матрицу, содержащую координаты небесных тел, например углы долготы, широты и расстояния. Будем считать, что заданы частотные распределения N - число событий, имеющих отношение к данной категории К
Определим число случаев реализации данной категории, которое приходится на заданный интервал изменения астрономических параметров, имеем в дискретном случае:
Nij (х], к) = Niw(x], к)Дх, х] < ~]. < х + Дх 1 £ i £ п, 1 £ j £ 2т, к = 1,...,к0 ^
Здесь w - плотность распределения событий вдоль нормированной координаты. Нормированная переменная определяется через угловую и радиальную координаты следующим образом:
Ф] (к)/2р, 1 £ j £ т
хк =
Г ( к ) ~ Гп,.п( к )
Гпах (к ) - Гтт ( к )
где Гтах
минимальное и максимальное удаление планеты от центра
масс системы, к0 - число небесных тел, используемых в задаче.
Определим матрицу информативностей согласно /1/
N/ X N
] = 0, Щ] (Хк) = 0
Ул ]к'
1 ^ 1 ^
—X I -—XI
/ у ] / у ]
п / ^ п~ 0
(2)
1 £ / £ п, 1 £ ] £ 2т, 1 £ к £ к0
Первая величина (2) называется информативность признака, а вторая величина является стандартным отклонением информативности или интегральной информативностью (ИИ).
Рассмотрим связь информативности со статистикой хи-вкадрат
Статистика с представляет собой сумму вероятностей совместного наблюдения признаков и объектов по всей корреляционной матрице или
3 См.: Ь11р://^^^'.тасЫпе1еатша.ги/^1к1/1Мех.рЬр?Щ1е=Таблица%20сопряженности
определенным ее подматрицам (т.е. сумму относительных отклонений частот совместного наблюдения признаков и объектов от среднего) [2, п.3.4]4:
г м (N.. - г)2
” - (3)
ж2=хх
7=1 І=1
і
где:
- N. - фактическое количество встреч .-го признака у объектов]-го класса;
- г - теоретически ожидаемое количество встреч .-го признака у объектов ]-го класса.
і =
N
(4)
Нельзя не обратить внимание на то, что статистика С математически простым образом связана с количеством информации в системе признаков о классе распознавания, в соответствии с системным обобщением формулы Харкевича для плотности информации (5):
4 = ь°8.
NN.
(5)
а именно из (4) и (5) получаем:
(6)
Выражение (6) для количественной меры знаний, полученное в и используемое в автоматизированном системно-когнитивном анализе (АСК-анализ), является чрезвычайно важным. По сути, его смысл в том, что количественная мера знаний представляет собой результат сравнения фактически наблюдаемой абсолютной частоты N. встреч .-го признака у объектов ]-го класса с теоретически ожидаемой частотой его встреч г (4) в соответствии с анализом хи-квадрат, которая и выступает в качестве нормы или базы сравнения. Это сравнение в выражении (6) осуществляется путем вычисления отношения фактически наблюдаемой абсолютной частоты N. встреч .-го признака у объектов ]-го класса с теоретически ожидаемой частотой его встреч г. Если при использовании критерия хи-квадрат в качестве фильтра предлагается не использовать для дальнейшего анализа фактически наблюдаемые частоты, меньшие теоретически ожидаемых как недос-
Отметим, что в базовой системе «Эйдос» [31] имеются развитие средства анализа хи-квадрат.
товерные, то в АСК-анализе эти значения используются и интерпретируются совершенно иначе: не как недостоверные, а как достоверно отражающие отрицательную причинно-следственную зависимость5, т.к. дают, как легко видеть из выражения (6) отрицательное количество информации: I. < 0. Поэтому применение фильтра хи-квадрат для отсеивания «недостоверной» информации эквивалентно исключению отрицательных информативностей из базы знаний. Соответственно исчезает возможность построения негативных когнитивных функций [30]. Фактически применяемая в АСК-анлизе количественная мера знаний детально показывает как образуется значение критерия хи-квадрат.
Из (6) очевидно:
1] = ¥(^2- ^2г) (7)
Сравнивая выражения (3) и (7), видим, что числитель в выражении (3) под знаком суммы отличается от выражения (7) только тем, что в выражении (7) вместо значений N. и г взяты их логарифмы, т.е. по сути, отличаются только единицей измерения. Поскольку логарифм является монотонно возрастающей функцией аргумента, то введение логарифма не меняет общего характера поведения функции.
Фактически это означает, что:
если N. < г то с] > 0, I. < 0
У ЛУ 5 У
< если N. = г то с] = 0, Iн = 0 (8)
если N. > г то с] > 0, I. > 0
У Л'1] 5 У
Если фактическая вероятность наблюдения .-го признака при предъявлении объекта ]-го класса равна теоретически ожидаемой (средней), то наблюдение этого признака не несет никакой информации о принадлежности объекта к данному классу. Если же она выше средней
- то это говорит в пользу того, что предъявлен объект данного класса, если же ниже - то другого.
Поэтому наличие статистической связи (информации) между признаками и классами распознавания, т.е. отличие вероятностей их со-
5 Когда е значение фактора не способствует, а препятствует переходу объекта в]-е состояние. Отметим, что математическая форма выражения (3) (а именно: квадрат) предусматривает и учет фактических абсолютных частот, меньших теоретических, как отражающих причинно-следственные связи. Тем ни менее традиционная интерпретация предполагает достоверными только фактические абсолютные частоты, большие теоретических
вместных наблюдений от предсказываемого в соответствии со случайным нормальным распределением, приводит к увеличению фактической
Таким образом, применяемая в автоматизированном системнокогнитивном анализе количественная мера силы и направления причинноследственной связи между факторами и поведением объекта (его переходами в состояния, соответствующие классам), т.е. информативность или количественная мера знаний (2) тесно связана с классическим критерием наличия статистически значимой связи хи-квадрат и можно обоснованно утверждать, что она не только не противоречит ему, но и в определенной степени основана на нем и является его развитием. Однако информативность представляется более развитым критерием, т.к. отражает не только наличие и силу связи, как хи-квадрат (8), но и ее знак, и главное — ее форму, т.е. сам вид зависимости [30]. Кроме того, использование в качестве количественной меры силы и направления связи количества информации позволяет привлечь хорошо развитые представления теории информации для исследования причинно-следственных зависимостей.
Связь между критерием хи-квадрат и когнитивными функциями
Частично-редуцированные когнитивные функции [30] строятся по максимуму информативности, т.е. по сути, по наиболее достоверным данным, если для оценки их достоверности использовать критерий хи-квадрат. Поэтому можно обоснованно ожидать, что использование критерия хи-квадрат в качестве фильтра достоверных данных даст результаты, сходные с результатами, приведенными в работе [30], однако приведет к потере существенной информации об отрицательных причинно-следственных зависимостях, визуализируемых в виде негативных когнитивных функций (уменьшится контрастность их визуализации).
Из вышесказанного следует возможность использования в качестве количественной меры степени выраженности закономерностей в предметной области использовать не матрицу абсолютных частот и меру %2, а новую меру, основанную на матрице информативностей и системном обобщении формулы Харкевича для количества информации:
статистики С по сравнению с теоретической величиной.
где:
ж м
- средняя информативность признаков по матрице информативностей.
Значение данной меры показывает среднее отличие количества информации в факторах о будущих состояниях активного объекта управления от среднего количества информации в факторе (которое при больших выборках близко к 0). По своей математической форме эта мера сходна с мерами для значимости факторов и степени сформированности образов классов и коррелирует с объемом когнитивного пространства классов и пространства атрибутов.
Описанная выше математическая модель обеспечивает инвариантность результатов обучения Системы относительно следующих параметров обучающей выборки:
1. Суммарное количество и порядок ввода анкет обучающей выборки.
2. Количество анкет обучающей выборки по каждому классу распознавания.
3. Суммарное количество признаков во всех анкетах обучающей выборки.
4. Суммарное количество признаков по эталонным описаниям различных классов распознавания.
5. Количество признаков и их порядок в отдельных анкетах обучающей выборки.
Это обеспечивает высокое качество решения задач системой распознавания на неполных и разнородных (в вышеперечисленных аспектах) данных как обучающей, так и распознаваемой выборки, т.е. при таких статистических характеристиках потоков этих данных, которые чаще всего и встречается на практике и которыми невозможно или очень сложно управлять.
Каждой категории можно сопоставить вектор информативности астрономических параметров размерности 2тк0, составленный из элементов матрицы информативности, путем последовательной записи столбцов, соответствующих нормированной координате, в один столбец, т.е.
С другой стороны, процесс идентификации, распознавания и прогнозирования может рассматриваться как разложение вектора распознаваемого объекта в ряд по векторам категорий (классов распознавания) /1, 5, 711/. Этот вектор, состоящий из единиц и нулей, можно определить по координатам небесных тел, соответствующих дате и месту происхождения события l в виде
1, (J -1)Лх < Xjk (l) < jDx, jk - s
_0, 1 < s < 2mk0 (11)
Таким образом, если нормированная координата небесного тела из данных по объекту исследуемой выборки попадает в заданный интервал, элементу вектора придается значение 1, а во всех остальных случаях - значение 0. Перечисление координат осуществляется последовательно, для каждого небесного тела. В качестве астрономических параметров в работах /7-11/ и других были использованы долгота, широта и расстояние от Земли до десяти небесных тел - Солнца, Луны, Марса, Меркурия, Венеры, Юпитера, Сатурна, Урана, Нептуна и Плутона, и долгота Северного Узла Луны.
В некоторых задачах возникает необходимость исследования совместного влияния небесных тел и местных параметров, типа координат и угловой скорости движения полюса Земли, индукции магнитного поля по измерениям на разных станциях, гравитационного потенциала, числа пятен на Солнце и т.п. на сейсмические события /7-12/.
В работах /13-15/ была построена модель линейной регрессии, описывающая движение полюса Земли, с использованием комбинаций астрономических параметров, характеризующих влияние каждого небесного тела в виде:
р - sin LAT. cos J Pi1 -'
Ri Ri
cos LAT, sin LON. sin J (12.1)
7 cos LAT. cos LON.
Pi 3 - k------------l---------------L
i3 i R
k - sin J cos LAT, sin LON + cos sin LAT,, i -1,2,...,10
P\1 = Q.(- cos Je cosLATt sinLONi + sin Je sinLATt)/R2 Q ^ cos LATi sin LONi
p\2 = Qi cos J----------~2-------L
Ri
' (12.2) . cos LAT. cos LONi
p\з = Qi sin J----------~2-------L
Ri
i = 1,2,...,10
Здесь долгота (LON), широта (LAT) и расстояние (R) определяется для каждого из 10 небесных тел, Je = 23,439291°- угол наклона земной
оси относительно нормали к орбитальной плоскости, Qi - заряды небесных тел.
Отметим, что данные для расстояний от Земли до небесных тел вычисляются в формулах (12) в астрономических единицах. Параметры (12.1), (12.2) были использованы в настоящей работе наряду с астрономическими параметрами.
При создании моделей в настоящей работе были использованы данные ежедневного числа солнечных пятен по наблюдениям американских астрономов /23/ - параметр RADAILY, данные по индукции магнитного поля Земли /24/, данные по сейсмическим событиям /25/, а также координаты географического полюса - X, Y /26/. Данные по индукции магнитного поля были взяты со следующих 23 станций (приведены только IAGA коды): GNA, GUA, IRT, KAK, MMB, RES, THL, DRV, HER, FUG, ABG, HON, CLF, LRV, SOD, AAE, AAA, TAN, SJG, AIA, TUC, BNG, MBO.
Решение прямой задачи включает в себя нормирование входных параметров и приведение их к одному масштабу изменения в интервале (0;360), разбиение интервалов на М частей, 2<M<36200, вычисление матрицы абсолютных частот и информативности, в соответствии с формулами (1-2). Вопросы визуализации матрицы информативностей и построение различных когнитивных функций рассмотрены в работах /27-28/ и других.
Описание программы
Программа ViewVibe.jar написана на языке Java и может быть использована на компьютерах с ОС типа Linux, Windows XP и выше. Скриншот основного меню программы приведен на рис. 1. Работа начинается с загрузки данных (кнопка Load Data Table) из файла типа книги Excel с двумя страницами. На первой странице файла данных перечислены имена категорий, а на второй странице задаются номера и имена строк, категории и столбцы входных параметров - рис. 2.
■ VisuVibe - C:\Documents and Settings\Alex\Desktop\WV\WV2\Abankall_ER.xls 030
Controls SUM_ON-InfTable(SUM) SUNLON-ABS Table
_ist of available tables
L Load Data Table HI Select all tables
0 Compute SUM.ON (save XLS ] Render Л
vsvADb
N umber of Intervals: 1 1 Compute SUNLAT С1 ABS SUM PRC • f(SUM) f(PRC) Save XLS | Render |
160 1 1 Compute St№IST Gabs С' sum PRC • f(SUM) f(PRC) Save XLS ] Render |
1 1 Compute MOONLON ABS SUM PRC • f(SUM) f(PRC) Save XLS | | Render [
Compute Selected
Runtime information: □ Compute MOONLAT Gabs (.'sum PRC • f(SUM) f(PRC) Save XLS | ] Render |
Processed table information: {cats=236, rowcats= 16032, columns=63, intervals= 160, rows= 16032} 1 1 Compute MOONDIST Cabs SUM PRC • f(SUM) f(PRC) Save XLS | | Render [
1 1 Compute MERCURYLON Gabs С' sum PRC • f(SUM) f(PRC) Save XLS | Render |
□ Compute MERCURYLAT С ABS SUM PRC • f(SUM) f(PRC) Save XLS | | Render
1 1 Compute MERCURYDIS Gabs С ■ sum PRC • f(SUM) f(PRC) Save XLS ] Render |
Memory consumption information: 1 1 Compute VENUSLON О ABS SUM PRC • f(SUM) f(PRC) Save XLS | | Render [
{2.1040696868 } 1 1 Compute VENUSLAT Gabs С' sum PRC • f(SUM) f(PRC) Save XLS ] Render |
1 1 Compute VENUSDIST C'ABS SUM PRC • f(SUM) f(PRC) Save XLS | | Render [
1
Рис. 1. Скриншот программы ViewVibe.jar
С Microsoft Excel - Abankall_EI *_X _ П X
File Edit View Insert Format Tools Data Window Help Type a question for help ». _ в X
I □ Z - (jtf) 100% - Щ \ Arial - 10 xll L U m Ш E Ш ▼ i* ▼ Д -
A1 ▼ fx N1
A' 6 с D E F -
1 N1 |N2
2 1 SC :A1-X=-0,29609 —:
3 2 SC :A2-X=-0,28609
4 ■■■3 SC:A3-X=-0,27609
5 4 SC A4-X=-0,26609
6 5 SC :A5-X=-0,25609
7 f SC :A6-X=-0,24609
8 7 SC:A7-X=-0,23609
9 Щ S С: A8-X =-0,22609
10 Щ SC:A9-X=-0,21609
11 10 SC :A10-X=-0,20609
12 11 SC :A11-X=-0,19609
13 12 SC: A12-X=-0,18609
14 13- SC :A13-X=-0,17609
15 14 SC :A14-X=-0,16609
16 15 SC :A15-X=-0,15609
17 16 SC :A16-X=-0,14609 m
M 4 ► M \ VNEWPF/ Abankall / J<Il =JL - I > i
Ready NUM
О Microsoft Excel - Abankall ER
Eile Edit \$ew Insert Format Tools Qata Window fcjeip
і J j Z ▼ ^ 100%
1 ■ Arial
.10 7.1 B
I U
■ Type a question for help
_ s
- ж
BM5
ft
0.00190000000000001
А В ш D '
1 ID NAME CATS1 SUNLON SUNLAT
2 1 09:02 1963 A13:B32:C40:D37 320.0163486987710 -0,0
■:3. 2 10:02 1963 A13:B32:C40:D37 321.0281621052010 -0,0
4 .3 11:02 1963 A13:B32:C41:D37 322.0396282292110 -0,0
5 4 12:02 1963 A13:B32:C40:D37 323.0507556897180 -0,0
6 5 13:02 1963 A13:B32:C41:D37 324,0615515920590 -0,0
7 6 14:02 1963 A14:B32:C41:D37 325.0720209176110 -0,0
8 7 15:02 1963 A14:B32:C41 :D37 326.0821660960550 -0,0
9 ш 16:02 1963 A14:B33:C41 :D36 327.0919866910990 -0,0
10 9 17:02 1963 A14:B33:C41:D37 328.1014791444830 -0,0
11 10 18:02 1963 A14:B33:C41:D37 329,1106364828810 -0,0
12 11 19:02 1963 A15:B33:C41 :D36 330.1194478509500 -0,0
13 12 20:02 1963 A15:B33:C41:D37 331.1278978932240 -0,0
14 13" 21:02 1963 A15:B33:C41:D36 332.1359663387060 -0,0
15 14 22:02 1963 A15:B33:C41:D36 333.1436284262530 -0,0
16 15 23:02 1963 A15:B34:C41 :D37 334.1508566036650 -0,0
17 16 24:02 1963 A16:B34:C41:D36 335.1576232309430 -0,0
и ► И \ NEWPF \Abankall/ r< > I
і
Ready
NUM
Рис. 2. Вид первой и второй страниц файла загрузки
При загрузке данные нормируются в соответствии с формулами (1) для приведения данных к одной шкале. После этого программа готова к вычислениям. На этом этапе необходимо задать число интервалов (номер модели) в окне Number of Intervals. По формулам (2) вычисляется матрица частот и матрица информативности, а также служебные матрицы, используемые в алгоритмах СИМ1 и СИМ2 /1/. Вычисления можно производить для всех или только выбранных столбцов входных параметров путем пометки соответствующего окна и запуска Compute Selected.
После вычислений активируются окна основных и служебных матриц ABS, SUM, PRC, f(SUM), f(PRC). Каждую из матриц можно сохранить в формате XLS, путем нажатия кнопки Save XLS, а также создать на ее основе изображение процесса, путем нажатия кнопки Render. Путь ко всем созданным программой изображениям сохраняется на верхней панели -рис. 1. Таким образом, можно сравнивать изображения, полученные на основе различных матриц и в различных моделях - рис. 3. При переходе по любому из путей открывается изображение вместе с панелью редактирования и кнопкой возврата в основное меню (Controls). На рис 3 представлен скриншот рабочего окна программы визуализации матриц ABS, SUM, PRC, f(SUM), f(PRC). Окно содержит две полосы прокрутки для просмотра изображений большого размера и кнопку изменения масштаба изображения Zoom Image. Изображение можно раскрасить - кнопки Red, Green, Blue, Gray, сгладить - кнопка Smooth, сделать правый и левый поворот на
90 градусов - Rotate Left, Rotate Right. Изображение сохраняется при нажатии кнопки Save Image по выбору в формате BMP, JPG, PNG с исходным размером, который задается размером фрагмента матрицы информативностей, т.е. размером=(число интервалов)х(число категорий) пиксель.
Рис. 3. Два изображения координат и угловой скорости движения полюса Земли в зависимости от долготы Солнца, созданных на основе матриц информативностей в моделях М360 и М160 и скриншот рабочего окна программы визуализации
Визуализация матриц семантических информационных моделей движения полюса Земли
Для решения прикладных задач в АСК-анализе проводится последовательное повышение степени формализации исходных данных до уровня, обеспечивающего их обработку на компьютере в программной системе. После выполнения когнитивной структуризации и формализации предметной области осуществляется синтез модели. Он включает в себя расчет на основе эмпирических данных, представленных в исследуемой выборке, следующих матриц:
- матрицы абсолютных частот ABS, которые используются во многих статистических системах;
- матрицы условных и безусловных процентных распределений PRC, которые используются в некоторых статистических системах;
- матрицы информативностей или матрицы знаний INF, которые используются только в АСК-анализе.
Интересно сравнить изображения, полученные на основе этих трех матриц в задаче о движении полюса Земли - рис. 4. В данной задаче движение полюса характеризуется координатами X, Y и угловой скоростью X1, Y1 - таблица 1. Как следует из данных, приведенных на рис. 4, при сравнении четырех зависимостей Y(X), Y(Y), Y(X1), Y(Y1) на основе матрицы абсолютных частот достаточно достоверно выявляется только линейная зависимость Y=Y. При визуализации на основе матрицы процентных распределений выявляются все зависимости, однако детали траектории движения полюса Y=Y(X), размыты из-за сильного контраста данных с высокой и низкой частотой. И только при визуализации на основе матрицы информативностей оказывается возможным проследить все детали движения полюса - см. правый рис. 4 и рис. 3, на котором в увеличенном масштабе представлены зависимости Х^), Х^), Х^1), Х^1).
X Y Х1 Y1 X Y Х1 Y1 X Y Х1 Y1
ABS PRC INF
Рис. 4. Визуализация матрицы абсолютных частот (слева), матрицы процентных распределений (в центре) и матрицы информативностей (справа)
В будущих версиях системы «Эйдос-Java» планируется использование критерия хи-квадрат в качестве фильтра, не пропускающего сомнительные с точки зрения их достоверности данные при визуализации матриц ABS, PER, INF, что, возможно, позволит уменьшить шум в изображениях когнитивных функций.
Теоретическое объяснение целесообразности использования именно матрицы информативностей (базы знаний) для визуализации когнитивных функций и решения других задач (идентификации, прогнозирования, поддержки принятия решений и исследования предметной области) состоит в следующем. На основе сравнения абсолютных частот можно делать какие-либо выводы только в том случае, когда по разным классам приведено одинаково количество примеров. В общем случае это количество примеров по разным классам всегда разное, поэтому матрица абсолютных частот сама по себе непригодна для решения вышеперечисленных задач. Но на практике иногда встречается ситуация, когда это количество мало отличается по разным классам и тогда использование этой матрицы не дает большой ошибки и позволяет составить более-менее достоверное представление о предметной области. Получить модель предметной области, инвариантную относительно различий в количестве примеров по классам, можно перейдя от матрицы абсолютных частот к матрице условных и безусловных процентных распределений6. Использование матрицы условных и безусловных процентных распределений позволяет получить такой же уровень достоверности выводов о предметной области, какой матрица абсолютных частот в случае равного количества примеров по разным классам. Однако для того, чтобы получить эти выводы необходимо сравнивать условные процентные распределения друг с другом. При небольших размерностях моделей это сравнение может быть проведено вручную, правда лишь на качественном уровне, однако при реальных встречающихся на практике размерностях вручную это сделать не представляется возможным. Поэтому в АСК-анализе принято решение автоматизировать количественное сравнение условных процентных распределений. При этом возник вопрос о том, как именно их сравнивать: друг с другом или с какой-то базой сравнения. Если в модели всего два класса, то приемлем вариант сравнения условных процентных распределений по ним друг с другом. Но
При увеличении объема выборки относительные частости (выраженные в процентах) стремятся к вероятностям, как пределам. При достаточно больших объемах выборки различие относительных частостей от вероятностей невелико и на практике приемлемо вместо терминов «относительные и абсолютные частости» использовать термины «условные и безусловные вероятности». Под процентными распределениями понимаются именно частости, а не вероятности.
когда классов всего три, то уже не очень понятно как это делать, если же их сотни, тысячи или десятки тысяч, то это становится вообще непонятным. В АСК-анализе этот вопрос решен путем сравнения условных процентных распределений по классам с безусловным процентным распределением по всей выборке, которое и выступает базой (нормой) сравнения. Это решение соответствует принятому в статистике методу средних и отклонений от средних и представляет собой косвенное или опосредованное сравнение условных процентных распределений друг с другом, т.к. база сравнения рассчитывается с их использованием. Таким образом, матрица информативностей представляет собой результат автоматизированного сравнения условных процентных распределений признаков по классам с их безусловным процентным распределением по всей выборке. По сути это результат нормировки условных процентных распределений с использованием в качестве нормы безусловного процентного распределения. Поэтому использование матрицы информативностей освобождает исследователя-аналитика от необходимости выполнения огромной рутинной работы (которую он как правило и не может выполнить вручную, а когда может, то лишь на качественном, а не на количественном уровне) по сравнению условных процентных распределений друг с другом или с какой-либо базой сравнения и обеспечивает более высокий уровень достоверности выводов, чем использование матрицы условных и безусловных процентных распределений.
С увеличением количества интервалов оказывается возможным установить такие закономерности движения полюса Земли, которые никак не просматриваются при меньших разбиениях. На верхнем рис. 3 представлены зависимости координат и угловой скорости полюса от долготы Солнца. На левом рисунке, полученном в модели М360, на данных для угловой скорости видны колебания, видимо, обусловленные влиянием Луны, которые в модели М160 представляются как случайные выбросы.
На рис. 5 представлен фрагмент матрицы информативностей, демонстрирующий зависимость координат (Х,У) и угловой скорости (Х1, У1) движения полюса Земли - всего 244 категории, перечисленные в таблице 1, от долготы Солнца в 1963-2006 годов по данным /26/. Как следует из данных, приведенных на рис. 5, координаты полюса в зависимости от долготы Солнца образуют жгуты, которые формируются из отдельных годичных движений на протяжении многих лет. Отметим, что категории угловой скорости не образуют достаточно четких нитевидных структур, подобных тем, что образуют категории координат.
Таблица 1 - ЕЖЕДНЕВНАЯ ЧАСТОТА ПОЯВЛЕНИЯ КАТЕГОРИИ КООРДИНАТ И УГЛОВОЙ СКОРОСТИ ДВИЖЕНИЯ ПОЛЮСА ЗЕМЛИ В 1963-2006 ГОДАХ
Категория X две Категория У две Категория XI две Категория У1 две
А1-Х=-0,29609 11 Б1-У=-0,01292 30 А1-Х1=-0,006 1 Б2-У1=-0,00554 1
А2-Х=-0,28609 8 Б2-У=-0,00292 55 А2-Х1=-0,0058 2 Б4-У1=-0,00514 6
А3-Х=-0,27609 8 Б3-У=0,00708 114 А3-Х1=-0,0056 1 Б5-У1=-0,00494 4
А4-Х=-0,26609 7 Б4-У=0,01708 139 А4-Х1=-0,0054 5 Б6-У1=-0,00474 20
А5-Х=-0,25609 17 Б5-У=0,02708 116 А5-Х1=-0,0052 7 Б7-У1=-0,00454 42
А6-Х=-0,24609 70 Б6-У=0,03708 95 А6-Х1=-0,005 11 Б8-У1=-0,00434 46
А7-Х=-0,23609 99 Б7-У=0,04708 104 А7-Х1=-0,0048 23 Б9-У1=-0,00414 93
А8-Х=-0,22609 140 Б8-У=0,05708 123 А8-Х1=-0,0046 32 Б10-У1=-0,00394 130
А9-Х=-0,21609 125 Б9-У=0,06708 217 А9-Х1=-0,0044 47 Б11-У1=-0,00374 137
А10-Х=-0,20609 194 Б10-У=0,07708 248 А10-Х1=-0,0042 67 Б12-У1=-0,00354 169
А11-Х=-0,19609 199 Б11-У=0,08708 253 А11-Х1=-0,004 136 Б13-У1=-0,00334 204
А12-Х=-0,18609 188 Б12-У=0,09708 207 А12-Х1=-0,0038 150 Б14-У1=-0,00314 258
А13-Х=-0,17609 173 Б13-У=0,10708 247 А13-Х1=-0,0036 202 Б15-У1=-0,00294 345
А14-Х=-0,16609 238 Б14-У=0,11708 274 А14-Х1=-0,0034 265 Б16-У1=-0,00274 315
А15-Х=-0,15609 378 Б15-У=0,12708 256 А15-Х1=-0,0032 309 Б17-У1=-0,00254 390
А16-Х=-0,14609 269 Б16-У=0,13708 314 А16-Х1=-0,003 354 Б18-У1=-0,00234 434
А17-Х=-0,13609 272 Б17-У=0,14708 317 А17-Х1=-0,0028 356 Б19-У1=-0,00214 433
А18-Х=-0,12609 269 Б18-У=0,15708 346 А18-Х1=-0,0026 383 Б20-У1=-0,00194 446
А19-Х=-0,11609 340 Б19-У=0,16708 375 А19-Х1=-0,0024 335 Б21-У1=-0,00174 440
А20-Х=-0,10609 354 Б20-У=0,17708 451 А20-Х1=-0,0022 434 Б22-У1=-0,00154 449
А21-Х=-0,09609 271 Б21-У=0,18708 427 А21-Х1=-0,002 445 Б23-У1=-0,00134 473
А22-Х=-0,08609 299 Б22-У=0,19708 432 А22-Х1=-0,0018 412 Б24-У1=-0,00114 500
А23-Х=-0,07609 302 Б23-У=0,20708 422 А23-Х1=-0,0016 398 Б25-У1 =-0,00094 586
А24-Х=-0,06609 342 Б24-У=0,21708 341 А24-Х1=-0,0014 422 Б26-У1=-0,00074 542
А25-Х=-0,05609 385 Б25-У=0,22708 372 А25-Х1=-0,0012 449 Б27-У1 =-0,00054 581
А26-Х=-0,04609 379 Б26-У=0,23708 478 А26-Х1=-0,001 403 Б28-У1 =-0,00034 515
А27-Х=-0,03609 515 Б27-У=0,24708 417 А27-Х1=-0,0008 510 Б29-У1=-0,00014 587
А28-Х=-0,02609 406 Б28-У=0,25708 374 А28-Х1=-0,0006 595 Б30-У1=0,00006 521
А29-Х=-0,01609 460 Б29-У=0,26708 340 А29-Х1=-0,0004 515 Б31-У1=0,00026 614
А30-Х=-0,00609 421 Б30-У=0,27708 332 А30-Х1=-0,0002 574 Б32-У1=0,00046 612
А31-Х=0,00391 441 Б31-У=0,28708 333 А31-Х1=0 656 Б33-У1=0,00066 575
А32-Х=0,01391 336 Б32-У=0,29708 338 А32-Х1=0,0002 554 Б34-У1=0,00086 468
А33-Х=0,02391 347 Б33-У=0,30708 356 А33-Х1=0,0004 575 Б35-У1=0,00106 427
А34-Х=0,03391 347 Б34-У=0,31708 400 А34-Х1=0,0006 546 Б36-У1=0,00126 403
А35-Х=0,04391 369 Б35-У=0,32708 427 А35-Х1=0,0008 458 Б37-У1=0,00146 503
А36-Х=0,05391 419 Б36-У=0,33708 369 А36-Х1=0,001 473 Б38-У1=0,00166 554
А37-Х=0,06391 469 Б37-У=0,34708 370 А37-Х1=0,0012 503 Б39-У1=0,00186 456
А38-Х=0,07391 382 Б38-У=0,35708 341 А38-Х1=0,0014 469 Б40-У1=0,00206 438
А39-Х=0,08391 414 Б39-У=0,36708 379 А39-Х1=0,0016 485 Б41-У1=0,00226 427
А40-Х=0,09391 402 Б40-У=0,37708 450 А40-Х1=0,0018 428 Б42-У1=0,00246 328
А41-Х=0,10391 410 Б41-У=0,38708 372 А41-Х1=0,002 338 Б43-У1=0,00266 271
А42-Х=0,11391 350 Б42-У=0,39708 351 А42-Х1=0,0022 343 Б44-У1=0,00286 306
А43-Х=0,12391 371 Б43-У=0,40708 289 А43-Х1=0,0024 344 Б45-У1=0,00306 246
А44-Х=0,13391 416 Б44-У=0,41708 301 А44-Х1=0,0026 353 Б46-У1=0,00326 197
А45-Х=0,14391 267 Б45-У=0,42708 335 А45-Х1=0,0028 257 Б47-У1=0,00346 170
А46-Х=0,15391 280 Б46-У=0,43708 207 А46-Х1=0,003 329 Б48-У1=0,00366 132
А47-Х=0,16391 284 Б47-У=0,44708 214 А47-Х1=0,0032 239 Б49-У1=0,00386 99
А48-Х=0,17391 258 Б48-У=0,45708 241 А48-Х1=0,0034 192 Б50-У1=0,00406 60
А49-Х=0,18391 257 Б49-У=0,46708 229 А49-Х1=0,0036 175 Б51-У1=0,00426 37
А50-Х=0,19391 250 Б50-У=0,47708 282 А50-Х1=0,0038 132 Б52-У1=0,00446 15
А51-Х=0,20391 300 Б51-У=0,48708 181 А51-Х1=0,004 106 Б53-У1=0,00466 5
А52-Х=0,21391 256 Б52-У=0,49708 131 А52-Х1=0,0042 83 Б54-У1=0,00486 8
А53-Х=0,22391 294 Б53-У=0,50708 125 А53-Х1=0,0044 65 Б55-У1=0,00506 3
А54-Х=0,23391 181 Б54-У=0,51708 115 А54-Х1=0,0046 41 Б56-У1=0,00526 4
А55-Х=0,24391 170 Б55-У=0,52708 122 А55-Х1=0,0048 15 Б59-У1=0,00586 2
А56-Х=0,25391 190 Б56-У=0,53708 132 А56-Х1=0,005 11 Б62-У1=0,00646 1
А57-Х=0,26391 79 Б57-У=0,54708 147 А57-Х1=0,0052 9 Б64-У1=0,00686 1
А58-Х=0,27391 92 Б58-У=0,55708 103 А58-Х1=0,0054 5 Б65-У1=0,00706 1
А59-Х=0,28391 78 Б59-У=0,56708 68 А59-Х1=0,0056 1
А60-Х=0,29391 56 Б60-У=0,57708 14 А60-Х1=0,0058 2
А61-Х=0,30391 72
А62-Х=0,31391 23
$иМ1_ОМ
Рисунок 5. Зависимость категорий координат и угловой скорости полюса Земли
от долготы Солнца в модели М480.
Согласно существующим представлениям, такое поведение угловой скорости полюса в зависимости от долготы Солнца обусловлено наличием случайной составляющей, связанной с движением атмосферы и океана относительно земной коры.
Визуализация матриц семантических информационных моделей
сейсмических событий
Исследуемая база данных сейсмических событий была сформирована на основе базы данных Международного сейсмологического центра -1БС /25/, содержащей 20489816 записей регистрации различными сейсмостанциями событий землетрясений, произошедших на нашей планете в период с 1 января 1961 года по 31 декабря 2006 г. Из исходной базы было образовано несколько различных БД для исследования влияния астрономических параметров на магнитуду и глубину гипофокуса, на ежедневное число землетрясений, а также на средние параметры сейсмической активности. В работах /9-10/ исследована совокупность 128320 событий землетрясений с магнитудой тЬ - 4, произошедших на нашей планете в период с 9 февраля 1963 года по 31 декабря 2006 г (всего 16032 дня).
В исходной БД сейсмические события характеризуются магнитудой тЬ, которой можно сопоставить категорию магнитуды - таблица 2. Поскольку события с одной и той же магнитудой могут повторяться в один день, каждому значению магнитуды сопоставляется несколько типов категорий, а именно:
А - событие с магнитудой тЬ повторяется один раз;
В - событие с магнитудой тЬ повторяется два раза;
С - событие с магнитудой тЬ повторяется три раза.
Кроме того, можно рассмотреть случай, когда, например, категория А усекается, путем отбрасывания некоторых событий. Таким образом, были образованы категории А66, В59 и С53.
Таблица 2 - Частота повторения категорий сейсмической активности
Категория ДББ Категория ДББ Категория ДББ
А40-МЬ=4,0 1362 В40-МЬ=4,0 446 С40-МЬ=4,0 130
А41-МЬ=4,1 1580 В41-МЬ=4,1 660 С41-МЬ=4,1 259
А42-МЬ=4,2 1796 В42-МЬ=4,2 835 С42-МЬ=4,2 362
А43-МЬ=4,3 2224 В43-МЬ=4,3 955 С43-МЬ=4,3 436
А44-МЬ=4,4 2744 В44-МЬ=4,4 1099 С44-МЬ=4,4 482
А45-МЬ=4,5 3358 В45-МЬ=4,5 1223 С45-МЬ=4,5 468
А46-МЬ=4,6 4119 В46-МЬ=4,6 1455 С46-МЬ=4,6 515
А47-МЬ=4,7 4768 В47-МЬ=4,7 1612 С47-МЬ=4,7 501
А48-МЬ=4,8 4954 В48-МЬ=4,8 1817 С48-МЬ=4,8 450
А49-МЬ=4,9 5008 В49-МЬ=4,9 1636 С49-МЬ=4,9 447
А50-МЬ=5 4904 В50-МЬ=5 1428 С50-МЬ=5 356
А51-МЬ=5,1 4582 В51-МЬ=5,1 1206 С51-МЬ=5,1 293
А52-МЬ=5,2 4134 В52-МЬ=5,2 936 С52-МЬ=5,2 166
А53-МЬ=5,3 3563 В53-МЬ=5,3 617 С53-МЬ=5,3-6,0 105
А54-МЬ=5,4 3010 В54-МЬ=5,4 422
А55-МЬ=5,5 2367 В55-МЬ=5,5 261
А56-МЬ=5,6 1940 В56-МЬ=5,6 180
А57-МЬ=5,7 1460 В57-МЬ=5,7 93
А58-МЬ=5,8 1179 В58-МЬ=5,8 73
А59-МЬ=5,9 864 В59-МЬ=5,9-6,4 69
А60-МЬ=6,0 656
А61-МЬ=6,1 453
А62-МЬ=6,2 319
А63-МЬ=6,3 202
А64-МЬ=6,4 137
А65-МЬ=6,5 87
А66-МЬ=6,6-7,0 68
На рис. 6 представлены данные визуализации матрицы абсолютных частот в задаче распознавания сейсмических событий по астрономическим данным /9-10/, а также с учетом влияния магнитного поля и движения полюса Земли /14/ в модели М720. Анализируя данные, приведенные на рис.
6, можно сделать вывод о том, что во всех рассмотренных случаях события группируются вблизи некоторых особых точек отображения (1) - см. /20/, образуя своеобразный линейчатый спектр. Такое поведение обнаружено впервые, благодаря использованной технике визуализации.
Другой эффект, обнаруженный на моделях большой размерности, заключается в том, что отображение сейсмических событий в зависимости от вертикальной компоненты индукции магнитного поля имеет вид своеобразных «пальцев» или жезлов, которые по виду аналогичны тем, что получаются при визуализации матрицы абсолютных частот сейсмических событий в зависимости от расстояния до Урана - рис. 7.
NODELON
JUPITERLON
і ч >> • ■ г- ■' t •» і і «'. і і
М 'И vi МНи hi Я т ’И ! ■
J. ми &
р. і ■ * • ( 4 >-■! ** г-і «4 * •• к'< М ►“1 tei* (►•«>
N ►« N И N Н М М М М N N N И:44МИМ
SATURNLON
ВгйНА
Рисунок 6. Зависимость категорий сейсмических событий А,В,С (в каждом рисунке категории отложены по вертикали снизу вверх) от долготы Лунного Узла, Юпитера и Сатурна, и от вертикальной компоненты индукции магнитного поля на станции ОКА в модели М720. Для визуализации использована матрица абсолютных частот и условных и безусловных процентных распределений в случае магнитного поля
АІА GUA HER URANUS ОНА THL
Рисунок 7. Зависимость категорий сейсмических событий А,В,С (в каждом рисунке категории отложены по горизонтали слева направо) от вертикальной компоненты индукции магнитного поля на станциях AIA, GUA, HER, GNA, THL и от расстояния от Земли до Урана в модели М360. Для визуализации использована матрица абсолютных частот.
Эта аналогия, впервые обнаруженная в работе /9/, послужила основой для создания моделей влияния небесных тел на геомагнитное поле и на движение полюса Земли /11, 13-15/.
Сравнивая картины визуализации трех матриц в модели М360, описывающей зависимость категорий сейсмических событий А,В,С от расстояния до Урана - рис. S, находим, что матрица информативностей наиболее точно отражает все детали этой зависимости. И хотя в этом случае корреляция событий является весьма слабой, тем не менее,
благодаря использованию АСК-анализа /1, 29/ удается выделить эту зависимость и найти комбинации астрономических параметров в форме (5.1)-(5.2), которые в наибольшей степени влияют на сейсмические события, движение полюса и магнитное поле Земли /13-15/.
INF PRC ABS
Рисунок 8. Визуализация матрицы информативностей (слева), матрицы процентных распределений (в центре) и матрицы абсолютных частот (справа) в модели М360 демонстрирует зависимость категорий сейсмических событий А,В,С (в каждом рисунке категории отложены по горизонтали слева направо) от расстояния до Урана (вертикальная координата, направленная сверху вниз).
Наконец, заметим, что исследованные в настоящей работе зависимости относятся к классу когнитивных функций /27-28, 30/, визуализация которых позволяет получить новые знания о поведении сложных систем, зависящих от множества параметров большой размерности. Приведенные выше примеры показывают существенное различие в стандартном классическом описании таких систем, основанном на использовании матрицы абсолютных частот, и с использованием АСК-анализа /1/.
Таким образом, по результатам работы можно сделать обоснованный вывод о том, что сформулированная проблема решена, т.е. создана новая версия системы искусственного интеллекта «Эйдос-астра» для решения прикладных задач с эмпирическими данными большой размерности. Приложение, написанное на языке JAVA, обеспечивает GUI и позволяет подготовить и выполнить визуализацию матрицы информативностей без ограничений, налагаемых реализацией предыдущих версий системы «Эйдос-астра».
В качестве перспективы авторы рассматривают реализацию в новой версии всех функций предыдущей версии, а также реализацию качественно новых возможностей,
Кроме того, авторы приняли решение предоставить заинтересованным читателям возможность бесплатно скачивать новую версию системы «Эйдос-астра» /12/ с исходными базами данных /32-33/ и исследовать примеры, приведенные в данной статье.
Библиографический список
1. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002. - 605с7.
2. Луценко Е.В. Универсальная когнитивная аналитическая система "ЭЙДОС". Пат. № 2003610986 РФ. Заяв. № 2003610510 РФ. Опубл. от 22.04.2003.
3. Patent 20 0 86 1 00 978, Russia, System for Typification and Identification of the Social Status of Respondents Based on the Astronomical Data at the Time of Birth - "AIDOS-ASTRO" / E.V. Lutsenko, A.P. Trunev, V.N. Shashin; Application № 2007613722, January 9,2008.
4. Луценко Е.В. Artificial intelligence system for identification of social categories of natives based on astronomical parameters / Е.В. Луценко, А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2008. - №03(37). - Режим доступа: http://ei.kubagro.ru/2008/03/pdf/07.pdf
5. Луценко Е.В. «Эйдос-астра» - интеллектуальная система научных исследований влияния космической среды на поведение глобальных геосистем / Е.В. Луценко, А.П. Трунев // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №07(61). -Режим доступа: http://ei .kubagro.ru/2010/07/pdf/ 17.pdf
6. Патент РФ9: Луценко Е.В., Трунев А.П., Шашин В.Н., Бандык Д.К. Интеллектуальная система научных исследований влияния космической среды на глобальные геосистемы «Эйдос-астра» (ИСНИ «Эйдос-астра»). Пат. № 2011612054 РФ. Заяв. № 2011610345 РФ 20.01.2011. Опубл. от 09.03.2011.
7. Трунев А.П. Прогнозирование сейсмической активности и климата на основе семантиче-
ских информационных моделей / А.П. Трунев, Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №09(53). -Шифр Информрегистра: 0420900012\0098. - Режим доступа:
http://ei.kubagro.ru/2009/09/pdf/09.pdf
8. Трунев А.П. Системно-когнитивный анализ и прогнозирование сейсмической активности литосферы Земли, как глобальной активной геосистемы / А.П. Трунев, Е.В. Луценко // По-литематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №01(55). - Шифр Информрегистра: 0421000012\0001. - Режим доступа: http://ei .kubagro.ru/2010/01/pdf/22.pdf
9. Трунев А.П. Семантические информационные модели глобальной сейсмической активности при смещении географического и магнитного полюса / А.П. Трунев, Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №02(56). - Шифр Информрегистра: 0421000012\0023. - Режим доступа: http://ei .kubagro.ru/2010/02/pdf/15 .pdf
10. Трунев А.П. Прогнозирование землетрясений по астрономическим данным с использованием системы искусственного интеллекта / А.П. Трунев, Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного универси-
Для удобства читателей ряд работ из списка приведен на сайте автора: http ://lc. kubagro. ru/
http://lc.kubagro.ru/aidos/2008610097.ipg
http://lc.kubagro.ru/aidos/2011612054.ipg
7
9
тета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. -№08(52). - Шифр Информрегистра: 0420900012\0086. - Режим доступа:
ИШз://а .kubagro.ru/2009/08/pdf/13 .pdf
11. Трунев А.П. Автоматизированный системно-когнитивный анализ влияния тел Солнечной системы на движение полюса Земли и визуализация причинно-следственных зависимостей в виде когнитивных функций / А.П. Трунев, Е.В. Луценко, Д.К. Бандык // Политематиче-ский сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011.
- №01(65). - Режим доступа: Ийр://е1 .kubagro.ru/2011/01/pdf/20.pdf
12. http://chaosandcorrclation.org/AS/ViewV 1Ьс.1аг
13. Трунев А.П. Моделирование электромагнитного и гравитационного влияния небесных тел солнечной системы на смещение географического полюса и магнитное поле Земли / А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. -Краснодар: КубГАУ, 2010. - №07(61). - Шифр Информрегистра: 0421000012\0152. - Режим доступа: http://ci .kubagro.ru/2010/07/pdf/ 16.pdf
14. Трунев А.П. Семантические информационные модели влияния солнечных пятен на сейсми-
ческую активность, движение полюса и магнитное поле Земли / А.П. Трунев, Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. - №02(66). С. 546 - 571. - Режим доступа:
http://ei.kubagro.ru/2011/02/pdf/46.pdf , 1,625 у.п.л.
15. Трунев А.П. Моделирование влияния небесных тел на движение полюса Земли /
А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. -Краснодар: КубГАУ, 2010. - №10(64). - Режим доступа:
http://ei .kubagro.ru/2010/10/pdf/22.pdf
16. Трунев А. П., Луценко Е. В. Астросоциотипология: Монография (научное издание). - Краснодар: КубГАУ, 2008, - 279 с.
17. Трунев А. П., Луценко Е. В. Системно-когнитивный анализ взаимосвязей между астрономическими и социальными событиями в астросоциотипологии /8-я Международная ФАМ конференция по финансово-актуарной математике и смежным вопросам, Красноярск, 2009.
18. Луценко Е.В. Типизация и идентификация респондентов в социологии по их астрономическим показателями на момент рождения. / Е.В. Луценко, А.П. Трунев, В.Н. Шашин // По-литематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2007. - №01(25). - Шифр Информрегистра: 0420700012\0014. - Режим доступа: http://ei .kubagro.ru/2007/01/pdf/14.pdf
19. Луценко Е.В. Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей / Е.В. Луценко, А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. -Краснодар: КубГАУ, 2008. - №01(35). - Шифр Информрегистра: 0420800012\0002. - Режим доступа: http://ci .kubagro.ru/2008/01/pdf/ 10.pdf
20. Трунев А.П. Проблема распознавания событий в поле центральных сил и прогнозирование курсов валют / А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №06(50). - Шифр Информрегистра: 0420900012\0057. - Режим доступа: http://ej.kubagro.ru/2009/06/pdf/08.pdf
21. Трунев А.П. Прогнозирование курсов валют по астрономическим данным с использованием системы искусственного интеллекта / А.П. Трунев // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №07(51). - Шифр Информрегистра: 0420900012\0068. - Режим доступа: http://cj .kubagro.ru/2009/07/pdf/15 .pdf
22. Трунев А.П. Корреляция фондового индекса s & p 500 с астрономическими и геофизическими параметрами (Системно-когнитивный анализ взаимосвязи ноосферы, литосферы, магнитосферы и космической среды) / А.П. Трунев, Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №03(57).
- Шифр Информрегистра: 0421000012\0039. - Режим доступа:
http://ei .kubagro.ru/2010/03/pdf/13 .pdf
23. National Geophysical Data Center/ http://www.ngdc.noaa.gov/ngdc.html
24. World Data Centre for Geomagnetism (Edinburgh)/ http://www.wdc.bgs.ac.uk/
25. International Seismological Center/ http://www.isc.ac.uk/
26. Earth orientation centre / http://hpiers.obspm.fr/eop-pc/
27. Луценко Е.В. Метод визуализации когнитивных функций - новый инструмент исследова-
ния эмпирических данных большой размерности / Е.В. Луценко, А.П. Трунев, Д.К. Бандык // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011. - №03(67). С. 240 - 282. - Режим доступа:
http://ei .kubagro.ru/2011/03/pdf/18 .pdf
28. Трунев А.П. Автоматизированный системно-когнитивный анализ влияния тел Солнечной системы на движение полюса Земли и визуализация причинно-следственных зависимостей в виде когнитивных функций / А.П. Трунев, Е.В. Луценко, Д.К. Бандык // Политематиче-ский сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2011.
- №01(65). С. 232 - 258. - Шифр Информрегистра: 0421100012\0002. - Режим доступа: http://ei .kubagro.ru/2011/01/pdf/20.pdf
29. Луценко Е.В. АСК-анализ как метод выявления когнитивных функциональных зависимостей в многомерных зашумленных фрагментированных данных / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2005. - №03(11). - Режим доступа: http://ei.kubagro.ru/2005/03/pdf/19.pdf
30. Луценко Е.В. Когнитивные функции как адекватный инструмент для формального представления причинно-следственных зависимостей / Е.В. Луценко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2010. - №09(63).
- Режим доступа: http://ei .kubagro.ru/2010/09/pdf/01 .pdf
31. Луценко Е.В. 30 лет системе «Эйдос» - одной из старейших отечественных универсальных систем искусственного интеллекта, широко применяемых и развивающихся и в настоящее время / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2009. - №10(54). - Шифр Информрегистра: 0420900012\0110. - Режим доступа: http://ei.kubagro.ru/2009/10/pdf/04.pdf
32. http://chaosandcorrelation.org/AS/Abankall ER.rar
33. http://chaosandcorrelation.org/AS/AbankallS3.rar