Научная статья на тему 'К вопросу о построении когнитивных карт для интеллектуальной обработки данных'

К вопросу о построении когнитивных карт для интеллектуальной обработки данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
565
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОГНИТИВНАЯ КАРТА / КЛАСТЕРНЫЙ АНАЛИЗ / НЕЙРОННАЯ СЕТЬ / ОБУЧАЮЩАЯ ВЫБОРКА / НЕЧЕТКИЕ МНОЖЕСТВА / COGNITIVE MAP / CLUSTER ANALYSIS / NEURAL NETWORK TRAINING SET / FUZZY SETS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жилов Р. А.

Представлен метод оптимального построения когнитивных карт заключающийся в оптимизации входных данных, размерности данных и структуры когнитивной карты. Проблема оптимизации возникает при больших объемах входных данных. Оптимизация размерности данных заключается в кластеризации входных данных и в качестве метода кластеризации используется иерархический агломеративный метод. Кластерный анализ позволяет разбивать множество данных на конечное число однородных групп. Оптимизация структуры когнитивной карты заключается в автоматической подстройке весов влияния концептов друг на друга методами машинного обучения, в частности используется метод обучения нейронной сети

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE QUESTION OF THE CONSTRUCTION OF COGNITIVE MAPS FOR DATA MINING

A method of constructing an optimal cognitive maps consists in optimizing the input data and the dimension data structure of a cognitive map. Pro-optimization problem occurs when large amounts of input data. Optimization of time-dimension data is clustering the input data and as a method of polarization-clusters using hierarchical agglomerative method. Cluster analysis allows to divide the data set into a finite number of homogeneous groups. Optimization of the structurery cognitive map is automatically tuning the balance of influence on each other concepts of machine learning methods, particularly the method of training the neural network.

Текст научной работы на тему «К вопросу о построении когнитивных карт для интеллектуальной обработки данных»

Вестник КРАУНЦ. Физ.-мат. науки. 2016. № 4-1(16). C. 101-106. ISSN 2079-6641

DOI: 10.18454/2079-6641-2016-16-4-1-101-106

УДК 519.7

К ВОПРОСУ О ПОСТРОЕНИИ КОГНИТИВНЫХ КАРТ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ ДАННЫХ

Р. А. Жилов

Институт прикладной математики и автоматизации, 36000, г. Нальчик, ул. Шорта-

нова, 89а

E-mail: [email protected]

Представлен метод оптимального построения когнитивных карт заключающийся в оптимизации входных данных, размерности данных и структуры когнитивной карты. Проблема оптимизации возникает при больших объемах входных данных. Оптимизация размерности данных заключается в кластеризации входных данных и в качестве метода кластеризации используется иерархический агломеративный метод. Кластерный анализ позволяет разбивать множество данных на конечное число однородных групп. Оптимизация структуры когнитивной карты заключается в автоматической подстройке весов влияния концептов друг на друга методами машинного обучения, в частности используется метод обучения нейронной сети.

Ключевые слова: когнитивная карта, кластерный анализ, нейронная сеть, обучающая выборка, нечеткие множества

© Жилов Р. А., 2016

MSC 68T30

ON THE QUESTION OF THE CONSTRUCTION OF COGNITIVE MAPS FOR

DATA MINING

R. A. Zhilov

Institute of Applied Mathematics and Automation, 360000, KBR, Nalchik, st. Shortanova

89a, Russia

E-mail: [email protected]

A method of constructing an optimal cognitive maps consists in optimizing the input data and the dimension data structure of a cognitive map. Pro-optimization problem occurs when large amounts of input data. Optimization of time-dimension data is clustering the input data and as a method of polarization-clusters using hierarchical agglomerative method. Cluster analysis allows to divide the data set into a finite number of homogeneous groups. Optimization of the structurery cognitive map is automatically tuning the balance of influence on each other concepts of machine learning methods, particularly the method of training the neural network.

Key words: cognitive map, cluster analysis, neural network training set, fuzzy sets.

© Zhilov R. A., 2016

Введение

В информационных и управляющих системах появляется проблема принятия решений в слабо структурированных динамических ситуациях, когда параметры, законы и закономерности развития ситуации описываются качественно. В этих ситуациях динамика параметров трудно предсказуема изменениями структуры. Не точное или нечеткое описание входных данных, а порой и нечетко структурированная задача, усложняют решение этих задач.

Для того, чтобы принять решение в условиях нехватки точной количественной информации экспертам в области информационных и управляющих систем приходится опираться на собственный опыт и интуицию, используя при принятии решений в качестве модели данной ситуации субъективную модель, основанную на экспертных оценках аналитиков. Для построения такой модели пользуются когнитивными картами или компьютерными системами моделирования когнитивных карт.

Основным понятием теории когнитивных карт является концепт. Концептом называется базовый (неделимый) элемент рассматриваемой системы [1]. Пусть К множество концептов (элементов) рассматриваемой системы, а множество связей, каждая из которых описывает силу влияние одного концепта К (концепта-причины) на другой концепт К (концепт-следствие). Направленность этой связи wij означает, что концепт-источник влияет на концепт-приемник, т.е. изменение значений (состояний) концепта-источника приводит к изменению значений (состояний) концепта-приемника.

Деятельность экспертов и аналитиков, направленная на исследование ситуации и принятия решений с помощью когнитивных карт, представляет собой методологию -логико-временную структуру применения различных методов и приемов: построение когнитивной карты, ее параметризация, получение прогнозов развития ситуаций, верификации, корректировки когнитивной карты и принятия решений [2].

Постановка задачи

Компьютерные модели когнитивных карт широко используются для помощи при принятии решений в условиях неточной и недостаточной информации. Требуется оптимизировать когнитивную карту путем оптимизации ее входных данных и системы подстройки весов. Для этого будут использованы методы кластерного анализа для оптимизации данных, и методы обучения искусственных нейронных сетей для подстройки весов влияния концептов друг на друга.

Уменьшение размерности входных данных путем их кластеризации

Построение когнитивной карты и ее параметризация являются самыми важными и сложными этапами и нуждаются в оптимизации. Построение когнитивной карты усложняется при наличии большого количества входных данных (концептов). Это связано с тем, что у получающейся когнитивной карты появляется большое количество концептов, а соответственно еще большее количество связей. На практике зачастую во входных данных появляются схожие по каким-то признакам и появляются связи слабо отличающиеся друг от друга и слабо влияющие на поведение когнитивной карты по отдельности. Именно для такого типа входных данных

и используются методы оптимизации размерности данных. Необходимость классификации входных данных по определенным признакам обусловлена тем, что такая процедура уменьшает внутреннюю размерность множества данных, что существенно облегчает построение когнитивной карты для заданной системы. Одним из известных направлений уменьшения внутренней размерности данных является кластеризация данных. Кластерный анализ позволяет разбивать множество данных на конечное число однородных групп.

Наиболее подходящим методом кластерного анализа являются иерархические аг-ломеративные методы. Сущность этих методов заключается в том, что на первом шаге каждый объект рассматривается как отдельный кластер. Процесс объединения кластеров происходит последовательно: на основании матрицы расстояний или матрицы сходства объединяются наиболее близкие объекты. В кластерном анализе каждый объект описывается k признаками, т.е. он может быть представлен как точка в k -мерном пространстве. Сходство с другими объектами будет определяться как соответствующее расстояние. В кластерном анализе используют различные меры расстояния между объектами.

В данной работе предлагается использовать расстояние city-block. В отличии от евклидово расстояния, которое часто используется при кластеризации, расстояние city-block уменьшает влияние отдельных больших разностей(выбросов), так как они не возводятся в квадрат.

где хг-,х/ - координаты 1-го и 7-го объектов в к-мерном пространстве; хц,х/ - величина 1-той компоненты у г-го (/-го) объекта (1 = 1,2,... к;г,/ = 1,2,...,п).

Вычисляя расстояния между точками по формуле (1) строится матрица расстоянии

где Р/ - расстояние между г-ым и /-ым объектом[1].

Процесс объединения кластеров происходит последовательно: на основании матрицы расстояний объединяются наиболее близкие объекты одним из методов иерархического кластерного анализа. В общем виде алгоритм иерархического кластерного анализа можно представить в виде последовательности процедур:

1) Значения исходных переменных нормируются.

2) Рассчитывается матрица расстояний или матрица мер близости.

3) Находится пара самых близких кластеров. По выбранному алгоритму объединяются эти два кластера объединяются. Новому кластеру присваивается меньший из номеров объединяемых кластеров.

4) Пункты 2, 3 и 4 повторяются до тех пор, пока все объекты не будут объединены в один кластер или до достижения заданного "порога"близости.

В результате мы получаем кластеры, элементы которых схожи по определенным признакам и на основании этих кластеров строится когнитивная карта.

Когнитивная карта представляет собой орграф О = (К, ы), где К-множество вершин графа (концепты), ы - множество ребер (связей)[3].

Pcb(Xi,Xj) = Е|Хц - Xji |(1)

Оптимизация когнитивной карты заключается в том, что она строится не на п-входных данных, а на к, где к < п. Кластеризация данных для построения когнитивной карты при большом количестве входных данных является оптимальной, так как уменьшается количество концептов и количество связей между этими концептами, тем самым сокращается количество операции выполняемых на каждом шаге обработки когнитивной карты. При этом когнитивная карта становится более наглядной и понятной эксперту. Последнее обстоятельство облегчает построение когнитивных карт, работающих в реальном режиме времени.

Подстройка весов влияния концептов когнитивной карты методами машинного обучения.

Соединенные определенным образом, нейроны образуют нейронную сеть. Работа сети разделяется на обучение и приспособление. Под обучением понимается процесс приспособления сети к предъявляемым эталонным образцам путем модификации (в соответствии с тем или иным алгоритмом) весовых коэффициентов связей между нейронами. Этот процесс является результатом алгоритма функционирования сети, а не предварительно заложенных в нее знаний человека, как это часто бывает в системах искусственного интеллекта.

Следующим этапом при построении когнитивной карты является ее параметризация, т.е. задание весов связей wij. В существующих методах построения когнитивной карты веса связей влияния задаются экспертом, что существенно увеличивает долю субъективизма в когнитивной карте. Оптимизация данного этапа заключается в автоматической настройке весов влияния концептов друг на друга методами машинного обучения. Когнитивную карту можно представить в виде однослойной нейронной сети. Все входные сигналы подаются всем нейронам. Выходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети. В качестве обучающей выборки будет выступать состояние системы за предыдущие этапы времени, наборы пар векторов (х[,у[),[ = 1,...,п, т.е. состояние всех концептов, входящих в когнитивную карту на каждом этапе. При обучении на вход будет поступать вектор состоянии концептов на (п— 1)-ом шаге, а на выходе должен получаться вектор состоянии концептов на п-ом шаге. После многократного представления таких примеров веса стабилизуются. В процессе функционирования сеть формирует выходной вектор у в соответствии с входным вектором х. В зависимости от того как отличается полученный результат от желаемого веса связей настраиваются. В системах нейронных сетей большое количество парадигм обучения. Обучение с учителем (контролируемое обучение) и обучение без учителя (неконтролируемое обучение) — вот две главные парадигмы, обычно используемые в проектировании обучающих алгоритмов. В парадигме обучения с учителем желаемый выход определяется обучающими образцами данных для каждого образца входа.

Для обучения когнитивной карты подходит метод обучения однослойных нейронных сетей, предложенный Розенблаттом [4]. Суть метода состоит в итерационной подстройке матрицы весов, последовательно уменьшающей ошибку в выходных векторах. Алгоритм включает несколько шагов:

На первом шаге весам влияния будут считаться случайными величинами между 0 и 1.

На втором шаге на вход подается входной вектор xt в результате на выходе получаем вектор yt, сформированный на основе случайных весов влияния.

На третьем шаге вычисляем вектор ошибки at = yt — yt.

Дальнейшая идея состоит в том, что изменение вектора весовых коэффициентов в области малых ошибок должно быть пропорционально ошибке на выходе и равно нулю, если ошибка равна нулю.

На четвертом шаге вектор весов модифицируется по формуле

W (t + 1) = W (t ) + cxiüi.

Здесь 0 < c < 1 - темп обучения.

Шаги 1-4 повторяются для всех обучающих векторов. Один цикл последовательного предъявления всей выборки называется эпохой. Обучение завершается по истечении нескольких эпох: а) когда итерации сойдутся, т.е. вектор весов перестанет изменяться или б) когда полная, просуммированная по всем векторам абсолютная ошибка станет меньше некоторого малого значения.

Такая процедура оптимизирует веса связей в когнитивной карте для последующего прогнозирования развития системы. Составив когнитивную карту подстраиваем веса влияния алгоритмами обучения однослойных нейронных сетей (обучаем когнитивную карту). Данная процедура делает когнитивную карту более объективной. Единственным условием для корректной подстройки весов является наличие обучающей выборки (данные функционирования системы по которой строится когнитивная карта за предыдущие этапы времени).

Заключение

Нейронные сети, как и когнитивные карты, всё чаще применяются и в реальных бизнес - приложениях. В некоторых областях, таких как обнаружение фальсификаций и оценка риска, они стали бесспорными лидерами среди используемых методов. Их использование в системах прогнозирования и системах маркетинговых исследований постоянно растёт.

Поскольку экономические, финансовые и социальные системы очень сложны и являются результатом действий и противодействий различных людей, то является очень сложным (если не невозможным) создать полную математическую модель с учётом всех возможных действий и противодействий. Практически невозможно детально аппроксимировать модель, основанную на таких традиционных параметрах, как максимизация полезности или максимизация прибыли.

Такие же методы оптимизации подходят и для нечетких когнитивных карт, в которых концепты могут принимать значения из диапазона действитель-ных чисел [0,1]. Термин «нечеткие» обозначает только то, что причинные связи (связи взаимовлияния) могут принимать не только значение, равное 0 или 1, а лежат в диапазоне действительных чисел, отражающих «силу» влияния одного концепта на другой [5].

Список литературы/References

[1] Авдеева З.К., Коврига C.B., Макаренко Д.И., "Когнитивное моделирование для решения задач управления слабоструктурированными системами (ситуациями)", Управление большими системами, 16 (2007), 26-39, [Avdeeva Z.K., Kovriga C.B., Makarenko D.I.

Kognitivnoe modelirovanie dlya resheniya zadach upravleniya slabostrukturirovannymi sistemami (situatsiyami) // Upravlenie bol'shimi sistemami. 2007. vol. 16. pp. 26-39 (in Russian)].

[2] Кулинич А. А., "Компьютерные системы моделирования когнитивных карт: подходы и методы", Control sciences, 2010, №3, [Kulinich A. A. Komp'yuternye sistemy modelirovaniya kognitivnykh kart: podkhody i metody // Control sciences. 2010. no 3. (in Russian)].

[3] Kosko В., "Fuzzy Cognitive Maps", International Journal of Man-Machine Studies., 1 (1986), 65-75.

[4] Розенблатт Ф., Принципы нейродинамики (перцептрон и теория механизмов мозга), Мир, М., 1965, 480 с., [Rozenblatt F. Printsipy neyrodinamiki (pertseptron i teoriya mekhanizmov mozga). Moskva. Mir, 1965. 480 p. (in Russian)].

[5] Жилов Р. А., "Применение нечетких когнитивных карт в системах принятия решении", Материалы Всероссийской научной конференции молодых ученных «Современные вопросы математической физики, математической биологии и информатики», 2014, 54-55, [Zhilov R. A. Primenenie nechetkikh kognitivnykh kart v sistemakh prinyatiya reshenii. Materialy Vserossiyskoy nauchnoy konferentsii molodykh uchennykh «Sovremennye voprosy matematicheskoy fiziki, matematicheskoy biologii i informatiki». 2014. pp. 54-55 (in Russian)].

Список литературы (ГОСТ)

[1] Авдеева З. К., Коврига C. В., Макаренко Д. И. Когнитивное моделирование для решения задач управления слабоструктурированными системами (ситуациями) // Управление большими системами. 2007. Т. 16. С. 26-39

[2] Кулинич А. А. Компьютерные системы моделирования когнитивных карт: подходы и методы // Control sciences. 2010. №3.

[3] Kosko В. Fuzzy Cognitive Maps //International Journal of Man-Machine Studies. 1986. no 1. pp. 65-75

[4] Розенблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга). М.: Мир, 1965. 480 c.

[5] Жилов Р. А. Применение нечетких когнитивных карт в системах принятия решении // Материалы Всероссийской научной конференции молодых ученных «Современные вопросы математической физики, математической биологии и информатики». 2014. C. 54-55

Для цитирования: Жилов Р. А. К вопросу о построении когнитивных карт для интеллектуальной обработки данных // Вестник КРАУНЦ. Физ.-мат. науки. 2016. № 4-1(16). C. 101-106. DOI: 10.18454/2079-6641-2016-16-4-1-101-106

For citation: Zhilov R. A. On the question of the construction of cognitive maps for data mining, Vestnik KRAUNC. Fiz.-mat. nauki. 2016, 16: 4-1, 101-106. DOI: 10.18454/2079-66412016-16-4-1-101-106

Поступила в редакцию / Original article submitted: 09.11.2016

i Надоели баннеры? Вы всегда можете отключить рекламу.