Научная статья на тему 'Об одном методе анализа данных в задаче психологической диагностики'

Об одном методе анализа данных в задаче психологической диагностики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
215
60
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Клюха Андрей Андреевич, Морозова Татьяна Юрьевна

Приводится метод построения модели предметной области на основе интеллектуального анализа данных. Метод базируется на теории решеток Биркгофа и представляет сформировавшийся в последнее время логико-алгебраический подход, известный как формальный концептуальный анализ. Метод применен к структурированию и формированию логических правил для установления диагноза при клинико-психологическом обследовании.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A method of data analysis in psychological diagnostics

This paper presents a way to build the initial model of a domain using a knowledge based system. The method is based on the Birkgof's lattice theory and represents the recently formed logic-algebra approach known as Formal Conceptual Analysis. We will apply this technique to structure and formulate the logical rules used to state the diagnosis during clinical and psychological inspections.

Текст научной работы на тему «Об одном методе анализа данных в задаче психологической диагностики»

УПРАВЛЕНИЕ В МЕДИЦИНЕ И БИОЛОГИИ X

УДК 004.652.6

ОБ ОДНОМ МЕТОДЕ АНАЛИЗА ДАННЫХ В ЗАДАЧЕ ПСИХОЛОГИЧЕСКОЙ ДИАГНОСТИКИ

А. А. Клюха,

доктор психол. наук

Главное управление кадров Министерства обороны РФ

Т. Ю. Морозова,

канд. физ.-мат. наук, доцент Московский государственный университет приборостроения и информатики

Приводится метод построения модели предметной области на основе интеллектуального анализа данных. Метод базируется на теории решеток Биркгофа и представляет сформировавшийся в последнее время логико-алгебраический подход, известный как формальный концептуальный анализ. Метод применен к структурированию и формированию логических правил для установления диагноза при клинико-психологическом обследовании.

This paper presents a way to build the initial model of a domain using a knowledge based system. The method is based on the Birkgof's lattice theory and represents the recently formed logic-algebra approach known as Formal Conceptual Analysis. We will apply this technique to structure and formulate the logical rules used to state the diagnosis during clinical and psychological inspections.

Методы интеллектуального анализа данных (Data Mining) [1] применяются для автоматического обнаружения эмпирических закономерностей и использования их при решении задач классификации, распознавания образов и прогнозирования. Особенность этих методов состоит в их ориентации на задачи, для которых использование традиционных статистических методов вызывает большие затруднения. Имеются в виду задачи анализа данных очень большого объема; пораженных шумами; с признаками, измеренными в разнотипных шкалах; при отсутствии оснований для выдвижения гипотез о законах распределения плохо обусловленных таблиц (количество признаков сравнимо с количеством объектов) и т. д.

Целью технологии анализа данных является производство нового знания, выявление отношения в данных. К методам анализа данных следует отнести так называемый формальный концептуальный анализ (ФКА), недостаточно освещенный в отечественной научной литературе и, возможно, поэтому не получивший широкого применения в задачах структурирования данных и формирования баз данных. Формальный концептуальный анализ, введенный Рудольфом Вилле [2], является математическим подходом к анализу данных, базирующимся на теории решеток Биркгофа [3]. Он позволяет получить из неструктурированной информации структурированную. Может широко использоваться в прикладных областях, например в психологии.

Для введения ФКА прежде всего необходимо определить термин контекст или формальный контекст. Формальный контекст — это тройка (в, М, I), где в — множество объектов; М — множество атрибутов и I — бинарные отношения между объектами и атрибутами: I с О хМ.

Следующие определения будут полезными для дальнейшего изложения:

1. На прямом произведении вхМ двух множеств существует частичный порядок, если (х1, у1) < (х2, у2) тогда и только тогда, когда х1 < х2 в в и у1 < у2 в М.

2. Решеткой называется множество Ь, в котором любые два его элемента имеют точную верхнюю грань, т. е. «объединение» X V у, и точную нижнюю грань, или «пересечение» X а у.

Представим контекст психических расстройств в виде таблицы, в которой цифрами обозначены различные формы шизофрении: 1 — параноидальная, 2 — кататоническая, 3 — гебефреническая, 4 — простая, 5 — приступообразная, 6 — фебрильная; а буквами русского алфавита — признаки заболеваний в виде множества атрибутов М.

Таблица может быть интерпретирована следующим образом. Каждый символ « + » помечает пару, являющуюся элементом инцидентного отношения I.

Например, бинарное отношение (параноидальная шизофрения, 1) означает, что заболевание параноидальная шизофрения (объект) обладает

Атрибут Объект

1 2 3 4 5 6

Возрастные особенности (А) + + +

Развитие Стремительное (Б) + +

Другое(В) + + +

Галлюцинации Стойкие(Г) + +

Эпизодические (Д) +

Особенности речи (Е) + +

Сознание Онейроидное помрачение сознания (Ж) +

Стойкий бред (З) + +

Другое(И) + + + + + +

Эмоции Специфические (К) + +

Неспецифические (Л) + + + + + +

Моторика Специфическая (М) +

Неспецифическая (Н) + + + + + +

Поведение Специфическое (О) + +

Неспецифическое (П) + + + + + +

Потеря контакта с окружающим миром (Р) +

Соматические проявления (С) +

симптомом «наличие у больного стойких галлюцинаций различных типов» (атрибут). Таким образом, (g, т)е I означает, что «объект g обладает свойством т».

Главным понятием в ФКА является формальный концепт. Концепт (А, Ы) определяет пару — объект А с О и атрибут N с М, которые удовлетворяют некоторым условиям. А называют экстентом, N — интентом концепта, а множество всех свойств, которыми они обладают, — содержанием (интенсионалом). Чтобы определить необходимость и достаточность условий для формального концепта, представим два оператора, допустив А с в:

А = {те М е А :^, т)е I},

и соответственно N с М:

N = ^е в\Уте N: (£, т)е I}.

Приведенные определения означают, что множество А содержит все атрибуты, которые являются общими для всех объектов А, а множество N есть множество всех объектов, которые обладают всеми свойствами множества N.

Тогда пара (А, N есть формальный концепт, если и только если

А = N и А = N.

Это свойство говорит о том, что все объекты концепта содержат все его атрибуты. Это свидетельствует о том, что такое заболевание как параноидальная шизофрения характеризуется в первую очередь нарушениями сознания и сферы восприятия, поражает эмоциональную сферу, двигательную сферу, воздействует на мотивацию и волю и как следствие вызывает изменения в поведении.

Для формальных концептов природа отношения подконцепт/надконцепт может быть определена следующим образом:

(А1, N1)< (А2, N2)« А1 с А2, N1 с N2.

Это отношение выявляет дуализм между атрибутами и объектами концептов. Концепт С1 = (А1, N1) является подконцептом концепта С2 = (А2, N2), если множество его объектов являются подмножеством объектов С2. Таким образом, множество всех формальных концептов образуют так называемую концептуальную решетку.

Если контекст задан тройкой (в, М, I), то ин-финум такой решетки образуется множеством {0, М}, супремум формируется множеством (в, 0}.

Линейная диаграмма является графическим представлением концептуальной решетки. Она позволяет исследовать и интерпретировать отношения между концептами, объектами и признаками, является эквивалентным представлением контекста, т. е. она содержит точно такую же информацию, как таблица отношений, в которых каждому узлу соответствует концепт из данного контекста.

На диаграмме каждый объект обладает свойствами, приписанными узлу, и свойствами узлов, с которыми этот узел связан дугами снизу вверх. С другой стороны, учитывая дуализм между объектами и свойствами (атрибутами), относительно свойств можно утверждать, что каждое свойство соответствует объектам, приписанным данному узлу, и тем объектам, с узлами которых данный узел связан дугами сверху вниз.

Приведем пример построения решетки концептов для анализа состояния пациента. В таблице задан формальный контекст К = (в, М, I), где в — множество состояний, М — их свойства, I — бинарное отношение между состояниями и свойствами. При построении решетки совпадающие столбцы таблицы можно интерпретировать как наличие одного или/и другого признака. Поэтому на линейной диаграмме признаки заключены в скобки. Эта ситуация также может свидетельствовать о линейной зависимости между столбцами.

На рисунке изображена концептуальная решетка контекста «наличие психического расстройства у пациента».

Граф состоит из узлов, которые представляют собой концепты, и ребер, соединяющих эти узлы. Два узла С1 и С2 соединены тогда и только тогда, когда С1 < С2 и нет такого концепта С3, что С1 < С3 < С2.

Каждый объект и атрибут введен в граф только один раз. Атрибуты и объекты распространяются вдоль граней графа, как своего рода наследование. Атрибуты распространяются вдоль граней к основанию графа. Таким образом, высший элемент графа (верхняя грань контекста) соответствует {в, 0}, где в — множество объектов. Элемент основания графа (нижняя грань контекста) соответствует {0, М}, где М — множество атрибутов.

Имена атрибута отмечаются буквами, а имена объекта отмечены цифрами около узла графа.

Таким образом, граф показывает связи между объектами и атрибутами.

По решетке можно проследить все свойства, которыми обладает то или иное состояние, — это множество всех свойств, лежащих выше узла, по-

в (О: II)

2 (£: Ж: 3: М)"

Наличие психического расстройства у пациента

меченного названием состояние. Каждый узел решетки соответствует концепту.

Заметим, что если для всех объектов контекста, для которых справедливо некоторое свойство Х, справедливо также некоторое свойство У, то является истинной и импликация. Иными словами, если импликация Х^У истинна для контекста К = (в, М, I) и любому объекту g с о применим каждый признак из посылки Х, то к нему применим также признак из заключения импликации У, где X с М и У с М.

Проблема данного подхода состоит в том, что большое количество признаков влечет за собой большой размер таблицы. Другая проблема в том, что результирующая таблица не может содержать полной информации о каждом объекте и, кроме того, информация может быть противоречивой. Противоречия обнаруживаются при непосредственном рассмотрении формального контекста. Эти противоречия решаются при консультации со специалистом. Данная проблема не может быть решена, например, при наличии в модели некоторой ошибки.

Несмотря на это ФКА делает связи между понятиями (концепциями) явными и тем самым помогает из неструктурированной информации получить структурированную, что позволяет делать выводы и принимать решения.

Литература

1. Дюк В., Самойленко А. Data mining. СПб.: Питер, 2001. 505 с.

2. Биркгоф Г. Теория решеток. М.: Наука, 1984. 337 с.

3. Ganter B., Wille R. Formale concept analysis: mathematical foundatioun. New York: Springer— Verlag, 1997. 93 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.