Научная статья на тему 'Опыт применения искусственных нейронных сетей для целей дифференциальной диагностики и прогноза нарушений психической адаптации'

Опыт применения искусственных нейронных сетей для целей дифференциальной диагностики и прогноза нарушений психической адаптации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
882
120
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Беребин Михаил Алексеевич, Пашков Сергей Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Опыт применения искусственных нейронных сетей для целей дифференциальной диагностики и прогноза нарушений психической адаптации»

УДК 681.142.2

ОПЫТ ПРИМЕНЕНИЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ЦЕЛЕЙ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ И ПРОГНОЗА НАРУШЕНИЙ ПСИХИЧЕСКОЙ АДАПТАЦИИ

МЛ. Беребин, С.В. Пашков

В последние десятилетия в научной и прикладной психологии в целом, и клинической психодиагностике, в частности, интенсивно разрабатываются методология и методы обработки информации, основанные на современных информационных технологиях. Применение таких методов позволяет успешно решать актуальные задачи, стоящие перед медицинской и психологической наукой и практикой [6]. Однако в основном применение современных информационных технологий в клинический и психологической практике ограничено созданием развитых баз диагностических данных. Значительно реже представлены исследования, связанные с разработкой эффективных методов анализа информации, построением интеллектуальных систем. Дальнейшему развитию этого направления современной психологической диагностики препятствует слабое знакомство спе-циалистов-психологов не только с большинством современных методов обработки и анализа данных, но и зачастую даже с методами традиционной прикладной статистики (математико-статистического анализа). Поэтому с сожалением стоит отметить печальный факт утраты психологией одного из лидирующих мест по применению современных (применительно к своей эпохе) технологий обработки и анализа данных, ибо многие разработки в области математико-статистического анализа получили развитие по инициативе и в интересах психологической науки и практики.

Вместе с тем, потребности клинической медицины и медицинской психодиагностики ставят новые задачи перед специалистами по психологическому обеспечению лечебного процесса, выявлению индивидуальных особенностей и психических состояний пациентов, эпидемиологической и скрининговой диагностике факторов риска психической дезадаптации. Реальности медицинской психологии и психодиагностики XXI века (активная динамика медицинской психодиагностики и ее объекта; интервенция некачественных отечественных и переводных тестовых методик, часто не имеющих психометрического обоснования; естественное снижение диагностического потенциала базовых методик типа ММР1 из-за их нерестандар-тизированности; значительной субъективности клинических методов психодиагностики, существенно влияющей на их валидность и т.п.) требуют разрешать эти задачи с наименьшими временными и ресурсными тратами. Это становится возможным только с помощью новых современных ин-формационных технологий._________________________

1. Общая характеристика информационных

технологий анализа данных в контексте

задач психологического исследования

Основные направления обработки, анализа и представлений данных сегодня представлены прикладной статистикой (традиционными математикостатистическими методами), оперативной аналитической обработкой данных (так называемые OLAP-технологиями) и технологиями интеллектуального анализа данных - Data Mining [3].

Анализ ситуации на рынке программных средств для интеллектуального анализа данных показывает, что методы математической статистики оказываются полезными главным образом для проверки заранее сформулированных исследовательских гипотез (Verification-driven Data Mining) и в целях «грубого» разведочного анализа. Последний составляет основу оперативной аналитической обработки данных (OnLine Analytical Processing, OLAP). Итогом такой обработки многомерной информации является создание моделей данных, организованных в виде п-кубов (cubes). В этих кубах содержатся количественно выраженные характеристики объекта исследования, ориентированные по осям, описывающим основные атрибуты этого объекта.

В свою очередь, появление технологии Data Mining (Discovery-driven Data Mining, буквально -«добыча» или «раскопка данных») было продиктовано постулатом о том, что любые первичные («сырые») данные (raw data) содержат в себе еще и некий глубинный пласт знаний, при грамотной «раскопке» которого могут быть обнаружены ранее недоступная информация [2]. Технологии Data Mining представляют собой новый виток в развитии средств и методов обработки данных и позволяют осуществлять «обнаружение знаний в базах данных» (Knowledge Discovery in Databases) и «интеллектуальный анализ данных». Результаты такого анализа представлены в виде определенных паттернов (шаблонов), описывающих некоторые фрагменты закономерностей, выявляемых в исследуемых базах данных. Отличительной особенностью такого представления результатов является нетривиальность (неожиданность и априорная неочевидность) получаемых выводов, не связанных, на первый взгляд, с исходными предположениями

о структуре выборки и виде распределения значений анализируемых показателей. Однако именно эти неожиданные (unexpected) регулярности в данных и составляют так называемые «скрытые знания» (hidden knowledge). У специалистов по анализу данных возникло понимание того, что все

первичные («сырые») данные (raw data) содержат в себе глубинный пласт знаний, при грамотной «раскопке» которого могут быть обнаружены настоящие самородки.

Отдельный класс относительно новых технологий обработки данных представляют экспертные системы (ЭС), получившие распространение в конце 60-х годов в связи с развитием вычислительной техники и её программного обеспечения, а также теории нечетких множеств. В традиционном представлении ЭС реализуют так называемое «высокоуровневое моделирование мыслительных процессов биологических организмов», то есть, работают на основе использования аппарата формальной логики. Фактически они призваны решать задачи в таких условиях и ситуациях, когда непосредственное участие человека-эксперта в данной предметной области было либо невозможно (агрессивные среды, космические и глубоководные исследования и т.п.), либо затруднительно (дефицит времени, кадровые проблемы).

Использование ЭС для достижения целей и решения задач так называемых «нечетких предметных областей» (медицины и психологии, в частности) предполагает проведение целого цикла работ, которые можно распределить по этапам: определение задачи решаемой ЭС; отбор экспертов в данной предметной области; выявление экспертных знаний и их верификация; аппаратная/программная реализация ЭС.

Осуществление ЭС в социальных и естест-венно-научных областях долгое время тормозилось в связи с тем, что полученные от человека-эксперта в этой «нечеткой» области знания по своему характеру являются неточными (для одной и ту же задачи разные эксперты находят различные решения), неполными (подавляющее большинство экспертов не в состоянии внятно объяснить, на каких основаниях они решают данную задачу так, а не иначе), нечеткими (эксперты предпочитают не давать определенные решения, а склонны к ответам типа «скорее так»). Аппарат же формальной логики ориентирован на более точное, полное и четкое описание процесса принятия решения. Это связано исключительным образом с тем, что информация, которой оперирует формальная логика представлена в виде двух состояний - «Да» и «Нет». То есть, если у пациентки есть беременность, ответ - «Да», если её нет, то ответ - «Нет». Tertium non datum - третьего не дано...

Вместе с тем, существует огромное количество ситуаций, которые не могут быть представлены посредством только бинарных данных. Например, к такого рода ситуациям могут быть отнесены психометрически шкалированные результаты измерения индивидуальных свойств, ситуации принятия решения по классификации испытуемых, или, например, показатели по биохимическим тестам. Конечно, существует понятие статистической нормы, и относительно него можно определить, к какой

области - высоких или низких значений,- относится данный показатель. Но в психологии алгоритм приведения показателей к «среднеарифметическому» не позволяет учитывать индивидуальные особенности испытуемых, нивелирует формирующиеся в популяции тенденции, снижает размерность пространства принятия решений, и, следовательно, уменьшает точность полученного решения.

Особую привлекательность для создания ЭС, использующих аппарат нечеткой логики, представляют искусственные нейронные сети (ИНС). Они реализуют «низкоуровневое моделирование мыслительных процессов биологических организмов», то есть, работают на основе эмуляции принципов переработки информации на клеточно-ансамблевом уровне. ИНС относятся к группе самонастраивающихся систем, то есть они способны при помощи ряда примеров «обучаться»: находить правильные решения при последующем предъявлении задач, аналогичных предъявленным ранее примерам.

2. Общая характеристика искусственных нейронных сетей

Современные ИНС представляют собой про-граммно-аппаратные средства создания специализированных моделей и устройств и позволяют решать широкий круг задач диагностики на основе применения алгоритмов теории распознавания образов. К достоинствам нейросетей следует отнести их относительную простоту, нелинейность, работу с нечеткой информацией, некритичность к исходным данным, способность обучаться на материале конкретных примеров.

В настоящее время существует около сотни алгоритмов обучения нейросетей, большая часть из которых предназначена для обучения конкретных нейросетевых моделей. Нейросети реализуют один из подходов к решению неформализуемых или трудноформализуемых задач с помощью обучения на примерах (case-based). Для его использования необходимо иметь достаточное количество примеров для настройки адаптивной системы с заданной степенью достоверности. Если примеры относятся к разным диагностическим группам, то настроенная (обученная) таким образом ИНС позволяет в последующем распознать (диагностировать) и дифференцировать любой новый случай, представленный набором показателей, аналогичным тем, что и в примерах, на которых проводилось обучение нейросети. Несомненным достоинством нейронной модели является то, что при ее создании не нужно представлять весь набор сложных закономерностей описания диагностируемого феномена, как это требуется при разработке распространенных в медицине и психодиагностике экспертных систем (другого направления использования современных информационных технологий).

Некоторая сложность теоретического обеспечения использования, трудоемкость и временные затраты по моделированию и обучению ИНС сочетает-

ся с простотой их применения конечным пользователем. Если задача создания конкретной нейросети адекватной поставленной задаче и ее оптимальное обучение доступно лишь специалисту, то ее практическое применение конечным пользователем требует только владения навыками общения с компьютером и по существу доступно каждому. Сложность интерпретации системы знаний обученной нейросетевой модели, как правило, кажется ненужной пользователю ИНС, так как для большинства конечных пользователей важно не понимание сущности работы нейросети, а ее результативность, информативность, безошибочность и быстродействие.

3. Особенности применения искусственных нейронных сетей в медицинской психодиагностике

К сожалению, ИНС применяются в основном для решения задач в области маркетинга, банковского дела и бизнеса. Применение нейросетевых моделей в области медицины и, особенно, психологии за рубежом встречается значительно реже, а в отечественной практике оно представлено в основном единичными исследованиями.

Нами было проведено изучение возможности применения ИНС для прогноза дифференциальной диагностики нарушений психической адаптации у сотрудников силовых структур, находившихся в командировке в Чеченской Республике (ЧР) в 2003-2004 гг. Использование ИНС представляется в данном случае обоснованным прежде всего потому, что у участников боевых действий (комбатантов) достаточно часто наблюдаются посттравматические стрессовые расстройства, которые имеют достаточно четкие диагностические критерии [5]. Вместе с тем, у этой категории пациентов посттравматические стрессовые расстройства часто сочетается с нарушениями психической адаптации. Между этими двумя нозологическими формами психических расстройств существуют неоднозначные взаимосвязи. В контексте настоящего исследования представляется важным тот факт, что термин «расстройство психической адаптации» хотя и приводится в МКБ-10, но имеет не клинический, а интерпретативный характер (т.е. он не представлен в классификации конкретными синдромно-нозологичес-кими описаниями). Это создает предпосылки к вариативности в оценке наблюдаемой симптоматики. Таким образом, прогнозирование риска психической дезадаптация представляет собой пример трудноформализуемой задачи.

В соответствии с программой исследования дважды (до и после командировки в Чеченскую Республику) проводилось психологическое исследование испытуемых по методике ММР1. Выбор результатов обследования по методике ММР1 в качестве базовых примеров для настройки нейросети обусловлен, в частности, спецификой работы психодиагностических служб всех силовых ведомств, для которых этот опросник является основной ме-

тодикой для обследования кандидатов для поступления на службу, а также «оперативной» методикой медицинской диагностики для выявления различных отклонений психического здоровья.

Кроме того, по итогам медицинского обследования, служебной аттестации по результатам служебно-боевой деятельности в ЧР и экспертной оценки уровня адаптации, выполненной компетентными врачами-психиатрами некоторые сотрудники были отнесены к группе «адаптированных» лиц (группа 1, «1 = 42 чел.). Лица, отнесенные к другой группе, считались нуждающимися в определенной психологической реабилитации («дезадаптированные», группа2, п2= 38 чел).

При обучении нейросетевой модели в качестве примеров применялись результаты обследования по методике MMPI, а состояние дезадаптации обозначалось как значение целевой переменной, равное -1. В свою очередь, состояние адаптации обозначалось как значение целевой переменной, равное +1. .В качестве симулятора нейросети была использована программа Neuro Pro версии 0.25, а подготовка исходных данных осуществлялась при помощи электронной таблицы Excel пакета Microsoft Office 97. В качестве внешнего критерия оценки валидности обученной нейросети использовались модели, построенные на основе традиционных методов математического анализа данных - дискриминантного и нелинейного регрессионного анализа. Математико-статистический анализ осуществлялся с помощью программных продуктов: SPSS 10.0 for Windows (дескриптивные статистики, кросстабуляция, корреляционный анализ, кластерный анализ), Statistica 6.0 (лог-линейная регрессия), Statgraphics версии 5.1 (факторный анализ, линейный регрессионный анализ), Minitab 13.31 (квадратичный регрессионный анализ). Использование этих различных программных средств обусловлено тем, что каждый из них имеет собственный набор математико-статистических процедур, зачастую уникальных. Кроме того, даже при одинаковых наборах математико-статистических процедур, разные статистические пакеты предлагают пользователю различные по своему составу итоговые таблицы.

Нейросеть для прогнозирования состояния дезадаптации у сотрудников силовых структур после командировки в зону ЧС была организована в виде трехслойного перцептрона (полносвязанная сеть прямого распространения) с сигмоидальными передаточными функциями нейронов:

s=^/(од + И1).

Первый слой нейронов является рецепторным и состоит из 13 нейронов, которым соответствуют 13 шкал MMPI. Второй («скрытый») слой также представлен 13 нейронами, а выходной составляли 2 нейрона (по числу диагностируемых классов уровня психической адаптации). Классификация случая производилась на основании наибольшего значения одного из выходных нейронов. После исключения из выборки всех «конфликтных при-

меров» (испытуемых с одинаковыми профилями ММР1, отнесенных в одном случае к группе 1, в другом - к группе 2) обучение нейронной сети проводилось на примере 80 случаев наблюдений.

На предварительном этапе исследования проведена традиционная для такого рода исследований математико-статистическая обработка данных

- метод сравнения средних арифметических по 1-критерию Стьюдента. При этом установлено, что среднегрупповые значения по шкалам ММР1 не имеют каких-либо значимых различий по г-тесту Стьюдента. Полученные данные свидетельствуют об однородности исследованной выборки с позиций традиционного подхода к дифференциальной диагностике (отметим, что статистическая обработка результатов по методу «средних арифметических» наиболее часто представлена в определенного рода «специализированных» изданиях по психодиагностике). Традиционный корреляционный анализ шкальных показателей показал, что у испытуемых группы 2 наблюдаются значимо большее (по сравнению с группой 1) число корреляционных плеяд с жесткими взаимосвязями между шкалами ММР1. Эти результаты подтверждают правильность отнесения испытуемых к группе дезадаптированных лиц, так как хорошо согласуются с результатами аналогичного лонгитюдного исследования, проведенного В.М. Воробьевым и В.А. Дюком [1] на материале обследования курсантов военно-учебных заведений.

Результаты факторного анализа, проведенного с целью выявления каких-либо закономерностей в рамках традиционной парадигмы обработки данных, также не позволили получить четкую дифференциально-диагностическую картину. Факторный анализ, выполненный методом главных компонент с уап тах-ротацией и нормализацией по методу Кайзера, позволил выделить только 4 фактора, объясняющих 65,9 % общей дисперсии признаков. Ограничение числа компонент происходило с использованием критериев «каменистой осыпи» и критерия Хамфри, а также с точки зрения оптимальной интерпретируемости факторов. В тоже время содержательная интерпретация факторов не позволяет получить достоверно различающихся факторно-аналитических моделей. В частности, у дезадаптированных сотрудников группы 2 результаты факторного анализа хорошо согласуются с результатами анализа межшкальных интеркорреляций: корреляционные плеяды К~Нх, Ш-Ну и П-Бс входят в состав 1-го фактора. Кроме того, включение в состав первого фактора шкалы Рс1 позволило интерпретировать его как «невротическая дезадаптация и дистанционированность» (26,4 % общей дисперсии признаков). Второй фактор представлен высоконагруженными на него шкалами Д 5/, Р, Р1 и -К, и был обозначен как «интровертированная психическая дезорганизация» (18,7 %). Третий фактор, с которым значимо коррелируют шкалы Ма, -I, Р и -К, был проин-

терпретирован как «гипертимная открытость и снижение критичности» (12,5 %). Четвертый фактор наиболее сильно взаимосвязан со шкалами М/ и Ра, и был определен как «подчеркиваемая (декларируемая) маскулинность» у сотрудников силовых структур (8,3 %),

Проведенная процедура кластеризации испытуемых посредством применения кросс-табуляции и вычисления ф-коэффициента Гилфорда позволила сопоставить распределение испытуемых групп

1 и 2 с результатами их теоретического отнесения к определенным кластерам. Критически низкие значения коэффициента Гилфорда (ф = 0,032) статистически подтвердили результаты визуализации кластерного решения, но при этом свидетельствуют о полном несовпадении состава кластеров и эмпирических групп.

После обучения нейросеть была тестирована и показала 100 % воспроизводимость результатов, то есть она оказалась способной распознавать все случаи наблюдения как «дезадаптивные» или «адаптивные» с точностью 100 %. Полученные закономерности работы обученной нейросети могут быть выражены следующим уравнением предсказания дезадаптации:

Х= +1 - Ъ,2-Р- 1,1 -К+ 0,1 -Яу + 0,30 +

+ 0,8-Ну - 0,3-М + 0,2-МГ- 0,8 Ра - 1,4 Р1 -

- 0,5-5с + 0,4-Ма - 0,9-5г.

Полученное уравнение приблизительно отражает реальные уравнения, используемые нейросетью для решения задачи классификации, и может быть полезно для понимания и интерпретации принципа классификации.

В примерах, использованных для обучения данной ИНС, априорно исключены так называемые «конфликтующие случаи». Вместе с тем, ней-росетевая модель оказалась способной к быстрой адаптации (переобучению), после которой классификация «конфликтных случаев» становится неопределенной (т.е. значения выходных нейронов близки между собой), а использование в «скрытом» втором слое избыточного числа нейронов, позволяет ей быть более гибкой по отношению к любым новым случаям наблюдения, что в целом повышает надежность классификации.

Отметим, что дискриминантная и нелинейная регрессионная модели позволяли верно классифицировать лишь 81,7 % примеров. Для уточнения диагностической ценности этих моделей из базы данных были исключены показатели шкал ММР1, не обнаруживающих значимых различий по 17-критерию Манна-Уитни (при р < 0,05). Полученная в итоге дискриминантная функция вида

С/ам =0,0679513-1 + 0,0994581 •£>- 7,89598 позволяет правильно классифицировать только 66,7 % случаев наблюдения.

Результаты создания и тестирования нейросети свидетельствуют о ее хорошем диагностическом потенциале при решении задач прогноза со-

стояний дезадаптации у сотрудников силовых структур. Отдельным направлением применения результатов нейросетевого моделирования в практике может являться их использование с целью разработки качественных продукционных правил для тестирующих компьютерных психодиагностических методик класса экспертных систем. Так, одно из таких «нейросетевых» правил имеет следующий вид: Если 33,5 < Ж 46,5 и П >45,5 и М/ < 39, то «АДАПТАЦИЯ». Количество примеров в правиле: 42, правильных примеров: 42, неправильных примеров: 0.

В качестве проявления подобного рода «исследовательского интереса» было проведена «перенастройка ИНС и получена новая нейросетевая структура, представленная 13 входными, 3 скрытыми и 2 выходными нейронами. Скрытые нейроны работали в соответствии с выявленными ранее продукционными правилами оценки риска адаптации-дезадаптации. Таким образом, ИНС использовала 3 синдрома, выраженных в коэффициентах шкал ММР1 правил, которые в одних случаях объединяются в распознаваемый паттерн дезадаптации, и в паттерн адаптации - в других.

Так, синдром 1 представлен весами шкал: -0,45-1, -0А4-Р, +0,27-#5, -0,30-Щ +0,93 Ра, +0,27-5с, -0,98-Мг, -0,51-5/.

В свою очередь, синдром 2 составили:

+0,24-/г, -0,76 К, +0,39-0, -0,80-М, -0,49-М/ +0,94-Ря, +0,34-Р1, -0,95-М/, а синдром 3 представлен регрессионной по своей форме функцией

+0,66-1, -0ЛЗ-/7, -1,00-Х, -0,23-Яу, +0,63 Д, -0,39-Ну, -0,22-/V, +0,24-М/ +0,29-Ра,

-0,63 -Ри +0,51-Ма, -0,59-5/.

Оценка риска дезадаптации («распознавание образа дезадаптации») проводилась по следующему

алгоритму принятия решения: «наличие признаков синдрома 1» & «отсутствие признаков синдрома 2» & «наличие признаков сивдрома 2».

Заключение

Представляется, что многие проблемы медицинской психодиагностики, вызванные, прежде всего, методологическими проблемами создания психодиагностического инструментария (субъективность и экспертно-клинический характер многих методик, сложность адаптации психометрических требований к условиям методик клинической психодиагностики и др.) вполне могут быть преодолимы с помощью уже имеющихся информационных компьютерных технологий.

Литература

1.Дюк В.А. Компьютерная психодиагностика.

- СПб.: Братство, 1994. — 364 с.

2. Дюк В.А. Data Mining — интеллектуальный анализ данных// Byte. - 1999. -№9. - С. 18-24.

3. Кречетов Н. Продукты для интеллектуального анализа данных // Рынок программных средств. -1997. -№ 14-15. - С. 32-39.

4. Круглов В.В., Борисов В.В., Искусственные нейронные сети. Теория и практика. - М.: Телеком, 2001. -382 с.

5. Тарабрина Н.В. Посттравматическое стрессовое расстройство у ветеранов-инвалидов (участников боевых действий)/ сост. и общ. редакция Н.В. Тарабриной// в кн.: Клиническая психология: — СПб. : Питер, 2000. — С. 325—352.

6. Червинская К.Р., Щелкова О.Ю. Медицинская психодиагностика и инженерия знаний / Под ред. Л.И. Вассермана. - СПб.: Ювента; М.: Издательский центр «Академия», 2002. - 624 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.