ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2016 Управление, вычислительная техника и информатика № 3 (36)
УДК 004.89
DOI: 10.17223/19988605/36/9
М.Н. Головчинер, А.Ж. Дылыкова
ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧЕ ВЫЯВЛЕНИЯ ДОМИНАНТНЫХ ЛИЧНОСТНЫХ ХАРАКТЕРИСТИК РАЗЛИЧНЫХ КАТЕГОРИЙ РЕСПОНДЕНТОВ
Рассмотрена возможность применения аппарата нейронных сетей для решения задачи классификации в области психодиагностики. В качестве исходных данных используются результаты тестирования заключенных по методике Лири. В статье приводится структурно-функциональная схема созданного программного комплекса, описываются этапы его функционирования, виды нейронных сетей, используемых на каждом из этапов работы комплекса.
Ключевые слова: психодиагностика; личностная характеристика; классификация; кластеризация; персептрон; сеть Кохонена; слой Гроссберга; сеть встречного распространения.
В настоящее время нейронные сети (НС) различной архитектуры используются для решения широкого круга задач (прогнозирование, распознавание образов, классификация, сжатие данных и др.), в различных сферах деятельности [1]. Применение НС «в области медицины и, особенно, психологии за рубежом встречается значительно реже, а в отечественной практики оно представлено в основном единичными исследованиями» [2]. Отсутствие публикаций применительно к этим областям можно объяснить тем, что отдельные предпринимаемые попытки создания нейросетевых психологических моделей оказались неудачными, так как нейронные сети при тестировании показывали неприемлемо большие погрешности или не удалось подтвердить верность полученных результатов [3]. Поэтому авторы надеются, что их исследование по применению нейросетевых технологий для решения одной задачи в области психодиагностики представляют определенный интерес.
Была поставлена задача с помощью НС выявить наличие доминантных личностных черт респондентов, объединенных в группы, которые (личностные черты) можно было бы рассматривать как основу для классификации с дальнейшим прогнозированием поведения личности.
Респондентами выступали заключенные одной из томских колоний. Основой для формирования групп (возможных классов) выбраны статьи, по которым респонденты были осуждены. В качестве исходных данных взяты результаты психодиагностического тестирования по методике Т. Лири [4].
Выбор данной методики тестирования определяется тем, что для обучения НС сети требуется большой объем обучающей выборки. Тестирование в данной колонии проводится по нескольким психодиагностическим методикам, однако основной, применяемой ко всем заключенным, является методика Лири. Остальные методики являются вспомогательными и количество респондентов недостаточно для формирования обучающих выборок достаточного объема.
Методика Лири определяет степень выраженности следующих типов отношения тестируемого к окружающим:
1) авторитарный;
2) эгоистичный;
3) агрессивный;
4) подозрительный;
5) подчиняемый;
6) зависимый;
7) дружелюбный;
8) альтруистический.
Тест содержит 128 пунктов по 16 вопросов на каждую характеристику. Исследование включало два этапа.
На первом этапе решалась задача возможности выявления набора личностных черт, которые могли бы выступить основой для классификации. Данное исследование (решение задачи классификации) проводилось с использованием нейронной сети типа персептрон [5-7].
На втором этапе (при условии получения положительных результатов классификации) с помощью сети встречного распространения [5-7], объединяющей сеть Кохонена и слой Гроссберга, решалась задача кластеризации, результаты которой могли бы подтвердить или опровергнуть результаты классификации.
1. Этап 1. Классификация
Поскольку комбинации личностных характеристик, которые могли бы лечь в основу возможной классификации, заранее неизвестны, необходимо реализовать цикл работы персептрона на множествах выборок из первоначальных тестов, причем размеры входных векторов, как правило, влияют на структуру персептрона. Поэтому для автоматизации работ на данном этапе создан программный комплекс, структурно-функциональная схема которого представлена на рис. 1.
Комплекс позволяет генерировать входные данные в определенном формате, перебирая комбинации характеристик, подающиеся на вход нейронной сети, и включает следующие компоненты:
1. Подготовка входных наборов данных и создание персептрона.
2. Обучение и тестирование персептрона.
3. Запись результатов тестирования.
Подготовка входных наборов данных и создание персептрона. На каждом шаге работы на вход системы пользователь (аналитик) подает комбинацию статей для анализа (комбинации по двум определенным статьям, по трем и т. д.). Далее на этом шаге:
1) строится персептрон;
2) на вход системы подаются соответствующие массивы тестов.
Выход
Рис. 1. Структурно-функциональная схема программного комплекса
Создание персептрона. Общая конфигурация персептрона представлена на рис. 2. Количество нейронов выходного слоя равно количеству анализируемой группы статей (две, три и т. д.). Сеть включает один скрытый слой. Первоначальное количество нейронов скрытого слоя к(п) определяется по соответствующей формуле и в процессе анализа результатов работы сети может быть изменено.
В качестве активационной функции выбрана логистическая функция (сигмоид) у = 1+g-Cs , где
С > 0 - коэффициент ширины сигмоида по оси абсцисс.
Входной слой
Скрытый Выходной сл°й
Выход
k(n) m
Рис. 2. Структура персептрона
Обучение и тестирование персептрона. На очередном такте работы сеть обучается и тестируется на соответствующей комбинации личностных характеристик.
Поскольку длины входных векторов (параметр n на рис. 2) на каждом такте могут различаться, при смене количества анализируемых характеристик персептрон перестраивается путем изменения количества k(n) нейронов скрытого слоя.
Обучение персептрона осуществляется методом обратного распространения ошибки.
Результаты тестирования оцениваются в зависимости от указанной аналитиком точности. Если разница между результатом и ожидаемым значением меньше точности, то полагается, что сеть выдала верный результат. В противном случае на текущем такте аналитик может повторить обучение и тестирование, увеличив количество нейронов скрытого слоя.
Сами результаты записываются в файл и далее могут быть отображены на лист Excel [8].
2. Этап 2. Кластеризация
Задача кластеризации - объединение объектов в кластеры (группы) - родственна задаче классификации с одним отличием - отсутствием признаковой переменной. Кластеризация осуществляется с использованием одного из критериев, определяющих степень близости объектов по совокупности параметров, например Евклидово расстояние.
Нейронная сеть Кохонена (рис. 3) является одной из самых популярных сетей кластеризации. Особенность сети заключается в том, что основу ее обучения составляет конкуренция между нейронами. Обучение сети осуществляется без учителя, т.е. без заранее определенных групп кластеров. В процессе обучения сеть самостоятельно пытается разделить представленную совокупность объектов на группы.
При подаче произвольного входного вектора сеть активирует лишь один нейрон (победитель), связанный с одним из кластеров. Поскольку в рамках данного исследования цель использования сети Кохонена - подтверждение результатов классификации, полученных персептроном, на вход слоя Кохо-нена подаются вектора, составленные только из комбинаций доминантных характеристик, разделяющих классы респондентов.
Чтобы убедиться в адекватности кластеризации, осуществленной сетью Кохонена, т.е. в соответствии сформированных кластеров классам (статьям) респондентов, сеть Кохонена была объединена с сетью (звездой) Гроссберга в сеть встречного распространения (СВР), схема которой представлена на рис. 4.
Рис. 3. Структура сети Кохонена
Слой Кохонена Слой Гроссберга
Рис. 4. Структура сети встречного распространения
Слой Гроссберга предназначен для формирования требуемых выходных векторов по окончании обучения слоя Кохонена (формирование кластеров входных векторов).
По окончании обучения слоя Кохонена на вход СВР подается произвольный вектор, который выступает в качестве эталона выходного вектора слоя Гроссберга. Таким образом, слой Гроссберга обучается с учителем. Обучающая процедура заключается в том, что подстройке подвергаются только веса нейронов слоя Гроссберга, которые соединены с нейроном-победителем слоя Кохонена.
По окончании обучения, если оно прошло успешно, на выходе СВР будет построен эталон кластера, к которому сеть отнесла входной вектор. В терминах изучаемой предметной области если распределение заключенных по кластерам после завершения функционирования СВР «адекватно», то выходные векторы СВР можно считать эталонами ответов на вопросы для осужденного по соответствующей статье УК РФ. Распределение считается «адекватным», если совпадает с реальным более чем на 80%.
Реализация этапа кластеризации включает построение СВР, обучение и тестирование.
При построении сети количество классов, проанализированных персептроном, определяет количество нейронов в слое Кохонена, а размер входных векторов - в слое Гроссберга.
В таблице представлены результаты исследований по выявлению доминантных личностных характеристик при сравнительном анализе заключенных по двум статьям. В качестве погрешности классификации использовалась доля неверно распознанных респондентов в тестовой выборке.
Результаты исследования по двум статьям
Первая статья Доминантные разделяющие личностные характеристики, выявленные персептро-ном Погрешность классификации персептрона Погрешность кластеризации слоя Кохонена Вторая статья
Убийство Эгоистичный 0,27 0,22 Умышленное причинение тяжкого вреда здоровью
Убийство Эгоистичный, авторитарный, агрессивный 0,22 0,34 Кража
Убийство Авторитарный, подчиняемый 0,32 0,4 Незаконные приобретение, хранение, перевозка, изготовление, переработка наркотических средств, психотропных веществ или их аналогов
Умышленное причинение тяжкого вреда здоровью Подозрительный 0,27 0,2 Кража
Умышленное причинение тяжкого вреда здоровью Подчиняемый, эгоистичный 0,43 0,28 Незаконные приобретение, хранение, перевозка, изготовление, переработка наркотических средств, психотропных веществ или их аналогов
Кража Авторитарный, зависимый, альтруистический 0,16 0,3 Незаконные приобретение, хранение, перевозка, изготовление, переработка наркотических средств, психотропных веществ или их аналогов
Очевидно, что для решения задачи по выявлению наличия доминантных характеристик достаточно проводить сравнительный анализ тестовых массивов только по двум статьям. Однако задачу прогнозирования необходимо решать на возможно более полном наборе классов, что позволяет осуществить данный программный комплекс.
Заключение
В настоящей статье представлено описание исследовательских работ по проверке применимости технологии нейронных сетей к задаче выявления личностных характеристик, определяющих различие в психологических портретах разных категориях респондентов (доминантных личностных характеристик). Респондентами рассматривались группы осужденных по различным статьям УК РФ. В качестве исходных данных для проведения исследований были взяты результаты психодиагностического тестирования осужденных по методике Лири, а в качестве инструментария - нейронная сеть типа персептрон и сеть встречного распространения, объединяющая сеть Кохонена и слой Гроссберга.
Исследования проводились на специально созданном программном комплексе, позволяющем автоматизировать формирование вариантов тестов, создание требуемых конфигураций сетей, процессы обучения и тестирования сетей, запоминания и визуализации результатов.
Приведенные в статье примеры результатов исследований дают основания рассматривать описанный подход к решению определенного класса задач психодиагностики как достаточно перспективный, способный заинтересовать специалистов-практиков соответствующих направлений психологии.
ЛИТЕРАТУРА
1. Ясницкий, Л.Н. Нейронные сети - инструмент для получения новых знаний: успехи, проблемы, перспективы // Нейроком-
пьютеры: разработка, применение. 2015. № 5. С. 48-56. URL: http://www.permai.ru/files/publications/193.pdf (дата обращения: 20.03.16).
2. Беребин М.А., Пашков С.В. Опыт применения искусственных нейронных сетей для целей дифференциальной диагностики и
прогноза нарушений психической адаптации // Вестник Южно-Уральского государственного университета. Сер. Компью-
терные технологии, управление, радиоэлектроника. 2006. № 14 (69). С. 41-45. URL: http://cyberleninka.ru/article/ri/opyt-primeneniya-iskusstvennyh-neyronnyh-setey-dlya-tseley-differentsialnoy-diagnostiki-i-prognoza-narusheniy-psihicheskoy-adaptat-sii#ixzz43eB2Irr9 (дата обращения: 25.03.16).
3. Мхитарян К. Рецензия на статью Л.Н. Ясницкого, Ю.А. Михалевой, Ф.М. Черепанова «Возможности методов искусственного ин-
теллекта для выявления и использования новых знаний на примере задачи управления персоналом» // Журнал формирующихся направлений науки. 2014. Вып. 6. URL: http://www.unconv-science.org/pdl76/mkhitaryan-ru.pdf (дата обращения: 20.03.16).
4. Методика диагностики межличностных отношений Лири. URL: http://azps.ru/tests/tests_liri.html (дата обращения: 15.03.16).
5. Осовский С. Нейронные сети для обработки информации. М. : Финансы и статистика, 2002. 344 с.
6. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. М. : Мир, 1992. 118 с.
7. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. 2-е изд. М. : Горячая линия-Телеком, 2002. 382 с.
8. Работа с ^m сервером Excel. URL: http://wladm.narod.ru/C_Sharp/comexcel.html (дата обращения: 15.03.16).
Головчинер Михаил Наумович, канд. техн. наук, доцент. E-mail: [email protected] Дылыкова АюнаЖимбеевна. E-mail: [email protected] Томский государственный университет
Поступила в редакцию 1 марта 2016 г. Golovchiner Michael Naumovich, Dylykov Ayuna Rymbaevna (Tomsk State University, Russian Federation).
The use of neural networks in the task of identifying the dominant personal characteristics of different categories of respondents.
Keywords: psychodiagnostics; personal characteristic; classification; clusterization; perceptron; Kohonen network; Grossberg layer; counter propagation network.
DOI: 10.17223/19988605/36/9
In the article the description of research papers on the applicability check of neural network technology to the problem of the personal characteristics is presented. The personal characteristics define the distinction in psychologic portraits of various categories of respondents (dominant personal characteristics).
As initial data for carrying out the research, the results of psychodiagnostic testing of respondents by means of Leary's procedure were taken and the toolkit is comprised of the perceptron neural network and the network of counter propagation combining the Ko-honen network and the Grossberg layer. Research includes two stages.
Stage 1. Classification. The problem of detection possibility of a set of personal traits which could act as a basis for classification is solved. The research was carried out with the use of a perceptron neural network. As combinations of personal characteristics which could be a basis of possible classification are unknown in advance, it is necessary to realise a perceptron cycle on sets of samples from primary tests, and the measurements of input vectors, as a rule, influence on the perceptron structure.
Therefore, for automation of process at the given stage (preparation of input data sets, neural network generation and training, and classification results display) the specialised program complex is created.
Stage 2. Clusterization. At the second stage (provided that the positive results of classification are obtained) by means of a counter propagation network the clusterization problem is solved, which results could confirm or deny the results of classification.
The examples of research results allow considering the described approach to the solution of a certain class of problems of psychodiagnostics as perspective enough and capable to interest practitioners of the corresponding directions of psychodiagnostics.
REFERENCES
1. Yasnitsky, L.N. (2015) Neyronnye seti - instrument dlya polucheniya novykh znaniy: uspekhi, problemy, perspektivy [Neural net-
work - a tool for gaining new knowledge: achievements, problems, prospects]. Neyrocompyutery: razrabotka, primenenie. 5. pp. 48-56. [Online] Available from: http://www.permai.ru/files/publications/193.pdf. (Accessed: 15th March 2016).
2. Berebin, M.A. & Pashkov, S.V. (2006) Opyt primeneniya iskusstvennykh neyronnykh setey dlya tseley differentsial'noy diagnostiki i
prognoza narusheniy psikhicheskoy adaptatsii [Experience of application of artificial neural networks for the purposes of differential diagnosis and prognosis of mental adaptation]. Vestnik Yuzhno-Ural'skogo gosudarstvennogo universiteta. Ser. Komp'yu-ternye tekhnologii, upravlenie, radioelektronika - Uzhno-Yralsk State University Journal of Computer technology, Control, Radio Electronics. 14(69). pp.41-45.
3. Mkhitaryan, K. (2014) Retsenziya na stat'yu L.N. Yasnitskogo, Yu.A. Mikhalevoy, F.M. Cherepanova "Vozmozhnosti metodov is-
kusstvennogo intellekta dlya vyyavleniya i ispol'zovaniya novykh znaniy na primere zadachi upravleniya personalom" [Review of the article L.N. Yasnitsky, Y.A.Mikhaleva, F.M.Cherepanova "The possibility of artificial intelligence methods for detection and use of new knowledge to the problem of personnel management"]. Zhurnal formiruyushchikhsya napravleniy nauki - International Journal of Unconventional Science. 6. pp. 42-43. [Online] Available from: http://www.unconv-science.org/pdf/6/mkhitaryan-ru.pdf. (Accessed: 15th March 2016).
4. AZPS.ru (n.d.) Metodika diagnostiki mezhlichnostnykh otnosheniy Liri [The technique of diagnostics of interpersonal relations
Leary]. [Online] Available from: http://azps.ru/tests/tests_liri.html. (Accessed: 15th Mach 2016).
5. Osovskiy, S. (2002) Neyronnye seti dlya obrabotki informatsii [Neural network for information processing]. Moscow: Finansy i
statistika.
6. Wasserman, P. (1992) Neyrokomp'yuternaya tekhnika: Teoriya ipraktika [Neurocomputer technique: Theory and practice]. Moscow: Mir.
7. Kruglov, V. V. & Borisov, V. V. (2002) Iskusstvennye neyronnye seti. Teoriya i praktika [An artificial neural network. Theory and
practice]. 2nd ed. Moscow: Goryachaya liniya.
8. Narod. ru. (n.d.) Rabota s Som serverom Excel [Work with the Com server Excel]. [Online] Available from: http://wladm.narod.ru/C_Sharp/comexcel.html. (Accessed: 15th March16).