Научная статья на тему 'ОПРЕДЕЛЕНИЕ ТИПА ХАРАКТЕРА ЛИЧНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТЬЮ НА ПРИМЕРЕ МЕТОДИКИ MMPI'

ОПРЕДЕЛЕНИЕ ТИПА ХАРАКТЕРА ЛИЧНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТЬЮ НА ПРИМЕРЕ МЕТОДИКИ MMPI Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
281
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИЧНОСТНЫЕ ОСОБЕННОСТИ / ТЕСТИРОВАНИЕ / ПСИХОДИАГНОСТИКА / НОРМАЛЬНОСТЬ И ПАТОЛОГИЧНОСТЬ ЛИЧНОСТИ / НЕЙРОСЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Полозов Андрей Анатольевич, Штарк Мария Павловна, Полозова Кристина Андреевна, Мальцева Наталья Анатольевна, Ахметзянов Артур Рахимзянович

Актуальность и цели. В работе поднимается проблема диагностики типов характера (ТХ) с помощью теста MMPI. Обычный тест MMPI состоит из 600 вопросов и занимает не менее 1,5 часов, при этом работодатель находится в зависимости от самооценки тестируемого, а ретестовая надежность MMPI не установлена. Материалы и методы. Исследуется возможность определения одного из восьми ТХ по MMPI по фотографии лица с использованием нейронной сети. Для этого с помощью теоретико-методологического анализа был выбран наиболее точный инструмент измерения типологии черт личности, после чего был собран датасет с фотографиями людей, согласившихся участвовать в эксперименте и прошедших двойное тестирование. Далее на полученном датасете, состоящем из 40 581 фотографии, была обучена нейронная сеть. Результаты . Созданная сверточная нейронная сеть (CNN) верно распознала 30 % ТХ из предоставленных ей 8116 фотографий при более высокой оперативности. Выводы. Полученные результаты сравнимы с оценками точности бумажного тестирования и показывают перспективность данного подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Полозов Андрей Анатольевич, Штарк Мария Павловна, Полозова Кристина Андреевна, Мальцева Наталья Анатольевна, Ахметзянов Артур Рахимзянович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DETERMINING OF PERSON’S CHARACTER TYPE BY CONVOLUTIONAL NEURAL NETWORK (USING THE MMPI METHODOLOGY)

Background. This paper raises the problem of diagnosing character types (CT) using the MMPI test. The usual MMPI test consists of 600 questions and takes at least 1.5 hours, where the employer depends on the self-esteem of the test taker, and the retest reliability of the MMPI has not been established. Materials and methods. This paper researches the possibility of determining one of the eight CT by MMPI by a photo with trained convolutional neural network (CNN). To do this, using theoretical and methodological analysis, the most accurate tool for measuring the typology of personality traits was selected, after which a dataset was collected with photos of people who agreed to participate in the experiment and passed double testing. Next, a neural network was trained on the resulting dataset consisting of 40,581 photos. Results . The convolutional neural network (CNN) created by us correctly recognized 30 % of the 8116 photos provided to it with higher speed. Conclusions . Obtained results are comparable with estimated accuracy of paper testing and show the prospects of this approach.

Текст научной работы на тему «ОПРЕДЕЛЕНИЕ ТИПА ХАРАКТЕРА ЛИЧНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТЬЮ НА ПРИМЕРЕ МЕТОДИКИ MMPI»

УДК 004.9

doi:10.21685/2227-8486-2023-1-10

ОПРЕДЕЛЕНИЕ ТИПА ХАРАКТЕРА ЛИЧНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТЬЮ НА ПРИМЕРЕ МЕТОДИКИ MMPI

А. А. Полозов1, М. П. Штарк2, К. А. Полозова3, Н. А. Мальцева4, А. Р. Ахметзянов5

13 4 Уральский федеральный университет, Екатеринбург, Россия 2 Майнитек, Верхняя Пышма, Свердловская область, Россия

5 Сургутский государственный педагогический университет, Сургут, Россия

Аннотация. Актуальность и цели. В работе поднимается проблема диагностики типов характера (ТХ) с помощью теста MMPI. Обычный тест MMPI состоит из 600 вопросов и занимает не менее 1,5 часов, при этом работодатель находится в зависимости от самооценки тестируемого, а ретестовая надежность MMPI не установлена. Материалы и методы. Исследуется возможность определения одного из восьми ТХ по MMPI по фотографии лица с использованием нейронной сети. Для этого с помощью теоретико-методологического анализа был выбран наиболее точный инструмент измерения типологии черт личности, после чего был собран датасет с фотографиями людей, согласившихся участвовать в эксперименте и прошедших двойное тестирование. Далее на полученном датасете, состоящем из 40 581 фотографии, была обучена нейронная сеть. Результаты. Созданная сверточная нейронная сеть (CNN) верно распознала 30 % ТХ из предоставленных ей 8116 фотографий при более высокой оперативности. Выводы. Полученные результаты сравнимы с оценками точности бумажного тестирования и показывают перспективность данного подхода.

Ключевые слова: личностные особенности, тестирование, психодиагностика, нормальность и патологичность личности, нейросеть

Для цитирования: Полозов А. А., Штарк М. П., Полозова К. А., Мальцева Н. А., Ахметзянов А. Р. Определение типа характера личности сверточной нейронной сетью на примере методики MMPI // Модели, системы, сети в экономике, технике, природе и обществе. 2023. № 1. С. 149-163. doi:10.21685/2227-8486-2023-1-10

DETERMINING OF PERSON'S CHARACTER TYPE

BY CONVOLUTIONAL NEURAL NETWORK (USING THE MMPI METHODOLOGY)

A.A. Polozov1, M.P. Shtark2, K.A. Polozova3, N.A. Maltseva4, A.R. Akhmetzyanov5

1, 3, 4 Ural Federal University, Yekaterinburg, Russia 2 Maynitek LLC, Verkhnyaya Pyshma, Sverdlovsk region, Russia 5 Surgut State Pedagogical University, Surgut, Russia

Abstract. Background. This paper raises the problem of diagnosing character types (CT) using the MMPI test. The usual MMPI test consists of 600 questions and takes at least 1.5

© Полозов А. А., Штарк М. П., Полозова К. А., Мальцева Н. А., Ахметзянов А. Р., 2023. Контент доступен по лицензии Creative Commons Attribution 4.0 License / This work is licensed under a Creative Commons Attribution 4.0 License.

hours, where the employer depends on the self-esteem of the test taker, and the retest reliability of the MMPI has not been established. Materials and methods. This paper researches the possibility of determining one of the eight CT by MMPI by a photo with trained convo-lutional neural network (CNN). To do this, using theoretical and methodological analysis, the most accurate tool for measuring the typology of personality traits was selected, after which a dataset was collected with photos of people who agreed to participate in the experiment and passed double testing. Next, a neural network was trained on the resulting dataset consisting of 40,581 photos. Results. The convolutional neural network (CNN) created by us correctly recognized 30 % of the 8116 photos provided to it with higher speed. Conclusions. Obtained results are comparable with estimated accuracy of paper testing and show the prospects of this approach.

Keywords: personality traits, testing, psychodiagnostics, normality and pathology of personality, neural network

For citation: Polozov A.A., Shtark M.P., Polozova K.A., Maltseva N.A., Akhmetzyanov A.R. Determining of person's character type by convolutional neural network (using the MMPI methodology). Modeli, sistemy, seti v ekonomike, tekhnike, prirode i obshchestve = Models, systems, networks in economics, technology, nature and society. 2023;(1):149-163. (In Russ.). doi:10.21685/2227-8486-2023-1-10

Введение

Психодиагностика как получение объективной информации о развитии личности, типологизации личности представляет огромный научный интерес. Цифровая трансформация способов получения необходимых для обеспечения психологической деятельности данных претерпела существенные изменения, убрав из подготовительного этапа и этапа интерпретации данных бланочный (бумажный) вариант психодиагностики. Ресурсы IT-технологий и активное внедрение нейросети в процессы исследования психологических феноменов благополучия человека позволяют расширить форму применения психодиагностики, создав возможности для получения информации о личности и ее развитии.

Наиболее адекватной для целей типирования личности и психологического отбора, по нашему мнению, является Миннесотский многофазный личностный тест (MMPI) - результат многолетнего труда и творческих поисков клинических психологов McKinley, Hathaway в 1948 г. Коэффициент ретесто-вой надежности шкал MMPI в различных группах обследованных колеблется от 0,05 до 0,86 и в среднем составляет 0,50-0,80 [1]. Сокращенный многофакторный опросник для исследования личности (СМОЛ) является адаптированным и стандартизированным вариантом психологического анкетного теста Mini-Mult (71 вопрос), который представляет собой сокращенную форму опросника MMPI. Коэффициент ретестовой надежности шкал в различных группах колеблется от 0,05 до 0,86. Согласно данным [2], тест-ретестовая корреляция между полной формой MMPI и Mini-Mult показала некоторые потери в надежности краткой формы (в среднем 9 %).

Материалы и методы исследования

Анализ данных, полученных в результате диагностики черт характера личности, базируется на средних показателях. В связи с этим значима проблема надежности психологической оценки. Средние значения являются

ориентирами, «опорными» точками диагностического заключения исследователя, так как дают представления о некотором стандарте, норме проявления личностных черт. Анализ представлений о наиболее часто встречающихся характеристиках позволяет выявить ориентиры, служащие основой построения индивидуальности. Мода 1 отражает типы включенных в выборку групп, поэтому целесообразна ориентация на частотные тенденции при проведении психологического исследования. В связи с этим выявленные сочетания черт «модальной» личности, т.е. соотнесенного с модой, будут более надежны для построения прогноза, нежели сочетания черт средних значений, вычисленного по традиционной формуле, где точкой отсчета является среднее арифметическое.

Цель исследования, создание сверточной нейронной сети (CNN), распознающей на основе фотографии лица один из восьми типов характера (на примере методики MMPI).

Решаемые в исследовании задачи:

- выделение наиболее адекватных психодиагностических инструментов для определения типов характера;

- создание базы данных из фотографий людей, которые прошли двойное тестирование с совпадающими результатами (ретестовой надежностью);

- подбор алгоритма создания сверточной нейросети для получения наиболее высокого уровня правильного распознавания типа характера.

Гипотеза работы: замена бумажных технологий самоидентификации типов характера на нейронную сеть покажет более высокий результат точности ответов за счет обобщения всех имеющихся изображений и отсутствия фактора субъективности оценки.

ММР1 представляет собой тест анкетного типа, состоящий из 566 утверждений, которые испытуемые должны признать верным для себя или отвергнуть. СМОЛ является адаптированным и стандартизированным вариантом психологического анкетного теста Mini-Mult, который представляет собой сокращенную форму опросника MMPI. Методика позволяет оценить уровень нервно-эмоциональной устойчивости, степень интеграции личностных свойств, уровень адаптации личности к социальному окружению. Тест состоит из 71 утверждения, относящихся к 11 шкалам: восемь основных (1, 2, 3, 4, 6, 7, 8, 9) и три дополнительных (L, F, K). Номера шкал СМОЛ совпадают с номерами соответствующих шкал MMPI. Каждая из основных шкал связана с определенным свойством личности. Подробное описание шкал и схемы интерпретации тестовых результатов излагается в специальных руководствах. На этапе предварительного тестирования используются только численные значения показателей СМОЛ.

Другим тестом ТХ было описание ключевых характеристик из справочника [3]. Тестируемый читал все восемь описаний и выбирал наиболее соответствующее. В случае совпадения результатов с результатами теста СМОЛ считали ТХ установленным. В этом случае 2-3 фотографии тестируемого с его страницы в соцсетях вносили в соответствующую группу датасета.

Отвечая на задачу измерения существенных свойств в 1948, 1954 гг. в результате многолетнего труда была разработана методика MMPI, в которой выделены следующие типы характера:

1. Шизоидный - одиночество, фантазии, холодность, избирательность.

2. Нарцисс - зависть, переоценка себя, потребность в преклонении.

3. Параноидальный - мнительность, пренебрежение другими, неуживчивость.

4. Компульсивный - сомнения, педантизм, мешающая делу скрупулезность.

5. Психопатический - бессердечие, желание «сделать всех», пренебрежение.

6. Истерический - демонстративность, театральность, привлечение внимания.

7. Депрессивный - соглашательство, боязнь быть покинутым, депрессия.

8. Мазохистический - терпение в надежде на последующее благо.

Таким образом, на начальном этапе работы ожидаемым числом типов

характера стало восемь.

Сверточная нейронная сеть (Convolutional Neural Network, CNN) -специальная архитектура искусственных нейронных сетей, предложенная Яном Лекуном в 1988 г. и нацеленная на эффективное распознавание образов.

Исследователи отмечают: «Оценка личностных качеств в настоящее время является ключевой частью многих важных социальных действий, таких как поиск работы, предотвращение несчастных случаев на транспорте, лечение заболеваний, работа полиции и межличностные взаимодействия. В предыдущем исследовании мы предсказывали личность на основе положительных образов студентов колледжа. Хотя этот метод обеспечивает высокую точность, опора только на положительные изображения приводит к потере большей части информации, связанной с личностью. Наши новые результаты показывают, что, используя реальные 2,5D статические изображения контуров лица, можно делать статистически значимые прогнозы о более широком диапазоне личностных качеств как мужчин, так и женщин. Мы решаем задачу всестороннего понимания черт личности человека, разрабатывая мультиперспективную 2,5-мерную гибридную личностно-вычислительную модель для оценки потенциальной корреляции между статическими изображениями контура лица и характеристиками личности. Наши экспериментальные результаты показывают, что глубокая нейронная сеть, обученная на больших размеченных наборах данных, может надежно прогнозировать многомерные характеристики личности людей с помощью 2,5D статических изображений контуров лица, а точность прогнозирования выше, чем у предыдущего метода с использованием 2D-изоб-ражений» [4].

Определение типа по типологии MBTI обычно проводят с помощью композитных изображений, составленных из лиц людей с определенной психологической функцией данной типологии и «Алгоритм психодиагностики по асимметрии лица» А. Н. Ануашвили [5]. В частности, специалисты из Mail.Ru Group и Frank RG [6, 7] исследовали влияние психологического типа потребителя на его финансовое поведение на основе MBTI. Сравнение лица тестируемого человека с композитными лицами обычно происходит с помощью сверточ-ной нейронной сети. Есть решения, осуществляющие поиск лиц на изображении с помощью гистограмм направленных градиентов HOG (https://github.com/ IvanBein/CompVision).

Схожая с нашей работа проводилась исследователями из Высшей школы экономики. Российские математики и психологи ВШЭ разработали нейросеть, которая научилась угадывать некоторые черты характера людей по их

фотографиям, и опубликовали статью в журнале Scientific Reports [8]. Главное отличие состоит в том, что ими изучалась возможность прогнозирования профилей личности Большой пятерки на основе фотографий лица человека. Участники-добровольцы (N = 12 447) предоставили свои фотографии лиц (31 367 изображений) и заполнили самооценку черт Большой пятерки. Затем был обучен каскад искусственных нейронных сетей (ИНС) на большом размеченном наборе данных, чтобы предсказать результаты Большой пятерки, о которых сообщают сами участники. Наивысшая корреляция между наблюдаемыми и предсказанными результатами теста были среди добросовестности (сознательности) с показателем 0,360 для мужчин и 0,355 для женщин, а средняя корреляция составила 0,243.

Изображения (фотографии и видеокадры) подвергались трехступенчатой процедуре проверки, направленной на удаление фальшивых и некачественных изображений. Во-первых, изображения без человеческих лиц или с несколькими человеческими были удалены с помощью алгоритмов компьютерного зрения. Во-вторых, изображения знаменитостей идентифицировались и удалялись с помощью специальной нейронной сети, обученной на наборе данных фотографий знаменитостей (CelebFaces Attributes Dataset (CelebA), N > 200 000), которая была дополнительно обогащена изображениями российских знаменитостей. После этого во время ручной проверки были удалены фото с частично закрытыми лицами, фото со следами изменения в графических редакторах, а также любые другие поддельные изображения.

Изображения, сохраненные для последующей обработки, были преобразованы в одноканальный 8-битный формат оттенков серого с использованием платформы OpenCV (opencv.org). Положение головы измерялось с помощью собственной специализированной нейронной сети (многослойного персеп-трона), обученной на выборке из 8000 изображений.

Затем ими была оценена эмоциональная нейтральность с помощью Microsoft Cognitive Services API и были удалены эмоциональные фото. Наконец, были применены функции обнаружения лица и глаз, выравнивания, изменения размера и обрезки, доступные в наборе инструментов с открытым исходным кодом Dlib (dlib.net).

Окончательный объединенный набор данных включал 12 447 действительных вопросников и 31 367 связанных фотографий после процедур проверки данных (ниже). Возраст участников варьировался от 18 до 60 лет. Набор данных был разбит случайным образом на набор обучающих данных (90 %) и тестовый набор данных (10 %), используемый для проверки модели прогнозирования. Набор проверочных данных включал ответы 505 мужчин, предоставивших 1224 изображения лица, и 740 женщин, предоставивших 1913 изображений. Из-за полового диморфизма черт лица и некоторых личностных черт все прогностические модели обучались и проверялись отдельно для мужских и женских лиц.

Полученные данные убедительно подтверждают возможность прогнозирования многомерных профилей личности на основе статических изображений лица с использованием ИНС, обученных на больших размеченных наборах данных.

Схожие задачи c акцентом на различные аспекты решались в работах [9-16].

Экспериментальная часть

В алгоритме используется сверточная нейронная сеть Яе8пе134 [4].

Она состоит из 34 слоев свертки и 3,6 миллиардов параметров обучения. Данная нейросеть достигла наименьшей ошибки в задачах классификации, которая превзошла даже человеческий результат.

Основная идея сверточной сети заключается в постепенном изучении более сложных признаков. Первый слой изучает края, второй слой изучает формы, третий слой - объекты, все последующие слои способны обучать сочетание характерных признаков каждого класса. Таким образом образуется иерархическая структура, где каждый следующий уровень выделяет все более и более высокоуровневые признаки.

Среди основных достоинств сети Яе8№1 рассматривается решение проблемы затухающего градиента, когда с увеличением количества слоев свертки ухудшается точность предсказания.

Чтобы преодолеть эту проблемы, в архитектуру сети были добавлены так называемые остаточные блоки. Сверточные слои организованы в так называемые вычислительные блоки (рис. 1), которые трансформируют и передают информацию от уровня к уровню. Суть таких чередующихся блоков заключается в добавлении выходных данных предыдущего уровня в слой впереди:

Y = F (x,{Wi}) + x. (1)

В случае когда выходные данные x и функция F(x) имеют разную размерность, данные умножаются на линейную проекцию W, чтобы расширить каналы быстрого доступа для соответствия. Это позволяет объединить входные данные x и F(x) в качестве входных данных для следующего слоя.

Это решает проблему деградации, понижения точности, характерную для глубоких нейронных сетей.

В качестве финального классификатора в Яе8№134 используется рооН^-слой с 80йшах-функцией, способный выявить наиболее значимые параметры входных данных и определить вероятность принадлежности к тому или иному классу.

Рис. 1. Вычислительный блок сети КеБ№134

Размер изображения изменяется с помощью случайной выборки его короткой стороны в [256, 480] для увеличения масштаба. Кадрирование 224^224 выбирается случайным образом из изображения или его горизонтального смещения с вычитанием среднего значения для каждого пикселя. Скорость обучения стартует с 0,1 и делится на 10, когда изменение ошибок выходит на плато,

модели обучаются вплоть до 60^10 000 итераций. Они используют снижение веса 0,0001 и импульс 0,9 [8, 17].

Для подготовки изображений (обрезка и поворот лица) используется библиотека img2pose, написанная с использованием библиотеки PyTorch. На одной из стадий эксперимента использовалась библиотека Dlib. Dlib - библиотека, содержащая алгоритмы машинного обучения и различные инструменты для работы с изображениями лиц. В ней реализованы методы обнаружения лица на фотографии с применением HOG, глубокой нейронной сети и других способов. Многие библиотеки и фреймворки, заточенные под работу с изображениями лиц, используют dlib под капотом. Нейрон получает на вход только ограниченный участок изображения h х w. Следующий нейрон работает со следующим участком изображения, который может частично пересекаться с участком соседнего нейрона. CNN создает дескриптор из 128 чисел так, что у одного и того же человека дескрипторы в евклидовом пространстве будут находиться ближе к друг другу, а у разных людей дальше.

В исследовании приняли участие мужчины и женщины в возрасте от 18 лет, выразившие желание добровольного участия в исследовании черт характеров. Общее количество испытуемых 2000 человек [18, 19]. На сервисе profurfu.ru использовался тест СМОЛ, который представляет собой сокращенную форму опросника MMPI. Тестируемый читал все восемь описаний и выбирал наиболее соответствующее. В случае совпадения результатов с результатами теста СМОЛ тип характера испытуемого считали установленным. Однако ретесто-вая надежность СМОЛ на данном этапе достоверно не установлена.

В связи с тем, что данные по ретестовой надежности MBTI, СМОЛ неизвестны, возникла необходимость в использовании второго теста. Авторы предполагали, что определение ТХ двумя разными тестовыми решениями позволит сформировать датасет из надежных данных. Выбор тестов для данного набора ТХ был невелик. Другим тестом ТХ стало описание ключевых характеристик из справочника [3]. Тестируемый читал все восемь описаний и выбирал наиболее соответствующее. В случае совпадения результатов с результатами теста СМОЛ считали ТХ установленным. В этом случае 2-3 фотографии тестируемого с его страницы в соцсетях вносили в соответствующую группу датасета.

Если взять последние 2000 тестированных и попытаться определить их принадлежность к типу характера, то получим данные табл. 1. Поскольку одновременно определяли MBTI, то данные приведены с учетом этого фактора.

Как видно из табл. 1, в наибольшей степени встречается шизоидный тип характера, для которого характерна замкнутость, отгороженность от окружающих, неспособность или нежелание устанавливать контакты, снижение потребности в общении. Сочетание противоречивых черт в личности и поведении - холодности и утонченной чувствительности, упрямства и податливости, настороженности и легковерия, апатичной бездеятельности и напористой целеустремленности, необщительности и неожиданной назойливости, застенчивости и бестактности, чрезмерных привязанностей и немотивированных антипатий, рациональных рассуждений и нелогичных поступков. Меньше всего его любят параноидальные и нарциссические личности.

Таблица 1

Соотношение тестируемых по типам личности (MBTI) и типам характера (%)

Типы личности/ характера ENTP ISFP ESFJ INTJ J W ISTJ INFP ESTP INTP ESFP ENTJ ISFJ ESTJ J PF W ISTP % по ТХ

Шизоидный 1,9 0,9 1,9 2,1 2,7 1,5 2,1 0,6 2,8 0,6 1,3 0,8 0,9 2,1 0,4 2,3 24,9

Параноидальный 0,0 0,0 1,1 0,2 0,8 0,4 0,6 0,4 1,1 0,4 0,4 0,8 0,2 0,9 0,2 0,4 7,8

Нарцисс 0,2 0,6 1,1 0,4 0,6 0,0 0,4 0,2 0,6 0,4 0,4 0,2 0,8 0,6 0,6 0,9 7,8

Психопатический 0,8 0,8 1,3 0,6 1,5 0,2 0,6 0,2 1,3 0,4 0,9 0,6 1,9 1,1 0,4 0,8 13,3

Компульсивный 0,4 1,1 1,5 0,6 0,4 0,4 1,1 0,4 0,4 1,1 0,8 1,5 1,3 1,3 1,3 1,9 15,6

Истерический 0,4 0,4 0,8 0,4 0,9 0,2 0,9 0,8 0,4 0,4 0,2 0,9 0,2 1,1 0,4 1,1 9,5

Депрессивный 0,2 0,8 1,5 1,3 0,4 0,9 0,0 0,2 0,2 0,4 0,8 0,6 0,9 0,9 0,6 2,1 11,8

Мазохистический 0,8 0,4 0,4 0,4 0,9 0,4 0,8 0,0 0,8 1,1 0,8 0,2 0,8 0,8 0,4 0,8 9,5

% от всех 4,55 4,93 9,68 5,88 8,16 4 6,45 2,66 7,59 4,74 5,5 5,5 7,02 8,92 4,17 10,2 100

Примерно в середине группы расположены компульсивный, психопатический и депрессивный типы характера.

Другим важным наблюдением для указанных последних 2000 из числа тестированных следует считать надежность тестирования. Только 32 % тестированных показали одинаковый результат на обоих тестах. В остальных случаях их мнение расходилось. Это исходная точка сравнения, которая показывает целесообразность нашей работы. Мы накапливали данные по тестированным и не публиковались долгое время, поскольку полученные значения были ниже 32 %. В этом случае значимость теста СМОЛ, например, была выше созданной нами CNN.

В ходе работы провели два предварительных эксперимента. Долгое время подбирали технологию CNN для данного исследования. Например, искали возможность для использования так называемых точек Landmarks для тестирования по типам характера. В библиотеке dlib существует программа, которая возвращает координаты 68 точек на лице. Это позволяет, например, получить средние значения таких координат для всех фотографий по каждому типу характера. В случае успеха мы могли получить еще более высокие проценты распознавания, однако на практике наш эксперимент не удался. Все-таки индивидуальные различия, связанные с остальными личностными чертами, оказались слишком велики для использования данного инструментария. В другом предварительном эксперименте использовался язык программирования С++ и библиотека Dlib. Нейронная сеть из библиотеки Dlib имеет архитектуру сети ResNet 34 с несколькими удаленными слоями и уменьшением количества фильтров на слой вдвое. Сеть была обучена с нуля на наборе данных около 3 миллионов лиц. Этот набор данных является производным от нескольких наборов данных. Модель имеет точность 99,38 % в стандартном тесте «Labeled Faces in the Wild». На основе модели был обучен классификатор лиц по типу характера. Обучение проводилось на 13 685 фотографиях лиц. На фотографии выполняется поиск лиц с помощью детектора лиц, далее найденное лицо передается на нейросеть. Нейронная сеть выдает вектор признаков размерностью 128, на основе этого вектора выполняется классификация. Точность классификатора составила 20 %. Сеть обучалась четыре дня.

Накопление фотографий шло достаточно медленно в течение нескольких лет. На сегодня накоплено 44 000 фотографий.

Исходный датасет по итогам работы состоял из 44 000 фотографий, полученных от 16 000 тестированных. Есть участники, имеющие разное число фото, например только одно, поэтому детальная оценка числа тестированных затруднительна. Процесс подготовки данных для CNN TX начинается с обрезания всех фото. Оставляют только овал лица. Так проще обучить CNN. Однако этот процесс сопряжен с потерями определенной части фотографий. Фото были разделены на восемь групп. Требования к фотографиям: без экспрессии, фото в профиль, фото в фас, не менее 200*200 пикселов, не групповые, без очков, головного убора, с минимальным отклонением положения головы от вертикали. Допускались фото с небольшим поворотом или наклоном лица. Однако для лучших результатов CNN целесообразно обрезать фотографии и тем самым избавить нейросеть от ненужной работы.

Обрезка фото с помощью библиотеки, детектирующей лица, убирает также и фотографии в слишком плохом качестве. Далее датасет был проверен вручную на отсутствие артефактов обрезки. После обрезки фото в нашем распоряжении осталась 40 581 фотография. Тренировочный датасет составлял 80 % датасета, а тестовый - 20 %. Таким образом, в среднем, по 4000 фото на каждый ТХ. Отдельно был создан тестовый датасет размером 8116 изображений.

Использовался следующий стек технологий: язык Python, библиотеки Keras, Tensorflow, PyTorch, Numpy, Pandas, Sklearn. На рис. 2 справа показана структура использованной нами нейросети ResNet34.

VGG-19 34-layer plain 34-layer residual

+ - -

fc lOOO

Рис. 2. Структура использованной нейросети 157

Она вдохновлена нейросетью VGG, при этом к ней добавлены остаточные соединения, которые превращают сеть в ее остаточную версию. Это решает проблему нейросети VGG с затухающим градиентом, который не позволял ей наращивать глубину слоев. С помощью ResNet градиенты могут передаваться непосредственно через пропускные соединения в обратном направлении от более поздних слоев к начальным фильтрам. Они обозначены закругленными стрелками справа от блоков.

Conv - слой свертки, который создает ядро свертки указанного размера (размером 3*3 или 7*7 для первого слоя) для извлечения признаков изображения. На схеме нейросети ResNet34 каждый из слоев следует одному и тому же паттерну: мы видим группы слоев с фиксированным размером карты признаков (feature map) со следующими параметрами: [64, 128, 256, 512], причем пропускные соединения обходят входные данные каждые два слоя.

Pool и avg pool - слоя подвыборки, выбирающие из заданного окна максимальный элемент и снижающий размерность предыдущего слоя.

Нейросеть имеет следующие слои (из-за размера графика они не изображены на рисунке):

- Flatten - вспомогательный слой, который позволяет перейти от свер-точной части сети, выделяющей признаки изображения, к полносвязной части, где нейросеть обучается классификации на основе ранее выделенных признаков. Он переводит матрицу признаков в формат вектора;

- Dense - полносвязный слой нейросети.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Обучение нейросети ResNet34 проходило с помощью YOLOv5 (URL: https://github.com/ultralytics/yolov5), лучшие результаты были получены со следующими параметрами:

1) количество эпох - 150;

2) размер batch - 64;

3) размер изображения - 224*224;

4) оптимизатор обучения - Adam;

- коэффициент скорости обучения (learning rate) - динамический, изначально равен 0,001, далее изменяется по формуле

lf = (1 - x / epochs) * (1 - lrf) + lrf,

где epochs - количество эпох, lrf = 0.01;

- регуляризация (label smoothing) - 0.1;

- функция ошибки (loss) - smartCrossEntropyLoss.

Использовались следующие настройки обработки изображений для аугментации:

HorizontalFlip(p=0.5) - С вероятностью 50 % изображение будет зеркальным;

ColorJitter(p=0.5, brightness=[0.6, 1.4], contrast=[0.6, 1.4], saturation=[0.6, 1.4], hue=[0, 0]) - Цветовые понижение яркости контрастности и насыщенности;

Normalize(p=1.0, mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225), max_pixel_value=255.0) - нормализация изображения;

после чего была произведена оценка работы нейросети на тестовом наборе. Для получения итогового результата использовалась встроенная в YoLOv5 метрика top1. Эта метрика берет класс, предсказанный на изображении с

наибольшей вероятностью, и сравнивает его с ожидаемым классом, который находится на изображении на самом деле. По сути, это метрика точности Accuracy. Она вычисляется по формуле (TP+TN) / (TP+TN+FP+FN), где TP -True Positive, верно положительный ответ, TN - True Negative, верно отрицательный ответ, FP - False Positive, ложно положительный ответ, FN - False Negative, ложно отрицательный ответ. В нашем случае это отношение правильных ответов нейросети к общему числу правильных ответов. Результаты распознавания по классам отображены в табл. 2.

Таблица 2

Результаты распознавания лиц обученной нейросетью по классам типов характера

Тип характера % распознавания

Шизоидный 19 %

Параноидальный 33 %

Нарцисс 21 %

Психопатический 40 %

Компульсивный 26 %

Истерический 37 %

Депрессивный 22 %

Мазохистический 30 %

Результаты

В результате проведенного эксперимента CNN ResNet34 лучше всего определяла психопатический (40 %), истерический (37 %) и параноидальный (33 %) ТХ. Средний результат распознавания признаков равен 30 %. CNN позволяет получать результаты без изучения физиогномических признаков. Это сравнимо с 32 %, которые мы наблюдали при определении ТХ из традиционного «бумажного» тестирования. Данные результаты показывают то, что при увеличении количества фотографий растут и проценты распознавания, что означает перспективность такого подхода.

Заключение

Статья посвящена проблеме оптимизации и объективизации данных психодиагностики. Использование нейронной сети (CNN) для тестирования персоналии представляется первым шагом на пути этого процесса. В обычном тесте исследователи находятся в зависимости от способности к самоидентификации тестируемого, которая может быть невысокой. К тому же у испытуемого может не быть способности оценивать себя в сравнении с другими. В случае с нашей CNN происходит отнесение испытуемого к одному из восьми классов на основе обобщения 40 581 фотографии. Используемый в практической психологии метод ретестовой надежности в перспективе может быть заменен на метод визуального соответствия обученной CNN. Это позволяет в разы поднять эффективность уже используемых методик (как, например, profurfu.ru), где обычный тест используется вместе с анализом фото. Для повышения надежности CNN-тестирования используются три фотографии в фас без экспрессии. Решение принимается в случае совпадения результата теста по двум

и более фото. Наряду со значимыми эффектами замены бланочного тестирования на диагностику с помощью нейросети существует ряд ограничений. Так, предельное значение в 100 % достичь проблематично из-за того, что к тесту изначально были допущены фото тестируемых с углами наклона головы. Другой проблемой является национальная специфичность лиц. Использовали фото людей европейской внешности, но маловероятно получить тот же результат на лицах из азиатских стран. Вышеуказанные недостатки устранимы в результате развития IT-технологий и чувствительности нейросетей. С точки зрения психологических составляющих ограничения к использованию отсутствуют.

С точки зрения неспециалиста по психологии вызывает сомнение возможность определения типа характера по формальным признакам: и с помощью традиционных методик, и с помощью предложенного в статье нейросете-вого подхода составляет порядка 30 %. Однако методика MMPI используется с 1948 г. с относительно невысокой ретестовой надежностью. Мы сумели относительно быстро выйти на аналогичные результаты и имеем перспективу удвоения показателя за счет акцента на ряд признаков. Например, люди с психопатическим типом характера имеют почти вертикально стоящие волосы прически, а мазохистического - опущенные края бровей. Мы не использовали эти признаки, но уже получили 30 % верных ответов.

Выводы

1. Проблема достоверности тестирования в психологии становится сдерживающим фактором развития этой научной дисциплины. Результаты тестирования предполагают адекватную сравнительную самооценку абитуриента самого себя относительно других, чего трудно ожидать на практике. Общепринятой практикой является определение на основе ретестовой надежности, которая, как правило, составляет 1/3. Это означает потерю большей части данных, снижение эффективности эксперимента, недостоверность итоговых результатов, неуверенность в правильности сделанной работы.

2. Современные ИТ-технологии ищут себе применение в других научных отраслях. Никого не удивляет онкологический диагноз на основе обученной сверточной нейросети. В нашей работе была предпринята попытка определить тип характера на основе анализа фотографии созданной CNN. Мы исходно использовали 44 000 фотографий. При этом у одного человека могло быть 2-3 фото. После процедуры обрезки фото (овал лица), остались годными уже 40 581 фото, примерно по 4000 фото на каждый ТХ. Созданный нами проверочный датасет показал 30 % правильных ответов, что сравнимо с процентами, полученными при бумажном тестировании.

Этическое одобрение

Исследование проводилось в соответствии с Хельсинкской декларацией. Протокол исследования был одобрен комитетом по этике исследований УрФУ. Мы получили согласие участников использовать свои данные и фотографии в исследовательских целях для профориентационных целей. Никакой информации или изображений, которые могли бы привести к идентификации участников исследования, опубликовано не было.

Список литературы

1. The Cambridge Handbook of Personality Psychology / ed. by P. J. Corr, G. Matthews. Cambridge University Press, 2009. P. 849.

2. Butcher J. N., Hostetler K. Abbreviating MMPI item administration: What can be learned from the MMPI for the MMPI-2? // Psychological Assessment: A Journal of Consulting and Clinical Psychology. 1990. Vol. 2. P. 12-21. doi: 10.1037/10403590.2.1.12

3. Таланов В. Л., Малкина-Пых И. Г. Справочник практического психолога. СПб. : Сова ; М. : ЭКСМО, 2002. 928 с.

4. He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognation // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016. P. 770-778.

5. Ануашвили А. Н. Объективная психология на основе волновой модели мозга. М. ; Варшава : Экон-Информ, 2008. 292 с.

6. П. Дж. Вандер Python для сложных задач: наука о данных и машинное обучение. СПб. : Питер, 2018. 576 с.

7. Mail.Ru Group и Frank RG исследовали влияние психотипа клиента на его финансовое поведение. URL: https://corp.mail.ru/ru/press/releases/10110 (дата обращения: 12.01.2023).

8. Kachur A., Osin E., Davydov D. [et al.]. Assessing the Big Five personality traits using real-life static facial images Scientific Reports. 2020. Vol. 10. doi:10.1038/s41598-020-65358-6

9. Barrick M., Mount M. The big five personality dimensions and job performance: a meta-analysis // Personnel psychology. 1991. Vol. 44, iss. 1. P. 1-26.

10. Ang S., Van Dyne L., Koh C. Personality Correlates of the Four-Factor Model of Cultural Intelligence // Group & Organization Management. 2006. Vol. 31.

11. Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features // Accepted conference on computer vision and pattern recognition. 2001. P. 1-9.

12. Turk M., Pentland A. Face Recognition using Eigenfaces // Conference on Computer Vision and Pattern Recognition (3-6 June 1991, Maui, HI, USA). 1991. P. 586-591.

13. Vijaya Lata Y., Kiran C., Ram H. [et al.]. Facial Recognition using Eigenfaces by PCA // International Journal of Recent Trends in Engineering. 2009. Vol. 1.

14. Bay H., Ess A., Tuytelaars T., Gool L. V. Speeded-Up Robust Features (SURF) // Computer Vision and Image Understanding. 2008. Vol. 110. P. 346-359.

15. Schroff F., Kalenichenko D., Philbin J. FaceNet: A Unified Embedding for Face Recognition and Clustering // Computer Vision and Pattern Recognition. 2015. P. 815-823.

16. Xie C., Tan M., Gong B. [et al.]. Adversarial Examples Improve Image Recognition // Computer vision and Pattern Recognition. 2019.

17. Img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation. URL: https://github.com/vitoralbiero/img2pose (дата обращения: 12.01.2023).

18. Полозов А. А. Психологические портреты персонала спортивного клуба // Спортивный психолог. 2005. № 3.

19. Полозов А. А., Полозова Н. Н. Модули психологической структуры в спорте. М. : Советский спорт, 2009.

References

1. The Cambridge Handbook of Personality Psychology. Ed. by P. J. Corr, G. Matthews. Cambridge University Press, 2009:849.

2. Butcher J.N., Hostetler K. Abbreviating MMPI item administration: What can be learned from the MMPI for the MMPI-2? Psychological Assessment: A Journal of Consulting and Clinical Psychology. 1990;2:12-21. doi:10.1037/1040-3590.2.1.12

3. Talanov V.L., Malkina-Pykh I.G. Spravochnik prakticheskogo psikhologa = Handbook of a practical psychologist. Saint Petersburg: Sova; Moscow: EKSMO, 2002:928. (In Russ.)

4. He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2016:770-778.

5. Anuashvili A.N. Ob"ektivnaya psikhologiya na osnove volnovoy modeli mozga = Objective psychology based on the wave model of the brain. Moscow; Varshava: Ekon-Inform, 2008:292. (In Russ.)

6. Vander P.Dzh. Python dlya slozhnykh zadach: nauka o dannykh i mashinnoe obuchenie = Python for complex tasks: Data science and machine learning. Saint Petersburg: Piter, 2018:576. (In Russ.)

7. Mail.Ru Group i Frank RG issledovali vliyanie psikhotipa klienta na ego finansovoe povedenie = Mail.Ru Group and Frank RG investigated the influence of the client's psychotype on his financial behavior. (In Russ.). Available at: https://corp.mail.ru/ ru/press/releases/10110 (accessed 12.01.2023).

8. Kachur A., Osin E., Davydov D. et al. Assessing the Big Five personality traits using real-life static facial images Scientific Reports. 2020;10. doi:10.1038/s41598-020-65358-6

9. Barrick M., Mount M. The big five personality dimensions and job performance: a meta-analysis. Personnel psychology. 1991;44(1): 1-26.

10. Ang S., Van Dyne L., Koh C. Personality Correlates of the Four-Factor Model of Cultural Intelligence. Group & Organization Management. 2006;31.

11. Viola P., Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features. Accepted conference on computer vision and pattern recognition. 2001:1-9.

12. Turk M., Pentland A. Face Recognition using Eigenfaces. Conference on Computer Vision and Pattern Recognition (3-6 June 1991, Maui, HI, USA). 1991:586-591.

13. Vijaya Lata Y., Kiran C., Ram H. et al. Facial Recognition using Eigenfaces by PCA. International Journal of Recent Trends in Engineering. 2009;1.

14. Bay H., Ess A., Tuytelaars T., Gool L.V. Speeded-Up Robust Features (SURF). Computer Vision and Image Understanding. 2008;110:346-359.

15. Schroff F., Kalenichenko D., Philbin J. FaceNet: A Unified Embedding for Face Recognition and Clustering. Computer Vision and Pattern Recognition. 2015:815-823.

16. Xie C., Tan M., Gong B. et al. Adversarial Examples Improve Image Recognition. Computer vision and Pattern Recognition. 2019.

17. Img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation. Available at: https://github.com/vitoralbiero/img2pose (accessed 12.01.2023).

18. Polozov A.A. Psychological portraits of sports club staff. Sportivnyy psikholog = Sports psychologist. 2005;(3). (In Russ.)

19. Polozov A.A., Polozova N.N. Moduli psikhologicheskoy struktury v sporte = Modules of psychological structure in sports. Moscow: Sovetskiy sport, 2009. (In Russ.)

Информация об авторах /Information about the authors

Андрей Анатольевич Полозов

доктор педагогических наук, профессор, Уральский федеральный университет (Россия, г. Екатеринбург, ул. Мира, 19) E-mail: a.a.polozov@mail.ru

Andrey A. Polozov

Doctor of pedagogical sciences, professor,

Ural Federal University

(19 Mira street, Yekaterinburg, Russia)

Мария Павловна Штарк

младший аналитик группы системного анализа, Майнитек

(Россия, Свердловская обл., г. Верхняя Пышма, ул. Уральских Рабочих, 42а) E-mail: maria_shtark@mail.ru

Maria P. Shtark

Junior analyst of the group of system analysis, Maynitek LLC

(42a Uralskih Rabochih street, Verkhnyaya Pyshma, Sverdlovsk region, Russia)

Кристина Андреевна Полозова

студентка,

Уральский федеральный университет (Россия, г. Екатеринбург, ул. Мира, 19) E-mail: a.a.polozov@mail.ru

Наталья Анатольевна Мальцева

инженер,

Уральский федеральный университет (Россия, г. Екатеринбург, ул. Мира, 19) E-mail: Natalia.maltseva.susu@gmail.com

Артур Рахимзянович Ахметзянов

преподаватель,

Сургутский государственный

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

педагогичский университет

(Россия, г. Сургут, 50 лет ВЛКСМ, 10/2)

E-mail: Artur.rahimzyanovich@mail.ru

Kristina A. Polozova

Student,

Ural Federal University

(19 Mira street, Yekaterinburg, Russia)

Natalya A Maltceva

Engineer,

Ural Federal University

(19 Mira street, Yekaterinburg, Russia)

Artur R. Akhmetzyanov

Teacher,

Surgut State Pedagogical University (10/2 50 years of the Komsomol street, Surgut, Russia)

Авторы заявляют об отсутствии конфликта интересов / The authors declare no conflicts of interests.

Поступила в редакцию/Received 10.01.2023 Поступила после рецензирования/Revised 17.02.2023 Принята к публикации/Accepted 13.03.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.