Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ СОЗДАНИЯ ГРАФОЛОГИЧЕСКОГО СЕРВИСА, ОПРЕДЕЛЯЮЩЕГО ХАРАКТЕР ЧЕЛОВЕКА ПО ЕГО ПОЧЕРКУ'

ИСПОЛЬЗОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ СОЗДАНИЯ ГРАФОЛОГИЧЕСКОГО СЕРВИСА, ОПРЕДЕЛЯЮЩЕГО ХАРАКТЕР ЧЕЛОВЕКА ПО ЕГО ПОЧЕРКУ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
71
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГРАФОЛОГИЯ / ПОЧЕРК / ЛИЧНОСТНЫЕ ХАРАКТЕРИСТИКИ / ГРАФОЛОГИЧЕСКИЙ АНАЛИЗ / НАКЛОН / НАПРАВЛЕНИЕ ПОЧЕРКА / ТЕКСТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Турицына А. В.

Проблема человеческого самопознания является очень актуальной в наши дни. Люди постоянно ищут новые методы для изучения собственного “Я”. Графология - один из таких методов. Основной сложностью графологического анализа является отсутствие автоматизации процесса, результат зависит только от знаний человека. Кроме того, на данный момент не существует сервиса, способного осуществить грамотный анализ по почерку человека. Однако есть методы компьютерного зрения, которые в комбинации способны произвести работу, схожую с работой графолога. К таким методам относятся сегментация, бинаризация и методы интегральной оценки. Для сопоставления характеристик почерка с человеческими особенностями характера необходимо применять классификаторы. Применение всех методов дает возможность создать сервис, который автоматизирует графологический анализ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING COMPUTER VISION METHODS TO CREATE A GRAPHOLOGICAL SERVICE THAT DETERMINES A PERSON'S CHARACTER BY HIS HANDWRITING

The problem of human self-knowledge is very relevant nowadays. People are constantly looking for new methods to study their own “I”. Graphology is one of such methods. The main difficulty of graphological analysis is the lack of automation of the process, the result depends only on the knowledge of the person. In addition, at the moment there is no service capable of carrying out a competent analysis of a person's handwriting. However, there are computer vision methods that, in combination, can produce work similar to that of a graphologist. Such methods include segmentation, binarization, and integral estimation methods. To compare the characteristics of handwriting with human characteristics of character, it is necessary to use classifiers. The use of all methods makes it possible to create a service that automates graphological analysis.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ СОЗДАНИЯ ГРАФОЛОГИЧЕСКОГО СЕРВИСА, ОПРЕДЕЛЯЮЩЕГО ХАРАКТЕР ЧЕЛОВЕКА ПО ЕГО ПОЧЕРКУ»

Использование методов компьютерного зрения для создания графологического сервиса, определяющего характер человека

по его почерку

А.В. Турицына

Волгоградский государственный технический университет, Волгоград

Аннотация: Проблема человеческого самопознания является очень актуальной в наши дни. Люди постоянно ищут новые методы для изучения собственного "Я". Графология -один из таких методов. Основной сложностью графологического анализа является отсутствие автоматизации процесса, результат зависит только от знаний человека. Кроме того, на данный момент не существует сервиса, способного осуществить грамотный анализ по почерку человека. Однако есть методы компьютерного зрения, которые в комбинации способны произвести работу, схожую с работой графолога. К таким методам относятся сегментация, бинаризация и методы интегральной оценки. Для сопоставления характеристик почерка с человеческими особенностями характера необходимо применять классификаторы. Применение всех методов дает возможность создать сервис, который автоматизирует графологический анализ.

Ключевые слова: графология, почерк, личностные характеристики, графологический анализ, наклон, направление почерка, строка, текст, буква, нажим, штрих, сегментация, бинаризация, метод интегральной оценки.

В современном мире очень большое внимание уделяется психологии. Многие современные люди занимается самопознанием, посещают психолога для того, чтобы разобраться с собственным "Я", изучают большое количество профильной литературы. Одним из методов самоизучения можно считать графологию. Графология — это не только дисциплина, которая изучает характер с помощью почерка, но и наука, задействующая письмо в различных областях. Используя различные методы, графология нашла своё применение во многих отраслях, таких, как биометрические системы безопасности в информационных технологиях, анализ характера в психологии, подбор персонала в бизнесе, аутентификация и определение преступников в криминалистике, консультационные услуги и аналогичные практики в образовании [1]. Почерк представляет собой сложный двигательный навык, основанный на неврологии и физиологии [2]. Как и личность, меняется и почерк. Такие периоды, как взросление, юность и

взрослость, отражаются на письме. Почерк подобен отпечатку человеческого пальца - невозможно найти абсолютно идентичных. Это обусловлено тем, что в рукописном тексте отражаются особенности человеческой личности. С его помощью можно узнать не только о базовых характеристиках хозяина: какой рукой он пишет, пол, примерный возраст, но и более специфические, такие как чувства, эмоции, мысли. По сути данная дисциплина исследует с научной точки зрения отношения между текстом и автором, рассматривая текст как выражение личности его хозяина. Графология - это анализ качественных физических характеристик и закономерностей рукописного почерка человека с целью идентификации личности его владельца. Это учение позволяет определить психологическое состояние, в котором человек находился в процессе письма, и оценить его личностные характеристики [3]. Однако, основным минусом данного вида психологического анализа считается отсутствие автоматизации. Степень успешности графологического исследования зависит от подготовки специалиста, его личного опыта, образования [4]. Таким образом, основная проблема при использовании такого метода исследования заключается в поиске достаточно квалифицированного специалиста.

Целью исследования является разработка метода соотношения почерка человека и его характера с помощью машинного обучения на основе компьютерного зрения для ускорения работы. Объект исследования -индивидуальные особенности человека, отраженные в его почерке. Предмет исследования - методы и средства для выделения индивидуальных особенностей человека из его почерка. Для достижения цели рассмотрены современные графологические модули и системы, находящиеся в открытом доступе в сети Интернет, а также сформулированы требования к разработке собственного программного продукта.

Все сервисы, которые представлены в открытом доступе в сети Интернет основываются на одном типе графологического анализа - тест [5-7]. Подобные сервисы можно разделить на два типа: в первом содержится большое количество вопросов, направленных на выделение основных характеристик почерка, во втором предлагаются фотографии для того, чтобы испытуемый мог провести параллель со своим рукописным текстом. Основные показатели, которые затрагиваются в подобных тестах, это: размер букв, наклон, форма букв, направление почерка, размашистость и сила нажима, характер написания слов и общая оценка. Однако, при такой поверхностной субъективной оценке собственного почерка, сложно сделать истинные выводы об особенностях характера. Главная проблема в том, что нет унифицированных показателей, которые могут помочь в классификации почерка по каждому из представленных параметров. Фактически, человек вынужден оценить размер букв, наклон и прочие особенности только по своему ощущению. Но ведь зачастую мнение каждого отдельного взятого индивидуума может очень сильно отличаться от мнения других. Тесты, в которых присутствуют фотографии, снижают степень субъективизма при оценке рукописного текста. Главной проблемой данных тестов является то, что оценка почерка происходит не на основании каждой отдельно взятой характеристики, а основываясь сразу на всех. То есть, изначально даны фотографии, сочетающие определенный набор. Таким образом получается, что почерк испытуемого может быть схож с представленным лишь по части необычных особенностей, а это, в свою очередь, приведёт к искажению итогового результата. Есть ещё один вид тестов с фотографиями, где фото сразу выделены под каждую особенность почерка. Но в таком случае рассматривается всего пять особенностей: нажим, наклон, размер, форма букв и расположение строк. Такого количества попросту недостаточно для того, чтобы сделать емкий анализ характера хозяина текста.

Ещё один способ получить графологическую экспертизу - обратиться к графологу [8]. Существуют два варианта исследования почерка: самостоятельный и с помощью эксперта. К первому варианту относятся курсы, на которых специалисты обучают людей самостоятельно проводить графологический анализ. Главный минус этого метода заключается в цене, длительности и в слабой теоретической базе. Цены на мастер-классы по отдельно взятым темам начинаются от пяти долларов, однако такие уроки охватывают лишь одну узкую тему, соответственно, одного урока будет недостаточно. Кроме того, существует профильный курс, но цена его начинается от двух с половиной тысяч евро за один модуль. Первый курс обучения длится пять месяцев, включая в себя обычные занятия и три недели экзаменов. Занятия проходят раз в неделю по три часа, в течение которых разбирается практика и теория. Всего обучение состоит из четырёх модулей: трёх курсов теоретической подготовки совместно с практикой и полностью практического курса. Для тех, кто не хочет становится графологом, можно заказать графологическую экспертизу своего почерка у сертифицированного специалиста. Цена начинается от трехсот сорока долларов без учёта НДС и выполняется данная услуга в течение десяти дней. Однако, подобная диагностика даёт очень обширный анализ личностных характеристик: анализ типа личности, ее основных особенностей, сильных и слабых сторон, отношения с окружающими, рекомендации по работе над собой и улучшению качества жизни, диагностика психоэмоционального, психосоматического, коммуникативного, социоадаптационного и многих других аспектов. Также существуют консультации, направленные на сферу самореализации, на наиболее комфортные и удовлетворяющие условия деятельности, на то, в чем и почему человек сможет почувствовать себя реализованным и эффективным - душевно и интеллектуально. Есть

отдельные услуги для анализа подписи человека, психодиагностики и профориентации подростков, психодиагностика отношений, графотерапия.

Анализируя аналоги разрабатываемого сервиса, можно сделать вывод, что имеющиеся продукты либо обладают большой стоимостью и длительностью, либо не имеют унифицированных показателей для точной классификации, либо очень скудны по анализируемым характеристикам. Таким образом, можно сказать, что разработка автоматизированного решения - сервиса, который сможет определять особенности характера по почерку, является актуальной задачей.

Основой для работы сервиса является извлечение данных. Извлечение признаков представляет собой процесс уменьшения размерности (извлечение данных) из многомерных входных данных. Выходные данные используются для анализа личности человека. Наиболее распространенными функциями при анализе почерка являются базовая линия, размер, нажим, штрих, наклон, интервал, скорость, поля и буквы. Большинство исследователей используют исходную линию, наклон и давление в качестве характеристик для прогнозирования поведения человека. Также очень важно учитывать интервалы почерка, которые содержат три типа интервалов: интервал между строками, интервал между словами и интервал между буквами. Интервал между строками на странице указывает на ясность и упорядоченность философии и рассуждений автора. Интервал между словами описывает эмоциональный комфорт человека в социуме. Между тем расстояние между буквами отражает то, как хозяин почерка относится к людям на личном уровне. И ещё одной важной характеристикой являются связующие штрихи почерка для выяснения информации о способности человека адаптироваться к изменяющимся условиям [9].

Основным методом, который используется при графологическом анализе является метод сегментации. Сегментация - это задача, которая

занимается поиском пикселей, характеризующий один смысловой объект. В компьютерном зрении она считается одной из основополагающих. При анализе используют сегментацию отдельных элементов текста, таких как букв, слов и строк. Использование этого метода обусловлено тем, что в основе исследования лежит задача по определению основных характеристик почерка, которые будут необходимы для дальнейшего графологического анализа.

Ещё одним методом, который активно применяется при анализе почерка человека, является метод интегральной оценки. Его применяют, чтобы определить вид и степень наклона. Это важно, в первую очередь, для того, чтобы определить состояние человека в момент написания, а также его самоопределение в окружающем мире. Для получения верхней и нижней границы письма используется вертикальная интегральная проекция, для левой и правой границ области письма - горизонтальная.

Направление почерка делят на три типа: вертикальное почерк, плавающий почерк и плоский почерк. Первый шаг к определению направления почерка - это занять 1/3 от начала текста. Для начала нужно вычислить интеграл вертикальной проекции каждой из первых 1/3 и 1/3 конца. Как только позиция получена, сравниваются первая позиция 1/3 и последняя позиция 1/3. Из этого следует, что если начальная 1/3 часть меньше 1/3 конечной части, то тогда получается, что почерк уменьшается. И если первая 1/3 часть больше 1/3 конечной части, то закономерно, что почерк увеличивается. Определение положения почерка между увеличивающимся, уменьшающимся или горизонтальным (т.е. неизменным) выполняется путем задания порогового значения [10].

Почерк обычно имеет три типа наклона: наклон влево, наклон вправо и прямой. Наклон надписи был получен путем нахождения максимального значения интегральной горизонтальной проекции гистограммы

оригинальных надписей, надписей, в которых применялось положительное преобразование сдвига, и надписей, в которых применялось отрицательное преобразование сдвига.

Высота буквы получается путем вычисления интеграла вертикальной проекции и интеграла горизонтальной проекции для вычисления ширины буквы.

Ширина почерка подчиняется следующим правилам; если высота буквы больше ширины буквы, то надпись узкая, а если высота буквы больше ширины буквы, то надпись широкая.

Также при графологическом анализе на этапе предварительной обработке часто применяют метод бинаризации - процесс изменения цвета изображения на черно-белый. Он выполняется с использованием порогового значения изображения, которое должно быть внутри. Цвет изображения делится на две части: чёрную и белую, соответственно. Цветовое разделение изображения разделяется пороговым значением, которое определяет, находится ли пиксель изображения ниже порогового значения, если да, тогда пиксель изображения будет изменен на 0, а если он превысит пороговое значение, то пиксель изображения будет изменен на 255. Обычное пороговое значение задается цифрой 128.

Особенностью извлечения является этап идентификации записи. Это процесс распознавания образца почерка на основе графологии. Чтобы определить тип процесса идентификации, в исследовании использовалось правило в соответствии с положениями книги графологии, измененное в соответствии с логикой, применяемой к системе.

Кроме того, важным этапом при обработке текста является использование классификаторов. Наиболее подходящим в нашем случае является классификатор kNN (k Nearest Neighbor или k Ближайших Соседей), использующий в своей основе матрицу сходств. Метод матрицы сходства

может использоваться для расчета сходства набора обучающих данных с матрицей вектора признаков. Таким образом будет установлено соответствие между характеристиками почерка и человеческого характера.

На данный момент разработан сервис по анализу рукописного текста и выявлению его отдельных элементов. Практическая значимость работы заключается в создании web-сервиса для анализа почерка и дальнейшего выделения индивидуальных особенностей человека. Результаты работы могут быть востребованы для коммерческого использования, а также для диагностики психологических отклонений.

Литература

1. Yalcin N., Gurbuz F. Graphology and Forensic Graphology. Global Journal of Technology. ResearchGate. 2015. № 8. P. 151-158.

2. Серегин В.В. Почерковедение и почерковедческая экспертиза. -Волгоград: ВА МВД России, 2014 - 340 с.

3. Бурякова О. С., Решетникова О. А., Черкесова Л. В. Применение нейросетевых технологий для графологического анализа характера человека по его рукописному почерку. Современные наукоемкие технологии. - 2022. -№ 10-2. - С. 231-242. - DOI: 10.17513/snt.39375.

4. Кравченко В. И. Графология: характер по почерку: учебно-метод. пособие; ГУАП. - СПб., 2006. - 92 с.

5. Психологические тесты онлайн. Jungland.ru. 2023. URL: JungLand.ru (дата обращения: 29.01.2023).

6. Психологические тесты онлайн. Onedio.ru. 2023. URL: Onedio.ru/tests (дата обращения: 29.01.2023).

7. Психологические тесты. Кошеваров.рф. 2023. URL: кошеваров.рф/Test.html (дата обращения: 29.01.2023).

8. Институт Графоанализа Инессы Гольдберг. Inessa-goldberg.ru. 2023. URL: inessa-goldberg.ru (дата обращения: 29.01.2023).

9. Samsuryadi R.K. and. Mohamad F.S. Automated handwriting analysis based on pattern recognition: A survey Indonesian Journal of Electrical Engineering and Computer Science. — 2021. — № 22(1). — C. 196-206.

10. Ingole Monika, Tighare Khemutai. Handwritten Character Recognition Using Neural Network. International Journal of Scientific Research in Computer Science, Engineering and Information Technology (IJSRCSEIT) - [India], 2021. -203-207 p.

References

1. Yalcin N., Gurbuz F. Graphology and Forensic Graphology. Global Journal of Technology. ResearchGate. 2015. № 8. pp. 151-158.

2. Seregin V.V. Pocherkovedeniye i pocherkovedcheskaya ekspertiza.

[Handwriting and handwriting expertise]. Volgograd: VA MVD Rossii, 2014. 340 p.

3. Buryakova O. S., Reshetnikova O. A., Cherkesova L. V. Sovremennyye naukoyemkiye tekhnologii. 2022. № 10-2. pp. 231-242. DOI: 10.17513/snt.39375.

4. Kravchenko V. I. Grafologiya: kharakter po pocherku [Graphology: character by handwriting]. Uchebno-metod. posobiye; GUAP. SPb., 2006. 92 p.

5. Psikhologicheskiye testy onlajn.[Psychological Tests Online]. Jungland.ru. 2023. URL: JungLand.ru (data obrashcheniya: 29.01.2023).

6. Psikhologicheskiye testy onlajn.[Psychological Tests Online] Onedio.ru. 2023. URL: Onedio.ru/tests (data obrashcheniya: 29.01.2023).

7. Psikhologicheskiye testy. [Psychological Tests]. Koshevarov. rf. 2023. URL: koshevarov.rf/Test.html (data obrashcheniya: 29.01.2023).

8. Institut Grafoanaliza Inessy Gol'dberg.[Inessa Goldberg Institute of Graphoanalysis] Inessa-goldberg.ru. 2023. URL: inessa-goldberg.ru (data obrashcheniya: 29.01.2023).

9. Samsuryadi R.K., Mohamad F.S. A survey Indonesian Journal of Electrical Engineering and Computer Science. 2021. № 22(1). pp. 196-206.

10. Ingole Monika, Tighare Khemutai. International Journal of Scientific Research in Computer Science, Engineering and Information Technology (IJSRCSEIT). [India], 2021. pp.203-207.

i Надоели баннеры? Вы всегда можете отключить рекламу.