Научная статья на тему 'Индивидуально-личностные характеристики автора и количественные параметры его текста: корпусное исследование'

Индивидуально-личностные характеристики автора и количественные параметры его текста: корпусное исследование Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
991
139
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
AUTHORSHIP STUDIES / TEXT PARAMETERS / TEXT CORPUS / LINGUISTIC STATISTICS / AUTHORSHIP PROFILING / PSYCHOLINGUISTICS / INDIVIDUAL DIFFERENCES IN TEXT PARAMETERS / АВТОРОВЕДЕНИЕ / КОРПУС ТЕКСТОВ / ДИАГНОСТИРОВАНИЕ ЛИЧНОСТИ АВТОРА ТЕКСТА / ПСИХОЛИНГВИСТИКА / ИНДИВИДУАЛЬНОЕ ВАРЬИРОВАНИЕ В РЕЧИ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Литвинова Татьяна Александровна, Диброва Елена Владимировна, Середин Павел Владимирович, Литвинова Ольга Александровна

В ходе экспериментального исследования с применением методов статистического анализа на материале специально созданного корпуса текстов на русском языке Personality, содержащего метаданные в виде информации об их авторах, установлены корреляции между количественными параметрами письменного текста (индексы автосемантичности, лексического разнообразия, частотности служебных слов и местоимений, индекс предикативности, показатели синтаксической сложности и др.) и характеристиками его продуцента (пол, возраст, тип темперамента в виде баллов по психологическому тесту, наличие и тип акцентуации характера). Наибольшее число корреляций выявлено для возраста, наименьшее для пола. Среди параметров текста наиболее информативными для диагностирования характеристик личности автора оказались параметры, отражающие частотные характеристики служебных и строевых слов, что подтверждает ранее сделанные нами наблюдения, а также согласуется с результатами, полученными зарубежными исследователями (преимущественно на материале английского языка). Определены перспективы дальнейшего исследования проблемы взаимосвязи характеристик личности и количественных параметров ее речевой продукции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Литвинова Татьяна Александровна, Диброва Елена Владимировна, Середин Павел Владимирович, Литвинова Ольга Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Individual characteristics of the author and Quantitative text Parameters: a corpus Study

During experiments using the statistical analysis on a special Russian text corpus Personality including metadata on their authors, the correlations between quantitative parameters of a written text (autosemanticity indices, lexical variety, frequencies of function words and pronouns, predicativity index, syntactical complexity, etc.) and characteristics of an individual who produced it (gender, age, temperament type based on the psychological test scores, accentuations of character) were found. the largest number of correlations was identified for the age and the smallest for the gender. the most instrumental text parameters in personality profiling were those indicative of frequencies of function and linking words, which agrees with the previous observations as well as the results obtained by foreign scientists (mostly on english texts). Possible new directions in the study of personality characteristics and quantitative parameters of speech production are identified.

Текст научной работы на тему «Индивидуально-личностные характеристики автора и количественные параметры его текста: корпусное исследование»

т.А. литвинова, Е.в. Диброва, УДк 81'23

п.в. середин, о.А. литвинова

индивидуально-личностные характеристики автора и количественные параметры Его текста: корпусное исследование1

В ходе экспериментального исследования с применением методов статистического анализа на материале специально созданного корпуса текстов на русском языке Personality, содержащего метаданные в виде информации об их авторах, установлены корреляции между количественными параметрами письменного текста (индексы автосемантичности, лексического разнообразия, частотности служебных слов и местоимений, индекс предикативности, показатели синтаксической сложности и др.) и характеристиками его продуцента (пол, возраст, тип темперамента в виде баллов по психологическому тесту, наличие и тип акцентуации характера). Наибольшее число корреляций выявлено для возраста, наименьшее - для пола. Среди параметров текста наиболее информативными для диагностирования характеристик личности автора оказались параметры, отражающие частотные характеристики служебных и строевых слов, что подтверждает ранее сделанные нами наблюдения, а также согласуется с результатами, полученными зарубежными исследователями (преимущественно на материале английского языка). Определены перспективы дальнейшего исследования проблемы взаимосвязи характеристик личности и количественных параметров ее речевой продукции.

Ключевые слова: автороведение, корпус текстов, диагностирование личности автора текста, психолингвистика, индивидуальное варьирование в речи.

Tatyana А. Litvinova, Elena V. Dibrova, Pavel V. seredin, olga А. litvinova

individual characteristics of the author and quantitative text parameters: a corpus study

During experiments using the statistical analysis on a special Russian text corpus Personality including metadata on their authors, the correlations between quantitative parameters of a written text (autosemanticity indices, lexical variety, frequencies of function words and pronouns, predicativity index, syntactical complexity, etc.) and characteristics of an individual who produced it (gender, age, temperament type based on the psychological test scores, accentuations of character) were found. The largest number of correlations was identified for the age and the smallest for the gender. The most instrumental text parameters in personality profiling were those indicative of frequencies of function and linking words, which agrees with the previous observations as well as the

1 Исследование выполнено при поддержке гранта РФФИ № 15-36-50104 мол_нр «Формально-грамматические параметры письменного текста и индивидуально-личностные характеристики его автора: корпусное исследование».

results obtained by foreign scientists (mostly on English texts). Possible new directions in the study of personality characteristics and quantitative parameters of speech production are identified.

Keywords: authorship studies, text parameters, text corpus, linguistic statistics, authorship profiling, psycholinguistics, individual differences in text parameters.

Введение. Проблема поиска корреляций между характеристиками личности и особенностями ее речевой продукции не является новой в мировой науке и активно изучается как российскими, так и зарубежными учеными. В российской науке приоритет в изучении данной проблемы принадлежит психологам, собственно лингвистических работ в этом направлении, как признают сами исследователи, крайне мало, и представленные в них данные носят фрагментарный, эклектичный характер [Седов 2004], «количественная оценка речевых коррелятов психологических характеристик разработана слабо» [Чернов 2012: 139].

Между тем обозначенная проблема имеет не только теоретическое, но и практическое значение, в частности, в лингвокриминалистике для разработки методик классификационной автороведческой экспертизы, цель которой - установление методом лингвистического анализа текста данных о его авторе (пол, возраст, психологические особенности) [Литвинова 2012; Литвинова 2015а]. Кроме того, успешные исследования в этом русле в перспективе могли бы привести к созданию «нового психодиагностического инструментария» [Чернов 2012: 139].

При решении данной проблемы, как показывает анализ научной литературы, особое значение имеет анализ формально-грамматических, не зависящих от темы текста и неконтролируемых автором характеристик, поддающихся квантификации (см., например, [Pennebaker 2003]; см. также краткий обзор в [Литвинова 2013а]).

В наших предыдущих работах [Литвинова 2012; Литвинова 2014; Литвинова 2015б] были предприняты попытки выявления корреляций между формально-грамматическими параметрами текста на русском языке и полом и психологическими характеристиками его автора (в виде баллов по пятифакторному личностному опроснику в интерпретации А.Б. Хромова, Фрайбургскому личностному опроснику) и построения на их основе прогностических математических моделей, позволяющих диагностировать указанные характеристики личности на основе численных значений квантифицируемых параметров продуцируемого ею текста. Данные исследования проводились нами на материале специального созданного корпуса текстов Personality, представляющих собой образцы естественной письменной речи (письмо другу, эссе на различные темы, рассказ по предложенной картине и пр.) [Загоровская 2012]. Отличительной особенностью данного корпуса текстов является метаразметка в виде информации об их авторах (пол, возраст, профессия, данные психологического тестирования и др.). Корпус содержит также подкорпуса «ложных» и «правдивых» текстов, текстов людей, страдающих психическими заболеваниями, и др. В настоящее время в корпусе представлены тексты более 1000 респондентов, и корпус постоянно пополняется (см. подробнее о составе и структуре корпуса: [Литвинова 2015а]).

Аналогичные корпуса текстов созданы для английского, датского языков, и они активно используются исследователями для решения проблем, связанных с по-

строением методик диагностирования личности автора письменного текста, атрибуции текста, выявлением статистически значимых различий между «правдивыми» и «ложными» текстами и т.д. [Литвинова 2015а]. Насколько нам известно, в отечественной лингвистике данный корпус аналогов не имеет.

Для указанных исследований нами были отобраны тексты респондентов, однородных по возрасту, образованию, социальному статусу (студенты 1-3 курсов вузов, всего 231 человек).

В качестве параметров текстов нами использовались:

1) частности слов различных частей речи, параметры, отражающие синтаксические характеристики текста [Литвинова 2013б];

2) биграммы частей речи (последовательности из двух единиц) [Литвинова

2014];

3) комплекс параметров, включавший индексы удобочитаемости, лексического разнообразия, частотности служебных слов и местоимений и т.д. [Литвинова

Был выявлен ряд значимых корреляций между характеристиками личности и количественными параметрами текста, на основе которых были построены прогностические модели. В среднем точность полученных моделей для диагностирования пола и индивидуально-психологических характеристик авторов, определенных при помощи пятифакторного личностного опросника, составила 60-65 %, что сопоставимо с результатами подобных исследований на материале английского языка. Наиболее высокая результативность была достигнута при диагностировании склонности автора текста к аутоагрессивному поведению на основе анализа комплекса количественных параметров текста. Так, было установлено, что для текстов, продуцируемых лицами с высокой склонностью к аутоагрессивному поведению, характерно меньшее лексическое разнообразие, меньшее число предлогов, большее число местоимений в целом, и личных в частности, при более высоком индексе логической связанности (создаваемом за счет большего количества союзов и дейкти-ческих частиц) и более высоком индексе средней длины предложения [Литвинова 2015б]. Во всех экспериментах была установлена особая значимость анализа частотностей служебных слов и местоимений для диагностирования личности автора текста. Однако необходимы дальнейшие исследования взаимосвязи квантифици-руемых параметров текста и характеристик его автора, поиск новых эффективных параметров и их апробация на большом корпусном материале.

Целью настоящего исследования является поиск взаимосвязи между количественными параметрами письменного текста (как доказавшими свою эффективность в предыдущих исследованиях, так впервые используемых для данной задачи) и психофизиологическими характеристиками личности (пол, возраст, тип темперамента, наличие и тип акцентуации).

экспериментальное исследование взаимосвязи характеристик личности и количественных параметров текста.

1. Материал исследования. Настоящее исследование проводилось на материале одного из подкорпусов корпуса текстов Personality2, в составлении которо-

2 Данный подкорпус текстов составлялся Е.В. Дибровой с сентября 2014 по февраль 2015 гг.

2015б].

го принимали участие жители города Ростов-на-Дону, N = 124, среди которых 91 женщина и 33 мужчины, возраст - от 16 до 79 лет (респондентов в возрасте от 16 до 22 - 51 человек, от 23 до 35 - 33 человека, от 35 до 50 - 13 человек, от 50 до 65 - 17 человек, от 65 до 79 - 10 человек), среднее образование среди них имеет 37 человек, среднее специальное - 13 человек, незаконченное высшее - 22, высшее - 45, два и более высших образований - 4. Перед написанием текста респонденты прошли психологическое тестирование - выполнили тест А. Белова на определение типа темперамента (флегматик; меланхолик; холерик; сангвиник, по каждой из этих шкал для каждого респондента высчитываются баллы в диапазоне от 0 до 1, которые в сумме дают 1); тест на определение акцентуации характера К. Леонгар-да - Н. Шмишека (каждый испытуемый получал оценку 0 или 1 в зависимости от наличия/отсутствия акцентуации по шкалам «Гипертимность», «Дистимичность», «Циклотимность», «Эмоциональность», «Демонстративность», «Застревание», «Педантичность», «Тревожность», «Возбудимость», «Экзальтированность»).

От каждого респондента был получен 1 текст на тему «В чем я вижу смысл жизни?», средний объем текста - 342 слова.

2. Параметры текста.

В качестве параметров текста, которые могут коррелировать с характеристиками личности, в настоящем исследовании мы брали количественные параметры текста на разных уровнях его организации. Ряд этих параметров зарекомендовали себя как эффективные в наших предыдущих исследованиях, ряд параметров впервые применяется для решения данной задачи.

1-я группа параметров - показатели автосемантичности и лексического разнообразия текста. В нашем исследовании [Литвинова 2015б] было показано, что индекс лексического разнообразия (известный также как индекс Хорвата), вычисляемый как отношение числа различных, неповторяющихся, слов к общему числу слов, в первых 100 словах текста, коррелирует с некоторыми параметрами личности.

В связи с этим в настоящем исследовании мы использовали ряд параметров текста, отражающих его лексическое разнообразие и автосемантичность:

1. Индекс автосемантичности текста ИА1, вычисляемый как отношение всех полнозначных слов к общему числу слов текста.

2. Коэффициент лексического разнообразия КЛР1, вычисляемый как отношение количества неповторяющихся полнозначных слов к общему числу слов в тексте.

3. Коэффициент лексического разнообразия КЛР2, вычисляемый как отношение количества всех неповторяющихся слов к общему числу слов в тексте.

4. Индекс автосемантичности текста ИА2, вычисленный с использованием программы Textus Pro 1.0 как отношение общего числа полнозначных слов к общему числу слов.

5. Процент покрытия словаря текста (общего числа разных слов, встречающихся в тексте) 5-ю самыми частотными словами (без учета неполнозначных слов).

6. Процент покрытия словаря текста 5-ю самыми частотными словами (с учетом неполнозначных слов).

7. Число слов, состоящих из 10 и более букв, деленное на длину текста в словах.

Параметры 1-3, 5-6 вычислялись при помощи онлайн-ресурса http://istio.

com/

2-я группа - показатели смысловой плотности текста. В качестве показателя смысловой плотности предложения нами был выбран такой показатель, как индекс предикативности (8), вычисляемый как отношение предикативных единиц к длине текста в словах. К предикативным мы вслед за А.Ф. Журавлевым относили финитные формы глагола (однородные глагольные сказуемые считались разными предикативными элементами), императив, инфинитив в инфинитивных односоставных предложениях, неадвербиализованные деепричастия, именную часть сказуемого с нулевой связкой и др. Парцеллированные элементы считались самостоятельными предикативными единицами. Именные однородные связки при одном глаголе не считались предикацией, как и второе именное сказуемое (пришел пьяный), причастия и причастные обороты в определительной функции, обособляемые адъективные определения и т.п. [Журавлев 1988].

3-я группа - показатели, связанные с частотностью служебных слов и местоимений:

9. Индекс прономинализации, вычисляемый как отношение количества местоимений-существительных к общему числу существительных.

10. Коэффициент логической связности, вычисляемый по формуле: общее число служебных слов (частицы + предлоги + союзы) / 3N предложений.

Все тексты были размечены при помощи морфологического парсера Xerox Incremental Parser2, далее производился подсчет частности слов с теми или иными тегами с ручным снятием омонимии.

4-я группа - показатели синтаксической сложности текста:

11. Соотношение числа групп однородных членов и длины текста в словах. Этот параметр Г.Я. Мартыненко относит к числу не зависящих от длины текста параметров, с помощью которых можно измерить синтаксическую сложность текста [Мартыненко 1988: 140].

12. Средняя длина фразы (под фразой мы понимаем простое предложение или предикативную часть сложного предложения); считается как отношение длины текста в словах к общему числу простых предложений и предикативных частей сложного предложения.

13. Средняя длина трех самых длинных предложений текста (в словах).

14. Отношение общего числа фраз к общему числу предложений в тексте.

15. Число случаев интерпозиции придаточного предложения, деленное на общее число придаточных предложений. В ряде работ данный параметр также используется как один из показателей сложности текста (см., например, [Kemper

Синтаксическая разметка текстов проводилась вручную. 3. Результаты эксперимента. После подсчета числовых значений указанных параметров текста данные для расчетов были занесены в Excel и далее экспортированы в программу SPSS Statistics для проведения корреляционного анализа.

2 https://open.xerox.com/Services/fst-nlp-tools/Consume/Morphological%20Analysis-176

1986]).

На первом этапе эксперимента на основе критерия Пирсона был проведен поиск статистически значимых корреляций между выбранными параметрами текста для выявления взаимовлияния параметров текста на разных уровнях языковой системы и уменьшения признакового пространства в дальнейших исследованиях. Полученные данные приведены в табл. 1, в которой на пересечении строки и столбца в случае наличия статистически значимых корреляций между параметрами текста приведено значение коэффициента корреляции Пирсона г (жирным выделены параметры, имеющие между собой высокие уровни связи). В нашем исследовании при поиске корреляций между численными значениями выбранных нами для исследования параметров текста мы исходили из тех соображений, что уровень статистической значимости p не может быть выше 0,05, однако для подавляющего большинства параметров его значение было крайне малым, в силу чего в данной таблице мы его не приводим.

Таблица 1

Статистически значимые корреляции между параметрами текста

Порядковый номер параметра 2 3 4 5 6 7 8 9 12 13 14 15

1 0,824 0,360 0,835 0,466 -0,524

2 0,631 0,665 -0,403 0,431 -0,393

3 0,416 0,319 -0,350

4 0,490 -0,616

5 0,934

7 -0,358 -0,452 00 ,3

8 0 о" о' 2 оп

9 -0,448

10 0,921 0,791 0,557

12 -0,370

13 0,827 0,530

14 0,409

Таблица 2

Статистически значимые корреляции между параметрами текста и характеристиками личности

Номер параметра текста 1 2 3 4 5 6 7 8 9 10 11 13

1. Психологическая характеристика автора

1.1. Темперамент

Холерик -0,225 0,01 -0,224 0,01

Сангвиник 0,297 0,0008 0,253 0,005

Флегматик 0,294 0,0009 0,228 0,01

Меланхолик -0,233 0,009

1.2. Акцентуация

Гипертимно сть 0,242 0,007 0,225 0,01

Дистимичность

Циклотимность -0,262 0,003 -0,258 0,004 0,258 0,004

Эмоциональность -0,205 0,02 -0,238 0,008

Демонстративность -0,267 0,003 -0,235 0,009 0,406 0,000003

Застревание 0,291 0,001

Педантично сть

Тревожность 0,200 0,03 0,221 0,01 0,228 0,01

Возбудимость 0,244 0,006

Экзальтированность

2. Пол 0,256 0,004 -0,296 0,0008

3. Возраст 0,211 0,02 0,271 0,002 -0,293 0,001 -0,242 0,007 0,260 0,004 0,284 0,001

Сильная корреляционная связь была нами обнаружена в группе параметров, отражающих лексическое разнообразие текста: между параметрами 1 и 2, 1 и 4, 5

Как показало настоящие исследование и наши предыдущие работы, целесообразно различать две группы параметров, связанных с лексическим разнообразием текста, - параметры, учитывающие только полнозначные слова, и параметры, учитывающие все лексические единицы текста. Высокая степень корреляции параметров 1 и 4 говорит о том, что индекс автосемантичности текста, показывающий соотношение в нем полнозначных и неполнозначных слов, может быть измерен как при помощи сервиса istio.com, так и при помощи бесплатно распространяемой программы Textus Pro 1.0.

Также нами была установлена сильная корреляционная связь между индексом предикативности (8) и средней длиной предложения (12): с возрастанием длины предложения этот индекс падает. Коэффициент логической связанности (10) возрастает с увеличением средней длины трех самых длинных предложений (13) и увеличением отношения (14). Параметры (13) и (14) также находятся между собой в сильной прямой корреляционной связи.

Используя аналогичный подход, на втором этапе исследования нами были определены уровни связи между характеристиками личности (пол, возраст, психологические характеристики в виде баллов) и параметрами текста.

В табл. 2 приведены коэффициенты корреляции Пирсона r и уровни статистической значимости p для коррелирующих между собой параметров текста и характеристик личности. Учитывая математические критерии оценки силы корреляционной связи, следует отметить, что уровень связи между исследуемыми величинами находится на границе слабой и средней связи. При расчетах мы сознательно отсекали те корреляции, значение коэффициента Пирсона для которых составляло менее 0,2, поскольку наши предыдущие исследования [Литвинова 2013б; Литвинова 2014; Литвинова 2015б] показывают несостоятельность использования этих данных для дальнейших расчетов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Следует отметить, что на этапе составления корпуса текстов и тестирования ряд характеристик личности (акцентуации) в соответствии с выбранным подходом задавались не в виде шкалы, а логистически (наличие/отсутствие признака). Поэтому расчет корреляций для большинства параметров демонстрирует весьма низкую связь личности с текстом по сравнению с тем, что нам удалось наблюдать ранее [Литвинова 2015б], когда тот или иной параметр личности имел градацию в виде числового диапазона.

4. Обсуждение. Как показал статистический анализ данных, наибольшее число корреляций с характеристиками личности имеет индекс автосемантичности (1), что подтверждает полученные ранее рядом авторов на материале различных языков результаты, свидетельствующие о значимости количественных характеристик неполнозначных слов для диагностирования характеристик личности. С возрастанием доли полнозначных слов в тексте (и соответственно снижением доли неполнозначных слов) падает вероятность того, что автор текста - холерик, имеет

такие акцентуации, как циклотимность, эмоциональность, демонстративность. Также отметим, что более высокие значения этого параметра характерны для мужчин.

Также установлен ряд корреляций с характеристиками личности такого параметра, как индекс лексического разнообразия с учетом только полнозначных слов (2). С его возрастанием ниже вероятность того, что автор текста - холерик, и выше - того, что флегматик.

Также является значимым для диагностирования характеристик личности такой параметр, как процент покрытия словаря текста 5-ю самыми частотными словами с учетом неполнозначных слов. С возрастанием этого показателя выше вероятность того, что автор текста является сангвиником, и ниже - того, что он является меланхоликом; также этот показатель падает с возрастом.

Как и в наших предыдущих исследованиях, выявлен ряд корреляций с характеристиками личности такого параметра, как индекс прономинализации. С его возрастанием также растет вероятность того, что автор текста имеет такие акцентуации характера, как циклотимность, демонстративность, возбудимость. Также высокие значения этого параметра более характерны для женщин.

Как показывает анализ, для диагностирования той или иной характеристики личности оказываются значимыми параметры различных языковых уровней. Так, для диагностирования типа темперамента оказываются значимыми те или иные характеристики лексического разнообразия и автосемантичности текста: например, для холериков, в противоположность флегматикам, характерны более низкие показатели индекса автосемантичности и лексического разнообразия с учетом только полнозначных слов; для сангвиников характерны более высокие показатели по параметру «процент покрытия 5-ю самыми частотными словами словаря текста» (как с учетом неполнозначных слов, так и без них) в противоположность меланхоликам, для которых характерны менее высокие значения этого показателя (с учетом не-полнозначных слов).

Для диагностирования той или иной акцентуации оказываются значимыми различные параметры текста. Так, для гипертимов характерны более высокие показатели индекса лексического разнообразия (3) и более высокий процент покрытия словаря текста 5-ю самыми частотными словами с учетом неполнозначных слов.

Для циклотимов характерны более низкие показатели индекса автосемантич-ности (1), (4) и высокие - индекса прономинализации. Для текстов эмоциональных людей характерны более низкие показатели индекса автосемантичности (1) и лексического разнообразия (3). Для речевой продукции демонстративных людей также характерны более низкие показатели индекса автосемантичности (1), (4) и более высокие - индекса прономинализации. Для текстов авторов с типом акцентуации «застревание» характерно более высокое значение доли слов, состоящих более чем из 10 букв, для авторов с акцентуацией «возбудимость» - более высокий индекс прономинализации.

Интересно отметить, что синтаксические параметры оказались значимыми только для диагностирования такой акцентуации автора текста, как тревожность. Для текстов лиц с повышенным уровнем тревожности характерны более высокое число однородных групп, более высокая средняя длина трех самых длинных предложений и большие высокие значения коэффициента логической связанности.

Для пола были найдены корреляции с индексом автосемантичности (1) и индексом прономинализации (9), что доказывает высказанный в ряде работ тезис о значимости анализа частотностей служебных слов (в частности, местоимений и предлогов) для диагностирования пола автора текста.

В работе был также выявлен ряд корреляций между значениями параметров текста и возрастом его автора, который понимался как диапазон значений от 16 до 79. В текстах людей более старшего возраста выше показатели индекса автосеман-тичности (1), лексического разнообразия с учетом только полнозначных слов (2), более высокий индекс предикативности и выше встречаемость групп однородных членов, меньше - процент покрываемости словаря текста 5-ю самыми частотными словами (как с учетом неполнозначных слов, так и без). Таким образом, как показал анализ, с возрастом происходит увеличение языковой сложности текста. Отметим, что для русского языка проблема диагностирования возраста автора текста остается слабо разработанной.

выводы. Таким образом, в работе была подтверждена связь между характеристиками личности и количественными параметрами письменного текста. Также исследование подтвердило особую значимость анализа частотных характеристик служебных и строевых слов для диагностирования личности автора текста. Вместе с тем относительно невысокие значения полученных коэффициентов корреляции в сравнении с полученными нами в предыдущих исследованиях указывают на то, что существуют возможности для улучшения полученных результатов. Выделим несколько направлений дальнейшей работы.

Так, в дальнейшем необходимо расширять корпус текстов для лучшей сбалансированности выборки. В частности, для исследования отражения в количественных параметрах текста возраста и пола их авторов возможно расширение корпуса за счет текстов интернет-коммуникации, для авторов которых известны соответствующие данные.

Отметим также, что для большей эффективности корреляционного анализа необходимо выбирать психологические тесты, результаты которых представлены в виде шкалы, а не в виде бинарных оппозиций (наличие/отсутствие признака).

В качестве одного из дальнейших направлений работы видится также расширение списка используемых параметров текста. Как представляется, такое расширение возможно за счет более детального анализа использования авторами текстов служебных и строевых слов, в том числе коннекторов, а также за счет введения количественных параметров, отражающих уровень связности и цельности текста.

Кроме того, необходима проверка количественных лингвистических параметров на стабильность при продуцировании одним и тем же автором текста на другую тему. Частично данную задачу может решить корпус текстов Personality, ряд подкорпусов которого содержат два текста разных функционально-смысловых типов одного и того же автора.

Как представляется, работа в указанных направлениях внесет определенный вклад в решение проблемы диагностирования личности по тексту и - шире - фундаментальной проблемы взаимосвязи языка и личности.

Литература

Журавлев А.Ф. Опыт квантитативно-типологического исследования разновидностей устной речи // Разновидности городской устной речи: сб. науч. тр. - М.: Наука, 1988. - С. 84-150.

Загоровская О.В., Литвинова Т.А., Литвинова О.А. Электронный корпус студенческих эссе на русском языке и его возможности для современных гуманитарных исследований // Мир науки, культуры и образования. - 2012. - № 3(34). - С.

Литвинова Т.А., Диброва Е.В., Литвинова О.А., Рыжкова Е.С. Корпусные исследования письменной речи в решении задач судебного автороведения // Филологические науки. Вопросы теории и практики. - 2015а. - № 7 (в печати).

Литвинова Т.А. Лингвистические основы неидентификационной судебно-автороведческой экспертизы // Вестник Челябинского государственного университета. Серия: Филология. Искусствоведение. - 2012. - Вып. 67. - С. 74-79.

Литвинова Т.А. Профилирование автора письменного текста // Язык и культура. - 2013а. - № 3(23). - С. 64-72.

Литвинова Т.А. Формально-грамматические корреляты личностных особенностей автора письменного текста // Филологические науки. Вопросы теории и практики. - 2013б. - № 12(30), ч. 1. - С. 132-135.

Литвинова Т.А., Литвинова О.А., Середин П.В. Частоты встречаемости последовательностей частей речи в тексте и психофизиологические характеристики его автора: корпусное исследование // Вестник Иркутского гос. лингвистического ун-та. - 2014. - № 2. - С. 8-12.

Литвинова Т.А., Середин П.В., Литвинова О.А., Загоровская О.В., Сердюк М.Е. Диагностирование индивидуально-психологических особенностей автора письменного текста, детерминирующих склонность к аутоагрессивному поведению // Вестник Воронежского гос. ун-та. Серия: Лингвистика и межкультурная коммуникация. - 2015б. - № 3 (в печати).

Мартыненко Г.Я. Основы стилеметрии. - Л.: Изд-во Ленингр. ун-та, 1988.

Седов К.Ф. Дискурс и личность: эволюция коммуникативной компетенции.

- М.: Лабиринт, 2004. - 320 с.

Чернов Д.Н., Игнатов Ю.Ю. Выражение психологических особенностей в количественных показателях речи // Вопросы психолингвистики. - 2012. - № 1(15).

- С. 134-139.

Kemper S. Imitation of complex syntactic constructions by elderly adults // Applied Psycholinguistics. - 1986. - Vol. 7, N 3. - P. 277-287.

Pennebaker J.W., Mehl M.R., Niederhoffer K. Psychological aspects of natural language use: Our words, our selves // Annual Review of Psychology. - 2003. - Vol. 54.

- P. 547-577.

387-389.

- 176 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.