Научная статья на тему 'ИДЕНТИФИКАЦИЯ АВТОРСТВА НА ОСНОВЕ ВЕКТОРИЗАЦИИ ЛИРИКИ А. А. АХМАТОВОЙ И М. И. ЦВЕТАЕВОЙ ПСИХОФИЗИОЛОГИЧЕСКИМИ МЕТОДАМИ'

ИДЕНТИФИКАЦИЯ АВТОРСТВА НА ОСНОВЕ ВЕКТОРИЗАЦИИ ЛИРИКИ А. А. АХМАТОВОЙ И М. И. ЦВЕТАЕВОЙ ПСИХОФИЗИОЛОГИЧЕСКИМИ МЕТОДАМИ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
30
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
2B-PLS МОДЕЛЬ / ТВОРЧЕСТВО М. И. ЦВЕТАЕВОЙ / ТВОРЧЕСТВО А. А. АХМАТОВОЙ / РАЗГРАНИЧЕНИЕ АВТОРОВ / ВЕКТОРИЗАЦИЯ ТЕКСТОВ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Ульченко Ангелина Николаевна

В целенаправленных диалоговых системах для более точного ответа, адресованного конкретному пользователю и учитывающего его особенности, может использоваться определитель авторства. В данной статье рассматривается возможность разграничения произведений двух авторов по результатам векторизации их текстов с помощью методов, которые успешно применяются для анализа в междисциплинарных исследованиях. Например, такой инструмент как 2B-PLS (Two-Block Projection to Latent Structure) продемонстрировал высокую эффективность в анализе результатов междисциплинарных исследований в нейролингвистике, психофизиологии и других областях наук. Для примера была взята лирика А. А. Ахматовой и М. И. Цветаевой, которая в наши дни служит объектом исследований множества ученых. Были выбраны 310 стихотворных текста, из которых 196 стихотворений относятся к творчеству А. А. Ахматовой, а 114 - М. И. Цветаевой. Анализируемые стихотворения датируются между 1907 и 1941 гг. в связи с датами жизни М. И. Цветаевой. Параметрами для анализа послужили результаты векторизации текстов: доли глаголов в тексте, имен собственных, имен прилагательных, наречий, уникальных слов в тексте, знаков препинания, служебных частей речи и знаменательных частей речи, средняя длина строк, количество строк, разнообразие знаков препинания. 2B-PLS анализ на основе указанных параметров показал однозначное разделение произведений двух поэтесс. Полученные результаты сопоставлены с исследованиями аспектов творчества А. А. Ахматовой и М. И. Цветаевой. Для лирики А. А. Ахматовой (по сравнению с лирикой М. И. Цветаевой) характерно более частое использование глаголов, прилагательных, наречий, служебных частей речи, знаменательных частей речи, а также больше строк и больше разнообразия знаков препинаний. Для лирики М. И. Цветаевой (по сравнению с лирикой А. А. Ахматовой) характерны более длинные строки и более разнообразный словарь, а также более частое использование знаков препинаний, имен существительных и собственных. Полученные результаты соотносятся с теоретическими исследованиями.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IDENTIFICATION OF AUTHORSHIP BASED ON VECTORIZATION OF LYRICS BY ANNA AKHMATOVA AND MARINA TSVETAEVA WITH PSYCHOPHYSIOLOGICAL METHODS

Purposeful dialog systems can employ an authorship determinant in order to obtain a more accurate answer which addresses a specific user and takes into account his features. This article discusses the possibility of distinguishing the works of two authors based on the results of vectorization of their texts using methods that are successfully used in interdisciplinary research. 2B-PLS (Two-Block Projection to Latent Structure) has demonstrated high effi iency in analyzing the results of interdisciplinary research in neurolinguistics, psychophysiology and other fields. The study described in this article involved the lyrics by Anna Akhmatova and Marina Tsvetaeva, whose works are nowadays researched by many scholars. The author selected 310 poetic texts: 196 poems by Akhmatova, and 114, by Tsvetaeva. The parameters for the analysis were the results of text vectorization: proportions of verbs in the text, proper names, adjectives, adverbs, unique words in the text, punctuation marks, functional parts of speech and significant parts of speech, average line length, number of lines, variety of punctuation marks. The 2B-PLS analysis based on the vectorization results for the texts in question showed clear differences between the works of the two poets. The author discussed these findings with scholars of Akhmatova and Tsvetaeva. The lyrics of Akhmatova (as compared to those of Tsvetaeva) are characterized by more frequent use of verbs, adjectives, adverbs, service parts of speech, significant parts of speech, as well as more lines and more variety of punctuation marks. The lyrics of Tsvetaeva (as compared to those of Akhmatova) are characterized by longer lines and a more diverse vocabulary, as well as more frequent use of punctuation marks, nouns and proper names. The results obtained correlate with theoretical studies.

Текст научной работы на тему «ИДЕНТИФИКАЦИЯ АВТОРСТВА НА ОСНОВЕ ВЕКТОРИЗАЦИИ ЛИРИКИ А. А. АХМАТОВОЙ И М. И. ЦВЕТАЕВОЙ ПСИХОФИЗИОЛОГИЧЕСКИМИ МЕТОДАМИ»

Комплексные исследования детства, 2023, т. 5, № 1 Comprehensive Child Studies, 2023, vol. 5, no. 1 _www.kid-journal.ru

Щ Check for updates

УДК 81-139 + 612.821

Комплексные междисциплинарные исследования

EDN BBNPHF

https://www.doi.org/10.33910/2687-0223-2023-5-1-4-13

Идентификация авторства на основе векторизации лирики А. А. Ахматовой и М. И. Цветаевой психофизиологическими методами

А. Н. Ульченко

Н1

1 Новосибирский национальный исследовательский государственный университет, 630090, Россия, г. Новосибирск, ул. Пирогова, д. 1

Аннотация. В целенаправленных диалоговых системах для более точного ответа, адресованного конкретному пользователю и учитывающего его особенности, может использоваться определитель авторства. В данной статье рассматривается возможность разграничения произведений двух авторов по результатам векторизации их текстов с помощью методов, которые успешно применяются для анализа в междисциплинарных исследованиях.

Например, такой инструмент как 2B-PLS (Two-Block Projection to Latent Structure) продемонстрировал высокую эффективность в анализе результатов междисциплинарных исследований в нейролингвистике, психофизиологии и других областях наук.

Для примера была взята лирика А. А. Ахматовой и М. И. Цветаевой, которая в наши дни служит объектом исследований множества ученых. Были выбраны 310 стихотворных текста, из которых 196 стихотворений относятся к творчеству А. А. Ахматовой, а 114 — М. И. Цветаевой. Анализируемые стихотворения датируются между 1907 и 1941 гг. в связи с датами жизни М. И. Цветаевой. Параметрами для анализа послужили результаты векторизации текстов: доли глаголов в тексте, имен собственных, имен прилагательных, наречий, уникальных слов в тексте, знаков препинания, служебных частей речи и знаменательных частей речи, средняя длина строк, количество строк, разнообразие знаков препинания. 2B-PLS анализ на основе указанных параметров показал однозначное разделение произведений двух поэтесс. Полученные результаты сопоставлены с исследованиями аспектов творчества А. А. Ахматовой и М. И. Цветаевой.

Для лирики А. А. Ахматовой (по сравнению с лирикой М. И. Цветаевой) характерно более частое использование глаголов, прилагательных, наречий, служебных частей речи, знаменательных частей речи, а также больше строк и больше разнообразия знаков препинаний. Для лирики М. И. Цветаевой (по сравнению с лирикой А. А. Ахматовой) характерны более длинные строки и более разнообразный словарь, а также более частое использование знаков препинаний, имен существительных и собственных.

Полученные результаты соотносятся с теоретическими исследованиями.

Сведения об авторе

Ульченко Ангелина Николаевна, ORCID: 0000-0002-5880-6424, e-mail: a.ulchenko@g.nsu.ru

Для цитирования:

Ульченко, А. Н.

(2023) Идентификация авторства на основе векторизации лирики А. А. Ахматовой и М. И. Цветаевой психофизиологическими методами. Комплексные исследования детства, т. 5, № 1, с. 4-13. https://doi. org/10.33910/2687-0223-2023-5-1-4-13 EDN BBNPHF Получена 25 декабря 2022; прошла рецензирование 22 января 2023; принята 23 января 2023.

Финансирование: Исследование не имело финансовой поддержки. Права: © А. Н. Ульченко (2023). Опубликовано Российским государственным педагогическим университетом им. А. И. Герцена. Открытый доступ на условиях лицензии CC BY-NC 4.0.

Ключевые слова: 2Б-РЬЯ модель, творчество М. И. Цветаевой, творчество А. А. Ахматовой, разграничение авторов, векторизация текстов

Identification of authorship based on vectorization of lyrics by Anna Akhmatova and Marina Tsvetaeva with psychophysiological methods

A. N. Ulchenko™

1 Novosibirsk National Research State University, 2 Pirogova Str., Novosibirsk 630090, Russia

Author

Angelina N. Ulchenko, ORCID: 0000-0002-5880-6424, e-mail: a.ulchenko@g.nsu.ru

For citation:

Ulchenko, A. N.

(2023) Identification of authorship based on vectorization of lyrics by Anna Akhmatova and Marina Tsvetaeva with psychophysiological methods. Comprehensive Child Studies, vol. 5, no. 1, pp. 4-13. https://doi.org/10.33910/2687-0223-2023-5-1-4-13 EDN BBNPHF

Received 25 December 2022; reviewed 22 January 2023; accepted 23 January 2023. Funding: The study did not receive any external funding. Copyright: © A. N. Ulchenko (2023). Published by Herzen State Pedagogical University of Russia. Open access under CC BY-NC License 4.0.

Abstract. Purposeful dialog systems can employ an authorship determinant in order to obtain a more accurate answer which addresses a specific user and takes into account his features. This article discusses the possibility of distinguishing the works of two authors based on the results of vectorization of their texts using methods that are successfully used in interdisciplinary research.

2B-PLS (Two-Block Projection to Latent Structure) has demonstrated high efficiency in analyzing the results of interdisciplinary research in neurolinguistics, psychophysiology and other fields.

The study described in this article involved the lyrics by Anna Akhmatova and Marina Tsvetaeva, whose works are nowadays researched by many scholars. The author selected 310 poetic texts: 196 poems by Akhmatova, and 114, by Tsvetaeva. The parameters for the analysis were the results of text vectorization: proportions of verbs in the text, proper names, adjectives, adverbs, unique words in the text, punctuation marks, functional parts of speech and significant parts of speech, average line length, number of lines, variety of punctuation marks.

The 2B-PLS analysis based on the vectorization results for the texts in question showed clear differences between the works of the two poets. The author discussed these findings with scholars of Akhmatova and Tsvetaeva. The lyrics of Akhmatova (as compared to those of Tsvetaeva) are characterized by more frequent use of verbs, adjectives, adverbs, service parts of speech, significant parts of speech, as well as more lines and more variety of punctuation marks.

The lyrics of Tsvetaeva (as compared to those of Akhmatova) are characterized by longer lines and a more diverse vocabulary, as well as more frequent use of punctuation marks, nouns and proper names. The results obtained correlate with theoretical studies.

Keywords: 2B-PLS, poems by A. Akhmatova, poems by M. Tsvetaeva, differentiation of authors, vectorization of texts

Введение

Про особенности лирики М. И. Цветаевой писала Л. М. Марзаганова (2020) в журнале «Молодой ученый». Проанализировав трудную жизнь поэтессы (Первая мировая и Гражданская войны, две революции, гибель дочери, расставание с мужем и эмиграция) и ее творчество, автор статьи устанавливает темы, наиболее полно раскрытые в лирике Цветаевой.

1) Тема детства. Была раскрыта особенно полно в ранних стихотворениях. Ей посвящен цикл «Вечерний альбом». В произведениях описана моральная борьба детей не только с «тенями», но и с самим собой.

2) Тема дома. Эта тема тесно связана с темой детства. Дом для М. И. Цветаевой

не просто жилище, но и отражение ее жизни.

3) Тема матери. К этой теме поэтесса относилась трепетно. Самое известное стихотворение, посвященное матери — «Маме» из сборника «Вечерний альбом». Автор показывает незримую связь матери и дочерей.

4) Тема бессонницы. Л. М. Марзаганова выделяет тему бессонницы как главную тему в произведениях М. И. Цветаевой. Этой теме посвящен цикл «Бессонница», написанный в 1916 г., в котором бессонница принимает множество оболочек, но неизменно преследует поэтессу.

Анализ тематик в лирике Цветаевой продолжает М. В. Цветкова (Цветкова 2017), обращая внимание на реализацию идей поэта,

поэзии и процесса творения стихов. Проанализировав произведения, написанные поэтессой на протяжении всей ее жизни, Цветкова приходит к выводу, что в художественном мире Цветаевой присутствуют (и являются основными) следующие мотивы:

1) мотив «наития стихий»;

2) мотив поэта как многобожца и чернокнижника;

3) мотив поэзии как смертоносного занятия, несущего блаженство.

Центральным же мотивом является мотив избранничества.

Таким образом, основное направление анализа стихотворений Цветаевой соотносится с анализом тематик, мотивов, соотнесения художественных средств выражения с биографией поэтессы.

Бросающейся в глаза особенностью поэзии Цветаевой можно назвать своеобразный стиль произведений. Об этом писала О. Г. Ревзина (Ревзина 2009). Она отмечает особенность деления слов на слоги, которое восстанавливает ритмическую схему. Кроме того, такое разделения слова на морфемы придает последним статус полнозначного слова, что позволяет увидеть новые смыслы в произведениях. Характерным для Цветаевой является синтагматическое соположение языковых единиц, различающихся только ударением, например название стихотворения «Мука и мука». Цветаева (Ревзина 2009) достигает выразительности не только за счет ритмической структуры стихотворений, но и за счет активного использования знаков препинаний как семантически насыщенных выразительных средств.

Таким образом, выделяются следующие черты поэзии Цветаевой:

1) уплотненность речи;

2) концентрированность;

3) напряженность и эмоциональность речи;

4) активность художественной формы, ритмики.

А. А. Ахматова была ярким представителем направления акмеизма, характеризующимся отказом от использования витиеватых метафор, загадочных символов, туманных образов.

Теме предикативов в творчестве Ахматовой посвящена статья А. А. Козловской (Козловская 2021), в которой анализируются личные формы предикатива с семантикой положительного состояния. Автор статьи обращает внимание на особенную частотность параллельных конструкций с различными личными предикативами, которые указывают на состояние лирической героини («Эта жизнь прекрасна, сердце, будь

же мудро» (Козловская 2021, 108)). Проанализировав стихотворения Ахматовой с точки зрения употребления предикативов, автор статьи приходит к выводу, что именно с их помощью поэтесса передает сложный и противоречивый внутренний мир героини, поскольку в одном произведении можно встретить предикативы как с положительной оценкой, так и с отрицательной.

На особенности употребления предикативов также обратила внимания О. Г. Твердохлеб (Твердохлеб 2007). В статье «Предикативное употребление компаратива в поэзии А. А. Ахматовой» приведена следующая статистика: компаратив встречается в 216 документах из найденных 945, имеется 346 вхождений (по поиску в корпусе НКРЯ по подкорпусу текстов Ахматовой). Такое употребление компаративов указывает на душевное состояние лирического героя.

В творчестве Цветаевой и Ахматовой есть общее и различия. Об этом написано, например, в пособии «Русская литература 1920-1930 гг.» (Русская литература 1920-1930 гг. 2015). В нем выделяются следующие сходства:

1) обе поэтессы утверждали, что их надо называть поэтами;

2) пережитое трудное детство;

3) любовь является одной из самых главных тем в поэзии;

4) обе писали о России и любви к ней;

5) обе изучали и любили Пушкина и не любили его жену.

А вот какие были замечены отличия:

1) у Цветаевой в произведениях больше динамики, тогда как у Ахматовой — статики;

2) стержень цветаевского творчества — эгоцентризм, тогда как Ахматову никто не обвинял в эгоцентризме;

3) страдающая роль Ахматовой — мужчина, а Цветаевой — женщина;

4) Ахматова была поэтом России, а Цветаева превращалась как бы в гражданина Вселенной.

Что касается статистической обработки текста, то она применяется в различных областях языкознания, но особенно ярко проявляется при работе с тезаурусами.

Рассмотрим, например, извлечение отношений (Пимешков, Диковицкий, Шишаев 2020). Данная задача связана с извлечением знаний из неструктурированного текста. В дальнейшем эти знания возможно использовать для формирования и пополнения тезауруса.

Процедура извлечения объектов включает комбинацию статистических и лингвистических методов. На первом этапе используются методы дистрибутивного анализа: определяются частотные характеристики каждого слова, учитывается статистика совместного употребления, определяется контекстная близость слов (для этого проводится векторизация слов). Показателем контекстной близости является косинусная близость между векторами слов. И только на втором этапе производится формирование синтаксических деревьев и построение модели семантической сети с множественными связями.

Методы статистического анализа текстов также используются для анализа текстов, например, научных публикаций (Рижинашвили 2018). Автор рассматривает «частоту употребления терминов в названиях статей и представленность различной тематики исследований» (Рижинашвили 2018, 76). Из такого анализа можно сделать вывод о понимании учеными содержания и задач дисциплины. По словам А. Л. Рижинашвили, «проведение с таким анализом изучения распределения работ по тематике способствует выявлению скрытых тенденций в развитии наук» (Рижинашвили 2018, 76).

Кроме изучений научных текстов, статистические методы используются для изучения текстов сообществ социальных сетей (Аванесян и др. 2021). В работе «Характеристики текстов сообществ социальных сетей» описаны методы статистического анализа текстов социальных сетей, основанных на сравнении автоматически сгенерированных частотных словарей методами корреляционного анализа. Авторами исследования были проведены ранговый анализ таких словарей и анализ частотных словарей буквосочетаний различной длины. В результате был сделан вывод, что буквосочетания длиной не более трех характеризуют язык (все наборы текстов на русском языке). Далее вычислялись наборы статистических характеристик текстов как возможные психолингвистические показатели. Таким образом, статистические методы обработки текстов применяются для различных видов анализа различных текстов.

Наследие Цветаевой и Ахматовой, двух поэтесс Серебряного века, привлекает исследователей как в прошлом веке, так и сегодня. Причем рассматриваются и общие особенности творчества (Могушкова 2021; Хадзиева, Нальгиева 2018), и конкретные детали в конкретных произведениях или произведениях конкретного периода (Ризванова, Кадырова 2020; Чжан 2022). Интересно, что стихотворения показаны иногда с неожиданных углов зрения, таких как, например,

исследование особенностей переводов на язык хинди (Самохина, Бобков 2021).

В настоящее время особенно актуальным является анализ литературных произведений не обычными методами литературоведов, а с использованием различных статистических методов (Гречачин 2018). В общем же случае задача определения автора текста востребована в различных областях обработки естественного языка, как, например, определение авторства в чатботах для целеориентированного ответа. Покажем на примере стихотворений Цветаевой и Ахматовой вариант разделения творчества двух людей по результатам векторизации их текстов.

Материалы и методы

Для анализа использовались 310 стихотворений: 196 стихотворений из творчества Ахматовой, 114 — Цветаевой. Стихотворения были взяты с сайта rupoem.ru, на котором существует группировка по дате написания. Был выбран промежуток с 1907 по 1941 г. (период был выбран в связи с датами жизни Цветаевой).

Была получена таблица со следующими колонками:

1) идентификатор текста;

2) текст;

3) доля глаголов в тексте;

4) доля существительных в тексте;

5) доля имен собственных;

6) доля прилагательных;

7) доля наречий;

8) средняя длина строк;

9) количество строк;

10) словарное разнообразие, то есть доля уникальных слов в тексте;

11) разнообразие знаков препинаний;

12) доля знаков препинаний;

13) доля служебных частей речи;

14) доля знаменательных частей речи.

Необходимые расчеты производились при

помощи библиотеки spacy_udpipe языка программирования Python, особенности которой позволяют проводить морфологический разбор слов в тексте с учетом контекста (Ульченко 2021).

Методы анализа

2B-PLS (Two-Block Projection to Latent Structure или Partial Least Squares) — эффективный инструмент современного анализа через выявление глубинных «латентных структур» (независимых механизмов), единых для двух блоков многомерных показателей (Rohlf, Corti 2000; Rannar et al. 1994).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Такой подход предоставляет больше возможностей, чем общеизвестные методы главных компонент (Principal Component Analysis, PCA) и главных координат (Principal Coordinates Analysis, PCO), латентное размещение Дирихле (Latent Dirichlet allocation, LDA), латентный семантический анализ (Latent semantic analyses, LSA/LSI — латентно-семантическое индексирование), неотрицательная матричная факторизация Lee-Seung (Nonnegative matrix factorization, NMF).

В междисциплинарных экспериментах 2B-PLS анализ показал высокую эффективность в исследованиях в области психофизиологии (Nikolaeva et al. 2022; Krivoshchekov et al. 2022), нейронаук (Savostyanov et al. 2022), биологии (Ковалева и др. 2019), генетики (Polunin et al. 2019), психологии (Vergunov 2022).

Модель формировалась с помощью программного пакета JACOBI 4 (Polunin, Shtaiger, Efimov 2019).

Результаты

В блоки нашей 2B-PLS-модели вошли переменные (табл. 1), которые представляют собой частоты частей речи и знаков препинаний, средние длины и количество строк в текстах, словарное разнообразие и разнообразие знаков препинаний (12 переменных, блок 1), а также ряды признаков года, номера и автора текста (343 признака, блок 2). Соответственно, будет 12 латентных структур.

Таким образом, предикторы 2B-PLS-модели (блок № 1) должны дать ответы на вопросы о параметрах текстов. Обучение модели (выбор угла разворота блока данных) происходит за счет откликов (блок № 2), которые включают признаки года, номера и автора текста.

Согласно графику осыпи латентных структур, сформированных моделью (рис. 1), первая латентная структура должна выражать общие особенности текстов авторов. Отсутствие

Табл. 1. Блоки переменных для 2B-PLS-модели

Переменные Блок

verbs, nouns, propn, adj, adv, service, puncts, significant: частота глаголов, существительных, имен собственных, прилагательных, наречий, служебных частей речи, знаков препинаний, знаменательных частей речи № 1

Length_str, count_str, word diversity, punct diversity: средняя длина строки и количество строк, словарное разнообразие, разнообразие знаков препинаний № 1

1907..1941: 31 признак года текста № 2

#1 ..#310: 310 признаков текстов (код текста) № 2

Ah, Ts: признаки авторов (Ахматова или Цветаева) № 2

Variables Block

verbs, nouns, propn, adj, adv, service, puncts, significant: frequency of verbs, nouns, proper names, adjectives, adverbs, service parts of speech, punctuation marks, significant parts of speech No. 1

Length_str, count_str, word diversity, punct diversity: average line length, number of lines, vocabulary diversity, punctuation diversity No. 1

1907..1941: 31 signs of the year of the text No. 2

#1 ..#310: 310 signs of texts (text code) No .2

Ah, Ts: signs of the authors (Akhmatova or Tsvetaeva) No. 2

Note: variables from Block 1 were previously normalized to the range.

Примечание: переменные из блока 1 предварительно нормировались на размах.

Table 1. Blocks of variables for 2B-PLS model

Рис. 1. График осыпи для латентных структур 2В-РЬБ-модели. Горизонтальная ось — номера латентных структур, вертикальная ось — описываемая доля общей наблюдаемой дисперсии

Fig. 1. Scree plot for latent structures of the 2B-PLS model. The horizontal axis is the numbers of latent structures, the vertical axis is the described share of the total observed variance

значимых нагрузок откликов-кодов для отдельных текстов по данной латентной структуре показывает это. К тому же показано отсутствие значимых нагрузок откликов для отдельных лет — динамика показателей из блока № 1 (табл. 1) для текстов данных авторов для периода с 1907 по 1941 г. отсутствует. Подавляющая доля общей наблюдаемой диспепсии, которая обусловлена структурой № 1 (81,6%), свидетельствует о крайне высокой однородности текстов с точки зрения изучаемых показателей.

Таким образом, латентная структура № 1 — это комплекс устойчивых формальных характеристик текстов Ахматовой и Цветаевой, который позволяет выявлять спорные с точки зрения авторства тексты (таковых среди 310 текстов не оказалось).

Отрицательное направление оси латентной структуры № 1 определяется признаком для текста из творчества Ахматовой (г = -0,69), а положительное направление — признаком для текста из творчества Цветаевой (г = +0,69). Таким образом, механизм, который связан с латентной структурой № 1, является противопоставлением комплекса устойчивых формальных характеристик текстов для Ахматовой и для Цветаевой.

Прочие латентные структуры не достигли порога в 5% описываемой дисперсии (это «шумовые» компоненты).

На рисунке 2 показаны соответствия изучаемых параметров и творчества поэтесс.

Обсуждение

Полученные результаты можно объяснить с филологической точки зрения. Например, рассмотрим словарное разнообразие в творчестве Цветаевой. Как пишут И. А. Ковынева и И. С. Скляр (Ковынева, Скляр 2019), для поэтессы характерно использование окказиональных слов, причем окказионализмы получаются путем образования несуществующих грамматических форм («знав», «ждав», «изжаждавша-яся»). Такое словообразование повышает количество уникальных слов в тексте. Кроме того, М. И. Цветаева в своих произведениях использует синонимы, как однокоренные, так и раз-нокоренные (Мамаджанова 2020), что является для нее особым художественным средством. Это отчетливо видно в следующих строках:

Об ушедших — отошедших — В горный лагерь перешедших, В белый стан тот журавлиный — Голубиный — лебединый.

Рис. 2. Визуализация статистически значимых нагрузок для переменных (латентная структура № 1). Горизонтальная ось — признаки автора, вертикальная ось — нагрузки (коэффициенты корреляции);

обозначения соответствуют таблице 1

Fig. 2. Visualization of statistically significant loadings for variables (latent structure No. 1). The horizontal axis is the author's signs, the vertical axis is loadings (correlation coefficients) the designations correspond to those in Table 1

adj count str service verbs adv +0 3 -significant puncts

nouns

+0.2+0.1 -n n

word diversify

A -0.1 - word diversity -0.2 -length str S

punct diversity significant significant count_str adj

puncts verbs

Активное использование синонимов также увеличивает долю уникальных слов.

В отношении знаков препинания надо учитывать, что в произведениях Цветаевой встречаются в большом количестве вставные конструкции (Ашимова и др. 2017), которые, как известно, выделяются знаками препинания. Таким образом, получается, что при использовании таких обособленных членов предложения количество пунктуации растет. Однако произведения Цветаевой не отличаются разнообразием знаков препинания, в ее произведениях они повторяются.

Что касается количества прилагательных, глаголов и наречий в произведениях поэтесс, то в работах, посвященных предикативам в творчестве Ахматовой, исследователи (например, Козловская 2021) отмечают, что она обильно пользуется краткими прилагательными, глаголами и наречиями для выражения предикативных смыслов.

Заключение

С помощью 2B-PLS показана возможность противопоставления двух поэтесс на основе

указанных параметров. 2B-PLS-анализ показал четкое разделение произведений Ахматовой и Цветаевой. Полученные результаты обсуждены с аспектами исследований их творчества.

Для лирики А. А. Ахматовой (по сравнению с лирикой М. И. Цветаевой) характерно более частое использование глаголов, прилагательных, наречий, служебных частей речи, знаменательных частей речи, а также большее количество строк и большее разнообразие знаков препинаний.

Для лирики М. И. Цветаевой (по сравнению с лирикой А. А. Ахматовой) характерны более длинные строки и более разнообразный словарь, а также более частое использование знаков препинаний, имен существительных и собственных.

Конфликт интересов

Автор заявляет об отсутствии потенциального или явного конфликта интересов.

Conflict of Interest

The author declares that there is no conflict of interest, either existing or potential.

Благодарности Acknowledgements

Е. Г. Вергунову за оказанную помощь в об- The author thanks E.G. Vergunov for his assis-работке данных. tance in data processing.

Литература

Аванесян, Н. Л., Соловьев, Ф. Н., Чеповский, А. А. (2021) Характеристики текстов сообществ социальных сетей. Вестник Новосибирского государственного университета. Серия: Информационные технологии, т. 19, № 1, с. 5-14.

Ашимова, А. Ф., Юсуфов, М. Г., Юсуфова, Л. О. (2017) Расчлененные синтаксические структуры со вставной конструкцией в художественной прозе М. Цветаевой. Вестник Социально-педагогического института, № 3 (23), с. 30-36.

Гречачин, В. А. (2018) Статистические методы в исследовании текстов. Вестник Башкирского университета, т. 23, № 3, с. 772-776.

Ковалева, В. Ю., Поздняков, А. А., Литвинов, Ю. Н., Ефимов, В. М. (2019) Оценка сопряженности морфогенетических и молекулярно-генетических модулей изменчивости серых полевок Microtus S.L. в градиентных условиях среды. Экологическая генетика, т. 17, № 2, с. 21-34. https://doi.org/10.17816/ ecogen17221-34

Ковынева, И. А., Скляр, Е. С. (2019) Функционально-семантические особенности окказионализмов в поэзии А. А. Фета, Ф. И. Тютчева и М. И. Цветаевой. Балтийский гуманитарный журнал, т. 8, № 1 (26), с. 86-88.

Козловская, А. А. (2021) Личные формы предикатива с семантикой позитивной экспрессии в лирике А. Ахматовой. Верхневолжский филологический вестник, № 1 (24), с. 104-111. https://doi.org/10.20323/2499-9679-2021-1-24-104-111

Мамаджанова, Х. К. (2020) Обстоятельный анализ синонимов в поэзии Марины Цветаевой, как демонстрирование номинативного варьирования. Вестник Педагогического университета, № 4 (87), с. 46-50.

Марзаганова, Л. М. (2020) Особенности лирики Марины Цветаевой. Молодой ученый, № 3 (293), с. 134-136.

Могушкова, Т. С. (2021) Сборник стихов «Вечерний альбом» Марины Ивановны Цветаевой. Вестник науки, т. 3, № 4 (37), с. 26-30.

Пимешков, В. К., Диковицкий, В. В., Шишаев, М. Г. (2020) Извлечение отношений тезауруса из текстов на естественном языке с использованием статистических и лингвистических методов. Труды Кольского научного центра РАН. Информационные технологии, № 8-11, с. 188-192. https://doi.org/10.37614/2307-5252.2020.8.11.028

Ревзина, О. Г. (2009) Безмерная Цветаева: опыт системного описания поэтического идиолекта. М.: Дом-музей Марины Цветаевой, 594 с.

Рижинашвили, А. Л. (2018) Методы статистического анализа текстов научных публикаций в работе историка науки. Проблемы деятельности ученого и научных коллективов, № 4 (34), с. 76-86.

Ризванова, Н. А., Кадырова, К. А. (2020) Композиционная роль заглавия, посвящения и подзаголовка в поэме Марины Цветаевой «Крысолов». Мир науки, культуры, образования, № 3 (82), с. 369-371. https://doi.org/10.24411/1991-5497-2020-00579

Русская литература 1920-1930 гг. (2015) StudFiles. [Электронный ресурс]. URL: https://studfile.net/ preview/2681017/ (дата обращения 19.11.2022).

Самохина, Е. Н., Бобков, Д. В. (2021) Особенности перевода стихотворений на язык хинди на примере творчества Марины Цветаевой и Анны Ахматовой. Казанский вестник молодых ученых, т. 5, № 5, с. 47-52.

Твердохлеб, О. Г. (2017) Предикативное употребление компаратива в поэзии А. А. Ахматовой. Вестник Пермского университета. Российская и зарубежная филология, т. 9, № 1, с. 77-86. https://doi.org/10.17072/2037-6681-2017-1-77-86

Ульченко, А. Н. (2021) Автоматическая замена литературных слов на разговорные аналоги. В кн.: World Science: Problems and Innovations: сборник статей LIV Международной научно-практической конференции. Пенза: Наука и Просвещение, с. 62-65.

Хадзиева, А. А., Нальгиева, А. А. (2018) Особенности творчества Анны Ахматовой. Проблемы современной науки и образования, № 2 (122), с. 35-37.

Цветкова, М. В. (2017) Поэт, поэзия и творческий дар в художественном мире Марины Цветаевой. Ученые записки Казанского университета. Серия: Гуманитарные науки, т. 159, № 1, с. 138-153.

Чжан, В. (2022) Мужество как философия бытия (на материале творчества А. Ахматовой и О. Берггольц периода Великой Отечественной войны). Филологические науки. Вопросы теории и практики, т. 15, № 2, с. 298-303. https://doi.org/10.30853/phil20210681

Krivoshchekov, S. G., Nikolaeva, E. I., Vergunov, E. G., Prihodko, A. Yu. (2022) Multivariate analysis of indicators of inhibitory and autonomic control in orthostasis and emotional situations. Human Physiology, vol. 48, no. 1, pp. 20-29. https://doi.org/10.1134/S0362119721060050 Nikolaeva, E. I., Efimova, V. L., Vergunov, E. G. (2022) Integration of vestibular and auditory information

in ontogenesis. Children, vol. 9, no. 3, article 401. https://doi.org/10.3390/children9030401 Polunin, D., Shtaiger, I., Efimov, V. (2019) JACOBI4 software for multivariate analysis of biological data. bioRxiv.

[Online]. Available at: https://doi.org/10.1101/803684 (accessed 19.11.2022). Rannar, S., Lindgren, F., Geladi, P., Wold, S. (1994) A PLS kernel algorithm for data sets with many variables and fewer objects. Part 1: Theory and algorithm. Journal of Chemometrics, vol. 8, no. 2, pp. 111-125. https://doi.org/10.1002/cem.1180080204 Rohlf, F. J., Corti, M. (2000) Use of two-block partial least-squares to study covariation in shape. Systematic Biology,

vol. 49, no. 4, pp. 740-753. https://doi.org/10.1080/106351500750049806 Savostyanov, A. N., Vergunov, E. G., Saprygin, A. E., Lebedkin, D. A. (2022) Validation of a face image assessment technology to study the dynamics of human functional states in the EEG resting-state paradigm. Vavilov Journal of Genetics and Breeding, vol. 26, no. 8, pp. 765-772. https://doi.org/10.18699/VJGB-22-92 Vergunov, E. G. (2022) Coping space transformation at different levels of university training during the pandemic and the assessment of its integral indicators. Kompleksnye issledovaniya detstva — Comprehensive Child Studies, vol. 4, № 2, pp. 115-123. https://doi.org/10.33910/2687-0223-2022-4-2-115-123

References

Avanesyan, N. L., Solovev, F. N., Chepovskij, A. A. (2021) Kharakteristiki tekstov soobshchestv sotsial'nykh setej [Characteristics of texts of social networks communities]. VestnikNovosibirskogogosudarstvennogo universiteta. Seriya: Informacionnye tekhnologii — Vestnik NSU. Series: Information Technologies, vol. 19, no. 1, pp. 5-14. (In Russian)

Ashimova, A. F., Yusufov, M. G., Yusufova, L. O. (2017) Raschlenennye sintaksicheskie struktury so vstavnoj konstruktsiej v khudozhestvennoj proze M. Tsvetaevoj [Dissected syntactis structures with an inserted construction in M. Tsvetaeva's artistic prose]. VestnikSotsial'no-pedagogicheskogo instituta — Bulletin of theSocio-Pedagogical Institute, no. 3 (23), pp. 30-36. (In Russian) Grechachin, V. A. (2018) Statisticheskie metody v issledovanii tekstov [Statistical methods in the study of texts].

Vestnik Bashkirskogo universiteta — Bulletin of Bashkir University, vol. 23, no. 3, pp. 772-776. (In Russian) Khadzieva, A. A., Nalgieva, A. A. (2018) Osobennosti tvorchestva Anny Akhmatovoj [Features of Anna Akhmatova's creativity]. Problemy sovremennoj nauki i obrazovaniya — Modern Problems of Science and Education, no. 2 (122), pp. 35-37. (In Russian)

Kovaleva, V. Yu., Pozdnyakov, A. A., Litvinov, Yu. N., Efimov, V. M. (2019) Otsenka sopryazhennosti morfogeneticheskikh i molekulyarno-geneticheskikh modulej izmenchivosti serykh polevok Microtus S. L. v gradientnykh usloviyakh sredy [Estimation of the congruence between morphogenetic and molecular-genetic modules of gray voles Microtus S.L. variability along a climatic gradient]. Ekologicheskaya genetika — Ecological Genetics, vol. 17, no. 2, pp. 21-34. https://doi.org/10.17816/ecogen17221-34 (In Russian) Kovyneva, I. A., Sklyar, E. S. (2019) Funktsional'no-semanticheskie osobennosti okkazionalizmov v poezii A. A. Feta, F. I. Tyutcheva i M. I. Tsvetaevoj [Functional semantic particularities of occasional words in Afanasy Fet's, Fyodor Tyutchev's and Marina Tsvetaeva's poetry]. Baltijskij gumanitarnyj zhurnal — Baltic Humanitarian Journal, vol. 8, no. 1 (26), pp. 86-88. (In Russian) Kozlovskaya, A. A. (2021) Lichnye formy predikativa s semantikoj pozitivnoj ekspressii v lirike A. Akhmatovoj [Personal predicatives with the semantics of positive expression in A. Akhmatova's poetry]. Verkhnevolzhskij filologicheskij vestnik — Verhnevolzhski Philological Bulletin, no. 1 (24), pp. 104-111. https://doi.org/10.20323/2499-9679-2021-1-24-104-111 (In Russian) Krivoshchekov, S. G., Nikolaeva, E. I., Vergunov, E. G., Prihodko, A. Yu. (2022) Multivariate analysis of indicators of inhibitory and autonomic control in orthostasis and emotional situations. Human Physiology, vol. 48, no. 1, pp. 20-29. https://doi.org/10.1134/S0362119721060050 (In English) Mamadzhanova, Kh. K. (2020) Obstoyatel'nyj analiz sinonimov v poezii Mariny Tsvetaevoj, kak demonstrirovanie nominativnogo var'irovaniya [Detailed analysis of synonymy in Marina Svetaeva poetry, as a manifestation of nominative variation]. Vestnik Pedagogicheskogo universiteta — Herald of the Pedagogical University, no. 4 (87), pp. 46-50. (In Russian)

Marzaganova, L. M. (2020) Osobennosti liriki Mariny Tsvetaevoj [Features of the lyrics of Marina Tsvetaeva].

Molodoj uchenyj, no. 3 (293), pp. 134-136. (In Russian) Mogushkova, T. S. (2021) Sbornik stikhov "Vechernij al'bom" Mariny Ivanovny Tsvetaevoj [The collection of poems

"Evening album" of Marina Tsvetaeva]. Vestnik nauki, vol. 3, no. 4 (37), pp. 26-30. (In Russian) Nikolaeva, E. I., Efimova, V. L., Vergunov, E. G. (2022) Integration of vestibular and auditory information in ontogenesis. Children, vol. 9, no. 3, article 401. https://doi.org/10.3390/children9030401 (In English)

A. H. YAbneHKO

Pimeshkov, V. K., Dikovitskij, V. V., Shishaev, M. G. (2020) Izvlechenie otnoshenij tezaurusa iz tekstov na estestvennom yazyke s ispol'zovaniem statisticheskikh i lingvisticheskikh metodov [Extraction of relation from natural language texts using statistical and linguistic methods]. Trudy Kol'skogo nauchnogo tsentra RAN. Informatsionnye tekhnologii — Transactions of the Kola Scientific Center. Information Technologies, no. 8-11, pp. 188-192. https://doi.org/10.37614/2307-5252.2020.8.11.028 (In Russian) Polunin, D., Shtaiger, I., Efimov, V. (2019) JACOBI4 software for multivariate analysis of biological data. bioRxiv.

[Online]. Available at: https://doi.org/10.1101/803684 (accessed 19.11.2022). (In English) Rannar, S., Lindgren, F., Geladi, P., Wold, S. (1994) A PLS kernel algorithm for data sets with many variables and fewer objects. Part 1: Theory and algorithm. Journal of Chemometrics, vol. 8, no. 2, pp. 111-125. https://doi.org/10.1002/cem.1180080204 (In English) Revzina, O. G. (2009) Bezmernaya Tsvetaeva: opyt sistemnogo opisaniya poeticheskogo idiolekta [Immeasurable Tsvetaeva: The experience of a systematic description of a poetic idiolect]. Moscow: Marina Tsvetaeva's House Museum Publ., 594 p. (In Russian) Rizhinashvili, A. L. (2018) Metody statisticheskogo analiza tekstov nauchnykh publikatsij v rabote istorika nauki [The methods of statistical analysis of texts of scientific publications in a work of historian of science]. Problemy deyatel'nosti uchenogo i nauchnykh kollektivov — The Problems of Scientist and Scientific Groups Activity, no. 4 (34), pp. 76-86. (In Russian) Rizvanova, N. A., Kadyrova, K. A. (2020) Kompozitsionnaya rol' zaglaviya, posvyashcheniya i podzagolovka v poeme Mariny Tsvetaevoj "Krysolov" [The compositional role of the title, dedication, subtitle in Marina Tsvetaeva's poem "The Rat-Man"]. Mir nauki, kul'tury, obrazovaniya — The World of Science, Culture and Education, no. 3 (82), pp. 369-371. https://doi.org/10.24411/1991-5497-2020-00579 (In Russian) Rohlf, F. J., Corti, M. (2000) Use of two-block partial least-squares to study covariation in shape. Systematic Biology,

vol. 49, no. 4, pp. 740-753. https://doi.org/10.1080/106351500750049806 (In English) Russkaya literatura 1920-1930 gg. [Russian Literature 1920-1930]. (2015) StudFiles. [Online]. Available at:

https://studfile.net/preview/2681017/ (accessed 19.11.2022). (In Russian) Samokhina, E. N., Bobkov, D. V. (2021) Osobennosti perevoda stikhotvorenij na yazyk khindi na primere tvorchestva Mariny Tsvetaevoj i Anny Akhmatovoj [Features of translation of poems into hindi language on the example of the works of Marina Tsvetaeva and Anna Akhmatova]. Kazanskij vestnik molodykh uchenykh — Kazan Bulletin of Young Scientists, vol. 5, no. 5, pp. 47-52. (In Russian) Savostyanov, A. N., Vergunov, E. G., Saprygin, A. E., Lebedkin, D. A. (2022) Validation of a face image assessment technology to study the dynamics of human functional states in the EEG resting-state paradigm. Vavilov Journal of Genetics and Breeding, vol. 26, no. 8, pp. 765-772. https://doi.org/10.18699/VJGB-22-92 (In English) Tsvetkova, M. V. (2017) Poet, poeziya i tvorcheskij dar v khudozhestvennom mire Mariny Tsvetaevoj [Poet, poetry, and gift of creativity in Marina Tsvetaeva's poetic world]. Uchenye zapiski Kazanskogo universiteta. Seriya: Gumanitarnye nauki — Proceedings of Kazan University. Humanities Series, vol. 159, no. 1, pp. 138-153. (In Russian)

Tverdokhleb, O. G. (2017) Predikativnoe upotreblenie komparativa v poezii A. A. Akhmatovoj [Predicative use of the comparative in the poetry of A. A. Akhmatova]. VestnikPermskogo universiteta. Rossijskaya izarubezhnaya filologiya — Perm University Herald. Russian and Foreign Philology, vol. 9, no. 1, pp. 77-86. https://doi. org/10.17072/2037-6681-2017-1-77-86 (In Russian) Ulchenko, A. N. (2021) Avtomaticheskaya zamena literaturnykh slov na razgovornye analogi [Automatic replacement of literary words with colloquial counterparts]. In: World Science: Problems and Innovations: sbornik statej LIV Mezhdunarodnoj nauchno-prakticheskoj konferentsii [World Science: Problems and Innovations: Proceedings of the LIV International Scientific-Practical Conference]. Penza: Nauka i Prosveshchenie Publ., pp. 62-65. (In Russian)

Vergunov, E. G. (2022) Coping space transformation at different levels of university training during the pandemic and the assessment of its integral indicators. Kompleksnye issledovaniya detstva — Comprehensive Child Studies, vol. 4, no. 2, pp. 115-123. https://doi.org/10.33910/2687-0223-2022-4-2-115-123 (In English) Zhang, W. (2022) Muzhestvo kak filosofiya bytiya (na materiale tvorchestva A. Akhmatovoj i O. Berggol'ts perioda Velikoj Otechestvennoj vojny) [Courage as philosophy of being (based on the creative work of A. Akhmatova and O. Bergholz during the Great Patriotic War)]. Filologicheskie nauki. Voprosy teorii ipraktiki — Philology. Theory & Practice, vol. 15, no. 2, pp. 298-303. https://doi.org/10.30853/phil20210681 (In Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.