Научная статья на тему 'К вопросу об авторстве романа "Двенадцать стульев"'

К вопросу об авторстве романа "Двенадцать стульев" Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1303
199
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АТРИБУЦИЯ ТЕКСТА / АВТОРСКИЙ ИНВАРИАНТ / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ИДЕНТИФИКАЦИЯ / АВТОРСТВО / ТЕКСТ / СЛУЖЕБНЫЕ СЛОВА / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА / КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА / ЭКСПЕРТИЗА ТЕКСТА / РОМАН "ДВЕНАДЦАТЬ СТУЛЬЕВ" / TEXT ATTRIBUTION / AUTHOR''S INVARIANT / MATHEMATICAL STATISTICS / IDENTIFICATION / AUTHORSHIP / TEXT / SERVICE WORDS / INFORMATION TECHNOLOGY / MATHEMATICAL LINGUISTICS / QUANTITATIVE CHARACTERISTICS OF THE TEXT / TEXT EXAMINATION / NOVEL "THE TWELVE CHAIRS"

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Миронова Любовь Борисовна, Верещагина Ольга Валерьевна

В настоящее время для определения авторства и подлинности литературных текстов применяются методы теории распознавания образов, математической статистики, теории вероятностей, широко используется вычислительная техника. Для определения автора текста часто требуется экспертиза, которая может установить создателя неизвестного текста или определить принадлежность произведения определенному автору при помощи статистических методов. С развитием вычислительной техники появилась возможность реализовать указанные методы, требующие больших по объему вычислений. Атрибуция текста есть установление авторства произведения литературы или искусства, времени и места его создания. Статья посвящена атрибуции широко известного романа «Двенадцать стульев». Целью статьи является проверка гипотезы Ирины Амлински о том, что автором романа «Двенадцать стульев» является М.А. Булгаков, выдвинутой ею в книге «12 стульев от Михаила Булгакова». Для проверки этой гипотезы использовался статистический метод подсчета авторского инварианта. Под авторским инвариантом понимается количественная характеристика литературных текстов, которая однозначно характеризует своим поведением произведения одного автора или небольшого числа «близких авторов» и принимает существенно разные значения для произведений разных групп авторов. В качестве такого инварианта берется частота служебных слов в больших выборках, принадлежащих исследуемым литературным текстам. Проведенное исследование позволяет отклонить гипотезу И. Амлински.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TO THE QUESTION OF THE AUTHORSHIP OF THE NOVEL "THE TWELVE CHAIRS"

Currently, methods of pattern recognition theory, mathematical statistics, probability theory are used to determine the authorship and authenticity of literary texts, computer technology is widely used. To determine the author of a text often requires expertise that can establish the creator of an unknown text or determine the ownership of a work of a certain author using statistical methods. With the development of computer technology, it became possible to implement these methods, which require large amounts of calculations. Attribution of the text is the establishment of the authorship of a work of literature or art, the time and place of its creation. The article is devoted to the attribution of the well-known novel "The Twelve Chairs". The aim of the article is to test the hypothesis of literary critic Irina Amlinsky that the author of the novel "The Twelve Chairs" is M. Bulgakov, put forward by her in the book "12 chairs from Mikhail Bulgakov". To test this hypothesis, we used a statistical method for calculating the author's invariant. The author's invariant is understood as a quantitative characteristic of literary texts, which uniquely characterizes the behavior of the work of one author or a small number of "close authors", takes significantly different values for the works of different groups of authors. As such an invariant, the frequency of service words in large samples of texts belonging to the literary texts under study is taken. This study allows to reject hypothesis of I. Amlinski.

Текст научной работы на тему «К вопросу об авторстве романа "Двенадцать стульев"»

Mironova Lyubov Borisovna, Vereshchagina Olga Valerievna TO THE QUESTION OF THE AUTHORSHIP ...

philological sciences -linguistics

УДК 81:81'32:82-31:519.257 DOI: 10.26140/bgz3-2019-0801-0026

К ВОПРОСУ ОБ АВТОРСТВЕ РОМАНА «ДВЕНАДЦАТЬ СТУЛЬЕВ»

© 2019

Миронова Любовь Борисовна, доцент кафедры математик и прикладной информатики,

Елабужский институт Верещагина Ольга Валерьевна, студент, Елабужский институт Казанский (Приволжского) федеральный университет (423600, Россия, Елабуга, улица Казанская, 89, e-mail: [email protected]) Аннотация. В настоящее время для определения авторства и подлинности литературных текстов применяются методы теории распознавания образов, математической статистики, теории вероятностей, широко используется вычислительная техника. Для определения автора текста часто требуется экспертиза, которая может установить создателя неизвестного текста или определить принадлежность произведения определенному автору при помощи статистических методов. С развитием вычислительной техники появилась возможность реализовать указанные методы, требующие больших по объему вычислений. Атрибуция текста есть установление авторства произведения литературы или искусства, времени и места его создания. Статья посвящена атрибуции широко известного романа «Двенадцать стульев». Целью статьи является проверка гипотезы Ирины Амлински о том, что автором романа «Двенадцать стульев» является М.А. Булгаков, выдвинутой ею в книге «12 стульев от Михаила Булгакова». Для проверки этой гипотезы использовался статистический метод подсчета авторского инварианта. Под авторским инвариантом понимается количественная характеристика литературных текстов, которая однозначно характеризует своим поведением произведения одного автора или небольшого числа «близких авторов» и принимает существенно разные значения для произведений разных групп авторов. В качестве такого инварианта берется частота служебных слов в больших выборках, принадлежащих исследуемым литературным текстам. Проведенное исследование позволяет отклонить гипотезу И. Амлински.

Ключевые слова: Атрибуция текста, авторский инвариант, математическая статистика, идентификация, авторство, текст, служебные слова, информационные технологии, математическая лингвистика, количественные характеристики текста, экспертиза текста, роман «Двенадцать стульев».

TO THE QUESTION OF THE AUTHORSHIP OF THE NOVEL "THE TWELVE CHAIRS»

© 2019

Mironova Lyubov Borisovna, associate professor, department of mathematics and applied informatics, Elabuga Institute Vereshchagina Olga Valerievna, student, Elabuga Institute Kazan (Volga region) Federal University (423600, Russia, Yelabuga, Kazanskaya street, 89, e-mail: [email protected]) Abstract. Currently, methods of pattern recognition theory, mathematical statistics, probability theory are used to determine the authorship and authenticity of literary texts, computer technology is widely used. To determine the author of a text often requires expertise that can establish the creator of an unknown text or determine the ownership of a work of a certain author using statistical methods. With the development of computer technology, it became possible to implement these methods, which require large amounts of calculations. Attribution of the text is the establishment of the authorship of a work of literature or art, the time and place of its creation. The article is devoted to the attribution of the well-known novel "The Twelve Chairs". The aim of the article is to test the hypothesis of literary critic Irina Amlinsky that the author of the novel "The Twelve Chairs" is M. Bulgakov, put forward by her in the book "12 chairs from Mikhail Bulgakov". To test this hypothesis, we used a statistical method for calculating the author's invariant. The author's invariant is understood as a quantitative characteristic of literary texts, which uniquely characterizes the behavior of the work of one author or a small number of "close authors", takes significantly different values for the works of different groups of authors. As such an invariant, the frequency of service words in large samples of texts belonging to the literary texts under study is taken. This study allows to reject hypothesis of I. Amlinski.

Keywords: Text attribution, author's invariant, mathematical statistics, identification, authorship, text, service words, information technology, mathematical linguistics, quantitative characteristics of the text, text examination, novel "The Twelve Chairs".

Проблемы атрибуции, установления авторства литературных и других (например, нарративных) текстов давно привлекает внимание исследователей, в том числе весьма авторитетных в научной среде [1-3].

В настоящее время исследования ведутся в различных направлениях: используются лингво-теоретические методики [4], различные методы, основанные на сравнении количественных характеристик текста [5, 6], интенсивно применяются математические методы, сопряженные с использованием вычислительной техники, как в России [7-12], так и в других странах [13-17]. Для определения авторства и подлинности литературных текстов с успехом применяются подходы из теории распознавания образов, математической статистики и теории вероятностей. Большой интерес представляют изучение гендерной дифференциации авторов, автороведческая экспертиза в юридической практике [18-20].

В 2013 году в свет вышла книга Ирины Амлински «12 стульев от Михаила Булгакова» [21], в которой литературовед обосновывает свою гипотезу, согласно кото-

рой Илья Ильф и Евгений Петров не являются истинными авторами литературного произведения «Двенадцать стульев».

Цель данной работы заключается в исследовании справедливости гипотезы Ирины Амлински. Для поиска подлинного автора мы будем использовать статистический метод «авторского инварианта», разработанный В. П. Фоменко и Т. Г. Фоменко [22, 23]. Метод был разработан с целью определения авторства текста на основе некой его числовой характеристики, а именно частоты употребления автором служебных слов: частиц, предлогов и союзов. Указанный метод зарекомендовал себя как простой, но эффективный метод, неоднократно проверенный на практике [24, 25].

Дадим точное определение авторского инварианта. Под авторским инвариантом понимается такая количественная характеристика текстов, прежде всего литературных, которая, во-первых, однозначно характеризует произведения одного автора или «близких авторов», во-вторых принимает такие значения для произведений

филологические науки - Миронова Любовь Борисовна, Верещагина Ольга Валерьевна

языкознание К ВОПРОСУ ОБ АВТОРСТВЕ РОМАНА ...

разных групп авторов, что эти значения уверенно различаются.

Из этого определения следует, что авторский инвариант позволяет установить авторов исследуемого текста, либо резко сузить круг претендентов на авторство.

Книга Ирины Амлински «12 стульев от Михаила Булгакова» содержит массу аргументов в пользу того, что автором произведения «Двенадцать стульев» является Михаил Афанасьевич Булгаков. Исследовательница указывает на удивительные совпадения в текстах «Мастер и Маргарита» и «Двенадцать стульев». С ней соглашается, например, В. Козаровецкий [26]. Число таких совпадений вызывает подозрения о несостоятельности традиционной версии создания романа. С другой стороны, скрыть подобную мистификацию непросто. Возникает много вопросов, например для чего это могло понадобиться самому Булгакову? Существуют рассказы современников о том, что И. Ильф и Е. Петров напряженно работали над романом «Двенадцать стульев», стараясь не выбиться из графика издателя. Общеизвестно, что И. Ильф, Е. Петров и М. Булгаков работали в редакции газеты «Гудок», постоянно общались, делились творческими замыслами. Однако аргументация И. Амлински преследует цель доказать, что роман «Двенадцать стульев» не мог быть написан И. Ильфом и Е. Петровым. И. Амлински считает, что анализ совместного творчества Ильфа и Петрова демонстрирует массу противоречий. Отношения авторов были не настолько близки, чтобы мог проявиться феномен соавторства (познакомились Ильф и Петров уже сложившимися немолодыми людьми, друг к другу обращались на «вы» и т.д.). При этом структура повествования романа весьма сложная, включает много второстепенных персонажей, нетривиальных сюжетных ходов, аллюзий и реминисценций. Остается непонятым, как И. Ильф и Е. Петров работали совместно, да ещё с такой большой производительностью, доступной лишь профессиональному писателю.

Подозрения И. Амлински вызывает и то, что черновых вариантов рукописи не сохранилось, имеется только написанный рукой Е. Петрова экземпляр окончательной рукописи и две машинописные копии с неё с редакторской правкой.

Эти и некоторые другие аргументы заставляют усомниться в том, что И. Ильф и Е. Петров действительно являются авторами романа «Двенадцать стульев». Вместе с тем, подход И. Амлински грешит определенной однобокостью, ею подобраны только те факты, которые ставят под сомнение авторство И. Ильфа и Е. Петрова, подтверждают эту заранее принятую гипотезу. Поэтому бесспорно признать правоту И. Амлински мы тоже не можем. Здесь мы попытаемся определить подлинного автора теперь уже методами математической статистики, а именно используя авторский инвариант.

Пусть в нашем распоряжении оказалось два произведения разных писателей. В данном случае «Двенадцать стульев» от И. Ильфа и Е. Петрова и «Мастер и Маргарита» от М. Булгакова. Выделим теперь из этих текстов отдельные фрагменты — выборки одинакового объема, то есть состоящие из одного и того же (фиксированного заранее) количества слов. Это количество слов естественно назвать объемом выборки.

Итак, последовательно двигаясь по тексту одного автора, затем другого, мы, берем один и тот же объем двух произведений, например, в 16000 слов. Чем длиннее исследуемое литературное произведение, тем больше выборок мы сможем сделать. Для коротких произведений число выборок невелико, что усложняет анализ, делает результаты неустойчивыми.

Пусть теперь мы избрали какой-либо лингвистический параметр, использование служебных слов, например, частоту употребления писателем предлога «в». Можно изучить эволюцию этого параметра вдоль всего текста этого произведения. Для этого сделаем последовательные выборки и подсчитаем для каждой из них зна-Балтийский гуманитарный журнал. 2019. Т. 8. № 1(26)

чение интересующего нас параметра. В результате для каждого произведения получим свое число. Например, в произведении «Мастер и Маргарита» предлог «в» встречается 434 раза, что составляет 2,713%, в романе «Двенадцать стульев» — 427 раз, что составляет 2,669%.

Продолжая анализ двух произведений таким образом, построим таблицу из 54 служебных слов. В список служебных слов мы внесли следующие:

Предлоги — для, во, в, на, с, у, от, без, до, о, над, из-за, через, со, при, про, об, ко, за, к, по, из, из-под, под.

Союзы — и, но, а, то есть, зато, когда, да, хотя, тоже, или, чтобы, если, будто, что.

Частицы — не, ведь, как, же, даже, бы, ли, вон, -ни-будь, -либо, только, вот, то, ни, лишь, уже.

Общий процент использования предлогов в произведениях:

«Мастер и Маргарита» — 1515 (9,468%);

«Двенадцать стульев» — 1516 (9,468%).

Общий процент использования союзов в произведениях:

«Мастер и Маргарита» — 650 (4,063%);

«Двенадцать стульев» — 496 (3,100%).

Общий процент использования частиц в произведениях:

«Мастер и Маргарита» — 675 (4,219%);

«Двенадцать стульев»— 593 (3,706%).

Таким образом, используя полученные данные, можем составить таблицу.

Таблица 1 - Доля служебных слов в сопоставленных романах.

Произведение Объем исследованного Количество служебных Доля служебных слов в

«Мастер и Маргарита» 16000 слов 2840 17.75%

«Двенадцать стульев» 16000 слов 2605 16.28%

Авторский инвариант для М.А. Булгакова равен 17,75%, а для автора романа «Двенадцать стульев» — 16,28%. Разность равна 1,47, что значительно превышает колебания этого параметра внутри произведений этих авторов. Такое существенное различие в значении авторского инварианта позволяет отклонить гипотезу И. Амлински о том, что автором романа «Двенадцать стульев» является М.А. Булгаков. Таким образом, можно утверждать, что действительным авторами указанного романа являются И. Ильф и Е. Петров.

СПИСОК ЛИТЕРАТУРЫ:

1. Виноградов В.В. Проблема авторства и теория стилей. М.: Государственное издательство художественной литературы, 1961. 616 с.

2. От Нестора до Фонвизина. Новые методы определения авторства. Под. ред. Л.В. Милова. М.: Прогресс, 1994. 448 с.

3. Хьетсо Г., Густавссон С., БекманБ., Гил С. Кто написал «Тихий Дон»? (Проблема авторства «Тихого Дона»). М.: Книга, 1989. 263 с.

4. Верхозин С.С. К вопросу о лингво-теоретических основах методик авторизации текста //Вестник Иркутского государственного лингвистического университета. 2013. № 1. С. 24-28.

5. Быстров А.В., Злобин Е.В. К вопросу об авторстве предсмертного письма Б.В. Савинкова - опыт комплексного исследования //Круг идей: Новое в исторической информатике. М., 1994. С.129-133.

6. Шабага И.Ю. Опыт исследования галльских панегириков количественными методами // Вестник Древней истории. 1993. № 1. С.147-161.

7. Муха А.В., Розалиев В.Л., Орлова Ю.А., Заболеева-Зотова А.В. Автоматизированный подход к определению авторства текста // Известия ВолГТУ. 2013. № 14 (117). С. 51-54.

8. Кукушкина О.В., Поликарпов А.А., Хмелёв Д.В. Определение авторства текста с использованием буквенной и грамматической информации //Проблемы передачи информации. 2001. Т. 37. Вып. 2. С. 96-109.

9. Шевелев О.Г. Разработка и исследование алгоритмов сравнения стилей текстовых произведений: дис. ...канд. техн. наук. Томск, 2006. 176 с.

10. Романов А.С., Шелупанов А.А., Бондарчук С.С. Обобщенная методика идентификации автора неизвестного текста // Доклады Томского государственного университета систем управления и радиоэлектроники. 2010. № 1(21). С. 108-112.

11. Романов А.С., Мещеряков Р.В. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной междунар. конф. «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). М.: РГГУ, 2009. Вып. 8 (15). С. 432-437.

12. Романов А.С. Методика идентификации автора текста на

1Ö9

Mironova Lyubov Borisovna, Vereshchagina Olga Valerievna TO THE QUESTION OF THE AUTHORSHIP ...

philological sciences -linguistics

основе аппарата опорных векторов // Докл. Том. гос. ун-та систем управления и радиоэлектроники. 2009. № 1 (19). Ч. 2. С. 36-42.

13. Tweedie F.J., Singh S., Holmes D.I. Neural Network Applications in Stylometry: The Federalist Paper // Computers and the Humanities. 1996. V. 30. P. 1-10.

14. Lowe D., Matthews R. Shakespeare vs. Fletcher: A Stylometric Analysis by Radial Basis Functions // Computers and the Humanities. 1995. V. 29. P. 449-461.

15. Bensefia A., Paquet T., Heutte L. Information Retrieval Based Writer Identification //ICDAR '03, Edinburgh, Scotland, August 3-6, 2003. 2003. P. 946-950.

16. Bensefia A., Nosary A., Paquet T., Heutte L. Writer Identification By Writer's Invariants //IWFHR '02, Ontario, Canada, August 6-8, 2002. 2002. P. 274-279.

17. Seropian A., Grimaldi M., Vincent N. Writer Identification based on the fractal construction of a reference base // ICDAR '03, Edinburgh, Scotland, August 3-6, 2003. 2003. P. 1163-1167.

18. Красса С.И., Калугина Е.Н. Гендерное профилирование автора субстандартного текста. //Вестник ЮУрГУ. Серия «Лингвистика». 2014. Т. 11. № 3. С. 19-22.

19. Красса С.И. Методика и инструментарий атрибуции текста в автороведческой экспертизе // Альманах современной науки и образования. 2013. № 10. С. 106-108.

20. Красса С.И. Методы судебной лингвистической экспертизы: практическая типология // Сборник научных трудов Sworld по материалам международной научно-практической конференции. 2012. Т. 40. № 4. С. 88-91.

21. Амлински И. 12 стульев от Михаила Булгакова. Berlin: Kirschner Verlag, 2013. 328 с.

22. Фоменко В.П., Фоменко Т.Г. Авторский инвариант русских литературных текстов. Предисловие А.Т. Фоменко. В кн. Фоменко А.Т. Новая хронология Греции: Античность в средневековье. Т. 2. М.: Изд-во МГУ, 1996. С. 768-820.

23. Авторский инвариант русских литературных текстов. [Электронный ресурс]. URL: http://chronologia.org/seven2_2/add3.html (дата обращения 13.01.2019).

24. Хмелев Д.В. Распознавание автора текста с использованием цепей А.А. Маркова //Вестник МГУ. Сер. 9: Филология. 2000. № 2. С. 115-126.

25. Хмелёв Д.В. Краткая история разработки методик определения авторского стиля. [Электронныйресурс]. URL: http://www.rusf.ru/ books/analysis/history.htm (дата обращения 13.01.2019).

26. Козаровецкий В. Московские баранки и одесские бублики. Кто написал «12 стульев» //Литературная Россия. №41. 11.10.2013. [Элекронный ресурс] URL: http://old.litrossia.ru/2013/41/08347.html (дата обращения 14.01.2019).

Статья поступила в редакцию 24.01.2019 Статья принята к публикации 27.02.2019

i Надоели баннеры? Вы всегда можете отключить рекламу.