Научная статья на тему 'Классификация стихотворных текстов методом дискриминантного анализа'

Классификация стихотворных текстов методом дискриминантного анализа Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
689
121
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРИМИНАНТНЫЙ АНАЛИЗ / АВСТРАЛИЙСКАЯ ПОЭЗИЯ / ИНДИВИДУАЛЬНЫЙ СТИЛЬ / ХАРАКТЕРИСТИКИ ТЕКСТА / DISCRIMINANT ANALYSIS / CLASSIFICATION / AUSTRALIAN VERSE / INDIVIDUAL STYLE / CHARACTERISTICS OF THE TEXT

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Ермолаева Юлия Евгеньевна

Статья посвящена классификации поэтических произведений австралийских поэтов XIX в. на основе 32 разноуровневых признаков методом дискриминантного анализа. Выявлены признаки, релевантные для дифференциации поэтических текстов. Получены данные о степени сходства и различия классов текстов различных авторов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Classification of verse texts by means of discriminant analysis

The article is devoted to classification of verse texts of Australian poets of XIX century on the basis of 32 different-leveled characteristics by means of discriminant analysis. The features, relevant for the differentiation of the poetic texts are defined. The data about the degree of similarity and difference of texts classes by different authors is gathered.

Текст научной работы на тему «Классификация стихотворных текстов методом дискриминантного анализа»

модели окультуривания рыцарства в контексте переменчивого и, в целом, крайне «некультурного» XV в.

9. Benson L.D. Malory’s Morte d’Arthur. Cambridge; Mass., 1976. P. 99-101.

10. Лотман Ю.М. Культура и взрыв. М., 1992. С. 85.

1. Knight S. Arthurian Literature and Society. N. Y., 1983. P. 113.

2. Malory Sir T. The Works of Sir Thomas Malory / еd. E. Vinaver. L., 1967. P. 1203-1204.

3. Bellamy J. Crime and Public Order in England in the Later Middle Ages. L., 1973. P. 1.

4. Lander J.R. Conflict and Stability in Fifteenth Century England. L., 1977. P. 167.

5. Barber R.W. The Knight and Chivalry. L., 1970. Chapter XX.

6. Field P.J.C. Introduction // Maloty T. Le Morte Darthur. L., 1978. P. 46.

7. James M. English Politics and the Concept of Honour 1485-1642. Oxford, 1979. P. 1.

8. Михайлов А.Д. Роман и повесть Высокого Средневековья // Средневековый роман и повесть. М., 1974. С. 17-18.

Поступила в редакцию 5.12.2008 г.

Serenkov Yu.S. Malory’s Arthuriana as a prescriptive ethical model of the knighthood culture. The article is devoted to the Thomas Malory’s vision of problems caused by an aggravation of the cultural crisis inside the English knighthood. Using the artistic and propagandist potential of the Arthurian myth, Malory traces the ways of refining the knighthood mentality through following certain behavioral and communicative patterns which he encrypts in the text of the “Winchester manuscript”. The main model of cultural refining is linked with the idea of the preciousness of reputation gained not by means of violence but through appropriation of king’s and lady’s goodwill and leans on reconsideration of the chivalric concepts of honor (hon-neur) and glory (gloire).

Key words: cultural code; knighthood; society; Middle Ages.

УДК 811.111’38

КЛАССИФИКАЦИЯ СТИХОТВОРНЫХ ТЕКСТОВ МЕТОДОМ ДИСКРИМИНАНТНОГО АНАЛИЗА

© Ю.Е. Ермолаева

Статья посвящена классификации поэтических произведений австралийских поэтов XIX в. на основе 32 разноуровневых признаков методом дискриминантного анализа. Выявлены признаки, релевантные для дифференциации поэтических текстов. Получены данные о степени сходства и различия классов текстов различных авторов.

Ключевые слова: дискриминантный анализ; Австралийская поэзия; индивидуальный стиль; характеристики текста.

Стилеметрия в настоящее время является одним из ведущих направлений в области изучения особенностей творческой манеры авторов, классификации текстов, определения авторства, выявления жанровой характеристики текстов. Основной целью стилеметрического анализа является нахождение признаков, отображающих как сходство стиля разных авторов, так и имеющиеся в них различия. В большинстве случаев указанная задача решается на материале прозаических текстов [1, 2]. В отношении стиля стихотворных текстов таких исследований значительно меньше. Из их числа следует отметить работы В.С. Баевского [3, 4], получившего ценные выводы на материале стихотворных текстов

российских поэтов, и работы В. С. Андреева -на материале американских поэтов [5, 6].

Целью данной статьи является поиск маркеров стиля для ряда ведущих австралийских поэтов XIX в. Материалом исследования послужили стихотворные произведения выдающихся австралийских поэтов Адама Гордона, Генри Кендалла, Виктора Дейли, Чарльза Харпура и Генри Лоусона. XIX в. в Австралии - время литературного ученичества, накопления поэтического опыта, но уже с ощутимыми проявлениями самостоятельности эстетического мышления, с поисками национального материала и национальных принципов его художественного воплощения [7].

Творческий метод Адама Гордона складывался в противоречивой борьбе романтических и реалистических тенденций. Наметив слияние традиций классической английской и устной австралийской поэзии, Гордон определил направление австралийской поэзии вплоть до конца XIX в.

Генри Кэндалл по праву считается национальным поэтом Австралии. В поэзии Кендалла сильны традиции романтизма. Он указал путь переосмысления европейских литературных традиций в условиях Австралии.

Виктор Дейли - поэт-романтик, автор сатирических, лирико-философских стихов, сонетов, баллад.

Выразителем взглядов демократических слоев населения Австралии был Чарльз Хар-пур. Определяя место Харпура в истории национальной поэзии, австралийские критики отмечают, что он заложил основы адаптации английских поэтических традиций к австралийской действительности. Его поэзия стоит у истоков австралийской литературы, освещая путь ее демократическим традициям.

В творчестве Лоусона, вдохновленном социалистическими идеями, показан суровый быт простых людей, звучат национальнопатриотические мотивы.

Несмотря на обширную художественную практику, к систематическому изучению австралийской литературы даже в самой Австралии приступили сравнительно недавно. Литературоведение долго пренебрегало ею как второстепенным, периферийным очагом английской литературы. С этим связано небольшое количество публикаций, посвященных исследованию творчества австралийских поэтов.

Данное исследование строится на базе стихотворных произведений, содержащих от восьми до шестидесяти строк. Такой подход обеспечивает сопоставимость текстов по объему [5]. К анализу привлекаются лирические произведения. Это объясняется тем, что в лирике личность автора отражается гораздо полнее и многограннее, чем в других видах поэзии. В выборку были включены ямбические стихотворения (различных размеров), поскольку именно этим метром написано большинство лирических произведений анализируемых австралийских поэтов. Размер выборок составил около 600 стихотворных строк для каждого автора (566 строк Гордо-

на, 595 строк Харпура, 598 строк Дейли, 614 строк Кендалла, 626 строк Лоусона), что составило в целом 2999 стихотворных строк. Произведения отбирались методом случайных чисел.

При формировании признакового пространства нашего исследования был взят ряд характеристик, используемых в работах

В.С. Андреева [5, 6]. Мы привлекаем к анализу 32 признака, отражающих фонетический, морфологический, синтаксический и ритмо-метрический аспекты. Вслед за указанной выше схемой признаков особое значение в нашей работе уделяется начальным и конечным сильным позициям стиха. Под сильной понимается позиция, на которую согласно метрической схеме должно падать ударение. Начало строки несет информативное содержание, а конец строки является основой для конструкции ритма и рифмы [8].

В фонетической группе признаков в нашей работе рассматривается количество слогов в словах в первой и последней сильных позициях в строке. Ритмо-метрическая группа представлена таким признаком, как количество стоп в строке. Морфологические признаки определяются частеречной принадлежностью слов в первой и последней сильных позициях в строке. Нами учитываются следующие морфологические классы слов: принадлежность слова к морфологическому классу существительного, прилагательного, глагола и его форм, наречия, местоимения. Синтаксическая группа представлена такими признаками, как синтаксическая функция слова, занимающего первую и последнюю сильную позицию в строке; количество придаточных предложений в составе сложноподчиненного и простых предложений в составе сложносочиненного предложения; количество предложений с полной и частичной инверсией. Учитывается также возможность замещения сильной позиции словом, не являющимся членом предложения (вводные слова, обращения).

Не менее актуальным является учет таких синтаксических признаков, как стилистическая маркированность конца строки, перенос и разрыв стиха синтаксической паузой. Под переносом (еп|атЬетеп1;) обычно понимают перенесение части синтаксически целой фразы из одной стихотворной строки в другую, например:

Whatever I can value, I can mould / Right deftly to my ends, and boldly too. (Харпур “To James Norton, Esq.”).

Другим признаком, основанным на несовпадении ритмической и синтаксической пауз, является синтаксический разрыв стиха, т. е. наличие в теле стиха синтаксической паузы, например:

I am Illusion; I am Truth. (Кендалл “Spring Song”).

Стилистическая маркированность конца строки устанавливается для стихов, оканчивающихся стилистическим вопросом, умолчанием или восклицанием, например:

I used to work the whole night through, / And what have you to say? (Лоусон, “And What Have You to Say ”).

Основными методами настоящего исследования являются многомерные статистические процедуры в рамках дискриминантного анализа. Дискриминантный анализ традиционно используется для принятия решения о том, какие переменные различают (дискриминируют) две или более совокупности (группы). Успешный опыт применения процедур этого вида анализа на языковом и текстовом материале имеет место в целом ряде работ [5, 6, 9-12].

В результате применения дискриминантного анализа было установлено, что около 70 % привлекаемых нами к анализу признаков (22 из 32) оказались релевантными для дискриминации текстов различных авторов. Эти признаки сформировали модель, определяющую признаковое пространство для дальнейшего исследования. В нее вошли следующие характеристики: количество слогов в словах в первой сильной позиции, количество существительных, глаголов, местоимений, наречий, сказуемых, определений, обстоятельств в первой сильной позиции, количество слов в первой и последней сильных позициях, не являющихся членами предложения, количество прилагательных, наречий, подлежащих, определений, дополнений в последней сильной позиции, количество простых предложений в составе сложносочиненного, количество придаточных предложений, количество предложений с полной и частичной инверсией, количество стихотворных переносов, стилистическая маркированность конца строки, количество стоп.

Для определения того, в чем сходны и чем различаются стили авторов и какие признаки являются наиболее релевантными для их дифференциации, были найдены дискриминантные функции, разделяющие классы текстов каждого автора в пространстве признаков модели. Для 5 классов текстов могут быть получены 4 дискриминантные функции (число классов минус 1) [13].

С целью установить статистическую значимость полученных функций необходимо рассмотреть собственные значения этих функций (табл. 1). Из табл. 1 видно, что имеется 4 собственных значения функций не равных нулю. Величина собственного значения связана с дискриминирующими возможностями функции: чем больше собственное значение, тем больше она способствует дискриминации. Функция с самым большим собственным значениям (Функция 1) является самым мощным дискриминатором, а функция с наименьшим собственным значением - самым слабым (Функция 4).

Таблица 1

Собственные значения дискриминантных функций

Дискриминантная функция Собственное значение

Функция 1 3,92

Функция 2 2,82

Функция 3 1,38

Функция 4 0,8б

Исходя из данных табл. 1, показываю-

щей информационный вклад функций, видно, что первые 3 функции обладают относительно большой дискриминирующей силой. В дальнейшем в нашем исследовании используются только эти функции.

Представляется возможным рассчитать средние значения трех функций относительно каждого класса, представленного автором. Эти средние значения помещены в табл. 2.

Как следует из табл. 2, первая дискриминантная функция в наибольшей степени противопоставляет класс текстов Дейли классу текстов Харпура. Для Дейли маркерами стиля являются количество сказуемых, определений, обстоятельств и дополнений в конце строки. К наиболее значимым признакам для Харпура относятся количество сказуемых и определений в начале строки.

Таблица 2

Коэффициенты дискриминантных функции

Классы Функции

1 2 3

Г ордон 0,05 0,21 -2,55

Кендалл -0,62 1,23 1,26

Дейли -2,67 -2,16 0,16

Лоусон -0,45 2,43 -0,21

Харпур 2,82 -1,08 0,34

Рассмотрим, как полученные данные можно интерпретировать с точки зрения содержания произведений данных авторов, особенностей их творчества. Поэзия Дейли характеризуется отсутствием национального колорита: Дейли не писал баллад буша и патриотических стихов. Он был поэтом-романтиком, автором сатирических, лирикофилософских стихов, сонетов, баллад. Определяя место Харпура в истории национальной поэзии, австралийские критики отмечают, что он заложил основы адаптации английских поэтических традиций к австралийской действительности. Его поэзия стоит у истоков австралийской национальной литературы.

Кроме отмеченной оппозиции Дейли и Харпура первая дисриминантная функция объединяет Кендалла, Гордона и Лоусона в отдельный класс.

Вторая дискриминантная функция противопоставляет класс Дейли классу Лоусона. В данном случае основными значимыми признаками для их различения являются количество подлежащих, сказуемых, определений, обстоятельств, дополнений и слов, не являющихся членами предложения, в начале строки. Противопоставление Лоусона и Дейли с точки зрения тематической направленности их произведений состоит в следующем: как указывалось выше, Дейли полностью исключает из своих произведений конкретную привязку к жизни Австралии, в то время как Лоусон был мастером реалистического изображения жизни переселенцев из Европы, которые с конца XVIII в. стали заполнять австралийские просторы в поисках пристанища и работы. Героями произведений Лоусона были золотоискатели, шахтеры, фермеры, погонщики скота, бродячие батраки («A Bush Girl», «The Ballad of the Roseabout», «But What the Use» и т. д.).

Третья функция носит дополнительный характер и позволяет найти различия между Кендаллом и Гордоном, которые сводятся к таким признакам, как количество существительных и местоимений в начале строки, количество существительных в конце строки, количество придаточных предложений в составе сложноподчиненного и простых предложений в составе сложносочиненного предложения, количество стоп в строке. Для Кендалла наиболее значимыми признаками являются количество существительных в начале строки и количество стоп в строке. Для Гордона наиболее характерны такие признаки, как количество местоимений в начале строки, количество простых предложений в составе сложносочиненного предложения.

Ни один из вошедших в модель 22 признаков по отдельности не может дискриминировать рассматриваемые классы произведений, в то время как используемый нами метод позволяет установить, какие комплексы признаков разграничивают стиль исследуемых авторов, уточнить вклад каждого признака в рамках этих комплексов. В группу наиболее релевантных морфологических признаков вошли такие признаки текста, как количество существительных и местоимений в начале строки, количество существительных в конце строки. К наиболее значимым синтаксическим признакам относятся количество подлежащих, сказуемых, определений, обстоятельств, дополнений и слов, не являющихся членами предложения в начале строки, количество сказуемых, определений, обстоятельств и дополнений в конце строки. В целом, наибольший вклад в дифференциацию стиля изучаемых авторов вносят синтаксические признаки начала строки. Найденные в ходе исследования дискриминантные функции являются значимыми и позволяют объединить различных авторов в классы, что, как выяснилось, соответствует тематической направленности анализируемых стихотворных произведений.

1. Мартыненко Г.Я. Основы стилеметрии. Л., 1988.

2. Марусенко М.А. Атрибуция анонимных и псевдонимных литературных произведений методами теории распознавания образов. Л., 1990.

3. Баевский В.С. Лингвистические, математические, семиотические и компьютерные модели в истории и теории литературы. М., 2001.

4. Баевский В.С. Пастернак - лирик: основы поэтической системы. Смоленск, 1993.

5. Андреев В.С. Классификация стихотворных текстов (на материале лирики американских поэтов романтиков): автореф. дис. ... канд. филол. наук. Смоленск, 2002.

6. Andreev V. A Multivariate Study of Style Differences in Poetry // The State of Stylistics / ed. G. Watson. Amsterdam; N. Y., 2008. Р. 177-190.

7. Андреева М.Г. Литература Австралии [второй половины XIX в.] // История всемирной литературы: в 9 т. М., 1991. Т. 7. С. 595-598.

8. Гаспаров М.Л. Современный русский стих: метрика и ритмика. М., 1974.

9. Андреев В. С., Кучер И.Н. Динамика образной системы А.Теннисона // Многомерный анализ в лингвистике. Смоленск, 2005. Вып. 2.

С. 3-13.

10. Андреев С. Н. Выявление степени сходства оригинала и его переводов в поэзии методом дискриминантного анализа // Федоровские чтения. Университетское переводоведение: материалы I Всерос. науч. конф. 27-28 окт. 1999 г. СПб., 2000. Вып. 1. С. 12-18.

11. Bagavandas M., Manimannan G. Style Consistency and Authorship Attribution. A Statistical Investigation // Journal of Quantitative Linguistics. 2008. № 15 (1). Р. 100-110.

12. Tambouratzis G., Markantonatou S., Hairetakis N., Vassiliou M., Tambouratzis D. and Carayannis G. Discriminating the Registers and Styles in the Modern Greek Language. Part 1: Diglossia in Stylistic Analysis. // Literary and Linguistic Computing. 2004. № 19 (2). Р. 197-220.

13. Клекка У.Р. Дискриминантный анализ // Факторный, дискриминантный и кластерный анализ. М., 1989. С. 78-138.

Поступила в редакцию 23.03.2009 г.

Ermolaeva Y.E. Classification of verse texts by means of discriminant analysis. The article is devoted to classification of verse texts of Australian poets of XIX century on the basis of 32 different-leveled characteristics by means of discriminant analysis. The features, relevant for the differentiation of the poetic texts are defined. The data about the degree of similarity and difference of texts classes by different authors is gathered.

Key words: discriminant analysis; classification; Australian verse; individual style; characteristics of the text.

УДК 821.111.’’19’’

ЗАГЛАВИЕ КАК ФОРМУЛИРОВКА ОСНОВНЫХ ПРОБЛЕМ В ПЬЕСЕ О. УАЙЛЬДА «ВЕРА, ИЛИ НИГИЛИСТЫ»

© О.М. Валова

В статье дается новая интерпретация заглавия пьесы О. Уайльда «Вера, или нигилисты» и делается вывод о том, что название указывает на многоплановость произведения, наличие в нем сложного подтекста. Пьеса, созданная на русском материале, является результатом размышлений О. Уайльда над актуальными вопросами современности.

Ключевые слова: смысл заглавия; конфликт; подтекст.

В 1880 г. О. Уайльд написал свою первую пьесу «Вера, или нигилисты» («Vera, or the Nihilists»). «Вера» интересна для изучения основных этапов становления О. Уайль-да-драматурга и О. Уайльда-мыслителя.

«Вера» считается «русской» пьесой, т. е. написанной на российском материале. Отечественные критики справедливо указывают на многочисленные исторические и географические неточности. Отмечается также, что образы нигилистов в плане бытовом и психологическом не всегда правдоподобны, ха-

рактеры главных действующих лиц социально не обусловлены, общественно-значимый конфликт отходит на второй план и т. п. [16]. Такое обилие несоответствий заставляет задуматься, насколько верны традиционные истолкования, и какой смысл О. Уайльд вкладывал в свое произведение.

На наш взгляд, уже заглавие пьесы указывает, что в ней имеется «двойное дно». Последующие произведения драматурга также дают основания утверждать: он никогда не избегал многослойности, напротив,

i Надоели баннеры? Вы всегда можете отключить рекламу.