Научная статья на тему 'Аксиологическая лексика в творчестве Юлиуша Словацкого и Циприана Норвида — развитие современных исследовательских методов'

Аксиологическая лексика в творчестве Юлиуша Словацкого и Циприана Норвида — развитие современных исследовательских методов Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
18
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
лексикография / цифровые гуманитарные науки / частотные списки / словарь языка автора / lexicography / digital humanities / frequency lists / author's dictionary

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Анна Менджецкая

В статье представлено сравнение двух лексикографических проектов, посвященных исследованию произведений двух польских поэтов — Юлиуша Словацкого и Циприана Норвида. Применительно к более раннему проекту — словарю языка Норвида — описаны традиционные методы создания словаря и способ оцифровки полученных результатов. Корпус языка Юлиуша Словацкого создавался совершенно иным способом: использование цифровых технологий для текстологического анализа подразумевалось изначально. Описанное изменение методов анализа позволяет с бо́льшей легкостью проводить многочисленные статистические исследования, литературоведческая интерпретация которых может существенно обогатить представления специалистов о творческой лаборатории поэтов. В качестве примера в статье описаны возможности программы «Контекст», разработанной коллективом CLARIN. Продемонстрированные исследовательские методы применены также при исследовании творчества других авторов, а инструменты заключают в себе потенциал дальнейшего развития в зависимости от потребностей и интересов прибегающих к ним исследователей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Axiological vocabulary in the works of Juliusz Slowacki and Cyprian Norwid — development of modern research methods

The paper presents a comparison of two lexicographic initiatives concerning the work of two Polish poets — Juliusz Słowacki and Cyprian Norwid. In the case of the earlier study — the dictionary of the Norwid language — the traditional methods of creating a dictionary and the way of transferring the obtained results into the digital world are described. Juliusz Słowacki's language corpus is developed by a completely different method, with the use of digital tools from the very beginning, for computer text analysis in mind. The described change in research methods allows for easier extraction of numerous statistics, the subsequent interpretation of which by researchers may be a valuable source of knowledge about the poets' craft. The text shows some of the capabilities of the Kontext tool developed by the CLARIN consortium. The presented research methods can also be successfully used in researching the work of other authors, and the tools still have the potential for development depending on the needs and interests of the researchers who use them.

Текст научной работы на тему «Аксиологическая лексика в творчестве Юлиуша Словацкого и Циприана Норвида — развитие современных исследовательских методов»

DOI: 10.31168/2618-8554.2021.20

Анна

МЕНДЖЕЦКАЯ (Варшава)

Аксиологическая лексика в творчестве Юлиуша Словацкого и Циприана Норвида — развитие современных исследовательских методов

Аннотация:

В статье представлено сравнение двух лексикографических проектов, посвященных исследованию произведений двух польских поэтов — Юлиуша Словацкого и Циприана Норвида. Применительно к более раннему проекту — словарю языка Норвида — описаны традиционные методы создания словаря и способ оцифровки полученных результатов. Корпус языка Юлиуша Словацкого создавался совершенно иным способом: использование цифровых технологий для текстологического анализа подразумевалось изначально. Описанное изменение методов анализа позволяет с большей легкостью проводить многочисленные статистические исследования, литературоведческая интерпретация которых может существенно обогатить представления специалистов о творческой лаборатории поэтов. В качестве примера в статье описаны возможности программы «Контекст», разработанной коллективом CLARIN. Продемонстрированные исследовательские методы применены также при исследовании творчества других авторов, а инструменты заключают в себе потенциал дальнейшего развития в зависимости от потребностей и интересов прибегающих к ним исследователей.

Ключевые слова:

лексикография, цифровые гуманитарные науки, частотные списки, словарь языка автора

Anna MEDDRZECKA (Warszawa)

Axiological vocabulary in the works of Juliusz Slowacki and Cyprian Norwid — development of modern research methods

Abstract:

The paper presents a comparison of two lexicographic initiatives concerning the work of two Polish poets — Juliusz Slowacki and Cyprian Norwid. In the case of the earlier study — the dictionary of the Norwid language — the traditional methods of creating a dictionary and the way of transferring the obtained results

into the digital world are described. Juliusz Slowacki's language corpus is developed by a completely different method, with the use of digital tools from the very beginning, for computer text analysis in mind. The described change in research methods allows for easier extraction of numerous statistics, the subsequent interpretation of which by researchers may be a valuable source of knowledge about the poets' craft. The text shows some of the capabilities of the Kontext tool developed by the CLARIN consortium. The presented research methods can also be successfully used in researching the work of other authors, and the tools still have the potential for development depending on the needs and interests of the researchers who use them.

Keywords:

lexicography, digital humanities, frequency lists, author's dictionary

Польские поэты эпохи романтизма оказали несомненное влияние не только на творчество авторов следующих поколений, но и на формирование современного польского литературного языка. Поэтому исследование творчества романтиков в лингвистическом и лексикографическом ключе может иметь первостепенное значение для получения более полного представления о развитии польской литературы и культуры. Развивающаяся дисциплина цифровых гуманитарных наук разработала инструменты, позволяющие по-новому взглянуть на творчество классиков и открыть в нем закономерности, которые до сих пор могли быть выявлены исключительно благодаря исследовательской интуиции.

Одной из важных составляющих исследования языка писателей являются словари, отражающие лексику, использованную в их произведениях. Первым трудом такого рода в польской лексикографии стал «Словарь языка Адама Мицкевича»1. Создатели словаря задались целью зафиксировать все лексемы, использованные поэтом как в изданных произведениях, так и в рукописях. В словарных статьях содержится информация о количестве употреблений данной лексемы в произведениях Мицкевича, а также ее грамматическая и семантическая характеристика. Приводятся примеры использования лексемы в сколь возможно кратком контексте. К сожалению, не существует электронной версии словаря, а бумажная, будучи ограниченной в объеме, не позволяет поместить в статью все примеры употреблений данной лексемы или хотя бы подробную информацию о местонахождении каждого употребления. «Словарь...» — несо-

мненно, эпохальный труд, открывший собой новый период лексикографических исследований. По сей день он является ориентиром для польских лексикографов, исследующих язык того или иного автора.

Нельзя не упомянуть также о таком необыкновенном проекте, как составление словаря языка Циприана Камиля Норвида, работа над которым ведется с 1981 г. Развитие форм, в которых он осуществляется, отражает изменение возможностей, которыми располагают исследователи языка поэтов. Также в статье будет рассмотрена концепция корпуса произведений Юлиуша Словацкого, разрабатываемого в трудах коллектива под руководством проф. Марека Трошиньского. Сравнение двух данных проектов позволит проанализировать изменение подходов и новые перспективы, открывающиеся перед авторской лексикографией.

Далее с помощью инструментов, предоставляемых обоими корпусами, будет исследовано употребление лексемы prawda (правда) в творчестве обоих поэтов. Выбор данного понятия неслучаен: это одна из ключевых лексем из аксиологического семантического поля в творчестве Норвида; значимая также для творчества Словацкого. Детальный анализ употребления позволяет показать, сколь различное место она занимает в творчестве двух авторов, и может стать основой для дальнейших исследований.

Цель настоящей статьи — продемонстрировать эволюцию исследовательских методов в области изучения языка поэтов, начиная с методов традиционных, первопроходческих, без которых было бы невозможно достижение результатов, доступных сегодня в условиях развития компьютерных технологий. Опыт, полученный лексикографами при работе над «Словарем языка Адама Мицкевича», а позднее в ходе работы как над «Словарем языка Циприана Норвида», так и над корпусом произведений Юлиуша Словацкого, может быть использован и приумножен при исследовании языка других авторов, а уже разработанные и продолжающие развиваться методы могут оказаться полезными для анализа языка других авторов, не только польских.

Ключевое условие успеха подобных исследований — развитие существующих аналитических инструментов, которое, в свою очередь, может быть достигнуто лишь в результате междисциплинарного сотрудничества. Междисциплинарные исследовательские кол-

лективы, в состав которых должны входить не только лингвисты и литературоведы, но и программисты, способны усовершенствовать уже существующие аналитические механизмы и создать новые, необходимые для реализации конкретных проектов. Результаты, представленные в статье, иллюстрируют начальную стадию исследования; используемые инструменты постоянно совершенствуются, и это обеспечивает возрастание точности и разнообразия достигаемых результатов. Именно в неограниченном, как представляется, потенциале — сила методов, предлагаемых цифровыми гуманитарными науками. Для использования этого потенциала необходимо показать исследователям, придерживающимся традиционных методов, каким бесценным подспорьем в их работе могут быть цифровые инструменты. Компьютерного анализа недостаточно, чтобы сформулировать гипотезы, сделать выводы и интерпретировать результаты; однако он позволяет получить гораздо большее количество точных данных, на которые исследователь может опираться в своих рассуждениях.

Словарь языка поэта — зачем он нужен?

Объект исследований, описанных в данной статье, — язык конкретных поэтов, особое внимание уделено лексикографическому аспекту. Составление словаря языка автора позволяет глубже понять его творчество и описать тончайшие интекстуальные семантические связи2. Уже само составление перечня слов, используемых автором, позволяет выделить в наибольшей степени представленные в его текстах семантические поля, обнаружить неологизмы, определить языковые тенденции, которым автор следовал или которых избегал, отметить некоторые черты его идиостиля — например, более частое употребление определенных лексем по сравнению со стандартным языком. Часто благодаря такому перечню можно определить, в каких областях писатель проявил себя как новатор, а где, напротив, был более консервативен. Иногда исследовательский интерес представляет отсутствие определенных слов в словаре автора. Таким образом, даже простое знакомство с лексикой, представленной в произведениях писателя, может стать основой для смысловой и идейной интерпретации его творчества.

Также интересным материалом к размышлению может послужить информация о частотности употребления отдельных лексем. Составление так называемого частотного списка3, т.е. перечня всех лексем, расположенных в соответствии с количеством употреблений в творчестве данного автора, позволяет выделить более и менее важные лексемы в авторском языке и даже иногда может стать основой для глубоких интерпретаций. Если прибавить к этому сведения о контекстах, в которых выступает данное слово, появляется возможность точного семантического анализа, выявляющего даже незначительные отклонения от лексикона стандартного языка или от тенденций, представленных в целом в языке произведений данного автора. Таким образом, мы получаем новый аналитический инструмент, позволяющий более детально изучить творческую лабораторию писателя и ответить на многие вопросы исследователей-литературоведов. Подробный анализ авторского словарного запаса дает возможность пересмотреть сложившиеся интерпретации или дать лучшее обоснование интерпретаций, сделанных на основе классического литературоведческого анализа или на основе исследовательской интуиции — зачастую весьма тонкой.

Сегодня достоинства лексикографического анализа в области авторского языка получают все более широкое признание: «ведь именно лексика играет главную роль в формировании смыслов текста [...]. Благодаря семантической структуре апеллятивной и ономастической лексики, значениям отдельных лексем [...], а особенно при помощи расположения лексем в определенном контексте и в результате специфической организации или конфигурации их семантических компонентов и создается художественный мир произведения. Лексический уровень имеет принципиальное значение в процессе сотворения собственно поэтического мира, являющегося глубинной интерпретацией мира реального»4. Следовательно, создание словарей языка писателей — неотъемлемый элемент углубленного исследования литературного творчества.

К сожалению, без использования компьютерных технологий разработка подобных словарных баз сопряжена с кропотливой и трудоемкой работой, в результаты которой с большой вероятностью могут вкрасться ошибки (хотя известны примеры блестящих работ подобного типа, выполненных с помощью традиционных методов).

Появление, развитие и совершенствование цифровых инструментов снимает с исследователя груз ответственности за техническую сторону вопроса: целиком на его совести остается корректная выборка материалов, которые войдут в будущий корпус. Насколько изменяются исследовательские возможности в этой области, хорошо видно при сравнении принципов создания онлайн-словаря языка Циприана Норвида с процессом создания корпуса текстов Юлиуша Словацкого, используемого для статистических исследований внутри этого корпуса.

Словарь языка Циприана Норвида

Словарь языка Норвида в его нынешней онлайн-версии создается с 2009 г. Вот как вспоминает начало работы над ним проф. Ядвига Пузынина: «В 1981 г. ко мне обратилась студентка, Барбара Фаленц-кая (позже Субко), она хотела написать под моим руководством магистерскую работу о понятии правды в «Vade-mecum» Норвида. Наша совместная работа над этим исследованием позволила мне более глубоко проникнуть в творчество Норвида. Я осознала тогда величие Норвида, осознала, что этот грандиозный поэт был мне прежде знаком очень мало, чтобы не сказать не знаком вовсе; и что он мало, явно недостаточно известен польскому обществу. Еще я поняла, насколько важным союзником он может быть в борьбе за ценности, которую я как раз тогда вела, занимаясь вопросами аксиологии в языке. Одновременно, руководствуясь этим исследованием о правде у Норвида, я пришла к выводу, что для понимания его творчества нужно хорошо исследовать используемую им лексику — то есть, насколько удастся, создать словарь его языка. И вот в трудное время, в 1983 г. — о чудо! — удалось основать Отдел Словаря языка Циприана Норвида»5.

Результат работы этого отдела — картотека из примерно 600 тыс. карточек, охватывающая все слова, фиксируемые в произведениях поэта*, включая союзы, предлоги, частицы и т.п. На каждой карточке, помимо словарной единицы, помещены пространные цитаты, представляющие широкий контекст данного слова — т.е., кроме сухого перечня слов, исследователь получает сведения о частоте употребления

* Создатели словаря пользовались изданием Полного собрания сочинений Норвида, подготовленным Юлиушем Виктором Гомулицким и исправленным и дополненным на основе рукописей, прижизненных и посмертных изданий.

данной единицы, о том, в каких текстах и в каких словосочетаниях она употребляется. На основании данных картотеки можно описать, например, насколько часто использовалось то или иное слово в произведениях различной тематики или периода творчества.

Словарь языка Норвида создавался на основе традиционных методов, поначалу даже без использования компьютера: содержание каждой карточки — результат кропотливого труда работников отдела. Риск появления ошибок в ходе подобной утомительной ручной работы всегда был очень велик, поэтому уже на ранних этапах исследователи начали рассматривать возможность использования компьютера: «По инициативе Зыгмунта Салони создатели словаря связались со специалистами в области компьютерных технологий. Обсуждались различные варианты компьютеризации исследования. В результате Отделение информатики Варшавского университета профинансировало создание конкорданций всех словарных единиц в поэме „Vade-mecum" (они, к сожалению, не сохранились)»6. Для создания цифрового перечня было необходимо наличие специального программного обеспечения, поэтому его разработка велась на другой площадке, но и в самом отделе появился компьютер (NB: первый на факультете полонистики)7.

С 2009 г. словарь языка Норвида разрабатывается в онлайн-вер-сии8. Это первый в Польше онлайн-словарь авторского языка, акцент в котором сделан на лексикографическую специфику исследований творчества поэта. На данный момент открыт доступ к полному перечню словарных единиц (т.е. к перечню всех лексем, выступающих в произведениях Норвида), а также к части завершенных словарных статей. Словарная статья содержит информацию о значении данной единицы, ее употреблении и особенностях, описываемых с помощью системы квантификаторов. Приводится также грамматическая информация. Если у слова несколько значений, они описываются последовательно и снабжаются дополнительной информацией*. На данный момент словарь содержит около 30 000 словарных статей и описывает около 600 000 словоупотреблений. Онлайн-версия создается путем оцифровки существующих карточек — дополняемых и корректируемых.

* Подробное описание структуры словарной статьи можно найти на сайте Словаря: https://www.slownikjezykanorwida.uw.edu.pl/tytulowa?budowa=.

Корпус языка произведений Юлиуша Словацкого

Творчество Юлиуша Словацкого на данный момент не подвергнуто полной лексикографической обработке. В наибольшей степени эта цель была достигнута в исследовании Анджея Болеского, хотя в нем все же не представлен полный словник идиолекта Словацкого. Этот пробел старается восполнить коллектив под руководством М. Тро-шиньского: он обрабатывает корпус текстов Юлиуша Словацкого, подготовленный к использованию инструментов, которые предлагает Центр языковых технологий Clarin-PL*. Данные исследования находятся на начальном этапе: и анализируемая база текстов, и инструменты постоянно совершенствуются. Однако представляется, что и те результаты, которые уже получены, достаточно интересны, чтобы побудить исследователей к более широкому использованию инструментов цифровых гуманитарных наук9.

Текстовой базой корпуса служит, прежде всего, Полное собрание сочинений Юлиуша Словацкого под редакцией Юлиуша Клейнера, дополненное более поздними «старшими изданиями» (в т.ч. драмы «Самуэль Зборовский» и поэмы «Путешествие в Святую Землю из Неаполя»), а также недавно прочитанные рукописи. Тексты были оцифрованы и тщательно отредактированы, после чего текстовые файлы прошли техническую обработку, необходимую для дальнейшего цифрового исследования.

Подготовленный таким образом корпус становился основой в том числе для создания частотного списка. Благодаря этому можно не только определить количество употреблений той или иной лексемы, но и сразу сравнить ее с частотностью других, что позволяет определить «удельный вес» данной единицы во всем корпусе, а также в отдельном произведении или группе произведений. Доступны также инструменты, позволяющие оценить в процентах частотность появления данной лексемы в отдельных текстах или в корпусе в целом.

Частотный список был разработан с помощью инструмента LEM10. Он осуществляет лемматизацию текста, распознает отдельные лексе-

* CLARIN-PL — польское научное объединение, часть общеевропейского исследовательского объединения CLARIN ERIC (Common Language Resources and Technology Infrastructure): https://www.clarin.eu/. Польское объединение возглавляет Вроцлавский политехнический институт (clarin-pl.eu).

doc#300

doc#18

doc#47

doc#19S

doc#110

doc#38

doc#300

doc#158

doc#369

doc#61

doc#326

doc#418

doc#6

doc=546

doc#433 doc#145 doc#61

doc#110

doc#79 doc#41

doc=l'

doc#293 doc#47 doc#195

is shuffled

•et nieco pochlebnej opinii, majac przed oczyma jedyna prawde i droge be

za swiadki filozofow, Ze si? to stalo? Helion Prawd;) jest. Tlon: , A potem - rok cab- nie klamal I z prau da juZ nie sn . Szczesny Nic... Siadaj... Prawda , zeja nie

okratni! Pani! ty jestes niewinna? со — prawda ? Tego nie mogla uczynic kobieta? Ту sama teraz prawdy w narodzie - a stad wolnosc, bo duch prawdy strzeze ciala od pohanbienia, a wszystko wazv, aby

imie Ojca i Ducha i Syna. Co widzisz, prandi) jest.... oto na niebie Walke...

si? i nie wierzac wcale, Zeby to bye moglo prawd? , postanowilem wszakie zatrzymac sie, abym kiedys nie bledny i zamyslony о Tobie, zaledwo w kilku poczuciach prawdy rozweseliiem sie, przegladajac twory okolo minie bedace,

Pana... to sa na marmurze Pisane law?... Czy prawda Dyjanno? Те dwie fontannv, со przed Watykanem Jak choc maluczka zda sie, Ale sie w rzad ogromnych prawd - cudownie kladzie... Nie bede mowil, jako w

zimnej mysli i z utworzenia rozumowego, ale wszystko z prawdy wnetrznej... Sciskam ciebie i cahije — zdroiv

pelna - powzialem zarazem to przekonanie, Ze ta prawda BoZa nie przez materialna silf, nie knutem wbita w • tryumfalnie do wiar ludzkich kosciola i miedzy ludem prawd BoZych, z natchnienia urodzonych... a dlugo

Uczepiona reka w gorze Za kizyZ. Judyta Ту snil prawd? swieta. Kosakowski Judyto — gdyby cie wzieto I smiercia

Список соответствий слова «правда» в произведениях Юлиуша Словацкого.

Источник: https://kontext.clarin-pl.eu/

мы, определяет их грамматические формы, а затем формирует частотные списки грамматических форм, тэгов или лексем — в зависимости от необходимости. К сожалению, использование этого инструмента обнаружило наличие потенциальных «слабых мест», чреватых неверным определением грамматических форм или лексем. Основными причинами возникновения подобных проблем были:

1) Орфография

В некоторых случаях — например, в лексемах geniusz (гений) или кго1 (король) в текстах была представлена орфография XIX в. ^ет]и$2, krolowie), из-за чего программа не могла соотнести указанные формы с лексемами из базы. Для нужд количественных исследований языка поэта необходимо внесение корректив с целью обеспечения единообразия орфографии.

2) Флексии

Текст, созданный в XIX в., содержит архаические флексии. Эти формы программа относила к нераспознанным, т.к. невозможность распознать окончание слова делала невозможным отнесение формы к той или иной лемме. В этой области также необходимы соответствующие шаги с целью внесения единообразия.

3) Лексика

Невозможность распознавания лексем программой вызывается не только архаическим характером исследуемых текстов. Трудность

могут представлять также авторские неологизмы или имена собственные. В некоторых случаях разрешение этой проблемы представляется невозможным.

Следующий шаг на пути к совершенствованию работы программы — решение выявленных проблем и стремление максимально ограничить число форм, помечаемых как <^п.», т.е. нераспознанные.

Даже несовершенная пока еще работа инструмента уже позволяет сгенерировать любые количественные сопоставления на основании соответствующим образом подготовленного корпуса. Сама его подготовка — длительный и ответственный процесс, однако впоследствии он может быть использован для выявления практически любой статистики. Возможность получения статистических данных о каждом слове значительно упрощает (по сравнению с работой над исключительно бумажной картотекой) дальнейшее исследование, а также сокращает вероятность ошибок.

Правда

Чтобы продемонстрировать возможности работы с цифровыми инструментами, а также различия между описываемыми проектами друг от друга, ниже будет представлен анализ употребления лексемы prawda (правда) в творчестве обоих поэтов. Выбор данного понятия неслучаен: в творчестве обоих авторов правда (истина) — крайне важная ценность. «Понятие правды, а также понятия неправды и лжи относятся к наиболее существенным и наиболее характерным определениям ценности и антиценности в творчестве Норвида. Представляется, что мы по сей день не оценили глубины и богатства норвидовского понимания сути правды и лжи и их роли в жизни личности и общества. Отсюда, в частности, идея тома словаря, в который вошли бы все зафиксированные в произведениях Норвида примеры использования слов, входящих в словообразовательные гнезда с именными вершинами prawda, /акг (ложь) и глагольными Ыатас (обманывать) 1 igaC (лгать); примеры должны сопровождаться лексикографическим комментарием», — пишет Пузынина во вступлении к лексикографическому тому, посвященному этической лексике в языке Циприана Норвида11.

Сильный аргумент, указывающий на огромную роль понятия prawda в норвидовском дискурсе, — количество употреблений дан-

ного слова. Как указывает Пузынина, «слово prawda встречается в текстах Норвида 908 раз (262 в стихах, 646 в прозе)» — это чрезвычайно много. Почти в два раза больший корпус текстов Словацкого фиксирует 495 употреблений слова prawda (а также 253 употребления прилагательного prawdziwy (истинный, настоящий) и 200 — наречия prawdziwie (верно; искренне; по-настоящему); у Норвида прилагательное и наречие встречаются соответственно 54 и 64 раза). «Словарь языка Адама Мицкевича» фиксирует 389 употреблений слова prawda в языке поэта. Таким образом, на фоне идиолектов двух других великих поэтов-романтиков в языке Норвида лексема prawda имеет значительно большую частотность. По подсчетам составителей норвидовского словаря, употребления лексемы prawda составляют около 0,075% всех словоупотреблений, «что для самостоятельной части речи с абстрактным значением — очень высокий показатель», — приходит к выводу Пузынина*. Однако не располагая частотными списками для всех элементов словаря языка Норвида, мы не можем в полной мере сравнить употребление лексемы prawda с употреблением других лексем в его произведениях.

Исследователи лексики произведений Норвида выделили для лексемы prawda пять возможных значений: онтологическое (употреблено 216 раз), аксиологическое (24 раза), эпистемическое (551 раз), эстетическое (15 раз) и этическое (90 раз). Разумеется, некоторые

употребления не имеют однозначной трактовки; возможно также раз-

^ 1? витие дополнительных значений — равнозначных или вторичных12.

В связи с тем, что словарная статья prawda еще находится в работе (на странице — см. фото 1 — видно примечание, что на данный момент доступна только незавершенная версия), в онлайн-версии пока что нет доступа к подробной статистике. Переходя по гиперссылкам, можно посмотреть, в каких контекстах отмечены употребления лексемы. Размеры приводимых цитат обусловлены реальным размером бумажных карточек, составлявших картотеку для изначальной, бумажной версии словаря (см. фото 2).

* Это, впрочем, не предел: самое частотное слово, относящееся к самостоятельным частям речи, в творчестве Словацкого — лексема duch (дух); оно составляет 0,48% словоупотреблений.

Фото 1. Статья Prawda в интернет-словаре языка Циприана Норвида. Источник: https://slownikjezykanorwida.uw.edu.pl/

Фото 2. Контекст, появляющийся при переходе по одной из ссылок в словарной статье. Максимальный объем контекста — длина цитаты, умещающейся на соответствующей бумажной карточке. Источник: https://slownikjezykanorwida.uw.edu.pl/

Как можно заметить, словарная статья позволяет проверить, в каких жанрах и в каких произведениях Норвида встречается искомое слово, но при этом не дает непосредственного доступа к данным о том, какие грамматические формы представлены, не дает информации о грамматических и морфологических особенностях его употребления. При переходе по ссылке пользователь может ознакомиться с контекстом отдельного употребления; количество слов до и после данной лексемы обусловлено размером бумажной карточки, на которой располагалась цитата. Все статистические данные вводятся вручную, что делает процесс создание комплексной системы ссылок длительным и трудоемким.

В творчестве Юлиуша Словацкого лексема prawda встречается 495 раз, прилагательное prawdziwy (истинный, настоящий) — 253 раза, наречиеprawdziwie (верно, истинно; искренне; по-настоящему) — 200 раз. В частотном списке, охватывающем все словарные единицы из произведений Словацкого (включая союзы, предлоги, частицы и даже знаки препинания, распознаваемые программой как отдельные слова) лексема prawda занимает 269-е место. Инструмент поиска по корпусу, а также инструмент параллельного сравнения корпусов позволяют составить более точную статистику фиксируемых морфологических (фото 2) и грамматических (фото 3) форм данной лексемы. Следует заметить, что в первом случае формы, идентичные морфологически, но отличающиеся грамматическими характеристиками, при подсчете объединяются; отсюда различие между первым и вторым статистическим результатом. Таким образом, данным инструментом могут воспользоваться не только лексикографы, но и любой желающий исследовать язык поэта с учетом грамматической дифференциации особенностей словоупотребления.

Инструмент также дает возможность поиска в отдельных частях корпуса — таким образом, должная подготовка корпуса позволяет создать статистику, демонстрирующую частотность данной лексемы в тех или иных группах текстов. В качестве примера предлагается рассмотреть употребление лексемы в подкорпусах, предварительно разделенных по жанрам, однако возможно деление на подкорпусы согласно любому критерию, в зависимости от целей и задач исследования.

Фото 3. Частотный список для лексемы prawda в корпусе произведений Юлиуша Словацкого. Источник: https://kontext.clarin-pl.eu/

Фото 4. Частотный список грамматических тэгов для лексемы prawda в корпусе произведений Юлиуша Словацкого. Источник: https://kontext.clarin-pl.eu/

Frequency list

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Frequency limit: 0

Total: б (1 pages)

doc.genre Freq i.p.m.

1. и/п filozoficzne 155

2. ß/ n dramat 113 296.6 Ш1ШШШ

3. й/ п list 99 388.5 ■■■■■■■

4. в/п poem 64 178.6

5. й/ п proza 17 367.8 -

6. в/п wiersz 11 302.7 -

Фото 5. Частотный список для лексемы prawda в различных частях корпуса, здесь — рабочий вариант деления на жанры.

Источник: https://kontext.clarin-pl.eu/

Таким образом, инструмент «контекст», помимо информации об абсолютном числе употреблений той или иной лексемы, рассчитывает также показатель i.p.m. (instances per million, число употреблений на миллион слов корпуса). Благодаря ему, возможно как сравнение абсолютного числа употреблений, так и «удельного веса» каждого употребления в отдельно взятом тексте. Это позволяет определить значимость того или иного словоупотребления и более широко сопоставлять статистики.

О правде и правде

Описанные инструменты позволяют получить точные данные, анализ которых — дальнейшая задача исследователя. Статистика сама по себе, бесспорно, указывает на исключительную роль понятия prawda в творчестве Норвида — чего нельзя сказать об ее употреблении в текстах Словацкого: в его языке большую частотность имеют такие лексемы, как milosc (любовь), smierc (смерть); самым частотным из самостоятельных частей речи, является существительное duch (дух), зафиксированное более 6 тыс. раз. Эти данные подтверждают исследовательскую догадку о том, что в творчестве Норвида этические проблемы раскрыты в большей степени с интеллектуальной и ценностной точки зрения, а в творчестве Словацкого эта тематика раскрывается скорее в эмоциональном и мистическом плане.

Интересный материал для анализа представляет список коллока-ций, т.е. слов, наиболее часто фиксируемых рядом с существительным prawda в творчестве Словацкого (фото 6)*. На первом месте среди самостоятельных частей речи, с 51 употреблением, оказывается... duch. Это подтверждает высказанный тезис о мистическом, духовном осмыслении данного понятия в творчестве поэта. Любопытно, что на 33 месте в данном списке оказывается само существительное prawda. Инструмент позволяет рассмотреть, в каких контекстах это происходит (фото 7).

Фото 6. Список коллокаций, слева и справа от заданного слова — по 5 единиц. Источник: https://kontext.clarin-pl.eu/

Представленная статистика включает слова, появляющиеся на расстоянии максимум 5 слов от заданной лексемы.

*

.. a miec beda drudzy — Prawda , o prawda ... tak sloñce stracone W tym oknie,

sie nareszcie i pokazal prawde prawd — na której wszelkie prawdy maja byc wybudowane na nowo. — Mv. Polacy

wykupiony ubarbarzyñców... Dzis rozblysnal sie nareszcie i pokazal czlek rozsadny Winien by zapuszczac rygle.... prawde Prawda prawd - na której wszelkie prawdy maja byc wybudowane na ! prawda ! czlek porzadny Jakis... prawda

zaprzec sie — niz mówic prawde ... Dlaczegoz ... Bom wolal zaprzec sie - niz mówic prawdy czystej nie mówiles?... Bo to ... Dlaczegoz prawdy czystej nie mówiles?

. bedziesz wiec miala wielu tlumaczów i tych, którzy prawde potwierdza. — a prawda. jest ze sie Pan Bóg

twarzy. gdy kto w obcvch narodach zawola: Mam prawde . Bo prawda jedna jest... A oto

naszej wvrzekli sie, szukac prawdy przestali, albo ta Winien by zapuszczac rvgle.... Prawda ! II ciajle z rak naszych widzieli uciekajaca. Helion Zaprowadziles ! czlek porzadny Jakis... prawda gada gola

kto w obcvch narodach zawola: Mam prawde . Bo prawda jedna jest... A oto byl drugi.

wielu tlumaczów i tvch, którzy prawde potwierdza — a prawda jest, ze sie Pan Bóg nad nami juz zhtowal

u barbarzyñców... Dzis rozblysnal sie nareszcie i pokazal prawde prawd - na której wszelkie prawdy maja bvc wybudowane na nowo

ducha spokojnosci... rozmilowany w prawdzie i w prawdach , którymi przez Boga nakarmiony bvlem, czynie.

go straciemy... a miec beda drudzy — Prawda . o prawda ... tak sloñce stracone W

o mojej ivnetrznej ducha spokojnosci... rozmilowany w prawdzie i w prawdach , którymi przez Boga nakarmiony bylem

na ziemi uczuli, woh naszej wyrzekli sie, szukac prawdy przestali, albo ta prawde ciagle z rak naszych widzieli

rak Podana... czyz nie jest cudem? Fenixana 0 prawda ! prawda ! — Lecz któz cié tak zmienit?

... czyz nie jest cudem? Fenixana 0 prawda ! prawda ! — Lecz któz cié tak zmienil? Kto ci

Фото 7. Лексема prawda выступает в соседстве с лексемой prawda

Использование подобного анализа позволяет выделить те контексты, в которых, путем повтора лексемы, интенсифицируется ее значение («Prawda, o prawda» — «Правда, о правда», «Prawda! Praw-da» — «Правда! Правда» и т.д.), а также те, в которых имеют место семантические сдвиги. Стоит обратить внимание и на дважды встречающуюся усилительную формулу prawda prawd (правда правд).

Уже сам анализ статистических данных об употреблении отдельной лексемы позволяет сделать интересные выводы, которые могут быть перенесены и на совокупность творчества исследуемых авторов. Сопоставительный анализ употребления нескольких лексем, сравнение с совокупностью представленных в словаре языка автора лексем или с корпусом текстов других авторов позволяет лучше понять художественные произведения, и, как следствие, точнее описать литературные процессы, которые по сей день определяют развитие литературы, культуры и языка. Так возникла идея еще одного проекта, реализуемого коллективом под руководством проф. Трошиньского «Гиперкорпус четырех поэтов-романтиков». В его рамках будут созданы корпусы, включающие совокупность произведений четырех выдающихся авторов польского романтизма: Адама Мицкевича, Юлиуша Словацкого, Зыгмунта Красиньского и Циприана Норвида. Реализация данного проекта откроет перед исследователями новые перспективы и сделает возможным дальнейшее совершенствование инструментов и методов.

Слово — орудие труда писателя — является также элементом формирования окружающей нас реальности. Понимание его значимости, описание способов его воздействия позволяет лучше понять шедевры, которые повлияли на наше сознание и по сей день оказывают воздействие на нашу повседневную жизнь.

Перевод А. Широковой

ПРИМЕЧАНИЯ

1 Slownik j^zyka Adama Mickiewicza. Red. Górski K., Hrabec S. T. 1-11, Wroclaw, 1962-1983.

2 Создание лексических баз творчества отдельных авторов является сюжетом, присутствующим в польской филологии уже долгое время; см., например: KozlowskaA. Indeks leksyki pisarza jako typ opracowania leksykograficznego // Prace Filologiczne. 54, 1, 2013. S. 147-158. В настоящее время мы располагаем законченными словарями Адама Мицкевича (red. Górski K., Grabec S. T. 1-11. Wroclaw, 1962-1983), Яна Хризостома Пасека (red. Koneczna H., Do-roszewski W. T. 1-2. Wroclaw, 1965-1973) и Яна Кохановского (red. Kuca-la M. T. 1-5. Kraków, 1994-2012). Идет работа над онлайн-словарем языка Циприана Норвида (Puzynina J., Korpysz T. Internetowy slownik j^zyka Cypria-na Norwida. Warszawa, 2009- ...; http://www.slownikjezykanorwida.uw.edu.pl). О разнице между классическими словарями, издаваемыми в бумажной версии, и словарями цифровыми, а также возможностях их использования см.: Koziol-Chrzanowska E., Zdunek U. Slowniki elektroniczne — nowa jakosc w polskiej leksykografii // Prace Filologiczne. 2013. T. 64. Cz. 1. S. 139-146.

3 См. Balowski M. Lista frekwencyjna poezji, prozy i dramatu Krzysztofa Kamila Baczynskiego. Prochowice, 1997.

4 Slawkowa E. Kierunki badan nad slownictwem pisarzy // J^zyk pisarzy: pro-blemy slownictwa. Red. Korpysz T., Kozlowska A. Warszawa, 2011. S. 14-15.

5 URL: http://www.leksykografia.uw.edu.pl/slowmki/44/internetowy-slownik--jezyka-cypriana-norwida (дата обращения: 15.12.2020). См.: Puzynina J. Norwid w moim zyciu // Norwidologów portret wlasny: poklosie sesji popular-nonaukowej w Tczewie. Red. i oprac. Dunajski A. Pelplin, 2010. S. 135-136.

6 См.: Szafran K., Milkowska M., Zakrzewska E. Z doswiadczen pracy nad kon-kordancjami do Vade-mecum Cypriana Kamila Norwida // Saloni Z. Studia z polskiej leksykografii wspólczesnej. T. II. Bialystok, 1987. S. 310-311. См. также: Milkowska M., Puzynina J., Saloni Z. The concordance to Vade mecum — the Polish poetic cycle by C.K. Norwid // Literary and Linguistic Computing. 1987. № 2(3). S. 164-165.

7 Цит. по: URL: http://www.leksykografia.uw.edu.pl/slowniki/44/internetowy-slownik-jezyka-cypriana-norwida (дата обращения: 15.12.2020).

8 URL: http://www.slownikjezykanorwida.uw.edu.pl/index.php (дата обращения: 15.12.2020).

9 О возможностях, которые использование интернет-корпусов и инструментов компьютерного анализа текстов открывает перед исследователем-литературоведом см.: Korpysz T. O «Internetowym slowniku jçzyka Cypriana Norwida» i mozliwosciach wykorzystania go w badaniach (nie tylko) norwido-logicznych // Tekst artystyczny w badaniach lingwistycznych. Red. Skorupska-Raczynska E., Maczel M., Zurawska-Chaszczewska J. Gorzow Wielkopolski, 2014. S. 45-64; Korpysz T. Jçzyk autora w sieci. O «Internetowym slowniku jçzyka Cypriana Norwida» // Znaczenie — Tekst — Kultura. Prace oferowane profesor Elzbiecie Janus. Red. Kozlowska A., Swi^tek A. Warszawa, 2014.

10 URL: https://ws.clarin-pl.eu/lem.shtml (дата обращения: 15.12.2020).

11 Puzynina J. Wstçp // Siownictwo etyczne Cypriana Norwida. Czçsc 1.: prawda, falsz, klamstwo. Red. Puzynina J. Warszawa, 1993. S. I—II.

12 Ibid. S. III.

i Надоели баннеры? Вы всегда можете отключить рекламу.