Научная статья на тему 'Системы филологического обеспечения как особая разновидность обогащенных текстовых корпусов: природа, задачи, общее строение'

Системы филологического обеспечения как особая разновидность обогащенных текстовых корпусов: природа, задачи, общее строение Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY-NC-ND
72
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОСНОВАНИЯ ФИЛОЛОГИИ / КОРПУСНАЯ ЛИНГВИСТИКА / СИСТЕМА ФИЛОЛОГИЧЕСКОГО ОБЕСПЕЧЕНИЯ / ИСТОРИЯ ТЕКСТА / ФИЛОЛОГИЧЕСКИЙ КОММЕНТАРИЙ / ФИЛОЛОГИЧЕСКОЕ СОПРОВОЖДЕНИЕ ТЕКСТА / ФИЛОЛОГИЧЕСКОЕ ОСНАЩЕНИЕ ТЕКСТОВОГО КОРПУСА

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Гиндин Сергей Иосифович, Гардер Мария Олеговна, Иванова Елена Анатольевна, Красникова Анна Сергеевна

В статье рассмотрена специфика задач и проблемы построения текстовых корпусов филологического назначения. Показано, что в таких корпусах необходима специальная надстройка, включающая «филологическое сопровождение» текстов и «филологическое оснащение» корпуса в целом. Корпус с такой надстройкой предлагается называть «системой филологического обеспечения». Рассмотрены функции каждого из компонентов такой системы и их возможный состав. Указано назначение введенных понятий для типологии филологических инструментов и для построения теории комметария.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

System of philological maintenance as a kind of enriched text corpora: goals, general structure, possible instruments

The paper treats the specific tasks of philologically oriented text corpora and problems of their construction. It is argued that such corpora must contain special twofold superstructure which consists of the so called philological convoy and philological equipment. The philological convoy is matched to each separate text and represents the history of this text, its diachronic variants, all necessary comment etc. The philological equipment is matched to the corpus as a whole and comprises different dictionaries, biographic and bibliographic guides etc. A corpus with such twofold superstructure the authors suggest to call a system of philological maitenance. The authors claim that this notion is a valid basis for constructing a typology of philological instruments and for elucidating the nature of commentary.

Текст научной работы на тему «Системы филологического обеспечения как особая разновидность обогащенных текстовых корпусов: природа, задачи, общее строение»

С. И. Гиндин, М. О. Гардер, Е.А. Иванова,

А. С. Красникова

Системы филологического обеспечения как особая разновидность обогащенных текстовые корпусов

(Природа, задачи, общее строение)1

Понятие корпуса текстов пришло в лингвистику из филологии 2, в которой оно активно используется по крайней мере с XVIII в. Но при переходе в другую науку, как это обычно бывает, несколько сместились акценты.

Лингвистику (как и другие гуманитарные и общественные науки, напр., психологию или социологию) тексты интересуют как источник информации о чем-то отразившемся в текстах, стоящем за ними: о языке, о функциональном стиле, о речевыгх предпочтениях его носителей, на худой конец - о законах организации самих текстов. В связи с этим лингвистов при создании корпусов больше всего волнуют две проблемы: 1) репрезентативность корпуса по отношению к интересующей их гипотетической «генеральной совокупности», выборкой из которой видится данный корпус, и 2) создание такой разметки текстов, которая позволяла бы извлекать необходимую информацию в автоматизированном режиме.

Филологию, в отличие от других дисциплин, текст интересует не как источник информации о чем-то затронутом или проявившемся в нем, но сам по себе - «как первоначально заданное целое, в котором можно различить разнородные содержания, относящиеся к разным специальным наукам, только после того, как оно будет прочитано именно как целое» [Винокур 2000, с.59].

Соответственно, и корпус текстов мыслится не как выборка из некоей генеральной совокупности, а как замкнутое собрание самоценный текстов, объединенные некоторым существенным признаком: общностью происхождения (один автор, одна школа, одна эпоха), жанром (ср. такие издания, как «Полное собрание русских летописей») и т.п. На смену проблеме репрезентативности корпуса приходит задача обеспечения его полноты.

Аналогичным образом, раз текст читается «как целое» прежде, чем станет предметом интереса «специальные наук», то и разметке для нужд этих наук должна предшествовать некоторая общая разметка, ориентированная на нужды чтения текста как такового и отражающая его - текста - собственное устройство.

Так видоизменяются в «филологически-ориентированном» корпусе текстов две приоритетные заботы разработчиков «лингвистических» корпусов. Но, помимо этого, необходимость обеспечить пользователю возможность «чтения текста как целого» вынуждает при создании филологических текстовый корпусов решать еще две специфических проблемы.

Первая из этих проблем состоит в необходимости обеспечить надежность, достоверность текста. Читатель должен быть уверен, что он читает именно то, что было в свое время написано создателем текста. В первую очередь для этого нужно очистить текст от накопившихся за время его функционирования искажений - как непроизвольные3, так и преднамеренные. В более сложные случаях надо уметь произвести выбор между различными «воплощениями» (редакциями, изводами и т.п.) одного текста или предоставить пользователю несколько таких воплощений. Очевидно, и для «очистки» текста, и для выбора между его различными воплощениями в корпусе должна быть систематизирована и представлена история каждого текста (или, как минимум, даны отсышки к такой истории). Формами представления истории текста могут быть как сводка разночтений к «основному» тексту, включенному в корпус, так и полное воспроизведение различных редакций, существенно отличающихся от основного текста. Формами её описания - краткий перечень различных воплощений текста с указанием на характер отношений между ними.

Но коль скоро мы вводим информацию об истории текста, то пользователю корпуса необходимо сообщить, на каком основании был выбран (и, возможно, как преобразован) тот «основной» текст, который включен в корпус. Эта информация может быть дана в форме обоснования текста, или текстологического комментария.

Вторая специфическая проблема создания филологически ориентированного корпуса состоит в том, что текст может оказаться частично или даже полностью непонятным или понимаемым неверно. Возможные источники непонимания или неверного понимания текста можно в значительной их части предвидеть заранее, так как его предполагаемые читатели будут

сталкиваться с некоторыми типовыми трудностями в чтении текстов: непонятными словами и словосочетаниями, непривычными фонетическими и грамматическими формами, неизвестными именами и реалиями, существенными для смысла отсылками к другим текстам или обстоятельствам создания данного текста. Число таких трудностей возрастает по мере роста временной, языковой и культурной дистанции между текстами и пользователями корпуса. Для преодоления этих трудностей естественно снабдить каждый текст корпуса вспомогательным аппаратом, который может сториться в форме комментария (лингвистического, реального, историко-литературного - см.: [Рейсер 1978, с.142-168]) или же научного перевода.

Таким образом, оказывается, что в филологически-ориентированном корпусе каждому тексту должны быть сопоставлены: 1) представление (или хотя бы описание) его истории, 2) текстологическое обоснование и 3) некоторый вспомогательный аппарат для содействия пониманию. Совокупность этих трех видов информации образует своеобразную надстройку над собственно корпусом, которую можно назвать филологическим сопровождением текстов.

На практике в состав филологического сопровожденея помимо трех указанных основных видов информации могут включаться и различные дополнительные: сведения о рецепции текста современниками, перечнями его «трансформов» в других языках (переводы) или знаковых системах (музыкальные переложения, иллюстрации, постановки на сцене, экранизации и т.д.)Состав дополнительных видов филологического сопровождения зависит от конкретного текста и назначения корпуса.

Однако наряду с типовыми затруднениями в чтении каждого текста, которые можно предвидеть уже при создании корпуса, у пользователей могут возникать свои индивидуальные затруднения и вопросы, которые такому предвидению не поддаются. Кроме того, за целостным чтением может следовать специализированное чтение в интересах той или иной науки или же практической задачи, при котором из всех текстов корпуса желательно извлекать лишь информацию строго ограниченного вида. Инструментами получения ответов на такие индивидуальные или специализированные вопросы могут, к примеру, служить конкорданс, словарь языка писателя или эпохи, система грамматической разметки текста (лингвистические инструменты), справочник стихотворных размеров и биографическая канва или летопись жизни и творчества автора (историко-литературные инструменты), хроника историче-

ских событий эпохи или справка о системе мер (инструменты исторические), библиография публикаций автора и исследований о нем и др. Названные инструменты обычно создаются и используются в разные науках - от лингвистики до истории. Но применяемые для понимания текстов некоторого корпуса, они приобретают филологическое назначение и в совокупности образуют вторую надстройку над этим корпусом - его филологическое (или филолого-лингвистическое) оснащение. В отличие от филологического сопровождения, оснащение сопоставляется не отдельным текстам, а корпусу в целом. Конкретный состав филологического оснащения определяется характером текстов, представленные в корпусе, и может со временем обогащаться и видоизменяться.

Корпус текстов вместе с двумя описанными надстройками - филологическим сопровождением и филолого-лингвисти-ческим оснащением - и предлагается назвать системой филологического обеспечения (СФО), или филологической информационной системой (рис. 1).

системы филологического обеспечения

В рамках системы каждая из надстроек выполняет свои особые функции и содержит специфический набор компонентов. Систематизируем эти функции и наборы в виде кратких перечней.

Филологическое сопровождение (ФС) выполняет следующие функции:

• представляет или описывает историю возникновения и дальнейшего существования текстов корпуса, их «диахронию»;

• обосновывает выбор элементов, включаемые в корпус, и их место в его общей структуре;

• помогает разрешать типовые затруднения, регулярно возникающие при понимании текста у читателей, принадлежащих к определенной «целевой» группе, в расчете на которую и построено ФС;

• дает возможность получить информацию об «инобытии» каждого текста в других средах его существования: на иностранных языках, в других родах искусства и в других медийных воплощениях

Для выполнения этих функций филологическое сопровождение включает в себя:

• обоснование выбора текста и определенное представление невыбранных манифестаций текста (сводка разночтений и/или другие редакции и варианты);

• комментарии к тексту (реальный, лингвистический, историко-функциональный и др.) или/и научный перевод;

• эквиваленты текста: переводы текста на другие языки и его парафразы, созданные в других знаковых системах и медийных средах.

Важно, что все элементы филологического сопровождения связаны в СФО с каждым конкретным текстом (см. рис. 2).

сопровождение текста 1 - обоснование

сопровождение текста 2 - комментарий

сопровождение текста 3 - эквиваленты

Рис. 2. Структура филологического сопровождения и его отношений с корпусом СФО

Филолого-лингвистическое оснащение (ФЛО) выполняет следующие функции:

• читателю, принадлежащему к «целевой» группе, на которую рассчитано ФС, помогает преодолевать нетипичные (заранее непредсказуемые) затруднения в понимании текстов;

• читателю, принадлежащему к другим группам, ФЛО позволяет самостоятельно находить ответы на возникающие у них вопросы по текстам;

• исследователю предоставляет инструментарий для решения разнообразные научные вопросов, возникающих при изучении отдельные текстов корпуса и корпуса в целом.

В отличие от инструментов ФС, инструменты оснащения, как уже указывалось выше, создаются и привязываются не к отдельным текстам, а ко всему корпусу СФО (см. рис. 3).

Рис. 3. Отношения филолого-лингвистического оснащения с корпусом СФО

Сводная картина возможного состава ФС и ФЛО дана на рис. 4.

Компоненты ФС: •представление истории текста; •обоснование выбора текста; •комментарии разный типов; •научный перевод; •другие формы перевода; •аудиозаписи; •иллюстрации; •музыкальные, кино- и др. парафразы текста;

Компоненты ФЛО: •языковые словари; •словари реалий; •стиховедческие справочники; •описания рукописей; •библиографические указатели; •биографические справочники; •мемуары и др. свидетельства современников; •отзывы критики;

Рис. 4. Примерный состав ФС и ФЛО

Понятие СФО позволяет обобщить традиционную филологическую практику и дать систематизацию продуктов труда филолога. Фактически любая книга, в которой тексты напечатаны с определенной научной подготовкой и снабжены хотя бы минимальным комментарием, представляет собой СФО в миниатюре. Сравнение «глубины» подготовки текста, а также состава и степени детализованности вспомогательного аппарата в разные изданиях позволяет строить весьма содержательную типологию СФО со многими критериями и параметрами.

Понятие СФО оказывается полезным и для теории комментария. В этой теории возникали представления о том, что

комментарий можно сопоставить объектам любого уровня - от слова до полного корпуса текстов или целой литературы [см.: Гаспаров 2004, с.71-72]. Введение понятия СФО и различение ФЛО и ФС позволяет выделить текст как преимущественный и по сути единственный объект комментирования, тогда как всевозможные «комментарии» к корпусу оказываются при ближайшем рассмотрении словарями и справочниками, лишенными привязки к индивидуальной плоти текста. Такая выделенность текста находит подтверждение и при анализе принципов определения границ комментируемых элементов внутри текста [см.: Гиндин (в печати)].

Но особенно плодотворным новое понятие окажется при проектировании и построении современных электронных и сетевых филологических систем. Использование новых технологий позволяет снять многие традиционные ограничения на состав и объем СФО (см. об этом, в частности: [Иванова 2003; Красникова 2007]) и резко увеличить их объяснительные и исследовательские возможности.

Обозрение существующих электронных и сетевых филологических систем с позиций теории СФО заслуживает самостоятельной публикации. Здесь укажем только, что пример и одновременно модель структуры СФО коллектив, к которому принадлежат авторы этой статьи, создал в 2000-2002 гг. при поддержке РФФИ на материале творчества В.Я. Брюсова4 В настоящее время возобновлены работы по существенному обогащению текстового корпуса этой СФО и моделированию в ней разнообразных типов лингвистического и филологического инструментария.

Примечания

Статья подготовлена в рамках коллективной работы «Инструменты филологического и лингвистического исследования корпуса текстов: природа, функции и компьютерное моделирование» (грант РФФИ № 06-06-80429). Предварительный, тезисный ее вариант см.: [Гиндин, Иванова, Красникова 2006].

Из различения лингвистики и филологии ни в коем случае не следует отождествление последней с изучением художественной литературы [см. об этом: Соссюр 1990, с.64-65]. О собственном предмете и задачах филологии см.: [Винокур 2000, с.51-55; Гиндин 1998, с.87-89; Гиндин 2000, с.154-159].

Многочисленные примеры и типологию непроизвольных искажений для ситуации переписки текста вручную см.: [ Лихачев 1983. с. 61-91]; для ситуации типографского набора - [Томашевский 1959, с.32-66]

1

2

3

4 Описание базовых принципов системы и ее первоначального состава см. в статье [Гиндин 2003]. Система была реализована на сайте www.vbryusov.ru. Коллектив разработчиков включал сотрудников и студентов двух кафедр РГГУ: Теоретической и прикладной лингвистики и Математики, логики и интеллектуальный: систем в гуманитарной сфере. Общее руководство проектом осуществляет С.И. Гиндин, компьютерной реализацией руководит О.М. Аншаков.

Литература

Винокур Г.О. Введение в изучение филологических наук. М.: Лабиринт, 2000;

Гаспаров М.Л. Ю.М. Лотман и проблемы комментирования // Новое литературное обозрение. 2004. № 66. С. 70-74.

Гиндин С.И. Введение в общую филологию // Авторские программы по гуманитарным и соц.-экон. дисциплинам: Психология, педагогика, лингвистика, литературоведение. М.: Логос, 1998. С. 83-94;

Гиндин С.И. От истории к тексту и от науки к искусству: Г.О. Винокур в раздумьях над предметом и статусом филологии // Винокур Г.О. Введение в изучение филологических наук. М.: Лабиринт, 2000. С.122-159.

Гиндин С.И. О принципиальной аналогии процесса комментирования с лексикографическим описанием и принципиальном различии их результатов (в печати).

Гиндин С.И. Гипертекстовая филологическая система по творчеству В.Я. Брюсова: Предварит. сообщение // Московский лингвистический журнал. 2003. Т. 6. № 2. С. 219-226.

ГиндинС.И., ИвановаЕ.А., КрасниковаА.С. Системы филологического обеспечения как особый вид текстовый корпусов: (Задачи, общая структура, инструментарий) // Труды Международной конференции «Корпусная лингвистика-2006». СПб.: Изд. С.-Петерб. Унта, 2006. С. 94-98.

Иванова Е.А. Компьютерная филология и проблемы представления вариантов текста // Московский лингвистический журнал. 2003. Т. 7. № 1. С. 106-124.

КрасниковаА.С. Проблемы представления текстовой динамики в корпусе системы филологического обеспечения // Прикладна лшгвь стика та лшгв1стичт технологш: МЕОАЬШО - 2006: Зб1рник наук. праць. Кипв: Дев1ра, 2007. С. 194-199.

Лихачев Д.С. Текстология: на материале рус. лит. Х-ХУ11 в. / Изд. 2-ое, испр. Л.: Наука, 1983.

Рейсер С.А. Основы текстологии. М.: Просвещение, 1978.

Соссюр Ф. де Заметки по общей лингвистике / Пер. с франц. Б.П. Нару-мова. М.: Прогресс, 1990.

Томашевский Б.В. Писатель и книга / Изд. 2-ое. М.: Искуство, 1959.

i Надоели баннеры? Вы всегда можете отключить рекламу.