Научная статья на тему 'Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг»'

Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг» Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
9
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
синтаксис / семантика / прагматика / интерпретация / компьютерная лингвистика / знаниe / syntax / semantics / pragmatics / interpretation / computational linguistics / knowledge

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Демьянков Валерий Закиевич

Глава из раздела «Знание как основа интерпретации» книги «Основы теории интерпретации и ее приложения в вычислительной лингвистике» Демьянкова В.З. [Демьянков, 1985].

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Databases: syntax, semantics, pragmatics and «interpretive zigzag»

Chapter from the section «Knowledge as the basis of interpretation» of the book «Fundamentals of the theory of interpretation and its applications in computational linguistics» by Demyankov V.Z.

Текст научной работы на тему «Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг»»

БИБЛИОГРАФИЧЕСКАЯ ЛОЦИЯ

DOI: 10.31249/metodquarterly/02.02.08

Демьянков В.З.1

Базы данных: синтаксис, семантика, прагматика и «интерпретирующий зигзаг»

Аннотация. Глава из раздела «Знание как основа интерпретации» книги «Основы теории интерпретации и ее приложения в вычислительной лингвистике» Демьянкова В.З. [Демьянков, 1985].

Ключевые слова: синтаксис; семантика; прагматика; интерпретация; компьютерная лингвистика; знание.

Для цитирования: Демьянков В.З. Базы данных : синтаксис, семантика, прагматика и «интерпретирующий зигзаг» // МЕТОД : московский ежеквартальник трудов из обществоведческих дисциплин: ежеквартал. науч. изд. / под ред. М.В. Ильина ; ИНИОН РАН, центр перспект. методологий соц.-гуманит. исследований. - М., 2022. - Вып. 12. - Т. 2, № 2. -С. 118-123. - URL: http://www.doi.org/10.31249/metodquarterly/02.02.08

В данном разделе речь идет о следующем положении «интерпретирующего подхода»: знание и владение языком могут быть определены и описаны с помощью формального аппарата, отдаленно напоминающего распознающую грамматику. Однако в отличие от последней, в интерпретирующем подходе предполагается также, что помимо чисто грамматических языковых средств к интерпретации языковых выражений, т.е. к говорению и пониманию, привлекаются и внеязыковые знания, не «встроенные» в грамматику. Иначе говоря, в интерпретирующем подходе речь, при всех ее целеполагаю-щих характеристиках (достижение коммуникативного эффекта, экспрессивная функция и т.п.), реализует потенции языка в контексте знаний, т.е. в рамках внутреннего мира интерпретатора, вооруженного такими знаниями.

Говорение, или, шире, продуцирование речи, - это воплощение замысла автора речи при параллельном интерпретировании получаемых промежуточных выражений по ходу их появления; при этом и в результате

1 Демьянков Валерий Закиевич, доктор филологических наук, профессор, главный научный сотрудник, заведующий отделом теоретического и прикладного языкознания Института языкознания РАН, e-mail: vdemiank@mail.ru © Демьянков В.З. 2022.

118

этого возможны исправления, отклонения от намеченной магистральной линии, отказ от первоначального замысла, колебания и коренная перестройка внутреннего мира говорящего (даже при отсутствии соответствующего комментария со стороны аудитории).

В принципах гипотетической интерпретации, приведенных выше, охарактеризована, по существу, та операция, которую в соответствии с многовековой традицией можно назвать «интерпретацией». А именно, интерпретация-процесс - это пульсирование гипотез, т.е. постепенное расширение и/или сужение текущего набора гипотез, в результате чего получается более или менее устойчивый набор толкований (возможно, этот набор состоит и из одного толкования, когда выражение интерпретируется «однозначно», без колебаний гипотез, т.е. без «осцилляции» значений). Интерпретация целого выражения основана на интерпретации его частей, а ход интерпретации определяется конструкцией целого, в частности расположением этих частей друг относительно друга в пространстве и времени: так, более ранние по времени элементы выражений интерпретируются раньше остальных, множество видов интерпретации бесконечно; одни виды могут быть, в конкретной концептуальной схеме, определены как исходные для других. Интерпретируемы как безукоризненно правильные, так и отклоняющиеся от правильности выражения: первый случай имеем, когда достаточно рассматривать только актуальный логически возможный мир, второй - когда приходится расширить внутренний мир интерпретатора (что предполагает способность человека-интерпретатора не отвергать с порога чужие представления и мнения).

Интерпретируя выражения на конкретном фоне, люди, видимо, предпочитают те толкования, которые минимально изменяют их внутренний мир; возможность и количество других вариантов толкований связаны со степенью лабильности внутреннего мира интерпретатора, со степенью подвижности запаса презумпций. Количество гипотез, отвергаемых по ходу интерпретации, не может быть фантастически большим, а набор результирующих толкований полностью отражает ту степень неоднозначности высказывания и обстоятельств их появления, которая релевантна для конкретного вида интерпретации и для конкретного типа внутреннего мира.

Интерпретацию одного вида, получаемую на основании интерпретации другого вида, необязательно представлять как один процесс, начинающийся только после завершения другого: интерпретирование предста-вимо как протекающее по «квантам», и зависимый вид интерпретации на каждом этапе вовлекает очередную порцию выражения, «проработанную» в рамках «исходного» вида интерпретации (а не целое выражение, таким образом «проработанное»). Кванты - это единицы, рассматриваемые как неделимые на составные части в рамках конкретного вида интерпретации; например, для морфологической интерпретации словоформы такими квантами являются морфы (см.: [Демьянков 1982]), а семантическая интерпретация результата морфологической интерпретации может вовлекать на каждом последующем этапе очередной просканированный (т.е. отождест-

119

вленный с одной из единиц, хранимых в системе языковых знаний) морф в рамках конкретной гипотетической интерпретации.

Отсюда вытекает, что если имеется два «смежных» вида интерпретации, когда один из них является непосредственно исходным для другого, то интерпретирование в рамках последнего, зависимого вида происходит не после того, как все выражение целиком (текст, предложение, слово и т.п.) проинтерпретировано в рамках исходного вида, а с отставанием ровно на один квант, почти параллельно. Вот почему мы понимаем предложение (если оно в принципе может быть вами понято) уже начиная с первых по времени его сегментов, а не только тогда, когда оно нам дано целиком.

В такой концепции семантическое исследование можно определить как установление закономерностей интерпретирования, дающего «прямое значение», «буквальное значение» интерпретируемого объекта, его «внутреннюю форму» (в терминах В. фон Гумбольдта). Тогда синтаксис - это то, что связано с установлением структуры интерпретируемого объекта в терминах единиц данного уровня рассмотрения, т.е. опознание объекта как структуры, состоящей из квантов, данных в определенной конфигурации. Синтаксическая структура в таком понимании предоставляет исходный материал для семантической интерпретации объекта на данном уровне. Прагматика же оказывается связанной с установлением «суппозиций», т.е. контекстно обусловленных значений интерпретируемого выражения (что, в свою очередь, несомненно, предполагает «деятельностный» аспект интерпретации). Все три дисциплины - синтаксис, семантика и прагматика -участвуют в получении интерпретации на различных уровнях: на уровне морфов, слова, словосочетания, предложения, речевого акта, речевого эпизода (стратегии, акции и т.п.), «речевой жизни».

Формализация описываемого подхода возможна в рамках такой модели владения языком, в которой все «интерпретирующее устройство» в целом - «интерпретатор» - состоит из двух основных взаимодействующих частей: из общего механизма интерпретации и из набора баз данных. Общий механизм интерпретации определяется сформулированными выше принципами, дополненными конкретными знаниями относительно направления сканирования (когда речь идет об интерпретации текста, выполненного в той или иной конкретной системе письменности), относительно соотнесенности различных уровней и т.п. Базы данных могут быть расклассифицированы по двум основаниям: 1) по статусу конкретного вида данных и 2) по уровню рассмотрения объекта интерпретации.

По первому основанию имеем три вида баз данных: а) единицы, отожествляемые с частью выражения, взятого в конкретном виде интерпретации (например, морфы, лексемы, семантические предикаты); б) регулярные правила (определяют расширение или сужение текущего набора гипотетических интерпретаций; множество объектов, подвергаемых преобразованиям с помощью таких правил, не ограничено); в) уникальные правила (также определяют сужения или, реже, расширения текущих на-

120

боров гипотез: множество объектов, ими преобразуемых, ограничено конечным списком), привлекающие внеязыковые знания. Инвентари единиц могут быть отнесены к ведению синтаксиса, регулярные правила представляют данные о семантике единиц (а именно о конструкционной их семантике, позволяющей дать значение целого только исходя из семантики квантов и из конструкции), а уникальные - о прагматике.

По второму основанию различаются базы данных для морфов, слов, словосочетаний, предложений и т.п. (см. выше). Так, данные о предложениях дают сведения об устойчивых речениях типа поговорок: их синтаксис (на этом уровне) описывает возможность соположения речений между собой в тексте, семантика определяет результат буквального прочтения текста, в котором такие речения сочетаются, а прагматика - все «продолженные» толкования таких сочетаний (например, прагматика определяет мораль притчи, составленной из поговорок). Аналогично этому рассматриваются и хранимые данные для речевых актов, для речевых акций и стратегий, а также для возможных миров, интерпретируемых как «речевая жизнь» (скажем, данные о соположимости анекдотов с конкретными обстоятельствами беседы).

Итак, базы данных предоставляют возможности для интерпретирования единиц различных видов сложности: списки единиц предоставляют материал, на основе которого работают регулярные правила, дающие буквальные значения выражений. Получение всех реальных значений выражения происходит в результате двух видов операций: уникальных правил и рассмотрения выражения в контексте. Первый представляет собой установление прагматики выражения, взятого изолированно (т. е. установление узуального значения лексической единицы, устойчивого словосочетания, речения и т.д. с закрепленными возможностями употребления и толкования), а второй - установление суппозиций выражения, т.е. такое сужение или расширение лексического значения, которое возникает вследствие рассмотрения и интерпретации более широкой части интерпретируемого объекта (скажем, текста), чем данное конкретное выражение-квант. Конечно, первое и второе не исключают друг друга; так, на выявлении суп-позиций выражения могут оказываться те ожидания-экспектации, которые получены на основании предшествующего («левого») контекста по уникальным правилам интерпретации. И наоборот, условием для работы конкретных уникальных правил могут быть экспектации, вызванные тем квантом выражения, который находится в поле зрения интерпретатора в данный конкретный момент. Например, реификация лексем (т.е. переосмысление абстрактного имени как имени объекта) типа угощение, выражение, исследование представляет собой подтверждение той экспектации, что далее речь пойдет о некотором предмете-вещи: в выражении Гости с интересом рассматривали красиво сервированное угощение на столе левый контекст для единицы угощение вызывает экспектацию имени конкретного предмета, а не процесса.

121

Взаимодействие уникальных, или прагматических, правил с результатом интерпретации предшествующего контекста, затем выдвижение новых экспектаций относительно последующего контекста и их подтверждение или отклонение, т.е. процесс гипотетического интерпретирования, и создает ту пеструю гамму переходов от буквального к контекстно обусловленному значению, которая реально присутствует в речи; именно здесь лежат всевозможные соотношения между экстенсионалом, интен-сионалом и «предметным объемом» выражения.

Процедура перехода от одного вида интерпретации к другим представляет собой, таким образом, зигзаг (см. табл.): на нижнем уровне (например, на морфологическом) интерпретатор начинает со сканирования, прибегнув к помощи инвентаря единиц этого уровня, затем обращается к регулярным правилам для единиц этого же уровня, после чего - к уникальным правилам этого же уровня (при этом непременно соблюдается принцип параллельности, упомянутый выше); после этого происходит переход на другой уровень единиц (скажем, после уровня морфов - на уровень лексем), где интерпретация начинается опять-таки со сканирования и через промежуточный этап конструкционной семантики идет к прагматике, и т. д.

Такое зигзагообразное продвижение интерпретатора по уровням можно назвать «интерпретирующим зигзагом».

Таблица

Интерпретационный зигзаг (знак вопроса означает в данной схеме отсутствие подходящего термина)

Общий механизм интерпретации База данных

инвентари единиц регулярные правила уникальные правила

Нижняя граница - часть словоформы, верхняя -словоформа данные о синтаксисе морфов и словарь морфов данные о семантике морфов ^ данные о прагматике морфов ^

Нижняя граница - лексема, верхняя - ? данные о синтаксисе слова ^ данные о семантике слова ^ данные о прагматике слова ^

Нижняя граница - слово-составляющая, верхняя -квазипредложение данные о синтаксисе словосочетания ^ данные о семантике словосочетания ^ данные о прагматике словосочетания ^

Нижняя граница - предложение, верхняя - ? данные о синтаксисе высказывания данные о семантике высказывания данные о прагматике высказывания

Нижняя граница - локу-ция, верхняя - ? данные о синтаксисе речевого акта данные о семантике речевого акта данные о прагматике речевого акта

Нижняя граница -иллокуция, верхняя -интеракция (?) данные о синтаксисе речевого действия данные о семантике речевого действия данные о прагматике речевого действия

Нижняя граница - эпизод, верхняя - «вся жизнь» данные о синтаксисе «речевой жизни» данные о семантике «речевой жизни» данные о прагматике «речевой жизни»

122

Список литературы

Демьянков В.З. Основы теории интерпретации и ее приложения в вычислительной лингвистике. - Москва : Изд-во Моск. ун-та, 1985. - 76 с.

Демьянков В.З. Морфологическая интерпретация текста и структура словаря // Вопросы кибернетики : общение с ЭВМ на естественном языке. - Москва : Научный совет по комплексной проблеме «Кибернетика», 1982. - С. 75-91.

Valery Demyankov1 Databases: syntax, semantics, pragmatics and «interpretive zigzag»

Abstract. Chapter from the section «Knowledge as the basis of interpretation» of the book «Fundamentals of the theory of interpretation and its applications in computational linguistics» by Demyankov V.Z.

Keywords: syntax; semantics; pragmatics; interpretation; computational linguistics; knowledge.

For citation: Demyankov V.Z. (2022). Databases : syntax, semantics, pragmatics and «interpretive zigzag». METHOD: Moscow Quarterly Journal of Social Studies, 2 (2), 118-123. http://www.doi.org/10.31249/metod/02.02.08

References

Demyankov V.Z. (1985). Osnovy teorii interpretacii i ee prilozhenija v vychislitel'noj lingvistike. M.: Izd-vo Mosk. un-ta.

Demyankov V.Z. (1982). Morfologicheskaja interpretacija teksta i struktura slovarja. Voprosy kibernetiki: Obshhenie s JeVM na estestvennom jazyke, 75-91. M.: Nauchnyj so vet po kompleksnoj probleme «Kibernetika».

1 Valery Demyankov, Institute of Linguistics of the Russian academy of sciences (Moscow, Russia), e-mail: vdemiank@mail.ru

123

i Надоели баннеры? Вы всегда можете отключить рекламу.