Научная статья на тему 'Лингвистическое моделирование темпорального адвербиала со значением локализации события'

Лингвистическое моделирование темпорального адвербиала со значением локализации события Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
99
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Сулейманова Елена Анатольевна

В статье рассмотрен класс адвербиальных выражений, выполняющих в предложении функцию временн´ ой локализации события (ТА-локализаторов). Описана семантическая структура ТА-локализатора. Предложена классификация ТА-локализаторов по способу задания референциального интервала. Выделен и описан подкласс ТА-локализаторов календарного типа, представляющий наибольший практический интерес при решении задачи календарной привязки событий. Ключевые слова и фразы: автоматическая обработка текста, извлечение фактов, лингвистический анализ указаний на время

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Лингвистическое моделирование темпорального адвербиала со значением локализации события»

ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ №4(27), 2015, с. 209-225 УДК 004.89:004.912

Е. А. Сулейманова

Лингвистическое моделирование темпорального адвербиала со значением локализации события

Аннотация. В статье рассмотрен класс адвербиальных выражений, выполняющих в предложении функцию временной локализации события (ТА-лока-лизаторов). Описана семантическая структура ТА-локализатора. Предложена классификация ТА-локализаторов по способу задания референциального интервала. Выделен и описан подкласс ТА-локализаторов календарного типа, представляющий наибольший практический интерес при решении задачи календарной привязки событий.

Ключевые слова и фразы: автоматическая обработка текста, извлечение фактов, лингвистический анализ указаний на время.

Введение

Глобальная задача, в рамках которой исследуются вопросы лингвистического моделирования временной информации, — задача извлечения фактов из неструктурированного текста типа новостей [1].

Большинство фактов, подлежащих извлечению из новостей, таковы, что временная информация является обязательным компонентом их формализованного представления в системе извлечения. Факт вступления господина А в должность В, как и факт пребывания господина С в должности Б, без указания на время, когда произошло (в течение какого времени имело место) соответствующее событие1, едва ли имеет право считаться полноценным фактом.

Таким образом, неотъемлемая составляющая задачи извлечения фактов — локализация во времени события, соответствующего извлекаемому факту. С точки зрения программной системы, это означает

1Событие — условный общий термин, используемый здесь для обозначения процесса, ситуации, состояния, действия, изменения, положения дел и т.п. (событие «в метаязыковом смысле» [2]).

Работа выполнена в рамках НИР «Моделирование модально-временного аспекта описания ситуаций в задаче извлечения информации из текстов», номер гос. регистрации 01201455353. © Е. А. Сулейманова, 2015

© Институт программных систем имени А. К. Айламазяна РАН, 2015 © Программные системы: теория и приложения, 2015

представление времени, занимаемого событием, в терминах внутреннего способа представления времени в системе (формальной, или логической, модели времени). Представление времени события в формальной модели времени назовем формальным временем события.

В тексте для сообщения временной информации о событии служат как грамматические глагольные категории времени и вида, так и различные слова и конструкции с темпоральной обстоятельственной (адвербиальной) функцией: наречия, наречные выражения, предложные и беспредложные именные группы, частицы, придаточные предложения с подчинительными союзами. Группу этих средств, за исключением частиц и придаточных предложений, будем рассматривать далее как класс темпоральных адвербиалов2.

Временная информация о событии — понятие весьма широкое. Виды темпоральной информации, выражаемые в т.ч. адвербиальными средствами, очень разнообразны. На данном этапе нас будут интересовать лишь те темпоральные адвербиалы (ТА), которые служат для сообщения временной координаты события (отвечая на вопрос «когда?»). Такие адвербиалы мы выделим в класс ТА-локализаторов.

Считаем, что ТА-локализатору, характеризующему событие, соответствует на некоторой оси времени его собственный референциаль-ный3 интервал — время ТА-локализатора.

Время события и время его ТА-локализатора — это не одно и то же. С уверенностью можно утверждать лишь то, что время ТА-локализатора должно позволить адресату текста вычислить время события с той точностью, которая, по мнению автора текста (говорящего), достаточна для понимания сообщения. При этом время события (параметр, вычисляемый адресатом текста) и время его ТА-локализа-тора (параметр, задаваемый автором текста) находятся друг с другом в определенном соотношении. Характер этого соотношения адресат определяет как на основе лингвистических признаков, так и опираясь на экстралингвистические знания.

Таким образом, чтобы определить время события (или получить некоторое приближение к времени события), программной системе

2Такого понимания термина «адвербиал» придерживается Ц. Д. Бигдаева [3]. И. М. Богуславский [4] относит к адвербиалам слова нескольких частей речи с адвербиальной функцией (наречия, частицы, предлоги, союзы).

3 Прилагательное «референциальный» мы используем в значении 'являющийся референтом' (аналогично «референциальному моменту» [5], а не как перевод английского слова reference в сочетаниях типа reference interval [6]).

извлечения фактов, адресату с очень ограниченными возможностями, необходимо определить время его ТА-локализатора и установить упомянутое соотношение.

Статья носит вводный характер и затрагивает некоторые общие аспекты задачи: анализ различных темпоральных значений, выразимых в языке адвербиальными средствами, и выделение ТА-локализаторов в отдельный класс; семантическая структура ТА-локализатора — компоненты, определяющие (задающие) его референциальный интервал; классификация ТА-локализаторов по способу задания референциаль-ного интервала.

1. ТА-локализаторы уб прочие ТА

Поле темпоральной адвербиальности охватывает очень разнородные типы значений (семантических признаков, сем), комбинации которых в составе конкретных адвербиалов не всегда поддаются однозначной категоризации.

Функцию временной локализации события так или иначе, прямо или косвенно может выполнять очень большая часть ТА, поэтому задача выделения в отдельный подкласс собственно ТА-локализаторов далеко не проста. Многие ТА, сочетающие в себе функцию темпоральной локализации с другими темпоральными или околотемпоральными значениями, оказываются близко синонимичны относительно бесспорным ТА-локализаторам (потом « после этого, сначала « до этого, перед этим). Поскольку практический интерес для нас представляет прежде всего ядро класса ТА-локализаторов, для спорных периферийных случаев будем принимать решение, руководствуясь прагматическими соображениями (насколько данная группа полезна с точки зрения общей задачи и насколько вписывается в общую модель ядра класса).

Определим ТА-локализаторы4 как адвербиалы, которые отвечают на вопрос «когда?» и могут быть «представлены на концептуальном уровне на временной оси» [3] («показатели времени» у Е. В. Паду-чевой [5], носители семы «собственно темпоральности» у М.В. Все-володовой [7]), например: 5-го декабря, в прошлый понедельник, в сентябре будущего года, в первой половине XIX века, 10 лет назад, через месяц,, год спустя, за несколько дней до выборов, пятью годами раньше, годом позже, до перестройки, после войны, в марте, летом,

4Термин «ТА-локализаторы» использует Ц. Д. Бигдаева в классификации англоязычных адвербиалов [3].

сейчас, теперь, когда-то, раньше, в прошлом, в те годы, тогда, давно, недавно, скоро и т.п. Общим для всех ТА данного типа является признак соотнесенности времени ТА с некоторым фиксированным временным ориентиром5.

Определенные таким образом темпоральные адвербиалы со значением локализации — ТА-локализаторы — противопоставляются в первую очередь ТА, не локализованным во времени и характеризующим событие безотносительно к какому бы то ни было временному ориентиру:

• ТА со значением характера протекания действия6 — долго, быстро, коротко, медленно, мгновенно, моментально, сразу.

• ТА со значением оценки соответствия7 (стандарту, норме, установленному моменту8 и т.п.) — вовремя, заранее, рано (в значении 'слишком рано'), поздно (в значении 'слишком поздно'), предварительно, заблаговременно, своевременно, несвоевременно, наконец, в конце концов, в конечном итоге.

Кроме того, не относим к ТА-локализаторам никакие ТА из следующих групп, независимо от наличия в них компонента временной локализованности:

• ТА с признаком длительности9 — два часа, все лето, годами, с утра до вечера, до самого отъезда, с трех часов, с самой войны, с 15 по 20 декабря, в течение (этого, всего) года, на мгновение, в последнее время, с недавних пор, до сих пор, (уже) целый год.

5Ср. понимание темпорального ориентира как момента (отрезка) времени или времени другого действия, относительно которого «характеризуется время данного действия» [8]. В общих классификациях темпоральных адвербиалов (как наречий, так и именных групп) значения ТА рассматриваются исключительно через их роль в характеризации события (действия); для класса ТА, способных выступать в функции временной локализации событий, понятие собственного времени ТА не используется.

6ТА — модификаторы быстроты действия, модификаторы мгновенности действия [3].

7 ТА — модификаторы временной оценки [3].

8«Установленный момент — некоторый условный неназванный, но подразумевающийся момент времени» [8], относительно которого оценивается время действия.

9Именные темпоральные распространители (ИТР) с семой дуративности [7]; показатели открытого и замкнутого, истекшего и неистекшего интервала [5], ТА — модификаторы длительности действия [3].

• ТА со значением срока10 — за год, на год, к воскресенью, за прошлый год, за эту неделю, в течение этой недели (будет сделано).

• ТА со признаком постепенности11 — с годами, со временем, с возрастом, по мере ослабления.

• ТА с признаками разделительности, повторяемости, частотности, кратности, регулярности/нерегулярности12 — однажды13 (в значении 'один раз' ), один раз, дважды, часто, редко, иногда, всегда, ежедневно, каждый год, по вторникам, по неделе, раз в месяц, дважды в год, с каждым годом, с каждой минутой, день ото дня, из года в год.

Отдельно отметим группу ТА — наречий со значением порядка следования, соотнесенности с другим событием14 (сначала, потом, затем, после, позже, позднее, впоследствии, одновременно, поочередно). Такой ТА локализует время «своего» события относительно некоторого другого события, принятого за ориентир. Указание на событие-ориентир встроено в значение ТА в виде анафорической15 ссылки. Это аналогично ТА-локализаторам — предложным группам с предлогами до, перед, после (перед отъездом, после этого), в которых указание на ориентир выражено поверхностными средствами. Тем не менее, будем считать, что эти ТА образуют отдельный класс, отличный от ТА-локализаторов. К нему же отнесем предложные группы с производным предлогом одновременно с.

От ТА-локализаторов важно отличать именные группы, не имеющие обстоятельственного значения и занимающие позиции актантов при некоторых предикатах (до войны оставался год — ср. до войны (ТА-локализатор) он был учителем) или атрибутивную позицию при

10ИТР с семой терминативности [7], показатели намеченного срока и срока завершения [5].

11ИТР с семой постепенности [7].

12ИТР с семой разделительности, повторяемости [7], показатели кратности и итерации [5], ТА — модификаторы частотности [3].

13Только в синтаксической позиции ремы и часто с модальными частицами «лишь» и «только» (В Киеве я был лишь однажды — ср. Однажды я был в Киеве)[9]. В позиции темы «однажды» — ТА-локализатор (ср. «когда-то»). Аналогично ведет себя ТА «один раз».

14Класс ТА-корреляторов [3]; группа наречий «с указанием на факт соотнесенности действия со временем другого действия (отношения порядка)», куда входят также «сначала», «потом» и др. [9].

15В наречии «сначала» ссылка катафорическая (событие-ориентир может быть упомянуто только в последующем фрагменте).

имени (алиби на момент убийства, цена на момент продажи — ср. ТА-локализатор со значением временного среза, близкий к показателю абстрактного времени16: нормативные документы, действовавшие на момент аварии).

Возможны и другие случаи, когда под ТА-локализаторы маскируются выражения, не выполняющие функции локализации конкретного события. Например: Выборы прошли в апреле (в апреле — ТА-локали-затор с эллиптичной датой) и В апреле погода бывает переменчива (здесь нет классической ситуации «событие и его временная локализация», а есть утверждение о свойствах типичного месяца апреля).

2. Время ТА-локализатора и время события

Для иллюстрации положения о необходимости различать время события и время его ТА-локализатора приведем всего лишь два базовых возможных соотношения между ними («разные виды одновременности» [5]).

(1) Время события находится внутри времени ТА-локализатора17,

например:

Иванов занял этот пост в июле прошлого года. Год назад в защиту опального башкирского чиновника открыто выступила «Единая Россия».

Как сообщал «Ъ» 6 июня,, [. .. ]

(2) Время ТА-локализатора находится внутри времени события18.

а. Ситуация развертывается в момент 1 (1 — время ТА-локали-затора):

В момент обыска в доме находились несколько сотрудников посольства США.

В момент аварии испанского поезда, в которой погибли 79 человек, машинист разговаривал по телефону с коллегами.

б. В момент 1 ситуация имеет место (1 — время ТА-локализато-ра):

В 1995 году он уже был известным политиком.

16О показателе абстрактного времени см. в разделе «Время ТА-локализатора и время события».

17Показатель времени в этом случае Е. В. Падучева называет «показателем объемлющего времени» [5]. По классификации М. В. Всеволодовой [10], такие именные темпоральные распространители имеют общее значение «времени, не полностью занятого действием».

18Показатели в 2а и 2б можно отнести соответственно к «показателям включенного времени» и «показателям абстрактного времени» [5].

Есть еще третья логическая возможность — совпадение времени события со временем ТА-локализатора19, но она не может быть реализована для класса ТА-локализаторов в нашем понимании, поскольку предполагает в ТА признак длительности (как в ТА с... до, с... по..., весь год и т.п.)

Для того чтобы определить собственное время события по времени его ТА-локализатора («внешнему времени»), необходимо учесть лингвистические факторы, определяющие «внутреннее время» (характер, способ протекания) события, среди которых акциональный класс предиката [11,12] или тип ситуации [13], морфосинтаксическое оформление ситуации. Кроме того, явно указанной в тексте информации может быть недостаточно для определения времени целевого факта: так, если объемлющий показатель времени локализует время события, ограничивая его, то включенное и абстрактное время соотносятся с временем события примерно как точка с интервалом. Еще один пример — время ТА-локализатора, заданное посредством лингвистической координаты (ср. незадолго до, вскоре и т.п. в контексте бытовых и исторических событий). Для того, чтобы иметь возможность в разумной степени восстанавливать имплицитную информацию о времени события, требуются формализованные экстралингвистические знания о типах событий, включающие и темпоральные аспекты.

3. Семантическая структура ТА-локализатора

Время ТА-локализатора (его референциальный интервал) всегда задается относительно некоторого фиксированного интервала на временной оси — опорного интервала (здесь и далее будем использовать этот термин вместо многозначного ориентир). Референциальный интервал ТА-локализатора однозначно определяется тремя компонентами:

(1) Опорный интервал (ОИ). ОИ может иметь абсолютную временную привязку (абсолютная дата) или не иметь таковой («момент речи»20, контекстная дата, время события).

(2) Способ позиционирования: а) в границах ОИ; б) «вокруг» ОИ (окрестность с центром в ОИ); в) до ОИ (предшествование), г) после ОИ (следование).

19Ср. «время, полностью занятое действием» [10].

20Под «моментом речи» понимаем текущий дейктический центр. Предполагаем, что длительность «момента речи» меньше минимальной длительности интервала, различаемой в лингвистической и формальной моделях.

Таблица 1. Примеры ТА-локализаторов с разной семантической структурой

ТА-локали-затор

Опорный интервал

Способ позиционирования

Расстояние

5-го апреля 2000 года

в прошлом полугодии

неделю назад

через 2 года после этого

год спустя

в прошлом

интервал, соответствующий дате «5.04.2000»

интервал, соответствующий «прошлому полугодию»

«момент речи»

«момент речи»

интервал, соответствующий «этому» (событию)

время упоминания-антецедента (события или временного указателя в предшествующем фрагменте)

«момент речи»

в границах

в границах

окрестность с центром в ОИ

предшествование

следование

следование

предшествование

неделя 2 года

1 год

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

не определено

(3) Расстояние до ОИ — для предшествования и следования.

Проиллюстрируем сказанное на нескольких примерах (таблица 1).

В общем случае определение опорного интервала — это необходимый первый шаг к определению времени самого ТА-локализатора.

Как видно из приведенных примеров, в поверхностной структуре ТА-локализатора опорному интервалу может соответствовать явно выраженный компонент — опорный компонент. Но явное присутствие опорного компонента не является обязательным (так, «момент речи» никогда явными поверхностными средствами не выражается). Различные способы выражения опорного компонента (ОК) в зависимости от способа задания времени ТА-локализатора рассмотрим в следующем разделе.

4. Типы ТА-локализаторов по способу задания референциального интервала

4.1. Время ТА-локализатора ограничено ОИ

4.1.1. ОИ — календарный интервал. ТА-локализаторы календарного типа

ОИ — конкретный календарный интервал некоторого типа, определенного в лингвистической модели календарного времени21 [14] (далее модельный интервал). ОК — текстовая дата (обычно явная, в некоторых случаях реконструируемая).

Определение 1. Текстовая дата — текстовое выражение (обычно именная группа или буквенно-цифровое обозначение) с референцией к конкретному модельному интервалу. Будем говорить о типе текстовой даты, понимая под этим тип ее календарного интервала (например, прошлый понедельник — это текстовая дата типа «день недели»).

Текстовая дата может быть абсолютной (если содержит все обязательные атрибуты интервала в явном виде) или контекстной (если вместо части значений содержит индексальные показатели или эллипсис).

Определение 2. ТА-локализатор календарного типа — это ТА-локализатор, время которого ограничено опорным интервалом, а в роли опорного интервала выступает модельный календарный интервал.

Примеры ТА-локализаторов календарного типа: 1 января 2001 года (ОИ — календарный интервал типа «день/сутки»), в воскресенье на этой неделе (ОИ — календарный интервал типа «день недели»), в том же году (ОИ — календарный интервал типа «год»), а также в середине прошлого года, в конце будущего месяца, в выходные — ОИ представляют собой производные календарные интервалы (также определенные в модели).

21Лингвистическая модель календарного времени ориентирована на языковые способы указания на время и предназначена не для вычислений, а для унификации текстовых выражений, в т.ч. для максимальной экспликации имплицитной (неполной, отсылочной) текстовой информации, с целью передачи в формальную модель.

Самую многочисленную группу ТА-локализаторов календарного типа составляют предложные группы с предлогом в (во), на, подчиняющим текстовую дату: в этом (1999, прошлом, будущем, том же) году, в четвертом квартале прошлого года, на этой неделе, во вторник, в тот день, на следующий день, в первой декаде января, в этом тысячелетии, в начале этого года, в середине прошлого века и т.п.

Другой чрезвычайно распространенный тип календарных ТА-ло-кализаторов представляет собой текстовую дату типа «день/сутки» в родительном падеже без предлога: 5 апреля 2000 года, 5 апреля позапрошлого года, 5-го числа, 5-го.

В ТА-локализаторах весной, летом, осенью, зимой, весной 1945-го, этой зимой, прошлым летом,, будущей осенью и т.п. будем выделять текстовую дату типа «время года» в творительном падеже.

Наконец, дейктические и анафорические наречия сегодня, завтра, назавтра, вчера, позавчера, накануне22 относим к ТА-локализато-рам календарного типа и считаем, что в их структуре подлежит реконструкции контекстная дата типа «день/сутки» (сегодня = 'в сегодняшний день', вчера = 'во вчерашний день' и т.п.).

4.1.2. ОИ — время события

ОИ — время некоторого события, явно упомянутого в ТА-локали-заторе посредством ОК. ОК — именная группа событийной семантики с референций к конкретному событию: в перестройку, во время Великой Отечественной войны.

4.1.3. ОИ — произвольный фиксированный интервал

ОИ — произвольный интервал на календарной оси, упомянутый посредством ОК — именной группы смешанной (темпорально-событийной) семантики: в Новый год, на майские праздники, в этом учебном году, в этом отопительном сезоне.

4.2. Время ТА-локализатора — окрестность ОИ

4.2.1. ОИ — «момент речи»

ОИ — «момент речи». ОК отсутствует. Время ТА-локализатора представляет собой неопределенную окрестность ОИ. Примеры: сейчас, теперь, в настоящее время. Характерно, что время события,

22Сюда не включаем предложную группу «накануне + именная группа событийной семантики», которая часто имеет значение не 'в день накануне', а 'незадолго до'.

описываемого таким ТА-локализатором, для адресата гораздо менее неопределенно (в силу знания последним типовых временных свойств события).

4.3. Предшествование без указания расстояния

Время ТА-локализатора — неопределенный интервал, который предшествует опорному интервалу.

4.3.1. ОИ — «момент речи»

ОИ — текущий «момент речи», ОК не выражен: раньше, когда-то, некогда, когда-то, в прошлом.

4.3.2. ОИ — время события

ОИ — время некоторого события, явно упомянутого в ТА-локали-заторе. ОК — либо ИГ событийной семантики, либо анафорическое местоимение: до выборов, до перестройки, до того, до этого, перед войной, перед Олимпиадой, перед этим.

4.3.3. ОИ — календарный интервал

ОИ — календарный интервал, ОК — текстовая дата, абсолютная или контекстная: перед 15 февраля, до пятницы (с предлогом до только в определенных контекстах, т.к. до в сочетании с текстовыми датами чаще дает показатель длительности).

4.3.4. ОИ — произвольный фиксированный интервал

ОИ — произвольный интервал на календарной оси, упомянутый посредством ОК — именной группы смешанной (темпорально-событийной) семантики: перед Новым годом, до майских праздников, перед этим учебным годом.

4.4. Следование без указания расстояния

Время ТА-локализатора — неопределенный интервал, который располагается после опорного интервала.

4.4.1. ОИ — «момент речи»

ОИ — текущий «момент речи», ОК отсутствует: когда-нибудь, в будущем.

4.4.2. ОИ — время события

ОИ — время некоторого события, явно упомянутого в ТА-локали-заторе. ОК — либо ИГ событийной семантики, либо анафорическое местоимение: после выборов, после Олимпиады, после этого. Временное значение в таких ТА может осложняться оттенком причинно-следственной связи.

4.4.3. ОИ — календарный интервал

ОИ — календарный интервал, ОК — текстовая дата, абсолютная или контекстная: после пятого (числа). Если дата метонимически обозначает известное событие, тогда временное значение также может осложняться оттенком причинно-следственной связи: После 11 сентября 2001 года мир стал другим.

4.4.4. ОИ — произвольны/й фиксированны/й интервал

ОИ — произвольный интервал на календарной оси, упомянутый посредством ОК — именной группы смешанной (темпорально-событийной) семантики: после Нового года, после майских праздников, после зимних каникул.

4.5. Позиционирование с указанием координаты относительно опорного интервала

4.5.1. Координата задано точно

ОИ и ОК возможны те же, что и для позиционирования без координаты. Примеры: через год, год спустя, через два дня после X, через месяц после этого, две недели назад, за две недели до X и т.п.

Явно указаны направление и расстояние (и единица измерения, и число единиц). Степень неопределенности времени ТА-локализатора пропорциональна масштабу ОИ (если он выражен явно), масштабу единицы длительности и количеству единиц длительности: день назад (время ТА-локализатора фактически ограничено календарным интервалом, ср. вчера), два дня назад (ср. позавчера), но: месяц назад (вероятнее всего — некоторая окрестность дня предшествующего месяца, имеющего то же число, что и день, содержащий «момент речи»), ср. также шесть месяцев назад, десять лет назад и т.п. (и масштаб центра окрестности, и размер окрестности, и степень неопределенности ее границ возрастают).

4.5.2. Единица измерения задана точно, а расстояние — размыто

Эти случаи аналогичны предыдущим, но характеризуются еще большей степенью неопределенности времени ТА-локализатора.

Примеры: лет 10 назад, дней за пять до этого (до X), несколькими днями позже.

4.5.3. Единица измерения не задана, а расстояние задано в разной степени неопределенно

Автор текста (говорящий) предполагает, что единица измерения и может быть восстановлена адресатом из контекста, с привлечением экстралингвистических знаний о типовых темпоральных свойствах локализуемого события (в частности, о продолжительности). Расстояние обычно поддается оценке в терминах лингвистических переменных «много», «немного», «мало», «очень мало», «несколько». Примеры: некоторое время назад (= 'несколько И назад'), незадолго до X (= 'за немного И до X'), перед самым X (='за мало И до X'), давно (= 'много И назад'), скоро (= 'через мало И'), сразу после X (= 'через очень мало И после X').

Заключение

В контексте задачи датировки событий ТА-локализаторы календарного типа безусловно заслуживают первоочередного внимания23, поскольку собственное время такого адвербиала точно локализовано на календарной оси.

Если текстовая дата — опорный компонент в составе ТА-лока-лизатора — абсолютна, т.е. содержит в явном виде значения всех своих атрибутов, то вычисление ее времени может быть сведено к выполнению нескольких шагов технического характера (уровня задачи извлечения именованных сущностей): автоматическое определение типа даты; выявление значений атрибутов; нормализация полученных данных в терминах формальной модели времени.

Однако в новостных текстах часто (если не чаще) приходится иметь дело с контекстными датами. Они неполны (эллиптичны) или содержат непрямые, отсылочные указания на значения атрибутов (тот же, прошлый, этот, следующий и т.п.). Формальной интерпретации таких дат должен предшествовать этап лингвистического

23Размытость возможна только для тех случаев, когда опорный интервал имеет в модели нечеткие границы («начало месяца», «конец года» и т.п.).

анализа: семантический анализ самой контекстной даты (формализованное представление ее «смысла» на метаязыке лингвистической модели) и разрешение анафорических и дейктических отсылок (определение того, что должна будет использовать формальная модель в качестве исходных данных для вычисления времени контекстной даты).

Благодарности. Автор выражает признательность И. В. Трофимову за возможность обсуждения материала и полезные замечания.

[2 [3

[4 [5

[6

[7

[8

[9

[10 [11

Список литературы

Д. А. Кормалёв, Е. П. Куршев, Е. А. Сулейманова, И. В. Трофимов. «Технология извлечения информации из текстов, основанная на знаниях», Программные продукты и системы, 2009, №2(86), с. 62-66. t209 Н. Д. Арутюнова. Типы языковых значений: Оценка. Событие. Факт, Наука, М., 1988. t209

Ц. Д. Бигдаева. Темпоральные адвербиалы в английском предложении: языковой процесс выражения смысла, Изд-во ВСГТУ, Улан-Удэ, 2004 t210,211,212,213

И. М. Богуславский. Сфера действия лексических единиц, Школа «Языки русской культуры», М., 1996. 210

Е. В. Падучева. Семантические исследования (Семантика, времени и вида в русском языке; Семантика нарратива), Школа «Языки русской культуры», М., 1996.t210,211,212,213,214

J. F. Allen, «An interval-based representation of temporal knowledge», Proceedings of the 7th international joint conference on Artificial intelligence, IJCAI'81, 1981, с. 221-226.t210

М. В. Всеволодова. «О семантическом согласовании глаголов и именных темпоральных распространителей», Вопросы языкознания, 1979, №1, с. 108-113. t211,212,213

Ф. И. Панков. Наречная темпоральность и ее речевые реализации, Автореф. ... канд. филол. наук, М., 1996. t212

Ф. И. Панков, «Категория наречной темпоральности и ее речевые реализации», Язык, сознание, коммуникация, т. 1, ред. В. В. Красных, А. И. Изотов, Филология, М., 1997, с. 192. t213

М. В. Всеволодова. «Способы выражения временных отношений в современном русском языке», Russian Linguistics, 10:2 (1986), с. 205-214. 214,215

Z. Vendler. Linguistics in Philosophy, Cornell University Press, Ithaca, N.Y., 1967. t215

[1

[12] A. Setzer. Temporal Information in Newswire Articles: an Annotation Scheme and Corpus Study, PhD thesis, Sheffield University, 2001.t216

[13] Т. В. Булыгина, «К построению типологии предикатов в русском языке», Семантические типы предикатов, ред. О. Н. Селиверстова, М., 1982. t216

[14] Е. А. Сулейманова. «Семантический анализ контекстных дат», Программные системы: теория и приложения, 6:4 (2015) (в печати).t217

Рекомендовал к публикации к.т.н. Е . П. Куршев

Об авторе:

Елена Анатольевна Сулейманова

Научный сотрудник Исследовательского центра искусственного интеллекта ИПС им. А. К. Айламазяна РАН, одна из разработчиков технологии построения систем извлечения информации

e-mail: yes@helen.botik.ru

Пример ссылки на эту публикацию:

Е. А. Сулейманова. «Лингвистическое моделирование темпорального адвербиала со значением локализации события», Программные системы: теория и приложения, 2015, 6:4(27), с. 209-225.

URL: http://psta.psiras.ru/read/psta2015_4_209-225.pdf

Elena Suleymanova. Linguistic modeling of temporal adverbial localizer. Abstract. The paper focuses on a class of adverbial expressions whose typical function in a sentence is that of temporal localization of an event (TA-localizers).

The semantic structure of TA-localizer is described. A typology of TA-localizers is suggested, which is based on different ways TA can use to locate its own interval.

A subclass named "calendar TA-localizers" is defined and described. The latter is of primary interest when the task in hand is to identify events' absolute dates. (In Russian).

Key Words and Phrases: natural language processing, factual information extraction, linguistic

analysis of temporal expressions.

References

[1] D. A. Kormalev, E. P. Kurshev, E. A. Suleymanova, I.V. Trofimov. "Knowledge-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

based technology for information extraction from texts", Programmnyye produkty i sistemy, 2009, no.2(86), pp. 62—66 (in Russian).

[2] N.D. Arutyunova. Types of language meanings, Nauka, M., 1988 (in Russian).

[3] Ts. D. Bigdayeva. Temporal adverbials in English sentence: the linguistic process of expressing sense, ESSUTM Publ., Ulan-Ude, 2004 (in Russian).

[4] I.M. Boguslavskiy. Scope of lexical units, School "Languages of Russian Culture", M., 1996 (in Russian).

[5] Ye. V. Paducheva. Semantic research (Semantics of tense and aspect in Russian; Semantics of narrative), School "Languages of Russian Culture", M., 1996 (in Russian).

[6] J.F. Allen, "An interval-based representation of temporal knowledge", Proceedings of the 7th international joint conference on Artificial intelligence, IJCAI'81, 1981, pp. 221-226.

[7] M. V. Vsevolodova. "On semantic coordination between verbs and nominal temporal adverbial phrases", Voprosy Jazykoznanija (Topics in the study of language), 1979, no.1, pp. 108-113 (in Russian).

[8] F. I. Pankov. Adverbial temporality and its speech instantiations, Abstract of PhD Thesis, M., 1996 (in Russian).

[9] F. I. Pankov, "Category of adverbial temporality and its speech instantiations", Language— Mind-Communication, vol. 1, eds. V. V. Krasnykh, A.I. Izotov, Filologiya, M., 1997, pp. 192 (in Russian).

[10] M. V. Vsevolodova. "The ways of expressing temporal relations in contemporary Russian", Russian Linguistics, 10:2 (1986), pp. 205—214 (in Russian).

[11] Z. Vendler. Linguistics in Philosophy, Cornell University Press, Ithaca, N.Y., 1967.

[12] A. Setzer. Temporal Information in Newswire Articles: an Annotation ¡Scheme and, Corpus Study, PhD thesis, Sheffield University, 2001.

[13] T. V. Bulygina, "Towards developing a typology of predicates in Russian", Semantic types of predicates, ed. O.N. Seliverstova, M., 1982 (in Russian).14"Semantic analysis of contextual dates", Programmnye Sistemy: Teoriya i Prilozheniya, 6:4 (2015) (to appear) (in Russian).

© E. A. Suleymanova, 2015

© Ailamazyan Program System Institute of RAS, 2015 © Program systems: Theory and Applications, 2015

Sample citation of this publication:

Elena Suleymanova. "Linguistic modeling of temporal adverbial localizer", Program systems: theory and applications, 2015, 6:4(27), pp. 209-225. (In Russian). URL: http://psta.psiras.ru/read/psta2015_4_209-225.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.