Об одной пионерской статье, или принципы формализации семантики в 1961 г

Шаляпина Зоя Михайловна

К 50-летию создания Лаборатории машинного перевода I МГПИИЯ

З.М. Шаляпина

Об одной пионерской статье, или Принципы формализации семантики в 1961 году

Рассматривается статья «О принципиальном использовании смысла при машинном переводе», опубликованная в 1961 г. А.К. Жолковским, H.H. Леонтьевой и Ю.С. Мартемьяновым. Демонстрируется, что в ней не просто введены новые, более мощные и более адекватные задачам того времени средства формализованного лингвистического описания, но выявлен и поставлен целый ряд лингвистических проблем, которые до того оставались «за кадром». Более того, в указанной статье впервые намечены многие пути и методы решения этих проблем, сохранившие свою научную значимость до настоящего времени. Тем самым она послужила фундаментом и источником целого ряда школ и направлений в исследованиях по синтаксису и семантике в современной теоретической и компьютерной лингвистике.

Ключевые слова: история лингвистики, семантическое представление, коммуникативная организация смысла, семантический синтез, синонимия, лексические функции, глубинный синтаксис.

Сейчас принято оценивать результативность научной деятельности по количественным критериям - прежде всего по тому, сколько статей опубликовано в журналах, включенных в заранее определенные списки, сколько докладов прочитано на международных научных форумах и т.п. Публикации в журналах, не входящих в соответствующие списки, и доклады, сделанные на отечественных конференциях, считаются менее ценными, а статьи в сборниках стоят на низшем уровне иерархии.

Конечно, некоторый смысл количественные критерии имеют: полное отсутствие научных публикаций и докладов, скорее всего, означает отсутствие и достойных публикации результатов. Но в общем случае количество, объем, формальный статус и даже цитируемость публикаций не находятся в сколько-нибудь прямой корреляции с их качеством, научной значимостью и степенью воздействия на дальнейшее развитие

соответствующей научной области. Одно из свидетельств этого - вышедшая в 1961 г. статья трех сотрудников Лаборатории машинного перевода 1-го Московского государственного педагогического института иностранныгх языков Александра Константиновича Жолковского, Нины Николаевны Леонтьевой и Юрия Семеновича Мартемьянова «О принципиальном использовании смысла при машинном переводе».1

Эта статья была опубликована в сборнике «Машинный перевод», изданном в Институте точной механики и вычислительной техники Академии наук СССР. Общий ее объем 36 000 знаков - 0,9 авторского листа, по 0,3 листа на каждого автора. Тем не менее пути исследований, намеченные этой небольшой публикацией, и поныне, как нам представляется, остаются актуальными для теоретического и компьютерного языкознания, а ряд высказанных в ней идей не просто получили в дальнейшем широкое распространение, но стали своего рода аксиоматикой данной области лингвистики. Рассмотрим некоторые из них (заранее просим извинения у читателя за возможную субъективность каких-то из высказываемых ниже суждений).

1. Формализация семантики как центральная задача исследований по автоматическому переводу

В рассматриваемой статье впервые в исследованиях по проблеме машинного перевода обращено внимание на содержание самого процесса перевода и задача исследований сформулирована с учетом этого содержания. Авторы, неявно полемизируя с Н. Хомским, а также с О.С. Кулагиной, И.А. Мельчуком и другими современниками, стоявшими в то время на позициях «конфигурационного» подхода к задаче машинного перевода2, подчеркивают, что неверно понимать перевод «как установление соответствий между грамматическими конфигурациями различных языков» в предположении, что «после выбора соответствующей конфигурации легко будет осуществить ее «лексическое наполнение», т.е. подставить в нее соответствующие слова» (с. 18). Напротив, «задачей перевода является передача на другом языке не грамматики, а смысла переводимого текста» (с. 18). Анализ текста при переводе предлагается трактовать как его понимание, а синтез - как изложение результатов этого понимания «своими словами на другом» языке (с. 46). Тем самым в центр исследований по формализации естественного языка в целях машинного перевода ставится задача описания семантики.

Было бы, разумеется, несправедливо утверждать, что до этой статьи формализацией семантики не занимались. Занимались, и достаточно активно - прежде всего в сфере библиотечных классификаций и информационного поиска, где еще в 1933 г. было введено понятие фасетной (= многомерной) семантической классификации3, а с начала 50-х гг. XX века стали разрабатываться так наз. семантические коды - формализованные языки для структурированного представления семантики в терминах семантических множителей. Эти разработки, прежде всего Кливлендский семантический код4, были хорошо известны авторам обсуждаемой статьи, которые ссылаются на них как на источник понятия и термина «семантический множитель» (с. 20). Но Кливлендский код создавался еще до того, как внимание компьютерной лингвистики обратилось к синтаксису и в ее арсенал вошли такие универсальные средства его формализации, как структуры зависимостей и составляю-щих5. Поэтому в его основу легли прежде всего морфологические модели: базисные понятия Кливлендского кода задавались семантическими множителями, смысловые отношения между ними - формальными суффиксами и инфиксами6. Понятно, что для детального описания естественно-языковой семантики этот аппарат недостаточен.

Занимались семантикой и непосредственно специалисты по машинному переводу - прежде всего в лаборатории Маргарет Мастерман, где разрабатывалось компонентное представление лексической семантики на основе тезаурусов7. Однако структура этого представления опиралась преимущественно на теоретико-множественные связки - конъюнкцию и дизъюнкцию, что ограничивало возможности учета в ней более сложных типов синтаксических отношений.

Заслуга Жолковского, Леонтьевой и Мартемьянова в том, что в их статье впервые был предложен аппарат семантического представления - семантической записи, позволяющий отображать в ней синтаксические деревья, и предложен целый ряд принципов построения такой записи, ставших в дальнейшем классическими.

2. Общие требования

к семантическому представлению

Важнейший из предложенных в рассматриваемой статье

принципов представления смысла лингвистических единиц

состоит в том, что необходимо уметь «записывать смысл вы-

оказывания, отвлекаясь от конкретных языковых способов его выражения» (с. 18).

С учетом этого к семантической записи предъявляются три основных - и теперь уже хрестоматийных - требования: она должна обеспечивать возможность «во-первых, слова и выражения с одинаковым смыслом записать одинаковым образом, во-вторых, слова и выражения, разные по смыслу, записать по-разному, причем, в третьих, точно отобразить степень и характер их несходства» (с. 18).

Эти требования позволяют авторам сделать вывод, что семантическая запись не может быть ограничена уровнем слов ни «сверху», ни «снизу».

С одной стороны, ни лексические, ни морфологические единицы не могут служить в качестве семантических целых. На примерах демонстрируется, что, во-первых, формальная структура слов не коррелирует со степенью их смысловой простоты или сложности и, во-вторых, смысл отдельной лексической единицы, как правило, неэлементарен, что мешает использовать его в качестве единицы описания смысла других слов. Соответственно, предлагается представлять смысл слова расчлененным образом - «в виде некоторой совокупности более элементарных единиц» - семантических множителей, по отношению к которым он «часто является образованием такого же порядка сложности, как предложение по отношению к слову» (с. 19-20).

С другой стороны, поскольку смысл неэлементарных лексических единиц может передаваться в том же или в другом языке «по частям» (с. 38), т.е. в виде сочетаний других лексических единиц, вводится требование, чтобы аппарат такой записи был одинаково пригоден и для слов, и для словосочетаний. Более того, он должен предусматривать «переход от записи смысла отдельных слов к записи смысла целой фразы» (с. 30, выделение наше - З.М.Ш.). Тем самым понятие семантического представления распространяется с отдельных слов и именных словосочетаний (рассматривавшихся в библиотечных семантических кодах) на более крупные единицы естественно-языковых текстов - предложения.

При этом эксплицитно формулируется принцип универсальности такого представления относительно различных естественных языков: точно так же, как семантическая запись отдельных слов не принадлежит «никакому конкретному языку» (с. 30), так и «смысловая запись фразы свободна от условностей конкретного языка, которые обычно осложняют переход к выражению того же смысла на другом конкретном языке» (с. 29).

Этот принцип иллюстрируется на примере предложений La préoccupation des pays du Benelux est facile à comprendre и The uneasefelt in Benelux countries is understandable. Строя их семантические представления в терминах предлагаемого аппарата, авторы рассматриваемой статьи демонстрируют, что эти «две фразы различных языков, различные по своей синтаксической структуре, но одинаковые по смыслу, могут быть сведены к одной смысловой записи» (с. 35).

Наконец, в рассматриваемой работе впервые определена принципиальная методика построения «изображения слова в <семантических> множителях» (с. 27). Для этого предлагается рассматривать не просто отдельные слова, но использовать «сравнение ряда высказываний с явно тождественным смыслом» (с. 20). Иными словами, в качестве операционного критерия для определения состава семантической записи описываемых единиц вводится исследование синонимии как взаимозаменяемости языковых выражений с тождественным смыслом, причем на уровне не отдельных слов, но содержащих их более крупных единиц текста. При этом «запись слов в семантических множителях» должна служить «полному (в идеале) устранению синонимии (т.е. сведению к единой записи всех синонимичных выражений)» (с. 26).

По существу здесь впервые в лингвистическом контексте дано определение смысла как инварианта синонимических преобразований, ставшее впоследствии краеугольным камнем для теории «Смысл ^ Текст»8.

3. От семантических множителей к семантическим предикатам

Значительным шагом вперед в теории лингвистической семантики и семантического синтаксиса явились введенные Жолковским, Леонтьевой и Мартемьяновым принципы формального представления в семантической записи отношений между ее элементами.

В это время в компьютерной лингвистике уже достаточно широко исследовалось понятие валентности. Первоначальная аморфная трактовка этого понятия (валентность как сочетаемость вообще)9, как и количественная его трактовка (валентность глагола как число допустимых при нем актантов10) уже начали уступать место дифференцированному пониманию валентностей как предсказаний текстовых связей определенных типов и уровней11. Однако даже применительно к валентно-

стям лексических единиц рассматривались прежде всего формальные разграничения - двусторонний, семантико-синтак-сический характер таких валентностей еще не осознавался.

В описании же собственно семантических отношений основными средствами их отображения все еще оставались операторы теории множеств - конъюнкция, дизъюнкция и отрицание, а в семантических кодах, как уже упоминалось, - также средства, построенные по образцу морфологических показателей естественного языка. Авторы рассматриваемой статьи впервые обратились в этих целях к более мощному формальному аппарату - теории предикатов, из которой была взята идея «пустых мест», которые допустимы у семантических множителей и на которые могут «ставиться» другие множители или их комбинации (с. 22).

Такие же «пустые места» предусматриваются и в лексическом словаре - для лексем, имеющих их в своей семантической записи. Тем самым - хотя и с использованием другого термина - впервые эксплицитно утверждается семантичность лексических валентностей и их обусловленность валентностями семантических элементов в составе толкований соответствующих лексических единиц. При этом в статье подчеркивается, что наличие у слова «пустых мест» не зависит от его морфологической и формально-синтаксической принадлежности: «в языке такими словами часто являются глаголы, существительные, предлоги, союзы, многие прилагательные» (с. 30-31). Заметим, что эта мысль и сейчас остается нетривиальной: часть лингвистов до сих пор признает предикатами только глаголы.

При анализе для единиц с «пустыми местами» должно происходить «заполнение пустых мест синтаксически связанными словами» (с. 31). Соответственно, в семантическом синтаксисе и на уровне элементарных смысловых единиц - семантических множителей, и на уровне более крупных семантических образований, представляемых естественно-языковой лексикой, предусматриваются, помимо теоретико-множественных отношений, отношения «постановки на места», называемые в статье «двусторонними». Последний термин здесь несколько неточен, поскольку подразумевает не просто двусторонность, но и прежде всего несимметричность соответствующих отношений. В современной терминологии это отношения заполнения актантных валентностей, или (предикатно-)актантные отношения.

Определив отношения данного типа, Жолковский, Леонтьева и Мартемьянов впервые связали семантические и синтакси-

ческие структуры, на несколько лет опередив в этом теорию Н. Хомского и его последователей. В ней первая попытка установить такую связь сделана в 1963 12, однако отношения между элементарными семантическими признаками в семантических представлениях («прочтениях» - readings) лексических единиц все еще были ограничены конъюнкцией и дизъюнкцией. Лишь позже в синтаксис таких представлений добавлены понятия «слотов» (slots), соответствующих «местам» лингвистических предикатов, и их «заполнителей» (fillers) 13.

Отметим два важных достоинства введенного исследователями подхода к семантическому синтаксису.

(а) В рамках этого подхода исчезают жесткие априорные ограничения на количество и характер отношений, допускаемых в структуре смысловой записи: не только список самих семантических множителей, но и инвентарь смысловых отношений становится открытым множеством.

(б) В семантическую запись вводятся синтагматические смысловые отношения того типа, который наиболее характерен для естественного языка, - «двусторонние» актантные отношения, имеющие принципиально несимметричную семантику и стандартно реализуемые в естественно-языковом синтаксисе столь же несимметричными подчинительными конструкциями.

4. Семантическая запись слова и межсловные семантические отношения

Понятие смысловых отношений, как оно трактуется у Жолковского, Леонтьевой и Мартемьянова, заслуживает специального рассмотрения.

Оно введено прежде всего в связи с противопоставлением «перевода по конфигурациям» и «перевода по смыслу» (см. выше в §1). Отмечая, что при переводе «важны, в первую очередь, не грамматические связи между словами, а смысловые отношения между смысловыми же компонентами высказывания», авторы статьи подчеркивают: «Для перевода не существенно, что такое-то существительное является дополнением к глаголу в определенной конфигурации. С точки зрения смысла существеннее, соответствует ли некоторый смысловой компонент действительному объекту воздействия в некотором процессе, адресату этого процесса или просто чему-то соприсутствующему в нем (Ср. «убить зверя», «посетить товарища», «получить

книгу»)» (с. 18) (в цитате подчеркнуто мною - З.М.Ш.). При этом указывается: «В отличие от грамматических конфигураций, смысловые отношения такого рода могут считаться общими для различных языков» (с. 18).

Легко видеть, что это прообраз будущих глубинных (семантических) падежей: сама используемая терминология сразу вызывает у современного читателя ассоциации с теорией Ч. Филлмора14. Между тем до его первой статьи на данную тему оставалось еще 7 лет!

Однако трактовка смысловых отношений интересна не только сходством с подходом Филлмора, но и отличиями от него. Ч. Филлмор, определяя падежные отношения как своего рода «семантические валентности», не увязывает их с семантическими описаниями обладающих ими слов, но, напротив, предлагает исключать связанную с этими отношениями информацию из лексических описаний, вынося ее в описание падежей как таковых. В результате его «семантические падежи» предстают как некоторая «внешняя» относительно лексики информация, которая не выводима из лексических толкований, но дополняет их (в частности, может «вводить» контекстную полисемию).

Жолковским, Леонтьевой и Мартемьяновым предложен принципиально иной подход (пояснения в угловых скобках наши - З.М.Ш.): «смысловая конкретизация связи <между предикатом и заполнителем его «места»> заключена в самом наборе множителей характеризующих семантику предиката>... двустороннее отношение в зависимости от набора семантических множителей ... может иметь значение воздействия, восприятия, эмоционального отношения, временного предшествования, сообщения, обладания и др.» (с. 39).

Как видим, авторы статьи прямо говорят о взаимосвязи смысловой интерпретации отношений, устанавливаемых при заполнении мест (валентностей) лингвистического предиката, с семантикой самого предиката, как она задается в его словарном описании структурой семантических множителей. Наличие у естественно-языковой единицы «пустых» мест, в свою очередь, увязывается с сопоставленной предикату смысловой записью: «Смысловая запись слова в словаре либо содержит пустые места, либо не содержит. В первом случае слово является связующим членом двустороннего отношения и формирует запись всех членов этого отношения» (с. 30).

При таком подходе структура отношений между языковыми элементами не является чем-то «внешним» относительно этих элементов, но определяется как реализация их собственных (потенциальных) свойств: «Заполнение пустых мест синтаксически связанными словами производится с учетом содержащейся в словаре информации о форме и некоторых смысловых характеристиках тех слов, которые способны занять соответствующие пустые места» (с. 38)15.

Таким образом, если в теории Ч. Филлмора семантические отношения (падежи) уточняют семантику связываемых ими слов, то подход Жолковского, Леонтьевой и Мартемьянова подводит к идее, что и на уровне семантических элементов, и на уровне слов, словосочетаний и предложений как более или менее сложных структур таких элементов смысловые отношения выводимы из свойств самих связываемых ими единиц.

Позже было показано, что для идеальной системы полностью элементарных семантических единиц оба подхода равносильны, так как семантические элементы и семантические отношения в такой системе взаимно определяют друг друга, различаясь используемыми в них способами обобщения семантической синтагматики16. При подходе, впервые намеченном в рассматриваемой работе троих исследователей, в роли обобщающих единиц, к которым сводятся неэлементарные структуры, выступают узлы этих структур - семантические сущности. В этом смысле здесь представлен один из вариантов сущностного подхода к языку17. Подход Ч. Филлмора, напротив, опирается на реляционный тип обобщения, когда в качестве обобщающих единиц выбираются ребра обобщаемых структур - семантические отношения.

5. Коммуникативная организация смысла и возможности ее отображения в структуре единиц разных уровней

Совершенно оригинальной для своего времени особенностью предложенного Жолковским, Леонтьевой и Мартемья-новым подхода к описанию семантики является то, что в семантической записи было предусмотрено отображение коммуникативной организации описываемого смысла. В статье рассматриваются три ее аспекта, связанные со способом заполнения и упорядочением (в разных отношениях) «мест» лингвистических предикатов, и для каждого из этих аспектов вводятся свои обозначения.

5.1. Коммуникативная организация в структуре толкования лексического предиката

Прежде всего авторы обращают внимание на то, что в языке возможны предикаты, «прочитывающие» некоторую ситуацию в разных направлениях - с «перестановкой мест», например: иметь и принадлежать, доволен и радует, раньше и позже, знать и быть известным (с. 22). Если говорить в современных терминах, члены приводимых пар лексем представляют собой конверсивы, т.е. задают одну и ту же ситуацию, но отличаются распределением своих актантов, вводящих ее участников, в иерархии, определяемой способом их оформления: актант, который при одном члене пары оформлен как подлежащее или определяемое, при другом выполняет роль дополнения и наоборот. В рассматриваемой работе впервые выявлен и в явном виде указан факт «смыслового тождества соответствующих высказываний» (с. 23).

Заметим, что лексические конверсивы не только до появления данной публикации, но и еще годы спустя описывались в лексикологии и лексикографии как антонимичные друг другу. Так, в словаре антонимов, изданном в 1971 г.18, пары больше - меньше, впереди - позади, лучше - хуже, слева - справа, брать - давать, победа - поражение и др. даются в общем списке антонимов, ничем не выделяясь среди других их видов. Предложенное исследователями рассмотрение членов таких пар как семантически тождественных с точностью до перестановки аргументов, т.е. при условии такой перестановки - синонимичных, являлось нетривиальным языковедческим открытием.

Новаторский характер носит и сопровождающее это рассмотрение замечание, что различие таких предикатов содержательно аналогично залоговым различиям типа Франция изучаетпроектуъ. ПроектизучаетсяФранцией (с. 22). Указывая, что в соответствующих конструкциях «соотношение по направлению передано самой грамматической формой, например, значение формы причастия страдательного залога = «переставь места внутри скобок»» (с. 23), авторы рассматриваемой статьи впервые эксплицитно вводят трактовку страдательного залога как конверсива, принятую впоследствии в теории «Смысл ^ Текст»19.

В то же время отмечается и то, что хотя высказывания с «разнонаправленными» предикатами указанного типа в целом взаимозаменимы, нельзя игнорировать и имеющиеся между

ними смысловые различия, которые, в соответствии с общими требованиями к семантической записи, должны находить в ней свое отражение. Средств, обеспечиваемых теорией множеств и теорией предикатов, для этого недостаточно, поэтому в предлагаемый семантический формализм вводится дополнительный знак «исходности», позиция которого в обозначении «двустороннего» смыслового множителя должна задавать направление его «прочтения».

5.2. Коммуникативная организация в структуре словосочетания

Второй аспект коммуникативной организации высказывания, на который обращают внимание авторы рассматриваемой статьи, также касается смысловых ситуаций с несколькими участниками. Здесь, однако, выделяется другой аспект их естественно-языкового представления - то, какой из участников ситуации «подается как главный» (с. 23) в синтаксической структуре словосочетания.

Вариативные возможности естественного языка в этом отношении демонстрируются на примере единиц «собственность» и «владелец» в сравнении с единицей «принадлежать» (с. 23-24): с одной стороны, они синонимичны20, поскольку «обрисовывают одну и ту же ситуацию («некто имеет, а нечто принадлежит»)», но, с другой стороны, «акценты в них расставлены по-разному». Отмечается, что наличие таких акцентов «с точки зрения смысла не безразлично» и должно эксплицитно отображаться в семантической записи (в качестве соответствующего показателя предлагается подчеркивание). При этом отмечается связь данного способа их выражения в языке с противопоставлением определения и определяемого.

В естественно-языковом синтаксисе, как известно, противопоставление синтаксических конструкций по тому, какой из членов конструкции выделяется в качестве главного, было впервые исследовано О. Есперсеном, который ввел в этой связи термины нексус и юнкция 21. У Жолковского, Леонтьевой и Мартемьянова это противопоставление впервые связывается с понятием логического акцента, получая тем самым семантическую интерпретацию22.

5.3. Коммуникативная организация предложения, представленная в его позиционной структуре

Третий аспект коммуникативной организации высказывания, для которого в рассматриваемой работе упоминается

необходимость его отображения в семантической записи, - это логический акцент, выделяющий «то главное, что утверждается», средствами порядка слов (с. 24). Речь идет о явлениях, известныгх современному читателю как актуальное, или тема-рематическое, членение предложения. Этот аспект коммуникативной организации предлагается обозначать двойным подчеркиванием, как в примере: Англия входит в эту зону vs. В эту зону входит Англия..

Рассматривая все эти виды «акцентов» и «направленности прочтения» как принципиально семантические явления, авторы выявляют глубинную общность таких, на первый взгляд, разнородный средств языкового выражения, как лексические конверсивы в языковой парадигматике, залоговые пары в морфологии, взаимозаменимость глагольного предиката и стандартного обозначения его субъекта или объекта в сочетании со связкой, соотношение определительныгх связей со связями типа «предикат-актант» и, наконец, порядок слов, рассматриваемый в его коммуникативные функциях. Тем самым впервые в языкознании эксплицитным образом утверждались функциональный параллелизм, семантическая родственность всех указанные типов лингвистических явлений.

6. Семантический синтез

Особо следует рассмотреть введенные и подробно проиллюстрированные в рассматриваемой статье принципы семантического синтеза.

6.1. Множественность синтеза

Авторы статьи эксплицитно формулируют требование, чтобы в словаре синтеза для той или иной смысловой записи давались все синонимичные слова и формы, а сам процесс синтеза предусматривал бы «разрешение синонимии» средств выражения - выбор окончательного варианта перевода на основе правил, которые должны быть «достаточно гибкими, чтобы придавать синтезируемой фразе естественный вид» (с. 36-37). В другой работе, опубликованной в том же году одним из авторов рассматриваемой статьи Н.Н. Леонтьевой, данное требование звучит еще более четко: задачей синтеза провозглашается «построение максимального количества фраз, соответствующих одной смысловой записи, т.е. составление множества перифраз одной мысли»23.

Тем самым вводится принцип множественности синте-

за, послуживший в дальнейшем теоретической базой для системы синонимического перифразирования, разработанной А.К. Жолковским и И.А. Мельчуком24, и получивший дополнительное обоснование в рамках теории «Смысл ^ Текст»25.

Уже в рассматриваемой статье перечисляется и иллюстрируется целый ряд средств, которые должны обеспечивать эту множественность: от синонимии грамматических и лексических способов выражения одного и того же смысла (включая возможность перераспределения семантических множителей между разными словами, множественность способов заполнения одних и тех же «мест» лингвистических предикатов - вариантность оформления заполняющих эти «места» единиц, факультативность этого заполнения, варьирование тех или иных аспектов коммуникативной организации рассматриваемых сочетаний и т.п.) до включения в синтезируемый текст «пустых» единиц и учета при выборе конкретных языковых средств того лексического и грамматического контекста, в котором эти средства должны функционировать.

6.2. Лексическая обусловленность как один из из источников множественности синтеза

В связи с требованием учитывать при синтезе текста контекстное окружение вводимых в этот текст единиц в рассматриваемой статье дана, в частности, первая формулировка важнейшего из тех принципов, на которых позже была построена теория лексических функций (ЛФ): «разные слова могут быть лексически обусловленными вариантами выражения одного смысла («оказывать влияние», но «производить впечатление»)» (с. 26, подчеркивание авторов - З.М.Ш.). Как видим, и в качестве примеров в статье указываются те единицы, которые в теории ЛФ определяются как значения лексических функций - в данном случае функции Оре^.

Иллюстрируя возможности введения в текст при синтезе «пустых» глаголов (с. 45-46), авторы статьи приводят также примеры, соответствующие другим глагольным ЛФ: ЬаЪог12 (сохранять в тайне) и СаивОрег1 (держать в неизвестности). При этом подчеркивается важность учета лексических ограничений на их сочетаемость: «При выборе «пустого» глагола необходимо учесть пометы о возможной лексической сочетаемости (и при самих пустых глаголах, и при словах, которые могут сочетаться с ними)» (с. 45-46) и демонстрируется роль рассматриваемых единиц в формировании синонимических вариантов выражения одного смысла: «Тогда <для фразы

Детали проекта были скрыты> возможно образование таких вариантов: «Детали проекта сохранялись в тайне», «держались в неизвестности»» (с. 45-46).

6.3. Варьирование при синтезе средств представления коммуникативной организации высказывания

Еще целый ряд явлений, в дальнейшем учтенных в теории ЛФ, рассматривается в работе Жолковского, Леонтьевой и Мартемьянова в связи с проблемами коммуникативной организации языковых высказываний. Это единицы, впоследствии получившие в указанной теории название «замен», или «парадигматических вариантов»26: конверсивы (с. 22-23) и стандартные обозначения актантов - например, слова собственность и владелец в их соотношении с глаголом принадлежать (с. 23-24), в теории ЛФ определяемые соответственно как S2 и Sj от этого глагола.

При перечислении средств, обеспечивающих варьирование результатов синтеза, в статье приводятся также примеры двух других типов замен - синонимов и единиц, имеющих то же значение, но относящихся к разным частям речи (в теории ЛФ - синтаксических дериватов). Эти средства иллюстрируются, в частности, перифразами: Англия подумывает о выдвижении проекта» и «Англия намерена выдвинуть проект» (с. 40).

Таким образом, в рассматриваемой статье фактически задана - частью эксплицитно, частью в виде естественно-языковых иллюстраций - целая программа исследований по созданию будущей системы синонимического перифразирования теории «Смысл ^ Текст» и основного инструмента этой системы - аппарата лексических функций.

7. Другие замечания и разграничения

Завершая рассмотрение статьи Жолковского, Леонтьевой и Мартемьянова, отметим, что помимо перечисленных выше принципиальных теоретико-методологических положений, она содержит также ряд более частных замечаний и разграничений, также явившихся новыми для своего времени. Отметим три таких разграничения.

7.1. Противопоставление лингвистической и энциклопедической семантики

В статье введено противопоставление лингвистически значимых и незначимых аспектов семантики. В частности, смысл

слова лингвистически значим и должен отражаться семантическими множителями в той части, в какой он «регулярным образом соотносится со смыслом других слов» (с. 24) и эти множители «а) могут быть использованы для ликвидации полисемии соседних слов, б) обусловливают ... участие <слова> в разного рода смысловых операциях» (с. 25). Остальную, лингвистически незначимую часть лексической семантики предлагается просто идентифицировать, например, в случае предметной лексики - обозначать порядковым номером (с. 25). В американской компьютерной лингвистике аналогичное противопоставление семантических признаков (semantic markers) и различителей (distinguishers) появляется лишь два года спустя27.

7.2. Противопоставление лексических толкований и селекционных ограничений

Эксплицитно разграничены, с одной стороны, семантическое описание самой лексической единицы, которое «позволяет точно обрисовать смысловые пределы слова, не внося ничего от окружающих слов» (с. 28), и, с другой стороны, требования такой единицы к своему контексту - информация о «смысловых характеристиках тех слов, которые способны занять соответствующие пустые места» (с. 31). В хомскианской лингвистике этому соответствует противопоставление «прочтений» (readings) лексических единиц и селекционных ограничений (selectional restrictions), налагаемых ими на другие элементы структуры, введенное также на два года позднее28.

7.3. Противопоставление значимых и незначимых предложно-падежных показателей

Противопоставлены два типа падежных форм и предлогов: одни несут собственную смысловую информацию и должны отображаться в семантической записи как двухместные предикаты (с. 33), другие «используются лишь как формальные указатели для того, чтобы определить место зависимого понятия внутри скобок управляющего», и представление их собственного смысла в семантической записи опускается (с. 32). В теории «Смысл ^ Текст» данный принцип вошел, как известно, в методику построения глубинно-синтаксического представления в отличие от поверхностно-синтаксического.

Заключение

Конечно, конкретная система формальных средств, предложенная в рассмотренной статье, скорее всего, покажется современному читателю наивной. Ненужным предстает при

современных возможностях языков программирования цифровое обозначение семантических множителей и оператора конверсии. И напротив, неоправданным усложнением формализма, ориентированного, по замыслу, на компьютерную реализацию, выглядит использование в нем «просодических» графических средств: надчеркивания для оператора отрицания, двух видов подчеркивания для разных типов логического акцента и т.п.

Важно, однако, другое: авторы не просто ввели новые, более мощные и более адекватные решаемой задаче средства формализованного лингвистического описания, но выявили и поставили целый ряд лингвистических проблем, которые до того оставались «за кадром», а также предложили принципы их решения, до сих пор сохранившие свою научную значимость.

В результате рассматриваемая статья послужила фундаментом и источником целого ряда школ и направлений в исследованиях по синтаксису и семантике в современной теоретической и компьютерной лингвистике. К ней восходят определение глубинного синтаксического представления и теория лексических функций в модели «Смысл ^ Текст»29; теория расчлененного смысла, созданная Ю.С. Мартемьяновым30; алгебра контекстных модификаций семантических отношений и включающая ее общая теория понимания естественно-языковых текстов H.H. Леонтьевой31; язык формальных толкований слов и словосочетаний32 и понятие сущностного подхода к языку33 в работах автора данного обзора.

Думаю, что в нашем поколении немало языковедов, которые так или иначе - непосредственно или опосредованно, сознательно или неосознанно - испытали в своей работе влияние этой почти забытой статьи.

Примечания)

ЖолковскийА.К., ЛеонтъеваН.Н., Мартемъянов Ю.С. О принципиальном использовании смысла при машинном переводе // Труды Института точной механики и вычислит. техники АН СССР. Вып. 2: Машинный перевод. М., 1961. С. 17-46. (Далее страницы указываются в скобках в тексте). Второе издание статьи см. в книге: Мартемъянов Ю.С. Логика ситуаций. Строение текста. Терминологичность слов. М.: Языки славянской культуры, 2004, с. 84-99. В данной работе статья цитируется по первому изданию.

См., например, Мелъчук И.А. Модель языка-посредника для машинного перевода // Тезисы Конференции по машинному переводу. М.:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

МГПИИЯ 1-й, 1958. С. 20-22; Кулагина О.С., Ляпунов A.A., Мельчук ИЛ, Молошная Т.Н. Теоретические основы машинного перевода на русский язык // Исследования по славянскому языкознанию. М., 1961. С. 374-382. RanganathanS. R. Colon classification. Madras, 1933. Позже И.А. Мельчук, распространив принципы такой классификации также на не-семанти-ческие аспекты лингвистического описания, назвал ее «скользящей» (см. работу Мельчук И.А. .Автоматический анализ текстов (на материале русского языка) // Славянское языкознание. М., 1963. С. 477-509). Melton J.L. The Semantic Code Today // American Documentation. 1952, vol. 13, № 2. P. 176-181; Perry J.W., Kent A., Berry M.M. Machine literature searching. N.Y.: Interscience Publishers, 1956.

В общем языкознании эти структуры уже были известны: первые примеры деревьев зависимостей даются еще в книге: Kern F. Grundriß der deutsche Sprachlehre. Berlin, 1896; понятие непосредственно составляющих эксплицитно определено в статье: Wells R.S. Immediate constituents // Language. 1947. Vol. 23. P. 81-117. Но в теорию компьютерной лингвистики эти понятия были, как известно, включены только во второй половине 50-х гг. XX века в работах: Chomsky N. Syntactic Structures. The Hague: Mouton&Co., 1957 (рус. перевод: Хомский Н. Синтаксические структуры // Новое в лингвистике. Вып. 2. М., 1962); TesnièreL. Éléments de syntaxe structurale. P.: Klincksieck, 1959 (рус. перевод: ТеньерЛ. Основы структурного синтаксиса. М.: Прогресс, 1988); Lecerf Y. Programme des conflicts, modèle des conflicts // Traduction automatique. 1960, vol. 1, № 4. P. 11-18; № 5. P. 17-36 (рус. перевод: ЛесерфИ. Применение программы и модели конфликтной ситуации к автоматическому синтаксическому анализу естественных языков // Научно-техническая информация. 1963, № 10. С. 42-50); Hays D.G. Grouping and dependency theories. Santa Monica (Calif.): RAND Corp., 1960. См. Москович B.A. Информационные языки. М.: Наука, 1971. С. 72-79; Черный А.И. Введение в теорию информационного поиска. М.: Наука, 1975. С. 85-87.

Masterman M. The potentialities of a mechanical thesaurus / Cambridge Language Research Unit. Cambridge (Engl.), 1956; Masterman M. The thesaurus in syntax and semantics // Machine translation. 1957, vol. 4, №1-2. P. 33-43 (рус. перевод: Мастерман М. Тезаурус в синтаксисе и семантике // Математическая лингвистика. М.: Мир, 1964); Richens R.H. Interlingual machine translation // Computerjournal. 1958, vol.1, № 3. P. 144-147. ЖолковскийА.К., МельчукИ.А. К построению действующей модели языка «Смысл « Текст» // Машинный перевод и прикладная лингвистика / МГПИИЯ им. М. Тореза. Вып. 11. М., 1969. С. 7; МельчукИ.А. Опыт теории лингвистических моделей «Смысл « Текст». Семантика, синтаксис. М.: Наука, 1974. С. 10 (переизд. в 1999, «Языки рус. культуры»). Кацнельсон С.Д. О грамматической категории // Вестник ЛГУ. 1948, № 2. С.114-134.

Tesnière L. Éléments de syntaxe structurale...

АндреевН.Д., БерковВ.П., ЗасоринаЛ.П. Исчисление валентностей при переходе от входного языка к языку-посреднику // Тезисы совещания по математической лингвистике. Л., 1959. С. 72; ЛейкинаБ.М. Некоторые

3

4

5

6

7

8

9

аспекты характеристики валентностей // Доклады конференции по обработке информации, машинному переводу и автоматическому чтению текста / АН СССР. Ин-т научной информации. Вып. 5. М.: ВИНИТИ, 1961.

12 Katz J.J., FodorJ.J. The structure of semantic theory // Language. 1963, vol. 39, № 2 (part 1). P. 170-210.

13 Katz J.J. Philosophy of language. N.-Y., L., 1966. Р. 151-175 (рус. перевод: КатцДж. Семантическая теория // Новое в зарубежной лингвистике, Вып. 10: Лексическая семантика. М.: Прогресс, 1981, с. 33-49).

14 Fillmore Ch. J. The Case for Case // Universals in Linguistic Theory. N.Y., 1968. P. 1-88 (рус. перевод: Филмор Ч. Дело о падеже // Новое в зарубежной лингвистике, Вып. 10: Лексическая семантика. М.: Прогресс, 1981, с. 369-495).

15 .Алгоритм анализа текста, целиком основанный на этом подходе, описан в работе: Жолковский А.К. О правилах семантического анализа // Машинный перевод и прикладная лингвистика / МГПИИЯ им. М.Тореза. Вып. 8. М., 1964. С. 17-32.

16 Шаляпина 3.М. Семантические элементы как основа лексикографического описания: общие принципы и формальный аппарат // Машинный перевод и прикладная лингвистика / МГПИИЯ им. М.Тореза. Вып. 15. М.: 1972. С. 54-98; Шаляпина 3.М. Об одном формализме для записи толкований слов и словосочетаний // Обработка текста и когнитивные технологии. Вып.1. М., Пущино: ОНТИ ПНЦ РАН, 1997. С. 73-110.

17 Общее определение сущностного подхода в его сопоставлении с реляционным см. в работах З.М. Шаляпиной: Шаляпина 3.М. Оппозиция «часть-целое» и сущностный подход к моделированию языковой компетенции // Роман Якобсон: тексты, документы, исследования. М.: РГГУ, 1999. С.541-551; Шаляпина 3.М. Трехмерная стратификационная модель языка и его функционирования: К общей теории лингвистических моделей. М.: Восточная литература, 2007. Более ранними вариантами сущностного подхода являются также описывавшиеся автором лексикографический и словоцентрический подходы, см.: Шаляпина3.М. Система АРАП: словарь, грамматика и их использование при автоматическом анализе // Международный семинар по машинному переводу. М.: ВЦП, 1975. С. 135-138; Шаляпина3.М. Грамматика и ее соотношение со словарем при словоцентрическом подходе к языку (На опыте формализованного лингвистического описания) // Вопросы языкознания, 1991, № 5. C. 42-54.

18 Введенская. Л.А. Словарь антонимов русского языка. Ростов-на-Дону: Изд-во Ростовск. ун-та, 1971.

19 МелънукИА Опыт теории лингвистических моделей «Смысл-—Текст»... С. 83.

20 В рассматриваемой статье на стр. 23 во 2-й строке снизу опечатка: вместо «нельзя считать полностью омонимичными слова «собственность», «владелец», «принадлежать»...» следует, очевидно, читать: «нельзя считать полностью синонимичными...».

21 Jespersen O. The Philosophy of Grammar. L.: George Allen and Unwin, 1924 (рус. перевод: Есперсен О. Философия грамматики. М.: Изд-во иностранной лит-ры, 1958).

22 Позже на этой основе было определено более общее понятие коммуникативного режима семантических отношений, см.: Шаляпина3.М. К проблеме коммуникативной организации текста и ее отражения в се-

мантической записи // Вычислительная лингвистика. М.: Наука, 1976. С. 53-80.

23 Леонтьева H.H. Модель синтеза русской фразы на основе семантической записи Доклады конференции по обработке информации, машинному переводу и автоматическому чтению текста / АН СССР; Ин-т науч. информации; 1 МГПИИЯ. М.: ВИНИТИ, 1961. Цит. по: Мельчук H.A., РавичР.Д. Автоматический перевод. 1949-1963. Критико-библи-ографический справочник. М.: ВИНИТИ, 1967. С. 371.

24 Жолковский A.K., Мельчук H.A. О возможном методе и инструментах семантического синтеза // Научно-техническая информация. 1965. №6. С. 23-28; Жолковский A.K., Мельчук H.A. О семантическом синтезе // Проблемы кибернетики. Вып. 19. М.: Наука, 1967. С.177-238.

25 Мельчук H.A. Опыт теории лингвистических моделей «Смысл « Текст»... С. 198-199.

26 Описание таких «замен» см., например, в: Мельчук H.A. Опыт теории лингвистических моделей «Смысл « Текст»... С. 78, 83-88.

27 См. статью Katz J.J., Fodor J.J. Op. cit. P. 170-210.

28 Katz J.J., Fodor J.J. Op. cit. P. 170-210.

29 Жолковский A.K. О правилах семантического анализа // Машинный перевод и прикладная лингвистика. Вып. 8. М.: МГПИИЯ им. М.Тореза, 1964. С. 17-32; Жолковский A.K., Мельчук H.A. О семантическом синтезе... С.177-238; Жолковский A.K., Мельчук H.A. К построению действующей модели языка «Смысл « Текст»... С. 5-35; Мельчук H.A. Опыт теории лингвистических моделей «Смысл « Текст»...; и другие работы тех же авторов.

30 Мартемьянов Ю.С. К описанию текста: язык валентно-юнктивно-эм-фазных отношений // Машинный перевод и прикладная лингвистика / МГПИИЯ им. М.Тореза. М., 1970. Вып. 13. С. 89-116; М., 1970. Вып. 14. С. 43-70; Мартемьянов Ю.С. Связный текст - изложение расчлененного смысла // Предв. публ. Проблемной группы по эксперим. и прикл. лингвистике / ИРЯ АН СССР. Вып. 40. М., 1972 с. 3-59.

31 Леонтьева H.H. Создание информационного языка на базе семантического анализа текста // Научно-техническая информация. Серия 2. 1971, № 8. С. 8-15; Леонтьева H.H. К теории автоматического понимания естественных текстов. Часть 3. Семантический компонент. Локальный семантический анализ. М.: МГУ, 2002; Леонтьева H.H. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.

32 ШаляпинаЗ.М. Формальный язык для записи толкований слов и словосочетаний // Проблемы кибернетики. Вып. 36. М.: Наука. Гл. ред. физ.-мат. лит-ры, 1979. С. 247-278; см. также работы, упомянутые в примеч. 16.

33 См. работы, упомянутые в примеч. 17.

Об одной пионерской статье, или принципы формализации семантики в 1961 г Текст научной статьи по специальности «Языкознание и литературоведение»

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Шаляпина Зоя Михайловна

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Шаляпина Зоя Михайловна

Recalling One Pioneering Paper, or Semantics and its Formalization in 1961

Текст научной работы на тему «Об одной пионерской статье, или принципы формализации семантики в 1961 г»