Моделирование языка при автоматическом переводе (в рамках сущностного подхода к лингвистическому описанию)
Программа спецкурса для студентов-лингвистов
Предисловие
Данный курс может рассматриваться как продолжение и углубление курса «Проблемы и методы автоматического перевода», программа которого уже была опубликована (см. Московский лингвистический журнал. 2003. Том 7. № 1. С. 125-154). Если в том курсе ставится задача возможно более широко охватить различные лингвистические подходы и формализмы, применяемые при создании систем автоматического перевода. рассматривая эти подходы и формализмы в их исторической перспективе и в сопоставлении друг с другом, то здесь более подробно и содержательно изучаются методы решения основных проблем автоматического перевода в рамках одного из разработанных в этих целях подходов - так наз. сущностного подхода к лингвистическому описанию. Данный подход целесообразно выделить в качестве предмета самостоятельного изучения, поскольку он составляет лингвофилософскую основу таких важных понятий и инструментов современной лингвистики, как система зависимостей, аппарат валентностей. компонентный принцип описания семантики и т.п. В то же время он позволяет непосредственно интерпретировать и эффективно использовать в лингвистическом описании отношения наследования, механизмы умолчаний и другие средства. выработанные в рамках объектно-ориентированного подхода в искусственном интеллекте и программировании и может рассматриваться как его принципиальный аналог применительно к лингвистике.
Подчеркнем, что содержание данного курса и курса «Проблемы и методы автоматического перевода» практически не пересекается, так что в принципе каждый из них может читаться независимо от другого. От слушателей данного курса ожидается только, что они уже знакомы с основными лингвистическими понятиями (в частности, владеют навыками построения представлений синтаксической структуры предложения
в терминах составляющих и зависимостей), а также знакомы с общим строением классической теории порождающих грамматик Н.Хомского и модели «Смысл<=?Текст» И.Д.Мельчука и А. К.Жолковского.
Курс рассчитан на 66 часов учебного времени и включает четыре основных части:
1) Общая модель языковой действительности и разграничение реляционного и сущностного подходов к описанию языка в целях АП;
2) Моделирование морфологических и морфолого-синтак-сических аспектов языка при сущностном подходе к его описанию в целях АП;
3) Моделирование синтаксических и семантико-синтакси-ческих аспектов языка при сущностном подходе его описанию в целях АП;
4) Моделирование семантики при сущностном подходе к описанию языка в целях АП.
Соответственно, он может читаться либо как единый годичный курс с зачетом после изучения первых двух его частей и с экзаменом в конце года, либо как два взаимосвязанных семестровых курса:
(1) Сущностный подход к языку и моделирование морфологических и морфолого-синтаксических аспектов языковой системы при АП;
(2) Моделирование семантико-синтаксических и семантических аспектов языковой системы при АП в рамках сущностного подхода к языку, каждый из которых завершается экзаменом. В таком варианте он читался, в частности, для студентов Ш-го курса ФТиПЛ РГГУ в 1994-1995 и 1997-1998 учебных годах).
В результате усвоения данного курса студенты должны, с одной стороны, получить понятие о лингвофилософских основаниях выделения сущностного подхода и о месте, которое он занимает среди различных направлений традиционного и современного языкознания с учетом общих представлений о языке и языковой деятельности, и. с другой стороны, усвоить конкретный понятийный аппарат данного подхода, изучить содержательные лингвистические критерии, выработанные в его рамках для определения общих и частных лингвистических оппозиций и категорий, в терминах которых может задаваться при этом подходе конкретно-лингвистическая информация различных уровней, и приобрести навыки организации и записи такой информации с помощью ряда конкретных формализмов, разработанных для этих целей в отечественных исследованиях по автоматическому переводу.
Соответственно, лекционные занятия в составе данного курса должны систематически сопровождаться семинарскими
занятиями, на которых студенты тренируются в практическом применении сведений, полученных ими из лекций. Поэтому курс должен читаться в относительно немногочисленных группах- желательно не более 10 слушателей.
При оценке знаний студентов по данному курсу также необходимо учитывать как его теоретические, так и практические аспекты, включая в каждый экзаменационный билет один вопрос по теории рассмотренных лингвистических моделей и один вопрос по практическому описанию тех или иных языковых явлений в терминах изученных формализмов.
Программа
Часть X. Общаямодель языковой действительности и разграаичение реляционного и сущностного подходов к описанию языка в целях АП
Тема 1. Стратификационные модели естественного языка е теории автоматического перевода
Стратификационная лингвистическая теория С.М. Лэма. Четыре уровня описания и три типа единиц, выделяемых на каждом уровне. Внутри- и межуровневые связи единиц разных типов. Порядок обработки текстов входного и выходного языков при Моделировании перевода на основе данной модели.
Модель «Смысл«Текст». Понятие уровня представления текста и его отличие от аналогичного понятия стратификационной лингвистики С.М. Лэма. Основные уровни модели. Принципы дифференциации основных уровней на поверхностный и глубинный подуровни. Особенности реализации этих принципов применительно к морфологическому, синтаксическое и семантическому уровням.
Глубинно-синтаксический уровень представления текста в модели «Смысл <=>Текст». Особенности его лексики и синтаксиса. Соотношение глубинных и базовых синтаксических структур. Уровень базовых синтаксических структур как уровень языка-поСредника при автоматическом переводе; достоинства и недостатки такого определения языка-посредника.
Уровень семантического представления текста в модели «Смысл<=$текст,. Его отличия от уровня семемных структур в стратификационной модели С.М. Лэма.
Компоненты описания языка в модели «Смысл$=>Текст». Словарь как полноправный и даже центральный компонент такого описания. Два возможных подхода к реализации этого принципа. Связь тезиса о центральной роли словаря в лингвистическом описании с рядом современных направлений в программировании и в исследованиях по искусственному интеллекту.
Лингвистические уровни, выделяемые в хомскианской теории языка. Их отличие от уровней стратификационных моделей.
Определение характера отношений между языковыми уровнями в работах Пражской лингвистической школы.
Тема 2. Основные функции языкового знака и общая модель лингвистической компетенции.
Принципиальное противопоставление языковой компетенции и языковой деятельности. Стабильность и вариативность той и другой. Проблема независимых оснований для модели языковой компетенции.
Определение модели языковой компетенции как многомерного лингвистического пространства, оси которого формируются логико-семиотическими функциями языкового знака. Основные из этих функций: обозначение, членение, обобщение. Их принципиальная несводимость друг к другу. Распределение лингвистических уровней по трем осям пространства языковой компетенции, соответствующим указанным функциями языкового знака.
Уровни оси обозначения. Соссюрианское понятие значимости и план собственно знаковой структуры языка. Соотношение плана собственно знаковой структуры с планами выражения и содержания. Интерпретация с точки зрения этого соотношения свойства асимметричного дуализма языкового знака и связанных с ним противопоставлений (вокабула уб. лексема, омонимия Ув. смысловая неопределенность, синонимия уб. вариантность и др.). Степень нелинейности языковых структур в разных планах оси обозначения.
Основные уровни (ярусы) оси членения, выделяемые в рамках каждого из трех планов оси обозначения. Соотношение между собой ярусов, относящихся к разным языковым планам. Ярусы, выделяемые с учетом межплановых соотношений включаемых в них единиц. Уровни классических стратификационных моделей. соотносящиеся с осью членения.
Уровни оси обобщения в их отношении к планам оси обозначен ия. Теоретико-множественное объединение и пересе-
чение как два основных источника лингвистического обобщения. Глубинные и поверхностные подуровни модели «Смысл Текст», с точки зрения оси обобщения.
Проблемы метрики языкового пространства. «Непараллельность» его основных осей и «несимметричность» переходов по каждой из них.
Тема 3. Моделирование языковой деятельности человека на базе трехмерного пространства языковой компетенции.
Языковая деятельность (языковое функционирование) как движение в пространстве языковой компетенции. Принципиальная множественность видов и моделей языкового функционирования.
Понятие языкового «центра». Лингвистическая избыточность. обусловленная частичным дублированием информации. относящейся к «центру» языка, в разных планах оси обозначения. Возможности варьирования видов и моделей языкового функционирования, связанные с этой избыточностью.
Три базовых модели анализа/синтеза, определяемые выбором основного для них плана оси обозначения. Специфика синтеза текста на основе плана выражения. Синтез на основе плана содержания и взаимодействие языка и мышления. Достоинства и недостатки анализа на основе плана содержания; опыт применения таких моделей анализа в прикладных системах обработки текстов. План собственно знаковой структуры как основа и анализа и синтеза при функционировании языка в режиме «текст-текст».
Варьирование направления движения по осям обобщения и членения как еще один источник множественности видов и моделей языкового функционирования. Обобщение/конкретизация и агрегация/сегментация при создании формализованных лингвистических описаний (моделирующем процессы первичного овладения языком), с одной стороны, и при обработке текстов на основе уже созданных лингвистических описаний (моделирующей понимание/порождение текстов на уже усвоенном языке), с другой.
«Анализ через синтез» и «синтез через анализ», с точки зрения осей обозначения, членения и обобщения.
Моделирование языковой компетенции в ориентации на конкретную задачу как «сужение» универсального лингвистического пространства применительно к этой задаче.
Тема 4. Общая формальная модель переводческой деятельности человека и проблемы автоматического перевода.
Перевод как языковая деятельность типа «текст-текст». Три вида собственно переводческих операций: поиск переводных эквивалентов для элементарных единиц перевода, формирование переводных эквивалентов для неэлементарных единиц перевода, межъязыковые преобразования.
Уровень осуществления собственно переводческих операций. с точки зрения оси обозначения. Виды языкового функционирования при переводе, связанные с движением относительно этой оси. и их моделирование в системах автоматического перевода. Возможности варьирования при переводе требуемой «глубины» анализа переводимого текста.
Обобщение/конкретизация в процессе перевода. Неполнота смысловых соответствий между оригиналом и переводом, ее возможные причины и основные пути ее преодоления. Три вида перефразирования при переводе: до-переводческое, после-переводческое и межъязыковое. Синтез и анализ при построении текста перевода. Редактирование текста перевода как необходимый компонент адекватной модели переводческой деятельности.
Уровни осуществления собственно переводческих операций. с точки зрения оси членения (проблема единиц перевода). Минимальные единицы автоматического перевода. Переводческая идиоматика и методы ее описания. Максимальные единицы автоматического перевода. Возможности и пределы их «минимизации» с учетом характера маркировки в языке структурных связей соответствующего уровня (яруса).
Основные типы знаний, необходимые в формализованном описании языка, моделирующем лингвистическую компетенцию человека, для поддержки автоматического перевода как модели его переводческой деятельности.
Тема 5. Реляционный и сущностный подход к организации лингвистических знаний при их формализованном описании.
Оппозиция «часть-целое» в языке и противопоставление реляционных и сущностных подходов к организации лингвистического описания. Соотношение обобщения и членения языковых единиц при описании синтагматических аспектов различных языковых уровней в рамках подходов того и другого типа. Преимущества и недостатки реляционного и сущностного способов лингвистического обобщения.
Понимание синтагматических отношений как свойств связываемых ими лингвистических сущностей. Роль эксплицитных и имплицитных повторов в организации синтагматической системы языка. Отображение языковой синтагматики в терминах валентностей лингвистических сущностей как основной механизм ее моделирования при сущностном подходе. Статус понятий валентности и валентностной модели управления применительно к различных планам оси обозначения. Валентности собственно знакового плана языка на различных уровнях (ярусах) членения.
Словарь и грамматика в реляционных и сущностных описаниях. Возможности и проблемы их согласования друг с другом и оптимизации их соотношения при расширении и корректировке лингвистического описания в целом.
Механизмы наследования и их роль в организации лингвистических описаний сущностного типа. Основные виды наследования, действующие на оси обобщения и на оси членения. Языковой «центр» и проблемы наследования «по оси обозначения».
Относительная трудоемкость реляционных и сущностных описаний в зависимости от их ориентации на максимально полный учет информации о каждой из охватываемых описанием словарных единиц (при возможной неполноте их инвентаря) или на максимально полное перечисление самих имеющихся в языке словарных единиц (при возможной неполноте информации об отдельных единицах).
Общие принципы обработки текстов на осн ове формализованных лингвистических описаний, организованных в рамках сущностного подхода. Сущностный подход как естественная основа для интерпретации задач обработки текста как «задач удовлетворения ограничений».
Часть 2. Средства и методы моделирования
морфологических и морфолого-синтаксических аспектов языковой системы при сущностном подходе
к ее описанию
Тема 6. Разграничение морфологии и синтаксиса при их моделировании в целях автоматического перевода.
Ярусы морфологии и синтаксиса в рамках общей модели языковой компетенции и языковой деятельности человека. «Содержательные» и «формальные» критерии их разграничения. Место аналитического формообразования, сточки зрения этих критериев.
Проблема разграничения уровней оси членения (ярусов) в собственно знаковом плане естественного языка. Минимальные. максимальные и промежуточные единицы лингвистического яруса. Принцип гомогенности каждого лингвистического яруса относительно допустимых в его пределах лингвистических сущностей, отношений и процессов.
Рекурсивный критерий установления принадлежности языковых единиц к определенному ярусу лингвистического описания на основании принципа его гомогенности. Понятие безусловных сущностей яруса и специфических для него отношений и процессов. Общая схема установления принадлежности конкретной лингвистической сущности к сфере распространения того или иного яруса. Принципиальная возможность «пересечения» сфер распространения смежных ярусов при определении состава входящих в них лингвистических сущностей на основе данного критерия.
Конкретизация общей схемы рекурсивного критерия разграничения лингвистических ярусов применительно к ярусам морфологии и синтаксиса. Слово как единица, пограничная между данными двумя ярусами. Постулат о принципиальной конечности безусловно морфологических сущностей и потенциальной бесконечности синтаксических. Возможности его интерпретации в синтагматическом и в парадигматическом смыслах. Специфически морфологические и специфически синтаксические отношения и процессы, с точки зрения этого постулата.
Проблема разграничения слова и фразеологического сочетания слов. Некоторые возможности моделирования фразеологических словосочетаний, не допускающих внутренних перестановок, одновременно как морфологических и синтаксических сущностей.
Тема 7. Моделирование морфологических знаний и процедур при сущностном подходе к лингвистическому описанию.
Возможности применения понятия валентности при моделировании морфологических и морфонологических (морфо-графических) аспектов языковой системы в рамках сущностного подхода. Проблема активных и пассивных валентностей этих ярусов.
Морфонологические (морфографические) чередования и их описание в валентностных терминах. Словарь и грамматика графико-морфологичсских лингвистических сущностей.
Интерпретация общих словоизменительных категорий в терминах морфологических валентностей лексических основ.
Морфологические валентности аффиксов. Стандартная и нестандартная сочетаемость морфологических сущностей в ва-лентностном описании морфологии.
Проблема лингвистической классификации словоизменительных категорий в свете требований компактности их представления в машинной форме. Соотношение этих требований с требованиями лингвистической адекватности описания.
Синтагматическая информация, релевантная для моделирования словоизменения. Организация этой информации в словаре и грамматике формализованного лингвистического описания с использованием механизмов наследования. Суммирующее наследование и наследование по умолчанию как основные из используемых здесь механизмов.
Морфологический анализ при сущностном подходе к описанию морфологии. Основные типы процедур такого анализа: сегментация анализируемой цепочки единиц выражения на ее минимальные подцепочки, допускающие собственно знаковую интерпретацию: переход к ее представлению на уровне морфологического яруса собственно знакового плана языка: верификация формируемых вариантов этого представления с учетом сочетаемости включаемых в них сущностей в пределах данного яруса. Неоднозначность сегментации и интерпретации графико-морфологических объектов и возможности ее устранения на морфологическом уровне.
Морфологический синтез при сущностном подходе к описанию морфологии. Словарь А.А.Зализняка как основа такого описания для русского языка. Лексико-морфологическая избыточность русского языка и определяемые ею отношения наследования морфологической информации от графико-морфологических сущностей, выделимых в составе русских лексем, к самим лексемам. Графико-морфологическая грамматика русского языка, опирающаяся на инвентари конечных и начальных компонентов русских лексем. Использование этой грамматики для обработки лексем, отсутствующих в словаре, и для оптимизации общего объема словаря.
Тема 8. Моделирование морфолого-синт аксических аспектов языка на различных этапах автоматического перевода при сущностном подходе к лингвистическому описанию.
Морфолого-синтаксический ярус лингвистического описания как уровень, охватывающий область интерференции морфологии и синтаксиса. Основные виды морфолого-синтак-сических сущностей.
Распространение аппарата морфологических валентностей на описание морфолого-синтаксической синтагматики как средство повышения устойчивости и надеишости морфологических моделей. Устранение неоднозначности сегментации и интерпретации морфологических и графико-морфоло-гических сущностей средствами данного аппарата. Механизм вытесняющего наследования и его использование при формировании морфологических представлений для морфолого-син-таксических аналогов словоформ.
Языки формальных лингвистических операторов/предикатов для описания морфолого-синтаксических явлений в процедурных терминах. Организация процедурных знаний, представленных в терминах таких языков, при сущностном подходе к лингвистическому описанию. Использование процедурных знаний морфолого-синтаксического уровня в целях анализа. Основные типы операторов (предикатов), служащих для снятия неоднозначности анализируемых единиц по их по линейному контексту. Примеры процедур данного типа.
Возможности и ограничения моделирования на морфоло-го-синтаксическом уровне процедур межъязыкового перехода. Линейная структура текста как объект перевода. Основные типы операторов (предикатов), требуемые для записи межъязыковых процедур морфолого-синтаксического уровня, и примеры самих процедур.
Языковая избыточность, связанная с линейной структурой текста, как основа для морфолого-синтаксического синтеза но неполной и/или неточной входной информации. Возможности такого синтеза для русского языка.
Часть 3. Средства и методы моделирования синтаксических и семантико-синтаксических аспектов языковой системы при сущностном подходе к лингвистическому описанию
Тема 9. Структуры зависимостей как основной вид представления языковой синтагматики при сущностном подходе к ее описанию. Лингвистические основания расстановки стрелок зависимостей.
Отношение <синтаксис-семантика> и его отличия от отношения <морфология-синтаксис> в трехмерной модели языковой компетенции. Двусторонний - «семантико-синтаксиче-ский» - характер конкретных синтагматических отношений синтаксического яруса в плане собственно знаковой структуры
языка. Синтаксические и семантические отношения как обобщение семантико-синтаксических отношений данного яруса.
Представление семантико-синтаксических отношений в терминах зависимостей и составляющих как проявление различия между сущностным и реляционным подходами к языковой синтагматике. Эндоцентрические и экзоцентрические конструкции при том и другом подходе. Требование древовид-ности структуры зависимостей для эндоцентрических конструкций.
Основные критерии расстановки и ориентации семанти-ко-синтаксических зависимостей в представлении эндоцентрических конструкций. Критерии свертывания/развертывания словосочетаний, связанных стрелками зависимостей. Критерий семантической неотделимости. Критерий морфологического согласования. Критерий морфолого-синтакси-ческого управления. Критерий семантического управления. Критерий структурной аналогии. Критерий автономной семантической интерпретируемости. Критерий трансформационной неотделимости. Критерий трансформационного подобия. Критерий максимальной проективности.
Применение имеющихся критериев расстановки и ориентации связей семантико-синтаксических зависимостей к материалу конкретных языков.
Представление в терминах зависимостей основных видов экзоцентрических конструкций. Сочинительные, специфика-тивные. анафорические зависимости. Структуры зависимостей для эллиптических конструкций.
Объединение различных типов зависимостей в составе единого графа и проблема его древовидности.
Тема 1О. Зависимости и валентности.
Семантико-синтаксические валентности языковых сущностей как обобщение собственно знаковых зависимостей между текстовыми инстанциациями этих сущностей путем разбиения множества таких зависимостей на классы эквивалентности. Основные принципы классификации текстовых зависимостей в этих целях. Требование однократной реализации валентностей в тексте. Условия допустимых нарушений этого требования. Трансформационный критерий классификации зависимостей. Критерий классификации зависимостей на базе компонентного анализа семантики связываемых ими сущностей.
Проблема актантов (комплементов) и сирконстантов (адъюнктов). Связь этой проблемы с ориентированностью от-
ношений зависимости в синтаксической структуре и с необходимостью выбора в качестве носителя актантной валентности на такое отношение только одной из двух связываемых им сущностей. Роль противопоставления актантов и сирконстантов в коммуникативной организации предложения и текста.
Понятие контр-актантной валентности. Противопоставление актантных и контр-актантных валентностей в его соотношении с противопоставлением актантов и сирконстантов. Синтаксические и семантические аспекты этого соотношения. Принципиальная конечность инвентаря и актантных и контр-актантных валентностей, сопоставляемых одному носителю.
Прямая и косвенная реализация валентностей. Понятие контекстного валентностного наследования.
Энциклопедическая информация и возможности ее представления в валентностных терминах. Понятие ассоциативных валентностей.
Внутрифразовые и межфразовые валентности.
Вероятностные и статистические сведения о языковой синтагматике при ее описании в терминах семантико-синтак-сических валентностей.
Тема 11. Принципы организации семантико-синтаксических знаний о языковой синтагматике при сущностном подходе к ее описанию.
Основные виды лингвистических знаний, представляющие семантико-синтаксические аспекты языковой синтагматики при сущностном подходе к лингвистическому описанию. ,
Знания об отдельной валентности: семантическая интерпретация валентности; семантические требования к лингвистическим сущностям, способным заполнять эту валентность в тексте: варианты ее текстовой реализации.
Знания об отдельном варианте реализации валентности: направление текстовой зависимости, реализующей эту валентность. при данном варианте ее реализации: требования к аналитическому оформителю текстовой сущности, заполняющей эту валентность; требования к самой этой сущности: позиционные сведения. Три вида требований к заполнению валентностей: морфологосинтаксические, семантические, лексические. Виды позиционных сведений о варианте реализации валентности: позиционное соотношение сущности, заполняющей валентность, и ее аналитического оформителя друг с другом и с сущностью - носителем валентности; требо-
вания к текстовым сущностях, допустимых между ними; допустимость какой-либо из этих сущностей в качестве источника разрешенной непроективности.
Знания о соотношении между собой единиц, заполняющих отдельные валентности данной лингвистической сущности и/или сущностей, связанных с ней в структуре, в тех или иных вариантах реализации этих валентностей.
Формальные виды требований к описываемым лингвистическим сущностям: разрешения, запреты, исключения из запретов. Оценочная информация в составе таких требований.
Организация грамматических знаний семантико-син-таксического типа в виде иерархии статей грамматических лингвистических сущностей, связанных друг с другом и с лексическими сущностями отношениями наследования. Грамматические сущности, выделяемые в рамках оси обобщения (= классифицирующие грамматические признаки). Суммирующее наследование и наследование по умолчанию как основные механизмы наследования, действующие на этой оси. Грамматические сущности, выделяемые с учетом отношений членения в ярусах морфологии и синтаксиса (гевр., морфологические и валентностные категории). Механизмы взаимодействия между наследником и наследодателем при их соотношении по оси членения.
Знания о семантико-синтаксических аспектах языковой синтагматики в статьях лексических сущностей. Собственно лексемы и идиоматические сочетания лексем: нестандартные механизмы наследования.
Тема 12. Семантико-синтаксические описания сущностного типа и их использование на различных этапах обработки текстов в целях автоматического перевода.
Проблема отбора знаний о языковой синтагматике, включаемых в конкретное лингвистическое описание, и увязки формального аппарата их представления в этом описании с характером осуществляемых на его основе процедур обработки текстов.
Формальные средства для записи синтагматической информации семантико-синтаксического типа в лингвистических описаниях, ориентированных на задачи анализа. Представление синтагматических отношений, устанавливаемых при анализе между лингвистическими сущностями анализируемого текста, как свойств этих сущностей - реализаций
их валентностей. Основные реляционные признаки (функции), используемые в этих целях. Представление синтагматической структуры как списка лингвистических сущностей с их реляционными признаками.
Возможности моделирования процедур выявления и обработки синтагматических структур семантико-синтаксического уровня операторными и предикатными средствами. Основные типы требуемых операторов (предикатов) и примеры процедурных описаний, записанных в их терминах. Универсальные алгоритмы анализа структур зависимостей на основе валент-ностного представления семантико-синтаксической синтагматики. Проблема интеграции универсальных процедур анализа с локальными операторными (предикатными) процедурами.
Структуры зависимостей и структуры составляющих на этапе межъязыкового перехода. Проблема «предиереводче-ского анализа» и «предпереводческого перефразирования». Основные типы межъязыковых знаний семантико-синтаксического уровня и их организация при сущностном подходе к лингвистическому описанию. Семантико-синтаксические условия выбора и формирования переводных эквивалентов для выделенных в переводимом тексте сущностей и отношений (структурных и позиционных).
Процедурные средства представления межъязыковых знаний семантико-синтаксического типа. Их соотношение с аналогичными средствами морфолого-син гаксического уровня. Возможности моделирования межъязыкового перехода «по умолчанию» на основе неполных сведений о семантико-синтаксической организации переводимого текста. Примеры записи соответствующих процедур.
Представление входной информации семантико-синтаксического уровня для целей синтеза при сущностном подходе к лингвистическому описанию. Этапы и проблематика синтеза при таком подходе.
Организация семантико-синтаксических знаний и процедур их использования в модели русского синтеза, реализующей данный подход. Возможности учета в этих целях словообразовательной структуры лексем. Формальный аппарат для их записи в этой модели. Примеры словарных и грамматических описаний, представленных в его терминах. Языковая избыточность и механизмы умолчаний синтаксического и семантико-синтаксического уровней. Механизм «семантико-синтаксического согласования» как средство снятия смысловой вариативности, связанной с не эксплицированными во вход-
ном представлении текста аспектами его содержания, по их «следам» (возможно, множественным) в его составе. Механизм «лексико-семантического согласования» и его использование при синтезе для моделирования «конкретизирующего перевода» в случаях семантической неопределенности (нерасчлененности) единиц оригинала. Соотношение этого механизма с понятиями лексических и энциклопедических функций
Часть 4. Средства и методы моделирования семантики при сущностном подходе к лингвистическому описанию
Тема 13. Общие требования к семантическому описанию при компонентном подходе к семантике
Компонентный подход к семантике и основные требования к аппарату семантического описания лингвистических сущностей. Постулат о «непрерывности семантической записи» и принцип членимости значений лингвистических сущностей. Принципы парадигматической и синтагматической системности семантических свойств лингвистической сущности. Семантические признаки, семантические падежи и семантические компоненты. Смысловая парадигматика и синтагматика лингвистической сущности в их соотношении друг с другом.
Основные типы семантической информации о лингвистической сущности: толкование, правила его контекстуальных модификаций, набор семантических классов, в которые входит данная лингвистическая сущность, семантическая интерпретация ее валентностей, семантические требования, предъявляемые ею к их заполнению. Взаимосвязь этих типов информации между собой.
Понятие идеальной системы элементарных семантических единиц. Требования к системе таких единиц: конечность инвентаря элементарных единиц, различных по своему сигнификативному содержанию, при бесконечности их комбинаторных возможностей: содержательность и полнота этого инвентаря: его минимальность: соотносимость элементарных семантических единиц с соответствующими им единицами естественного языка.
Принципы выделения элементарных семантических сущностей (семантических элементов). Индивидуализирующие и классифицирующие семантические элементы. Категориальные и энциклопедические семантические элементы.
Принципы выделения элементарных синтагматических семантических отношений. Ориентированные и неориентированные семантические отношения.
Соотношение семантических сущностей и синтагматических семантических отношений в идеальной системе элементарных семантических единиц.
Тема 14. Язык формальных толкований лингвистических сущностей.
Язык формальных толкований (ЯФТ) как средство представления парадигматических и синтагматических аспектов лингвистической семантики при сущностном подходе к лингвистическому описанию.
Словарь языка формальных толкований. Средства записи референциальных индексов и энциклопедических семантических сущностей. Категориальные семантические сущности и их валентности. Определение синтагматических семантических отношений как производных семантических единиц-дериватов- категориальных семантических сущностей по соответствующим их валентностям. Парадигматические отношения включения и выводимости, определенные на множестве категориальных семантических сущностей и их дериватов. Основные категориальные семантические сущности языка формальных толкований. Сравнение их инвентаря с аналогичными инвентарями других семантических языков.
Коммуникативная организация элементарных синтагматических сочетаний семантических сущностей и отношений в формальном толковании. Понятие семантическо1 о коммуникативного режима такого сочетания. Три базовых коммуникативных режима: нексус, юнкция. реляция. Противопоставление нексуса и юнкции в естественно-языковом синтаксисе. «Синтаксические» лексические функции как естественно-язы-ковой аналог режима реляции. Возможность рекурсивного комбинирования базовых коммуникативных режимов. Средства представления коммуникативных режимов в языке формальных толкований.
Понятие правильной семантической формулы и ее формальное определение. Механизмы наследования валентностей семантических формул, основанные на отношениях членения («от части к целому»). Парадигматические отношения между семантическими формулами: равнозначность, включение, выводимость, юнктивная деривация. Наследование свойств семантических формул на основе этих отношений.
Тема 15. Возможности использования языка формальных толкований для описания семантики в связи с задачами автоматического перевода.
Словарные и контекстуальные толкования языковых сущностей. Проблема омонимии и полисемии в формализованном описании лексики.
Толкования и семантическое представление текста.
Толкования и языковая парадигматика. Отношения синонимии. конверсности. семантической близости, логического следования. Понятия родо-видовых и вапентностных лексико-семантических классов. Правила выведения признаков тех и других классов из толкований языковых сущностей.
Толкования и "семантическая грамматика». Наследование парадигматических и валентностных свойств языковых сущностей но семантическим основаниям. Основные типы грамматических сведений в словарных статьях категориальных семантических сущностей. Семантические требования к заполнению валентностей как один из видов этих сведений. Примеры толкований и семантических требований к валентностям конкретных лексических единиц.
Использование языка формальных толкований в сложных случаях структурного анализа, восстановления эллипсиса, перефразирования. Проблема контекстного валентностного наследования и связанного с ним семантического согласования «разноуровневых» актантов в предикатно-актантных конструкциях. Примеры описаний соответствующих явлений средствами рассматриваемого языка.
Семантические и прагматические явления, представляющие трудности для описания в терминах языка формальных толкований. Возможности дополнения этого языка процедурными средствами.
Литература
Апресян Ю.Д. и др. Лингвистическое обеспечение системы ЭТАП-2. М.: Наука. 1989 (к теме 1); с. 43-45 (к теме 4): с. 40-59. 224-235 (к теме 8); с. 266-275 (к теме 11): с. 29-33 (к теме 12).
Апресян Ю.Д. Толкование лексических значений как проблема теоретической семантики // Изв. АН СССР, Сер. лит-ры и языка. 1969. Т. XXVIII. Вып. 1.С. 11-24 (ктеме 14).
Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М.: Наука. 1967(ктеме 14).
Арсентьева И.Г. От семантических свойств слова - к поверхностно-синтаксическим: постановка задачи и результат машинного эксперимента // Научно-техническая информация. Сер.2. 1976. N»9. С. 25-32 (к теме 15).
Богуславский И. Исследования по синтаксической семантике. М.: Наука. 1985 (ко всему курсу).
ВардулъИ.Ф. Основы описательной лингвистики. М., 1977 (к теме 2).
Вежбицка А. Семантические универсалии и «примитивное мышление». Толкование эмоциональных концептов // Вежбицка А. Язык. Культура. Познание. М.: Русские словари. 1997. С.291-319. 3288-341 (к теме 13).
Есперсен О. Философия грамматики. М.. 1957 (к теме 14).
Железняков М.И., Невлева Т.Н., Новицкая И.М.. Смирнова Л.Н.. Цей-тин Г.С.. Опыт построения модели типа «Текст -> действительность» с использованием ассоциативных сетей // Машинный фонд русского языка: предпроектные исследования. М., 1988. С. 140-167 (к теме 9).
Жолковский А.К.. Мельчук И.А.. Шаляпина З.М. Экспериментальный фрагмент англо-русского толково-комбинаторного словаря в процессе перевода. М.. 1971 (к теме 4).
Жолковский А.К.. Мельчук И.А. К построению действующей модели языка «Смыслс=>Текст» // Машинный перевод и прикладная лингвистика. Вып. U.M.. 1969. С.5-35 (к теме 5): с. 5-35 (к теме 13).
Жолковский А.К., МельчукИ.А. О семантическом синтезе// Проблемы кибернетики. Вып. 19. М.. 1967. С. 177-238 (ктеме 12): с. 177-238 (к теме 14).
ЗасоринаЛ.Н.. Верков В.П. Понятие валентности в языке // Вестник Ленинградского университета. Сер. истории, языка и литературы. Л.. 1961. Вып. 2. №8. С. 133-139(ктеме 5).
Канович М.И.. Шаляпина З.М. Аппарат R-отсылок как универсальное средство синтаксического синтеза (на опыте разработки системы русского синтеза RussLan) // Диалог 2006: Компьютерная лингвистика и интеллектуальные технологии. Труды Международной конференции. М.: Изд-во РГГУ. 2006. С. 207-213 (к теме 12).
Канович М.И.. Шаляпина З.М. Лингвистическая избыточность как фактор организации лексико-морфологической базы в модели русского словоизменительного синтеза // ДИАЛОГ'95: Труды Международного семинара по компьютерной лингвистике и ее приложениям. Казань. 1995. С. 133-139 (к теме 7).
Канович М.И., Шаляпина З.М. Русский морфологический и морфоло-го-синтаксический синтез по неполной и/или неточной входной информации // Русский язык как иностранный: лингвистические проблемы. М.: ИКАР. 1997. С. 137-147 (к теме 8).
Карцевский С. Об асимметричном дуализме лингвистического знака // Звегинцев В.А. История языкознания Х1Х-ХХ веков в очерках и извлечениях. Часть 2. М.. 1965. С. 85-90 (к теме 2).
Кацнельсон С.Д. О грамматической категории // Вестник Ленинградского университета. Сер. истории, языка и литературы. Л.. 1948, №2(к теме 5).
3. М. Шаляпина
Кибрик А,Е. Критерии определения направления синтаксической связи в синтагме // Структурно-математические методы моделирования языка. Часть 1. Киев. 1970. С. 60-61 (ктеме9^.
Кибрик А.Е. О соотношении понятий синтаксического подчинения с понятиями согласования, управления и примыкания // Проблемы теоретической и экспериментальной лингвистики. М.: МГУ. 1977. С. 161-179 (к теме 9).
КозинскийИ.Ш. Некоторые грамматические универсалии в подсистемах выражения субъектно-объектныхотношений. Дисс.... канд. филол. наук. М., 1979 (к теме 3).
Костыркин А.1С. Применение технологий ограничений в синтаксическом анализе предложения //ДИАЛОГ2000: Труды международного семинара по компьютерной лингвистике и ее приложениям. Т. 2. Прикладные проблемы. Протвино. 2000. С. 199-208 (к теме 5).
Кулагина О.С. Исследования по машинному переводу. М.: Наука. 1979 (к теме 4).
Лемб СМ. Стратификационная лингвистика как основа машинного перевода // Научно-техническая информация. 1964. № 10. С. 33-42 (к теме 1).
Леонтьева H.H.. Волковыская Е.В.. Копылова О.В.. Молчанова Т.Н.. Штернова O.A. Словарь энциклопедических функций и его роль в автоматическом индексировании // Научно-техническая информация. Сер. 2. 1978. № 7. С. 23-29 (к теме 12).
Леонтьева H.H. Автоматическое понимание текстов: системы, модели. ресурсы: Учеб. пособие для студ. лингв, фак. вузов. М.: Академия. 2006. 304 с (ко всему курсу).
Мартпемьянов /О.С. К описанию текста: язык валентно-юнктивных эмфазных отношений // Машинный перевод и прикладная лингвистика. Вып. 13. М.: МГПИИЯ им. М.Тореза. 1970(ктеме 14).
МарчукЮ.Н. Проблемы машинного перевода. М.: Наука. 1983. С. 106-109 (к теме 8).
Мельников Г.П. Системология и языковые аспекты кибернетики. М.. 1978 (к теме 3).
Мельчук И. А. Опыт теории лингвистических моделей иСмысл<=>Текст». М.: Наука. 1974. 314 с (ко всему курсу).
Мельчук И.А. Уровни представления языковых высказываний и общее строение модели «Смыслс=>Текст» // Актуальные проблемы лексикологии и словообразования. Новосибирск: НГУ. 1972 (к теме 1).
МикуличЛ.И.. ЧервоненкисА.Я. Специализированная диалоговая система // Вопросы разработки прикладных систем. Новосибирск. 1979. С. 113 -129 (к теме 3).
МодинаЛ.С.. Шаляпина З.М. Графико-морфологическая грамматика японского языка в действующей модели анализа японских письменных текстов // Языки Дальнего Востока. Юго-Восточной Азии и Западной Африки: Материалы III Мсжд. конф. М.: МГУ. ИСАА. СПб.: СПбГУ. 1995. С. 120-123 (к теме 7).
МодинаЛ.С., Шаляпина З.М. Лсксико-грамматическая классификация японских лингвистических сущностей и ее функции в моде-
ли японско-русского автоматического перевода ЯРАП // Языки Дальнего Востока. Юго-Восточной Азии и Западной Африки: Материалы IV Межд. конф. М.: МГУ. ИСАА. СПб.: СПбГУ. 1997 (к теме 12).
МодинаЛ.С.. Шаляпина З.М. Межъязыковые операции в модели япон-ско-русского автоматического перевода ЯРАП / / Электронные библиотеки и базы данных по истории Евразии в средние века. Вып. 7. М.: ИВ РАН. 1999. С. 172-231 (к теме 8).
МодинаЛ.С., ШаляпинаЗ.М. Принципы анализа японских текстов при моделировании японской лексико-морфологической системы // Диалог 1996: 'Груды международного семинара по компьютерной лингвистике и ее приложениям. М.. 1996. С. 169-174 (к теме 7).
МодинаЛ.С., Шаляпина З.М. Принципы организации лингвистических знаний в объектно-ориентированной модели лексико-мор-фологической системы японского языка // Диалог 1995: Труды Международного семинара по компьютерной лингвистике и ее приложениям. Казань. 1995. С. 198-205 (к теме 5): с. 198-205 (к теме 7).
НагаоМ., ЦудзииДз.. ИакамураДз. Машинный перевод с японского языка на английский //ТИИЭР. Труды Института инженеров по электротехнике и радиоэлектронике. 1986. Т. 74. N»7. С. 114-118 (к теме 15).
НариньяниА.С. Формальная модель: общая схема и выбор адекватных средств // Препринт N->107 ВЦ СО АН СССР. Сер. «Экспериментальная разработка формальной модели русского языка». Вып. 1. Новосибирск. 1978. 29 с (к теме 3).
Падучева Е.В. Некоторые проблемы моделирования соответствия между текстом и смыслом в языке // Известия Академии наук. Серия литера1уры и языка. 1975. №6. С. 548-559 (ктеме 1).
Падучева Е.В. О семантике синтаксиса. М.. 1974 (к теме 9).
Попов Э.В. Общение с ЭВМ на естественном языке. М.. 1982 (к теме 3).
Пумпянский А.Л. Информационная роль порядка слой в научной и технической литературе. М.: Наука. 1974 (к теме 4).
РевзинИ.И. Современная структурная лингвистика. Проблемы и методы. М.: Наука. 1977 (к теме 9).
СевбоИ.П. Графическое представление синтаксических структур и стилистическая диагностика. Киев: Наукова думка. 1981 (ктеме 9).
Соссюр Ф. де. Курс общей лингвистики // Соссюр Ф. де. Труды по языкознанию. М.: Прогресс. 1977. С. 31-273 (к теме 2).
ТанакаХ.. Мидзогути Ф. Система машинного перевода, учитывающая семантику//Дзёхо сери. 1985.Т.26./* 1.С. 1191-1196(ктеме 15).
Шаляпина З.М. Три функции языкового знака и проблемы их отражения в лингвистическом описании // Проблемы функциональной грамматики. М.: Наука. 1985. С. 103-120 (ктеме 2).
Шаляпина З.М. и др. Об англо-русском многоаспектном словаре с грамматическим обеспечением // Вопросы информационной теории и практики. Сб. № 27. М: Советское радио. 1975. С. 64-87 (ктеме 11).
Шаляпина З.М.. КановичМ.И., КостыркинА.В., МодинаЛ.С. Лексико-синтаксическая информация в словаре для автоматического перевода (В рамках сущностного подхода к лингвистическому1 описанию) // Словарь в современном мире . Материалы Третьей международной школы-семинара. Иваново. 2000. С. 117-121 (к теме 11).
ШаляпинаЗ.М.. КаноеичМ.И.. МодинаЛ.С. Экспериментальный комплекс ЯРАП как инструмент сопоставительных лингвистических исследований // Общее и восточное языкознание. Сб. науч. тр. М.: Современный писатель. 1999. С.64-79 (к теме 8).
Шаляпина З.М. Автоматический перевод как моделирование переводческой деятельности человека // Международный форум по информации и документации. 1980.Т.5. N«26. С. 16-20 (к теме 4).
Шаляпина З.М. Англо-русский многоаспектный автоматический словарь (АРМ АС) // Машинный переводи прикладная лингвистика. Вып. 17. М.: МГПИИЯ. 1974. С. 7-67 (к теме 11). Шаляпина З.М. Грамматика и сс соотношение со словарем при слово-центрическом подходе к языку (на опыте формализованного лингвистического описания) // Вопросы языкознания. 1991. №5. С. 42-54 (к теме 5).
Шаляпина З.М. К проблеме коммуникативной организации текста и ее отражения в семантической записи // Вычислительная лингвистика. М.: Наука. 1976. С. 53-80(ктеме 14).
Шаляпина З.М. К проблеме моделирования языковой компетенции и языковой деятельности человека в рамках общей модели языковой действительности // Референция и проблемы текстообразо-вания. М.. 1988. С. 214-232 (ко всему курсу).
Шаляпина З.М. Межфразовые связи как способ реализации лексических валентностей // Аспекты изучения текста. М.. 1981. С. 80-87 (к теме 10).
Шаляпина З.М. Многофункциональность аппарата лексических функций и некоторые возможности его применения и развития // Восток - Запад: Вторая международная конференция по модели «Смысл «Текст». М.: Языки слав, культуры, 2005. С.447-457 (ктеме 12).
Шаляпина З.М. О двух типах кореферентности валентностей в предикатно-актантных конструкциях // Типология конструкций с предикатными актантами. Л.: Наука. 1985. С. 46-50 (ктеме 15).
Шаляпина З.М. О морфолого-синтаксическом статусе некоторых японских грамматических единиц (в связи с общими проблемами разграничения морфологии и синтаксиса в естественном языке // Актуальные проблемы японского языкознания. М.: Наука. 1986. С.69-103 (ктеме 6).
Шаляпина З.М. Об одном возможном подходе к задаче анализа японских текстов при их автоматической обработке // Проблемы компьютерной лингвистики. Минск:. 1997. С. 1 10-144 (к теме 8): с. 110-144 (ктеме 12).
Шаляпина З.М. Об одном подходе к выделению фразеологических
единиц в связи с задачами автоматической обработки текстов // Фразеография в машинном фонде русского языка. М.: Наука. 1990. С. 188-195 (к теме 6).
Шаляпина З.М. Об одном способе формализации понятия лингвистической нормативности в целях автоматической обработки текстов // Формальное представление лингвистической информации. Новосибирск. 1982. С. 20-37 (ктеме 10).
Шаляпина З.М. Об одном формализме для записи толкований слов и словосочетаний // Обработка текста и когнитивные технологии. Вып. 1. М.. Пущино. 1997. С. 73-110 (ктеме 14).
Шаляпина З.М. Оппозиция «часть-целое» и сущностный подход к моделированию языковой компетенции // Роман Якобсон: тексты, документы, ис следования. М.: РГГУ. 1999. С. 541-551 (ко всему курсу).
Шаляпина З.М. Семантико-синтаксический анализ в системе англорусского автоматического перевода (АРЛП). М.. 1974. 58 с. (Публ. проблемной группы по экспериментальной и прикладной лингвистике. вып. 47) (к теме 12).
Шаляпина З.М. Семантические элементы как основа лексикографического описания: общие принципы и формальный аппарат // Машинный переводи прикладная лингвистика. Вып. 15. М.. 1972. С. 54-98 (к теме 13).
Шаляпина З.М. Синтаксис и семантика в системе англо-русского автоматического перевода АРЛП // Актуальные вопросы практической реализации систем автоматического перевода. Часть 1.М.:МГУ. 1982. С. 184-204 (ктеме 9).
Шаляпина З.М. Словарь как единая форма организации формализованного лингвистического описания // Proceedings of the Fourteenth International Congress of Linguists. Berlin: Akademie-Verlag. 1991. P. 1244-1247 (к теме 5).
Шаляпина З.М. Текст как объект автоматического перевода // Текст и перевод. М.: Наука, 1988. С. 113-129 (к теме 4).
Шаляпина З.М. Формальный язык для записи толкований слов и словосочетаний // Проблемы кибернетики. Вып. 36. М.: 1979. С. 247-278 (к теме 14).
Allerton D.J. Valency and the English Verb. L.: Academic Press. 1982 (к теме 10|
BeverT.G.. KatzJ.J.. LangedoenD.T. An integrated theoiy of linguistic ability. Hassocs (Sx.). 1977 (к теме 1).
Chomsky N. Aspects of the theory of syntax. N.Y.. 1965 (к теме 2).
Danes F. On Linguistic Strata (Levels) / /Travaux linguistiques de Prague. 4. Prague. 1971. P. 127-143 (к теме 1 ).
Helbig G. Zum Status derValenzund dcrsemantischen Kasus // Deutsch als Frcmdsprache. Leipzig. 1979. H.2. S.65-78 (к теме 10|
Helwtg P. Dependency unification grammar // Proceedings of COLING
1986. Bonn. 1986. P. 195-198 (к теме 10). Chauché J. Les systèmes ATEF et G ETA // T. A. Informations. 1975. №2. P.21-39 (к теме 8).
Jcippinen N.. l^ehtola A.. Valkonen K. Functional Structures for Parsing
Dependency Constraints // Proceedings of COLING 1986. Bonn. 1986. P. 461-463 (к теме 9).
Ruzicka R. Three aspects of valence // Valence, semantic case and grammatical relations. Amsterdam: John Benjamins. 1978. P. 47-53 (к теме 10).
Sakamoto Y.. Ishikawa Т.. Satoh M. Concept and Structure of Semantic Markers for Machine Translation in Mu-Project // Proceedings of COLING 1986. P. 13-19 (к теме 14).
Schmidt P. Valency Theory in a Strat ificational MT-System // Proceedings of COLING 1986. Bonn. 1986. P. 307-312 (к теме 10).
Sgall P. Zur Frage der Ebenenen ini Sprachsystem // Travaux linguis-tiquesde Prague. 1. Prague. 1966. P. 95-106 (к теме 1).
Sgall P. Cases in a stratificational description // Prague Studies in Mathematical Linguistics. 3. Praha. 1972. P. 201-211 (к теме 13).
Somers H.L. On the validity of the complement-adjunct distinction in valency grammar // Linguistics. 1984. Vol. 22. №4. P.507-530 (к теме 10).
Somers H.L The need for MT-oricnted versions of Case and Valency in MT// Proceedings of COLING 1986. Bonn. 1986. P. 118-123 (к теме 10).
Starosta S.. Nomura H. Lexicase Parsing: A Lexicon-driven Approach to Syntactic Analysis 11 Proceedings of COLING 1986. Bonn. 1986. P. 127-132 (к теме 5).
Trnka В. On the linguistic sign and the multilevel organization of language // Travaux linguistiques de Prague. 1. Lftcole de Prague d'au-jourd'hui. Prague: Academia. 1966. P.33-40 (к теме 1).
VaterH. On the possibility of distinguishing between complements and adjuncts //Valence, semantic case and grammatical relations. Amsterdam: John Benjamins. 1978. P. 21-45(ктеме 10).
WierzbickaA. Semantic primitives // Linguistische Forschungen. Band 22. Frankfurt. 1972. 235 p (к теме 13).
Yokoyama Sh.. Hanakata K. Conceptual Lexicon Using an Object - Oriented Language 11 Proceedings of COLING 1986. Bonn. 1986. P. 226-228 (к теме 11).
Zemik U.. DyerM. Disambiguation and Language Acquisition through the Phrasal Lexicon // Proceedings of COLING 1986. Bonn. 1986. P. 247-252 (к теме 5).