УДК 81”374.73
ЛЕСНИКОВ Сергей Владимирович, кандидат филологических наук, доцент кафедры математики и информатики Коряжемского филиала Поморского государственного университета имени М.В. Ломоносова, соискатель кафедры русского языка Томского государственного университета. Автор 183 научных публикаций, в т.ч. 7 монографий, 52 учебников и учебно-методических пособий
ФРЕЙМОВОЕ КОНСТРУИРОВАНИЕ ТЕЗАУРУСА МЕТАЯЗЫКА ЛИНГВИСТИКИ*
В статье рассматривается фреймовый подход конструирования гипертекстового информационно-поискового тезауруса метаязыка лингвистики. Предполагается, что словарная статья тезауруса метаязыка лингвистики будет давать исчерпывающую информацию о термине языкознания с принятой в данном словаре-тезаурусе степенью детализации и о его понятийных, гипертекстовых связях с другими терминами и с их лексико-семантическими вариантами.
Теория концептов, фрейм, семантическая сеть, гипертекст, гизаурус, тезаурус, словарь
По мнению профессора Массачусетского технологического института, специалиста в области представления данных, искусственного интеллекта и робототехнике Марвина Минского, «основные структурные элементы, образующие фундамент для развертывания процессов восприятия, хранения информации, мышления и разработки языковых форм общения, должны быть более крупными и иметь более четкую структуру; их фактическое и процедуральное содержание следует более тесно увязывать друг с другом с тем, чтобы получить возможность объяснить феномен
силы и “быстродействия” человеческого мышления»1. Именно поэтому Минский в своей работе делает попытку создать единую и стройную теорию, отправным моментом для которой «служит тот факт, что человек, пытаясь познать новую для себя ситуацию или по-новому взглянуть на уже привычные вещи, выбирает из своей памяти некоторую структуру данных (образ), называемую нами фреймом, с таким расчетом, чтобы путем изменения в ней отдельных деталей сделать ее пригодной для понимания более широкого класса явлений или процессов.
© Лесников С.В., 2011
* Работа выполнена при поддержке исследовательского гранта Российского фонда фундаментальных исследований по инициативному проекту № 11-07-00733 «Гипертекстовый информационно-поисковый тезауру “Метаязык науки” (структура; математическое, лингвистическое и программное обеспечения; разделы лингвистика, математика, экономика)».
Фрейм является структурой данных для представления стереотипной ситуации. С каждым фреймом ассоциирована информация разных видов. Одна ее часть указывает, каким образом следует использовать данный фрейм, другая -что предположительно может повлечь за собой его выполнение, третья - что следует предпринять, если эти ожидания не подтвердятся.
Фрейм можно представлять себе в виде сети, состоящей из узлов и связей между ними. «Верхние уровни» фрейма четко определены, поскольку образованы такими понятиями, которые всегда справедливы по отношению к предполагаемой ситуации. На более низких уровнях имеется много особых вершин-терминалов, или «ячеек», которые должны быть заполнены характерными примерами или данными.
Каждым терминалом могут устанавливаться условия, которым должны удовлетворять его задания. Простые условия определяются маркерами, например в виде требования, чтобы заданием терминала был какой-либо субъект или предмет подходящих размеров или указатель на субфрейм определенного типа. Более сложными условиями задаются отношения между понятиями, включенными в различные терминальные вершины.
Группы семантически близких друг к другу фреймов объединены в систему фреймов. Результаты существенных действий представляются в виде трансформаций между фреймами системы. Это дает возможность моделировать такие понятия, как внимание и ценность информации, сделать более экономичными некоторые типы вычислений, а также показать эффективность использования фреймов в системах ИИ2.
По мнению Т. Винограда и Ф. Флореса, «в определенном отношении вычислительные системы, основанные на фреймах, приближаются к значению со стороны герменевтики. Они сосредоточивают свои усилия не на вопросе «Каким образом программа способна точно отражать ситуацию?», а, скорее, на вопросе «Каким образом предзнание системы (совокупность фреймов) влияет на ее интерпретацию ситуации?». Значение предложения или сцены скрыто во взаимодействии между структурой предложения и структурами, уже имеющимися в машине.
Широкий и живой интерес к фреймам - это своего рода реакция на распространенное, но не выраженное в четкой форме осознание неадекватности подхода с точки зрения решения проблемы, заключение: «однако и данный подход не решает главных трудностей»3.
Фрейм можно определить как поименованную структуру, которая состоит из слотов. В свою очередь, слот - это конструкция из имени и значения слота. Значение слота - шпация.
Достоинством фреймового подхода является то, что слоты фрейма могут группироваться как самостоятельные структурные единицы (в частности, в качестве шпаций могут указываться имена других фреймов), а поэтому возможна их обработка как единого целого, т.е. как очередной фрейм и т.д. Таким образом, механизм организации ссылок, а теперь мы скажем ГИПЕРТЕКСТОВЫХ ссылок, позволяет создавать в интерактивном режиме на современных компьютерах из отдельных фреймов сложные сетевые структуры и системы именно благодаря установленным связям между понятиями, объектами и событиями. Приведем пример фрейма СЛОВАРЬ. фрейм: СЛОВАРЬ
название: ... автор(ы): ... редактор(ы): ... издательство: ... структура: ... словник: ВОКАБУЛЫ Слоты «название», «автор(ы)», «редакто-р(ы)», «издательство», «структура», как правило, константы. Например, в случае многотомных и издаваемых большими коллективами в течение многих лет, естественно, это не так. Слот «словник» имеет ссылку на фрейм ВОКАБУЛЫ, который может выглядеть так: фрейм: ВОКАБУЛЫ заглавное слово: .варианты: . определение: ДЕФИНИЦИЯ пример: ИЛЛЮСТРАЦИЯ ...
Здесь, в свою очередь, слоты «определение» и «пример» ссылаются на фреймы ДЕФИНИЦИЯ и ИЛЛЮСТРАЦИЯ. Так можно уточнять и определять фрейм СЛОВАРЬ до тех пор, пока в итоге не получится формальная система, позволяющая не только представить, но и фактически в автоматизированном, интерактивном варианте сконструировать гипертекстовый словарь. «Словарное определение мож-
но приравнять к сообщению (в других терминах это описание или единица), тогда данное представляет собой входное слово, комментарий - правую часть толкового словаря, слотом является каждый релевантный (т.е. не нулевой и не избыточный) семантический множитель, а фасет зафиксирован как раз нулевыми и избыточными множителями»4.
В работах по искусственному интеллекту, представлению и инженерии знаний5 под фреймом понимается структура данных (образ), связанных с концептуальными объектами в памяти и необходимых для представления некоторой типической, стереотипной ситуации, или основная единица представления знаний. Наряду с термином «фрейм» также употребляются термины «сценарий», «скрипт», «ситуационная модель», «когнитивная модель», «сцена-прототип», «схема».
Сценарный фрейм представляет типовую структуру некоторого события/ситуации, объединяющую характерные признаки этого события/ситуации или структуру данных относительно некоторой темы; он непосредственно связан с ситуацией6. Действия, предусмотренные сценарием, выполняются в зависимости от обстоятельств. Сценарный фрейм обычно допускает два хода: обычная последовательность действий или ее нарушение, в результате чего возможен выход из сцены/ситуации.
Иерархическая структура фрейма состоит из терминальных узлов-слотов (терминалов) и нетерминальных узлов, содержащих конкретные сведения и информацию, относящиеся к тому концептуальному объекту, который описывает фрейм, а также данные, необходимые для процедур вывода. Терминал представляет и описывает предмет, его специфические черты, а также информацию об отношениях между объектами, о способе использования фрейма, о следующем действии или о действии, которое нужно выполнить, если предположение не оправдалось. Различные фреймы одной системы описывают один объект с разных углов зрения.
Процесс сопоставления при определении правильности выбора фрейма проходит в три шага: 1) выбор базового фрейма с помощью предположения и интуиции (если выбор был
сделан правильно, то это единственный шаг); 2) поиск информации для присваивания значения слоту; 3) при неуспехе второго шага управление передается другому фрейму системы.
Признаки фрейма устанавливаются на основе договоренности между коммуникантами, для которых они будут информативно значимыми. Понятие структурного фрейма текста совпадает с понятиями архетипа/ «прообраза»7. В прототип «могут входить вещи, которые типичны (но не всегда имеют место) или релевантны лишь в нескольких контекстах»8. Прототип текста представляет ментальный конструкт типичного представителя категории или класса объектов, являясь моделью структуры, архитектоники и композиции какого-либо типа текстов, выделяемой на основе всего корпуса текстов индуктивно, эмпирически-аналитически. Конкретная реализация текста будет текстовым инвариантом прототипа (архетипа, стереотипа, структурного фрейма текста), допускающего нормативные отклонения. Направленность семантических особенностей фрейма связана с целевой функцией текста.
Представление текста как иерархии фреймов отражает закономерности текстопострое-ния и распределения информации. Анализ фреймов дает возможность построить иерархическую систему семантических взаимоотношений внутри текста. Для фреймового представления семантики текста необходимо определить операции преобразования, изменяющих его содержание, а при сохранении формы - определить операции свертки.
Фрейм-ситуация формируется представлениями о прототипической ситуации и ее элементах, имеющих фиксированные роли и положения. Семантические модели управления фреймом затрагивают определенные требования к контексту, непосредственному семантическому и синтаксическому окружению языковой единицы. Контекстуальная норма является своего рода стереотипом. Ожидания определяются знаниями о стандартном контексте и ситуации. При заполнении переменных учитывается ситуационный контекст, что позволяет говорить о контекстно-обусловленных стратегиях заполнения базового фрейма, т.е. идет приписывание моделей управления конкретным лексическим единицам.
Недостаточная конкретизация контекста приводит к вводу «проясняющих» деталей.
Каждый фрейм-ситуация представляет собой более или менее полный список понятий, позволяющий адекватно действовать в данной ситуации. В определении соответствия/несоответствия элемента текста какому-либо фрейму, выбранному в качестве ограничителя сочетаемости элементов, участвуют следующие условия: а) совместимость понятия и фрейма в индивидуальной концептуальной системе индивида; б) категориально предопределенная семантическая сочетаемость; в) определяющий признак: собственно признак для свойств и характеристик элемента, ограничивающий признак, оценивающий признак; г) типизация процессов, действий и отношений по тождеству или сходству моделей управления семантической структурой фрейма.
Данные условия касаются признаков фрейма и семантических условий заполнения его узлов, регламентирующих семантическую сочетаемость. Приписывание слову значения, конкретного семантического и синтаксического управления, обеспечивающего воспроизводимость и эффективность конкретного акта коммуникации, позволяет говорить о ролевой семантике9.
В гипертекстовом информационно-поисковом тезаурусе метаязыка лингвистики (в формате компьютерного, гипертекстового тезауруса /ГИЗАУРУСА/ - базе данных с перекрестными гипертекстовыми ссылками) дается определение (дефиниция, иллюстрация, интерпретация, объяснение, понятие, пояснение, разъяснение, толкование, трактовка, формулировка, цитата, экскурс и/или эксцерпция) ключевых понятий-терминов, относящихся к сфере определенной науки и ряду смежных дисциплин, которые в той или иной мере связаны с проблемами данной науки. Конструирование тезауруса обусловлено необходимостью единства в терминологии - нередко ученые одно и то же явление называют по-разному, с другой стороны, один и тот же термин бывает полисемичен даже в рамках одной научной области. Кроме этого, при анализе уже опубликованных терминологических словарей определенной науки бросается в глаза лакунарность состава словников и некая тенденциозность подачи на-
учных материалов авторами-составителями. Фактически речь идет о составлении метаязыка науки - особого языка, объектом которого является содержание и выражение другого языка, т.е. в нашем случае метаязык - это язык второго порядка как специальная семиологичес-кая система, употребляемая тогда, когда надо говорить о естественном (или искусственном) языке же, выступающем в качестве «языка-объекта». При этом можно отдельно выделить в метаязыке следующее: 1) собственно термины (слова, которые или совсем не употребляются в языке-объекте, либо приобретают, после заимствования из языка-объекта, особое значение), 2) сочетания слов, которые характеризуют собственно метаязык определенной науки в его полном виде (напр., составные термины), 3) определенный социально-предметный аспект (напр., когда метаречь отражает специфику эпохи, того или иного научного направления, школы).
Тезаурус метаязыка лингвистики конструируется в виде следующего гипертекстового фрейма и пяти базовых слотов: верхний
левый центральный правый
нижний
Верхний - название тезауруса и базовые кнопки дружественного интерфейса для быстрого, оперативного переключения слотов (в свою очередь других фреймов), например переход на стартовую, главную страницу, вызов помощи, возврат назад и переход по некоторым базовым конструкциям (ключевым концептам: знак, слово, текст, язык, метаязык, приложения). Ссылки из верхнего слота активируют левый слот, т.е. использование гипертекстовых ссылок в верхнем слоте приводит к изменению содержимого левого слота посредством загрузки в этот левый слот соответствующего содержания ассоциированного фрейма.
Левый слот играет роль глобального или частного оглавления (содержания). Активирование ссылок в левом слоте приводит к изменению центрального слота.
В правом слоте помещен латинский (английский) алфавит, для вызова соответствующих индексов словарных статей тезауруса побук-венно. Нижний - соответственно русский алфа-
вит. Из правого и левого слотов активизируется центральный слот.
В центральном слоте в основном и происходит выдача контента.
Разумеется, имеется возможность открыть по любой ссылке новый фрейм (окно) посредством активизации гиперссылки правой клавишей манипулятора «мышь».
При этом необходимо подчеркнуть, что лишь эти пять слотов размечаются вручную. Все словарные статьи тезауруса хранятся по-файлово, а как алфавитные (и русский и английский) пофайловые, так и внутренние перекрестные (по содержимому собственно словарных
статей) гиперссылки генерируются при помощи программного комплекса на основе предварительно препарированных, размеченных исходных словарных материалов.
Процесс использования гипертекстового тезауруса метаязыка лингвистики в целом напоминает обычную работу в системе Интернет, но в локальном варианте на персональном компьютере. В перспективе предполагается, что после необходимой апробации в локальном варианте в интерактивном варианте сконструированный тезаурус будет доступен и в Интернете, например по адресам http://lsw.ru, http:// ЛСВ.РФ, http://МФРЯ.РФ.
Примечания
1 Минский М. Фреймы для представления: знаний: пер. с англ. М., 1979. С. 6.
2 Там же. С. 7-8 (ИИ - искусственный интеллект).
3 Виноград Т., Флорес Ф. О понимании компьютеров и познания // Язык и интеллект. М., 1996. С. 225.
4 КарауловЮ.Н. Лингвистическое конструирование и тезаурус литературного языка. М., 1981. С. 345.
5 Представление и использование знания /Х. Уэно, Т. Кояма, Т. Окамото и др. М., 1989; ЧарнякЮ. Умозаключения и знания // Новое в зарубежной лингвистике. Вып. XII. М., 1983. Ч. I. С. 171-207; Ч. II. С. 272-317. Шемакин Ю.И. Введением в информатику. М., 1985; ШингареваЕ.А. Семиотические основы лингвистической информатики: учеб. пособие. Л., 1987; ШингареваЕ.В. О двух направлениях представления семантики текста (тезаурус и фрейм) // НТИ. Сер. 2. Информ. процессы и системы. 1982. № 8. С. 1-8; ШингареваЕ.В., Гончаренко В.В. Фреймы для распознавания смысла текста. Кишинев, 1984.
6Минский М. Вычисления и автоматы. М., 1971; Его же. Фреймы для представления знаний // Психология машинного зрения. М., 1978. С. 249-338; Минский М., Пейперт С. Персептроны. М., 1970; Романов А.А. Системный анализ регулятивных средств диалогического общения. М., 1988.
7 Шрейдер Ю.А. Информация и метаинформация // НТИ. Сер. 2. Информ. процессы и системы. 1982. № 4. С. 3-10.
8 Виноград Т., Флорес Ф. Указ. соч. С. 224.
9Масленникова Е. Фреймовое представление семантики текста // Лингвистический вестник. Вып. 2. Ижевск, 2000. С. 114-124. URL: http://libelli.narod.ru/sonnet66/Russian/maslennikova/frame.html.
Lesnikov Sergey
FRAME CONSTRUCTION OF THESAURUS OF LINGUISTICS METALANGUAGE
Frame approach of constructing a hypertext information retrieval thesaurus of linguistics metalanguage is considered in the article. The dictionary entry of the linguistics metalanguage thesaurus is assumed to give a detailed information about the term of linguistics with the detalization extent adopted in the given dictionary and about its conceptual, hypertext links to other terms and their lexical-semantic variants.
Контактная информация: e-mail: [email protected]; [email protected];
[email protected]; [email protected]; http://lsw.ru http://ЛСВ.РФ
Рецензент - Сидорова Т.А., доктор филологических наук, доцент кафедры русского языка Поморского государственного университета имени М.В. Ломоносова