Научная статья на тему 'Моделирование тезауруса метаязыка лингвистики на базе гипертекстовых фреймов'

Моделирование тезауруса метаязыка лингвистики на базе гипертекстовых фреймов Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
271
88
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕОРИЯ КОНЦЕПТОВ / ФРЕЙМ / СЕМАНТИЧЕСКАЯ СЕТЬ / ГИПЕРТЕКСТ / ГИЗАУРУС / ТЕЗАУРУС / СЛОВАРЬ / CONCEPT THEORY / FRAME / HYPERTEXT / METALANGUAGE / GIZAURUS / THESAURUS / DICTIONARY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лесников Сергей Владимирович

В статье рассматриваются гипертекстовые фреймы как основа для моделирования гипертекстового информационно-поискового тезауруса метаязыка лингвистики. Предполается, что словарная статья тезауруса метаязыка лингвистики будет давать исчерпывающую информацию о термине языкознания с принятой в данном словаре-тезаурусе степенью детализации и о его понятийных, гипертекстовых связях с другими терминами и с их лексико-семантическими вариантами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Modeling the Metalanguage Thesaurus of Linguistics-Based Hypertext Frames

The author considers framing approach to constructing a hypertext information retrieval thesaurus of the metalanguage of linguistics. It is assumed that the dictionary entry of the metalanguage thesaurus will give detailed information about a linguistic term with reference to its conceptual, hypertext links with other terms and their lexical-semantic variants.

Текст научной работы на тему «Моделирование тезауруса метаязыка лингвистики на базе гипертекстовых фреймов»

Лингвистическое моделирование. Когнитивные и лингвокультурологические аспекты характеристики языкового материала

УДК 81'374.73

С. В. Лесников

МОДЕЛИРОВАНИЕ ТЕЗАУРУСА МЕТАЯЗЫКА ЛИНГВИСТИКИ НА БАЗЕ ГИПЕРТЕКСТОВЫХ ФРЕЙМОВ*

В статье рассматриваются гипертекстовые фреймы как основа для моделирования гипертекстового информационно-поискового тезауруса метаязыка лингвистики. Предполается, что словарная статья тезауруса метаязыка лингвистики будет давать исчерпывающую информацию о термине языкознания с принятой в данном словаре-тезаурусе степенью детализации и о его понятийных, гипертекстовых связях с другими терминами и с их лексико-се-мантическими вариантами.

The author considers framing approach to constructing a hypertext information retrieval thesaurus of the metalanguage of linguistics. It is assumed that the dictionary entry of the metalanguage thesaurus will give detailed information about a linguistic term with reference to its conceptual, hypertext links with other terms and their lexical-semantic variants.

Ключевые слова: теория концептов, фрейм, семантическая сеть, гипертекст, гизаурус, тезаурус, словарь.

Keywords: concept theory, frame, hypertext, metalanguage, gizaurus, thesaurus, dictionary.

Тезаурус метаязыка лингвистики конструируется в виде следующего гипертекстового фрейма и пяти базовых слотов:

верхний

левый центральный правый

нижний

Верхний - название тезауруса и базовые кнопки дружественного интерфейса для быстрого, оперативного переключения слотов (в свою очередь других фреймов), напр., переход на стартовую, главную страницу, вызов помощи, возврат назад и переход по некоторым базовым конст-

* Публикуется при поддержке Российского фонда фундаментальных исследований по инициативному проекту № 11-07-00733 «Гипертекстовый информационно-поисковый тезаурус "Метаязык науки" (структура; математическое, лингвистическое и программное обеспечение; разделы лингвистика, математика, экономика)» (научный руководитель С. В. Лесников).

© Лесников С. В., 2011

рукциям (ключевым концептам: знак, слово, текст, язык, метаязык, приложения). Ссылки из верхнего слота активируют левый слот, т. е. использование гипертекстовых ссылок в верхнем слоте приводит к изменению содержимого левого слота посредством загрузки в этом левый слот соответствующего содержания ассоциированного фрейма.

Левый слот играет роль глобального или частного оглавления (содержания). Активирование ссылок в левом слоте приводит к изменению центрального слота.

В правом слоте помещен латинский (английский) алфавит, для вызова соответствующих индексов словарных статей тезауруса побуквенно. Нижний - соответственно русский алфавит. Из правого и левого слотов активизируется центральный слот.

В центральном слоте в основном и происходит выдача контента.

Разумеется, имеется возможность открыть по любой ссылке новый фрейм (окно) посредством активизации гиперссылки правой клавишей манипулятора «мышь».

При этом необходимо подчеркнуть, что лишь эти пять слотов размечаются вручную. Все словарные статьи тезауруса хранятся пофайлово, а как алфавитные (и русский, и английский) по-файловые, так и внутренние перекрестные (по содержимому собственно словарных статей) гиперссылки генерируются при помощи программного комплекса на основе предварительно препарированных, размеченных исходных словарных материалов.

По мнению профессора Массачусетского технологического института, специалиста в области представления данных, искусственного интеллекта и робототехники Марвина Минского, «основные структурные элементы, образующие фундамент для развертывания процессов восприятия, хранения информации, мышления и разработки языковых форм общения, должны быть более крупными и иметь более четкую структуру; их фактическое и процедуральное содержание следует более тесно увязывать друг с другом с тем, чтобы получить возможность объяснить феномен силы и "быстродействия" человеческого мышления» [1]. И именно поэтому Минский в своей работе делает попытку создать единую и стройную теорию, отправным моментом для которой «служит тот факт, что человек, пытаясь познать новую для себя ситуацию или по-новому взгля-

нуть на уже привычные вещи, выбирает из своей памяти некоторую структуру данных (образ), называемую нами фреймом, с таким расчетом, чтобы путем изменения в ней отдельных деталей сделать ее пригодной для понимания более широкого класса явлений или процессов.

Фрейм является структурой данных для представления стереотипной ситуации. С каждым фреймом ассоциирована информация разных видов. Одна ее часть указывает, каким образом следует использовать данный фрейм, другая -что предположительно может повлечь за собой его выполнение, третья - что следует предпринять, если эти ожидания не подтвердятся.

Фрейм можно представлять себе в виде сети, состоящей из узлов и связей между ними. "Верхние уровни" фрейма четко определены, поскольку образованы такими понятиями, которые всегда справедливы по отношению к предполагаемой ситуации. На более низких уровнях имеется много особых вершин-терминалов или "ячеек", которые должны быть заполнены характерными примерами или данными.

Каждым терминалом могут устанавливаться условия, которым должны удовлетворять его задания. Простые условия определяются маркерами, напр., в виде требования, чтобы заданием терминала был какой-либо субъект, или предмет подходящих размеров, или указатель на субфрейм определенного типа. Более сложными условиями задаются отношения между понятиями, включенными в различные терминальные вершины.

Группы семантически близких друг к другу фреймов объединены в систему фреймов. Результаты существенных действий представляются в виде трансформаций между фреймами системы. Это дает возможность моделировать такие понятия, как внимание и ценность информации, сделать более экономичными некоторые типы вычислений, а также показать эффективность использования фреймов в системах ИИ» [2].

По мнению Т. Винограда и Ф. Флореса, «в определенном отношении вычислительные системы, основанные на фреймах, приближаются к значению со стороны герменевтики. Они сосредоточивают свои усилия не на вопросе "Каким образом программа способна точно отражать ситуацию?", а скорее на вопросе "Каким образом предзнание системы (совокупность фреймов) влияет на ее интерпретацию ситуации?". Значение предложения или сцены скрыто во взаимодействии между структурой предложения и структурами, уже имеющимися в машине.

Широкий и живой интерес к фреймам - это своего рода реакция на распространенное, но не выраженное в четкой форме осознание неадекватности подхода с точки зрения решения про-

блемы», при этом заключая: «однако и данный подход не решает главных трудностей» [3].

Фрейм можно определить как поименованную структуру, которая состоит из слотов. В свою очередь, слот - это конструкция из имени и значения слота. Значение слота - шпация.

Достоинством фреймового подхода является то, что слоты фрейма могут группироваться как самостоятельные структурные единицы (в частности, в качестве шпаций могут указываться имена других фреймов), а поэтому возможна их обработка как единого целого, т. е. как очередной фрейм и т. д. Таким образом, механизм организации ссылок, а теперь мы скажем ГИПЕРТЕКСТОВЫХ ссылок, позволяет создавать в интерактивном режиме на современных компьютерах из отдельных фреймов сложные сетевые структуры и системы именно благодаря установленным связям между понятиями, объектами и событиями. Приведем пример фрейма СЛОВАРЬ. фрейм: СЛОВАРЬ

название: ... автор(ы): ... редактор(ы): ... издательство: ... структура: ... словник: ВОКАБУЛЫ

Слоты «название», «автор(ы)», «редактор(ы)», «издательство», «структура», как правило, константы. Напр., в случае многотомных и издаваемых большими коллективами в течение многих лет, естественно, это не так. Слот «словник» имеет ссылку на фрейм ВОКАБУЛЫ, который может выглядеть так: фрейм: ВОКАБУЛЫ заглавное слово: . варианты: . определение: ДЕФИНИЦИЯ пример: ИЛЛЮСТРАЦИЯ ... Здесь, в свою очередь, слоты «определение» и «пример» ссылаются на фреймы ДЕФИНИЦИЯ и ИЛЛЮСТРАЦИЯ. И так дальше можно уточнять и определять фрейм СЛОВАРЬ до тех пор, пока в итоге не получится формальная система, позволяющая не только представить, но и фактически в автоматизированном, интерактивном варианте сконструировать гипертекстовый словарь. «Словарное определение можно приравнять к сообщению (в других терминах это описание или единица), тогда данное представляет собой входное слово, комментарий - правую часть толкового словаря, слотом является каждый релевантный (т. е. не нулевой и не избыточный) семантический множитель, а фасет зафиксирован как раз нулевыми и избыточными множителями» [4].

В работах по искусственному интеллекту, представлению и инженерии знаний [5] под фреймом понимается структура данных (образ), связанных с концептуальными объектами в памяти и необходимых для представления некоторой типической, стереотипной ситуации, или основная едини-

ца представления знаний. Наряду с термином «фрейм» также употребляются термины «сценарий», «скрипт», «ситуационная модель», «когнитивная модель», «сцена-прототип», «схема».

Сценарный фрейм представляет типовую структуру некоторого события/ситуации, объединяющую характерные признаки этого события/ ситуации, или структуру данных относительно некоторой темы; он непосредственно связан с ситуацией [6]. Действия, предусмотренные сценарием, выполняются в зависимости от обстоятельств. Сценарный фрейм обычно допускает два хода: обычная последовательность действий или ее нарушение, в результате чего возможен выход из сцены/ситуации.

Иерархическая структура фрейма состоит из терминальных узлов-слотов (терминалов) и нетерминальных узлов, содержащих конкретные сведения и информацию, относящиеся к тому концептуальному объекту, который описывает фрейм, а также данные, необходимые для процедур вывода. Терминал представляет и описывает предмет, его специфические черты, а также информацию об отношениях между объектами, о способе использования фрейма, о следующем действии или о действии, которое нужно выполнить, если предположение не оправдалось. Различные фреймы одной системы описывают один объект с разных углов зрения.

Процесс сопоставления при определении правильности выбора фрейма подразумевает три шага: 1) выбор базового фрейма с помощью предположения и интуиции (если выбор был сделан правильно, то это единственный шаг); 2) поиск информации для присваивания значения слоту; 3) при неуспехе второго шага управление передается другому фрейму системы.

Признаки фрейма устанавливаются на основе договоренности между коммуникантами, для которых они будут информативно значимыми. Понятие структурного фрейма текста совпадает с понятиями архетипа/«прообраза» [7]. В прототип «могут входить вещи, которые типичны (но не всегда имеют место) или релевантны лишь в нескольких контекстах» [8]. Прототип текста представляет ментальный конструкт типичного представителя категории или класса объектов, являясь моделью структуры, архитектоники и композиции какого-либо типа текстов, выделяемой на основе всего корпуса текстов индуктивно, эмпирически-аналитически. Конкретная реализация текста будет текстовым инвариантом прототипа (архетипа, стереотипа, структурного фрейма текста), допускающего нормативные отклонения. Направленность семантических особенностей фрейма связана с целевой функцией текста.

Представление текста как иерархии фреймов отражает закономерности текстопостроения и

распределения информации. Анализ фреймов дает возможность построить иерархическую систему семантических взаимоотношений внутри текста. Для фреймового представления семантики текста необходимо определить операции преобразования, изменяющие его содержание, а при сохранении формы - определить операции свертки.

Фрейм-ситуация формируется представлениями о прототипической ситуации и ее элементах, имеющих фиксированные роли и положения. Семантические модели управления фреймом затрагивают определенные требования к контексту, непосредственному семантическому и синтаксическому окружению языковой единицы. Контекстуальная норма является своего рода стереотипом. Ожидания определяются знаниями о стандартном контексте и ситуации. При заполнении переменных учитывается ситуационный контекст, что позволяет говорить о контекстно-обусловленных стратегиях заполнения базового фрейма, т. е. идет приписывание моделей управления конкретным лексическим единицам. Недостаточная конкретизация контекста приводит к вводу «проясняющих» деталей.

Каждый фрейм-ситуация представляет собой более или менее полный список понятий, позволяющий адекватно действовать в данной ситуации. В определении соответствия/несоответствия элемента текста какому-либо фрейму, выбранному в качестве ограничителя сочетаемости элементов, участвуют следующие условия: а) совместимость понятия и фрейма в индивидуальной концептуальной системе индивида; б) категориально предопределенная семантическая сочетаемость; в) определяющий признак: собственно признак для свойств и характеристик элемента, ограничивающий признак, оценивающий признак; г) типизация процессов, действий и отношений по тождеству или сходству моделей управления семантической структурой фрейма.

Данные условия касаются признаков фрейма и семантических условий заполнения его узлов, регламентирующих семантическую сочетаемость. Приписывание слову значения, конкретного семантического и синтаксического управления, обеспечивающего воспроизводимость и эффективность конкретного акта коммуникации, позволяет говорить о ролевой семантике [9].

В гипертекстовом информационно-поисковом тезаурусе метаязыка лингвистики (в формате компьютерного, гипертекстового тезауруса /ГИ-ЗАУРУСА/ - базе данных с перекрестными гипертекстовыми ссылками) дается определение (дефиниция, иллюстрация, интерпретация, объяснение, понятие, пояснение, разъяснение, толкование, трактовка, формулировка, цитата, экскурс и/или эксцерпция) ключевых понятий-терминов, относящихся к сфере определенной науки и ряду

смежных дисциплин, которые в той или иной мере связаны с проблемами данной науки. Конструирование тезауруса обусловлено необходимостью единства в терминологии - нередко учёные одно и то же явление называют по-разному, с другой стороны, один и тот же термин бывает полисе-мичен даже в рамках одной научной области. Кроме этого при анализе уже опубликованных терминологических словарей определенной науки бросается в глаза лакунарность состава словников и некая тенденциозность подачи научных материалов авторами-составителями. Фактически речь идет о составлении метаязыка науки -особого языка, объектом которого является содержание и выражение другого языка, т. е. в нашем случае метаязык - это язык второго порядка как специальная семиологическая система, употребляемая тогда, когда надо говорить о естественном (или искусственном) языке же, выступающем в качестве «языка-объекта». При этом можно отдельно выделить в метаязыке следующее: 1) собственно термины (слова, которые или совсем не употребляются в языке-объекте, либо приобретают, после заимствования из языка-объекта, особое значение), 2) сочетания слов, которые характеризуют собственно метаязык определенной науки в его полном виде (напр., составные термины), 3) определенный социально-предметный аспект (напр., когда метаречь отражает специфику эпохи, того или иного научного направления, школы).

Процесс использования гипертекстового тезауруса метаязыка лингвистики в целом напоминает обычную работу в системе Интернет, но в локальном варианте на персональном компьютере. В перспективе преполагается, что после необходимой апробации в локальном варианте в интерактивном варианте сконструированный тезаурус будет доступен и в Интернете, напр., по адресам http://lsw.ru, http^/ЛСВ.РФ, http:// МФРЯ.РФ.

Примечания

1. Минский М, Фреймы для представления знаний / пер. с англ. М.: Энергия, 1979. С. 6.

2. Минский М, Там же. С. 7-8. ИИ - искусственный интеллект.

3. Виноград Т., Флорес Ф, О понимании компьютеров и познания // Язык и интеллект. М., 1996. С.. 225.

4. Караулов Ю, Н, Лингвистическое конструирование и тезаурус литературного языка. М.: Наука, 1981. С. 345.

5. Уэно X, Кояма Т, Окамото Т, Мацуби Б,, Исидзука М, Представление и использование знаний. М.: Мир, 1989; Чарняк Ю, Умозаключения и знания // Новое в зарубежной лингвистике. Вып. XII. М., 1983. Ч. I. С. 171-207. Ч. II. С. 272-317; Шемакин Ю, И, Введением в информатику. М.: Финансы и статистика, 1985; Шингарева Е, А, Семиотические основы лингвистической информатики: учеб. пособие. Л.: ЛГПИ им. А. И. Герцена, 1987; Шингарева Е, В, О двух направ-

лениях представления семантики текста (тезаурус и фрейм) // НТИ. Сер. 2. Информ. процессы и системы. 1982. № 8. С. 1-8; Шингарева Е. В., Гончаренко В. В. Фреймы для распознавания смысла текста. Кишинев: Штиинца, 1984.

6. Минский М. Вычисления и автоматы. М.: Мир, 1971; Минский М. Фреймы для представления знаний // Психология машинного зрения. М.: Мир, 1978. С. 249-338; Минский М, Пейперт С. Персептроны. М.: Мир, 1970; Романов А. А. Системный анализ регулятивных средств диалогического общения. М.: ИЯ АН СССР, 1988.

7. Шрейдер Ю. А. Информация и метаинформа-ция // НТИ. Сер. 2. Информ. процессы и системы. 1982. № 4. С. 3-10.

8. Виноград Т, Флорес Ф. Там же. С. 224.

9. Масленникова Е. Фреймовое представление семантики текста // Лингвистический вестник. Вып. 2. Ижевск: УМО "Sancta lingua", 2000. С. 114-124. URL: http://libelli.narod.ru/sonnet66/Russian/maslennikova/ frame.html

УДК 811.161.1

Л. И. Дрофа

КОГНИТИВНЫЕ УРОВНИ ЗНАЧЕНИЯ И ВНУТРЕННЕЙ ФОРМЫ В ГРУППАХ ПОСЛОВИЦ С КОМПОНЕНТОМ «БОГ»

В статье описано применение когнитивного метода анализа пословиц с взаимодействием когнитивного уровня значения и когнитивного уровня внутренней формы, образующих единое когнитивное пространство, или когнитивную модель пословицы, при рассмотрении таких групп провербиальных единиц с компонентом «Бог», как пословицы-максимы, пословицы-метафоры, пословицы с аллегорической метафорой и др.

The paper is concerned with usage of cognitive method of analysis of proverbs with the interaction of cognitive level of meaning and cognitive level of inner form which constitute a common cognitive space, or cognitive model of a proverb. The study is based on the material of such groups of proverbial units with the component "God" as proverbs-maxims, proverbs-metaphors, proverbs with allegorical metaphor, etc.

Ключевые слова: провербиальные единицы языка, когнитивная структура, когнитивное пространство, когнитивный метод, когнитивный уровень значения, когнитивный уровень внутренней формы, пословицы-максимы, пословицы-метафоры, аллегорическая метафора, абстрактный концепт.

Keywords: proverbial units of language, cognitive structure, cognitive space, cognitive method, cognitive level of meaning, cognitive level of inner form, proverbs-maxims, proverbs-metaphors, allegorical metaphor, abstract concept.

В литературе, посвященной когнитивным исследованиям, неоднократно отмечалось отсутствие собственного когнитивного практического

© Дрофа Л. И., 2011

i Надоели баннеры? Вы всегда можете отключить рекламу.