Научная статья на тему '2002. 04. 020. Яковишин В. С. Формальный язык: теория. Грамматика. Применение. Минск, 2000. 15i С. Библиогр. : С. 145151'

2002. 04. 020. Яковишин В. С. Формальный язык: теория. Грамматика. Применение. Минск, 2000. 15i С. Библиогр. : С. 145151 Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
42
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЛУБИННАЯ И ПОВЕРХНОСТНАЯ СТРУКТУРА / ГРАММАТИКА ПОРОЖДАЮЩАЯ / ГРАММАТИКА ФОРМАЛЬНАЯ / ПРЕДСТАВЛЕНИЕ ЗНАНИЙ / ФОРМАЛИЗАЦИЯ ЯЗЫКА
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2002. 04. 020. Яковишин В. С. Формальный язык: теория. Грамматика. Применение. Минск, 2000. 15i С. Библиогр. : С. 145151»

ПРИКЛАДНОЕ ЯЗЫКОЗНАНИЕ

2002.04.020. ЯКОВИШИН В.С. ФОРМАЛЬНЫЙ ЯЗЫК: ТЕОРИЯ. ГРАММАТИКА. ПРИМЕНЕНИЕ. - Минск, 2000. - 15I с. - Библиогр.: с.145-151.

Книга состоит из введения, шести глав (1. "Принципы формализации языка"; 2. "Формальная грамматика"; 3. "Понятия грамматики предложении"; 4."Правила синтаксиса и семантики"; 5."Морфологическая: интерпретация"; 6. "Переход к представлению знаний), заключения и приложения. Предлагаются расширенный формально-грамматический аппарат и элементы теории, объединя-ющей в единую систему понятия формальной порождающее грамматики и традиционной лингвистики. Созданный на основе этой теории формальный язык позволяет представить смысловое содержание текстовых сообщений при сохранении их естественной синтагматической структуры.

В работе, в частности, подчеркивается, что применение формального языка как промежуточного звена при переходе к представлению знаний позволяет избежать фундаментальных трудностей, возникающих при непосредственной экспликации текста: переход к внутреннему (эксплицированному) представлению невозможен без достаточно полном информационной базы, послед-нюю же нельзя получить, не осуществив этого перехода. В предлагаемом методе входные предложения сначала преобразуются в формальную запись (что не требует обращения к знаниям о предметной области), а затем они отождествляются с фрагментами концептуальной структуры базы знаний. Экспликация входного текста в данном случае происходит в течение всего процесса форми-рования информационной базы, где входные понятия конкретизи-руются, попадая в соответствующие концептуальное контексты.

С автоматизацией перехода, от внешней формы сообщений к внутреннему представлению знаний открываются новые возможности решения таких задач информатики, как извлечение знаний из электронной документации и автоматическое формирование информа-ционной базы, корректируемый знаниями машинный перевод, сжатие и защита информации при передаче кодированных знаний и др.

Предлагаемая автором концепция формального языка одной из задач ставит преодоление трудностей, возникающих при использо-вании

ресурсов существующих формальных (порождающих) грам-матик. Указывается на синтагматическую недостаточность послед-них, поскольку они (например, грамматика непосредственно составляющих) синтагматическую структуру предложения представ-ляют в виде последовательности слов, где фиксируется только линейная смежность языковых единиц (составляющих) и их принадлежность к соответствующим категориям - без прямого указания на функциональные значения и синтаксические связи.

Разнообразные попытки дополнения формальной грамматики также не дают желаемого эффекта, поскольку простое использование символов, обозначающих функциональные значения ("субъект", "объект" и др.), ведет лишь к смешению синтагматических (функци-ональных) и парадигматических (категориальных) понятий: новым символам приписывается категориальный характер, а относительный характер функциональных понятии остается невыраженным. Автор считает, что требуемое расширение грамматики "можно получить лишь в результате дополнения алфавита такими функциональными символами, с помощью которых из любых правильных (выводимых) цепочек, основ, создаются новые правильные цепочки путем приписывания этих символов к основам в качестве модификаторов или использования их в качестве соединяющих элементов" (с.7). Иначе говоря, грамматика должна располагать символами, с помощью которых задаются одноместные и двухместные алгебра-ические операции, определяемые на множестве порождаемых цепочек. "Только в этом случае функциональные символы, подобно известным обозначениям операций, формально отличаются от всех других элементов языка: они задаются как отдельное подмножество алфавита, а в порождаемых цепочках выделяются с помощью знаков пунктуации и всегда занимают особые, строго фиксированные позиции" (с. 7).

Благодаря такому специальному выделению функциональных символов и реализуется расширение грамматических средств, которое приводит к замене традиционной двухуровневой иерархии единиц языка "символ - слово" на трехуровневую иерархию "символ - сло-во -предложение". Традиционные цепочки-слова, образуемые путем непосредственного соединения символов, рассматриваются при этой замене как компоненты цепочек-предложений - единиц более высокого уровня, которые образуются путем соединения слов с помощью функционального алфавита.

Порождемый язык в этом случае представляет некоторую (двух-росновную) алгебру с двумя базисными множествами - множеством слов А* (свободной полугруппой над алфавитом А), на котором определена обычная операция конкатенации, и множеством предложений Ь(А*), на котором может быть определено несколько операций, выражаемых функциональными символами.

Данному расширению формально-грамматических средств отвечает грамматика предложений, порождающая язык Ь(в) Ь(Л*) -множество всевозможных синтагматических структур естественного языка. Предельный случай этой расширенной грамматики представляет грамматика слов. порождающая язык Ь(в) Л* - множество цепочек-слов, все компоненты которых синтаксически нейтральны и упорядочиваются лишь в зависимости от их категориальной принадлежности.

Аналогом порождаемых синтагматических структур являются предложения естественного языка, аналогом цепочек-слов - любые цифровые выражения систем счисления, идентификаторы языков программирования и др., а также обычные словоформы, инкорпорированные слова-предложения, различные аббревиатуры.

Таким образом, в грамматике, порождающем предложения, в отличие от традиционных формальных грамматик, обычное развертывание непосредственно составляющих совмещается с широким использованием алгебраического способа описания, в соответствии с которым язык представляется как результат применения различных операции к некоторому базисному множеству цепочек. Однако применение этого способа для описания обычных предложении потребовал осознания того далеко не очевидного факта, что в естественном языке роль алгебраических операций выполняют абстрактные единицы, известные в лингвистике как грамматические значения, т.е. семантические элементы, которые на морфоло-гическом уровне языка выражаются различными грамматическими средствами -способом аффиксации, служебными словами, порядком слов, интонацией и др.

Очевидно, что в описании естественного языка алгебраические операции могут применяться только на некотором абстрактном уровне. В процессе дальнейшего порождения осуществляется замена символов операции их семантическими или морфологическими репрезентантами. Следовательно, если в алфавите грамматики имеются функциональные

символы (и грамматические значения задаются как алгебраические операции), то тем самым уже предполагается существование выводимого формального языка, который на следующем этапе порождения получает морфоло-гическую интерпретацию, воплощаясь в виде обычного текста.

Автор подчеркивает, что "используемый в порождающем процессе формальный язык может рассматриваться как глубинная структура, инвариантная относительно своих поверхностных манифестаций, или некоторый идеальный генотипический язык, принадлежащим ступени конструктов и преобразуемый в объекты того или иного реального (генотипического) языка, принадлежащего ступени наблюдения" (с.9).

Выделение в порождающем процессе абстрактного уровня описания, где в явном виде фиксируются соответствующие различия между всеми видами грамматических и лексических значений, позволяет получить формальные определения известных лингвис-тических категорий и объединить в единую логическую систему понятия формальной порождающей грамматики и традиционной лингвистики. Благодаря этому объединению порождающий механизм используется не только как удобный способ представления (задания) языка, позволяющий получить эффективные алгоритмы граммати-ческого анализа как процесса восхождения к порождаемой формальной записи. Построение порождающей грамматики может рассматриваться и как исследовательский прием, или научным эксперимент, с помощью которого осуществляется переход от наблю-даемых явыковых явлений к порождающим правилам, т.е. к описанию законов языка.

Именно в порождающей грамматике язык представляется как динамичный объект исследования, что является необходимой предпосылкой превращения описательной (синхронической) лингвис-тики в подлинно научную (объяснительную) дисциплину, эффек-тивно использующую современные исследовательские методы и средства. Используемые в экспериментальных условиях граммати-ческие правила могут оцениваться с точки зрения их объяснительной силы, полноты и простоты описания. В результате подобной оценки из множества создаваемых грамматик выбирается та, которая наилучшим образом описывает наблюдаемые языковые явления. Таким образом, в процессе лингвистического познания грамматика совершенствуется, приближаясь к некоторой идеальной системе правил, представляющих скрытую сущность языка.

Предлагаемая автором грамматика рассматривается именно как попытка, приближения к такой идеальной системе правил, а, порождаемый грамматикой формальный язык - как смысловая запись, которая оценивается с точки зрения достигаемой при этом эмпирической адекватности. Такал смысловая запись может быть представлена как множество скобочных структур (напоминающих формулы), которые в явном виде выражают смысловое содержание обычных текстовых предложений. Все грамматические значения обозначаются в них единицами заданного набора семантических элементов, а все лексические значения - обычными основами или числовыми кодами (порядковыми номерами) словаря слов. Для выражения синтаксических связей слов в предложении используются скобки и фиксированным порядок слов: на первом месте записывается главное (определяемое) слово синтагматической зависимости, на втором - определяющее.

При стремлении к адекватному отображению естественной грамматической структуры можно получить множество формальных языков, фиксирующих семантическую индивидуальность моделируемого текста. Каждый из этих формальных языков может рассматриваться как идеальная смысловая запись, где все грамматические значения выражаются лишь индивидуальным, характерным для данного языка набором семантических элементов. Предлагаемый формальный язык располагает основным набором семантических элементов, выявляемых в тексте русского языка. Этот формальный язык может использоваться в информационном системе для пред-ставления знаний, извлекаемых из русскоязычной документации.

Выражается надежда, что в дальнейшем может быть получен и универсальный набор семантических элементов, выявляемых в разных языках мира. Такое обобщенное представление граммати-ческой семантики может быть использовано как международная грамматическая нотация, пазиграфия, обеспечивающая идеальную "креолизацию" языка -соединение универсальной грамматической системы с некоторой индивидуальной лексикой: для выражения грамматических значений могут использоваться единицы из универсального набора семантических элементов, а для выражения лексических значений - словарные средства моделируемого текста.

Формальный язык, располагающий средствами универсальной грамматической системы (при сохранении в нем индивидуальной лексики) может применяться для представления знаний в многоязычной

информационной базе, обеспечивающей ввод и вывод сообщений на разных языках.

А.М.Кузнецов

i Надоели баннеры? Вы всегда можете отключить рекламу.