Научная статья на тему 'Условия понимания текстов на естественных языках'

Условия понимания текстов на естественных языках Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
181
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Условия понимания текстов на естественных языках»

«Сумма на лицевом счете». Таким образом, количество элементов множества значений поля <^ит_сумма» таблицы «Сумма в кассе» становится равным двум.

Таблица «Сумма предприятия» формируется запросом на создание таблицы. Она содержит единственную запись с одним полем «Sum_Sum_сумма», полученную суммированием значений поля <^ит_сумма» таблицы «Сумма в кассе».

Таблица «Сводная» формируется запросом на создание таблицы. Результаты запроса формируютя на основании двух связных таблиц, таблицы «Договоры» и таблицы «Счета». Таблицы связываются по полям «Наимен. документа» (таблица «Договоры») и «Наимен. договора» (таблица «Счета»). Таблицу «Сводная» составляют следующие поля: «Наимен. договора» (таблица «Счета»), «Процент пени» (таблица «Договоры»), «Период оплаты» (таблица «Договоры»), «Сумма в счетеї» (таблица «Счета»), «Дата выписки прих. ордера» (таблица «Счета»), «Пеня», «Сумма в счете», «Признак».

Поле «Пеня» вычисляется согласно следующему выражению:

(DateO-Мдата выписки при ордера]+[период оплаты])-1))*

*[процент пени]*[сумма в счетеї]

Поле «Сумма в счете» вычисляется согласно выражению:

[сумма в счете1]+[пеня]

Поле «Признак» инициализируется значением False. Это означает, что ни один счет не выбран для оплаты.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Замкова Л.И., Чефранов А.Г. Алгоритм принятия решения об оплате счетов на основе решения задачи о ранце / Конф. «Новые информационные технологии. Разработка и аспекты применения».- Таганрог, 2000.

2. PrudnicovS.P., Gorelova G.V. Using the step Cut method // 14 Conf. on System modeling and optimization, 1989, Leipzig, DDR.

Е.Г. Иванова

УСЛОВИЯ ПОНИМАНИЯ ТЕКСТОВ НА ЕСТЕСТВЕННЫХ ЯЗЫКАХ Введение

Исследование и моделирование реализуемого на уровне сознания в естественном интеллекте механизма понимания текстов на естественном языке является одной из наиболее важных задач в общей проблематике работ, проводимых с целью создания искусственного интеллекта. Решение этой задачи необходимо для обеспечения возможности смыслового обмена информацией между искусственным и естественным интеллектами на некотором упрощенном (для начала) подмножестве естественного языка. Поэтому вопросам, связанным с исследованиями тех или иных аспектов механизма понимания текстов на естественном языке, посвящено достаточно большое число работ [1, 2. С. 83-87, 210-215, 292-298].

В настоящей работе рассматривается связь между допустимостью текстов на естественном языке и понимаемостью этих текстов. Обосновывается утверждение, что допустимость (на всех уровнях) текстов на естественном языке при одинаковых исходных объемах базовых и оперативных знаний у источников и приемников информации является необходимым и достаточным условием для обеспечения возможности понимания этих текстов.

Основные понятия

Основной целью передачи от агента А к агенту В текста Т на любом естественном языке является создание в фокусе внимания сознания агента В некоторого образа QB, который должен быть максимально адекватным тому исходному образу QA, который находился в фокусе внимания сознания агента А в тот момент времени ^ когда он формулировал описывающий этот образ текст Т. Если эта цель достигается, то будем полагать, что агент В понял то, что ему хотел сообщить с помощью текста Т агент А. В противном случае будем считать, что агент В не понял текст Т.

Для упрощения рассуждений естественно полагать, что оба агента А и В имеют одинаковые исходные объемы базовых и оперативных знаний [3]. Это означает, что к моменту времени [, когда началась формулировка и передача текста Т от агента А к агенту В, оба эти агента обладали одинаковыми запасами слов, и этим словам в их сознаниях соответствовали адекватные между собой понятия, а также то, что в этот же момент времени t оба агента обладали одинаковыми объемами оперативных знаний о текущих состояниях всех упоминаемых в тексте Т сущностях.

Однако даже при этих достаточно сильных предположениях об исходной одинаковости объемов базовых и оперативных знаний у агентов А и В далеко не каждый текст, который в принципе мог бы быть сформулирован агентом А, будет понят агентом В.

Можно показать, что необходимым условием для обеспечения возможности понимания агентом В текста Т является выполнение условий допустимости этого текста на всех уровнях: лексическом, синтаксическом, семантическом и прагматическом. Удовлетворяющий этим условиям текст будем называть корректным текстом.

Можно также утверждать, что в сочетании с выполнением уже названных выше условий равенств базовых и оперативных знаний, имеющихся у агентов А и

В, обо всех упоминаемых в тексте Т сущностях, условие корректности текста Т является не только необходимым, но и достаточным условием для понимания этого текста агентом В.

Вопросы, связанные с истинностью или ложностью передаваемой с помощью текста Т информации, здесь не рассматриваются. Не рассматриваются также способы определения степени адекватности образов QA и QB. (В общем случае степень адекватности этих образов определяется степенью адекватности базовых и оперативных знаний, имевшихся у агентов А и В в момент формулирования и восприятия текста Т.)

Лексический уровень

Требование допустимости (корректности), предъявляемое на лексическом уровне к каждому слову текста Т в качестве необходимого условия для обеспечения понимаемости этого текста агентом В, - очевидно. Например, если очередным словом текста Т является допустимое на лексическом уровне слово стол, то в фокусе сознания агента В после лексического анализа этого слова возникает некоторый обобщенный образ стола, который в соответствии с имеющимися у агента В базовыми терминологическими знаниями на лексическом уровне связан с этим словом. Поэтому никаких проблем с пониманием на лексическом уровне смысла отдельно взятого слова стол у агента В не возникнет.

Ясно, что образ стола, который возникает в сознании агента В при восприятии им этого слова, в общем случае будет более или менее отличаться в некоторых деталях от того образа стола, который имелся в сознании агента А, когда он произносил это слово. Однако при равенстве базовых терминологических знаний, имеющихся у этих агентов, эти образы в основных своих чертах (с точностью до общепринятого определения термина стол, даваемого в толковых словарях) должны совпадать.

И, наоборот, если очередное слово в тексте Т будет недопустимым на лексическом уровне, то агент В не поймет это слово. Например, если этим словом будет «слово» кртпс, то в фокусе сознания агента В ничего, кроме естественного недоумения, не возникнет, так как это «слово» ничего не обозначает (такого «слова» нет в базовых знаниях агента В на лексическом уровне). Естественной реакцией агента В в данном случае может быть только лишь что-нибудь вроде: «Не понял!».

Таким образом, мы видим, что на лексическом уровне понятен только тот текст, который допустим (при одинаковом исходном объеме базовых терминологических знаний у обоих агентов А и В).

Синтаксический уровень

На синтаксическом уровне анализа текста Т происходит анализ допустимости (корректности) всех номинативных словосочетаний этого текста. Здесь под номинативным словосочетанием понимается любая номинативная единица, состоящая из нескольких слов, которая выполняет лексико-семантическую функцию сложного наименования некоторой сущности [4]. (Поэтому, в этом смысле, не являются номинативными словосочетаниями наборы слов, обозначающие предикативные и полупредикативные отношения.)

Например, номинативное словосочетание письменный стол с точки зрения наших базовых знаний является допустимым и, следовательно, это номинативное словосочетание будет понятным, а номинативное словосочетание газовый стол с точки зрения наших базовых знаний является недопустимым и, следовательно, непонятным.

Таким образом, номинативные словосочетания позволяют поименовывать как сами сущности, так и состояния, в которых они могут находиться, в тех случаях, когда в естественном языке отсутствуют соответствующие отдельные термины для обозначения выделяемых в предложениях сущностей, а также для обозначения или состояний, в которых эти сущности находятся, или событий, которые произошли с этими сущностями. В этих случаях вначале берутся более широкие по смыслу термины, а затем с помощью дополнительных ограничительно-уточняю-щих слов (имен прилагательных для имен существительных, наречий для глаголов и т.п.) смысл исходных терминов суживается и уточняется до требуемого уровня.

На этом же синтаксическом уровне происходит также анализ на допустимость используемых в каждом предложении грамматических конструкций. В этом случае проверяется, является ли очередной набор понятных в отдельности слов и номинативных словосочетаний предложением или нет. То есть, выполняется ли основное правило предложения, которое состоит в следующем. В каждом предложении должна быть названа некоторая сущность (группа существительного) и названо либо состояние, в котором находится эта сущность (настоящее или прошедшее время в несовершенной форме), либо событие, которое изменило предыдущее состояние этой сущности (прошедшее время в совершенной форме).

Например, допустимым на синтаксическом уровне, а, следовательно, и понятным на этом же уровне является словосочетание (предложение): «Письменный стол стоит у окна». Здесь указывается сущность («письменный стол») и указывается состояние, в котором находится эта сущность («стоит у окна»). И, напротив, словосочетание: «Письменный стол красная лампа» не является предложением (здесь названы две сущности и не указаны состояния, в которых они находятся). Таким образом, такое словосочетание является синтаксически недопустимым и, следовательно, непонятным на синтаксическом уровне. (Хотя на лексическом уровне здесь все понятно, так как каждое слово в отдельности является допустимым.)

Семантический уровень

На семантическом уровне допустимость определяется уже на смысловом (содержательном) уровне. Так как мы предполагаем, что как передающий информацию агент А, так и принимающий эту информацию агент В имеют одинаковые базовые (терминологические, общекультурные и общеобразовательные) знания, то для каждой сущности S и для каждой ситуации, в которой может находиться эта сущность, как агент А, так и агент В имеют одинаковые представления о том, в каких состояниях в принципе может находиться эта сущность. И если в предложении Р указывается некоторая недопустимая сущность (недопустимость группы существительного) или указывается сущность допустимая, но недопустимым является либо состояние, в котором находится эта сущность, либо событие, которое происходит с этой сущностью (недопустимость глагольной группы), то данное предложение будет непонятным.

Например, предложение «Свеча горит» семантически допустимо, а значит и понятно на семантическом уровне. Если же мы рассмотрим предложение «Свеча говорит», то на семантическом уровне это предложение будет непонятно, так как свеча, согласно нашим базовым знаниям, не может находиться в состоянии «говорения».

Прагматический уровень

Прагматическим является уровень понимания цели изложения и смысла всего текста Т в целом. Опять же, исходя из общих для агентов А и В базовых и оперативных знаний, агент В, воспринимая отдельные предложения текста Т, должен в конце принятия всего текста Т создать в своем сознании образ Q некоторой допустимой ситуации Е. Здесь под допустимостью образа Q подразумевается цельность и некоторая завершенность этого образа. Если несколько допустимых (то есть понятных) в отдельности предложений создают в сознании агента В незавершенный (фрагментарный) образ или если семантический смысл одного предложения противоречит семантическому смыслу другого предложения одного и того же текста, то в этих случаях данный текст является недопустимым, а значит, и непонятным. То есть под допустимостью на прагматическом уровне некоторой описываемой в тексте Т ситуации следует понимать соответствие (непротиворечивость) сведений, содержащихся в этом тексте, всей той совокупности базовых и оперативных знаний, которой обладал агент В в момент восприятия текста Т. И, наоборот, несоответствие содержащейся в тексте Т информации всей совокупности базовых и оперативных знаний, имеющихся у агента В, приводит к выводу о противоречии между этим текстом и имеющимися знаниями, а значит, этот текст будет не понятен агенту В. Например, если в тексте Т будет вполне понятно на лексическом, синтаксическом и семантическом уровнях даваться «разумное» объяснение того, что земля имеет форму чемодана, то агент В (если он имеет хоть какое-то базовое образование) не поймет этого объяснения, так как оно является недопустимым (противоречащим его базовым знаниям).

Тут следует отметить, что, так как текст Т может быть дополнен еще некоторым числом предложений, то понятность текста Т по мере его восприятия может меняться. Например, текст: «На столе стоит свеча. Вася зажег свечу», прагматически допустим и пока что более или менее понятен. Если же к этому тексту добавить предложение: «В огороде бузина, а в Киеве дядька», то в целом текст получится мало допустимым и в сознании бедного агента В образуется некий рваный образ, не представляющий собой нечто ясное и целое. То есть на прагматическом уровне этот текст (с дополнительным предложением) уже нельзя будет назвать понятным для агента В. Хотя на лексическом, синтаксическом и семантическом уровнях каждое предложение этого текста в отдельности допустимо и понятно.

Следует отметить, что границы прагматического уровня понимания текста весьма условны и размыты (как и само понятие прагматического уровня). На этом уровне понимание текста Т означает обеспечение возможности получения агентом В из информации, содержащейся в данном тексте, ответов на множество различных вопросов типа: что, зачем, почему, как и т.п. На этом уровне часто возникает ситуация полупонимания, когда, например, агент В понимает, что ему сообщил агент А с помощью текста Т, но не понимает, зачем он это сделал и т.п.

Таким образом, понять текст Т, значит, совместить его в нашем сознании с одним из допустимых (возможных) вариантов корректного информационного заполнения слотов тех фреймов, которые отражают наши предварительные знания о свойствах сущностей, о которых идет речь в тексте Т. Проще говоря, понятно только лишь то, что на всех уровнях соответствует (не противоречит) ранее усвоенным знаниям всех типов. Именно поэтому более легко понимаются чисто информационные тексты, в которых, используя известные понятия, описываются некоторые ситуации или события, и более трудно понимаются образовательные и научные тексты, в которых вводятся новые понятия.

В заключение отметим, что приведенные выше рассуждения в большей степени объясняют феномен непонимания, а уже затем понимание определяется опосредованно как отсутствие непонимания. Такой подход справедлив ровно постольку, поскольку справедливо правило двойного отрицания. (Не все признают универсальную справедливость этого правила.)

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Minsky M. A framework for representing knowledge // MIT-AI Laboratory Memo 306, 1974.

2. Компьютерная лингвистика и интеллектуальные технологии / Труды международной конференции Диалог'2003. Протвино, 2003.- М.: Наука.

3. Ivanova E. Representation of formal logical knowledge by the means of natural language. Proceedings of the Ninth International Conference «Speech and Computer» SPECOM'04, Saint-Petesberg, 2004. P. 433-437.

4. Розенталь Д.Е., Голуб И.Б., Теленкова М.А. Современный русский язык.- 5-е изд.- М.: Айрис-пресс, 2003.- 448 с.

С.А. Котеленко

ФОРМАЛЬНОЕ ОПИСАНИЕ ОНТОЛОГИЙ НА ОСНОВЕ НЕЧЁТКОЙ ГИПЕРГРАФОВОЙ МОДЕЛИ ДАННЫХ

Введение

Онтологии играют существенную роль в многочисленных приложениях, задачей которых является интеллектуальная обработка данных в сети. Для этих приложений онтологии являются источником точного, формального описания знаний. Под описанием знаний в данном случае понимается задание понятий (термов, концептов) и отношений между ними. Вопрос формального описания онтологий тесно связан с механизмом вывода, предоставляющим возможность получить ответ на вопрос о связанности определённых понятий друг с другом. Проблема описания онтологий и разработки механизма вывода осложняется необходимостью работать с нечёткими понятиями и отношениями.

i Надоели баннеры? Вы всегда можете отключить рекламу.