Научная статья на тему 'Исследование базовых принципов построения семантического интерпретатора вопросно-ответных текстов на естественном языке в АОС'

Исследование базовых принципов построения семантического интерпретатора вопросно-ответных текстов на естественном языке в АОС Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
436
107
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕМАНТИЧЕСКИЙ АНАЛИЗ ОТВЕТОВ ОБУЧАЕМОГО / ПРАГМАТИЧЕСКИ-ОРИЕНТИРОВАННЫЙ ПОДХОД / КОНЦЕПТУЛА / ИНДИВИДУАЛЬНЫЕ КОНЦЕПТУАЛЬНЫЕ ГРАММАТИКИ / КЛАССИФИКАЦИЯ ВОПРОСНО-ОТВЕТНЫХ ТЕКСТОВ / СЕГМЕНТАЦИЯ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ / ЛИНГВОПРОЦЕССОР

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Сулейманов Дж Ш.

Описывается прагматически-ориентированный подход к созданию модели семантической интерпретации вопросно-ответных текстов в АОС в режиме, когда активной стороной является система. Раскрываются базовые принципы построения процессора вопросно-ответных текстов в условиях «ожидаемости» значений вопроса и «детерминированости» контекста.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование базовых принципов построения семантического интерпретатора вопросно-ответных текстов на естественном языке в АОС»

Educational Technology & Society 4(3) 2001 ISSN 1436-4522

Исследование базовых принципов построения семантического интерпретатора вопросно-ответных текстов на естественном языке в АОС

Дж.Ш.Сулейманов Казанский государственный университет Академия наук Татарстана Заведующий совместной научно-исследовательской лабораторией “Проблемы искусственного интеллекта”, профессор КГУ, доктор технических наук Djavdet. Suleymanov@ksu.ru

Аннотация

Описывается прагматически-ориентированный подход к созданию модели семантической интерпретации вопросно-ответных текстов в АОС в режиме, когда активной стороной является система. Раскрываются базовые принципы построения процессора вопросно-ответных текстов в условиях «ожидаемости» значений вопроса и «детерминированости» контекста.

Ключевые слова

Семантический анализ ответов обучаемого, прагматически-ориентированный подход, концептула, индивидуальные концептуальные грамматики,

классификация вопросно-ответных текстов, сегментация текстов на естественном языке, лингвопроцессор.

Введение

Решение проблемы построения естественно-языковых лингвистических моделей и создания на их основе эффективных лингвопpоцессоpов, как нам представляется, лежит не столько в области создания полных описаний естественного языка (ЕЯ) (даже если это было бы возможно гипотетически), сколько в области концептуального осмысления подхода к построению лингвистической модели как к неотъемлемой части системы, составляющей единое целое вместе со всеми участниками обработки текста. Таким подходом, как мы считаем, является четкое базирование модели на прагматике системы, объединяющей всех участников вокруг целевой обработки ЕЯ-текста. Такое определение лингвистических моделей, основанное на их функциональном аспекте, является весьма продуктивным с методологической точки зрения, позволяющим провести соответствующую классификацию моделей по их прагматическим признакам, т.е. по цели разработки и сфере применения, разработать достаточно эффективные технологии и системы обработки ЕЯ-текстов. Нами проведена следующая классификация лингвистических моделей:

1. Когнитивные (семантико-контекстные) модели, обеспечивающие глубинное проникновение в текущий контекст и трансформацию его с сохранением смысла как внутри одной модели, так и между разными моделями (например, системы машинного перевода, системы извлечения знаний);

2. Диалоговые запросно-ответные или интерактивные модели, обеспечивающие естественно-языковой диалог автоматизированной системы с пользователем при запросах к системе или ответах пользователя на вопросы системы. Функция таких моделей, помимо анализа или синтеза ЕЯ-текстов, заключается в формировании корректного образа ответа на запрос и/или реакции на ответ пользователя;

3. Концептуально-формальные модели, обеспечивающие целевую

обработку текстов согласно соответствующим формальным правилам определенного языкового уровня (собственно грамматики ЕЯ) (морфологические анализаторы, корректоры и др.);

4. Концептуально-функциональные модели, являющиеся наиболее полными описаниями определенного ЕЯ-уровня или уровней, обеспечивающие разработчиков структурно-функциональной, а также справочной информацией, необходимой при построении систем и информационных технологий обработки естественно-языковых текстов.

Прагматически-ориентированные модели или модели от цели - это такие описания языка и процесса обработки естественно-языковых текстов, которые, в отличие от универсальных многоуровневых моделей с множеством связей, включают минимальный набор средств, разработанный исходя из принципа достаточности для решения определенного круга задач.

Такие модели строятся не за счет усечения тех или иных элементов языковых уровней универсальной лингвистической модели, а за счет установления целевых характеристик, изначально учитывающих достаточный набор языковых средств и детальность их описания исходя из методологических принципов «ожидаемости ответа» и «детерминированости контекста».

В последние годы активизировались теоретические и прикладные работы по развитию комплексной и многоаспектной лингвистической стороны проблемы человеко-машинного диалога, а именно, исследование диалога как способа общения и вида текста [Андрусенко Т.Б., 1994].

Диалог человека с машиной означает интерактивный обмен посланиями между пользователем и диалоговой системой в соответствии с условленными языком (языками) диалога и формой (формами) диалога для достижения определенной задачи. Диалоговое взаимодействие пользователя с автоматизированной системой протекает в одном из следующих режимов:

1) активна система, когда на вопросы системы отвечает пользователь,

2) активен пользователь, когда на запрос пользователя определенным образом реагирует система, и, наконец,

3) двухсторонне активный диалог, когда пользователь и система меняются ролями в ходе общения.

Наиболее изученным, развитым и представленным в литературе является режим (2), когда вопросы задает пользователь, а система отвечает. Очевидно, что при этом успешный поиск информации в базе данных и генерирование соответствующего ответа, главным образом, зависят от того, насколько корректно система сможет интерпретировать вопрос пользователя. Большинство лингвистических процессоров для общения с базой данных (БД) на ЕЯ, активно разрабатываемых рядом отечественных и зарубежных исследовательских групп и фирм, не опираются на принципиальную лингвистическую модель и функционируют в предположении, что человек инициирует диалог, т.е. цели пользователя, а не системы, определяют диалог.

Примером диалоговой модели, наиболее естественно моделирующей вопросно-ответную ситуацию, т.е. режим, когда активна система и пассивен пользователь, является вопросно-ответный диалог в автоматизированной обучающей системе (АОС) [Вакуленко В.Н., 1992]. Вопросно-ответная ситуация в АОС имеет следующие особенности, учет которых позволяет строить прагматически-ориентированные лингвистические модели как основы эффективных анализаторов ответов обучаемого.

1. Особенность входного текста

В АОС текст на ЕЯ - это ожидаемый ответ на заданный вопрос, иначе говоря, это множество значений заданного вопроса. Вопрос АВТОРа1 накладывает определенные ограничения на форму ответа и его содержание. Ожидаемый объем ответа ограничивается требуемой степенью подробности по заданному вопросу. В силу определенности контекста и ожидаемых лексем, сводится к минимуму неоднозначность лексем (омонимия, полисемия, синонимия и др.).

1 АВТОР - разработчик обучающего курса

2. Особенность "понимания" текста

Задача анализа ответов в АОС - это проверка правильности ответа обучаемого, т.е. соответствия его ожидаемому. При этом в АОС, зачастую, достаточно извлечение из текста только той его части, где содержится ответ на заданный вопрос. В качестве такой части может быть выделен также некоторый текст на ЕЯ. Выделенная часть текста подвергается лингвистической обработке (возможно, в специально определенных терминах).

3. Особенность формальной основы анализа

В существующих анализаторах ответов обучаемого в АОС грамматика естественного языка либо полностью игнорируется, либо используется жесткая "грамматика" в рамках строго формализованного обучающего курса.

Диалог обучаемого с АОС предполагает вопросно-ответную ситуацию, когда задающему вопрос (т.е. АОС) естественно ожидать в ответе обучаемого раскрытия определенного смысла, заданного вопросом, ограниченного объема лексем в ответе, с большой точностью соответствующих лексемам, ожидаемым по заданному вопросу. При этом важно не поверхностно-синтаксическое различие фраз, а то, какое предметное содержание имеет слово в ответе. Это содержание не зависит ни от части речи, которой выражено слово, ни от того, каким членом предложения оно является, а определяется той ролью, которую выполняет соответствующая лексема в ряду других в текущем контексте. Вследствие этого, при контроле ответа обучаемого в АОС для получения эффективных алгоритмов анализа ЕЯ-текста могут быть использованы упрощенные лингвистические модели, ориентированные на информированного (т.е. знакомого с контекстом) "слушающего".

4. Особенность выходной информации

В результате анализа ответов обучаемого необходимо получить набор параметров, характеризующих степень правильности ответа (диагностику), с целью управления учебным процессом. Как известно, управление процессом обучения зависит от многих параметров, в том числе от дидактических требований, опыта преподавателя, особенности каждого предмета, предыстории обучения и т. п.

Как показывает анализ возможностей контроля естественно-языковых текстов в реальных обучающих системах [ИИ в образовании, 1996], практически ни одна из исследованных разработок не содержит модули, предназначенной для анализа естественно-языковых ответов обучаемого по смыслу. Подробный сравнительный анализ средств автоматизации контроля ответов обучаемого приводится в совместной монографии автора статьи с Бухараевым Р.Г. [Бухараев Р.Г., Сулейманов Д.Ш., 1990]. Задача семантического анализа естественно-языковых текстов в проанализированных нами традиционных АОС не решена, более того, не существует конструктивных методов формального определения семантики. Анализатор ответов обучаемого, включенный в состав лингвистического обеспечения АОС ВУЗ-ОСКАР, развитый в настоящее время возможностями анализа ответов новых типов вопросов и семантических классов значений вопросов, реализует частное решение задачи семантического анализа ответных текстов на естественном языке на основе прагматически-ориентированного подхода.

Основные понятия и принципы построения

В процессе диалогового общения всегда существует контекст, который определяет дополнительную информацию, способствующую правильному пониманию смысла сообщения. В условиях вопросно-ответного диалога такой контекст настолько определенен, что задающий вопрос достаточно четко может априори очертить круг ожидаемых возможных ответов и декодировать ожидаемый смысл из многообразия грамматически правильно построенных фраз в соответствии с этим предварительным знанием. Смысловая типизация вопросов и семантическая классификация ответных текстов дают возможность противопоставить каждому типу вопроса ограниченный набор допустимых, т.е. логически правильных, смысловых

конструкций (ответных формул). Можно рассматривать совокупность этих формул, соответствующих конкретному типу вопроса, как некоторую грамматику, кодирующую конструкции, передающие правильный смысл ответа. Нами поставлена и решена задача проведения такой классификации вопросно-ответных текстов, когда форма и соответствующий смысл входного текста напрямую зависят от типа вопроса.

Как показано выше, построение семантического интерпретатора текстов на ЕЯ в контексте, управляемом вопросом системы к пользователю, имеет свою специфику, выгодно отличающую ее от других ЕЯ-диалоговых систем и создающую реальные предпосылки для построения эффективного смыслового интерпретатора.

Семантическая типизация вопросов позволяет разбить множество ответов обучаемого на семантические классы, в каждом из которых требуется раскрытие некоторого однотипного смысла, определенного типом вопроса и независимого от формы задания и лексического наполнения вопроса.

Введем определения понятий концептулы и индивидуальных концептуальных грамматик.

Концептула - это элементарная смыслообразующая единица (обобщенная семантическая единица) семантической структуры текста, отражающая роль лексем в значении вопроса и в определенном их сочетании формирующая смысл текста в контексте, детерминированном заданным вопросом.

Схемы сочетания концептул (формулы), соответствующие правильной передаче ожидаемого смысла, будем называть индивидуальными концептуальными грамматиками (ИКГ).

Совокупность всех ИКГ составляет концептуальную грамматику (КГ).

Использование понятия концептуальной грамматики дает возможность сводить выявление семантического содержания ответа к анализу его грамматического соответствия некоторой ИКГ.

Система интерпретации ЕЯ-текстов в контексте, управляемом системой, включает базу знаний, базу специфических грамматических конструкций, лингвопроцессор и семантический интерпретатор. Интерпретация ответного текста происходит следующим образом. Текст поступает в лингвопроцессор и на основе базы знаний переводится в канонизированное представление в виде последовательности специальных семантических единиц (концептул). Часть информации на лексическом уровне может представлять интерес для дальнейшего разбора (например, для проверки на непротиворечивость с ожидаемой частью ответа), поэтому накапливается в специальных файлах. Далее канонический текст интерпретируется с привлечением специальных семантических схем - ИКГ. Результат формируется в виде некоторого вектора ситуации, по которому принимается управляющее действие системы.

Построение лингвистического процессора базируется на следующих двух методологических принципах и 6 принципах реализации прагматически-ориентированной модели.

1. Методологические принципы

1. Принцип детерминированности контекста. В силу активности, система «погружает» пользователя в определенный контекст, который определяется заданным вопросом. Соответственно, содержание ответа, его лексикон и даже форма и, отчасти, объем предопределены и пользователь с необходимостью отвечает на вопрос в определенных рамках.

2. Принцип ожидаемости смысла ответа. По заданному вопросу система знает пространство значений вопроса, т.е. ей заранее известен контекст, в котором будет происходить интерпретация ответа и достаточно легко может быть сформирована модель текста, адекватная ожидаемому ответу как по лексике, так по форме изложения и семантической конструкции.

2. Принципы реализации:

1. Принцип. Выделение системы смыслообразующих единиц (концептул) с целью трансформации проблемы семантического анализа вопросно-ответного текста в проблему синтаксического анализа в условиях использования детерминирующей роли контекста.

Принцип выделения концептул приводит к необходимости провести

типизацию понятий, отношений, грамматических признаков и специальных ролей лексем и установления соответствия между ними и концептулами в управляемом контексте, т.е. в контексте заданного вопроса.

Выделение концептул производится на основе анализа типов лексем и их ролей в вопросно-ответных текстах.

2. Принцип. Семантическая классификация вопросно-ответных текстов на основе типовых отношений: выделение конкретных типов отношений, типов вопросов и классов ответов для реализации детерминирующей роли контекста.

В вопросно-ответном диалоге система функционирует в условиях определенного контекста и она способна четко очертить круг ожидаемых возможных ответов, т. е. значений вопроса, и декодировать ожидаемый смысл из многообразия грамматически правильно построенных фраз в соответствии с этим предварительным знанием. Смысловая типизация вопросов и семантическая классификация значений вопроса дают возможность противопоставить каждому типу вопроса ограниченный набор допустимых ответных формул, т. е. логически правильных смысловых конструкций. Можно рассматривать совокупность этих формул, соответствующих конкретному типу вопроса, как некоторую грамматику, кодирующую конструкции, передающие правильный смысл ответа.

Следовательно, при семантическом подходе к типизации вопросов и классификации ответов имеется прямая связь между типом вопроса и классом ответа. Принадлежность ответа к некоторому классу ответов определяется не по его объему и содержанию, и не по форме вопроса, а по типу вопроса системы и по ожидаемому смыслу.

3. Принцип. Разработка индивидуальных концептуальных грамматик (ИКГ) семантических классов, отражающих смысловые конструкции ответов соответствующих классов и в совокупности составляющих концептуальную грамматику (КГ) как схему реализации принципа трансформации семантики в синтаксис, служащей формальной основой для построения семантического интерпретатора, ориентированного на "слушающего".

Сочетания понятий и отношений в текстах, соответствующих определенным семантическим классам, имеют достаточно устойчивые частотные характеристики. Следовательно, при создании системы семантической интерпретации логично ожидать в анализируемом тексте семантические конструкции, имеющие наиболее высокие частотные характеристики для рассматриваемого контекста.

Схемы сочетания концептул, соответствующие правильной передаче ожидаемого смысла, названы нами индивидуальными концептуальными грамматиками (ИКГ).

4. Принцип. Сегментация вопросно-ответных текстов по минимальным смысловым конструкциям для рекурсивного применения правил концептуальной грамматики (базовых смысловых формул).

Принцип 4 обосновывается тем, что любой осмысленный текст допускает актуальное членение на синтагматические группы, линейные или иерархические, а также очевидным утверждением, что любой осмысленный текст полностью «покрывается» линейной или иерархической последовательностью сегментов, отражающих его глубинное каноническое описание.

В проблематике семантического анализа текстов на ЕЯ, особенно для практической реализации разработок, оказывается важной задача членения входного текста на такие части, к которым рекурсивно применимы простые формулы. Сложный текст, представляет собой линейную и/или иерархическую последовательность смысловых частей, относящихся к тому или иному семантическому классу ответов. Часть сложного текста, или полный текст, относящийся к определенному семантическому классу, названа сегментом. Таким образом, сложный текст является линейно и/или иерархически организованным множеством сегментов.

В известных системах понимания ЕЯ практически отсутствуют эффективные механизмы выделения сегментов в анализируемом связном тексте для применения к ним ограниченного набора унифицированных правил анализа. Глубинные причины такого положения лежат в сложности самой проблемы членения входного текста на соответствующие смысловые части. Это посильно только действительно

интеллектуальной системе, способной на основе плавающего (уточняющего смысл части текста по месту чтения) контекста выделять смысловые конструкции, рекурсивно идентифицируемые с правилами ИКГ соответствующих классов ответов.

Для реализации принципа сегментации важно ответить на следующие два вопроса: как определить контекст, в рамках которого входной текст должен анализироваться на смысловую корректность, и каким образом выделять в тексте сегменты, чтобы к ним были рекурсивно применимы грамматические формулы.

Ответ на первый вопрос ведет нас, в общем случае, к необходимости подробного анализа проблем плавающего контекста, условий его изменения, сохраняющих смысловую непрерывность восприятия и ряда других методологических, лингвистических, психологических и семиотических проблем. В нашем случае мы сознательно идем на некоторое упрощение ситуации, фиксируя контекст по заданному вопросу. В силу этого входной текст, т.е. ответ обучаемого, однозначно попадает в рассматриваемый контекст и фактически содержит ожидаемый смысл (точнее, должен содержать, иначе текст не является ответом на вопрос или не распознается данным семантическим интерпретатором).

Для применения соответствующих ИКГ требуется определить, к какому семантическому классу ответов относится вводимый текст. В случае вопросноответного текста система способна заранее по задаваемому вопросу предопределить семантический класс ожидаемого ответа, тем самым предопределяя и соответствующую ИКГ, применяемую для его смыслового анализа. Семантическая классификация вопросно-ответных текстов производится от простого к сложному. Вначале определяются простые семантические классы ответов, т. е. ответы, в которых раскрывается смысл вида "понятие-отношение-понятие". Затем из таких конструкций строятся более сложные семантические классы, представляющие собой комбинации простых классов, как линейные, так и иерархические, отражающие существование связных текстов из простых, сложносочиненных и сложноподчиненных предложений. Соответственно, сегментация текстов приводит к построению как линейных, так и иерархических представлений, которые рекурсивно распознаются на основе определенных ИКГ.

5. Принцип. Релевантность представления знаний (модели ответа) по смысловой структуре и лексическому наполнению ожидаемому ответному тексту.

Ясно, что наиболее эффективный диалог, т. е. достаточно адекватная и реактивная интерпретация входного текста будет осуществляться при соблюдении принципа релевантности представления знаний (модели ответа) по смысловой структуре и лексическому наполнению ожидаемому ответному тексту. Это является естественным требованием к системе интерпретации, моделирующей человекомашинный интерфейс, т.к. в управляемом контексте активный участник диалога всегда имеет возможность заранее построить модель ответа адекватно ожидаемого контекста по своему вопросу.

6. Принцип. Принцип открытости системы, обеспечивающий развитие системы путем накопления новых знаний на основе устойчивых статистических характеристик, в том числе, путем расширения множества обобщенных семантических единиц, введения новых типов вопросов и классов ответов, сортировки и расширения правил КГ, введения новых ИКГ.

Семантическая классификация вопросно-ответных систем

В условиях АОС, благодаря особенностям, подробно рассмотренным выше, имеется возможность существенно упростить способы кодирования смысловой информации, а следовательно, и способы ее декодирования. При анализе текста в процессе общения оказывается важным фиксирование контекста и установление зависимости формального выражения смысла (т.е. грамматической конструкции) от этого контекста. Такой подход, безусловно, требует решения задачи классификации самих контекстов. Любая предметная область (ПО) содержательно состоит из конкретных понятий и отношений между этими понятиями. Множество конкретных понятий и отношений по определенным признакам можно разбить на конечное число типов понятий и типов отношений. Назовем эти типы семантическими единицами. Каждое осмысленное предложение ПО можно перевести в текст,

составленный из типов понятий и типов отношений, без детального учета грамматических особенностей ЕЯ, отображая каждое понятие или отношение в соответствующий тип.

Полный отказ от элементов классической грамматики ЕЯ оправдан не во всех случаях. Иногда смысл предложения определяется предлогами, падежными окончаниями слов и др., и их учет позволяет существенно упростить семантический анализ текста. Поэтому вводится дополнительная семантическая единица (концептула) - грамматическая роль лексем или их частей для указания

соответствующих грамматических признаков естественного языка.

Смысл анализируемого текста зависит также от специфики проблемной области. Этим вызвано введение третьего типа концептул - специальных ролей лексем в ответе пользователя. В общем случае канонический смысл текста определяется сочетанием концептул всех указанных типов.

1. Выделение типов понятий.

Рассмотрим методологию выделения конкретных типов понятий, отражающихся соответствующими концептулами в каноническом представлении.

88 - концептула, отражающая главное понятие (первая буква 8 - признак того, что концептула отражает понятие).

Главное понятие - это понятие/понятия, относительно которого/которых задан вопрос (т.е. понятие/понятия, раскрываемое/раскрываемые в данном контексте). Назовем его ФАКТОРом. В его роли может выступать любая лексема, в том числе, скажем, и выражающая отношение.

Сложные тексты могут содержать несколько понятий, связи которых раскрываются в анализируемых предложениях, каждый из которых в процессе анализа определенной части предложения может, в свою очередь, выступать в роли главного понятия. Для их различения в пределах анализируемого текста вводится обозначение: ББ(1) - концептула, отражающая 1-е главное понятие.

80 - концептула, отражающая понятие, состоящее в некотором определенном отношении с главным понятием.

8оп - концептула, отражающая обобщенное понятие (ОП). ОП - это понятие, находящееся по отношению к главному на более высоком уровне в иерархии понятий предметной области (например, понятие "человек" есть ОП по отношению к понятию "студент").

8А - концептула, отражающая понятие-аргумент.

8Р - концептула, отражающая понятие-результат.

Обозначим через К8 множество концептул, отражающих различные типы понятий, т.е., К8 = {88, 88(1), 80, 8ОП , 8А, 8Р}.

2. Выделение типов отношений.

Введем понятие Конкретного Отношения (КО). КО - это семантическая интерпретация лексемы, отражающей конкретное отношение между понятиями в данном контексте.

Однозначность семантической интерпретации лексем определяется спецификой предметной области и контекстом, который в рассматриваемой задаче устанавливается АВТОРом.

Введем понятие Типового Отношения (ТО). ТО - это обобщенное отношение, объединяющее КО в семейства отношений, отражающих однотипный смысл и раскрывающих определенный признак понятий предметной области (ПО). Например, все приведенные выше КО, выраженные лексемами типа ‘играет’, ‘спит’, ‘плавает’, объединяются в семейство ТО СОСТОЯНИЕ по признаку: выражать

состояние понятия (т.е. отражать однотипный смысл, раскрывающий признак понятия ПО - находиться в некотором состоянии).

Аналогично определяются ТО ДЕЙСТВИЕ, СОСТАВ ВКЛЮЧЕНИЕ, ВРО (ВРеменное Отношение), ПРО (Пространственное Отношение), ТО КЛО (КоЛичественное Отношение), КЧО (КаЧественное Отношение). Приведенный список ТО подробно описан в [Бухараев Р.Г., Сулейманов Д.Ш., 1990] и может быть расширен в зависимости от ПО по усмотрению АВТОРа.

Введем понятие Составного Отношения (СО). СО - это устойчивая комбинация двух ТО ДЕЙСТВИЕ: действия, направленного на аргумент (т.е. отношение ББ к БА) и результат (т.е. отношение ББ к БР).

В следующем тексте раскрывается СО ФУНКЦИЯ понятия Бі ‘Бі переводит Б2 в Бз’. (іа)2

Введем формальные обозначения для концептул, соответствующих типов отношений.

Ис - это концептула, соответствующая ТО СОСТОЯНИЕ

Исоот - ТО СОСТАВ

ИВКЛ - ТО ВКЛЮЧЕНИЕ

ЯД - ТО ДЕЙСТВИЕ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Явро - ТО ВРО

ЯПРО - ТО ПРО

Икло - ТО КЛО

ИКЧО - ТО КЧО

Изо - концептула, отражающая отношение ББ к БО КоБ - концептула, отражающая отношение БО к ББ Яд - концептула, отражающая отношение ББ к БА Яр - концептула, отражающая отношение ББ к БР.

Через КЯ обозначим множество концептул, отражающих различные типы отношений, т.е. Кя= {Яс , Ясост , Явкл , Яд , Явро , Япро , Якло , Якчо , Ибо , Яоб , Яд , ЯР}. Здесь ЯБО , ЯОБ принимают значения из следующего множества: {Яс , ЯСОСТ ,

ЯВКЛ , ЯД , ЯВРО , ЯПРО , ЯКЛО , ЯКЧО }.

Таким образом, концептулы первой группы (обозначим К1) включают

следующее множество прагматических ролей: К1 = КБ ^ КЯ .

Грамматические роли лексем и частей отражают грамматические признаки естественного языка (элементы грамматики, например, суффиксы, союзы, предлоги и др.). Выделяются следующие грамматические признаки (для русского языка) и соответствующие концептулы:

1. Предлог перед Б А (например, предлоги из, от, с и т.п.) отражается концептулой вРА.

2. Предлог перед БР (например, предлоги в, на, к и т.п.) отражается концептулой вРР.

3. Грамматические модификаторы: либо лексемы типа ‘чем’, ‘нежели’ и т.п. после лексемы, выражающей отношение, либо падежные окончания слова после лексемы, выражающей понятие - отражаются концептулой вш .

4. Функциональная лексема, обозначающая признак начала причинной части ответа, в котором раскрывается причинно-следственное отношение. Например, лексемы ‘потому что’, ‘так как’, ‘если’ и т.п. отражаются концептулой в:.

5. Функциональная лексема, обозначающая признак начала следственной части ответа, в котором раскрывается причинно-следственное отношение. Например, лексемы ‘то’, ‘тогда’, ‘значит’ и т.п. отражаются концептулой

а2.

Таким образом, концептулы второй группы (обозначим, К2) включают следующее множество грамматически ролей:

К2= { вРА , вРр , вш , в: , в:2 }.

Здесь в - признак грамматических ролей.

Специальная роль лексем отражает специфику элементов ответа на конкретный вопрос в заданной предметной области, т.е. в определенном контексте. Выделяются следующие специальные лексемы и отражающие их концептулы:

1. Необязательная лексема, т.е. лексема, отсутствие или наличие которой в ответе не влияет на смысл ответа. Отражается концептулой ЬК

2. Запрещенная лексема, т.е. лексема, наличие которой в ответе недопустимо (рассматривается как ошибка). Отражается концептулой Ь2.

3. Неопределенная лексема, т.е. лексема, не предусмотренная АВТОРом курса. Отражается концептулой ЬКБ.

2 Здесь и далее буква «а» обозначает текст ответа

4. Интервальная лексема, т.е. лексема, которая накладывает некоторое ограничение на понятие или отношение (указывает область действия, например, ‘2К памяти’, ‘все операторы’ и т.д.).

Интервальная лексема при 88 отражается концептулой Ы8 .

Аналогично записываются другие концептулы для интервальных лексем:

Ь10 - при 80, Ь1А - при 8А, Ь1Р - при 8Р, - при отношениях.

Таким образом, концептулы третьей группы (обозначим К3) включают следующее множество специальных ролей:

к3= {ьм ьг, ькб, и8 , Ь10 , иА , иР , ик } .

Здесь Ь - признак специальных ролей.

В рассмотренном нами тексте (1а) главное понятие ‘8^ отражается концептулой 88, ‘переводит’ - ЯА, ‘82‘ - 8А, ‘в’ - вРР, ‘83’ - 8Р. Здесь концептулы 88, ЯА, 8а, вРР, 8Р образуют цепочку 88 —> ЯА —>8А —> вРР —> 8Р (1к)3

В сочетании концептул (1к) передается смысл: «Понятие, относительно которого задан вопрос, воздействует на понятие-аргумент и получает понятие-результат». (1)

Данный смысл является инвариантным относительно лексем, выражающих конкретные понятия или отношения (т.е. не зависит от конкретного значения). В отличие от грамматики ЕЯ, совокупности правила сочетания грамматических категорий ЕЯ (подлежащее, сказуемое, определение и др.), правила сочетания концептул назовем концептуальной грамматикой.

Введем понятие Ключевого Параметра (КП).

КП - это определенная последовательность символов, предусмотренная АВТОРом и обязательная в ответе. Например, КП могут быть любые лексемы, числа, знаки, формулы, программы и т.п.

3. Семантическая классификация вопросов и ответов.

На основании введенной классификации ТО, СО, понятий ФАКТОРа и КП производится семантическая классификация текстов: вопросов АВТОРа и ответов обучаемого.

На форму задания вопросов не накладывается специальных ограничений. Ограничения естественным образом исходят лишь из того требования, что вопрос должен быть однозначно понят обучаемым (т.е. по тексту вопроса должно быть понятно, раскрытие какого смысла требуется в ответе). Так, выделяются следующие типы вопросов и соответствующие классы ответов.

I. Вопросы, требующие явного задания в ответе КП (без учета отношений

между понятиями; отношения явно заданы в вопросе). Сюда относятся вопросы: ‘Напишите программу вычисления функции на Паскале’, ‘Назовите состав

компилятора’.

Этому типу вопросов соответствуют классы ответов, в которых обязательно явно содержатся КП. Например, ответы выборочного типа (даны несколько ответов, необходимо указать правильный ответ); ответы типа "ДА - НЕТ"; ответы фиксированно-конструируемого типа (когда дается часть ответа и необходимо дописать недостающие лексемы); численные ответы и т.п.

II. Вопросы, требующие раскрытия в ответе ТО одного ФАКТОРа.

Это вопросы следующего типа: ‘Что выполняется раньше: компиляция или загрузка?’, ‘Как связаны состав вещества и его физические свойства?’, ‘Что легче -железо или дерево?’, ‘Назовите предназначение информационного обеспечения САПР’ и т.п.

Выделяются следующие классы ответов, раскрывающие одноименные ТО: СОСТАВ, ВКЛЮЧЕНИЕ, ДЕЙСТВИЕ, СОСТОЯНИЕ, ВРО, ПРО, КЛО, КЧО. Выделение классов ответов не зависит ни от предметной области, ни от понятий ПО. Поэтому в примерах ответов по классам конкретные понятия заменены на обобщенные представления, обозначение 8! - это обобщенное представление некоторого понятия. Пусть имеется некая ПО, с понятиями {81 , ..., 81 , 81+1 , 81+2 , 81+3 ,

81+4 , 81+5 , 81+6 , 81+7, 81+8 , ...}.

СОСТАВ - это класс ответов, в которых понятие раскрывается через его ТО СОСТАВ с составляющими понятиями:81 состоит из 81+3 и 81+4. (6а)

3 Здесь и далее буква «к» обозначает сочетание концептул

ВКЛЮЧЕНИЕ - это класс ответов, в которых понятие раскрывается через ТО ВКЛЮЧЕНИЕ к другому понятию, содержащему его как часть: Б1

включается в Б1+1 . (7 а)

СОСТОЯНИЕ - это класс ответов, в которых понятие раскрывается через его состояние (ТО СОСТОЯНИЕ): Б1 играет. (8а)

ДЕЙСТВИЕ - это класс ответов, в которых понятие раскрывается через отношение действие (ТО ДЕЙСТВИЕ) к другим понятиям: Б1 перемещает Б1+2 . (9а)

ВРО - это класс ответов, в которых понятие раскрывается через его отношение (ТО ВРО) к другим понятиям по некоторым временной шкале: Б1 выполняется раньше Б1+1. (10а)

ПРО - это класс ответов, в которых понятие раскрывается через отношение (ТО ПРО), отражающее его положение в пространстве относительно других понятий: Б1 выполняется раньше Б1+2 . (11а)

КЛО - это класс ответов, в которых раскрывается количественное отношение (ТО КЛО) понятия к другим понятиям:Б1+1 больше, чем Б1 . (12а)

КЧО - это класс ответов, в которых раскрывается качественное отношение понятия к другим понятиям: Б1+2 легче, чем Б1 . (13а)

III. Вопросы, требующие раскрытия в ответе СО одного ФАКТОРа. К этому типу относятся вопросы: ‘Какую функцию выполняет компилятор?’, ‘Назовите предназначение загрузчика’ и т.п.

Такому типу вопросов соответствуют классы ответов, в которых ФАКТОР раскрывается через СО.

Например, выделен класс ответов ФУНКЦИЯ. В этом классе ответов ФАКТОР раскрывается через его СО ФУНКЦИЯ:Б1 переводит Б1+6 и Б1+7 . (14а)

IV. Вопросы, требующие раскрытия в ответе произвольной комбинации ТО и/или СО одного ФАКТОРа. К данному типу относятся вопросы: ‘Дайте описание вещества К’, ‘Что вы знаете о кибернетике?’, ‘Дайте определение компилятора’.

Этим вопросам соответствуют классы ответов, в которых ФАКТОР раскрывается через его ТО и/или СО. Выделяются следующие классы ответов:

1. ОПИСАНИЕ - это класс ответов, в которых раскрываются произвольные комбинации ТО и/или СО ФАКТОРа с другими понятиями: Б1 состоит из Б1+3 , Б1+4 , Б1+5 . Переводит Б1+6 и Б1+7 и выполняется раньше Б1+1 . (15а)

2. ОПРЕДЕЛЕНИЕ - это класс ответов, в которых ФАКТОР раскрывается

через ОП - обобщающее понятие (т.е. понятие на более высоком уровне в иерархии) и класс ОПИСАНИЕ (т.е. комбинацию ТО и/или СО ОП с другими понятиями). Например, к этому классу можно отнести ответ: ‘Студент - это человек, который обучается в вузе’. (16а)

3. ПРИЧИНА - это класс ответов, в которых раскрывается условие

существования некоторых отношений ФАКТОРа с другими понятиями. Предполагается, что ФАКТОР следствия и его отношения с другими понятиями заданы в вопросе. Например, рассмотрим текст ответа: ‘ Дерево не тонет в воде, потому что удельный вес дерева меньше удельного веса воды’. (17а).

Если это ответ на вопрос: ‘Почему дерево не тонет в воде?’, то ответ относится к классу ПРИЧИНА. Здесь ФАКТОР следствия ‘дерево’ и его отношение с объектом ‘вода’ дается в самом вопросе. Часть ответа ‘Потому что удельный вес дерева меньше удельного веса воды’ раскрывает условие существования указанного следствия.

4. СЛЕДСТВИЕ - это класс ответов, в которых раскрывается следствие от существования некоторых отношений ФАКТОРа с другими понятиями. Предполагается, что ФАКТОР причины и его отношения с другими понятиями даны в самом вопросе. Тот же пример в этом случае демонстрирует ответ на вопрос: ‘Что следует из того, что удельный вес дерева меньше удельного веса воды?’. Здесь ФАКТОР причины ‘удельный вес дерева’ и его отношение ‘меньше’ к другому понятию ‘удельный вес воды’ даются в вопросе. В части ответа: ‘Дерево не тонет в воде’ раскрывается следствие от существования указанного условия. В ответах на вопросы типа ФАКТОР не меняется в процессе просмотра текста (т.е. предполагается, что ответы содержат информацию только относительно одного ФАКТОРа).

V. Вопросы, требующие раскрытия в ответе более чем одного ФАКТОРа. Например, к ним относятся вопросы следующего типа: ‘Расскажите о Казанском университете’, ‘Докажите теорему’, ‘Сформулируйте алгоритм выполнения

аналитической реакции в растворе’ и т.п. Этому типу вопросов могут соответствовать ответы, в которых ФАКТОР меняется в процессе просмотра ответа. Например, выделены следующие классы ответов, в которых содержатся ФАКТОРы, связанные только общим контекстом:

ДЕТАЛИЗАЦИЯ. В ответах этого класса происходит детализация понятий, состоящих в некотором отношении с ФАКТОРом.

Например, пусть задан вопрос V типа: ‘Какая связь существует между институтом и заводом?’. Ответом может быть текст, относящийся к классу ДЕТАЛИЗАЦИЯ: ‘В институте разработана САПР, которая используется для проектирования токарных приспособлений, которые внедряются на заводе’. (18а)

В этом ответе три ФАКТОРа - ‘институт’, ‘САПР’, ‘токарные

приспособления’. Раскрываются следующие отношений: ‘институт разработал

САПР’, ‘САПР проектирует токарные приспособления, ‘токарные приспособления внедряются на заводе’.

Разбиение текстов на семантические классы осуществляется по типу отношения ФАКТОРа, раскрываемого в данном ответе, и не зависит ни от конкретной ПО, ни от понятий данной ПО, ни от конкретного языка общения с системой. Это позволяет строить эффективные предметно-независимые анализаторы, ориентированные на раскрытие определенного типа отношения ФАКТОРа в рамках соответствующего класса ответов.

Также как и в случае выделения типов отношений, каждая группа классов ответов 1^ может быть расширена АВТОРом.

При семантическом подходе к типизации вопросов и классификации ответов имеется прямая связь между типом вопроса и классом ответа. Принадлежность ответа к некоторому классу ответов определяется не по его объему и содержанию, и не по форме вопроса, а по типу вопроса АВТОРа и по ожидаемому смыслу.

Индивидуальные концептуальные грамматики

Семантическим классам ответов соответствуют присущие им схемы сочетания концептул, передающие специфический (обобщенный) смысл ответов данного класса (значений вопросов). Схемы сочетания концептул (формулы), соответствующие правильной передаче ожидаемого смысла, названы индивидуальными концептуальными грамматиками (ИКГ). Каждая ИКГ передает определенный смысл - назовем его каноническим смыслом. Смысл текста, формируемый из лексем на основе этой ИКГ, назовем поверхностным (конкретным).

Канонический смысл ИКГ расшифровывает однозначно. Например, в сочетании концептул ББ —> ЯБО —> БО —> БО —> БО (2к) передается смысл:

‘ ФАКТОР находится в некотором отношении с тремя другими понятиями. Дано отношение ФАКТОРа - ЯБО’. Этот канонический смысл не зависит ни от ПО, ни от понятий, ни от классов ответов, основанных на данной ИКГ. Таким образом, смысл введения ИКГ заключается в сведении семантического анализа текста к синтаксическому анализу его канонического представления в условиях, определенных некоторым контекстом.

При формировании текста одна и та же ИКГ может быть основной для формирования текстов различных классов.

Например, следующие тексты основаны на одинаковом сочетании концептул (2к), т.е. основаны на одной ИКГ и имеют идентичный глубинный смысл, но раскрывают различный поверхностный смысл:

1) Б1 включается в Б1+1 , Б1+2 , Б1+3 (19а)

2) Б1+2 состоит из Б1+4 , Б1+5 , Б1+6 (20а)

3) Б1+5 влечет Б1+1 , Б1+3 , Б1+ (21а)

4) Б1+1 находится на Б1+7 , Б1+3 , Б1+8 (22а)

Здесь текст (19а) относится к семантическому классу ВКЛЮЧЕНИЕ, текст

(20а) - к классу СОСТАВ, текст (21а) - к классу ДЕЙСТВИЕ, текст (22а) - к классу ПРО.

Некоторые семантические классы ответов (с идентичными конструкциями) имеют идентичные ИКГ, следовательно, семантических классов больше, чем ИКГ. Совокупность ИКГ составляет концептуальную грамматику, ориентированную на контекст. Рассмотрим ИКГ выделенных семантических классов ответов. Описание ИКГ будем проводить в нотации Бэкуса-Наура.

В ответах на вопросы типа 1 значащими являются только КП.

Пусть задан вопрос типа 1, скажем: ‘Определите наименьший общий

делитель следующих чисел: 10, 125, 35’. Ответ: ‘5’. Ответ на вопрос содержит ожидаемый КП - число 5.

ИКГ классов ответов на вопросы типа 1 (обозначим, ИКГ1) имеет следующее формализованное представление:

<ИКГ1> :: = 88*

Здесь и далее в ИКГ символ * («звездочка») - признак возможного повтора концептулы.

Ответы семантических классов на вопросы типа II определяются схемой понятие — отношение — понятие. В этих ответах значащими являются понятия и ТО между ними.

Рассмотрим возможные ответы на вопрос: ‘Что выполняется раньше:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

программа компиляции или загрузки?’

- компиляция выполняется раньше загрузки (23а)

- загрузка выполняется после компиляции (24а)

- раньше, чем загрузка (25а)

- раньше загрузки (26а)

- раньше компилятор (27а)

- после компилятора (28а)

Здесь ‘компиляция’ есть ФАКТОР (88), ‘загрузка’ - 80, ‘раньше’ - временное отношение понятия ‘компиляция’ к понятию ‘загрузка’: Я80, ‘после’ - ВРО понятия ‘загрузка’ к понятию ‘компиляция’ - Я08 .

Ответы 23а-28а, соответственно, имеют следующие формализованные

представления:

1. ББ —> Ибо —> БО (1к)

2. БО —>Яоб —> ББ (2к)

3. ЯБО —> вш —> БО (3к)

4. ЯБО —> БО —> вш (4к)

5. Ибо —> ББ (5к)

6. ЯОБ —> ББ —> вш (6к)

Здесь ш - обозначение модификатора; вш - после отношения Я принимает значения типа ‘чем’, ‘нежели’ и т.п.; вш - после понятия имеет значение падежного окончания слова.

Классы ответов, раскрывающих ТО понятий, имеют идентичные ИКГ (обозначим ИКГ2):

<ИКГ2>: : = ББ *—> Ябо *—> БО* | Ябо *—> ББ* | ББ* —> Ябо * | БО* —>

-Жоб *—> ББ* I Яоб *—> БО* І БО* —> Яоб * I (Ябо —> Ом)* —>

—> БО* | Ябо *—> (БО —> Ом)* | (Ябо —> Ом)* —> БО* | Яоб —> (ББ —>

—>Ом)*

Знак ‘|’ обозначает альтернативное вхождение сочетаний концептул. Круглые скобки (,) служат для объединения концептул разных типов.

ИКГ классов ответов на вопросы типа III являются определенной (фиксированной) комбинацией ИКГ классов ответов на вопросы типа II. В этих ответах значащими являются понятия и СО между ними.

Рассмотрим возможные ответы на вопрос типа III: ‘Какую функцию выполняет компилятор?’

1. переводит исходный текст на языке высокого уровня в объектный текст в машинных кодах (29а)

2. получает ЯМК из ЯВУ (30а)

3. компилятор переводит ЯВУ в ЯМК (31а)

Здесь отношение ‘переводит’ есть ЯА , отношение ‘получает’ - ЯР, понятия ‘текст на языке высокого уровня’, ‘ЯВУ’ - Б А, ‘текст в машинных кодах’, ‘ЯМК’ - БР, предлог ‘из’ - вРА , предлог ‘в’ - вРР, понятие ‘компилятор’ есть ФАКТОР - ББ.

Формализованные представления ответов, соответственно, имеют вид:

1. ЯА —> БА —> вРР —> БР (7к)

2. ЯР —> БР —> вРА —> БА (8к)

3. ББ —> ЯА —> БА —> вРР —> БР (9к)

Таким образом, ИКГ классов ответов ФУНКЦИЯ имеет следующее описание: <ИКГ ФУНКЦИЯ> :: = [ББ* —> ]((Яа* —> (ОРР —> БР* —> БА* | БА* —> —>ОРР —> БР*) | ЯР* —> (ОРА —> БА* —> БР* БР* —> ОРА —> БА*)) | ((ОРР —> БР* —> Яа* —> БА* | БА* —> ЯА* —> ОРР —> БР*) КОРА —> —> БА* —> Яр* —> БР* | БР* —> Яр* —> ОРА —> БА*)))

Квадратные скобки [,] означают необязательное вхождение.

ИКГ классов ответов, соответствующих вопросам типа ГУ-^ являются произвольной комбинацией ИКГ классов ответов на вопросы типа II и III. Рассмотрим, например, ответ на вопрос РУ типа:

‘Расскажите о компиляторе’.

Ответ: ‘Состоит из лексического и семантического анализатора, включает также этапы генерации и оптимизации кодов. Переводит ЯВУ в ЯМК и предшествует этапу загрузки. Компилятор входит в состав операционной системы и находится в библиотеке системы’. (32а)

В этом ответе класса ОПИСАНИЕ значащими являются понятия: ‘лексического’, ‘синтаксического’, ‘генерации’, ‘оптимизации кодов’,

‘операционной системы’, ‘библиотеке системы’ - БО, ‘компилятор’ - ББ, отношения ‘компилятора’: КО ‘состоит из’ и КО ‘включает’ относятся к ТО СОСТАВ (ЯБО), КО ‘переводит’ относится к СО ФУНКЦИЯ (ЯА), КО ‘предшествует’ относится к ТО ВРО (ЯБО), КО ‘входит в’ относится к ТО ВКЛЮЧЕНИЕ (ЯБО), КО ‘находится в’ относится к ТО ПРО (ЯБО); понятия ‘ЯВУ’ - БА, ‘ЯМК’ - БР, предлог ‘в’ -вРР . Формализованное представление данного ответа имеет следующий вид:

[ ББ —> ] Ябо —> БО —> БО —> [ ББ —> ] Ябо —> БО —>

—> Б0—> [ ББ—> ] Яа —> БА—> ОРР —> БР—> [ ББ—> ] Ябо —>

—> БО —> ББ —> Ябо —> БО —> [ ББ —> ] Ябо —> БО

Таким образом, данное представление есть комбинация шести цепочек концептул, раскрывающих шесть отношений понятия ‘компилятор’.

ИКГ классов ответов на вопросы типов II и III: СОСТАВ - СОСТАВ -ФУНКЦИЯ - ВРО - ВКЛЮЧЕНИЕ - ПРО соответственно. ББ в квадратных скобках [,] означает неявное (контекстное) вхождение.

В примере (15а) раскрываются ТО СОСТАВ, СО ФУНКЦИЯ и ТО ВРО ФАКТОРа Б1 . В этом ответе значащими являются понятия Б1 - ББ, Б1+3 , Б1+4 , Б1+5 - БО, Б1+6 - БА, Б1+7 - БР, КО ‘состоит из’ относится к ТО СОСТАВ (ЯБО), КО ‘переводит’ - к СО ФУНКЦИЯ (ЯА ), КО ‘раньше’ - к ТО ВРО (обозначим - ЯБО ), предлог ‘в’ - вРР .

Формализованное представление ответа следующее:

ББ —> Ябо —> БО —> БО —> БО —> [ББ —> ] Яа —>

—> ОР—> [ББ —> ] Ябо —> БО (10к)

Данное представление ответа есть комбинация ИКГ классов ответов: СОСТАВ - ФУНКЦИЯ - ВРО.

В ответе (17а), относящемся к классу ПРИЧИНА, значащими являются понятия ‘удельный вес дерева’ - ББ, ‘удельный вес воды’ - БО, КО ‘меньше’ - ЯБО . Формализованное представление ответа имеет вид

ББ —> Ябо —> БО (11к)

Эта последовательность концептул относится к ИКГ класса ответов КЛО. В части того же текста (17а), относящейся к классу СЛЕДСТВИЕ, значащими являются понятия ‘дерево’ - ББ, ‘вода’ - БО, КО ‘не тонет’ относится к ТО СОСТОЯНИЕ - ЯБО , КО ‘в’ - к ТО ПРО - ЯБО .

Формализованное представление ответа имеет вид:

ББ —> Ябо —> [ББ —> ] —> Ябо —> БО (12к)

Данное представление есть комбинация из двух цепочек концептул ИКГ классов ответов СОСТАВ и ПРО.

Таким образом, ИКГ классов ответов ОПИСАНИЕ, ПРИЧИНА, СЛЕДСТВИЕ (обозначим ИКГ4) имеет следующее описание:

<ИКГ4>::=<Т2>* <Т3>* <Т2>* —> <ИКГ4>* <Т3>* —> <ИКГ4>

Здесь Т2 обозначает ИКГ классов ответов на вопросы типа II; Т3 - ИКГ классов ответов на вопросы типа III.

В примере (16а), относящемся к классу ОПРЕДЕЛЕНИЕ, раскрывается комбинация отношений ТО СОСТОЯНИЕ и ПРО. Здесь понятие ‘студент’ есть 88, ‘человек’ - 80П , ‘вуз’ - 80, КО ‘обучается’ относится к ТО СОСТОЯНИЕ, КО ‘в’ - к ТО ПРО.

Формализованное представление ответа имеет вид:

88 —> Боп —> Я8о —> [Бел —> ] —> Я8о —> БО (13к)

ИКГ класса ОПРЕДЕЛЕНИЕ имеет следующее описание:

<ИКГ ОПРЕДЕЛЕНИЕ> :: = [88* —>] БОП —><ИКГ4>[—> 88*]

Причем, имеет место взаимоисключающее вхождение 88*, т.е. 88* входит в сочетание концептул либо вначале, либо в конце, либо отсутствует (присутствует контекстно).

Рассмотрим ответ, относящийся к классу ДЕТАЛИЗАЦИЯ: ‘81 переводит 81+1 в 81+2 , который находится на 81+3 , который выполняется раньше 81+4 , который больше, чем 81+6 ,который стирается’. (33а)

Формализованное представление ответа имеет следующий вид:

SS(1)—> 88(1)ДЕТ—> ЯА —> 8Л—> ОРР —> БР —> ББ(2)ДЕТ—>Я8О —> БО — > 88(3)ДЕТ —>ЯБО —>БО—>88(4)ДЕТ —> Я8О —> От —> БО —>

—> 88(5)ДЕТ—> Ябо (14к)

Здесь концептула 88(1) есть ФАКТОР1 - отражает понятие 81 , 81+1 есть 8А , ФАКТОР2 88(2)=8Р отражает понятие 81+3 , ФАКТОР3 88(3)=80 - 81+3 , ФАКТОР4 88(4)=80 - понятие 81+4 , ФАКТОР5 88(5)=80 - понятие 81+5 . КО ‘переводит’ относится к СО ФУНКЦИЯ - ЯА , ‘находится на’, ‘раньше’, ‘больше’, ‘стирается’ относятся соответственно к ТО ПРО, ВРО, КЛО и СОСТАВ. Все ТО обозначаются концептулой Я80 . Предлог ‘в’ есть вРР .

Формализованное представление ранее рассмотренного ответа (18а) имеет следующий вид:

ББ(1)—> Я8О —> БО —> 88(2)ДЕТ—> Я8О —> БО —> ББ(3)ДЕТ—> Я8О —> БО (15к) Здесь три ФАКТОРа: ‘институт’ - 88(1), ‘САПР’ - 88(2)=80, ‘токарные приспособления’ - 80=88(3), и понятие ‘завод’ - 80, раскрываются через отношение ДЕЙСТВИЕ - ‘построил’, ДЕЙСТВИЕ - ‘проектирует’, ПРО - ‘на’. Таким образом, ИКГ класса ДЕТАЛИЗАЦИЯ (обозначим ИКГ5) имеет следующее описание: <ИКГ5>::=([ББ(1)* —>]ББ(1)ДЕТ —> <О(1)>*)*.

Здесь 88(1) - концептула, отражающая 1-й ФАКТОР; 88(1)ДЕТ обозначение начала детализации 1-го ФАКТОРа; в(1) - часть ИКГ класса ДЕТАЛИЗАЦИЯ с постоянным 88(1), т.е. грамматика в(1) есть ИКГ4 и раскрывает только 1-й ФАКТОР.

Рассмотрим ответ класса ПСО: ‘81 применяется в 8^ , потому что 81+2 плотнее 81+3 ’. Здесь значащими являются понятия 81 - ФАКТОР 1, 81+2 - ФАКТОР2 (возможно, 81= 81+2), 81+1, 81+3 - 80, отношения ‘применяется в’ - ПРО, ‘плотнее’ - КЧО;

функциональная лексема ‘потому что’ - в: .

Формализованное представление данного ответа следующее:

88(1) —> Я8О —> О^ —> 88(2) —> Я8О —> БО (16к)

В ответе (17а) значащими являются понятия ‘дерево’ - 88(1), ‘его удельный вес’ - 88(2); ‘вода’, ‘удельный вес воды’ - 80; отношения ‘не тонет’ - ТО СОСТОЯНИЕ, ‘в’ - ТО ПРО, ‘меньше’ - ТО КЛО. Все ТО отражаются концептулой К-80 .

Формализованное представление этого ответа следующее:

ББ(1)—>Я8О —> [88(1)—>] Я8О —> БО —> О1—> 88(2) —> Я8О —>БО (17к) Таким образом, ИКГ класса ответов ПСО имеет следующее описание:

<ИКГПСО>::=[О/,—>](ББ(1)* —> <О(1)>)* —> [О/к—>](ББ(1)*—> О(1)>)*

Здесь 1=1,2; к=1,2; причем к Ф 1.

Рассмотрим следующий ответ: ‘81 включает 81+ и 81+2 , которые находятся на 81+3 , 81 также переводит 81+4 , которая выполняется раньше 81+5 , которая состоит из

8гШ 81+7 и 81+8 (34а)

Формализованное представление ответа имеет вид:

88(1) —> Я8О —> БО —> БО —> 88(2)ДЕТ —> Я8О —> БО —> 88(1) —>

--> Я8О --> БО —> ББ(3)ДЕТ —> Ябо —> БО —> 88(4)ДЕТ —> Ябо —>

—> БО —> БО —> БО.

Таким образом, данное представление есть комбинация двух ИКГ класса ДЕТАЛИЗАЦИЯ (т.е. ИКГ5):

1. ББ(1) —> Ябо —> БО —> БО —> ББ(2)ДЕТ —> Ябо —> БО и

2. ББ(1) —> Ябо —> БО —> ББ(3)ДЕТ —> Ябо —> БО —> ББ(4)ДЕТ —> —> Ябо —> БО —> БО —> БО

Рассмотренные канонические схемы получены на основе частотных характеристик сочетаний концептул в рамках семантических классов и демонстрируют методологию разработки ИКГ.

Заключение

В статье исследуется одна из наиболее сложных задач в области разработки интеллектуальных экспертно-обучающих систем - задача построения семантического интерпретатора ответов обучаемого.

Как показывает анализ возможностей контроля естественно-языковых текстов в реальных обучающих системах, практически ни одна из исследованных разработок не содержит модули, предназначенной для анализа естественно-языковых ответов обучаемого по смыслу. Задача семантического анализа естественно-языковых текстов в проанализированных нами традиционных АОС не решена, более того, не существует конструктивных методов формального определения семантики.

Подробно рассмотрены особенности анализа вопросно-ответных текстов в ситуации «ожидаемого текста» и «детерминированного контекста» и 6 принципов построения анализатора ответов обучаемого, в целях реализации частного решения задачи семантического анализа ответных текстов на естественном языке на основе прагматически-ориентированного подхода.

Литература

[Андрусенко Т.Б., 1994] Лингвистические структуры в компьютерных учебных средах. -Киев: Наукова Думка, 1994. -160 с.

[Вакуленко В.Н., 1992] База знаний консультирующей системы // Тез. конф. Восток-Запад по новым информационным технологиям в образовании . - М.: МЦНТИ, 1992. -С.37-38.

[ИИ в образовании, 1996] Труды Международного семинара «Искусственный интеллект в образовании» в двух томах (Казань, 1-4 октября 1996 г.)// Под ред. Иванова В.Г., Галеева И.Х. -Казань. -1996.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[Бухараев Р.Г., Сулейманов Д.Ш., 1990] Семантический анализ в вопросноответных системах. - Казань: Изд-во Казан. ун-та. - 1990. -124 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.