Философско-методологические принципы логических моделей представления знаний

Милославов Алексей Сергеевич

ФИЛОСОФСКО-МЕТОДОЛОГИЧЕСКИЕ ПРИНЦИПЫ ЛОГИЧЕСКИХ МОДЕЛЕЙ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

А.С. Милославов

Начиная с конца 70-х годов прошлого столетия в том разделе компьютерных наук (computer science), который получил название "искусственный интеллект" (далее - ИИ), происходило формирование нового направления исследований, получившее название "инженерия знаний". Основная идея, определяющая исследования в данной области, заключается в том, что прогресс в области ИИ будет достигнут на пути построения систем, "работающих со знаниями".1 За прошедший до сегодняшнего дня период времени инженерия знаний превратилась в самостоятельную, почтенную сферу научных изысканий, в рамках которой сформировался свой терминологический аппарат, и четко определились основные проблемные направления деятельности специалистов. Одним из них является "представление знаний". Основной целью исследований в этой области можно считать разработку оптимальных принципов (моделей) организации (представления) информации для ее хранения и обработки вычислительной машиной. К настоящему времени сформировалось несколько основных подходов к решению проблемы представления, одним из которых является построение "логических моделей представления знаний".

Несмотря на большое число работ, посвященных разнообразным аспектам использования логических моделей представления, их построение и использование не было подвергнуто анализу в логико-методологическом плане. Специалистам в области компьютерных наук нередко свойственен сугубо эмпирический подход к решению стоящих перед ними проблем. В общем случае он сводится к выполнению следующего набора действий: создание программы, ее испытание, устранение недостатков в работе.2

Представляется, однако, очевидным, что если объектом исследования и моделирования являются такие сущности, как "интеллект" и "знание", то для успешного решения стоящих в области ИИ проблем необходимо ясное осознание философской и логико-методологического базы, от которой отталкивается исследователь.

Представленная работа преследует две цели. Во-первых, выявить метод построения логических моделей представления знаний. Этому посвящена первая часть работы. Во-вторых, сравнить с логико-методологической точки зрения логический подход к представлению знаний с другими подходами: продукционным, сетевым, фреймовым. Эти вопросы рассматриваются во второй части.

I

Чтобы рассмотреть возможность использования аппарата логики для представления знаний, предварительно необходимо дать описание взаимодействия информационной интеллектуальной системы, реализованной на ЭВМ, и мира, в котором система функционирует. Это позволит уточнить те методологические принципы, которые лежат в основе логического подхода к представлению знаний.

1 В нашей работе мы не будем обсуждать вопрос, что понимают под термином "знание" специалисты в области компьютерных наук. Этот вопрос достаточно хорошо исследован как в отечественной, так и в зарубежной литературе. См: Алексеева И.Ю. Человеческое знание и его компьютерный образ. М.: ИФРАН, 1993. 218 с.

2 Такой незамысловатый принцип открыто декларируется, например, в работе Lenat D. , Feigenbaum. On the threshould of knowledge // Artificial Intelligence. 1991. V.47. P. 185--250.

Взаимодействие между ЭВМ и миром может быть представлено с помощью следующей схемы:

^S— машина мир

—A^

Стрелка S в схеме означает восприятие машиной информации о мире, стрелка A означает воздействие машины на мир, являющееся результатом обработки полученной информации. "Интеллектуальный агент вовлечен в бесконечную цепь восприятий реальности, вынесения суждений о ней и выполнения действий". 3

Рассмотрим вопрос о том, что представляет собой мир с точки зрения восприятия его машиной. Информационная интеллектуальная система создается для решения задач. Решение любой задачи требует наличия информации о той части мира, к которой относится задача. Поэтому машине необходимо "знать" не то, что представляет собой весь мир, а только то, что представляет собой часть мира, которая имеет отношение к задаче.

Следует отметить также тот факт, что и в выделенной части мира машине должны быть предоставлены только те факты, которые необходимы для решения задачи. Набор этих фактов представляет конечное множество. Следовательно, мир можно рассматривать как некоторый конечный набор его состояний. Обозначим его через W.

В свою очередь, и машина может быть также рассмотрена как набор ее конечных состояний. Будем обозначать этот набор через M. Пусть m - одно из состояний множества M и пусть w - одно из состояний множества W. Кроме этого, пусть s обозначает один вход для поступления информации в машину из множества S входов. Наконец, пусть а обозначает один из множества A выходов машины. Теперь состояния машины и мира, а также входы и выходы машины можно связать следующим образом: функция "воспр" отображает W в S; функция "пам" отображает S X M в M; функция "действ" отображает S X M в A;

функция "возд" отображает A X W в W (Для имен функций мы используем сокращения слов "восприятие", "память", "действие", "воздействие".)

Теперь поясним смысл предложенных функций. Обратим внимание на функцию "воспр". Она моделирует тот факт, что машина является восприимчивой не к каждому аспекту окружающего мира, а только к той информации, которая касается решаемой задачи. Функция "пам" моделирует поведение машины: состояние машины в любой момент времени является зависимым от предыдущих состояний и множества входных элементов. Следующая функция, "действ", описывает то, как ведет себя машина. Поведение машины зависит от ее состояния и от ее выходов. Наконец, последняя из предложенных функций, "возд", моделирует результат воздействия машины на мир. Этот результат зависит от действий машины (выходов) и текущего состояния мира. Данная схема отношения и взаимодействия между ЭВМ и миром была предложена Н. Нильсоном.4 Она является достаточно общей, чтобы охватить большинство возможных подходов к созданию интеллектуальных машин.

Как может быть истолкована представленная схема в рамках логического подхода к представлению знаний? Состояния машины в таком случае будут задаваться множеством предложений, например, логики первого порядка. Функция "пам" тогда преобразует одно множество предложений в другое множество под воздействием

информации, поступающей извне. Тем самым меняется состояние машины.

3

Вудс У. А. Основные проблемы представления знаний // ТИИЭР. 1986. Т.74. N10. С.34

4 Nilsson N.J. Logic and artificial intelligence // Artificial Intelligence 1991. V.47. N1-3. P. 31-56.

Мир "для ЭВМ" является набором предложений, математической структурой, которая состоит из объектов, функций и отношений. Отсюда можно сделать вывод, что машина имеет дело не с самим миром, а с моделью мира.5

Отметим, что в основе методологии использования логической формы представления знаний в информационных интеллектуальных системах лежит философско-гносеологическая позиция, согласно которой окружающий интеллектуального агента мир является слишком сложным и разнообразным, чтобы его можно было полностью постичь. Интеллектуальный агент создает идеализированные модели, которые используются как инструменты для решения стоящих перед ним задач. Точность моделей всегда ограничена соображениями простоты и эффективности их использования. Требование к модели предъявляется только одно - она должна обеспечивать эффективное решение задачи. По этой причине одна модель может быть " более истинной", чем другая, если она обеспечивает более удовлетворительное решение. Могут также существовать несравнимые модели, приводящие к совершенно разным решениям.

При этом, однако, нужно помнить, что модель, какой бы удовлетворительной она ни была, всегда будет выражать лишь неполное знание об объективной реальности. Неполнота знания, выражаемого моделью, может быть вызвана хотя бы одной из следующих причин. Во-первых, окружающая действительность меняется с момента получения последних сведений о ней до момента окончательного формирования модели. Во-вторых, интеллектуальный агент за приемлемое время не может узнать о мире все, что он даже в принципе может узнать. Наконец, в-третьих, интеллектуальный агент может не обладать понятийным аппаратом, достаточным, для того чтобы описывать некоторые аспекты действительности, вследствие чего ограничиваются возможности создаваемых искусственных систем представления знаний.

Можно говорить о том, что деятельность конструктора системы включает в себя элемент "угадывания". Отмечая наличие этого элемента, Н. Нильсон указывает сходство в работе создающего интеллектуальную систему человека с деятельностью ученого. В частности, он пишет по этому поводу: "Наш конструктор в таком же затруднении, как и ученый; ученый воображает описания мира и постепенно очищает их, пока они не станут более полезными".6 Для обозначения "угадывания" Н. Нильсон использует термин " концептуализация".

При этом для каждого выделенного объекта мира в концептуализации создается объектная константа, для каждого выделяемого в мире отношения создается константа отношения, для каждой выделяемой в мире функции создается функциональная константа. Используя эти конструкции, а также синтаксис исчисления предикатов, можно составить множество предложений, которое будет выражать выбранную концептуализацию и то декларативное знание, которым, по замыслу создателя, должна обладать машина.

Теперь уточним, в каком смысле можно говорить о том, что набор предложений, записанный в языке исчисления предикатов, выражает знания о мире. Для этого необходимо определить понятия "интерпретация" и "модель" для предложений исчисления предикатов. Интерпретация состоит из: (1) приписывания отношения каждой константе отношений (предикату); (2) приписывания объекта каждой

5 Даже если учитывать возможный механизм для восприятия машиной окружающего мира, знание ЭВМ, все равно является знанием модели проблемной области, поскольку программа для распознавания образов, требующаяся в подобном случае, создается, во-первых, для различения не всех возможных предметов, а лишь необходимых для достижения поставленных целей, и, во-вторых, сама программа распознавания является записью на некотором языке и, следовательно, имплицитно задает некоторую языковую модель проблемной области.

6 Nilsson N.J. Logic and artificial intelligence // Artificial Intelligence. 1991. V.47. N1-3. P.36

объектной константе; (3) приписывания функции каждой функциональной константе; (4) процедуры для приписывания значений "истина" или "ложь" каждой замкнутой формуле. Последняя процедура, как известно, включает в себя оценку базисных атомарных формул, для чего используются упомянутые выше приписывания, и далее используются таблицы истинности для приписывания значений неатомарным формулам. Более сложной является оценка квантифицированных формул, но в данном случае ее можно рассматривать как основанную на интуитивном смысле кванторов.

Любая интерпретация, для которой все предложения во множестве оцениваются как истинные, называется моделью этого множества предложений.

Теперь можно следующим образом переформулировать задачу конструктора интеллектуальной информационной системы:

1) выделить в мире интересующие связи, объекты, функции;

2) использовать первопорядковое исчисление предикатов для выражения предполагаемой концептуализации, для этого:

a) указать интерпретацию выражений этого языка в терминах объектов, связей и отношений;

b) составить множество предложений языка так, чтобы интерпретация этих предложений оказалась бы моделью множества предложений.

Множество предложений составляет "базу знаний" информационной системы. Пусть оно обозначается Y. При создании интеллектуальной системы фиксируется начальное состояние базы знаний, выражаемое множеством предложений Y0. Если машина взаимодействует с миром, то упомянутая выше функция "пам" производит последовательность состояний машины, каждое из которых выражается множествами предложений Y0, Yi, Y2, ... .

Подводя итог, можно сказать, что интеллектуальная система, обладающая множеством предложений, "знает мир" в том смысле, что предложения допускают множество моделей. Это множество является, возможно, лучшим приближением картины мира, имеющейся у людей, создающих интеллектуальную систему, к тому, что действительно представляет собой мир в пределах решаемой задачи.

Необходимо отметить, что многое из сказанного может быть отнесено не только к представлению знаний на основе логики предикатов, но и к другим способам представления. При любом способе представления знания в декларативной форме самой главной, по сути дела, является проблема концептуализации. Действительно, изобретение предполагаемой модели подразумевает создание согласованного описания интересующей области действительности. Описание должно включать в себя, кроме явных объектов, функций и отношений, некоторые представления о мире, которые являются "интуитивными" или " общераспространенными", т.е. такими, которые в повседневной деятельности людей по решению разного рода проблем не высказываются явно, но предполагаются общеизвестными, а иногда не осознаются вообще. Для сложных предметных областей извлечение знаний подобного типа часто является непростой задачей. Особые трудности возникают при представлении таких сущностей, как процессы, события, цели, время. Часто оказывается сложным четко сформулировать знания о повседневном мире. 7

Проблема концептуализации является актуальной для любой модели, используемой для представления знаний в искусственной интеллектуальной системе. Другое дело, что отправные точки для построения этих моделей могут быть различны. Для того чтобы указать отправные точки, лежащие в основе различных схем представления знаний и подтвердить наличие общей для всех схем проблемы

7

Н. Нильсон отмечает: «Решить, что сказать, труднее, чем сконструировать язык, на котором это будет сказано». См.: Nilsson N.J. Logic and artificial intelligence // AI. 1991. V.47. N1-3. P.41

концептуализации, рассмотрим в самом общем виде другие модели представления знаний и укажем их достоинства и недостатки. Это позволит, кроме всего прочего, дать более объективную оценку логических моделей представления.

II

Самой первой по времени и до сих пор наиболее распространенной является модель представления знаний, использующая правило продукций и называемая продукционной (или процедурной).

Продукция - это правило, имеющее вид "если [условие], то [действие]". Общую форму продукции можно представить следующим образом: г, Д Р, Л^Б, 0,

где Л^Б - обычная продукция "если [условие], то [действие]", именуемая также "ядром продукции"; Р - это условие применимости, т.е. некоторые внешние условия, определяемые фактами, не входящими непосредственно в Л; Б - элемент, характеризующий сферу проблемной области базы знаний; 0 - постусловия продукции, указывающие на те изменения, которые необходимо внести в базу знаний после реализации данной процедуры.

Продукционной системой называется любая совокупность продукций. Интеллектуальные системы, основанные на продукциях, предполагают наличие трех основных компонентов. Первый из них - это совокупность правил (собственно "система продукций"), составляющих "базу знаний". Вторым компонентом является память для кратковременного хранения информации ("рабочая память"). В рабочей памяти могут храниться предпосылки для решения конкретных задач, кроме того, в нее могут отправляться результаты выводов, полученные после применения правил. Третья составляющая систем, основанных на продукциях, - "механизм логического вывода". Являясь необходимой компонентой, он позволяет использовать правила либо в соответствии с содержимым рабочей памяти, либо в соответствии с информацией, поступающей из внешнего мира.

Пусть W, как и ранее, обозначает множество состояний внешнего мира, К - это множество состояний "рассуждающей системы", а К - это множество правил базы знаний. Д. А. Поспелов предлагает следующую классификацию продукций:

1) продукции типа Л„^БГ - левая часть продукции содержит информацию, поступающую из внешнего мира, а правая часть выражает сведения о том, какие изменения произойдут в рассуждающей системе под воздействием поступившей информации; работа этого типа продукций влияет на ход рассуждений;

2) продукции типа Л„^Бк - условная часть этого типа продукций содержит сообщения, которые следует зафиксировать в базе знаний;

3) продукции типа Лк^Б„ выражает процесс выдачи сообщений из базы знаний во внешний мир, например, в случае обнаружения противоречивой информации в базе знаний;

4) продукции типа Лг^Бк - условная часть продукции описывает факты, полученные рассуждающей системой, которые необходимо зафиксировать в базе знаний (правая часть продукции);

5) продукции типа Лк^Бг - этот тип служит для обмена информацией между базой знаний (условие) и механизмом вывода (действие);

6) продукции типа Л№^Б№ - этот тип называется "продукциями непосредственного отклика";

7) продукции типа ЛГ^Б„ - этот тип продукций описывает воздействие на внешний мир (Б„), порождаемое результатом работы рассуждающей системы (Лг);

8) продукции типа ЛГ^БГ - это продукции, работающие внутри механизма логического вывода;

9) продукции типа Лк^Бк - это процедуры, преобразующие знания в пределах базы знаний. 8

Если рассмотреть предложенную Д.А. Поспеловым классификацию типов продукций с точки зрения схемы, описывающей взаимодействие интеллектуальной системы (машины) и мира, то можно проинтерпретировать эту классификацию в терминах схемы следующим образом. Для выражения функции "пам" служат продукции типов (1), (2), (4), (5), (8) и (9). Действительно, как было сказано, функция "пам", моделирующая поведение машины, выражает зависимость состояния машины от предыдущих состояний и множества входных элементов. Если рассматривать базу знаний машины как набор ее конечных состояний, то продукции типа (2) и (4) будут выражать указанную зависимость - состояние базы знаний будет изменяться под действием информации, поступающей из внешнего мира (продукции типа (2)) и из рассуждающего устройства (продукции типа (4)). Что касается продукций типов (1), (5), (8), то необходимо отметить следующее. В схеме внутренняя "работа" машины выражалась функциями "пам" и "действ". Функция "пам", по сути дела, моделирует работу "механизма логического вывода" (рассуждающего устройства) в интеллектуальных системах, основанных на продукциях. Поэтому, для того чтобы продукции типов (1), (5) и (8) можно было интерпретировать в терминах схемы, необходимо допустить наличие множества функций типа "пам". Продукции типа (1) будут пониматься как правила, выбирающие одну из функций типа "пам" при условии поступления той или иной информации из окружающего мира. Продукции типа (5) выбирают одну из функций множества "пам" в зависимости от информации, поступающей из базы знаний. Продукции типа (8) - это выбор функции из множества "пам", который зависит от информации полученной из самой машины вывода. Преобразования состояний машины могут происходить и вследствие информации, хранящейся в самой базе знаний, что выражается продукциями типа (9).

Кроме функции "пам", продукции типов (4), (5), (8), (9) могут пониматься также как выражающие функцию "действ", которая описывает поведение машины в зависимости от ее состояний и ее выходов. Кроме того, функция "действ" выражается продукциями типа (3), которые описывают то, какие сообщения выдаются из базы знаний.

Для выражения функции "воспр" в классификации Д.А. Поспелова служат продукции типов (1) и (2). Наконец, функция "возд", может быть выражена продукциями типов (3), (7) и (6).

Достоинства и недостатки моделей представления знаний основанных на продукциях, достаточно хорошо исследованы и описаны в литературе, например в работе "Представление и использование знаний".9 Ее авторы среди достоинств продукционной модели указывают следующие свойства:

• простота создания и истолкования отдельных правил;

• простота пополнения и модификации;

• простота механизма логического вывода.

Отмечая недостатки моделей этого типа, японские исследователи перечисляют такие отрицательные стороны, как неясность взаимных отношений между правилами, сложность оценки целостного образа знаний, низкую эффективность обработки, отсутствие гибкости в логическом выводе.

8 Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. М., 1989.

9 Представление и использование знаний / Под ред. Уэно Х., Исидзура. М.: Мир, 1989.

Среди причин, по которым модели представления знаний, основанные на правилах продукций, получили широкое распространение, помимо перечисленных выше достоинств, имеющих технологический характер, следует также отметить гносеологическое основание, определившее широкое распространение продукционных моделей. Дело в том, что, по мнению многих исследователей, большую часть человеческих знаний можно представить в виде правил продукций.10

По этому поводу необходимо сделать несколько замечаний. Бесспорным представляется то, что все каузальные утверждения имеют в естественном языке форму выражения типа "если..., то...". С другой стороны, такую естественно-языковую форму выражения можно придать логическому отношению следования или булевой связке (импликации). Однако общеизвестен тот факт, что логическая (материальная) импликация (или отношение следования) не носит каузального характера в общераспространенном понимании причинно-следственной связи. Поэтому можно поставить вопрос о том, является ли правомерным использование правил продукций для выражения различного рода отношений (в данном случае причинно-следственной связи и отношения логического следования). Иначе вопрос можно поставить так: достаточны ли средства систем продукций для выражения тех знаний, которые могут быть представлены средствами логики?

Действительно, с одной стороны, логическая формула понимается машиной как процедура - на этом принципе основано логическое программирование. Кроме того, механизм вывода, основанный на модели логического программирования, с точки зрения математической структуры эквивалентен механизму вывода, основанному на модели системы продукций. Однако можно указать существенное отличие логической модели представления от продукционной. Оно заключается в том, что логическая программа имеет, помимо процедурной, декларативную семантику, основанную на теории моделей. Наличие декларативной семантики является выражением совершенно другого подхода к моделированию предметной области для представления знаний, чем тот, который лежит в основе моделирования с помощью систем продукций. Иначе говоря, в основании логических и продукционных моделей лежит совершенно разный принцип концептуализации. Действительно, если в основе продукционных моделей лежит описание трансформаций состояний предметной области, то отправной точкой для логических моделей являются истинные утверждения о предметной области. Когда используется логическая модель представления, конструктору-программисту интеллектуальной системы требуется просто сформулировать те утверждения, которые он считает истинными относительно предметной области, а затем перевести эти утверждения на язык требуемого логического формализма. При этом ему не требуется разделять в рамках программы те утверждения, которые выражают факты, и те, которые выражают общие законы (правила). Когда же используются продукции для преставления знаний, конструктору необходимо, прежде всего, представлять себе трансформации, которые происходят в состояниях мира, для того чтобы представить их в форме правил продукций. Конкретные факты, в свою очередь, выносятся за пределы базы знаний и поступают в нее по мере необходимости. Таким образом, в продукционных моделях теряется единообразная форма представления знания о единичном (знание фактов) и знания общего (знание правил). Кроме того, правила в рамках процедурного представления не имеют внутренней связи между собой - они представляют как бы отдельные кванты знания, каждый из которых может быть активирован при поступлении соответствующих данных. В противоположность такому положению дел, в рамках логического подхода к представлению знаний мы имеем правила и факты, связанные вполне осмысленным образом, а именно, с помощью

10 См., напр.: Поспелов Д. А. Моделирование рассуждений. Опыт анализа мыслительных актов. М., 1989

конъюнкции, которая соединяет элементы множества предложений. Можно сказать, что логическая модель представления выражает знание в форме дедуктивной теории, в то время как процедурная - в форме набора правил, между которыми отсутствует внутренняя связь.

Таким образом, можно сказать, что продукционная схема представления не позволяет выразить все аспекты знания, представимые в рамках логических моделей.

Еще одной моделью представления знаний, используемой в интеллектуальных информационных системах, является сетевая модель, именуемая иногда моделью на основе семантических сетей.11

В отличие от рассмотренной выше продукционной модели, где делается акцент на правилах преобразований, допустимых в описываемом мире, в семантических сетях внимание сосредотачивается на описании объектов мира и связей между этими объектами. Представление знаний семантическими сетями, по сути дела, является не более чем представлением простой структуры данных.

Рассмотрим те аспекты сетевых моделей, которые имеют отношение к логике.

Поскольку семантические сети представляют собой структуру данных, то важным моментом при построении сетей является выбор принципа, в соответствии с которым будет производиться структуризация данных. В качестве основных принципов можно указать следующие:

1) классификация - в соответствии с этим принципом объект (индивидуум) следует связывать с его родовым типом;

2) агрегация - эта ось связывает объект с его компонентами (частями);

3) обобщение - этот принцип используется для связи типа с более общим типом; это отношение между типами также называется ¡Б-а отношением и формирует иерархию типов (¡Б-а иерархию);

4) разделение - эта ось группирует объекты и элементы отношений, представляя их так, что если разделение объектов А расположено в иерархии ниже разделения объектов В, то все, что явно представлено в В, явным образом представляется в А.12

Перечисленные выше принципы структуризации данных можно проинтерпретировать в логических терминах. Так, принцип, именуемый классификацией, является выражением отношения принадлежности индивида к какому-либо виду. В свою очередь, принцип, названный обобщением, выражает родовидовое отношение между понятиями. Ось, названная агрегацией, является выражением такой характеристики понятия, как содержание. Наконец, ось, именуемая разделением, может быть проинтерпретирована как выражение связи объема понятия и его содержания. Действительно, видовое понятие содержит в себе все признаки того рода, к которому оно принадлежит.

Из сказанного выше представляется очевидным, что для семантических сетей методологическим основанием является учение о понятии формальной логики. Это можно объяснить следующим образом. В основу представления знаний средствами семантических сетей, как отмечалось выше, положены индивидуумы и отношения между ними. В то же время методология семантических сетей претендует на то, чтобы простая совокупность данных превратилась в "структурированное знание". Но структурировать данные об индивидуумах означает предложить для них классификацию. Классификация всегда предполагает установление отношений типа "род-вид" и/или "целое-часть" между понятиями. Таким образом, чтобы

11 Заметим, что первоначально семантические сети были задуманы как модель представления структуры долговременной памяти в психологии.

12 См., напр.: Mylopoulos J., Levesque H. J. An Overview of knowledge Representation // On conceptual Modelling. Springer Verlag, 1984. P. 3-17.

структурировать данные об индивидах, оказывается необходимым при построении семантических сетей использовать учение о понятии из формальной логики.

Можно указать несколько моментов, в отношении которых сетевые модели представления знаний уступают логическим. Во-первых, это - невыразимость негативной информации. Использование языка логики, со своей стороны, позволяет представлять негативную информацию явным образом. Для этого применяется унарный союз "не-". Во-вторых, использование модальных, временных операторов и кванторов позволяет представлять достаточно тонкие оттенки информации, которые очень трудно (если вообще возможно) представить с помощью семантических сетей. Таким образом, можно сделать вывод, что использование логической модели позволяет представлять информацию, выражаемую на семантических сетях, но сетевая модель представления не обладает выразительными качествами логических моделей.

Рассмотрим еще одну из существующих моделей представления знаний -фреймовую (или объектную). Как известно, она была предложена М. Минским. Он также ввел основные термины, используемые в этой модели.

Ключевым элементом здесь является понятие фрейма. Фрейм - это структура данных для представления некоторого концептуального объекта. Информация, которая относится к фрейму, содержится в слотах. Слот - это составляющая фрейма. В системах, основанных на знаниях, все фреймы взаимосвязаны, при этом объединяются декларативные и процедурные знания.

Общая схема фрейма имеет следующий вид:

{г, [v2;Ы...[vk;gk]},

где г - это имя фрейма, V/ - имена слотов, gj - значения слотов. Если значения слотов не определены, то фрейм называется фреймом-прототипом.

Нас будут интересовать объектные модели только в аспекте сравнения их с моделями логическими. С этой точки зрения необходимо указать на две, на наш взгляд, важные проблемы. Первая из них может быть названа "проблемой информационной эквивалентности" и состоит в следующем. Являются ли фреймы такой схемой представления, которая позволяет представлять информацию, не выразимую средствами языка логики? Известно, что фреймовые модели были предложены М. Минским в качестве альтернативы логическому подходу к моделированию мышления. Это выражается в том, что связанные с фреймовым представлением законы вывода не обладают той строгостью, которая присуща правилам логического вывода. Отсутствие строгости диктуется только соображениями эффективности. По-видимому, для объектных представлений можно было бы развить системы выводов, эквивалентные использованным в логике предикатов. Однако синтаксис таких систем оказался бы весьма громоздким, что лишило бы объектное представление тех достоинств, ради достижения которых оно создавалось.13

В том, что информацию, содержащуюся в фрейме, можно представить формулой или набором формул логики предикатов, нет ничего удивительного. Фреймовое представление - это способ описания ситуаций, объектов и сущностей другого рода. Но, как известно, логика предикатов была развита на основе анализа естественного языка и по этой причине может быть моделью для их построения. Из того, что ситуации, объекты и другие сущности, для представления которых используются фреймы, могут быть описаны в форме текста, можно сделать вывод о том, что не существует принципиальных ограничений на представление этих сущностей с помощью того или иного логического формализма.

13 По этому поводу см., напр.: Логический подход к искуственному интеллекту: от классической логики к логическому программированию / Тейз А., Грибомон П., Луи Ж. и др. М.: Мир, 1990.

Однако факт того, что знания, представленные фреймами, могут быть также представлены средствами логического формализма, не означает эквивалентности методологических принципов, лежащих в основе фреймовой модели представления, с одной стороны, и логической модели, с другой. Логическая модель представляет знание через множество предложений, которые считаются истинными в отношении некоторой предметной области. Фреймовая модель предполагает целостное описание представляемой сущности в рамках некоторой когнитивной структуры.

Если поставить вопрос о том, что представляет собой когнитивная структура, для моделирования которой используются фреймы, то придется затронуть вторую проблему отношения между логикой и теорией фреймов. Эта проблема заключается в отношении между когнитивной структурой, соответствующей фреймам, и понятием, как оно рассматривается в традиционной логике. Так, например, авторы уже упоминавшегося выше коллективного труда придерживаются мнения, что фрейм

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14

соответствует концепту, т.е. понятию.

Вопрос о сопоставлении понятий и фреймов подробно разбирается в монографии И.Ю. Алексеевой.15 В результате анализа возможности отождествления фреймов и понятий как когнитивных структур И.Ю. Алексеева приходит к выводу о необоснованности подобного отождествления. Фрейм нельзя рассматривать в качестве понятия, поскольку одна из характеристик понятия - содержание - не раскрывается через фрейм. Отвечая на вопрос о том, представлением какой когнитивной структуры являются фреймы, И.Ю. Алексеева приходит к справедливому заключению, что "фрейм как знаковая структура служит для представления фрейма как когнитивной структуры".16

Таким образом, сравнительный анализ логической модели с фреймовой, продукционной и моделью на основе семантических сетей демонстрирует различия в подходах к описанию предметных областей, лежащие в основе этих моделей.

Сказанное выше позволяет сделать вывод о том, что использование логической модели позволяет выразить ту информацию, которая представима на других моделях, но некоторые аспекты знания, которые легко передаются средствами логики, не находят своего отражения, если используется фреймовая, продукционная или сетевая модель. Наиболее важным моментом является тот, что логическая модель позволяет представлять знания как совокупность согласованных между собой (непротиворечивых) предложений и предлагает обоснованный механизм обработки этих предложений, концептуально связанный со способом представления.

Литература

1. Алексеева И.Ю. Человеческое знание и его компьютерный образ. М.: ИФРАН, 1993.

2. Вудс У.А. Основные проблемы представления знаний // ТИИЭР. 1986. Т.74. N10. С.32-46.

3. Логический подход к искусственному интеллекту: от классической логики к логическому программированию / Тейз А., Грибомон П., Луи Ж. и др. М.: Мир, 1990.

4. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. М., 1989.

5. Представление и использование знаний / Под ред. Уэно Х., Исидзура. М.: Мир, 1989.

14 Там же.

15 Алексеева И.Ю. Человеческое знание и его компьютерный образ. М.: ИФРАН, 1993.

16 Там же, с.120

6. Mylopoulos J., Levesque H. J. An Overview of knowledge Representation // On conceptual Modelling. Springer Verlag, 1984. P. 3-17.

7. Nilsson N.J. Logic and artificial intelligence // AI. 1991. V.47. № 1-3. P. 31-56.

Философско-методологические принципы логических моделей представления знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Милославов Алексей Сергеевич

Текст научной работы на тему «Философско-методологические принципы логических моделей представления знаний»