Научная статья на тему 'Эволюция систем компьютерных данных в становлении и развитии компьютерной репрезентации знания'

Эволюция систем компьютерных данных в становлении и развитии компьютерной репрезентации знания Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
286
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНЫЕ ДАННЫЕ / КОМПЬЮТЕРНЫЕ ЗНАНИЯ / ПРЕДМЕТНАЯ ОБЛАСТЬ / МОДЕЛИ РЕПРЕЗЕНТАЦИИ ДАННЫХ / ЭВОЛЮЦИЯ СИСТЕМ КОМПЬЮТЕРНЫХ ДАННЫХ / ДЕКЛАРАТИВНЫЙ ТИП КОМПЬЮТЕРНОЙ РЕПРЕЗЕНТАЦИИ ЗНАНИЯ / ПРОЦЕДУРНЫЙ ТИП КОМПЬЮТЕРНОЙ РЕПРЕЗЕНТАЦИИ ЗНАНИЯ / СТАНОВЛЕНИЕ И РАЗВИТИЕ КОМПЬЮТЕРНОЙ РЕПРЕЗЕНТАЦИИ ЗНАНИЯ / COMPUTER DATA / COMPUTER KNOWLEDGE / SUBJECT AREA / EVOLUTION OF COMPUTER DATA SYSTEMS / DECLARATIVE TYPE OF COMPUTER REPRESENTATIONS OF KNOWLEDGE / PROCEDURAL TYPE OF COMPUTER REPRESENTATIONS OF KNOWLEDGE / FORMATION AND DEVELOPMENT OF COMPUTER- REPRESENTATION OF KNOWLEDGE / REPRESENTATION MODEL OF DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иноземцев В. А.

В статье проводится философско-методологическое исследование трансформации систем компьютерных данных в становлении и развитии проблемы компьютерной репрезентации знания. В работе осуществляется анализ важнейших теоретических конструктов информатики и искусственного интеллекта (ИИ), таких как «предметная область», «объект», «свойство объекта», «отношение между объектами» и ряда других, благодаря которым происходит формирование из компьютерных данных компьютерных знаний, а также декларативного и процедурного типов компьютерной репрезентации знания в ИИ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Evolution of computer data in the development of computer representations of knowledge

The article presents the philosophical and methodological study of transformation of computer data systems in the development of computer problems of representation of knowledge. The work analyzes the major theoretical constructs of informatics and artificial intelligence (AI) such as "subject area", "object", "object property", "relationship between objects" and a number of others, due to which there is a formation of computer data computer knowledge as well as declarative and procedural types of computer representations of knowledge in AI.

Текст научной работы на тему «Эволюция систем компьютерных данных в становлении и развитии компьютерной репрезентации знания»

ответить на вопрос, в силу чего обеспечивается становление единства науки и на их основе формирование философии как формальной науки. Он утверждал, что подводя единичные явления под понятия и законы, мы обобщаем их, таким образом, возможно восхождение к наивысшему единству.

Однако в реальности объективизация знания, которую В.В. Лесевич полагал средством достижения истины, содержала в себе номиналистическую тенденцию, своими методами обеспечивала спекулятивные результаты, близкие к положениям столь критикуемой им метафизики. Основу объективации составляла редукция "элементов опыта", логическое комбинирование понятий с целью очищения опыта от априоризма. Синтез теоретических начал конкретных наук достигался за счет средств дескриптивизма, в интерпретации русского эм-пириокритика феноменолизируя аналитико-рационалистическую форму.

Подводя итог, можем отметить, что В.В. Лесевич в своих пометках прошел сложный путь от правоверного позитивиста до сторонника научно-критической философии, которую он считал высшим этапом развития позитивизма и которую активно пропагандировал. Его заслуга заключается в привнесении идеи положительного знания в русское общественное сознание, в стремлении найти ему практическое гуманистическое наполнение. Другое обли-чие воззрений В.В. Лесевича - методологические "поиски", попытки определить место философии в структуре научной методологии, постоянное внимание к методам познания. Вместе с тем следует отметить, что разработка методологии науки ограничивалась у него анализом роли субъективного метода, абсолютизация последнего привела к отрицанию онтологии, реальность явления мира ставилась в зависимость от возможностей критически мыслящей личности.

Литература

1. Де Ла-Серда (Де-Роберти). Краткое объяснение // Слово, 1878, № 3.

2. Емельянов Б.В. Русский позитивизм XIX век // Общественные науки. История философии, 2010, № 2(77).

3. История русской философии // Под общ. ред. М.А. Маслина, 2007, с. 307-311.

4. Кареев Н. И., Лесевич В.В. // Современность, 1906, № 1

5. Лесевич В.В. Собр. соч. в 3 т., 1 и 2, М., 1915.

6. Шкуринов П.С. Позитивизм в России XIX века. М., 1980.

7. Матюшенко З.Г., Самсонова Н.Г. Позитивизм в России: ранний этап // Известия МГТУ «МАМИ» № 4(18), 2013, т. 2.

ЛОГИКА И МЕТОДОЛОГИЯ НАУКИ

Эволюция систем компьютерных данных в становлении и развитии компьютерной репрезентации знания

к.ф.н. доц. Иноземцев В.А. Университет машиностроения [email protected]

Аннотация. В статье проводится философско-методологическое исследование трансформации систем компьютерных данных в становлении и развитии проблемы компьютерной репрезентации знания. В работе осуществляется анализ важнейших теоретических конструктов информатики и искусственного интеллекта (ИИ), таких как «предметная область», «объект», «свойство объекта», «отношение между объектами» и ряда других, благодаря которым происходит формирование из компьютерных данных компьютерных знаний, а также декларативного и процедурного типов компьютерной репрезентации знания в ИИ.

Ключевые слова: компьютерные данные, компьютерные знания, предметная область, модели репрезентации данных, эволюция систем компьютерных

данных, декларативный тип компьютерной репрезентации знания, процедурный тип компьютерной репрезентации знания, становление и развитие компьютерной репрезентации знания.

Исследование выполнено при финансовой поддержке РГНФ в рамках проекта проведения научных исследований («Логический инструментарий и философские основания современной науки»), проект № 14-23-01005.

Фактором, детерминирующим генезис и эволюцию проблемы компьютерной репрезентации знания, наряду с развитием алгоритмических языков программирования, является эволюция систем компьютерных данных. Обе линии в совокупности обуславливают формирование из компьютерных данных компьютерных знаний. В связи с этим остановимся на философском и логико-методологическом анализе развития систем компьютерных данных и теоретических конструктов информатики, с помощью которых осуществляется описание структуры предметных областей в этой науке.

Одним из важнейших теоретических конструктов информатики и искусственного интеллекта (ИИ), применяемым для репрезентации данных и знаний, является такой конструкт как «предметная область» (ПО). Подобно большинству базовых конструктов многих наук он не имеет точного формального определения. Любая предметная область - это специальным образом выделенный и описанный фрагмент действительности. Совокупность объектов различного вида вместе с существующими между ними отношениями составляет объектное ядро этой области, обладающее онтологическим статусом. Предметные области в информатике и ИИ образуют совокупности описаний следующего вида: 1) объектов некоторых фрагментов действительности; 2) свойств выделенных объектов и отношений между ними; 3) воздействий на выделенные объекты и отношения между ними со стороны внешней среды; 4) обратных воздействий выделенных объектов и отношений на внешнюю среду [8, 10]. Объекты предметных областей в информатике имеют не только материальную, но и идеальную природу.

Теоретический конструкт «ПО» соответствует определенному огрублению реальности, при котором выделяются те объекты, свойства объектов и отношения между объектами, которые представляют определенную прагматическую ценность и фиксируются в базах данных и базах знаний. Конструкт «ПО» соответствует целенаправленной первичной трансформации онтологической картины мира в гносеологическую картину мира, которая в последующем закрепляется в памяти компьютеров в качестве моделей репрезентации знания. Такие модели не должны противоречить гносеологической картине мира. Однако в отличие от последней эти компьютерные модели имеют точно очерченный формализованный характер.

В настоящее время в информатике и ИИ, с одной стороны, существует множество определений теоретических конструктов «объект» и «предмет», с другой стороны, эти конструкты в силу того, что являются базовыми, достаточно часто провозглашаются специалистами в информатике и ИИ как первичные, неопределяемые. В том случае, когда эти конструкты задаются, их определения опираются как на традиционные логико-математические и лингвистические идеи, восходящие к Г. Фреге, Ч. Пирсу и Ф. де Соссюру, так и на современные представления. Теоретический конструкт «предмет» в информатике и ИИ используется в том случае, когда объекты, существующие независимо от пользователей, становятся носителями определенной совокупности свойств и входят в отношения, представляющие интерес для пользователей. Иными словами, предметы - это объекты, но уже сами ставшие фокусом рассмотрения, наблюдения и носителями определенных свойств. Один и тот же объект воспринимается разными информационными системами как разные предметы. Предметы выступают как результат абстракции некоторых объектов и огрубления фрагментов действительности, при котором игнорируется бесконечное многообразие свойств и взаимодействий объектов. Таким образом, предметы в информатике и ИИ - это модели реальных объектов: конструкт «объект» имеет в них онтологический статус, в то время как «предмет» - гносеологический статус.

Теоретический конструкт «объект», как известно, играет важную роль как в филосо-

фии, так и в логике и методологии научного познания. Обычно научная теория полагает некоторые объекты своего рассмотрения существующими; универсум таких объектов составляет онтологию данной теории. В этих случаях говорят об онтологических допущениях языка теории. В современной логической семантике, сформировавшейся в основном благодаря работам А. Тарского, не постулируется идея о том, что в качестве объектов предметных областей должны рассматриваться только реально существующие объекты. Концепция предметных областей в логической семантике, в особенности в семантиках модальных логик, предполагает наличие действительных, возможных и виртуальных объектов. Мыслимость возможных объектов в этих семантиках означает их понимание как интенциональных объектов, т.е. объектов, на которые направляется внимание человеческого сознания. В современной логической семантике для решения проблем, связанных с выяснением статуса различных типов объектов, создаётся концепция предметных областей, называемая формальной онтологией. В формальной онтологии исследуются формальные структуры объектов предметных областей и возможных отношений между ними. Р. Поли говорит о различных вариантах конструирования формальной онтологии. Он выделяет следующие типы формальных онто-логий: 1) онтологию объектов и свойств; 2) онтологию событий; 3) стратифицированную онтологию; 4) трансформационную онтологию; 5) онтологию ментальных конструкций; 6) комбинаторную онтологию [14, р. 42 - 43].

Теоретические конструкты «объект», «свойство объекта», «отношение между объектами» относятся к числу базовых конструктов информатики и ИИ. Поскольку совокупность дискретных объектов и отношений между ними составляет любую предметную область, указанные конструкты применяются при репрезентации компьютерных данных и компьютерных знаний. Эти базовые теоретические конструкты информатики и ИИ можно выразить в терминах логики.

Теоретический конструкт «объект» («информационный объект», «объект предметной области») в информатике и ИИ, как отмечалось ранее, часто объявляется исходным, первичным, неопределяемым. Некоторые исследователи ограничиваются констатацией того, что объект - это «... нечто существующее и различимое, т.е. мы можем отличить один объект от другого» [2, с. 23]. Другие считают объект эквивалентным понятию «сущности», которая определяется ими как «... нечто, имеющее реальность в бытии или в мышлении» [13, р. 13].

Конструкт «объект», и в частности «объект мысли», достаточно широко используется в логике. Е.К. Войшвилло начинает построение теории понятия с исследования основных семантических категорий языковых выражений, таких как термы и предикаторы. Для анализа термов он использует конструкт «объект мысли». Следует отметить, что определения «объекта» в информатике и ИИ достаточно близки определению «объекта мысли», предложенного Е.К. Войшвилло. Он считает, что «объектом мысли может стать лишь то, что обладает качественной определённостью, достаточной для того, чтобы его можно было бы каким-либо образом выделить (описать и указать) и более или менее точно отделить от всего остального» [1, с. 21]. Специалистам в области информатики и ИИ следует учесть замечание Е.К. Войшвилло о недопустимости объединения в одно множество возможных аргументов предиктора предметов произвольной природы, т.к. «... в каждом конкретном случае необходимо уточнение, какие предметы имеются в виду» [1, с. 17].

Объектами в информатике могут быть числа, уравнения, слова, программы, геометрические фигуры, люди (например, учащийся или группа учащихся), другие материальные и идеальные сущности. Объекты подразделяются на простые и составные. Составными называются объекты, состоящие из простых объектов, связанных между собой отношениями. «Отношения» в информатике определяется обычным образом, причём выделяются два класса отношений: отношения между объектами и отношения между типами объектов. Для того чтобы объекты или отношения можно было репрезентировать в знаковых системах, необходимо осуществить их идентификацию. В соответствии с делением на простые и сложные объекты, идентификация объектов в информатике подразделяется на идентификацию простых объектов и идентификацию сложных объектов.

Идентификация простых объектов проводится прямым и косвенным способом. Прямой способ идентификации простых объектов состоит в именовании этих объектов и включает несколько видов. Первый вид прямой идентификации заключается в том, что конкретным объектам даются простые, неделимые имена (константы), которые произвольным образом выбираются из некоторого словаря. Например, пятёрка и 5 являются именами объекта, известного как пятое положительное целое число. При втором виде прямой идентификации классам однотипных объектов, обобщённых по определённым свойствам, даются общие имена, такие как, например, «дом», «цех», «клиент».

Важнейшим видом косвенной идентификации объектов является контекстная идентификация, основанная на использовании такого базового конструкта информатики, как «свойство объекта». Каждый объект характеризуется набором основных свойств (атрибутов). «Свойство объекта» обозначается в информатике также терминами «элемент данных», «поле данных», «поле», «поле записи» (или «тип записи»). Свойства могут быть однозначными, многозначными, либо иметь неопределённое значение. Свойства могут быть иерархическими, т.е. включать в себя другие свойства. Если рассматривать выражения, с помощью которых обозначаются свойства объекта с точки зрения логики, то оказывается, что они представляют собой общие имена. Общие имена - это «выражения, представляющие классы предметов, обобщаемых по некоторым свойствам» [1, с. 13].

Свойства объектов (или «элементы данных» в другой терминологии) имеют значения (количественные или качественные), которые иногда называют также значениями данных. Значения данных представляют действительные данные, содержащиеся в каждом элементе данных. Значения, которые может принимать некоторый элемент данных, могут объединяться во множества значений этого элемента данных. Значения данных иногда называются просто данными [12, р. 15]. Используя логическую терминологию, получаем, что значения данных - это единичные имена. В отличие от единичных неописательных имён таких, как «Москва», «Волга» и другие, в информатике под значениями данных имеют в виду единичные описательные имена.

Большое значение для описания структуры предметных областей наряду с перечисленными выше имеют такие термины, как «экземпляр объекта» и «тип объектов». Экземплярами объектов в информатике называют единичные наборы принимаемых свойствами значений. Множества объектов с одинаковым набором свойств образуют типы объектов. Каждый тип имеет имя. С точки зрения логики «экземпляр объекта» - это элементы объёма общего имени. Имя типа объектов выступает в логике обычно в роли общего имени.

Контекстную идентификацию осуществляют следующим образом. Среди всех свойств объектов (элементов данных) выделяются подмножества (в частном случае - одно), значения которых позволяют однозначно выделить конкретный объект из множества однотипных объектов. Такая совокупность свойств называется ключевым элементом данных, или ключом данного набора объектов. Объекты определяются именами своего типа и значениями идентификаторов. Объекты и, соответственно, типы объектов могут иметь иерархическую структуру. Основное отличие объектов предметных областей от их свойств заключается в том, что объекты обладают относительной самостоятельностью, т.е. объекты могут возникать и исчезать. Свойства же объектов не имеют смысла вне обладающих ими объектов и могут возникать или исчезать только с возникновением или исчезновением соответствующих объектов.

Идентификация составных объектов зависит от идентификации отношений. Идентификация отношений осуществляется путём выбора предикатных символов из некоторого заданного словаря. В отличие от простых объектов, знания о которых выражаются с помощью единичных или общих имён, знания об отношениях выражаются высказываниями (пропозициями), которым приписывается оценка истинности. В информатике различают отношения между объектами и отношения между типами объектов. При описании структуры предметных областей говорят, как правило, о трёх основных видах отношений между объектами: «один к одному», «многие к одному», «многие ко многим». Наряду с отношениями между объектами существуют отношения между типами объектов, важнейшими из которых явля-

ются отношения IS-A (род-вид), PART-OF (часть-целое), HAS-PROPERTY и некоторые другие. Разновидность отношений IS-A, характеризующая переход от вида к роду, называется AKO-отношениями (a kind of), обратными к ним являются отношения INSTANCE-OF. Важнейшей чертой IS-A отношений является то, что свойства высших типов автоматически переносятся на низшие типы.

На этом завершим анализ базовых конструктов, используемых для репрезентации информации о структуре любой предметной области. Введённую при этом неформальную модель компьютерных данных назовём моделью «объектов и отношений». Эта модель отличается от «великих классических» моделей баз данных концептуального уровня: сетевой, реляционной и иерархической, - речь о которых пойдет далее.

Репрезентация данных является формой представления информации (компьютерных данных) в памяти компьютеров. Развитие способов репрезентации данных проходит через следующие этапы: 1) этап репрезентации данных в простейших массивах данных; 2) этап репрезентации данных в векторах, файлах, таблицах, списках; 3) этап репрезентации данных в абстрактных типах данных и системах баз данных. При традиционной репрезентации данных, характерной для первого и второго этапов, исследователи сталкиваются со многими трудностями, важнейшей из которых является избыточность данных, т.е. хранение одних и тех же данных в различных местах. Избыточность данных приводит к их противоречивости, которая является следствием недостаточного контроля данных при внесении изменений. Выходом из создавшегося положения становится создание нового вида систем компьютерных данных - банков и баз данных. В соответствии с концепцией банков данных, данные отделяются от обрабатывающих их программ и объединяются так, чтобы адекватно отображать изменяющиеся состояния некоторых фрагментов действительности и эффективно удовлетворять информационные запросы пользователей. Ядро банков данных составляют базы данных. Дальнейшее совершенствование систем компьютерных данных реализуется в системах баз данных.

Базы данных представляют собой изменяющиеся во времени совокупности компьютерных данных о предметных областях. Репрезентация данных в базах данных выполняется на трёх уровнях: концептуальном, внутреннем, внешнем [2, 4]. Им соответствуют схемы баз данных. Под схемами понимают наборы определённым способом заданных правил, утверждений, определяющих всё множество допустимых состояний баз данных и правил перехода от одного состояния к другому. Концептуальные схемы содержат описания типов объектов предметных областей, их свойств и отношений. Внутренние схемы представляют собой описания способов хранения данных. Внешние схемы ориентируются на пользователей. Концептуальные схемы, которые специфицируются в языках репрезентации данных, репрезентируют основные компоненты предметных областей: объекты и отношения.

Три классические модели баз данных концептуального уровня (модели репрезентации данных): реляционная, иерархическая и сетевая и базирующиеся на этих моделях языки репрезентации данных отличаются способом, с помощью которого соответствующая модель позволяет пользователям репрезентировать отношения между объектами. Совокупности моделей и языков репрезентации данных образуют концепции репрезентации данных: реляционную, иерархическую и сетевую. В информатике выделяется три вида отношений между объектами: «один к одному», «многие к одному» и «многие ко многим» [2, 13]. Кроме того, в информатике вводится также несколько видов отношений между атрибутами различных объектов и атрибутами одного объекта.

Рассмотрим отношения между объектами. Первым видом отношений между объектами является отношение «один к одному», при котором для каждого объекта в одном наборе существует только один находящийся с ним в некотором отношении объект второго набора. Следующим видом отношений между объектами является отношение «многие к одному», при котором каждый объект из первого набора связан с несколькими объектами второго набора, но каждый объект во втором наборе связан не более чем с одним объектом в первом наборе. Наконец, последним видом отношений между объектами является отношение «мно-

гие ко многим», при котором отсутствуют ограничения на множество пар объектов, принадлежащих набору отношений. Отношения между атрибутами также следует разделить на отношения вида «один к одному», «многие к одному» и «многие ко многим». Репрезентация отношений вида «один к одному» является характерной для реляционной концепции, отношений вида «многие к одному» присуща иерархической концепции и, наконец, отношений вида «многие ко многим» свойственна сетевой концепции. В соответствии с избранной концепцией говорят о реляционных, иерархических и сетевых моделях репрезентации данных.

В сетевых моделях репрезентации данных (которые не следует путать с сетевыми моделями компьютерной репрезентации знания) используются табличные и графовые репрезентации. Вершинам графов соответствуют информационные единицы, называемые записями, которые представляют собой специальным образом организованные таблицы, а дугам графов - типы отношений между записями. В отличие от реляционных моделей, в которых запрещается повторение одинаковых строк, в сетевых моделях репрезентации данных такие повторения допустимы. Вторым отличием является явное задание отношений между записями с помощью графов, а не опосредованное, как в реляционных моделях репрезентации данных. В иерархических моделях репрезентации данных в отличие от двух других классических моделей репрезентации данных происходит упорядочивание схем баз данных в древообразные структуры.

Развитие репрезентации данных в системах баз данных проходит в три этапа: 1) этап разработки трех классических моделей репрезентации данных; 2) этап анализа семантических возможностей классических моделей данных; 3) этап создания неклассических моделей данных. На первом этапе (конец 1960-х - середина 1970-х годов) вводятся рассмотренные выше классические модели репрезентации данных: реляционная, иерархическая, сетевая.

Второй этап развития систем баз данных (вторая половина 1970-х - начало 1980-х годов) можно определить как период анализа семантических возможностей указанных моделей репрезентации данных и их дальнейшего совершенствования. Проведенный на этом этапе анализ выявляет значительные трудности построения компьютерной репрезентации данных и знаний о предметных областях действительности при помощи классических моделей. Это сложности в решении таких задач, как идентификация объектов, интеллектуализация интерфейса с банком данных и ряд других.

На третьем этапе (1980-е - 1990-е годы) для решения семантических проблем начинают разрабатываться семантические модели баз данных [3, 8, 10]. Семантические модели баз данных сближаются и переплетаются с моделями компьютерной репрезентации знания. В эти же годы разрабатывается также информационно-логический подход к моделированию баз данных, при котором упор делается на построение самостоятельных формализованных моделей предметных областей с последующим отображением их в модели баз данных.

В развитых моделях репрезентации данных можно выделить две компоненты, хранящиеся в базах данных: интенсиональные репрезентации и экстенсиональные репрезентации. Экстенсиональные репрезентации описывают конкретные объекты предметных областей, конкретные события и факты, а также конкретные явления и процессы. Интенсиональные репрезентации фиксируют закономерности и связи, имеющие место в предметных областях. Экстенсиональные репрезентации относятся к компьютерным данным. Относительно трактовки интенсиональных репрезентаций моделей баз данных единого мнения нет. Специалисты в информатике и теории баз данных говорят о них как о схемах баз данных, представители ИИ - как о компьютерных знаниях.

На основании проведенного анализа можно сделать вывод о том, что на возникновение и развитие проблемы компьютерной репрезентации знания в 1960-е - 1970-е годы наибольшее влияние оказывают две линии развития компьютерных систем. К первой линии относится эволюция алгоритмических языков программирования, рассмотренная в предыдущей статье, и ко второй линии совершенствование систем компьютерных данных, изученное в настоящей работе.

Остановимся на отличии интеллектуальных систем, основанных на компьютерных зна-

ниях, от систем компьютерных данных. В интеллектуальных системах (системах компьютерных знаний) репрезентируется информация, отображающая закономерности структуры и функционирования предметных областей [8, 9]. В системах компьютерных данных хранится конкретная информация об объектах предметных областей, которая репрезентируется в виде формализованных документов (файлов, таблиц и т.д.) [2, 7, 10]. Системы ИИ главной целью имеют получение новых фактов из имеющейся информации [11]. В системах баз данных главное внимание уделяется поиску уже известных фактов из совокупности наличествующей информации. Кроме того, в базах данных основное значение имеет информация, описывающая некоторые объекты и хранящаяся, как правило, в одном месте. Отношения между объектами занимают меньшую часть объема баз данных. В базах знаний, являющихся важнейшими компонентами интеллектуальных систем, отношения между объектами являются основным содержанием. Для репрезентации такого рода информации требуются, например, совокупности высказываний, сделанные на естественных языках об интересующих пользователей предметных областях. Эти и другие причины приводят к созданию концепций компьютерной репрезентации знания - логической, сетевой и фреймовой, которые становятся различными способами решения проблемы компьютерной репрезентации знания. Под концепциями компьютерной репрезентации знания будем понимать совокупности компьютерных моделей репрезентации знания и соответствующие этим моделям языковые и логические средства.

Отметим существенные особенности компьютерных данных и компьютерных знаний. Компьютерные данные - это такая форма репрезентации информации, которая обладает следующими особенностями: 1) неинтерпретируемость; 2) пассивность (активными являются программы); 3) изолированность (все компьютерные данные являются изолированными, и не существует никаких средств установления между ними связей в отсутствии программ) [3]. Переходу от компьютерных данных к компьютерным знаниям способствуют в конце 1960 -х - начале 1970-х годов такие два отмеченных ранее обстоятельства: 1) данные отрываются от обрабатывающих их программ; 2) появляются программы (трансляторы и поисковые программы), которые не зависят от избранных пользователями предметных областей.

Наряду с этими обстоятельствами при создании интеллектуальных систем появляется необходимость в выявлении, упорядочивании разнообразных компьютерных данных, сведений эмпирического характера, теоретических положений и эвристических соображений из соответствующей области науки или иной профессиональной деятельности (в особенности при конструировании экспертных систем). Необходимо при этом задавать способы обработки этих сведений с помощью компьютеров так, чтобы интеллектуальные системы могли успешно использоваться в решении задач, для которых они предназначаются. Это приводит к изменениям в характере компьютерных данных: они начинают усложняться, появляются структурированные компьютерные данные. Процедуры, связанные с обработкой данных, также усложняются.

Большинство исследователей в информатике и ИИ отмечают, что существуют специфические особенности, отличающие компьютерные знания от компьютерных данных. Под компьютерными знаниями понимается такая форма репрезентации информации, которая обладает рядом особенностей. В качестве специфических особенностей компьютерных знаний Д.А. Поспелов выделяет следующие особенности: 1) внутренняя интерпретируемость; 2) структурированность; 3) связность; 4) активность [8].

Однако интерпретируемость можно признать специфической особенностью компьютерных знаний лишь с некоторой оговоркой, т.к. эта особенность явно просматривается уже в реляционных моделях баз данных, где имена столбцов являются атрибутами отношений, имена которых указываются в строках. Вторая особенность знаний - структурированность -предполагает декомпозицию сложных объектов на более простые объекты, а затем установление между ними различных отношений типа IS-A, PART-OF, HAS-PROPERTY. Вместе с тем эти типы отношений используются уже в сетевых и иерархических моделях баз данных. Поэтому структурированность можно считать особенностью компьютерных знаний также с определенной оговоркой. Третья особенность - связность - является специфической особен-

ностью компьютерных знаний, т.к. у связности не существует аналогов в случае моделей баз данных. Дело в том, что знания связываются не только структурно. Они должны отражать закономерности относительно фактов, процессов, состояний, поэтому необходимо введение временных, пространственных, каузальных отношений между ними. Специфика вводимых отношений над элементами сложных объектов или процессов определяет особенности знаний о тех или иных объектах, процессах.

Наконец, последняя особенность - активность - является особенностью как человеческих, так и компьютерных знаний. Однако активность у людей и компьютеров проявляется по-разному. Люди в процессе освоения мира действуют, как правило, следующим образом: они ставят перед собой цели, активизация которых вызывает реализацию процедур, приводящих к желаемым результатам. Этот механизм свидетельствует о том, что у людей активными являются знания, которые вызывают активизацию пассивных процедур. При использовании компьютеров (особенно на первых этапах) наблюдается обратная ситуация: роль активного начала играют программы, т.е. процедуры, а данные пассивно хранятся в памяти компьютеров. Позднее данные начинают выступать в качестве источников решения задач. В последние десятилетия активность знаний вызывается состояниями баз знаний в случае обнаружения неполноты или частичной противоречивости находящихся в них знаний. Обнаружение противоречий в знаниях или знаний, несовместимых в рамках одного описания становится побудительной причиной для построения процедур, приводящих к преодолению противоречий и появлению новых знаний. Подобные процедуры невозможно или очень трудно реализовать при хранении массивов данных.

Другим важным стимулом активности знаний является неполнота знаний, которая выражается в необходимости их пополнения. Это обстоятельство приводит к построению специальных процедур пополнения описаний имеющихся в интеллектуальных системах компьютерных знаний. Аналогичные процедуры пополнения описаний используются также в процессе понимания текстов на естественных языках. В любых текстах на естественных языках явно сообщаются только необходимые сведения (имеющиеся знания), а все остальное достраивают информационные системы, воспринимающие тексты за счет «логик реального мира» или «псевдофизических логик». Термином «псевдофизическая логика» обычно обозначают широкий класс формальных систем, описывающих временные, пространственные, динамические, каузальные и другие отношения реального физического мира [3]. Сущность операции пополнения состоит в достраивании описаний реальных ситуаций с помощью псевдофизических логик, которые отражают знания о закономерностях реального мира. Указанные замечания относительно каждой из особенностей компьютерных знаний дополняют и корректируют подход к их определению, который предлагается Д.А. Поспеловым. Однако они не изменяют его главного содержания. Именно благодаря этим особенностям компьютерных знаний реализуется переход от компьютерных данных к компьютерным знаниям и от баз данных к базам знаний.

В завершении работы сформулируем типологию репрезентации знания в компьютерных науках. Введём термин «тип компьютерной репрезентации знания», под которым будем понимать способ представления знаний, т.е. соглашение относительно описания в компьютерах объектов, фактов, процессов, ситуаций, имеющих место в предметных областях действительности. В компьютерных науках и ИИ обычно выделяют два типа репрезентации знания: декларативный и процедурный.

Появлению этих типов компьютерной репрезентации знания предшествует расчленение всего корпуса человеческого знания на два больших типа: знания «как» и знания «что». Развитие интеллектуальных технологий, а первоначально информационных технологий, происходит по пути перехода от знаний «как» к знаниям «что». Знания о том, как организовать память, как вычислить математическую функцию или как исправить ошибки, компьютеры получают от программистов. Однако интеллектуальный уровень использования компьютеров наступает только в том случае, когда пользователи могут получить ответы на запросы о том, что представляет собой те или иные объекты, понятия, системы действий, что

нужно делать в тех или иных ситуациях, что происходит в тех или иных фрагментах действительности.

На отделение декларативного типа компьютерной репрезентации знания от процедурного типа репрезентации, наряду с изложенными выше обстоятельствами, значительное влияние оказывает такое направление ИИ-исследований, которое называют машинным переводом. Машинный перевод как один из разделов ИИ формируется в конце 1950-х - начале 1960-х годов. Отвлекаясь от специфики данного направления ИИ-исследований, следует отметить некоторое обстоятельство. Именно в работах по машинному переводу впервые актуализируется проблема понимания естественно-языковых текстов как проблема соотнесения их с совокупностью знаний о внешнем мире, которые хранятся в памяти компьютеров. В обычных программах в 1950-е - 1960-е годы декларативный и процедурный типы компьютерной репрезентации знания еще соединяются и переплетаются так, что разделить их невозможно. Декларативный тип репрезентации знания в таких программах оказываются как бы встроенным в тело программ. При машинном переводе впервые осознаётся очевидное для лингвистов обстоятельство: словари, в которых описывается вся необходимая информация, касающаяся лексики, морфологии и частично синтаксиса, должны являться самостоятельными компонентами. Словари отделяются от программ перевода, которые могут модифицироваться, и это никак не сказывается на содержимом словарей. С другой стороны, при сохранении программ перевода, состав словарей может изменяться. Это становится одной из причин разделения декларативного и процедурного типов компьютерной репрезентации знания и приводит к появлению баз знаний.

Знания об окружающем мире и о предметных областях действительности в случае декларативного типа компьютерной репрезентации знания выражаются или в виде совокупности фактов, описывающих отношения между конкретными объектами определенных систем, или в виде закономерностей, описывающих отношения между абстрактными объектами, которые репрезентируют объекты действительности со стороны свойств, существенных для определённых предметных областей. В случае процедурного типа компьютерной репрезентации знания, когда знания тесно связываются с выполнением процессов, они выражаются в виде набора формальных правил - алгоритмов. Ни одна из конкретных компьютерных систем репрезентации знания не использует в чистом виде только декларативного или процедурного типа репрезентации знания, а включает элементы каждого из них. При этом один из этих типов является в данной конкретной системе доминирующим.

В качестве примеров декларативных репрезентаций можно привести следующие: 1) описательные утверждения естественных языков (в том числе содержащие этические нормы, методологические рекомендации); 2) логические модели и языки репрезентации знания; 3) табличные способы репрезентации; 4) сетевые модели компьютерной репрезентации знания; 5) языки репрезентации данных в базах данных и многие другие. Вариантами декларативного типа репрезентаций являются физические законы. Примерами процедурного типа репрезентации знания служат: 1) процедурные утверждения естественных языков; 2) алгебраические системы и модели; 3) алгоритмы; 4) правила.

Большинство конкретных репрезентаций в интеллектуальных системах занимает промежуточное положение между чисто декларативными и процедурными типами репрезентации знания. К их числу относится значительная часть репрезентаций на естественных языках, на алгоритмических языках, на языках баз данных, включающих как средства описания данных, так и средства их обработки, фреймовые модели и языки репрезентации знания.

Главным достоинством процедурного типа компьютерной репрезентации знания является учет специфики конкретных предметных областей, закладываемой в эвристические знания. Эти знания трудно или невозможно выразить в универсальных процедурах декларативного типа. Вместе с тем при использовании процедурного типа репрезентации знания возникает целый ряд проблем: 1) проблема выбора единиц хранения процедурного типа знания; 2) проблема накопления процедурного знания; 3) проблема наличия процедурного типа знания, которое трудно поддаётся строгой формализации (личностные знания, обучение компьюте-

ров ремеслам); 4) проблема модификации знания.

Основное преимущество декларативного типа компьютерной репрезентации знания заключается в том, что в нём отсутствует необходимость указывать способы использования конкретных фрагментов знания. Данное свойство обеспечивает гибкость и экономичность декларативного типа репрезентации знания. При декларативном типе знания рассматриваются как множество независимых или слабо зависимых фактов, что позволяет осуществлять модификацию знаний и обучение простым добавлением или устранением утверждений. Декларативный тип репрезентации знания почти не зависит от особенностей физической организации баз знаний. Однако декларативный тип репрезентации проигрывает процедурному подходу в оперативности получения ответов на запросы. В теоретическом плане все имеющиеся к данному моменту системы и типы компьютерной репрезентации знания эквивалентны в силу того, что они вписываются в символические структуры, присущие основным языкам программирования. Вместе с этим поиск более совершенного и более мощного способа описания предметных областей остаётся и будет оставаться центральной проблемой при создании интеллектуальных систем [4, 5, 6].

В статье осуществлена реконструкция становления и развития двух форм репрезентации информации в компьютерных науках и ИИ-компьютерных данных и компьютерных знаний. Проведено философско-методологическое исследование такой линии генезиса и эволюции проблемы компьютерной репрезентации знания как эволюция систем компьютерных данных. Вместе с еще одним фактором - развитием алгоритмических языков программирования - данная линия привела к появлению и дальнейшему развитию проблемы компьютерной репрезентации знания. В работе установлено, что эти два фактора, переплетясь между собой и накладываясь друг на друга, приводят к формированию из компьютерных данных компьютерных знаний, а также к оформлению декларативного и процедурного типов компьютерной репрезентации знания в ИИ.

Литература

1. Войшвилло Е.К. Понятие. М., МГУ. 1967. 286 с.

2. Дейт К. Введение в системы баз данных. М., Наука. 1980. 463 с.

3. Диалоговые системы в АСУ. М., Энергоатомиздат. 1983. 208 с.

4. Ивлев В.Ю., Ивлева М.Л., Иноземцев В.А. Когнитивная революция как фактор становления новой эпистемологической парадигмы и методологии исследования знания в современной науке // Известия МГТУ «МАМИ» № 1(15), 2013, т. 6. С. 90-99.

5. Ивлев В.Ю., Ивлева М.Л., Иноземцев В.А. Становление новой философско-методологической парадигмы современной науки в условиях информационного общества. М., 2012.

6. Иноземцев В.А. Дедуктивная логика в решении проблемы компьютерной репрезентации // Известия МГТУ «МАМИ» № 1(19), 2014, т. 5.

7. Мартэн Д. Базы данных. М., Радио и связь. 1983. 168 с.

8. Поспелов Д.А. Логико-лингвистические модели в управлении. М., Энергоатомиздат. 1981. 231 с.

9. Представление и использование знаний / Под ред. Х. Уэно, М. Исудзука. М., Мир. 1989. 220 с.

10. Цаленко М.Ш. Моделирование семантики в базах данных. М., Наука. 1989. 287 с.

11. Эндрю А. Искусственный интеллект. М., Мир. 1985. 265 с.

12. Advances in data base theory. N.-Y. Plenum Press. 1981. 432 р.

13. Atre S. Data base. N.-Y., Toronto. John Viley and Sons. 1980. 442 р.

14. Poli R. Ontologia formale. Genova. Marietti. 1992. 236 р.

i Надоели баннеры? Вы всегда можете отключить рекламу.