Научная статья на тему 'Категория "знание" с позиции нейросемантики'

Категория "знание" с позиции нейросемантики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
245
91
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОЦЕСС / ПРЕДМЕТНАЯ ОБЛАСТЬ / ИНФОРМАЦИОННО-УПРАВЛЯЮЩАЯ СИСТЕМА / ТЕКСТОВАЯ ФОРМА / ОБРАЗ / ИНФОРМАЦИЯ / АВТОСТРУКТУРИЗАЦИЯ / РЕКУРСИЯ / РЕСУРС / НЕЙРОПОДОБНЫЙ ЭЛЕМЕНТ / СТРУКТУРА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бодякин В. И.

Опираясь на модель естественного эволюционного происхождения биологических и психических форм высокоорганизованной материи, знание рассматривается как комплекс обрабатываемой информации из внешней среды и информации о состоянии самой системы, вызванное этой обработкой. Определение знания полностью описываться в системе физических мер: сантиметр-номер-имя, бит, секунда.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Категория "знание" с позиции нейросемантики»

КАТЕГОРИЯ "ЗНАНИЕ" С ПОЗИЦИИ НЕЙРОСЕМАНТИКИ

Бодякин В.И.

(Институт проблем управления РАН, г. Москва) body@ipu.ru

Опираясь на модель естественного эволюционного происхождения биологических и психических форм высокоорганизованной материи, знание рассматривается как комплекс обрабатываемой информации из внешней среды и информации о состоянии самой системы, вызванное этой обработкой. Определение знания полностью описываться в системе физических мер: сантиметр-номер-имя, бит, секунда.

Ключевые слова: процесс, предметная область, информаци-онно-управляющая система, текстовая форма, образ, информация, автоструктуризация, рекурсия, ресурс, нейроподоб-ный элемент, структура

Введение

Человеческая психика достаточно эффективно справляется с управлением в сложных ситуациях, активно используя в рассуждениях размытые понятия, но попытка уточнить эти понятия часто вызывает значительные затруднения. Так, например, определяя наше время как "общество знания", мы не можем дать четкого и объективного определения его фундаментальным понятиям: "информация", "знание", хотя контекстно, т.е. в рамках конструкций естественного языка, эти понятия для нашего восприятия вполне однозначны.

Предполагая естественное эволюционное происхождение биологических и психических форм высокоорганизованной материи, мы считаем, что все характеристики различных типов информационных систем и их механизмов хранения и обработки информации, должны полностью описываться в системе физиче-

51

ских мер: сантиметр-номер-имя, бит, секунда (система СБС) [1,2].

Одно из фундаментальных понятий науки когнитологии, которое также формально не определено - это "знание", трактуется достаточно широко и неоднозначно. В литературе определения понятия "знания" рассматривается как продукт общественной материальной и духовной деятельности людей; идеальное выражение в знаковой форме объективных свойств и связей мира, природного и человеческого. В знании кристаллизуется, преемственно накапливается и объективизируется общественная сила человека. В знании осуществляется перевод разрозненных представлений в теоретически систематизированную, общезначимую форму; удержание того, что может быть сохранено, передано, преемственно развито в качестве устойчивой опоры последующей человеческой деятельности [3]. Знание - это отражение реального мира в сознании. Знание в информатике - это вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому [7]. Как мы видим, данные определения понятия "знания", понятные нам в контексте нашей культуры, но формализовать и сделать их понятными инженеру и доступными компьютеру, т.е. формализовать, очень затруднительно. Тем более что видов "знаний" великое множество. Это и "декларативные ", "процедурные ", "научные", "эвристические", "метазнания", "знания о предметной области" и др. [5,6].

1. Определения основных компонент информационного ресурса

Примем ранжирование компонент информационного ресурса по сложности как: "текстовая форма" < "сигнал" < "образ" < "информация" < "знание". В работе [2] приводятся определения основных компонент информационного ресурса и нейросемантики. Кратко повторим их.

1.1. Текстовая форма

Дискретную форму, выражаемую последовательностью кодов алфавита (А={а, Ь, с, ..., z...}) и отображающую с любой необходимой степенью точности изменение во времени одного из параметров некоторого физического процесса, будем называть текстовой формой (ТФ). Это первый качественный переход от физических квантово-континуальных объектов-процессов предметной области к их возможным дискретным модельным замещениям (образам) в информационно-управляющей системе (ИУС), дополнительно имеющим еще и нематериальную характеристику информационного ресурса - семантическую.

1.2. Нейросемантика

Особенность нейросемантической архитектуры ИУС заключается в том, что когда мы в битах минимизируем в ней отображение ТФ, то получается иерархически сетевая структура в виде многодольного иерархического ацикличного графа (НСС), в вершинах которого "конденсируются" фрагменты ТФ, соответствующие физическим процесса в предметной области. Т.е. в каждом нейроподобном элементе ИУС "стягивается" текст, соответствующий реальному процессу, т.е. автоматически формируется пара: нейроподобный элемент <-» семантика процесса. Это взаимнооднозначное соответствие и породило название направления - нейросемантика.

1.3. Образ

Сформированную ИУС элементарную семантическую единицу, которая замещает процесс-объект предметной области, будем называть образом. Образ - хранится и используется ИУС как неделимое целое (смысловой квант). Образ - соответствует целому числу причинно-связанных процессов предметной области.

Самые простые образы (терминальные) - коды алфавита А текстовой формы. Образы имеют иерархическую природу. Сложные образы состоят из более простых образов. Пример образов: буквы, слоги, слова, фразы и т.д.

Помимо обычных характеристик в единицах измерения ТФ: см., сек. и бит, у образа появляется "имя", которое может измеряться в координатах множества пар, и может быть выражено в пространственной координате.

1.4. Информация

Общепринято, что информация всегда несет какую-либо законченную смысловую нагрузку. Например, фраза: "идет снег" -это информация (она вызывает мысль, например, "пойти на лыжах" и, как следствие, получить от этой прогулки удовольствие). Тогда как "идет" и "снег" - это образы (чтобы эти сообщения вызвали у вас реакцию, вам необходимо получить дополнительные сообщения - ответы на ряд вопросов: "кто или что идет?", "причем здесь - снег?" и ряд других, если конечно "идет" и "снег" не являются ответом на предыдущие ваши вопросы).

Информация является прагматической единицей (квантом) ИУС. Информация всегда имеет определенную грамматикопрагматическую структуру: образы состояния предметной области; образы действия ИУС; Е+, т.е. в тройках (ТФ] - ТФ2 -ТФ3, Е+). ИУС всегда настраивается на восприятие ТФ через эту прагматическую структуру (Е ). которая, в свою очередь, может быть представлена как внутренний образ ИУС (ТФ3). Таким образом, из ТФ выделяется только прагматически окрашенная для ИУС информация.

Особенность конструкции информации заключается в том, что она объединяет себе дискретную часть: ТФ1 , ТФ2 и аналоговую ТФ3 или Е+. Е+ - это своеобразный "эмоциональный" уровень удовлетворенности собственной реакции ТФ2 на ТФ1 . Эта "эмоциональность" пронзает все процессы ИУС, хоть как-то связанные с полученным результатом. Аналоговая форма Е+ позволяет безадресно (глобально, масштабно) управлять настройкой ИУС на получение ею положительных "эмоций" - Е+.

Ценность информации всегда оценивается по величине Е+ в данной структуре. Информация содержит образ управления предметной областью. При отсутствии в информации образа Е+ она впоследствии для ИУС (генетически) игнорируется.

Информация - прагматически причинно-связанная последовательность образов, в виде тройки: <ситуация в предметной области> <реакция ИУС> <оценка>, ориентированная на достижение ИУС какого-либо ее целевого образа предметной области (например, Е+)

1.4. Знание

В литературе определения понятия "знания" рассматривается как: продукт общественной материальной и духовной деятельности людей; идеальное выражение в знаковой форме объективных свойств и связей мира, природного и человеческого. В знании кристаллизуется, преемственно накапливается и объективизируется общественная сила человека. В знании осуществляется перевод разрозненных представлений в теоретически систематизированную, общезначимую форму, удержание того, что может быть сохранено, передано, преемственно развито в качестве устойчивой опоры последующей человеческой деятельности [5,7]. Знание - это отражение реального мира в сознании. Знания в информатике - это вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому [6]. Как мы видим, данные определения понятия "знания", понятные нам в контексте нашей культуры, но формализовать и сделать их понятными инженеру и доступными компьютеру, т.е. формализовать, очень затруднительно. Тем более что видов "знаний" как и традиционных видов "информации" великое множество. Это и "декларативные", "процедурные", "научные", "эвристические", "метазнания", "знания о предметной области" и др.

Знание - эта категория информационного ресурса, требует дополнительных инструментальных особенностей ИУС, которые в данной статье не рассматриваются и которые вполне могут сформироваться у ИУС естественным эволюционным путем. Знание - значительно более сложная категория, чем информация. Так, если в формировании информации достаточно присутствия образов, относящихся только к предметной области, то в

структуру знания необходимо включить еще и образы состояния самой ИУС, возникающие в процессе переработки образов текущего состояния предметной области в данный момент времени.

Текстовые последовательности, как конкретные примеры, относящиеся к одному типу (классу) причинно-следственных процессов ("знанию"), вызывают характерные и однотипные процессы (образы) состояния самой НСС. Формирование (связывание) в единую функциональную подструктуру образов (Л'-элементов). относящихся непосредственно к предметной области и образов состояния НСС, вызванных обработкой ТФ из внешней среды (предметной области) - это и есть физическое представление "образа знания". Таким образом, одноранговое включение в НСС функции рекурсии, позволяет получить TV-элемент, выполняющий "функцию знания", а именно, реагирующий на весь класс примеров, относящихся к какому-либо правилу причинно-следственных процессов для различных объектов, т.е. вычислять семантические закономерности предметной области.

Знание - структура ИУС, включающая в себя причинносвязанное объединение информации (образов) о предметной области и текущей информации (образов) о внутреннем состоянии самой ИУС, вызванном анализируемыми процессами предметной области.

В знании ко всем физическим характеристикам информации (см. выше) добавляются еще образы, состояния самой нейросе-мантической структуры, вызываемые обработкой текущей информации. Для вовлечения этих образов в процессы обработки нейросемантической структуры одноранговой рекурсии (интроскопии), возникает необходимость в дополнительных структурах, которые также реализуются TV-элементами.

Так, если "информация" это структура образов только предметной области, то в структуру знания уже включаются и образы состояния самой информационно-управляющей системы, возникающие в процессе данной переработки сигналов предметной области. Знание - это своеобразная одношаговая рекурсия

информационно-управляющей системы. Использование в качестве программной реализации нейросемантические структуры (НСС), позволяет выделить и проанализировать физическое представление "образа знания" в виде подструктуры нейропо-добных TV-элементов [ 1,2,4].

Знание более контекстно (зависимо от пространственно временного окружения процессов) в рамках предметной области, и ИУС в сравнении с информацией и механизм его настройки более сложен. Другие понятия информационного ресурса, такие как сообщение, данные и др., могут быть легко выведены из вышеприведенных "корневых" определений.

2. Функциональные различия компонент информационного ресурса

Помимо четкого формального различия в данных нами определениях, компоненты информационного ресурса имеют качественные и функциональные физические различия.

Представим, что у нас есть три типа предметных областей: случайная ("белый шум" - БШ), периодическая (колебательные физические процессы, телесериал), реальная (излагающая систематизированное знание), и также три типа ИУС: автомат ("техническая ИС"), животное ("адаптивная ИУС"), человек ("разумная ИУС").

Теперь представим, что сначала процессы в предметной области (ПО) являются "белым шумом" (БШ). Так как, это случайные процессы, то ни "техническая ИС", ни "адаптивная ИУС", ни "разумная ИУС", ничего более чем случайного сигнала (образов), при формировании образов нейросемантической структуры из этого потока выявить не смогут, см. рис. 1.

Ь8еЙг "

_псЛШ/аЬсаЬс...

Сериал ...

_ Реальный

Знание МаШег...

Рис.

Если же представить, что в предметной области будут происходить некоторые априорно неизвестные периодические процессы, то "техническая ИС" (например, бухгалтерская программа "С1"), не настроенная на них, будет воспринимать их как сигнал. "Адаптивная ИУС" - найдет некоторую регулярность или период в этом потоке ТФ, и образ этой регулярности будет рассматриваться как информация из данной ТФ. "Разумная ИУС" из этого потока также более чем регулярности, т.е. образа или информации, выявить не сможет.

Теперь представим, что процессы в предметной области -это интеллектуальный процесс, например, передача "В мире животных". "Техническая ИС" более чем сигнала из данной предметной области не почерпнет. "Адаптивная ИУС" выявит только иерархию различных образов (информацию), а "разумная ИУС" из этого потока выявит семантические закономерности (например, различные классы, отряды животных и т.д.), т.е. выявит знание.

Выводы из этого примера (уже наши с вами семантические закономерности) заключаются в том, что предметная область и ИУС тесно взаимосвязаны. При этом ИУС не может выделить из ТФ более того, что в нег'1 есть, и ИУС не может выявить из ТФ более того, что позволяет ее конструкция (информационная архитектура), см. рис. 1.

Касательно определенных нами компонент информационного ресурса, рассмотрим еще один параметр физических отличий, который заключается в существенно различных объемах

Сигнал С С

С Инфор- мация И

С И Знание

1

памяти, необходимых для полного отображения в ИУС постоянного потока ТФ (ТФ(/)=сопз1:), попеременно состоящего из сигнала, информации, или знания.

Будем предполагать ТФ равномерным потоком, отображающим шумовые, информационные и интеллектуальные процессы. При этом под ИУС будем рассматривать как одну из "разумных ИУС" (рис. 1).

2.1. Ввод в ииформацгюиио-управляющую систему шумовой текстовой формы

Понятно, что отобразить шумовую ТФ без потерь можно только посредством ее полной записи (например, на магнитную ленту). Структуризация априорно неопределенной шумовой ТФ невозможна в никакой ИУС. Теоретически и экспериментально показано, что в этом случае необходимость памяти Яцус под ТФ будут характеризоваться линейной функцией: Япус= к*1 +Ь\, где к и Ы некоторые константы, и при удовлетворении критерия достаточности ТФ будет следовать, что ТФ является принципиально неструктурируемой, т.е. "белым шумом" (рис. 2).

Рис. 2

2.2. Ввод в пнформацпонно-управляющую систему квазиперио-дической текстового формы

Будем считать, что ТФ - это радиопередача на неизвестном языке некоторого сериала типа: "про дона Педро в котором встречаются одинаковые фрагменты ТФ, но между ними нет устойчивых причинно-следственных связей. Это типичная информационная ТФ. За счет того, что ссылки (в битах) на повторяющие образы в НСС существенно меньше, чем сами образы (в битах), то величина компрессии для такой ТФ будет иметь монотонный рост, близкий к логарифмической функции: Rnyc= logit) +Ь2, где, Ь2 некоторая константа (рис. 3).

Рис. 3

2.3. Функционирование информационно-управляющей системы с информацией о знании

Будем преобразовывать в ИУС текстовой поток, сформированный взаимоувязанными причинно-связанными процессами предметной области. В этом случае у ИУС определенной архитектуры появляется возможность не обременять память конкретными фактами (образами), а только один раз построить и запомнить правило, причинно связывающее образы. Например, на основании двух информационных отрезков ТФ:

<\ВСЕ\ ВОЛКИ |СЕРЫ 11А\ \ЕСТЬ\ \ВОЛК\,

| ЗНА ЧИТ\, | А | \ЕСТЬ \ СЕР \ЫЙ\ Е+>

<\ВСЕ\ \ПЕТУХ\И\ КРАСИВ Ы В \ЕСТЬ\\ПЕТУХ\, \\ЗНАЧИТ\, В ЕСТЬ\KPACMB \ЫЙ\Е+>

логически формируется завершенная подструктура (рис. 4).

Рис. 4

А1\ А/З А/2

АН - "ритмические" образы внутреннего состояния ИУС,

Л7 - "повторно" активирующиеся образы предметной области, знак - обозначает найденные границы между образами

Если же затем на вход ИУС поступает неполная фраза, например, <ВСЕ ПЛЮКИ КАНЫ С ЕСТЬ ПЛЮК ЗНАЧИТ С ЕСТЬ >, то не найдя ассоциативно близкого Л'-элемента в информационной области нейросемантической структуры, ИУС включается на поиск ассоциаций в области семантических закономерностей нейросемантической структуры. Здесь ассоциативно активизируется Л'-элемент. который отображает структуру, приведенную на рис. 4. В результате, на выходе ИУС будет сформирована ТФ - <КАНЫИ>, как итог активации образов ИУС и предметной области: Л2 + Ы|И [1,2].

2.4. Ввод в пнформацпонно-управляющую систему шумовой текстовой формы с информацией о знании

Понятно, что если формируются TV-элементы, аналогичные показанным на рис. 4, то у ИУС отпадает дальнейшая необходимость в записи в НС С информационных отрезков ТФ, которые перекрываются образами семантических закономерностей в нейросемантической структуры. Таким образом, информационные отрезки ТФ, на которых сформированы семантические закономерности, в память ИУС не записываются. Затраты ИУС необходимой памяти Rnус под такие ТФ будут нулевые, а функция Rnyc= const{t), см. рис. 5.

Рис. 5

По экспериментальным данным, соответствующим функции Рцус= сотМ^), можно утверждать, что данный текстовый поток содержит информационные ТФ, на которых строятся в ИУС подструктуры знания, состоящие из образов предметной области и образов ИУС.

Таким образом, судя по характеру функции 1(цуГ(1) можно объективно классифицировать процессы предметной области на "шумовые", "информационные" и "интеллектуальные" ("разумные").

Отметим, что с точки зрения "операционной системы" ИУС оперирование различными элементами информационного ресурса, "образом", "информацией" и "знанием" осуществляется различными типами образов-операторов - А'-элс ментов. Принцип действия всех этих образов-операторов подобен; различие 62

лишь в том, что они включаются на разных этапах обработки ТФ. Так, первоначально ТФ обрабатывается "образом распознавания", далее включается "образ оценки-действия" и затем "образ оператора знания".

Информационный ресурс всегда связан с материальным носителем (бумага, камень, акустическая и электромагнитная волны, состояния молекул и различных полей и т. д.). В данной работе мы рассмотрели только статические особенности информационного ресурса, т.е. наличие или отсутствие той или иной категории информационного ресурса (сигнала, информации или знания). Проявление всех информационных категорий - это всегда переходный процесс, имеющий сигнальную форму -"есть" или "нет" в данном отрезке ТФ "образ" или "информация", т.е. категория "информация" имеет двойственную характеристику. Ее потенциальное наличие или отсутствие определяется в статической форме ее носителя, а само проявление "информации" возможно только в процессе взаимодействия ее носителя с ИУС.

Еще одна особенность, которую не хотелось бы упустить, заключается в том, что одна единица "знания" соответствует целому множеству конкретных единиц "информации", т.е. целому классу.

Заключение

Формализовать активно используемые современной цивилизацией такие понятия информационного ресурса как: "сигнал", "образ", "информация", "знание" жизненно необходимо, особенно в "информационную эпоху".

Это необходимо для формирования основ научного мировоззрения. Прежде всего, формирования представлений об информационных процессах как одних из основополагающих понятий науки: пространства-времени, вещества, энергии и информации, на основе которых строится современная научная картина мира. Также необходимо рассмотрение единых информационных принципов строения и функционирования самораз-

вивающихся ИУС различной природы. И, в конченом счете, в формировании общенаучных и общекультурных навыков работы с информацией, хотя бы на уровне, как мы уже работаем с категориями времени, пространства и энергии.

Из этого следует вся важность и ответственность в скорейшем наведении порядка нашего научного понимания сути информационных процессов. И сложности на этом пути имеют вполне объективный характер. Это и психофизическая ограниченность человека [1,2], а также и отсутствие приборного арсенала, измеряющего "величины информационности", кроме как человеческого сознания, которое до сих пор для науки также остается Великой тайной. Эту сложность хорошо иллюстрируют слова А. Эйнштейна: “В нашем стремлении понять реальность мы подобны человеку, который хочет понять механизм закрытых часов. Он видит циферблат и движущиеся стрелки, даже слышит тиканье, но не имеет средств открыть их. Если он остроумен, он может нарисовать себе картину механизма, которая отвечала бы всему, что он наблюдает, но он никогда не может быть вполне уверен в том, что его картина единственная, которая могла бы объяснить его наблюдения. Он никогда не будет в состоянии сравнить свою картину с реальным механизмом, и он не может даже представить себе возможность и смысл такого сравнения: " [8].

Литература

1. БОДЯКИН В.И. Куда идешь, человек? (Основы эволюциоло-гии. Информационный подход). - М. СИНТЕГ, 1998, 332с. http ://www. ipu. ru/stran/bod/monograf.htm

2. БОДЯКИН В.И. Определение понятия "информация" с

позиций нейросемантики. М.: ИЛУ РАН. 2006

http://www.mtas.ru/search_results.php?short_view=0&publicati on_id=3033

3. Большая советская энциклопедия. - М.: 1977. - Т. 27. 1

4. УОСЕРМЕН Ф. Нейрокомпьютерная техника. М.: Мир. 1992. - 240 с.

5. УРСУЛ А.Д. Природа информации, философские очерки // М.: Политиздат, 1968. - 288 с.

6. Философский словарь / под ред. И.Т.Фролова - 4-е изд. -М.: Политиздат, 1981. - 445 с.

7. Философский энциклопедический словарь. - М.: Советская энциклопедия, 1983, С. 217-218.

8. ЭЙНШТЕЙН А., ИНФЕЛЬД Л. Эволюция физики / Пер. с англ. М., 1966. С. 30.

i Надоели баннеры? Вы всегда можете отключить рекламу.