Научная статья на тему 'Проблема референтного класса и ее концептуальное, математическое и инструментальное решение в системно-когнитивном анализе'

Проблема референтного класса и ее концептуальное, математическое и инструментальное решение в системно-когнитивном анализе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
377
80
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОБЛЕМА РЕФЕРЕНТНОГО КЛАССА / СИСТЕМНАЯ ТЕОРИЯ ИНФОРМАЦИИ / СИНТЕЗ / АНАЛИЗ / АБСТРАГИРОВАНИЕ / ИДЕНТИФИКАЦИЯ / PROBLEM OF THE REFERENTIAL CLASS / SYSTEM THEORY OF THE INFORMATION / SYNTHESIS / ANALYSIS / ABSTRACTION / IDENTIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Луценко Евгений Вениаминович

В статье рассматривается применение СК-анализа и системной теории информации (СТИ) для решения известной проблемы математической логики и математической лингвистики, получившей название "Проблема референтного класса". Высказывается гипотеза, что данная проблема является проблемой именно этих научных направлений и естественным образом преодолевается в теории и практике систем искусственного интеллекта, в частности системно-когнитивном анализе и его математической модели системной теории информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Луценко Евгений Вениаминович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROBLEM OF THE REFERENTIAL CLASS AND ITS CONCEPTUAL, MATHEMATICAL AND INSTRUMENTAL SOLUTION IN SYSTEMIC COGNITIVE ANALYSIS

In the article we examine the application of the systemic cognitive analysis and the system theory of the information (STI) for the decision of a known problem of mathematical logic and the mathematical linguistics which have received the name "Problem of a referential class". There is a hypothesis that the given problem is a problem of these scientific directions and is naturally overcome in the theory and practice of systems of an artificial intellect, in particular in systemic cognitive analysis and its mathematical model of the system theory of the information

Текст научной работы на тему «Проблема референтного класса и ее концептуальное, математическое и инструментальное решение в системно-когнитивном анализе»

УДК 303.732.4

ПРОБЛЕМА РЕФЕРЕНТНОГО КЛАССА И ЕЕ КОНЦЕПТУАЛЬНОЕ, МАТЕМАТИЧЕСКОЕ И ИНСТРУМЕНТАЛЬНОЕ РЕШЕНИЕ В СИСТЕМНО-КОГНИТИВНОМ АНАЛИЗЕ

Луценко Евгений Вениаминович д.э.н., к.т.н., профессор

Кубанский государственный аграрный университет, Краснодар, Россия

В статье рассматривается применение СК-анализа и системной теории информации (СТИ) для решения известной проблемы математической логики и математической лингвистики, получившей название "Проблема референтного класса". Высказывается гипотеза, что данная проблема является проблемой именно этих научных направлений и естественным образом преодолевается в теории и практике систем искусственного интеллекта, в частности системно-когнитивном анализе и его математической модели системной теории информации.

Ключевые слова: ПРОБЛЕМА РЕФЕРЕНТНОГО КЛАССА, СИСТЕМНАЯ ТЕОРИЯ ИНФОРМАЦИИ, СИНТЕЗ, АНАЛИЗ, АБСТРАГИРОВАНИЕ, ИДЕНТИФИКАЦИЯ

UDC 303.732.4

PROBLEM OF THE REFERENTIAL CLASS AND ITS CONCEPTUAL, MATHEMATICAL AND INSTRUMENTAL SOLUTION IN SYSTEMIC COGNITIVE ANALYSIS

Lutsenko Eugeny Veniaminovich Dr. Sci.Econ., Cand. Tech.Sci., professor

Kuban State Agrarian University, Krasnodar, Russia

In the article we examine the application of the systemic cognitive analysis and the system theory of the information (STI) for the decision of a known problem of mathematical logic and the mathematical linguistics which have received the name "Problem of a referential class". There is a hypothesis that the given problem is a problem of these scientific directions and is naturally overcome in the theory and practice of systems of an artificial intellect, in particular in systemic cognitive analysis and its mathematical model of the system theory of the information.

Keywords: PROBLEM OF THE REFERENTIAL CLASS, SYSTEM THEORY OF THE INFORMATION, SYNTHESIS, ANALYSIS, ABSTRACTION, IDENTIFICATION

Суть проблемы

Суть проблемы референтного класса (лат. ге/егет - сообщающий) на наш взгляд наиболее удачно освещена в основополагающей работе В.М.Резникова "Проблема референтного класса и условные вероятности" [15]. В этой работе В.М.Резников пишет, что впервые на проблему референтного класса обратил внимание Дж.Венн: "Каждая индивидуальная вещь или событие, имеет бесконечное множество свойств или атрибутов, и поэтому они могут рассматриваться как принадлежащие к бесконечному множеству различных классов " [1]. На сайте "Искусственный интеллект: системы и модели"1 данная проблема рассматривается в несколько ином аспекте и разъясняется на примере из области медицинской диагностики. При постановке диагноза врач определяет шансы на то, что данный пациент имеет некоторое конкретное заболевание руководствуясь информацией о признаках данного пациента, включающих не только клиническую картину (симптомы и синдромы, анамнез, данные лабораторных исследований и т.п.), но и учитывая любую другую доступную ему информацию о нем. При решении этой задачи врач сравнивает своего пациента с другими пациентами, информация о которых имеется в его профессио-

1 http://rriai.org. ru/uslovnaya-veroyatno st-5. html

нальной памяти, отражающей профессиональный опыт (прецеденты). На первый взгляд кажется само собой разумеющимся, что чем полнее описание пациента, т.е. чем более широкой является система признаков, и чем точнее это описание, т.е. чем меньше погрешность измерения значений признаков, тем лучше. Однако скоро выясняется, что чем больше признаков учитывается при поиске прецедентов и чем точнее известны их значения, тем меньше вероятность найти эти прецеденты, т.к. строго говоря пациентов с точно такой же системой признаков имеющих абсолютно те же самые значения, что у пришедшего на прием пациента, не существует вообще Из этого делается вывод о том, что невозможно определить референтный (т.е. наиболее подходящий, соответствующий, адекватный) класс, которому бы соответствовали экспериментальные данные о пациенте. И далее добавляется: "Это - одна из неразрешимых проблем в философии науки" (курсив мой, авт.).

Традиционные подходы к решению проблемы

Традиционные подходы к решению проблемы референтного класса на наш взгляд также наиболее удачно освещены в уже упомянутой работе В.М.Резникова [15]. Поэтому в данной статье мы не будем описывать усилия ученых решить проблему референтного класса (за этой информацией отсылаем читателя к работе [15]), и отметим лишь, что "...кульминацией этих усилий стала попытка Карнапа и других ученых разработать строгую индуктивную логику, позволяющую правильно вычислять вероятность любого высказывания на основании результатов любой коллекции наблюдений. В настоящее время считается, что никакой уникальной индуктивной логики не существует; вместо этого любая подобная логика опирается на субъективное априорное распределение вероятностей, субъективность которой уменьшается по мере накопления все большего и большего количества наблюдений" (курсив мой, авт.).

Обсуждение проблемы

Предварительные замечания

Перед тем как предложить возможное решение сформулированной проблемы референтного класса хотелось бы сделать несколько предварительных замечаний.

1. Сначала по поводу определения сущности рассматриваемой проблемы Дж.Венном: поскольку каждая индивидуальная вещь или событие имеет бесконечное множество свойств или атрибутов, то она может рассматриваться как принадлежащая к бесконечному множеству различных классов". Это определение содержит в неявной форме по крайней мере три следующих предположения, причем несоблюдение хотя бы одного из них делает высказывание Дж.Венна неверным:

2 http://rriai.org. щ/т1оупауа-уегоуаШо б^5. Мт!

3 Вместо термина Дж.Венна "Вещь или событие” будем использовать более привычные для нас термины "Объект или его состояние" или просто "Объект".

- во-первых, предполагается, что один объект может одновременно относится только к одному классу, который и является для него рефератным, тогда как вообще говоря один объект одновременно может принадлежать ко многим классам, причем в различной степени;

- во-вторых, предполагается, что все признаки классов имеют одинаковый вес, т.е. в равной степени "говорят" о принадлежности обладающего ими объекта к классу, тогда как это верно только для индивидуальных (сингулярных) объектов, а в общем случае признаки обладают различной степенью характерности для различных классов, но это можно установить только для обобщенных классов, например, полученных методом многопараметрической типизации;

- в-третьих, не учитывается, если множество признаков объекта бесконечно, то из этого вовсе не следует, что оно включает все признаки, т.е. если два множества бесконечны, то это не означает, что они тождественны, например, две замкнутые области на плоскости, содержащие бесконечное количество точек, могут тождественно совпадать, пересекаться или вообще не иметь общих точек, причем если они пересекаются, то в этом пересечении содержится также бесконечное количество точек.

С учетом вышесказанного, на наш взгляд, все эти три предположения Дж.Венна необоснованны и просто неверны. Поэтому высказывание Дж.Венна: "Каждая индивидуальная вещь или событие, имеет бесконечное множество свойств или атрибутов, и поэтому они могут рассматриваться как принадлежащие к бесконечному множеству различных классов" мы бы продолжили так. Да, это верно... но с учетом того, что различные вещи и события (далее: объекты) в разной степени принадлежат различным классам и эта степень принадлежности может изменяться в самых широких пределах от положительной, до нулевой и отрицательной. На практике можно считать, что объект принадлежат к тому классу, степень принадлежности к которому у них наивысшая по сравнению с другими классами и при этом она выше некоторого порога, если же она ниже этого порога, то объект остается неопознанным, т.е. не похожим ни на один из известных обобщенных образов классов в степени, достаточной для того, чтобы отнести его к этому классу. Это возможно потому, что различные признаки объекта могут содержать различное количество информации, причем не только о принадлежности объекта к тем или иным классам, но и о непринадлежности к ним, а также вообще не нести об этом никакой существенной информации. Необходимо также отметить эмерд-жентную природу признаков наблюдаемых объектов и их зависимость от признаков наблюдателя или самого способа наблюдения [12].

2. Из приведенного выше примера проблемы референтного класса с сайта "Искусственный интеллект: системы и модели" для современного специалиста в области систем искусственного интеллекта очевидно, что проблема референтного класса по сути представляет собой "проблему” рас-

познавания образов. Но распознавание образов уже давно не представляет собой проблему, т.к. в настоящее время известно множество различных методов распознавания образов [2, 3], на практике подтвердивших свою высокую эффективность. Проблема, напоминающая проблему референтного класса, может возникать лишь в некоторых из методов распознавания образов. Например:

- в методе к-ближайших соседей, в котором осуществляется не сравнение образа конкретного объекта с обобщенными образами классов, которых в этой модели вообще не формируется, а другими конкретными объектами о которых известно, к каким классам они относятся. Считается, что распознаваемый объект относится к тому классу, к которому чаще всего относятся к наиболее похожих на него объектов-прецедентов;

- в нейронных сетях при так называемом их переобучении, т.е. когда нейроны начинают возбуждаться не при предъявлении сети объектов, похожих на объекты обучающей выборки, а лишь при предъявлении тождественно тех же самых объектов, которые использовались при обучении.

Поэтому мы считаем, что предлагаемое нами в данной статье решение проблемы референтного класса далеко не единственное и приводится лишь по той причине, что оно авторское.

3. Учитывая предыдущие замечания едва ли можно согласиться с тем, что проблема референтного класса "Это - одна из неразрешимых проблем в философии науки"4, по крайней мере с тем, что она действительно неразрешимая, и что она относится к философии науки, а не к другим ее направлениям. Хотя может быть для философии науки, а также математической логике и лингвистике, где эта проблема впервые и была сформулирована и до сих пор не решена, она и действительно является неразрешимой, не смотря на то, что уже давно разрешена в других направлениях науки, например в теории и практике систем искусственного интеллекта. Таким образом можно предположить, что проблема референтного класса - это внутренняя проблема этих направлений науки, неразрешимая внутри них их средствами, но которая вполне может быть решена, если выйти за их пределы или внести в них новые идеи из других научных направлений.

Дополнительные замечания

Интересно, как представлял себе Дж.Венн учет бесконечного количества признаков конкретных объектов и обобщенных классов, не говоря уже о выполнении операций по их сравнению? Чтобы осуществить это скорее всего потребуется бесконечное время или бесконечное количество компьютеров (а также программистов, операторов, сисадминов и т.д.). В принципе подошел бы наверное и один компьютер, но с бесконечной вычислительной мощностью процессора, а также бесконечным объемом опе-

4 http://rriai.org. щ/т1оупауа-уегоуаШо б^5. Иі:т1

ративной и внешней памяти. Но такой компьютер наверное будет создан через бесконечное количество лет.

Что можно сказать "об абсолютно точном" измерении значений признаков? Во многих современных теоретических научных концепциях реальности, например в квантовой механике, даже в принципе нельзя корректно говорить о каких-то абсолютно точных значениях величин. Но допустим, что все же такое "истинное" значение объективно существует. Даже в этом случае любая количественная величина, получаемая в результате измерений, представляет собой сумму ее истинного (абсолютно точного) значения и в принципе полностью неустранимого шума, связанного с погрешностью измерений. Зная характеристики шума, например, что он белый (в среднем равен нулю), или что его частотный спектр лежит в другой полосе, чем частотный спектр полезного сигнала, можно использовать многоканальные системы выделения сигнала из шума, прямое и обратное преобразование Фурье, а также другие методы и эффективно подавлять шум, но все равно не до нуля. Поэтому ни о каких "абсолютно точных" значениях признаков говорить не приходится, даже в принципе. Фактически мы всегда, независимо от того, осознаем это или нет, имеем дело лишь с интервальными оценками количественных величин, т.е. с некоторыми диапазонами или интервалами, внутри которых с некоторой высокой вероятностью (обычно выше 0.95) и находится "истинное значение". Чем меньше значение этих интервалов, тем точнее мы знаем истинное значение, но тем больше информации мы должны получить об объекте (это связано с теоремой Котельникова "об отсчетах"). Для получения абсолютно точного значения величины, например числа р, у которого бесконечное количество знаков после запятой, необходимо бесконечное количество информации, что как мы уже видели выше, практически (да наверное и теоретически) невозможно. Это значит, что говорить об абсолютно точных значениях признаков вообще некорректно.

Замечание о том, что объект принадлежит только к одному классу. Любой реальный объект в общем случае может рассматриваться как взвешенная суперпозиция классов, т.е. как сумма этих классов с различными весами. При этом сами классы, по которым производится разложение объекта, вообще говоря также могут рассматриваться как разлагаемые по другим более фундаментальным классам и т.д. Все это очень напоминает разложение произвольной кривой в ряд по каким-либо функциям. Наиболее известно разложение в ярд Фурье, т.е. по синусам и косинусам различных частот. Но в общем виде о возможности разложения любой функции в ряд говорит теорема Арнольда и обобщающая ее теорема Колмогорова. Возникает вопрос о том, а могут ли существовать такие классы, которые невозможно разложить на более фундаментальные? Если существуют, то возможны и объекты, которые могут принадлежать только к одному классу, т.е. подобные тем, о которых говорил Дж.Венн.

Этот вопрос сходен с вопросом о существовании конечного предела делимости материи, который рассматривался в работе [12]. С математической точки зрения кривую невозможно разложить в ряд по другим кривым если она ортонормированна по отношению к каждой из них, т.е. с каждой из них имеет нулевую корреляцию или независима от каждой из них. В теории рядов рассматриваются так называемые системы базисных функций, по которым и производится разложение в ряд других функций. Одним из обязательных требований, которое предъявляется к системе базисных функций является требование их взаимной независимости, т.е. ортонорми-рованности. Существует более общее понятие, чем система базисных функций: это понятие конфигуратора, которое подробнее будет рассмотрено ниже. В принципе такая кривая, которая ортонормированна ко всей системе базисных функций, может быть добавлена к этой системе что увеличивает размерность соответствующего пространства и качественно увеличивает возможности данного конфигуратора по отображению реальности. Есть еще и другой вариант, когда например синус разлагается в ряд Фурье: тогда получается он сам. Если в ряд по базисным функциям разлагается одна из них, то в результате получается она сама. Ясно, что добавление ее к системе базисных функций ничего в ней не меняет. В этом случае разложение в ряд возможно, но бессмысленно. Но можно считать, что оно невозможно, в том смысле, что в результате разложения функции в ряд она не меняется, т.е. как бы "далее не разлагается". Но тот же самый "далее не разлагаемый в ряд Фурье" синус может быть разложен в ряд по другим функциям: экспонентам или спецфункциям (например, функциям Бесселя и Гамма-функциям), а также по произвольной системе взаимно неорто-нормированных функций общего вида. Вопрос о том, существуют ли такие функции, которые далее неразложимы по всем известным функциям, остается открытым. Но автор высказывает гипотезу, что возможны, т.к. ясно, что на любой момент времени нам не могут быть известны абсолютно все в принципе возможные функции. С другой стороны из этого же предположения следует, что всегда могут быть найдены новые функции, по которым они будут разлагаться в ряд. Поэтому по поводу неявно высказанного Дж.Венном предположении о том, что объект относится только к одному классу, которое ему представлялось само собой на столько очевидным, что он даже не сформулировал его и не стал обсуждать, можно сделать вывод, что скорее всего оно нереалистично, так как на практике это всегда не так и возможно по-видимому, только в каких-то частных случаях, да и то, только из-за исторической ограниченности наших знаний на любой момент времени.

Предлагаемое решение проблемы референтного класса

Предлагаются решение проблемы референтного класса с применением системно-когнитивного анализа (СК-анализ) [2, 3] на трех уровнях: концептуальном, математическом и инструментальном:

- концептуальное решение основано на базовой когнитивной концепции системно-когнитивного анализа;

- математическое решение основано на системной теории информации;

- инструментальное решение, представляющее собой инструмент или способ (технологию и методику ее применения) обеспечивает решение данной проблемы на практике и основано на универсальной когнитивной аналитической системе "Эйдос".

Рассмотрим предполагаемое решение проблемы референтного класса на всех этих уровнях.

Концептуальное решение проблемы референтного класса

Когнитивная концепция и синтез когнитивного конфигуратора

В данном разделе приводится когнитивная концепция, разработанная автором исследования в 1996 году [2], с учетом двух основных требований:

1. Адекватное отражение в когнитивной концепции реальных процессов, реализуемых человеком в процессах познания.

2. Высокая степень приспособленности когнитивной концепции для формализации в виде достаточно простых математических и алгоритмических моделей, допускающих прозрачную программную реализацию в автоматизированной системе.

Понятие когнитивного конфигуратора и необходимость естественнонаучной (формализуемой) когнитивной концепции

Определение понятия конфигуратора

Понятие конфигуратора, по-видимому, впервые предложено В.А.Лефевром [2], хотя безусловно это понятие использовалось и раньше, но, во-первых, оно не получало самостоятельного названия, а, во-вторых, использовалось в частных случаях и не получало обобщения. Под конфигуратором В.А.Лефевр понимал минимальный полный набор понятийных шкал или конструктов, т.е. понятий, достаточный для адекватного описания предметной области.

Примеры конфигураторов приведены в [2].

Понятие когнитивного конфигуратора

В исследованиях по когнитивной психологии изучается значительное количество различных операций, связанных с процессом познания. Однако, насколько известно из литературы, психологами не ставился вопрос о выделении из всего множества когнитивных операций такого минимального (ба-

зового) набора наиболее элементарных из них, из которых как составные могли бы строится другие операции. Ясно, что для выделения таких базовых когнитивных операций (БКО) необходимо построить их иерархическую систему, в фундаменте которой будут находится наиболее элементарные из них, на втором уровне - производные от них, обладающие более высоким уровнем интегративности, и т.д.

Таким образом, под когнитивным конфигуратором будем понимать минимальный полный набор базовых когнитивных операций, достаточный для представления различных процессов познания.

Когнитивные концепции и операции

Проведенный анализ когнитивных концепций показал, что они разрабатывались ведущими психологами (Пиаже, Солсо, Найсер) без учета требований, связанных с их дальнейшей формализацией и автоматизацией. Поэтому имеющиеся концепции когнитивной психологии слабо подходят для этой цели; в когнитивной психологии не ставилась и не решалась задача конструирования когнитивного конфигуратора и, соответственно, не сформулировано понятие базовой когнитивной операции.

Предлагаемая когнитивная концепция

Автоматизировать процесс познания в целом безусловно значительно сложнее, чем отдельные операции процесса познания. Но для этого прежде всего необходимо выявить эти операции и найти место каждой из них в системе или последовательности процесса познания.

Сделать это предлагается в форме когнитивной концепции, которая должна удовлетворять следующим требованиям:

- адекватность, т.е. точное отражение сущности процессов познания, характерных для человека, в частности описание процессов вербализации, семантической адаптации и семантического синтеза (уточнения смысла слов и понятий и включения в словарь новых слов и понятий);

- высокая степень детализации и структурированности до уровня достаточно простых базовых когнитивных операций;

- возможность математического описания, формализации и автоматизации.

Однако приходится констатировать, что даже концепции когнитивной психологии, значительно более конкретные, чем гносеологические, разрабатывались без учета необходимости построения реализующих их математических и алгоритмических моделей и программных систем. Более того, в когнитивной психологии из всего многообразия различных исследуемых когнитивных операций не выделены базовые, к суперпозиции и различным вариантам сочетаний которых сводятся различные процессы познания. Поэтому для достижения целей данного исследования концепции когнитивной психологии мало применимы.

В связи с этим в данном исследовании предлагается когнитивная концепция, удовлетворяющая сформулированным выше требованиям. Эта концепция достаточно проста, иначе было бы невозможно ее формализовать, многие ее положения интуитивно очевидны или хорошо известны, тем ни менее в целостном виде она сформулирована лишь в работе [2]. Положения когнитивной концепции приведены в определенном порядке, соответствующем реальному ходу процесса познания "от конкретных эмпирических исходных данных к содержательным информационным моделям, а затем к их верификации, адаптации и, в случае необходимости, к пере-синтезу".

На базе выше сформулированных положений автором предложена целостная система взглядов на процесс познания, т.е. когнитивная концепция [2] (рисунок 1):

УРОВЕНЬ СМЫСЛА СПОСОБ МЫШЛЕНИЯ БА ЗОВЫЕ КОГНИТИВНЫЕ ОПЕРАЦИИ СИСТЕМНОГО АНАЛИЗА КОГНИТИВНЫЕ СТРУКТУРЫ

О 1 СИСТЕМА АЛЬТЕРНАТИВНЫХ ПАРАДИГМ РЕАЛЬНОСТИ

о о ш 8 ш ° ТЕКУЩАЯ ПАРАДИГМА РЕАЛЬНОСТИ

о И! _□ Йё 0 Ё_ КОНСТРУКТИВНЫЙ АНАЛИЗ БИНАРНЫЕ КОНСТРУКТЫ (СИСТЕМЫ ПРОТИВОПОЛОЖНЫХ КЛАСТЕРОВ )

О 8 5 =3 ныР В КЛА СС ИФ ИКА ЦИ Я (КПА СТЕ Р-АНАЛИЗ), КОГНИТИВНАЯ ГРАФИКА ФОРМЕ СЕМАНТИЧЕСКИХ СЕТЕЙ КЛАСТЕРЫ (ГРУППЫ НАИБОЛЕЕ СХОДНЫХ КЛАССОВ)

и ОБОБЩЕНИЕ (СИНТЕЗ, ИНДУКЦИЯ) ИДЕНТИФИКАЦИЯ И ПРОГНОЗИРОВАНИЕ, АБСТРАГИРОВАНИЕ , ДЕДУКЦИЯ И АБДУКЦИЯ , СРАВНЕНИЕ , СОДЕРЖАТЕЛЬНОЕ СРАВНЕНИЕ, КОГНИТИВНАЯ ГРАФИКА В ФОРМЕ КОГНИТИВНЫХ ДИАГРАММ ОБОБЩЕННЫЕ КАТЕГОРИИ ОБЪЕКТОВ (КЛАССЫ), ИМЕЮЩИЕ ИМЕНА КЛА СС ИФ ИК АЦИ О Н Н ЫЕ ШКАЛЫ И ГРАДАЦИИ

о 5-І § ш ^ г ё і ^ ёз о ^ СИНТЕЗ ЧУВСТВЕННОГО ОБРАЗА КОНКРЕТНОГО ОБЪЕКТА ЧУВСТВЕННЫЕ ОБРАЗЫ КОН КРЕТН ЬIX ОБЪЕКТО В И ИХ ИМЕНА

О!) озд ЧУВСТВЕННОЕ ВОСПРИЯТИЕ ДИСКРЕТНЫЕ ЭЛЕМЕНТЫ ПОТОКА ЧУВСТВЕННОГО ВОСПРИЯТИЯ. ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

ПИРАМИДА СМЫСЛА

Рисунок 1. Обобщенная схема предлагаемой когнитивной концепции

Суть предложенной когнитивной концепции состоит в том, что процесс познания рассматривается как многоуровневая иерархическая система обработки информации, в которой каждый последующий уровень является результатом интеграции элементов предыдущего уровня. На 1-м уровне этой системы находятся дискретные элементы потока чувственного восприятия, которые на 2-м уровне интегрируются в чувственный образ конкретного объекта. Те, в свою очередь, на 3-м уровне интегрируются в обобщенные образы классов и факторов, образующие на 4-м уровне кластеры, а на 5-м конструкты. Система конструктов на 6-м уровне образуют текущую парадигму реальности (т.е. человек познает мир путем синтеза и применения конструктов). На 7-м же уровне обнаруживается, что текущая парадигма не является единственно-возможной.

Ключевым для когнитивной концепции является понятие факта, под которым понимается соответствие дискретного и интегрального элементов

познания (т.е. элементов разных уровней интеграции-иерархии), обнаруженное на опыте. Факт рассматривается как квант смысла, что является основой для его формализации. Таким образом, происхождение смысла связывается со своего рода "разностью потенциалов", существующей между смежными уровнями интеграции-иерархии обработки информации в процессах познания.

1. Процесс познания начинается с чувственного восприятия. Различные органы восприятия дают качественно-различную чувственную информацию в форме дискретного потока элементов восприятия. Эти элементы формализуются с помощью описательных шкал и градаций.

2. В процессе накопления опыта выявляются взаимосвязи между элементами чувственного восприятия: одни элементы часто наблюдаются с другими (имеет место их пространственно-временная корреляция), другие же вместе встречаются достаточно редко. Существование устойчивых связей между элементами восприятия говорит о том, что они отражают некую реальность, интегральную по отношению к этим элементам. Эту реальность будем называть объектами восприятия. Рассматриваемые в единстве с объектами элементы восприятия будем называть признаками объектов. Таким образом, органы восприятия дают чувственную информацию о признаках наблюдаемых объектов, процессов и явлений окружающего мира (объектов). Чувственный образ конкретного объекта представляет собой систему, возникающую как результат процесса синтеза признаков этого объекта. В условиях усложненного восприятия синтез чувственного образа объекта может быть существенно замедленным и даже не завершаться в реальном времени. При анализе конкретных описаний уникальных индивидуальных (сингулярных) объектов нет возможности определить степень характерности признаков для этого объекта, т.е. они все имеют одинаковый вес или значимость и одинаково связаны с образом конкретного объекта.

3. Человек присваивает конкретным объектам названия (имена) и сравнивает объекты друг с другом. При сравнении выясняется, что одни объекты в различных степенях сходны по их признакам, а другие отличаются. Сходные объекты объединяются в обобщенные категории (классы), которым присваиваются имена, производные от имен входящих в категорию конкретных объектов. Классы формализуются с помощью классификационных шкал и градаций и обеспечивают интегральный способ описания действительности. Путем обобщения (синтеза, индукции, многопараметрической типизации) информации о признаках конкретных объектов, входящих в те или иные классы, формируются обобщенные образы классов. При этом для каждого признака определяется, какое количество информации в нем содержится о принадлежности или непринадлежности обладающего этим признаком конкретного объекта к каждому из обобщенных классов.

Например, когда ребенку первый раз в жизни показывают мячик, то все признаки мячика: круглый, пустой, на половину синий - на половину красный, резиновый, и т.д., имеют совершенно одинаково связаны с образом данного конкретного мячика. Когда же ребенок подрастает и видит уже сотый мячик, то начинает понимать, что такие признаки как круглый и пустой, наблюдаемые практически у всех мячиков, которые он видел за свою жизнь, связаны с обобщенным образом "Мячик" существенным образом, тогда как цвет, размер мячика и материал, и которого он изготовлен, могут меняться самым разнообразным образом.

Таким образом, накопление опыта и сравнение обобщенных образов классов друг с другом позволяет определить степень характерности тех или иных признаков для различных классов, т.е. смысл признаков (количество информации в факте наблюдения данного признака у конкретного объекта о принадлежности или непринадлежности данного объекта к каждому из классов) и обобщенную ценность каждого признака для идентификации конкретных объектов с классами и сравнения классов, а также исключить наименее ценные признаки из дальнейшего анализа без существенного сокращения количества полезной информации о предметной области (абстрагирование). Абстрагирование позволяет существенно сократить затраты внутренних ресурсов системы на анализ информации при сохранении всего наиболее существенно в модели. Идентификация представляет собой процесс узнавания, т.е. установление соответствия между чувственным описанием конкретного объекта, как совокупности дискретных признаков, и неделимым (целостным) именем обобщенного класса, которое ассоциируется с местом и ролью воспринимаемого объекта в природе и обществе. При идентификации определяется какое количество информации о принадлежности или непринадлежности к каждому из обобщенных классов содержится не в отдельных признаках конкретного объекта, а во всей системе его признаков. Это количество информации о принадлежности конкретного объекта к каждому из обобщенных образов классов определяется как суммарное для всех признаков данного объекта по данному классу. В результате получается рейтинг классов в порядке убывания суммарного количества информации о принадлежности к ним, содержащемуся в системе признаков конкретного объекта. Получается, что один и тот же объект одновременно в различной степени, причем как положительной, так и отрицательной, принадлежит разным классам, т.е. к некоторым и не принадлежит (для которых это суммарное количество информации ниже некоторого порога). На наш взгляд в этом и состоит концептуальное решение проблемы рефератных классов.

Дискретное и целостное восприятие действительности поддерживаются как правило различными полушариями мозга: соответственно, правым и левым (доминантность полушарий). Таким образом именно систем-

ное взаимодействие интегрального (целостного) и дискретного способов восприятия обеспечивает возможность установление содержательного смысла событий. При выполнении когнитивной операции "содержательное сравнение" двух классов определяется вклад каждого признака в их сходство или различие.

4. После идентификации уникальных объектов с классами возможна их классификация и присвоение обобщающих имен группам похожих классов. Для обозначения группы похожих классов используем понятие "кластер". Но и сами кластеры в результате выполнения когнитивной операции "генерация конструктов" могут быть классифицированы по степени сходства друг с другом. Для обозначения системы двух противоположных кластеров, с "спектром" промежуточных кластеров между ними, будем использовать термин "бинарный конструкт", при этом сами противоположные кластеры будем называть "полюса бинарного конструкта". Бинарные конструкты классов и атрибутов, т.е. конструкты с двумя полюсами, наиболее типичны для человека и представляет собой когнитивные структуры, играющие огромную роль в процессах познания. Достаточно сказать, что познание можно рассматривать как процесс генерации, совершенствования и применения конструктов. Качество конструкта тем выше, чем сильнее отличаются его полюса, т.е. чем больше диапазон его смысла.

Результаты идентификации и прогнозирования, осуществленные с помощью модели, путем выполнения когнитивной операции "верификация" сопоставляются с опытом, после чего определяется целесообразность выполнения когнитивной операции "обучение". При этом может возникнуть три основных варианта, которые на рисунке 2 обозначены цифрами:

К ПОЯСНЕНИЮ ПОНЯТИЙ: "АДАПТАЦИЯ И СИНТЕЗ МОДЕЛИ";

"ВНУТРЕННЯЯ И ВНЕШНЯЯ ВАЛИДНОСТЬ ИНФОРМАЦИОННОЙ МОДЕЛИ"

\

\

\

/

/

/

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рисунок 2. К пояснению смысла понятий: "Адаптация и синтез когнитивной модели предметной области", "Внутренняя и внешняя валидность информационной модели",

РАСШИРЕННАЯ ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ

1. Объект, входит в обучающую выборку и достоверно идентифицируется (внутренняя валидность, в адаптации нет необходимости).

2. Объект, не входит в обучающую выборку, но входит в исходную генеральную совокупность, по отношению к которой эта выборка репрезентативна, и достоверно идентифицируется (внешняя валидность, добавление объекта к обучающей выборке и адаптация модели приводит к количественному уточнению смысла признаков и образов классов).

3. Объект не входит в исходную генеральную совокупность и идентифицируется недостоверно (внешняя валидность, добавление объекта к обучающей выборке и пересинтез модели приводит к качественному уточнению смысла признаков и образов классов, исходная генеральная совокупность расширяется).

Когнитивный конфигуратор и базовые когнитивные операции системного анализа

Таким образом из предложенной когнитивной концепции вытекает существование по крайней мере 10 базовых когнитивных операций системного анализа (БКОСА) (таблица 1):

Таблица 1 - ОБОБЩЕННЫЙ СПИСОК БКОСА (КОГНИТИВНЫЙ КОНФИГУРАТОР)

№ КвдБКОС* по схеме А СК-анализ а Полное наименование БКОСА

1. 1. Присвоение имен классам и атрибутам (интенсиональная и экстенсиональная репрезентация)

й. 3, Восприятие

3. 3. Обобщение (синтез, индукция)

4. 4. Абстрагирование классов и атрибутов

5. 5. Оценка адекватности модели

6. 7. Сравнение, идентификация и прогнозирование

7. 9. Анализ (дедукция и абдукция) классов и атрибутов

8. 1:0.1,10.1 Классификация и генерация конструктов классов и атрибутов

9. 10.3,10.4. Содержательное сравнение классов и атрибутов

10. 11. Планирование и принятие решений о применении системы управляющих факторов

Необходимо отметить, что классификация операций системного анализа по В.М.Казиеву [2] ближе всего к позиции, излагаемой в данной работе, т.к. этим автором названы 6 из 10 базовых когнитивных операций системного анализа: формализация; синтез (индукция); абстрагирование; анализ (дедукция); распознавание, и идентификация образов; классификация. Вместе с тем им не приводятся математическая модель, алгоритмы и инструментарий реализации этих операций и не ставится задача их разработки, кроме того некоторые из них приведены дважды под разными названиями, например: анализ и синтез это тоже самое, что дедукция и индукция (таблица 1).

Необходимо также отметить, что по-видимому, впервые идея сведения мышления и процессов познания к когнитивным операциям была четко и осознанно сформулирована в письменном виде в V веке до н.э.:

”Сущность интеллекта проявляется в способностях обобщения, абстрагирования, сравнения и классификации” (цит.по пам., Патанжали, Йога-Сутра, авт.).

Познание предметной области с одной стороны безусловно является фундаментом, на котором строится все грандиозное здание системного анализа, а с другой стороны, процессы познания являются связующим звеном, органично объединяющим "блоки" принципов и методов системного анализа в стройное здание. Более того, процессы познания буквально пронизывают все методы и принципы системного анализа, входя в них как один из самых существенных элементов.

Однако, на этом основании неверным будет представлять, что когнитивные операции являются подмножеством понятия "системный анализ", скорее наоборот: системный анализ представляет собой один из теоретических методов познания, представимый в форме определенной последовательности когнитивных операций, тогда как другие последовательности этих операций позволяют образовать другие формы теоретического познания.

Задачи формализации базовых когнитивных операций системного анализа

Для решения задачи формализации БКОСА необходимо решить следующие задачи:

1. Выбор единой интерпретируемой численной меры для классов и атрибутов.

2. Выбор неметрической меры сходства объектов в семантических пространствах.

4. Определение идентификационной и прогностической ценности атрибутов.

5. Ортонормирование семантических пространств классов и атрибутов (Парето-оптимизация).

Выбор единой интерпретируемой численной меры для классов и атрибутов

При построении модели объекта управления одной из принципиальных проблем является выбор формализованного представления для индикаторов, критериев и факторов (далее: факторов). Эта проблема распадается на две подпроблемы:

1. Выбор и обоснование смысла выбранной численной меры.

2. Выбор математической формы и способа определения (процедуры, алгоритма) количественного выражения для значений, отражающих степень взаимосвязи факторов и будущих состояний АОУ.

Рассмотрим требования к численной мере, определяемые существом подпроблем. Эти требования вытекают из необходимости совершать с численными значениями факторов математические операции (сложение,

вычитание, умножение и деление), что в свою очередь необходимо для построения полноценной математической модели.

Требование 1: из формулировки 1-й подпроблемы следует, что все факторы должны быть приведены к некоторой общей и универсальной для всех факторов единице измерения, имеющей какой-то смысл, причем смысл, поддающийся единой сопоставимой в пространстве и времени интерпретации.

Традиционно в специальной литературе рассматриваются следующие смысловые значения для факторов: стоимость (выигрыш-проигрыш или прибыль-убытки); полезность; риск; корреляционная или причинноследственная взаимосвязь. Иногда предлагается использовать безразмерные меры для факторов, например эластичность, однако, этот вариант не является вполне удовлетворительным, т.к. не позволяет придать факторам содержательный и сопоставимый смысл и получить содержательную интерпретацию выводов, полученных на основе математической модели.

Таким образом, возникает ключевая при выборе численной меры проблема выбора смысла, т.е. по сути единиц измерения, для индикаторов, критериев и факторов.

Требование 2: высокая степень адекватности предметной области.

Требование 3: высокая скорость сходимости при увеличении объема обучающей выборки.

Требование 4: высокая независимость от артефактов.

Что касается конкретной математической формы и процедуры определения числовых значений факторов в выбранных единицах измерения, то обычно применяется метод взвешивания экспертных оценок, при котором эксперты предлагают свои оценки, полученные как правило неформализованным путем. При этом сами эксперты также обычно ранжированы по степени их компетентности. Фактически при таком подходе числовые значения факторов является не определяемой, искомой, а исходной величиной. Иначе обстоит дело в факторном анализе, но в этом методе, опять же на основе экспертных оценок важности факторов, требуется предварительно, т.е. перед проведением исследования, принять решение о том, какие факторы исследовать (из-за жестких ограничений на размерность задачи в факторном анализе). Таким образом оба эти подхода реализуемы при относительно небольших размерностях задачи, что с точки зрения достижения целей настоящего исследования, является недостатком этих подходов.

Поэтому самостоятельной и одной из ключевых проблем является обоснованный и удачный выбор математической формы для численной меры индикаторов и факторов.

Эта математическая форма с одной стороны должна удовлетворять предыдущим требованиям, прежде всего требованию 1, а также должна быть процедурно вычислимой, измеримой.

Выбор неметрической меры сходства объектов в семантических пространствах

Существует большое количество мер сходства, из которых можно было бы упомянуть скалярное произведение, ковариацию, корреляцию, евклидово расстояние, расстояние Махалонобиса и др.

Проблема выбора меры сходства состоит в том, что при выбранной численной мере для координат классов и факторов она должна удовлетворять определенным критериям:

1. Обладать высокой степенью адекватности предметной области, т.е. высокой валидностью, при различных объемах выборки, как при очень малых, так и при средних и очень больших.

2. Иметь обоснованную, четкую, ясную и интуитивно понятную интерпретацию.

3. Быть нетрудоемкой в вычислительном отношении.

4. Обеспечивать корректное вычисление меры сходства для пространств с неортонормированным базисом.

Определение идентификационной и прогностической ценности атрибутов

Не все факторы имеют одинаковую ценность для решения задач идентификации, прогнозирования и управления. Традиционно считается, что факторы имеют одинаковую ценность только в тех случаях (обычно в психологии), когда определить их действительную ценность не представляется возможным по каким-либо причинам.

Для достижения целей, поставленных в данном исследовании, необходимо решить проблему определения ценности факторов, т.е. разработать математическую модель и алгоритм, которые допускают программную реализацию и обеспечивают на практике определение идентификационной и прогностической ценности факторов.

Ортонормирование семантических пространств классов и атрибутов (Парето-оптимизация)

Если не все факторы имеют одинаковую ценность для решения задач идентификации, прогнозирования и управления, то возникает проблема исключения из системы факторов тех из них, которые не представляют особой ценности. Удаление малоценных факторов вполне оправданно и целесообразно, т.к. сбор и обработка информации по ним в среднем связана с такими же затратами времени, вычислительных и информационных ресурсов, как и при обработке ценных факторов. В этом состоит идея Па-рето-оптимизации. Однако это удаление должно осуществляться при вполне определенных граничных условиях, характеризующих результирующую систему: адекватность модели; количество признаков на класс; суммарное количество градаций признаков в описательных шкалах. В противном случае удаление факторов может отрицательно сказываться на качестве решения задач. На практике проблема реализации Парето-

оптимизации состоит в том, что факторы вообще говоря коррелируют друг с другом и поэтому их ценность может изменяться при удалении любого из них, в том числе и наименее ценного. Поэтому просто взять и удалить наименее ценные факторы не представляется возможным и для этого необходим корректный итерационный вычислительный алгоритм обеспечивающий решение этой проблемы при заданных граничных условиях.

Математическое решение проблемы референтного класса

Предложенная автором системная теория информации (СТИ) [2] позволяет непосредственно на основе эмпирических данных вычислять степень истинности прямых и обратных логических высказываний о принадлежности объекта, обладающего набором признаков {L} к j-му классу. При этом обобщенный образ класса формируется путем многопараметрической типизации на основе его индивидуальных реализаций - эмпирических примеров, образующих обучающую выборку. Таким образом, СТИ обеспечивает обобщение или индукцию.

Далее рассмотрим суть предлагаемого подхода.

Итак, классическая формула Хартли имеет вид:

I = Log 2W ( i )

Будем искать ее системное обобщение в виде:

I = Log 2W j ( 2 )

где:

W - количество элементов в множестве.

j - коэффициент эмерджентности, названный автором в честь Хартли коэффициентом эмерджентности Хартли.

Примем, что системное обобщение формулы Хартли имеет вид:

1V1

1 = Log2 Z C

m W

m=1

( 3 )

где:

СШ

Ж - количество подсистем и ш элементов;

ш - сложность подсистем;

М- максимальная сложность подсистем.

Так как СЖ = Ж , то при М=1 система переходит в множество и выражение (3) приобретает вид (1), т.е. для него выполняется принцип соответствия, являющийся обязательным для более общей теории.

Учитывая, что при М= Ж:

М

I

Ш=1

СШ = 2Ж -1

в этом случае получаем:

I = ^2(2ж -1)

( 4 )

( 5 )

Выражение (5) дает приближенную оценку максимального количества информации в элементе системы. Из выражения (5) видно, что при увеличении числа элементов Ж количество информации I быстро стремится к Ж (6) и уже при Ж>4 погрешность выражения (5) не превышает 1%:

при Ж

( 6 )

I ® Ж К ;

Приравняв правые части выражений (2) и (3):

М

I = Ьое 2Ж * = Ьо% 21 С,

Ш

Ж

( 7 )

Ш=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

получим выражение для коэффициента эмерджентности Хартли:

Ш=1

Ж

( 8 )

Смысл этого коэффициента раскрыт в работе [18]. Здесь же отметим лишь, что при М®1 когда система асимптотически переходит в множество *®1 и (2) ® (1), как и должно быть согласно принципу соответствия.

С учетом (8) выражение (2) примет вид:

М

Ьо§2 I СШ

Ш =1

I(Ж, М) = ^2Ж ЬояЖ

или при М=Ж и больших Ж, учитывая (4 и 5):

Ж

I (Ж, м ) = ^ж10^ = ж

( 9 )

( 10 )

Выражение (9) и представляет собой искомое системное обобщение классической формулы Хартли, а выражение (10) - его достаточно хорошее приближение при большом количестве элементов в системе Ж. Классическая формула А. Харкевича имеет вид:

к

У

к

где:

- Ру - условная вероятность перехода объекта в }-е состояние при условии действия на него 1-го значения фактора;

- Ру - безусловная вероятность перехода объекта в }-е состояние (вероятность самопроизвольного перехода или вероятность перехода, посчитанная по всей выборке, т.е. при действии любого значения фактора).

Придадим выражению (11) следующий эквивалентный вид, который и будем использовать ниже:

где: - индекс г обозначает признак (значение фактора): 1£ г £ М;

- индекс у обозначает состояние объекта или класс: 1£у £ Ж;

- Ру - условная вероятность наблюдения 1-го значения фактора у объектов в у-го класса;

- Рг - безусловная вероятность наблюдения 1-го значения фактора по всей выборке.

Из (12) видно, что формула Харкевича для семантической меры информации по сути является логарифмом от формулы Байеса для апостериорной вероятности (отношение условной вероятности к безусловной). Вопрос об эквивалентности выражений (11) и (12) рассмотрим позднее.

Известно, что классическая формула Шеннона для количества информации для неравновероятных событий преобразуется в формулу Хартли при условии, что события равновероятны, т.е. удовлетворяет фундаментальному принципу соответствия. Поэтому теория информации Шеннона справедливо считается обобщением теории Хартли для неравновероятных событий. Однако, выражения (11) и (12) при подстановке в них реальных численных значений вероятностей Ру, Ру и Рг не дает количества информации в битах, т.е. для этого выражения не выполняется принцип соответствия, обязательный для более общих теорий. Возможно, в этом состоит причина довольно сдержанного, а иногда и скептического отношения специалистов по теории информации Шеннона к семантической теории информации Харкевича.

Причину этого мы видим в том, что в выражениях (11) и (12) отсутствуют глобальные параметры конкретной модели Ж и М, т.е. в том, что А.Харкевич в своем выражении для количества информации не ввел зависимости от мощности пространства будущих состояний объекта Ж и количества значений факторов М, обуславливающих переход объекта в эти состояния.

Поставим задачу получить такое обобщение формулы Харкевича, которое бы удовлетворяло тому же самому принципу соответствия, что и формула Шеннона, т.е. преобразовывалось в формулу Хартли в предель-

Р

( 12 )

ном детерминистском равновероятном случае, когда каждому классу (состоянию объекта) соответствует один признак (значение фактора), и каждому признаку - один класс, и эти классы (а, значит и признаки), равновероятны, и при этом каждый фактор однозначно, т.е. детерминистским образом определяет переход объекта в определенное состояние, соответствующее классу.

Будем искать это обобщение (12) в виде:

/о Л*

!и (Ж, М) =

Р

и

( із )

Найдем такое выражение для коэффициента названого нами в честь А.Харкевича "коэффициентом эмерджентности Харкевича", которое обеспечивает выполнение для выражения (13) принципа, соответствия с классической формулой Хартли (1) и ее системным обобщением (2 и 3) в равновероятном детерминистском случае.

Для этого нам потребуется выразить вероятности Рі/, Р/ и Рі через частоты наблюдения признаков по классам (см. таблица 1). В таблице 1 рамкой обведена область значений, переменные определены ранее.

Таблица 2 - МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ

Классы Сумма

і ... І ... Иг

Значения факторов і N11 N / У1Ж

...

І У, Уу Чж Ж У = 1N у=1

...

м ^1 УМ/ N 1У МЖ

Суммарное количество признаков М = ЕN і=1 Ж М У=ЪЪ і=1 /=1

Суммарное количество объектов обучающей выборки N

Алгоритм формирования матрицы абсолютных частот.

Объекты обучающей выборки описываются векторами (массивами)

Ь = {Ьі} имеющихся у них признаков:

Ь {Ь.} |1’ если у объекта есть 1-й признак;

1 [0, если у объекта нет 1-го признака.

Первоначально в матрице абсолютных частот все значения равны нулю. Затем организуется цикл по объектам обучающей выборки. Если предъявленного объекта относящегося к }-му классу есть 1-й признак, то значения абсолютных частот переприсваиваются, см. "программистское" выражение:

N.. = N. +1; N. = N. +1; N. = N1. +1; N = N +1

1} 1} 1 1 } } .

Здесь можно провести очень интересную и важную аналогию между способом формирования матрицы абсолютных частот и работой многоканальной системы выделения полезного сигнала из шума. Представим себе, что все объекты, предъявляемые для формирования обобщенного образа некоторого класса в действительности являются различными реализациями одного объекта - "Эйдоса" (в смысле Платона), по-разному зашумленного различными случайными обстоятельствами. И наша задача состоит в том, чтобы подавить этот шум и выделить из него то общее и существенное, что отличает объекты данного класса от объектов других классов. Учитывая, что шум чаще всего является "белым" и имеет свойство при суммировании с самим собой стремиться к нулю, а сигнал при этом наоборот возрастает пропорционально количеству слагаемых, то увеличение объема обучающей выборки приводит ко все лучшему отношению сигнал/шум в матрице абсолютных частот, т.е. к выделению полезной информации из шума. Примерно так мы начинаем постепенно понимать смысл фразы, которую мы сразу не расслышали по телефону и несколько раз переспрашивали. При этом в повторах шум не позволяет понять то одну, то другую часть фразы, но в конце-концов за счет использования памяти и интеллектуальной обработки информации мы понимаем ее всю. Так и объекты, описанные признаками, можно рассматривать как зашумленные фразы, несущие нам информацию об обобщенных образах классов: ”Эйдо-сах” [5, 9], к которым они относятся. И эту информацию мы выделяем из шума при синтезе модели.

Выразим относительные частоты ("вероятности") Р., Р. и Р. через абсолютные частоты наблюдения признаков по классам (см. таблица 1). Вероятности с одним и тем же обозначением для разных выражений рассчитываются по-разному.

Для выражения (11) получим:

Р N.

Р = —- ( 14 )

1 NJ

Для выражений (12) и (13):

Для выражений (11), (12) и (13):

ж

м

( 16 )

У=1

г =1

м

ж

ж м

N = Х N. =1NJ =Ц N

г =1 у =1 г =1 у =1

В (16) использованы обозначения:

N. - суммарное количество наблюдений в исследуемой выборке факта: "действовало г-е значение фактора и объект перешел в .-е состояние";

N. - суммарное количество встреч различных факторов у объектов, перешедших в.-е состояние;

N1 - суммарное количество встреч г-го фактора у всех объектов исследуемой выборки;

N - суммарное количество встреч различных факторов у всех объектов исследуемой выборки.

Формирование матрицы относительных частот (условных и безусловных вероятностей).

На основе анализа матрицы частот (таблица 1) классы можно сравнивать по наблюдаемым частотам признаков только в том случае, если количество объектов по всем классам одинаково, как и суммарное количество признаков по классам. Если же они отличаются, то корректно сравнивать классы можно только по условным и безусловным вероятностям наблюдения признаков, посчитанных на основе матрицы частот (таблица 1) в соответствии с выражениями (14) и (15), в результате чего получается матрица условных и безусловных процентных распределений (табли-

При расчете матрицы условных и безусловных вероятностей N. из таблицы 1 могут браться либо из предпоследней, либо из последней строки. В 1-м случае N. представляет собой "Суммарное количество признаков у всех объектов, использованных для формирования обобщенного образа уго класса", а во 2-м случае, это "Суммарное количество объектов обучающей выборки, использованных для формирования обобщенного образа .-го класса", соответственно получаем различные, хотя и очень сходные семан-

ца 2).

тические информационные модели, которые мы называем СИМ-1 и СИМ-2 [9, 17]. Оба этих вида моделей поддерживаются системой "Эйдос".

Таблица 3 - МАТРИЦА ОТНОСИТЕЛЬНЫХ ЧАСТОТ (УСЛОВНЫХ И

БЕЗУСЛОВНЫХ ВЕРОЯТНОС

Классы Безусловная вероятность признака

1 ... І ... Ж

Значения факторов 1 Р, Р1] Р 1 ш

...

І Р, Р] Р 1ІШ Р

...

м РМ1 РМ] Р 1 мш

Безусловная вероятность класса р]

ЕЙ)

Эквивалентность выражений (11) и (12) устанавливается, если подставить в них выражения вероятности Р., Р. и Р{ через частоты наблюдения признаков по классам из (14), (15) и (16). В обоих случаях из выражений (11) и (12) получается одно и тоже выражение (17):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

NN

N,NJ

( 17 )

А из (13) выражение (18), с которым мы и будем далее работать.

( 18 )

При взаимно-однозначном соответствии классов и признаков в равновероятном детерминистском случае имеем (таблица 3):

Таблица 4 - МАТРИЦА ЧАСТОТ В РАВНОВЕРОЯТНОМ

ДЕТЕРМИН ИСТСКОМ СЛУЧ [АЕ

Классы

1 ... І ... Ж Сумма

Значения факторов 1 1 1

... 1 1

І 1 1

... 1 1

м 1 1

Сумма 1 1 1 1 1 N

В этом случае к каждому классу относится один объект, имеющий единственный признак. Откуда получаем для всех I и] (19):

"]: Nu _ N, _ Nt _ 1

- . - . - ( 19 )

Таким образом, обобщенная формула А.Харкевича (18) с учетом (19) в этом случае приобретает вид:

Ij _ Log 2 NY = Log 2W

j

,j

( 20 )

откуда:

Y_

_ LogWj

Log2 N

( 21 )

или, учитывая выражение для коэффициента эмерджентности Хартли (8):

м

Log2 х cm

m_1

Y_ Log2W Log2W ( 22 )

Log 2N

Подставив коэффициент эмерджентности А.Харкевича (21) в выражение (18), получим:

Log2W j

Ij _ Log2

Log 2W j

Log 2N

N,N. r

r

\

Log

V

' Л vN,]

NijN N,Nj

V ]

\

Log 2 N

+ Log2 N

/

_ Log

2 NtN

или окончательно:

N

LogWj

Log2 N

,]

v i ] 0

Отметим, что 1-я задача получения системного обобщения формул Хартли и Харкевича и 2-я задача получения такого обобщения формулы Харкевича, которая удовлетворяет принципу соответствия с формулой Хартли - это две разные задачи. 1-я задача является более общей и при ее решении, которое приведено выше, автоматически решается и 2-я задача, которая является, таким образом, частным случаем 1-й.

Однако, представляет самостоятельный интерес и частный случай, в результате которого получается формула Харкевича удовлетворяющая в равновероятном детерминистском случае принципу соответствия с классической формулой Хартли (1), а не с ее системным обобщением (2) и (3). Ясно, что эта формула получается из (23) при (р=1.

^2Ж

ij _ L°g.

2

г

Nij

NiNJ

Log2 N

+ Log2W

( 24 )

V ' /

Из выражений (21) и (22) видно, что в этом частном случае, т.е. когда система эквивалентна множеству (M=1), коэффициент эмерджентности А.Харкевича приобретает вид:

Log 2W

Y_

Log 2 N

( 25 )

На практике для численных расчетов на удобнее пользоваться не

выражениями (23) или (24), а формулой (26), которая получается непосредственно из (18) после подстановки в него выражения (25):

( 26 )

В классическом анализе Шеннона идет речь лишь о передаче символов по одному информационному каналу от одного источника к одному приемнику. Его интересует прежде всего передача самого сообщения.

В данной статье ставится другая задача: идентифицировать или распознать информационный источник по сообщению от него. Поэтому метод Шеннона был обобщен путем учета в математической модели возможности существования многих источников информации, о которых к приемнику по зашумленному каналу связи приходят не отдельные символы-признаки, а сообщения, состоящие из последовательностей символов (признаков) любой длины.

Следовательно, ставится задача идентификации информационного источника по сообщению от него, полученному приемником по зашумленному каналу. Метод, являющийся обобщением метода К.Шеннона, позволяет применить классическую теорию информации для построения моде-

лей систем распознавания образов и принятия решений, ориентированных на применение для синтеза адаптивных АСУ сложными объектами.

Для решения поставленной задачи необходимо вычислять не средние информационные характеристики, как в теории Шеннона, а количество информации, содержащееся в конкретном 1-м признаке (символе) о том, что он пришел от данного 1-го источника информации. Это позволит определить и суммарное количество информации в сообщении о каждом информационном источнике, что дает интегральный критерий для идентификации или прогнозирования состояния объекта.

Логично предположить, что среднее количество информации, содержащейся в системе признаков о системе классов

Ж М р

I (У, X) = Х£ Р^ОЕ 2 А, ( 27 )

1=1 7=1 РгР]

является ничем иным, как усреднением (с учетом условной вероятности наблюдения) "индивидуальных количеств информации", которые содержатся в конкретных признаках о конкретных классах (источниках), т.е.:

г(Х1, У,) = ^ОЕ2 -Р!- • ( 28 )

Р,Р}

Это выражение определяет так называемую "плотность информации", т.е. количество информации, которое содержится в одном отдельно взятом факте наблюдения ,-го символа (признака) на приемнике о том, что этот символ (признак) послан J-м источником.

Если в сообщении содержится М символов, то суммарное количество информации о принадлежности данного сообщения J-му информационно -му источнику (классу) составляет:

М ^ р

г(Х1) = У ^Оё 2——. ( 29 )

,=1 Р,Р1

Необходимо отметить, что применение сложения в выражении (29) является вполне корректным и оправданным, так как информация с самого начала вводилась как аддитивная величина, для которой операция сложения является корректной.

Преобразуем выражение (29) к виду, более удобному для применения на практике для численных расчетов. Для этого традиционным для теории информации Шеннона способом выразим вероятности встреч признаков через частоты их наблюдения:

р1=х-р <»'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У г ]

Подставив (30) в (29), получим:

М N.

,(Х1) = X

_____У_

2

,=1 NN.

( 31 )

г 1

Если ранжировать классы в порядке убывания суммарного количества информации о принадлежности к ним, содержащейся в данном сообщении (т.е. описании объекта), и выбирать первый из них, т.е. тот, о котором в сообщении содержится наибольшее количество информации, то мы получим обоснованную статистическую процедуру, основанную на классической теории информации, оптимальность которой доказывается в фундаментальной лемме Неймана-Пирсона [2, 3].

Подставим значения вероятностей из (30) в (28) и получим выражением для плотности информации Шеннона, выраженное не через вероятности, а через частоты наблюдения символов, которые рассматриваются как признаки объектов, т.е. количество информации, содержащееся в отдельном г-м признаке о том, что другом конце канала связи находится 1-й объект (32):

N.

г (Х1, У,) = 1о§2 • ( 32 >

Сравнивая выражения (23) и (32) видим, что в системном обобщении формулы Харкевича 1-е слагаемое практически тождественно выражению Шеннона для плотности информации, а 2-е слагаемое представляющем собой плотность информации по Хартли.

Различия состоят в том, что в выражении (23) это слагаемое возведено в степень, имеющую смысл коэффициента эмерджентности Харкеви-ча. Поэтому вполне оправданным называть это слагаемое не коэффициентом эмерджентности Харкевича, а коэффициентом эмерджентности Шен-нона-Харкевича. Необходимо отметить также, что значения частот в этих формулах связаны с вероятностями несколько различным образом (выражения 14-16 и 30).

Из этого следует также, что полученное выражение (23) представляет собой нелинейную суперпозицию выражений для плотности информации Шеннона и Хартли, и, таким образом, является обобщающим выражением для плотности информации, которое при различных условиях асимптотически переходит в классические выражения Хартли и Харкевича, а от выражения Шеннона отличается лишь константой, т.е. 2-м слагаемым, характеризующим мощность множества состояний объекта в модели.

Это позволяет нам обоснованно высказать гипотезу о том, что системная теория информации (СТИ), базирующаяся на выражении (23) для плотности информации, является более общей, чем теории Хартли, Шеннона и Харкевича и асимптотически связана с ними через принцип соответствия (рисунок 1).

Системное обобщение формулы Шеннона

Ij (W, M) = Logс

NN,-

LogCWj

LogcN

\

Классическая формула Шеннона для плотности информации

(

Ij = Logc

Nl

NN,

Системное обобщение формулы Харкевича (СТИ)

Ij (W, M):

LogCW j LogcN

+ LogCW j

Системное обобщение формулы Харкевича

I, (W, M) = Logc

/ \Y

NN 1

NNl

V J /

Классическая формула Харкевича

N,N^

Iij = Log

v NNj

V J J

Системное обобщение формулы Хартли

I(W, M)=LogW

Классическая формула Хартли

I (W) = LogCW

Коэффициент эмерджент^ ф

ности Харкевича ^ ^ 2"

(характеризует детерми- _ Тпа N

нированность системы): ° 2

Коэффициент M

эмерджентности Log с X cw

Хартли (характеризует j = m=1

"эффект системы"): Wc og L

ОБОЗНАЧЕНИЯ:

W - количество классов (мощность множества будущих состояний объекта управления)

М - максимальный уровень сложности смешанных состояний объекта управления

Иу - суммарное количество встреч ьго фактора у объектов, перешедших в ^е состояние

N - суммарное количество встреч различных факторов у объектов, перешедших в у-е состояние

N - суммарное количество встреч ьго фактора у всех объектов

N - суммарное количество встреч различных факторов у всех объектов

С ^ - количество сочетаний из W по т

Таблица 5. Генезис системной (эмерджентной) теории информации

Получение матрицы знаний (информативностей).

На основе анализа матрицы условных и безусловных вероятностей (таблица 3) наблюдений признаков по классам и всей выборке можно сравнивать признаки друг с другом по их роли для сравнения классов друг

с другом и конкретных объектов с обобщенными классами. При этом существует 3 основных группы признаков:

Группа 1-я. Которые в одном классе встречаются, а в других нет. Это детерминистские признаки, обнаружение такого признака у объекта однозначно определяет его принадлежность к соответствующему классу.

Группа 2-я. Которые в одном классе встречаются чаще, чем в других. Это статистические признаки, обнаружение такого признака у объекта несет некоторую информацию о его принадлежности к соответствующему классу.

Группа 3-я. Которые в разных классах встречаются одной и той же вероятностью. Это признаки, обнаружение которых у объекта не несет никакой информации о его принадлежности к тем или иным классам.

Таким образом мы видим, что если используя таблицу 3 анализировать условные вероятности (или процентные распределения) признаков по классам, то можно вынести правдоподобные суждения о принадлежности объектов, обладающих этими признакам к тем или иным классам.

Однако в таком методе сравнения есть по крайней мере два существенных недостатка:

1. Для того, чтобы отнести признак к одной из вышеперечисленных групп необходимо сравнивать вероятности его наблюдения по классам, т.е. каждый раз при таком сравнении выполнять соответствующую необходимую для этого работу.

2. При отнесении признака ко 2-й группе этого самого по себе еще недостаточно для его использования с целью идентификации объекта, а необходимо еще оценить количество информации, которое содержится в факте обнаружения у объекта этого признака о принадлежности этого объекта к каждому из классов, а для этого необходим соответствующий математический и численный метод.

Что касается 1-го недостатка, то о нем можно сказать, что для реальных задач большой размерности выполнение этого сравнения вручную практически невозможно, а значит тем более невозможно и использование результатов этого сравнения для решения задач идентификации, прогнозирования и поддержки принятия решений, а тем более для исследования предметной области путем исследования ее модели. Все это обусловлено тем, что результат сравнения вероятностей встречи признака по классам не представляется при ручной обработке в количественной форме некоторого одного числа: частного критерия, величина и знак которого отражали бы результат такого сравнения.

2-й недостаток преодолевается методом, который предложен А.Харкевичем в выражениях (11) и (12) и уточнен нами в системном обобщении этих выражений (18). В этом методе предложено сравнивать не условные вероятности наблюдения признаков по различным классам

друг с другом, а условную вероятность наблюдения признака по классу с безусловной вероятностью его наблюдения по всей выборке.

Это предложение по своей сути полностью соответствует известному статистическому методу отклонений от средних и нормативному подходу, когда в качестве базы сравнения выбирается норма, т.е. среднее по всей группе. На основе этого подхода формируются и критерии сравнения, т.е. можно сказать, что критериальный подход изначально основан на нормативном.

Если такое сравнение провести по всем признакам и классам, то получится матрица, снимающая оба указанных недостатка: используя выражение (18) и данные таблицы 1 непосредственно прямым счетом получаем матрицу знаний (таблица 6):

Таблица 6 - МАТРИЦА ЗНАНИЙ (ИНФОРМАТИВНОСТЕЙ)

Классы Значимость фактора

1 ... і ... ж

Значения факторов 1 І11 І1] І1ж С1 - 2 1 ж 2 -1 £(-'■>

...

І І1 І] Ііж С' - 2 1 ж ч2 1 £М і)

ж -1 1’

...

м ІМ1 ІМ] Імж См = 1 ж ( - \ ж -1 £(Ім Ім)

Степень редукции класса Сі С Сж 1 ж м . ,2 Я - 2 1 У УМ і)

2 (ж • М -1) £ £ М] )

Здесь - I это среднее количество знаний в 1-м значении фактора:

1 ж

I = — у I

1 ж , 1

ГГ . =1

При расчете матрицы знаний N. из таблицы 1 могут браться либо из предпоследней, либо из последней строки. В 1-м случае N. представляет собой "Суммарное количество признаков у всех объектов, использованных для формирования обобщенного образа .-го класса", а во 2-м случае, это "Суммарное количество объектов обучающей выборки, использованных для формирования обобщенного образа .-го класса", соответственно получаем различные, хотя и очень сходные семантические информационные

модели, которые мы называем СИМ-1 и СИМ-2 [9, 17]. Оба этих вида моделей поддерживаются системой "Эйдос".

Количественные значения коэффициентов 1у таблицы 4 являются знаниями о том, что "объект перейдет в і-е состояние" если "на объект действует і-е значение фактора".

Принципиально важно, что эти весовые коэффициенты не определяются экспертами на основе опыта интуитивным неформализуемым способом, а рассчитываются непосредственно на основе эмпирических данных на основе теоретически обоснованной модели, хорошо зарекомендовавшей себя на практике при решении широкого круга задач в различных предметных областях.

Когда количество информации 1у>0 - і-й фактор способствует переходу объекта управления в і-е состояние, когда 1у<0 - препятствует этому переходу, когда же 1у=0 - никак не влияет на это. В векторе і-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе і-го состояния класса (столбец матрицы информативностей) отображается, какое количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, матрица информативностей (таблица 4) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния объекта управления) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: ".Истина" и 'Ложь”, а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности").

Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать на их основе прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций.

Таким образом данная модель позволяет рассчитать какое количество информации содержится в любом факте о наступлении любого события в любой предметной области, причем для этого не требуется повторности этих фактов и событий. Если же эти повторности осуществляются и при этом наблюдается некоторая вариабельность значений факторов, обуславливающих наступление тех или иных событий, то модель

обеспечивает многопараметрическую типизацию, т е. синтез обобщенных образов классов или категорий наступающих событий с количественной оценкой степени и знака влияния на их наступление различных значений факторов. Причем эти значения факторов могут быть как количественными, так и качественными и измеряться в любых единицах измерения, в любом случае в модели оценивается количество информации которое в них содержится о наступлении событий, переходе объекта управления в определенные состояния или просто о его принадлежности к тем или иным классам.

Математическая модель СТИ позволяет прогнозировать поведение объекта управления при воздействии на него не только одного, но и целой системы факторов:

1]-/(1] )■ ( 33 )

В теории принятия решений скалярная функция І] векторного аргумента называется интегральным критерием. Основная проблема состоит в выборе такого аналитического вида функции интегрального критерия, который обеспечил бы эффективное решение сформулированной выше задачи АСУ.

Учитывая, что частные критерии (26) имеют смысл количества информации, а информация по определению является аддитивной функцией, предлагается ввести интегральный критерий, как аддитивную функцию от частных критериев в виде:

І] - (І] , Ц). ( 34 )

В выражении (34) круглыми скобками обозначено скалярное произведение, т.е. свертка. В координатной форме это выражение имеет вид:

М

І -£ І І , ( 35 )

і-1

где:

Ь - У*} - вектор]-го класса-состояния объекта управления;

Ц - {Ц} - вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив-локатор), т.е.:

1, если і - й фактор действует;

Ц, - ^ а,, где : 0 < а, < 1, если і - й фактор действует с истинностью а,

0, если і - й фактор не действует.

В реализованной модели значения координат вектора состояния предмет-

ной области принимались равными либо 1 (фактор действует), либо 0 (фактор не действует).

Таким образом, интегральный критерий представляет собой суммарное количество информации, содержащееся в системе значений факторов различной природы (т.е. факторах, характеризующих объект управления, управляющее воздействие и окружающую среду) о переходе объекта управления в то или иное будущее состояние или о его принадлежности к некоторому обобщенному классу.

В многокритериальной постановке задача прогнозирования состояния объекта управления, при оказании на него заданного многофакторного управляющего воздействия I., сводится к максимизации интегрального критерия:

• •

. * = тах(( 1.., Ц)), ( 36 )

т.е. к выбору такого состояния объекта управления, для которого интегральный критерий максимален.

Результат прогнозирования поведения объекта управления, описанного данной системой факторов, представляет собой список его возможных будущих состояний, в котором они расположены в порядке убывания суммарного количества информации о переходе объекта управления в каждое из них.

Результат идентификации состояния конкретного объекта, описанного данной системой признаков, представляет собой список обобщенных образов классов, ранжированный в порядке убывания суммарного количества информации, содержащейся в системе признаков объекта о его принадлежности к этим классам.

В работах [2, 9] показано, что результат идентификации объекта с классами в СТИ можно рассматривать как его разложение вряд по профилям классов.

В данной работе показано, что предложенная информационная мера обеспечивает сопоставимость индивидуальных количеств информации, содержащейся в факторах о классах, а также сопоставимость интегральных критериев, рассчитанных для одного объекта и разных классов, для разных объектов и разных классов.

Когда количество информации 1у>0 - 1-й фактор способствует переходу объекта управления в }—е состояние, когда 1у<0 - препятствует этому переходу, когда же 1у=0 - никак не влияет на это. В векторе Ь-го фактора (строка матрицы информативностей) отображается, какое количество информации о переходе объекта управления в каждое из будущих состояний содержится в том факте, что данный фактор действует. В векторе ]-го состояния класса (столбец матрицы информативностей) отображается, какое

количество информации о переходе объекта управления в соответствующее состояние содержится в каждом из факторов.

Таким образом, матрица информативностей (таблица 4) является обобщенной таблицей решений, в которой входы (факторы) и выходы (будущие состояния активного объекта управления (АОУ)) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: ".Истина" и 'Ложь”, а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности").

Фактически предложенная модель позволяет осуществить синтез обобщенных таблиц решений для различных предметных областей непосредственно на основе эмпирических исходных данных и продуцировать на их основе прямые и обратные (т.е. индуктивные и дедуктивные) правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций (таблица 7).

Таблица 7 - ПРЯМЫЕ И ОБРАТНЫЕ (ИНДУКТИВНЫЕ И ДЕДУКТИВНЫЕ) ПРАВДОПОДОБНЫЕ ЛОГИЧЕСКИЕ ВЫСКАЗЫВАНИЯ С РАСЧЕТНОЙ (В СООТВЕТСТВИИ С СТИ) СТЕПЕНЬЮ ИСТИННОСТИ ИМПЛИКАЦИЙ

Прямые высказывания: Обратные высказывания

1 если А, то В (если действует фактор А, то мы предполагаем С степенью ИСТИННОСТИ Ідв, что АОУ перейдет в состояние В) если В, то А (если АОУ перешел в состояние В, то мы предполагаем с степенью истинности 1АВ, что действовал фактор А)

2 если Аі и Аг... и Ам, то В (прогноз влияния системы факторов на поведение АОУ. Степень истинности обобщающей (итоговой) импликации равна алгебраической сумме истинностей составляющих ее элементарных импликаций вида: "если А то В") если В, тоА1 и А2... иАм (информационный портрет класса В, т.е. влияние различных факторов А на переход АОУ в будущее состояние В, решение обратной задачи прогнозирования, т.е. выработка управления)

3 если А, то В} или В2... или б№ (семантический портрет фактора А, т.е. его влияние на переход АОУ в различные состояния)

4 если А^иАг...и Ам, то В1 или В2... или В№ (прогноз влияния системы факторов на переход АОУ в различные состояния)

Приведем пример более сложного (опосредованного) высказывания, которое может быть рассчитано непосредственно на основе матрицы информативностей - обобщенной таблицы решений (таблица 7):

Если А, со степенью истинности а(А,В) детерминирует В, и если С, со степенью истинности с(С,0) детерминирует Б, и А совпада-

ет по смыслу с С со степенью истинности а(А,С), то это вносит вклад в совпадение В с Б, равный степени истинности а(В,0).

При этом в прямых рассуждениях как предпосылки рассматриваются факторы, а как заключение - будущие состояния АОУ, а в обратных - наоборот: как предпосылки - будущие состояния АОУ, а как заключение -факторы. Степень истинности 1-й предпосылки - это просто количество информации 1., содержащейся в ней о наступлении ]-го будущего состояния АОУ. Если предпосылок несколько, то степень истинности наступления .-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом. Количество информации в 1-м факторе о наступлении .-го состояния АОУ, рассчитывается в соответствии с выражением (26) СТИ.

Прямые правдоподобные логические рассуждения позволяют прогнозировать степень достоверности наступления события по действующим факторам, а обратные - по заданному состоянию восстановить степень необходимости и степень нежелательности каждого фактора для наступления этого состояния, т.е. принимать решение по выбору управляющих воздействий на АОУ, оптимальных для перевода его в заданное целевое состояние.

Это и есть (на наш взгляд) математическое решение проблемы референтного класса в СТИ.

Необходимо отметить, что предложенная модель, основывающаяся на теории информации, обеспечивает также автоматизированное формирования системы нечетких правил по содержимому входных данных, как и комбинация нечеткой логики Заде-Коско с нейронными сетями Кохонена. Принципиально важно, что качественное изменение модели путем добавления в нее новых классов не уменьшает достоверности распознавания уже сформированных классов. Кроме того, при сравнении распознаваемого объекта с каждым классом учитываются не только признаки, имеющиеся у объекта, но и отсутствующие у него, поэтому предложенной моделью правильно идентифицируются объекты, признаки которых образуют множества, одно из которых является подмножеством другого (как и в Неокогнитроне К.Фукушимы) [2, 3].

Задача принятия решения о выборе наиболее эффективного управляющего воздействия является обратной задачей по отношению к задаче максимизации интегрального критерия (идентификации и прогнозирования), т.е. вместо того, чтобы по набору факторов прогнозировать будущее состояние объекта, наоборот, по заданному (целевому) состоянию объекта определяется такой набор факторов, который с наибольшей эффективностью перевел бы объект управления в это состояние.

Предлагается еще одно обобщение фундаментальной леммы Неймана-Пирсона, основанное на косвенном учете корреляций между информа-

тивностями в векторе состояний при использовании средних по векторам. Соответственно, вместо простой суммы количеств информации предлагается использовать корреляцию между векторами состояния и объекта управления, которая количественно измеряет степень сходства этих векторов:

I у - средняя информативность по вектору класса;

Ь - среднее по вектору идентифицируемой ситуации (объекта).

& у - среднеквадратичное отклонение информативностей вектора класса;

&і - среднеквадратичное отклонение по вектору распознаваемого объекта.

Выражение (37) получается непосредственно из (35) после замены координат перемножаемых векторов их стандартизированными значениями:

Необходимо отметить, что выражение для интегрального критерия сходства (37) по своей математической форме является корреляцией двух векторов, т.е. нормированной сверткой в координатной форме. Это означает, что если эти вектора являются суммой двух сигналов: полезного и белого шума, то при расчете интегрального критерия белый шум практически не будет играть никакой роли, т.е. его корреляция с самими собой равна нулю по определению. Поэтому интегральный критерий сходства объекта со случным набором признаков с любыми образами классов, или реального объекта с образами классов, сформированными случайным образом, будет равен нулю. Это означает, что выбранный интегральный критерий сходства является высокоэффективным средством подавления белого шума и выделения полезной информации из шума, который неизбежно присутствует в эмпирических данных.

Важно также отметить неметрическую природу предложенного интегрального критерия сходства, благодаря чему его применение является корректным и при неортонормированном семантическом информационном пространстве, каким оно в подавляющем количестве случае и является, т.е. в общем случае.

у

( 37 )

где:

Сравнение, идентификация и прогнозирование как разложение векторов объектов в ряд по векторам классов (объектный анализ)

Выше были введены неметрические интегральные критерии сходства объекта, описанного массивом-локатором Ц с обобщенными образами классов (выражения 40-42).

Для непрерывного случая выражение (42) принимает вид:

Г

м

■ JL(i)lj (i)di.

( 38 )

Таким образом, выражение (38) представляет собой обобщение интегрального критерия сходства конкретного объекта и обобщенного класса (42) для непрерывного случая в координатной форме.

Отметим, что коэффициенты ряда Фурье (39) по своей математической форме и смыслу сходны с ненормированными коэффициентами корреляции, т.е. по сути скалярными произведениями для непрерывных функций в координатной форме: выражением (37) между разлагаемой в ряд кривой f(x) и функциями Sin и Св8 различных частот и амплитуд [2]:

/

f (x ) = f +1

n=1

an cos

V

L

+ bn sin

V

L

где

1 L

a о = L I f (x )dx

a

L

1

L

- L L

( 39 )

= 7 J f (x)

cos

- L L

L

bn=L Jf (x )sin

L - L

dx

L

dx

где «={1, 2, 3,...} - натуральное число.

Из сравнения выражений (38) и (39) следует вывод о том, что процесс идентификации и прогнозирования (распознавания), реализованный в предложенной математической модели, может рассматриваться как разложение вектора-локатора распознаваемого объекта в ряд по векторам информативностей классов распознавания (которые представляют собой произвольные функции, сформированные при синтезе модели путем многопараметрической типизации на основе эмпирических данных).

Например, результаты идентификации представим на рисунке 3:

Универсальная когнитивная аналитическая система

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11:57 (с) нпп *эйдос*

№ анкеты:

Наим.физ.источника:

Качество:

у Код

38

43

79

159

157

249

10

49

57

185

182

201

204

198

26

179

Наименование класса

ПРОФЕССИОНАЛЬНО-ВАЖНЫЕ ЛИЧНОСТН УСТОЙЧИВОСТЬ И НАДЕЖНОСТЬ Б ЗКС УСПЕВАЕМОСТЬ ПО ДИСЦ. ГСЭ.02 (И УСПЕВАЕМОСТЬ ПО ДИСЦ. ДН.15 (Ри УСПЕВАЕМОСТЬ ПО ДИСЦ. ДН.15 (Ри УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.25 (ВВ поступление в вуз: поступил

УСТОЙЧИВОСТЬ и НАДЕЖНОСТЬ В ЭКС

УСПЕВАЕМОСТЬ ПО ЦИКЛУ ДН.00 (пр УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.04 (СП УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.03 (Ад УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.09 (Су УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.10 (ДО УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.08 (Бу СЛУЖЕБНО-ПРОФЕССИОНАЛЬНАЯ ИАПРА УСПЕВАЕМОСТЬ ПО ДИСЦ. СД.02 (ОР

31

20

20

16

16

16

13

12

-22

-23

-24

-24

-25

-27

-29

-35

Гистограмма сходств/различий

стр. 1 И стр. 1 Р;печать карточки Р4печать всех карточек | печать сводной формь*

Рисунок 3. Пример разложения профиля курсанта усл.№69 в ряд по

обобщенным образам классов

Продолжая развивать аналогию с разложением в ряд, данный результат идентификации можно представить в векторной аналитической форме:

Кусл№ = 0,31 • I (38)'+ 0,20 • I (48) + 0,20 • I (79) + 0,16 • I (159) +

• • • •

+ 0,16 • I (157) + 0,16 • I (249) +... - 0,35 • I (179) - 0,29 • I (26) -

• • • •

- 0,27 • I (198) - 0,25 • I (204) - 0,24 • I (201) - 0,24 • I (182) -... или в координатной форме, более удобной для численных расчетов:

( 40 )

Предполагается, что Ц = {Ц,}» К(,). Таким образом массив-локатор, характеризующий распознаваемый объект, рассматривается как сумма произведений профилей классов на интегральный критерий сходства массива-локатора с этими профилями (т.е. взвешенная суперпозиция или разложение в ряд по профилям классов).

В выражении (40):

I(j) - интегральный критерий сходства массива-локатора, описывающего состояние объекта и у-го класса, рассчитываемый, согласно выражений (38) или (40):

1 М / _ \ / _ч

■2(-/у)( - ь) ( 41 )

I,

а, а ,М

І =1

!(1у) - вектор обобщенного образа у-го класса, координаты которого рассчитываются в соответствии с системным обобщением формулы Хар-кевича (42):

4 =

Примечание: обозначения Ц1у) и /у, и т.п. эквивалентны. Смысл всех переменных, входящих в выражения (41) и (42) раскрыт выше.

При дальнейшем развитии данной аналогии естественно возникают вопросы: о полноте, избыточности и ортонормированности системы векторов классов как функций, по которым проводится разложение вектора объекта; о сходимости, т.е. вообще возможности и корректности такого разложения.

В общем случае вектор объекта совершенно не обязательно должен разлагаться в ряд по векторам классов таким образом, что сумма ряда во всех точках точно совпадала со значениями исходной функции. Это означает, что система векторов классов может быть неполна по отношению к профилю распознаваемого объекта, и, тем более, всех возможных объектов.

Предлагается считать не разлагаемые в ряд, т.е. плохо распознаваемые объекты, суперпозицией хорошо распознаваемых объектов (”похожих” на те, которые использовались для формирования обобщенных образов классов), и объектов, которые и не должны распознаваться, так как объекты этого типа не встречались в обучающей выборке и не использовались для формирования обобщенных образов классов, а также не относятся к представляемой обучающей выборкой генеральной совокупности.

Нераспознаваемую компоненту можно рассматривать либо как шум, либо считать ее полезным сигналом, несущим ценную информацию о неисследованных объектах интересующей нас предметной области (в зависимости от целей и тезауруса исследователей). Первый вариант не приводит к осложнениям, так как примененный в математической модели алгоритм сравнения векторов объектов и классов, основанный на вычислении нормированной корреляции Пирсона (сумма произведений), является весьма устойчивым к наличию белого шума в идентифицируемом сигнале. Во втором варианте необходимо дообучить систему распознаванию объектов, несущих такую компоненту (в этой возможности и заключается адаптивность модели). Технически этот вопрос решается просто копированием описаний плохо распознавшихся объектов из распознаваемой выборки в обучающую, их идентификацией экспертами и дообучением системы. Кроме того, может быть целесообразным расширить справочник классов распознавания новыми классами, соответствующими этим объектам, и осуществить пересинтез модели.

Однако на практике гораздо чаще наблюдается противоположная ситуация (можно даже сказать, что она типична), когда система векторов избыточна, т.е. в системе классов распознавания есть очень похожие классы (между которыми имеет место высокая корреляция, наблюдаемая в режиме: "кластерно-конструктивный анализ"). Практически это означает, что в системе сформировано несколько практически одинаковых образов с разными наименованиями. Для исследователя это само по себе является очень ценной информацией. Однако если исходить только из потребности разложения распознаваемого объекта в ряд по векторам классов (чтобы определить суперпозицией каких образов он является, т.е. "разложить его на компоненты"), то наличие сильно коррелирующих друг с другом векторов представляется неоправданным, так как просто увеличивает размерности данных, внося в них мало нового по существу. Поэтому возникает задача исключения избыточности системы классов распознавания, т.е. выбора из всей системы классов распознавания такого минимального их набора, в котором профили классов минимально коррелируют друг с другом, т.е. ортогональны в фазовом пространстве признаков. Это условие в теории рядов называется "ортонормируемостью" системы базовых функций, а в факторном анализе связано с идеей выделения "главных компонент".

В предлагаемой математической модели реализованы два варианта выхода из данной ситуации:

1) исключение неформирующихся, расплывчатых классов;

2) объединение почти идентичных по содержанию (дублирующих друг друга) классов.

Однако выбрать нужный вариант и реализовать его, используя соответствующие режимы, пользователь технологии АСК-анализа должен сам. Вся необходимая и достаточная информация для принятия соответствующих решений предоставляется пользователю инструментария АСК-анализа.

Если считать, что функции образов составляют формальнологическую систему, к которой применима теорема Геделя, то можно сформулировать эту теорему для данного случая следующим образом: "Для любой системы базисных функций в принципе всегда может существовать по крайней мере одна такая функция, что она не может быть разложена в ряд по данной системе базисных функций, т.е. функция, которая является ортонормированной ко всей системе базисных функций в целом ”. Поэтому для адекватного отражения подобных функций в модели необходимо повышение размерности семантического информационного пространства.

Очевидно, не взаимосвязанными друг с другом могут быть только четко оформленные, детерминистские образы, т.е. образы с высокой степенью редукции ("степень сформированности конструкта"). Поэтому в процессе выявления взаимно-ортогональных базисных образов, в первую

очередь, будут выброшены аморфные "расплывчатые" образы, которые связаны практически со всеми остальными образами.

В некоторых случаях результат такого процесса представляет интерес, и это делает оправданным его реализацию. Однако можно предположить, что наличие расплывчатых образов в системе является оправданным, так как в этом случае система образов не будет формальной и подчиняющейся теореме Геделя. Следовательно, система распознавания будет более полна в том смысле, что увеличится вероятность идентификации любого объекта, предъявленного ей на распознавание. Конечно, уровень сходства с аморфным образом не может быть столь высоким, как с четко оформленным. Поэтому в этом случае более уместно применить термин "ассоциация" или нечеткая, расплывчатая идентификация, чем "однозначная идентификация".

Итак, можно сделать следующий вывод: допустимость в математической модели СК-анализа не только четко оформленных (детерминистских) образов, но и образов аморфных, нечетких, расплывчатых является важным достоинством данной модели. Это обусловлено тем, что данная модель обеспечивает корректные результаты анализа, идентификации и прогнозирования даже в тех случаях, когда модели идентификации и информационно-поисковые системы детерминистского типа традиционных АСУ практически неработоспособны. В этих условиях данная модель СК-анализа работает как система ассоциативной (нечеткой) идентификации.

Таким образом, в предложенной семантической информационной модели при идентификации и прогнозировании, по сути, осуществляется разложение векторов идентифицируемых объектов по векторам классов распознавания, т.е. осуществляется "объектный анализ" (по аналогии с спектральным, гармоническим или Фурье-анализом), что позволяет рассматривать идентифицируемые объекты как суперпозицию обобщенных образов классов различного типа с различными амплитудами (25). При этом вектора обобщенных образов классов, с математической точки зрения, представляют собой произвольные функции и не обязательно образуют полную и не избыточную (ортонормированную) систему функций.

Для любого объекта всегда существует такая система базисных функций, что вектор объекта может быть представлен в форме линейной суперпозиции (суммы) этих базисных функций с различными амплитудами. Это утверждение, по-видимому, является одним из следствий фундаментальной теоремы А.Н. Колмогорова, доказанной им в 1957 году (О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения // Докл. АН СССР, Т. 114, С. 953-956, 1957).

Теорема Колмогорова: Любая непрерывная функция от п переменных Р(х], х2,..., хп) может быть представлена в виде:

К ( x, ))

i=l

/

2 п+1/

К (х,,, х2,..., хп ) = £ £ '= V

где ^ и Ну - непрерывные функции, причем Ну не зависят от функции к

Эта теорема означает, что для реализации функций многих переменных достаточно операций суммирования и композиции функций одной переменной. Удивительно, что в этом представлении лишь функции gj зависят от представляемой функции К, а функции Ну универсальны. Необходимо отметить, что теорема Колмогорова является обобщением теоремы В.И. Арнольда (1957), которая дает решение 13-й проблемы Гильберта.

К сожалению, определение вида функций Ну и gj для данной функции К представляет собой математическую проблему, для которой пока не найдено общего строгого решения.

В данной работе предлагается рассматривать предлагаемую семантическую информационную модель как один из вариантов решения этой проблемы. В этом контексте функция Г интерпретируется как образ идентифицируемого объекта, функция Нц - образ 1-го класса, а функция 2] - мера сходства образа объекта с образом класса.

Инструментальное решение проблемы референтного класса (система "Эйдос")

Цели и основные функции системы ” Эйдос”

Универсальная когнитивная аналитическая система "Эйдос" является отечественным лицензионным программным продуктом [14], созданным исключительно с использованием официально приобретенного лицензионного программного обеспечения. По системе "Эйдос" и различным аспектам ее применения имеется 12 научных монографий и учебных пособий с грифами УМО и министерства [2, 3], а также около 200 научных публикаций ряда авторов. Титульная видеограмма системы приведена на рисунке 4:

CopuRicrht (с) Scientific & industrial enterprise ftlDDS, Russia, 1979-2005. Russian Patent Mo 940217. ftll Rights Reserued. НАУЧНО-ПРОИЗВОДСТВЕННОЕ ПРЕДПРИЯТИЕ *ЭЙДОС* г.Краснооар, URL: http://Lc.Marod.ru Автор: б.э.н., к.т.н., профессор Е.В.Луценко

ЭИДОС-12.5

© и © т ш м a

При создании системы применены слебушие лицензионные программные продукты:

Рисунок 4. Титульная видеограмма системы "Эйдос’

Система "Эйдос" является одним из элементов предлагаемого решения проблемы и достижения цели данной работы, т.к. она обеспечивает решение следующих задач:

1. Синтез и адаптация семантической информационной модели предметной области, включая объект активный управления и окружающую среду.

2. Идентификация и прогнозирование состояния активного объекта управления, а также разработка управляющих воздействий для его перевода в заданные целевые состояния.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Углубленный анализ семантической информационной модели предметной области.

Таким образом, система "Эйдос" является инструментарием, решающим проблему данной работы.

Синтез содержательной информационной модели предметной области

Для разработки информационной модели предметной области необходимо владеть основными принципами ее когнитивной структуризации и формализованного описания. Синтез содержательной информационной модели включает следующие этапы:

1. Формализация (когнитивная структуризация предметной области).

2. Формирование исследуемой выборки и управление ею.

3. Синтез или адаптация модели.

4. Оптимизация модели.

5. Измерение адекватности модели (внутренней и внешней, интегральной и дифференциальной валидности), ее скорости сходимости и семантической устойчивости.

Идентификация и прогнозирование состояния объекта управления, выработка управляющих воздействий

Данный вид работ включает:

1. Ввод распознаваемой выборки.

2. Пакетное распознавание.

3. Вывод результатов распознавания и их оценку.

Углубленный анализ содержательной информационной модели

предметной области

Углубленный анализ выполняется в подсистеме "Типология" и включает:

1. Информационный и семантический анализ классов и признаков.

2. Кластерно-конструктивный анализ классов распознавания и признаков, включая визуализацию результатов анализа в оригинальной графической форме когнитивной графики (семантические сети классов и признаков).

3. Когнитивный анализ классов и признаков (когнитивные диаграммы и диаграммы Вольфа Мерлина).

Обобщенная структура системы "Эйдос"

Данной обобщенной структуре соответствуют и структура управления и дерево диалога системы (таблица 8):

Таблица 8 - ОБОБЩЕННАЯ СТРУКТУРА СИСТЕМЫ "ЭЙДОС"

Подсистема Режим Функция Операция

1. Формализация ПО 1. Классификационные шкалы и градации

2. Описательные шкалы (и градации)

3. Градации описательных шкал (признаки)

4. Иерархические уровни систем 1. Уровни классов

2. Уровни признаков

5. Программные интерфейсы для импорта данных 1. Импорт данных из ТХТ-фалов стандарта ООБ-текст

2. Импорт данных из йБР-файлов стандарта проф. А. Н.Лебедева

3. Импорт из транспонированных йБР-файлов проф. А. Н.Лебедева

4. Генерация шкал и обучающей выборки RND-модели

5. Генерация шкал и обучающей выборки для исследования чисел

6. Транспонирование DBF-матриц исходных данных

7. Импорт данных из DBF-файлов стандарта Евгения Лебедева

6. Почтовая служба по НСИ 1. Обмен по классам

2. Обмен по обобщенным признакам

3. Обмен по первичным признакам

7. Печать анкеты

2. Синтез СИМ 1. Ввод-корректировка обучающей выборки

2. Управление обучающей выборкой 1. Параметрическое задание объектов для обработки

2. Статистическая характеристика, ручной ремонт

3. Автоматический ремонт обучающей выборки

3. Синтез семантической информационной модели СИМ 1. Расчет матрицы абсолютных частот

2. Исключение артефактов (робастная процедура)

3. Расчет матрицы информативностей СИМ-1 и сделать ее текущей

4. Расчет условных процентных распределений СИМ-1 и СИМ-2

5. Автоматическое выполнение режимов 1-2-3-4

6. Сходимость и устойчивость СИМ 1. Сходимость и устойчивость СИМ

2. Зависимость валидности СИМ от объема обучающей выборки

7. Расчет матрицы информативностей СИМ-2 и сделать ее текущей

4. Почтовая служба по обучающей информации

5. Синтез СИМ и измерение ее адекватности

3. Оптимизация СИМ 1. Формирование ортонормированного базиса классов

2. Исключение признаков с низкой селективной силой

3. Удаление классов и признаков, по которым недостаточно данных

4. Разделение классов на типичную и нетипичную части

5. Генерация сочетанных признаков и перекодирование обучающей выборки

4. 1. Ввод-корректировка распознаваемой выборки

Распознава-

ние

3. Вывод результатов распознавания 1. Разрез: один объект - много классов

2. Разрез: один класс - много объектов

4. Почтовая служба по распознаваемой выборке

5. Построение функций влияния

2. Пакетное распознавание

6. Докодирование сочетаний признаков в распознаваемой выборке

1. Типологический анализ классов распознавания

5.

Типология

2. Типологический анализ первичных признаков

1. Информационные (ранговые) портреты (классов)

2. Кластерный и конструктивный анализ классов

1 Расчет матрицы сходства образов классов

2. Генерация кластеров и конструктов классов

3. Просмотр и печать кластеров и конструктов__________________________________

4. Автоматическое выполнение режимов: 1,2,3

5. Вывод 2d семантических сетей классов

3. Когнитивные диаграммы классов

1. Информационные (ранговые) портреты признаков

2. Кластерный и конструктивный анализ признаков

1. Расчет матрицы сходства образов признаков_____________________________

2. Генерация кластеров и конструктов признаков

3. Просмотр и печать кластеров и конструктов__________________________________

4. Автоматическое выполнение режимов: 1,2,3

5. Вывод 2d семантических сетей признаков

3. Когнитивные диаграммы признаков

1. Оценка достоверности заполнения объектов

2. Измерение адекватности семантической информационной модели

б. СК-анализ СИМ

3. Измерение независимости классов и признаков

4. Просмотр профилей классов и признаков СИМ-1 и СИМ-2

5. Графическое отображение нелокальных нейронов

6. Отображение Паретто-подмножеств нейронной сети

7. Классические и интегральные когнитивные карты

1. Генерация (сброс) БД

7. Сервис

1. Все базы данных

2. НСИ 1. Всех баз данных НСИ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. БД классов

3. БД первичных признаков

4. БД обобщенных признаков

3. Обучающая выборка

4. Распознаваемая выборка

5. Базы данных статистики

2. Переиндексация всех баз данных

3. Печать БД абсолютных частот

4. Печать БД условных процентных распределений СИМ-1 и СИМ-2

S. Печать БД информативностей СИМ-1 и СИМ-2

6. Интеллектуальная дескрипторная информационно-поисковая система

7. Копирование основных баз данных СИМ

3. Сделать текущей матрицу информативностей СИМ-1

9. Сделать текущей матрицу информативностей СИМ-1

Подробнее подсистемы, режимы, функции и операции, реализуемые системой "Эйдос", описаны в работах [2, 3].

Таким образом, система "Эйдос", реализующая приведенную математическую модель СТИ, основанную на базовой когнитивной концепции, на наш взгляд является инструментальным решением проблемы рефератных классов, т.к. позволяет решать ее на практике в самых различных предметных областях, в которых используется обобщение, абстрагирование, сравнение, классификация, прогнозирование, принятие решений и другие базовые когнитивные операции, поддерживаемые системой в универсальной форме, независящей от предметной области.

Выводы

Из вышеизложенного можно сделать обоснованный вывод о том, что базовая когнитивная концепция системно-когнитивного анализа, его математическая модель (системная теория информации), а также методика численных расчетов (структуры данных и алгоритмы) и специальный программный инструментарий (технология) СК-анализа (система "Эйдос") и методика ее применения являются решением проблемы референтного класса в теории и практике в различных предметных областях.

Литература5

1. Venn J. The logic of chance. - N.Y.: Macmillian and Co, 1876. - Р. 194.

2. Луценко Е. В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). - Краснодар: КубГАУ. 2002. - 605 с.

3. Луценко Е.В. Интеллектуальные информационные системы: Учебное пособие с грифами Министерства сельского хозяйства РФ и УМО для студентов специальности "Прикладная информатика (по областям)" и другим экономическим специальностям. 2-е изд., перераб. и доп.- Краснодар: КубГАУ, 2006. - 615 с.

4. Луценко Е.В. Artificial intelligence system for identification of social categories of natives based on astronomical parameters / Е.В. Луценко, А.П. Трунев // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2008. - №03(37). -Режим доступа: http://ej.kubagro.ru/2008/03/pdf/07.pdf

5. Луценко Е.В. АСК-анализ как метод выявления когнитивных функциональных зависимостей в многомерных зашумленных фрагментированных данных / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2005. - №03(11). - Режим доступа: http://ej.kubagro.ru/2005/03/pdf/19.pdf

6. Луценко Е. В. Астросоциотипология и спектральный анализ личности по астросоциотипам с применением семантических информационных мультимоделей / Е.В. Луценко, А.П. Трунев // Научный журнал КубГАУ [Электронный ресурс]. -

5 Для обеспечения доступа читателей к этим и другим работам они размещены в Мег^ по адресам: Ы1р://!с.kubagro.ru/aidos/ http://ei.kubagro.ru/a/viewaut.asp?id=11

Краснодар: КубГАУ, 2GGS. - №G1(35). - Шифр Информрегистра: G42GSGGG12\GGG2.

- Режим доступа: http://ei.kubagro.ru/2GGS/Gl/pdf/lG.pdf

7. Луценко Е. В. Возможности прогнозирования учебных достижений студентов на основе АСК-анализа их имеджевых фотороботов / Е. В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG4. - №G2(4). - Режим доступа: http://ei. kubagro. ru/2GG4/G2/pdf/l3.pdf

S. Луценко Е. В. Количественные меры возрастания эмерджентности в процессе эволюции систем (в рамках системной теории информации) / Е. В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG6. - №G5(21). -Шифр Информрегистра: G42G6GGG12\GGS9. - Режим доступа:

http://ei.kubagro.ru/2GG6/G5/pdf/3l.pdf

9. Луценко Е.В. Математическая сущность системной теории информации (СТИ) (Системное обобщение формулы Больцмана-Найквиста-Хартли, синтез семантической теории информации Харкевича и теории информации Шеннона) / Е.В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GGS. - №GS(42). - Режим доступа: http://ei.kubagro.ru/2GGS/GS/pdf/G4.pdf

1G. Луценко Е.В. Повышение адекватности спектрального анализа личности по астросоциотипам путем их разделения на типичную и нетипичную части / Е.В. Луценко,

A.П. Трунев // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: Куб-ГАУ, 2GGS. - №G2(36). - Шифр Информрегистра: G42GSGGG12\GG17. - Режим доступа: http://ei.kubagro.ru/2GGS/G2/pdf/lG.pdf

11. Луценко Е.В. Прогнозирование учебных достижений студентов на основе особен-

ностей их почерка с применением системно-когнитивного анализа / Е. В. Луценко // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: КубГАУ, 2GG6. -№G4(2G). - Шифр Информрегистра: G42G6GGG12\GGS3. - Режим доступа:

http://ei.kubagro.ru/2GG6/G4/pdf/27.pdf

12. Луценко Е.В. Существование, несуществование и изменение как эмерджентные

свойства систем. Квантовая Магия, том 5, вып. 1, стр. 1215-1239, 2GGS. [Электронный ресурс]. - Режим доступа:

http://quantmagic.narod.ru/volumes/VOL5l2GGS/pl2l5.html

13. Луценко Е.В. Типизация и идентификация респондентов в социологии по их астрономическим показателями на момент рождения. / Е.В. Луценко, А.П. Трунев,

B.Н. Шашин // Научный журнал КубГАУ [Электронный ресурс]. - Краснодар: Куб-ГАУ, 2GG7. - №G1(25). - Шифр Информрегистра: G42G7GGG12\GG14. - Режим доступа: http://ei.kubagro.ru/2GG7/Gl/pdf/l4.pdf

14. Пат. № 2GG361G9S6 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В.Луценко (Россия); Заяв. № 2GG361G51G РФ. Опубл. от 22.G4.2GG3. -5Ga

15. Резников В.М. Проблема референтного класса и условные вероятности. [Электронный ресурс]. - Новосибирск: Институт философии и права СО РАН. - Режим доступа: http://www.philosophy.nsc.ru/iournals/philscience/l G4/GG reznikov.htm

16. Трунев А.П., Луценко Е.В. Астросоциотипология: Монография (научное издание).

- Краснодар: КубГАУ, 2GGS. - 264 с.

17. Шеляг М.М. Обоснование количественной меры знаний, когнитивного интегрального критерия и второй семантической информационной модели СК-анализа на основе теории вероятностей. // Научный журнал КубГАУ [Электронный ресурс]. -Краснодар: КубГАУ, 2GGS. - №G9(43).- Режим доступа:

http://ei.kubagro.ru/2GGS/G9/pdf/G2.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.