Научная статья на тему 'Модели прогнозирования в интеллектуальных системах'

Модели прогнозирования в интеллектуальных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
389
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модели прогнозирования в интеллектуальных системах»

биения объектов на классы. При этом в начальном разбиении могут участвовать не все объекты. Решая задачу оптимизации ядер, получаем начальные значения ядер. Далее можно использовать метод динамических ядер.

Дополнительным критерием для определения начального числа классов, близкого к реальному, может послужить плотность расположения объектов в пространстве классов. Эта плотность может быть оценена как отношение числа объектов в классе к объему класса. В свою очередь, объем класса может быть вычислен как объем шара с центром в ядре класса и с радиусом, равным радиусу класса. В более общем случае можно раздельно оценивать радиусы класса по различным осям координат, тогда объем класса можно вычислить как объем соответствующего эллипсоида.

Более простой подход состоит в вычислении объема класса как объема куба со стороной, равной радиусу класса. При раздельном оценивании радиусов по осям координат аналогично можно вычислить объем соответствующего параллелепипеда.

Способ применения этого критерия достаточно прост. Задаемся начальным разбиением множества объектов на классы. Затем выбираем один класс из этого множества и делим его на два, для чего используется метод динамических ядер или сеть Кохонена. Если в результате разбиения получаются классы с плотностью, не меньшей, чем исходный класс, то разбиение считается удачным, и процедура повторяется для следующего класса. В противном случае результат последнего разбиения аннулируется. Эта процедура повторяется для всех классов, и если при этом не получено ни одного удачного разбиения, то алгоритм заканчивает работу, а полученное число классов считается соответствующим их реальному количеству.

Описанный алгоритм применяется для формирования классов, соответствующих различным стоимостным группам исследуемых объектов. Для решения задачи распознавания нового объекта, то есть отнесения исследуемого образца к той или иной стоимостной группе, возможно применение аппарата нейросетей. Однако на этом этапе более предпочтительным представляется использование нейросетей с радиальными базисными функциями. Естественным способом проявления базиса в данном случае являются ранее определенные N кластеров. Соответственно, сеть, решающая задачу классификации, будет иметь N нейронов во входном слое и один выходной нейрон. Между ними располагается еще один скрытый слой нейронов, количество которых должно обеспечить необходимую точность распознава-

ния; оно и определяется по теореме Колмогорова.

Результатом распознавания исследуемого объекта является его отнесение к одному из классов, то есть к конкретной стоимостной группе. Далее необходимо определить стоимость этого объекта, для чего нужно выполнить аппроксимацию стоимостных характеристик его класса на данный конкретный объект. Задачи аппроксимации функций многих переменных также могут быть решены с помощью нейросети, традиционно для этого наиболее подходящей считается нейросеть прямого распространения, то есть персептрон.

Кроме входного и выходного слоя персептрон содержит несколько (чаще всего 1 или 2) скрытых слоев, при этом каждый нейрон связан со всеми нейронами следующего слоя. Входной слой нейронов реализует линейную передаточную функцию, скрытые и выходные нейроны - сигмоидную функцию. Процесс обучения такого персептрона заключается в настройке весов связей W между его слоями.

Наиболее быстро настраиваемая разновидность персептрона - сеть с радиальными базисными функциями, в которой скрытый слой всего один, - реализует потенциальные передаточные функции, которые определяются в виде: ¥(х)=ехр(-(х-Ь)ж С(х-Ь) ) .

Центр положения базисной функции Ь обычно определяется центром соответствующего кластера, параметр С представляет собой ковариационную матрицу. В ходе обучения сети настраиваются параметры W и С, но могут также изменяться и центры Ь.

Чтобы определить ошибку обучения сети, необходимо просуммировать квадраты отклонения результата работы сети по всем кластерам, участвующим в обучении, от реальных цен, определенных в обучающей выборке. Для уменьшения этой ошибки обычно используется метод градиентного спуска. При этом выражение для производной весов вычисляется отдельно для связей между выходным и последним скрытым слоем и для связей между скрытыми слоями. Если в качестве нелинейной преобразующей функции нейрона используется сигмоидная функция, получаем известный метод обратного распространения ошибки.

Реализации и последовательное применение перечисленных алгоритмов могут служить основой для создания интеллектуальной системы поддержки принятия решений при стоимостной оценке объектов.

Кроме задач оценки различных драгоценных камней, разработанная система может применяться при оценке объектов недвижимости.

МОДЕЛИ ПРОГНОЗИРОВАНИЯ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ

Г.П. Виноградов, к.т.н.; Н.А. Семенов, д.т.н.

(Тверской государственный технический университет)

При классическом подходе к проблеме построения моделей социально-экономических процессов и решения задач прогнозирования:

— априори предполагается, что для наблюдаемых параметров справедлива гипотеза нормального закона их распределения, хотя это спорно (Петерс С. Хаос и порядок на рынке капитала. М., 2000);

— не учитывается активное поведение людей, являющихся интеллектуальными элементами объектов управления;

— предполагается, что поведение людей, занятых в процессе построения моделей прогнозирования, в слабой степени влияет (или вообще не влияет) на их адекватность и практическую значимость ре-

зультатов.

В то же время в экономике, построенной на знаниях, наблюдается тенденция к созданию систем с высокой степенью интеллектуальности. Их выходные параметры являются результатом принятия решений ЛПР.

В этом случае можно выделить две основных роли человека в управлении:

• ЛПР - человек, отвечающий за реализацию решений и последствия;

• эксперт - человек, владеющий знаниями и опытом в подготовке решений, но не отвечающий за их окончательный выбор и практическую реализацию.

Таким образом, во временных рядах, отображающих результаты наблюдения за экономическим процессом, всегда отражается политика ЛПР, поведение людей, участвующих в подготовке решений и реализации экономического процесса, воздействия внешней среды и т.п., то есть всего того, что названо механизмом функционирования организационной системы (Бурков В.Н., Новиков Д.А. Введение в теорию активных систем. М.: ИПУ РАН, 1996). Следовательно, прогноз в социально-экономических системах выступает как средство воздействия на объект управления. Такой вид прогноза называется активным.

Для активного прогноза совпадение значений прогнозных показателей с реальными не является доказательством высокого качества прогноза. В этих условиях первостепенную роль приобретает проблема описания в теоретических моделях прогнозирования поведения интеллектуальной организации с использованием знаний ЛПР и экспертов. Эти модели должны учитывать при решении задач прогнозирования влияние человеческого фактора.

Таким образом, задачи практики и логика развития теории прогнозирования порождают новый класс задач активного прогнозирования, что предполагает решение двух проблем:

1) построение процедур активной экспертизы для получения согласованного варианта прогноза либо нескольких альтернативных вариантов с примерно одинаковым уровнем аргументации;

2) разработка методологии применения комплекса научных методов, программных средств в сочетании с опытом, знанием, квалификацией и интуицией эксперта, ЛПР для получения модели, адекватно описывающей реальный процесс с его точки зрения (или с точки зрения группы экспертов).

Пусть социально-экономический процесс описывается как динамическая система вида: x(t+r)=

= fТ (x(t)),xe P, dimP=n , где т - временной лаг.

Пусть в дискретные моменты времени с шагом A = const регистрируется временной ряд из N чисел: Xj ,Х'2 y'y^N .

Каждая точка этого ряда является скалярной функцией вектора состояния динамической системы, то есть xi =h(x(t . )), t . =t0+(i-1)At .

Требуется по данным временного ряда {xt ,i=1,N } восстановить или реконструировать траекторию динамической системы.

Возможность такой реконструкции устанавливают теоремы Уитни и Таккенса, то есть для построенных т-мерных векторов Н(х((+т)), Н(х((+2т)),...,Н(х((+(т-1)т)) должна существовать функция Р, содержащая в себе проектор на многообразие размерности меньше т:

х1~Р(Рн(х1-1 ,...,х1-т )) •

Поскольку определить вид функции Р в общем случае невозможно, то, используя предположение о квазистационарности, можно считать, что исследуемый объект может находиться в одном из К состояний, и в каждом состоянии объект можно описать моделью, использующей, например, локальную аппроксимацию вида

Р(г)=Р(г0 )+А1 (Аг)+А2 (Аг,Аг), Аг=г-г0,

где А1 и А2 - полиномы первой и второй степени соответственно от Аz .

В реальных условиях эксперт при прогнозировании тенденции процесса всегда строит представление о влиянии на прогнозируемый показатель некоторого набора независимых факторов.

Пусть хеВт - вектор независимых переменных; уе В" - зависимая переменная; у=Ф(х) - неизвестная зависимость. Требуется высказать наиболее правдоподобное предположение о возможном значении у*=Ф(х*) переменной у при заданном значении х* переменной х, используя при этом:

• семейство частных моделей, построенных на основе статистической информации (х, у,):

у = 0(а 1;х)(1=1Д), (1)

где <р1 - вещественная функция и вектор оценок параметров ¿-й модели, определенные на этапе идентификации; х, у, - результаты измерений переменных х,у на периоде времени £;

• семейство экспертных высказываний:

х=х*^уе(ак,Ьк ](к =1К), (2)

где ак,Ък - заданные к-м экспертом действительные числа (будущее состояние системы), такие, что (ак,Ък] - попарно различные интервалы.

Задача ЛПР состоит в том, чтобы на основе информации типа (1)-(2) сформировать комбинированный прогноз. При сопоставлении и анализе экспертных мнений ЛПР для оценки степени их объективности, как правило, учитывает аргументацию экспертов. Для этого ЛПР стремится создать механизм экспертизы, при котором эксперты стремятся к выработке наиболее обоснованного варианта решения. Такой механизм называется неманипулиремым, так как позволяет свести к минимуму влияние субъективных факторов на принимаемое решение. Алгоритм решения этой задачи отображен на рисунке.

Предлагаемая схема основывается на знании причинно-следственных связей между входными факторами и анализируемыми показателями, которые имеются на качественном уровне у опытного пользователя. То есть каждый опытный эксперт на качественном вербальном уровне выносит свое суж-

дение {я,}^ на основе модели состояния системы,

которая описывает не только связи между параметрами, но и учитывает направление воздействия факторов и степень их влияния друг на друга на текущий момент времени. Это и позволяет предложить процедуры варьирования параметров математических методов прогнозирования в соответствии с представлениями экспертов.

Задача прогнозирования социально-экономического процесса относится к классу слабоструктурированных задач, описываемых когнитивными моделями, которые строятся на основе доступной информации и знаний эксперта. В современных организационных системах созданы компьютерные системы, управляющие огромными собственными базами данных, а также имеющие доступ к другим базам данных. Объемы доступных данных исчисляются терабайтами. Информационные технологии в этом процессе могут использоваться в двух вариантах: 1) эксперт использует запросы как средство извлечения

данных для анализа (такая схема работает в относительно несложных ситуациях и небольших базах данных); 2) в случае сложных проблем и больших объемов данных информационные технологии должны обеспечивать извлечение знаний из баз данных так, чтобы эксперт получал информацию в агрегированном виде - в виде моделей, подготовленных компьютером. Такое их использование для построения моделей позволяет их пошаговое улучшение. Начав с относительно грубой модели, необходимо по мере накопления новых данных и результатов применения модели на практике улучшать ее, используя следующие операции:

— извлечь данные, очистить их и трансформировать;

— провести собственно анализ data mining;

— интерпретировать полученные результаты.

Интерпретация результатов возлагается на эксперта, который переводит эти знания в правила типа "Если ..., то ...". Результатом интерпретации должна быть иерархия критериев, полученная путем декомпозиции цели, сформулированной в самом общем виде, и множеством сгенерированных экспертом решений - альтернатив. Эта схема иерархии критериев дополняется моделью динамики развития ситуации, построенной на основе знаний эксперта о процессах, протекающих в анализируемом объекте. Модель динамики ситуации представляется в виде особого вида когнитивных карт, описывающих ситуацию множеством факторов, связанных причинно-следственными отношениями с операторами их преобразования, полученными при применении технологии data mining. Такие модели позволяют получать количественные прогнозы развития ситуаций, а также решать задачу генерации решений для перевода ситуации из начального в целевое состояние.

ГЕНЕТИЧЕСКИЙ ПОИСК ПРИ ПОСТРОЕНИИ СВЯЗЫВАЮЩИХ ДЕРЕВЬЕВ

(Работа выполнена при частичной финансовой поддержке РФФИ 07-01-00511 и программ РНП.2.1.2.2238, РНП 2.1.2.3193)

В.В. Курейчик, д.т.н. (Таганрогский технологический институт Южного федерального университета), П.В. Сороколетов, к.т.н. ЗАО «СЕДИКОМ» (Москва)

Многие задачи автоматизации проектирования решаются на основе эволюционного моделирования и генетического поиска (Емельянов В.В., Курейчик В.В., Курейчик В.М. Теория и практика эволюционного моделирования. М.: Физматлит, 2003; Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы. Р-н-Д: Ростиздат, 2004). Генетический поиск с точки зрения преобразования информации -это последовательное преобразование одного конечного нечеткого множества альтернативных решений в другое. Само преобразование называется алгоритмом поиска, или генетическим алго-

ритмом (ГА). В основе ГА лежит случайный, направленный или комбинированный поиск. Целью работы является анализ путей и методов повышения скорости работы ГА при построении связывающих деревьев на этапе проектирования. Авторы предлагают новые архитектуры параллельного генетического поиска, позволяющие в отличие от стандартных и существующих ГА частично решать проблему предварительной сходимости алгоритмов построения деревьев Штейнера и повышать скорость обработки информации, не ухудшая качества решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.