УДК 004.8
МЕТОД ИСПОЛЬЗОВАНИЯ МЕНТАЛЬНЫХ ПРЕДСТАВЛЕНИЙ АГЕНТА ПРИ РЕШЕНИИ ЗАДАЧ ПРОГНОЗИРОВАНИЯ
Г.П. Виноградов, М.Н. Куракин
Тверской государственный технический университет
Рассматривается задача использования ментальных представлений агентов в задачах прогнозирования. Предлагаемый метод основан на сочетании формализованного представления качественных знаний агентов в виде когнитивных моделей и статистических методов.
Ключевые слова: агент, когнитивная модель, многокритериальная оптимизация, прогнозирование, тренд, временной ряд.
Введение
В практике прогнозирования социально-экономических процессов часто встречаются ситуации, когда имеется несколько альтернативных моделей изучаемого процесса и выполненные по ним прогнозы существенно различны. Для такой ситуации развит ряд методов, позволяющих комбинировать эти частные прогнозы или порождающие их модели [1] и, таким образом, достигать согласованной оценки ожидаемого развития процесса.
Для повышения надежности комбинированного прогноза привлекаются эксперты (их будем называть интеллектуальными агентами), которые анализируют частные прогнозы и ранжируют их по достоверности. После этого этапа используются известные методы обработки экспертных оценок для определения прогноза наиболее согласованного с мнением всех агентов (так называемый эвристический подход к комбинированию прогнозов [2]).
Однако суждения агентов не обязательно должны относиться только к оценкам результатов прогнозирования, полученных на моделях. В частности, агенты могут сами высказывать мнение об ожидаемом значении прогнозируемой величины. При этом возникает задача комбинирования частных прогнозов, выполненных как с использованием моделей, так и на основе экспертных высказываний.
В статье развивается один из воз-
можных подходов к решению этой задачи. Особое внимание при этом уделено простоте вычислительной реализации.
Постановка задачи прогнозирования Пусть хе IV' - вектор независимых переменных, у е Кп - зависимая переменная, у = Ф(х)~ неизвестная зависимость. Требуется высказать наиболее правдоподобное (в определенном ниже смысле) предположение о возможном значении у* = Ф(х*) переменной у при
заданном значении х * переменной х, используя при этом:
• Семейство частных моделей
у = (р1 (а1; х) (/ = 1, ТУ), (1)
построенных на основе статистической информации.
(2)
где (р1, а1 - вещественная функция и вектор оценок параметров г -й модели, определенные ранее на этапе идентификации; х., у , - результаты измерений переменных , у на периоде времени I.
• Семейство экспертных высказываний
х = х*^у&(ак,Ък] (к = 1,К), (3) где ак,Ьк - заданные к-м агентом действительные числа, такие, что (ак,Ьк] - попарно различные интервалы.
Данная постановка задачи является детерминированной. Возможна также вероятностная постановка, которая предпо-
лагает известными следующие характеристики неопределенности исходной информации:
Законы распределения случайных ошибок е1 (/ = 1, ТУ), с которыми выполняется предсказание у по х на моделях (1).
Правдоподобия рк (0 < рк < 1) экспертных высказываний (3).
Согласованные оценки агентов для нижней А и верхней В границ значений у такие, что правдоподобия событий уе и у е (В, со) равны нулю.
При решении задачи прогнозирования рядов динамики экономических показателей необходимо учитывать следующие их особенности:
1. Анализируемый экономический показатель у испытывает на себе влияние
множества факторов X — {хг., / = 1, п) , которое состоит из двух подмножеств: X = { X и } и { х 7 } , где {Хи } -подмножество управляющих входных факторов и {Хт} - подмножество контролируемых и неконтролируемых воздействий внешней среды. Часть этих факторов имеет монотонный характер изменения и вызывает такое же монотонное изменение анализируемого показателя. Существует значительная часть входных факторов изменяющихся скачкообразно, что вызывает резкое изменение производной ¥. Это может быть, например, получение разового льготного кредитования, введение повышенных импортных пошлин, резкая девальвация рубля и т.п.
2. Важной особенностью временных рядов экономических показателей является то, что «вклад» в тенденцию ¥(1/ /1) с ростом р уменьшается. Это позволяет утверждать, что временной ряд практически любого экономического показателя является объектом с конечной памятью 81'. Очевидно, что величина р будет определять объем выборки, принимаемой во вни-
мание при расчете параметров модели. В зависимости от шага дискретизации временной ряд задается таблицей вида
Вп = {у(1 г),1 = 1>п } , где п - находящийся в распоряжении объем выборки. Но для построения оптимальной модели тренда экономического показателя как динамической системы Л'’’, необходимо иметь фиксированные значения ¥ = 7(7), где ? е ^п_т^п\, т> 0 и т <п, заранее неизвестны и характеризуют «память» динамической системы. Очевидно, что у(?п) —
это последнее значение временного ряда. Если т > п, то, очевидно, данных недостаточно для построения модели тренда. Наиболее целесообразно величину ш определять итеративным путем.
3. Наличие данных, резко отличающихся от трендовых значений («выбросов»). Выявление внешних факторов, вызывающих «выброс» позволяет построить сценарий при ответе на вопрос «что будет если...».
Эти особенности делают проблематичным качество прогноза на основе модели тренда, полученной по методу наименьших квадратов, в том числе и с весовыми коэффициентами.
Больший эффект в таких ситуациях дает сочетание опыта и знаний агента и возможностей статистических методов.
Предлагаемая схема основывается на предположении, что для экономических показателей можно предложить множество вариантов аппроксимации закона распределения, удовлетворяющих статистическим правилам проверки их адекватности. Выбор конкретного варианта будет определяться, очевидно, знанием причинно-следственных связей между входными факторами и анализируемым показателем, которое имеется на качественном уровне у опытного пользователя.
Согласно приведенной схеме параметры модели тенденции будут определяться условием минимизации следующего функционала:
т
X ~ ^(О)2 -» ^ е а„,, (4)
1=1
где т - количество значений временного ряда 7, IV = {wi = \,т) ^ О.^ - мно-
жество значений для весовых коэффици-
т
ентов, например, О, и’, = 1 .
;=1
Варьируемыми параметрами при минимизации данного функционала будут: весовые коэффициенты г =\,т ; вид модели у = (р{г); объем выборки, принимаемый во внимание при определении параметров модели тренда.
Качество модели, можно описать стандартными статистическими показателями. Пусть показатели качества построенной модели тенденции образуют
вектор Z = {г у = 1, к} . Тогда очевидно, что 2 = {г j = \, к} будет зависеть от вектора весовых коэффициентов Ж = {м?= \,т) , которые для
лица принимающего решения образовали вектор управляющих переменных, выбором которых ЛИР может обеспечить требуемый уровень прогностической эффективности модели тенденции.
Будем предполагать, что для агента шкала ценностей определена таким образом, что различные наборы показателей
Z = - ,у = 1,&} имеют для него неоди-
наковое значение. Это позволяет предположить существование у него непрерывного монотонно возрастающего по каждому показателю квазивогнутого индикатора предпочтений и(2) такого, что
г(жт) у г(ж<2)) о и(г(жт)) > и(г(ш<2>)) ^ г(жт) ~ г(ж(2)) о и(г(]¥т) = и(г(ш<2)))
где Ж(1),Ж(2) е 0.№ (здесь 0.у/ - множество допустимых значений управляющих переменных, в данном случае весовых коэффициентов).
Сделанное предположение относи-
тельно функции U(Z(W)) позволяет определить решение задачи векторной оп-тимизации, как множество точек { w . } , максимизирующих функцию U(Z(W)) таких что:
r=K,i = WEfi»,«r°= (6)
arg max U (zx (W),..., z/JVzk(W)).
Для найденных значений W° e Q.w должно выполняться условие оптимальности по Парето и поиск решения должен проходить по паретовой границе множества Z(W):
E(Z(W)) = {Z(1) е Z(W), Z(1) >- Z(2),
Z(2) e Z(W) => Z(1) = Z(2)}.
Функция U(Z(W)) в явном виде, как правило, неизвестна, поэтому для определения оптимальных величин целесообразно использовать интерактивные процедуры. Для этого выбирается некоторое решение W(V), с использованием информации, получаемой от агента, определяется поведение U(Z(W(0>) в окрестности точки W('V> и на этой основе строится последовательность решений {Ж(1)}, которая при определенных условиях сходится кИ.
Однако, часто множество E(Z(W)) невыпуклое, и поиск в пространстве решений сопряжен со значительными трудностями. Поэтому паретову границу целесообразно параметризировать элементами более простого множества А . Из известных процедур параметризации для целей оптимизации прогностических свойств модели тенденции наиболее подходящей является процедура ассортиментной параметризации, базирующаяся на теореме Карлина [1]:
U(Z(W)) = U(a,Z(W))=<a,Z(W)>, (8)
где <•> - означает скалярное произведе-
к
ние, а е A, {aj > О, Z ai = !>'
3= 1
При этом выполняются условия:
We П.
V
W
a(W) є А : W(a) = argmaxU(a(W), Z(W)) = W
0
(9)
(10)
где Ilw - область Парето.
Пусть V* — совокупность предпочтительных с точки зрения ЛИР показателей Z(W), причем У*Ф0и
V*eE(Z(W)), тогда согласно принятой процедуре параметризации, V* можно представить как V* = сг(А*), где А* — множество максимальных элементов отношения , определяемых предпочтениями ЛИР на множестве параметров А, по правилу
ах >- а2 сг(<21) > (j{a2),al,a2 е А .(11)
Тогда задача принятия решения по выбору оптимальных структуры и параметров модели тренда временного ряда может быть записана в виде:
U * (а) —> шах, ае А, (12) где U* = U ■ (7.
Таким образом, произведена параметрическая декомпозиция экстремальной задачи U(Z(W)), W е Qw, Z(W)e QzHa задачу вычисления <Т и задачу maxU(<j(a)), ае А . Такая декомпозиция распределяет роли в человеко-машинном диалоге следующим образом:
■ на ЭВМ вычисляется параметризация о, которая для ассортиментной параметризации имеет вид max'? при Z(W) > aZ ;
■ агент участвует в решении задачи оптимизации (12).
В качестве формальной основы диалоговой процедуры построения модели тренда можно воспользоваться как градиентными методами решения, так и методами прямого поиска, не требующими информации о производных целевой функции. В силу того, что модель имеет стохастический характер, латентными
факторами выступают качественные признаки, и кроме того, функция и(-) предпочтений агента, в общем случае, не является дифференцируемой, то наибольший эффект следует ожидать от применения методов случайного поиска.
При организации диалога с лицом принимающим решения использовалась следующая модель реакции ЛИР на предъявленное решение.
По двум решениям 2(\¥(Г)) и 2(Ж(2)) ЛИР сообщает вектор с компо-
нентами: і = 1, к такой, что:
1 =
i
+ 1,если принятие {увеличение или уменьшение )
(13)
г — го критерия соотвеству ет получению предпочтит ельного решения;
— 1,в противном случае;
0,если принятие ¿ — го критерия безразлично.
Ускорение сходимости описанного выше алгоритма возможно за счет более полного учета информации о направлении поиска в пространстве решений, получаемой от агента.
Суть алгоритма состоит в итеративном повторении следующих шагов:
- выполнение процедуры ассортиментной параметризации;
- расчет оптимальных значений весовых коэффициентов
- выявление предпочтений агента и корректировка значений а.,_/ = 1,& методом поощрения случайностью.
Первоначальные значения весов для ускорения сходимости назначаются для контрольных точек выбранных лицом, принимающим решения по формуле:
1Д
Ц> i = ------------,
т + ОД с
где т - объем выборки, с- число контрольных точек. Для остальных точек выборки весовые коэффициенты принимаются равными.
Если последняя точка является кон-1
трольнои: w =
т + 0 Д с
Из условия нормализации ^ wf = 1 и
7=1
погрешности вычислении вес для последней точки выборки примем равным:
1 1 т -1
-----------1-(1 - V м>.) . Если по-
да + ОДс ^
=
следняя точка не является контрольной:
^ /Я -1
■+о-Е w,.).
т + ОД с ,.=1
На каждом шаге поиска оптимум функции предпочтения осуществляется методом скользящего допуска [2], показатели качества модели рассчитываются после определения параметров методом наименьших квадратов.
Если за заданное число итераций не будет получена ситуация безразличия по сравниваемым показателям, то принимается решение, либо изменить структуру модели, либо изменить величину объема выборки данных.
Описанная методика реализована на базе приложений C++ и MS Excel и была применена для прогноза рядов динамики функционирования рынка услуг г. Твери. Качество модели оценивалось по четырем показателям: СКО выбранных точек, квадрат разности экспериментальных данных и теоретических с весами, визуальное сходство, СКО всех точек выборки. Значение критерия Фишера использовалось как ограничение при расчете оптимальных значений W . Количество контрольных точек было выбрано равным 4. В начальный момент значения для двух наборов коэффициентов а выбраны случайным образом. Начальные значения для весовых коэффициентов W определялись по описанным выше формулам.
Допустимое число итераций принималось равным 10. В качестве первого приближения использовалась полиномиальная модель второго порядка.
Формирование таблицы предпочтений агента на каждой итерации осуществляется попарным сравнением критериев
оценки качества модели для двух рассчитанных вариантов с помощью экранной формы, представленной на рис. 1.
В ходе выполнения алгоритма были определены точки, веса Ж. которых стремятся к нулю. Эти данные, слабо влияющие на современную тенденцию развития рынка из-за событий августа 1998 года, были отброшены. Для оставшихся данных была выполнена операция дезагрегирования, и был выполнен переход к помесячным данным.
В конце работы алгоритма получаем оптимальную, на взгляд агента, модель:
^ = -0,0001 к3 + 0,005543Г2 -
- 0,07769^ + 19,51824.
(14)
Прогнозируемые значения представлены на рис. 1, где точки январь 2000, февраль 2000 и март 2000 соответственно использованы как контрольные для оценки качества модели.
Интерактивная модель дала более точный прогноз. Это произошло вследствие более точного учета ситуации на рынке с помощью знаний и опыта агента. Более того, модель, построенная с помощью статистических методов, показала снижение объемов оказания платных услуг, хотя четко прослеживается тенденция на их увеличение.
Согласование результатов прогноза нескольких агентов.
В качестве комбинированного прогноза примем образ линейной свертки
функций (р1 моделей:
<Р(р,х) = ^р1(р1(а\х).
(15)
2=1
при х = х*, где /3 = {/3\/32 - век-
тор подлежащих определению коэффициентов.
- Реальные данные —Интерактивная модель —is— МНК
Рис. 1. Сравнение прогнозов интерактивной модели и МНК
Введем следующие обозначения: у}. = ф* (а' Ху) (/ = 1, #, j = 1, /;),
Уп+1 =<р'(а',х*) (/ = 1,#, (а,Ь] = [](ак,Ьк]
к=\
и рассмотрим четыре возможных случая.
Экспертные высказывания взаимно не противоречивы и в совокупности согласованы с некоторыми из частных прогнозов, то есть выполняются условия:
(а,Ь\ Ф О
(а,г>]п|{л+1,...,л+1}^о- (16)
Коэффициенты /?' находим из требования минимизации суммы модулей отклонений фактических от рассчитанных по свертке (14) значений зависимой переменной на периоде основания прогноза:
N
¿(Р) = '51\У] -<р{Р,х})\-^тт (17)
У=1
при условиях согласованности комбинированного прогноза с экспертными вы-
сказываниями: а + 8 < ^ /5' уп+1 <Ь и
;=1
N ____
нормировки = 1, Р >0 (7 = \,Щ ■
i=\
Здесь 8 - малое положительное
число, введенное для получения двухсторонних нестрогих ограничений при полуоткрытом интервале (а,Ь].
Необходимость минимизации суммы модулей отклонений на периоде основания прогноза вызвана тем, что свертка (14) должна не просто удовлетворять экспертным высказываниям о будущем развитии процесса, но и хорошо объяснять его предысторию.
ЛИТЕРАТУРА
1. Гермейер Ю.Б. Игры с непротивоположными интересами//М.: Из-во МГУ, 1972, - 183 с.
2. Химмельблау Д.М. Прикладное нелинейное программирование //М.: Мир, 1975, - 536 с.
Рукопись поступала в редакцию 24.12.2010.
THE METHOD OF AGENT’S MENTAL REPRESENTATIONS USE FOR PREDICTING
G. Vinogradov, M. Kurakin
The task of agents’ mental representations use in forecasting problems is considered. The proposed method is based on a combination of formal presentation of agents’ qualitative knowledge in the form of cognitive models and statistical methods.
Keywords: agent, cognitive model, multiobjective optimization, forecasting, trend, time series.