УДК 338.5:004.8.032.26
Р.Р. РЗАЕВ*, Н.А. УМАРОВА**, М.А. АГАМАЛЫЕВ**
АДАПТИВНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ ЦЕНООБРАЗОВАНИЯ НА РЫНКЕ С ИСПОЛЬЗОВАНИЕМ РАДИАЛЬНО-БАЗИСНОЙ ФУНКЦИОНАЛЬНОЙ СЕТИ
Институт кибернетики НАН Азербайджана, Азербайджанский государственный технический университет, Баку, Азербайджан Университет «Одлар Йурду», Баку, Азербайджан
Анотація. Пропонується схема адаптивного управління процесом ринкового ціноутворення, заснована на застосуванні радіально-базисної функціональної нейронної мережі. Схема управління, що включає градієнтний алгоритм налаштування параметрів нейронного регулятора, апробована на конкретному прикладі.
Ключові слова: ринкове ціноутворення, адаптивне управління, радіально-базисна функціональна мережа, нейронний регулятор.
Аннотация. Предлагается схема адаптивного управления процессом рыночного ценообразования, основанная на применении радиально-базисной функциональной нейронной сети. Схема управления, включающая градиентный алгоритм настройки параметров нейронного регулятора, апробирована на конкретном примере.
Ключевые слова: рыночное ценообразование, адаптивное управление, радиально-базисная функциональная сеть, нейронный регулятор.
Abstract. Adaptive management scheme of market pricing process based on radial basis function network is proposed. The control scheme including a gradient algorithm ofparameter settings of neural controller was tested on a specific example.
Keywords: market pricing, adaptive management, radial basis function network, neural controller.
1. Введение
Спрос и предложение являются основными концепциями потребительского рынка товаров и услуг, а их уровни, как известно, зависят от многих факторов: от текущей и ожидаемой цены на товар (услугу), доходов и потенциального количества потребителей, цен на родственные товары, цен на сырье, технологии производства, числа производителей и т. д. Однако, если предположить, что меняется лишь цена данного товара, а все остальные факторы остаются неизменными (то есть фиксированными), то функции спроса D и предложения S со свойственными им характерными особенностями можно представить соответственно как
Qd = D(p), D (p)< 0
и
Qs = S (p ), S (p )> ^
где Qd - уровень спроса, Qs - уровень предложения, p - текущая цена товара (услуги).
Тенденции попеременного изменения уровней спроса и предложения на рынках товаров и услуг обеспечивают конкурентный уровень равновесной цены и в конечном итоге приводят к установлению равновесия, при котором объём товаров, предлагаемый товаропроизводителями и доставляющий им максимум прибыли, равен предъявляемому спросу потребителей. Однако равновесие достигается далеко не всегда и не на всех рынках. Поэтому модели динамических процессов установления равновесия потребительских цен находятся в центре внимания исследователей с самого начала применения математических методов в экономике и по сей день остаются актуальными и востребованными.
© Рзаев Р.Р., Умарова Н.А., Агамалыев М.А., 2013 ISSN 1028-9763. Математичні машини і системи, 2013, № 3
В данной работе предлагается модель нейронного управления процессом рыночного ценообразования. Вполне очевидно, что нейронные сети, обладающие рядом уникальных свойств, например, способностью к обучению и обобщению данных, умению адаптироваться к изменению свойств объекта управления и внешней среды, пригодностью для синтеза нелинейных регуляторов, высокой устойчивостью к повреждениям своих элементов в силу изначально заложенного в нейросетевую архитектуру параллелизма, являются мощным инструментом регулирования. Сама идея применения нейронных сетей для управления динамическими объектами впервые была высказана У. Видроу [1] еще в 1964 г., однако интенсивные исследования в этом направлении развернулись лишь в конце 80-х годов прошлого века. В дальнейшем исследовались различные способы построения нейрорегуляторов с применением различных типов нейронных сетей, например, многослойных feedforward с линиями задержек [2] и рекуррентных (feedback) сетей. Однако наилучшие результаты всё же были получены при использовании радиально-базисных функциональных сетей [3], предполагающих обучение существенно меньшего числа своих параметров.
2. Динамические модели рыночного ценообразования
Одним из подходов при изучении динамики рыночного ценообразования является дискретный, при котором цена pt, спрос Dt и предложение St на промежутке [t, t +1) остаются неизменными. Для изучения динамики цен используются различные, включающие элементы обучения, модификации следующих двух базовых тривиальных итерационных моделей:
S (pt+1) = D(pt) (при запаздывании предложения) (1)
или
D(pt+1) = S (pt) (при запаздывании спроса). (2)
Вместе с тем известно, что развитие системы ценообразования, как, собственно, и любой другой динамической системы, без присутствия там обратных связей может привести к катастрофе, так как только инверсное управление, то есть управление с применением обратной связи, способно усилить устойчивость процесса рыночного ценообразования [4]. Поэтому отсутствие обратных связей в модификациях (1)-(2), как правило, не позволяет получить искомые устойчивые решения, в данном случае равновесную цену това-
ра.
По сути, к подобному выводу подводит и известная классическая модель адаптации цены вальрасовского типа с одним запаздыванием [5]:
pt+1 = pt+AD(pt)- S (pt)], (3)
где r > 0 - коэффициент адаптации, определяющий реакцию рынка (экономических агентов) на дисбаланс спроса и предложения. Нетрудно заметить, что модель (3) отражает рост или снижение цены на товар при избыточном спросе или предложения соответственно, причём ее сходимость, то есть движение текущей цены к равновесной, зависит от выбора значения r .
Данный подход, который связывают с именем Л. Вальраса, может быть формализован различными способами. В частности, в дискретном случае динамику рыночного ценообразования можно представить как
pM = pter[ D( p )-S (p)]. (4)
Проведенные исследования этой модели показали, что даже в случае линейных функций спроса и предложения очень трудно достичь искомого решения, так как из-за би-фуркационности параметра модели итерационный процесс ценообразования не приводит к точечным или даже периодическим аттракторам: цена меняется без кажущейся закономерности, и в ее поведении наблюдается детерминированный хаос.
К еще более сложным решениям приводят динамические модели рыночного ценообразования, представленные в виде нелинейных разностных уравнений с двойным запаздыванием:
р(+1 = Гр(р{) + (1 - г )р(рм), (5)
где г - параметр осреднения, р(р) = рАе-р , А - коэффициент адаптации.
Компьютерные симуляции итерационного процесса рыночного ценообразования (5) для различных значений параметров г и А , проведенные в [6], показали наличие хаотического изменения цены р(, хотя в отдельных случаях все же имеет место детерминированный хаос, сменяющийся высокопериодичными колебаниями с конечным выходом на равновесное решение при некоторых значениях параметра г . Это еще раз доказывает необходимость вовлечения в процесс моделирования рыночного ценообразования обратной связи, которую в настоящее время все чаще реализуют с применением нейронных технологий, в том числе радиально-базисных функциональных нейронных сетей.
3. Постановка задачи
Процесс рыночного ценообразования представляет собой нелинейную динамическую систему. Поэтому рассмотрим этот процесс как систему из класса 8180 (один вход - один выход), описываемую в общем виде как разностное уравнение [7]:
А+1 = I к , Рр-! — Р-п+1 )+ )• ) , (6)
где \р(} - последовательность цен как скалярных выходов системы; )} - управляющие
входы; п и т - целые числа, определяющие порядок системы, причём т < п; / : Жп ® Ж
- неизвестная нелинейная функция; в(г-1) - полином т -го порядка по 2_1 (задержкам на один такт) вида
в(г) = Ь„ + ^+ Ъг2+... + Ъ,г.-. (7)
В (6) нелинейная функция /(•) считается достаточно сложной и недоступной для аналитического представления, а коэффициенты Ък (к = 1 т) полинома в(г-1) также считаются неизвестными. Цель данной работы заключается в нахождении такого адаптивного управляющего закона (адаптивного управления ценообразованием), чтобы выход системы р( наименее уклонялся бы от соответствующего желаемого выхода ргтой.
Для аппроксимации нелинейной функции / (•) в работе применяется радиальнобазисная функциональная (РБФ) нейронная сеть, на основе которой индуцируется управление ценообразованием.
Далее, в целях удобства, примем следующие сокращения:
^ =( А , Pt-l,..., р,-п+1 ) ,
Ри ^), и^ -1),...,и( - т)],
К ^ )Т = [ Ъо,Ъ1,..., Ът ].
Тогда (б) можно записать в более компактной форме:
Pt+1 = f (xt ) + К (t)T Фи (t)
4. РБФ нейронные сети
В общем случае под радиальной базисной функциональной нейронной сетью (Radial Basis Functional Neural Network) понимается двухслойная feedforward (без обратных связей) сеть, которая содержит скрытый слой радиально симметричных нейронов. Радиальные базисные нейронные сети состоят из большего количества нейронов, чем обычные feedforward нейронные сети, обучающиеся по алгоритму «error backpropaqation» (обратное распространение ошибки), но на их создание требуется значительно меньше времени. Причем РБФ-сети наиболее эффективны, когда доступно обучающее множество, состоящее из большого числа обучающих векторов.
На рис. 1 в нотации пакета MATLAB показаны радиально-базисный нейрон с n входами: x1, x2,..., xn и его гауссовская функция активации вида
y = radbas(l) = exp(-12), (9)
где вход I определяется как i=||x-w||# График гауссовской функции активации представлен на рис. 2.
y=radbas( ||w - х||)
Рис. 1. Радиально-базисный нейрон Рис. 2. Гауссовская функция активации
Радиально-базисный нейрон формирует значение 1, когда вход х идентичен вектору весов w. Смещение в позволяет корректировать чувствительность нейрона rаdbаs. Например, если нейрон имел смещение в = 0,1, то его выходом будет 0,5 для любого вектора
входа х и вектора веса w при расстоянии между векторами, равном 8,333 или 0,833/в.
Следовательно, при помощи в можно масштабировать разность х и w.
В общем виде РБФ-сеть (опять же в нотации МЛТЬЛВ) (рис. 3) состоит из двух слоев:
• скрытого радиальнобазисного слоя, имеющего пг нейронов;
• выходного линейного слоя, имеющего тг нейронов.
Входами блока явля-
ются вектор входа х и матрица весов Г^д, а выходом - вектор, состоящий из т элементов. Выход блока |^І8І|| умножается поэлементно на вектор смещения в1 и формирует вход функции активации.
yi = radbas (II JWu - х II в} ) У2= purelin (LWu yi +$-)
Рис. 3. РБФ-сеть
На основе данного описания для РБФ-сети с n входами, m выходами и s гауссовскими нейронами из скрытого слоя соответствующий ей логический базис представим в следующем компактном виде:
j = exp - ( x - cj|2 / erf ) (i = 1 s), (10)
У = в^(х), (11)
где xє Жn - входной вектор; j = [j, j2,..., jp]тє Ж* - вектор, компонентами которого являются выходы гауссовских нейронов; IW1’^ %nxp - матрица весов входных связей и в1 -
пороги гауссовских нейронов, формирующие параметры гауссовской функции; ct є Жs -
2 11 11 центр и e - плотность; под || || подразумевается евклидова норма.
В силу своей дифференциальной природы данная РБФ-сеть может служить универсальным аппроксиматором для любой непрерывной функции на любом компактном множестве, а именно имеет место следующая теорема [8, 9].
Теорема. Для всякой непрерывной на компактном множестве C є Ж функции f (x) при любом є > 0 найдется вектор весов в = в* такой, что
maxi f (x) - N(x, в * )| < е, (12)
xєC ' '
где N(x, 0) - выход РБФ-сети с p числом гауссовских нейронов, значение которого может зависеть от є и самой функции f (x).
5. Схема адаптивного управления
Исходя из (12), будем считать, что после соответствующей настройки весов в є Ж* выходных связей функция f (x) может быть заменена статичной РБФ-сетью с непрерывным выходом N(x, в), где s - число гауссовских нейронов. То есть после успешного обучения РБФ-сети для всех x є C сЖ* равенство (8) может быть представлено в следующем виде:
Рж = n [,, , в :\+в: (,)т Фи (t)+{f (x,) - n [,, , в:]}, (13)
где в * = [в.*1, в *2,..., в * ] - s -мерный вектор, компонентами которого являются оптимальные веса выходных связей.
Полагая J](t) погрешностью моделирования, то есть
h(t) = f (у, ) - N[х,,в;\, (14)
ограниченную конечной постоянной J0 = sup f (xt) - N [у, в*], (13) представим в следую-
t>0
щем более компактном виде:
ptmo- = n[x, , в:\+в: (,)т Фи (,)+п(,). (15)
Далее, исходя из логического базиса РБФ-сетей, функцию N(,) запишем в виде
n [х,, в :\=в :т Ф, (,), (16)
где jx(t)є Жs - вектор, компонентами которого являются значения гауссовских функций активаций (10) нейронов из скрытого слоя.
При обучении РБФ-сети веса !^1,1еЖ”^р её входных связей и пороги 6] гауссовских нейронов, а, значит, и параметры гауссовской функции (9): с{ и <гг., выбираются заранее, то есть являются известными априори. В этом случае процесс обучения РБФ-сети ограничивается сравнительно быстрой локальной настройкой весовых коэффициентов выходных связей в * [10, 11].
Тогда, исходя из приведённых соображений, модель управления рыночным ценообразованием (15) можно записать в следующем виде:
Рж = в * (і )т фх (і)+в* (і )т фи (і) + п(і) = в * ф(і)+п(і),
(17)
где
в *т =
Ф(і)
в*т, в *т
Фи ( 0' Фх ( 0
(18)
(19)
Адаптивный закон управления и() для системы (17) можно получить из равенства
рто*=0( і)т ф( і)=е х ( і)т Фх ( і)+е и ( і)т Фи ( і),
(20)
где р+1 - желаемый выход, то есть желаемая цена товара на следующем дискретном шаге, а 6х(^) и 6и (^) являются приближениями для 6*( ^) и 6* ( ^) соответственно.
Таким образом, из (5.9) имеем
1
0
и(і) = X- Р™* - 0х(і)т Фх( 0 - 0и1и(і - 1) - 02и(і - 2) - ••• - 0ити(і - т)
. (21)
и 0
Рис. 4. Схема адаптивного управления динамикой цен
На рис. 4 представлена схема предлагаемого адаптивного управления процессом рыночного ценообразования.
6. Градиентный алгоритм адаптивной настройки параметров нейронного регулятора
Настройку параметров в (21) осуществим на основе градиентного алгоритма обучения, представленного в [12], а именно, на основе следующего рекуррентного равенства:
Ф(і )е(і)
0(і +1) = 0(і) + а(і)
с0 +Ф(і )т Ф(і)
(22)
где 1-ый параметр настраивается путём
0х(і +1), если 0х(і + ^п^0) >
01(і +1) =
0*
е:
где
и
0) 0и0^ если 01(і + 0) <
В (22) величина с запаздыванием а(і) определяется как
0, если |е(і )| < В(і),
ак (В(і), е(і)) / е(і), х,
е(і) = У(і) -0(і)т Ф(і)
(23)
а(і) =
(24)
(25)
к( g, е) =
е - g, если е > g,
0, если \е\ < g, е + g, если е < -g.
(26)
Используемая в (24) величина В(і), являясь неотрицательной, настраивается исходя
из
В(і +1) = В(і) + а(і )Ь
|е(і )|
С + Ф(і) Ф(і)
, В(0) = 0, ь> 0,
(27)
а константа а удовлетворяет неравенству
0 < а < тіп
^ с ^ —,1 V Ь J
(28)
7. Пример программной симуляции
Предположим, что динамическая модель рыночного ценообразования задана в виде следующего нелинейного разностного уравнения с двойным запаздыванием:
1,5 М-1
Рі+1
+ 0,35БІп(рі + рі-1) + 1,2м (і),
(29)
а эталонная модель в виде линейного регрессионного уравнения:
0
^шоё а /1 , а о . л
А+1 = 0,6 Рг + 0,2 Рм + 1
Полагая компактное множество С квадратом с длиной стороны 4 и геометрическим центром в начале двумерной декартовой системы координат, в качестве центров гауссовских функций активаций (9) нейронов из скрытого слоя РБФ-сети выберем соответствующие узловые точки сетки, покрывающие квадрат С с шагом
1 (рис. 5). Тогда, очевидно, что число скрытых гауссовских нейронов ^ будет равно 25, а ширина для каждого из них будет выбрана как а = 1.
Далее, на основе выбора параметров представленного выше градиентного алгоритма как с0 = 0,01,
е(га) = 0,0048, Ь = 0,01, была проведена программная симуляция поставленной задачи (рис. 6).
Рис. 6. Адаптивное управление динамическим процессом (29)
8. Результаты
По способу применения нейронных сетей различают два класса методов нейроуправления: прямые методы, основанные на непосредственном управлении объектом с помощью нейронной сети, и непрямые методы, когда нейронная сеть используется для выполнения вспомогательных функций управления, таких как фильтрация шума или идентификация динамического объекта. В нашем случае РБФ-сеть обучается идентифицировать процесс рыночного ценообразования.
Ключевой проблемой при решении задач управления динамическими процессами является реализация модели инверсной динамики управляемого объекта. Аналитическое решение этой задачи не всегда возможно, поскольку требуется обращение причинноследственных зависимостей поведения реального объекта. Применение нейронных сетей
и, в частности, РБФ-сети позволяет в сравнительно короткое время находить приближенные решения этой задачи путем обучения сети на примерах управления реальным объектом.
Опираясь на уже многолетний опыт применения нейросетевых моделей в управлении динамическими нелинейными системами, в работе предложена схема адаптивного управления процессом рыночного ценообразования в условиях динамично развивающихся уровней спроса и предложений. Адаптация полученных результатов к конкретным рыночным условиям требует наличия адекватной модели динамики цен с двойным и более запаздыванием.
с\ С2 СЗ сц С5
С6 С7 С8 С9 сю
си С12 С13 С14 С15
с 16 СП с 18 С19 С20
С21 С 22 С23 С24 С25
Рис. 5. Центры гауссовских функций активаций нейронов из скрытого слоя РБФ-сети
СПИСОК ЛИТЕРАТУРЫ
1. Widrow B. Pattern-recognizing control systems / B. Widrow, F.W. Smith // Proc. of Computer and Information Sciences. - Washington, USA, 19б4. - Vol. 12. - P. 288 - 317.
2. Venayagamoorthy G.K. Implementation of Adaptive Criticbased Neurocontrollers for Turbogenerators in a Multimachine Power System / G.K. Venayagamoorthy, R.G. Harley, D.C. Wunsch // IEEE Transactions on Neural Networks. - 2QQ3. - Vol. 14, Is. 5. - P. 1Q47 - 10б4.
3. Li Y. Neuro-controller design for nonlinear fighter aircraft maneuver using fully tuned RBF networks / Y. Li, N. Sundararajan, P. Saratchandran // Automatica. - 2001. - N 8, Vol. 37. - P. 1293 - 1301.
4. Арнольд В.И. Теория катастроф / Арнольд В.И. - М.; Наука, 1990.
5. Savit R. When random is no random; an introduction to chaos in market prices / R. Savit // J. of Future Markets. - 1988. - Vol. 8. - P. 271.
6. Лебедев В.В., Лебедев К.В. Математическое и компьютерное моделирование экономики. - М.; НВТ-Дизайн, 2QQ2. - 25б с.
7. Narendra K.S. Identification and control of dynamic systems using neural networks / K.S. Narendra, K. Parthasarathy // IEEE Trans. Neural Networks. - 1990. - Vol. 1. - P. 4 - 27.
8. Hartman E.J. Layered neural networks with Gaussian hidden units as universal approximations / E.J. Hartman, J.D. Keeler, J.M. Kowalski // Neural Computation. - 1990. - Vol. 2. - P. 210 - 215.
9. Park J. Universal approximation using radial-basis-function networks / J. Park, I.W. Sandberg // Neural Computation. - 1990. - Vol. 3. - P. 24б - 257.
1Q. Holcomb T. Local training of radial basis function networks; towards solving the hidden unit problem / T. Holcomb, M. Morari // Proc. American Control Conf. - 1991. - P. 2331 - 233б.
11. Moody J. Fast learning in networks of locally-tuned processing units / J. Moody, C.J. Darken // Neural Computation. - 1989. - Vol. 1. - P. 281 - 294.
12. Stable adaptive control of a class of nonlinear dynamic systems using RBF networks / G. Feng, N. Znang, C.K. Chak [et al.] // Intelligent Automation and Soft Computing. - 199б. - N 2, Vol. 2. - P. 15
- 2б.
Стаття надійшла до редакції 28.12.2012