ность отобрать h2 число вариантов, прошедших порог. Его величина отличается от величины порога первого этапа в связи с изменением числа степеней свободы. Если таких вариантов больше одного, то выдвигается гипотеза о наличии трех объектов и т.д. Процедура продолжается до тех пор, пока не будет оставлен один вариант объединения траекторий,
который и соответствует оценочному N числу траекторий.
Отметим, что на втором этапе процедура вычисления статистик существенно проще, поскольку содержит лишь операции сложения вычисленных ранее статистик первого этапа. Однако величина порога будет зависеть от количества объектов в выдвигаемой гипотезе.
Упростить рассмотренный метод можно путем стробирования отметок. При этом может быть несколько вариантов (по степени сложности) построения обработки.
Первый из них состоит в стробировании отметок [1] и использовании для проверки гипотез только отметок, попавших в стробы. Величина строба зависит от максимальной скорости объекта. Для оценки параметров траектории используются рекуррентные методы. Для оценки количества вариантов продолжения траектории будем считать, что в строб может попасть в среднем m отметок. Тогда оценка среднего числа вариантов продолжения траектории за M
кадров равна M (n) = mM , т.е. выигрыш в числе рассматриваемых вариантов в этом случае будет
nM
иметь порядок
V m У
где n - среднее число отметок
в кадре.
Следующий вариант упрощения состоит в том, что для продолжения траектории выбирается одна отметка в стробе, например, по критерию минимального отклонения от центра строба. В этом случае проблема проверки гипотез отпадает, однако при высокой пространственной плотности объектов такой алгоритм может оказаться не работоспособным.
Таким образом, выбор конкретного алгоритма обработки зависит от ожидаемой пространственной плотности объектов, их максимальной скорости, точности измерения параметров и интервала обработки. Самые сложные алгоритмы используют процедуры многоальтернативной проверки гипотез, а более простые — стробирования измерений.
Литература: 1. Кузьмин С.З. Основы теории цифровой обработки радиолокационной информации. М.: Сов. радио, 1974. 432 с. 2. Бакут П.А., Жулина Ю.В., Иванчук Н.А. Обнаружение движущихся объектов. М.: Сов. радио, 1980. 288 с.
Поступила в редколлегию 07.07.99 Рецензент: д-р техн. наук, проф. Макаренко Б.И.
Стрелкова Татьяна Александровна, научный сотрудник Военно-научного центра космических исследований при Харьковском военном университете. Научные интересы: биофизика, оптико-электронные системы медицинской диагностики. Адрес: Украина, 310043, Харьков, Площадь Свободы 6, тел. (0572) 40-28-85.
Писаренок Татьяна Георгиевна, аспирантка ГНПО “Метрология”. Научные интересы: статистическая обработка телевизионных сигналов. Адрес: Украина, 310002, Харьков, ул. Мироносицкая, 42, тел. (0572) 40-30-83.
Лытюга Александр Петрович, старший научный сотрудник Военно-научного центра космических исследований при Харьковском военном университете. Научные интересы: оптико-электронные средства, вычислительная техника. Адрес: Украина, 310043, Харьков, Площадь Свободы 6, тел. (0572) 40-28-85.
УДК 681.513.7
ИМИТАЦИОННАЯ НЕЙРОСЕТЕВАЯ МОДЕЛЬ ДУОПОЛИИ
БОДЯНСКИЙ Е.В., ЛЮБЧИКЛ.М., МАТУСОВСКИЙ Б.А, ПЛИСС И.И
Анализ несовершенной конкуренции двух экономических агентов на рынке товаров производится с помощью имитационной нейросетевой модели. Предлагается архитектура искусственной нейронной сети, работающей в ускоренном и реальном масштабах времени.
Одним из направлений экономико-математических исследований является теория дуополии [1,2], изучающая вопросы конкуренции на рынке двух экономических агентов. До появления методов имитационного моделирования [3] теория дуополии строилась на весьма сильных и зачастую нереалистичных предположениях, поскольку иначе возникали слишком сложные модели, не поддающиеся аналитическому исследованию и интерпретации. И только с появлением техники имитационного эксперимента отпала необходимость использовать грубые предпосылки, плохо согласующиеся с реальностью.
В настоящей работе рассматривается нетрадиционная задача дуополии (тем не менее имеющая практический смысл в условиях современных реалий), характеризующаяся различными предельными затратами конкурентов и ограниченностью их капитала.
Рассмотрим вначале классическую задачу дуополии, когда предполагается, что товар однороден, производится при одинаковых предельных издержках, капитал экономических агентов неограничен, при этом общий выпуск продукции равен
q = qi + q2. (1)
функция спроса линейна
p = a - b(q1 + q2), a > 0, b > 0, (2)
а кривые издержек имеют вид
S1 = cq1 + d, S2 = cq2 + d, c > 0, d > 0, (3)
где p — цена товара; c — предельные издержки; d — фиксированные издержки.
Первый экономической агент при этом будет получать прибыль
Ii =(a-b(qi + q2))qi - cqi - d (4)
РИ, 1999, № 3
75
которую он хочет максимизировать путем выбора q,. Условием максимума этой прибыли является
= (а - b(qx + q2 ))- bq,
dq,
-b^^і -c = 0,
dq,
(5)
dq2
где ———так называемая предположительная вари-
dq,
ация, описывающая влияние изменения выпуска первого агента на выпуск конкурента.
Анализ классической дуополии Курно [1,3] основан на предпосылке, что предположительные вариации равны нулю, т.е. что каждый из дуополистов считает, что изменения в его собственном выпуске продукции не повлияют на поведение конкурента. Тогда равновесие Курно (РК) можно определить парой уравнений:
di, dq, =° ^ = ° 951=° °. dq, М=0 °. dqi 41 Sq2 (6)
откуда a - 2bq, - bq2 - c = 0. a - bq, - 2bq2 - c = 0 (7)
и равенство a - c
qi = q2 = 3b (8)
представляет собой РК.
Тогда равновесные рыночные цены и общий выпуск продукции будут определяться по формулам
Р =
a + 2c
q =
2 a - c
(9)
3 ' 1 3 b ‘
Из (7) следует также выражение для отношений между выпусками конкурентов:
qi
a - c - bq2
2b
q2
a - c - bqi 2b
(10)
Классическая дуополия Курно описывает ситуацию, когда конкуренты находятся в равных условиях, т.е. несут одинаковые затраты.
Рассмотрим задачу дуополии, когда затраты конкурентов отличаются. Подобная ситуация возникает, например, при исследовании взаимодействия теневого и легального секторов экономики [4,5]. Поскольку затраты теневого сектора ниже (отсутствие налогового, таможенного и других форм контроля), он находится в более выгодном положении. Попытка анализа подобного взаимодействия была предпринята в [6], однако задача не была решена.
Пусть
S1 = ciqi + d1.S2 = c2q2 + d2 . ci ^ c2. d1 ^ d2
и
di, u
= a - b(i + q2
= a - b( + q2
dq,
дІ2
,^2
Из (12) следует, что
a - ci - bq 2 q, =—^.q2
a 2c, c2
qi =—^—.q2
3b
)-bqi- ci = 0.
)-bq2- c2 = °*
= a - c2 - bqi
2b .
_ a + ci - 2c2 = 3b .
(12)
(13)
(14)
Р
a + ci + c2 3
.q
2a - ci - c 2 3
(15)
Если затраты второго экономического агента
составляют долю затрат первого c2 = gci, 0 < g < i, то потери первого дуополиста в выпуске составляют
qi- q2 = qq < °. (16)
что провоцирует перетекание капитала из легального сектора в теневой. В этих условиях, следуя теории рыночного равновесия, теневой сектор просто “обязан” расшириться.
Одной из основных предпосылок теории дуополии является неограниченность капитала у производителей. На самом деле это далеко не так, и неучет этого обстоятельства может заметно исказить картину состояния дел.
Итак, на самом деле
51 = ciqi + di < Qi.
52 = c2q2 + d2 < Q2.
при этом естественно возникает задача нелинейного программирования:
maxIi =(a -b(q, + q2))q1 - c,q, - d,
qi
<пРи c,q, + di <Qi. maxI2 =(a -b( + q2))^2 - c2q2 - d2 (18)
ПРИ c2q2 + d2 < Q2 *
Сформулируем пару функций Лагранжа:
И, =-(a - b(q, + q2 )q, - c,q, - d,) +
+ Xi(і - di - Qi),
L2 =-(a-b(q, + q2)q2 -c2q2 -d2)+ (19) _ + X2 (c2q2 - d2 - Q2 )
(здесь X,. X 2 — неопределённые неотрицательные множители Лагранжа, удовлетворяющие условиям дополнительной нежесткости) и запишем систему уравнений Куна-Таккера:
76
РИ, 1999, № 3
cLj/dqj
6L1/dk1
dL2/dq2
dL2/dX 2
: -a + 2bql + bq2 +
+ (l + Xj )cj = 0,
Ciqi + dj - Qi < 0,
= -a + bq1+2bq2 +
+ (l + X2 )c2 = 0,
= c2q2 + d2 — Q2 < °-
(20)
Из (20)следует
qi
q2
a — 2(l + Xj )cj + (l + X 2 )c2 3b
a + (l + Xj )) — 2(1 + X 2 )c2
3b
(21)
при этом если первый дуополист “знает” выпуск второго, то собственный выпуск может быть найден с помощью процедуры
q (k)=a -(l+Xl(k - l))cl- bq2
ql (k )= 2b ,
Xl (k ) = [Xl (k-l)+
+y(k Xclql(k)+dl- Ql)]+
(22)
где k = l,2,...,M — итерации ускоренного машинного времени; y(k) — положительный параметр шага
поиска; [•]+ = max{°,^}.
Если же оба дуополиста работают в условиях неопределенности о намерениях друг друга, то их стратегии определяются соотношениями
q (k)= a-2(l + Xl(k-l))ci +(l + X2(k l))c2
3b
,(k ) =
a +(l + X! (k - l))c1 - 2(l + X 2 (k - l))c2 3b
Xl (k ) = [Xl (k -l)+
+Y(k IK^^lql(k)+dl- Ql)]+, X 2 (k ) = [X 2 (k-l)+
+ Y(k)(c2q2 (k)+ d2 - Q2 )]+ .
(23)
q
Отметим, что равенство настраиваемого множителя Лагранжа нулю означает, что у данного дуополиста имеется избыточный капитал, который с большей выгодой может быть использован для других целей, например, направлен в другую отрасль деятельности.
Введенные соотношения описывают оптимальные выпуски конкурентов в статике, в то время как экономика функционирует в динамике в реальном времени.
Используя уравнение для классического РК, полагая временной шаг равный одному периоду реального времени и переходя к динамике, несложно получить пару разностных уравнений
qt+l =a -c-bq2 qt+l =a-c-bql _
ql = 2b ’ q2 = 2b ' (24)
где t = 0,1,2,... — текущее реальное время.
Следуя уравнениям (24), каждый дуополист как бы “подгоняет” свой выпуск к выпуску конкурента до тех пор, пока не будет достигнута точка РК. На каждом шаге этого процесса динамической подгонки изменение выпуска одного экономического агента вызывает изменение выпуска другого.
Системе уравнений (13) в динамике соответствует пара разностных уравнений
t+l = a cl bq2 t+l = a c2
ql = 2b , q2 = 2b
а динамика для (18) имеет вид
qt+l =a -(l+Xl )cl- bq2
^ = 2b ,
_t+l = a -(l + Xt2 )c2 - bqt
Г = 2b .
bq1t
, (25)
(26)
Здесь, однако, возникает вопрос о соотношении между ускоренным (k) и реальным (t) временами, на котором следует остановиться подробней, для чего рассмотрим временной график приведенный на рис. 1.
М 1 2 3 .... М-1 М
oVWVWo >
t t+l
Рис. 1. Соотношение времен
Из рис. 1 следует, что между двумя соседними тактами реального времени t и t+1 происходит М итераций машинного времени, причем шаг квантования реального времени таков, что М — количество итераций машинного времени может быть достаточно велико.
В каждый момент реального времени t решается задача нелинейного программирования с помощью алгоритма (23), для чего отводится не более М итераций машинного времени для достижения сходимости. После этого полагается ql (m)= ql,
q2 (m) = ql2 , X1 (M) = Xl, X2 (M) = Xl2 и происходит переход к (26), где вычисляются новые значения
выпусков ql+l, q2+l. Далее опять запускается процедура настройки неопределенных множителей Лагранжа для обеспечения требуемых ограничений.
При более сложном анализе дуополии учитывается вероятная реакция конкурента, т.е. допускается ненулевая предположительная вариация. Такая ситуация возникает в дуополии Стэкельберга [1], когда один или оба экономических агента одновременно считают, что конкурент будет вести себя как дуополист Курно. Предположим, что первый дуополист считает, что его конкурент будет реагировать соответственно реакциям Курно:
q2 =
a - c - bql 2b
(27)
Тогда предположительная вариация будет равна
dq2/dql = -1/2 , поэтому, используя (5), получаем
РИ, 1999, № 3
77
= a -b(i + q2)-bqi + 2bq! - c = 0 (28) 2 a - c - bq2
и qi = 3------— (29)
Общие результаты будут зависеть от поведения второго дуополиста. Если он пользуется реакцией Курно, как полагает первый, то решением является равновесие Стэкельберга (PC) для первого дуополиста:
a - c a - c
qi =^т-, q2 =
(30)
2b 4b
Очевидно, что при такой стратегии первый агент получает большую прибыль, а второй меньшую, чем при РК. Предположим далее, что второй дуополист не пользуется реакцией Курно, а действует сам согласно реакции Стэкельберга, т.е. каждый конкурент неправильно предполагает, что другой использует допущение Курно. В результате получаем неравновесие Стэкельберга (НС):
2 a - c
qi = q2 =
(31)
5 b
при котором оба конкурента получают меньшую прибыль, чем при РК. Несложно также видеть, что
a + 4c 4 a - c
p = —• q = 5' “Г-
(32)
Переходя далее к ситуации, когда конкуренты несут разные затраты c1 и c2 , выпишем основные результаты, связанные с РК, НС, PC для первого дуополиста.
Равновесие Курно: a - ci - bq2
qi = qi =
2b
a - 2ci + c2
P =
3b
a + ci + c2
3
. q2 = q2 = q =
a - c2 - bqi
2b
a + ci - 2c2 3b ’ 2a - ci - c 2
3b
li =
І2 =
(a - 2ci + c2 )2
9b
_ (a + ci - 2c2 )2
i
9b
-d.
(33)
(34)
(35)
(36)
Неравновесие Стэкельберга:
qi
q2
2 a - ci -bq2 3' b
2 a -c2 - bqi
3 b
(37)
qi
q2
2 a - 3ci + 2c2 5 b
2 a + 2ci -3c2
5 b
(38)
P =
a + 2(ci + c2) _2 2a - ci - c2
q =
(39)
т = _2_ (a - 3ci + 2c2 )2 d
i 25 b iJ
т = 2_ (a + 2ci -3c2)2 -d
(40)
25 b
Равновесие Стэкельберга:
q 2 a-ci -bq2 q a-c2 -bqi
qi = і---b—• q2 =—b--------• (41)
qi =—^q2 =—i(42)
2b
a + 2c, + c 2
p=—4-^’ q=
4b
3a - 2ci - c2
4b
’ (43)
т =(a - 2ci + c2)2 d A1 o1 U15
T2 =
8b
_(a + 2ci - 3c2 )2
16b
" d2 *
(44)
Обобщая (33)-(44), записываем соотношения общего вида:
b
5
5
qi = ki
q2 = k2
a - ci- bq2 b ’
a - c2- bqi b
qi = ki
a + k1icl + k12c2
q2 = k2
b
a + k2ici + k 22 c 2
b
(45)
(46)
(47)
p = a-bq, q = q, + q2,
Ti =(P - ci )q, - di,T2 =(P - c2 )q2 - d2 ’(48) где значения коэффициентов выражений (45), (46) приведены в таблице.
k1 k2 ki k2 kii ki2 k21 k22
РК 1/2 1/2 1/3 1/3 -2 1 1 -2
НС 2/3 2/3 2/5 2/5 -3 2 2 -3
РС 2/3 1/2 1/2 1/4 -2 1 2 -3
Перейдем далее к рассмотрению РС при ограничениях на капитал конкурентов. Системе уравнений Куна-Таккера (20) в данном случае соответствует
78
РИ, 1999, № 3
откуда
cLj
dqi
cLj
~dk!
dL2
dqi
dL^
dk 2
-a + |h + bq2 +
+ (l + ki )ci = 0 cjqj + dj - Qj < 0,
-a + bqi + 2bq 2 +
+ (l + k 2 )c2 = 0 c2q2 + d2 — Q2 < 0
qi
q2
2 a -(l + k1 )c1 -bq2 3' b
a-(l + k2)c2 -bqi
при этом (22) процедура настройки
q (k) = 2 a -(i+ki(k - i))ci- bq2 4iW 3 b
ki (k )=[ki (k -1)+
+Y(k Xciqi(k)+di- Qi)]+•
(49)
(50)
(51)
Если же первый дуополист планирует свой выпуск по Стэкельбергу, а второй — по Курно, то вместо (23) запишем
qi(k)
q2(k)
a - 2(i + ki(k-i))ci +(i + k2 (k ~i))c2
2b
a + 2(i+ki((-i)ci -3(i + k2(k-l) 4b
2
“ki (k ) = [ki (k-i)+
+ Y(k)((k) + di - Qi)]+,
k2 (k) = [k2 (k -i) +
+ Y(k)(c2q2 (k)+ d2 - Q2 )]+ ,
(52)
а динамика PC может быть описана парой разностных уравнений:
qi1
q2+i
2 a -(i + k1 )ci - bq‘2 3' b
a-(i + k2)c2 -bqj
2b •
(53)
И, наконец, можно записать уравнения дуополии в статике и динамике общего вида. С учетом (45) -(48) получим
qi(k )=!T(a+kii (1+ki ( - OK +
b
+ k12 (J + k2 (k - i))(:2 ), q2(k )=^r(a + k2i (J+ki (k - OK +
b
+ k22 (l + k2 (k - OK ),
ki (k) = [ki (k - j)+ Y(k)x
x(ciqi(k) + di - Qi)]+, ki(M)= k1,
k 2 (k ) = [k 2 (k - i) + y(k)x
x(c2q2 (k) + d2 - Q2 )]+ , k2 (M)= k2
(54)
и
qi+i = ki
qt2+i = k;
a-(i + kj )c1 - bq2 b ,
a-(i+k2) 2- bq1
(55)
b
Соотношения (54), (55) описывают взаимодействие двух экономических агентов в условиях несовершенной конкуренции различного типа и положены в основу имитационной модели, синтезированной на основе аппарата исскуственных нейронных сетей [7,8]. В основу синтеза положены методика и обозначения элементов (понятные без дополнительных объяснений), предложенные в [9]. На рис. 2 приведена искусственная нейронная сеть ускоренного времени — ИНС(к), реализующая соотношения (54). ИНС(к) “вложена” в нейронную сеть реального времени ИНС(Ь) (рис.3), которая имитирует динамику (55).
На вход ИНС(к) извне поступает информация о затратах и имеющемся капитале, а из ИНС(Ь) передаются параметры функции спроса a и b . В процессе вычислений в ускоренном времени с помощью последних двух соотношений (54) проверяются ограничения на капитал дуополистов, и если капитал избыточен, на выходах, обозначаемых (!), появляется единичный сигнал. После М итераций ускоренного времени счетчик итераций подает разрешающий сигнал на ключи К, после чего на выходе ИНС(к)
появляются значения qi, ki, q2 , k2 .
ИНС(к) входит в состав ИНС(Ь), на вход которой извне поступают данные о затратах и сложившихся
к этому времени ценах pl, а из ИНС(к) — выпуски
и множители Лагранжа. На выходе сети реального времени появляются сигналы, соответствующие общему выпуску q1, прибылям конкурентов Ij , I^ и
будущим выпускам qj+1, и q2+1.
Алгоритм обучения, входящий в ИНС(Ь), предназначен для настройки параметров функции спроса и реализует процедуру Уидроу-Хоффа, принимающую в данном случае вид
РИ, 1999, № 3
79
-AQi(k)
Рис. 2. Искусственная нейронная сеть ускоренного времени
a' = a-i + Р'~ а'-1 - b'^'
1 +
b' = b-1 + Р' - a'-‘ -b'-1ql q'. (56)
1+(q' )2
Задаваясь различными значениями параметров
k1, k2, k1, k2, k11, k12, k21, k22, несложно проанализировать поведение конкурентов при различных типах дуополий.
Если же доступны реальные данные о состоянии рынка, с помощью того же алгоритма обучения Уидроу-Хоффа можно восстановить параметры дуо-
полии и “вычислить” истинные стратегии действующих экономических агентов.
Паралельная имитация нескольких ИНС(З), взаимодействующих через каналы Q1 , Q2 , AQ1 (k) ,
(!), AQ2 (k), (!), позволит исследовать процессы перетекания капитала из одного сегмента рынка в другие.
Литература. 1. Интрилигатор М. Математические методы оптимизации и экономическая теория. М.: Прогресс, 1975. 607с. 2. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. М.: Мир, 1988. 512с. 3. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем. М.: Мир, 1975. 500с. 4. Теневая экономика, проблемы борьбы с организованной преступностью и коррупцией в сфере экономики // Сборник материалов “круглого стола”. Луганск: РИО ЛИВД МВД
80
РИ, 1999, № 3
Рис. 3. Искусственная нейронная сеть реального времени
Украины, 1997. 257с. 5. Бодянський Є.В., Матусовський Б.А. Математичне моделювання тіньової економіки на основі теоретико-ігрового підходу // Використання досягнень науки і техніки у боротьбі зі злочинністю. Матеріали наук.-практ. конф. Харків: Право, 1988. С. 119122. 6. Волгин Л.Н. Принцип согласованного оптимума. М: Сов. радио, 1977. 144с. 7. Rojas R. Neural Networks. A Systematic Introduction. Berlin: Springer-Verlag, 1996. 502p.
8. Scherer A. Neuronale Netze. Grundlagen und Anwendungen. Braunschweig / Wiesbaden: Friedr. Vieweg & Sohn Verlagsgesellshaft mbH, 1997. 249S. 9. Cichocki A., Unbehauen R. Neural Networks for Optimization and Signal Processing. Stuttgard: Teubner, 1993. 526p.
Поступила в редколлегию 20.08.99 Рецензент: д-р техн. наук, проф. Куценко А.С.
Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры технической кибернетики ХТУРЭ. Научные интересы: теория адаптивных систем, искусственные нейронные сети, техническая диагностика. Увлечения: фелинология, восточные учения, японская поэзия. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 40-98-90.
Любчик Леонид Михайлович, д-р техн. наук, профессор кафедры системного анализа и управления ХГПУ, лауреат Государственной премии Украины, член IEEE. Научные интересы: теория адаптивных и обучающихся систем, робастное управление, обратные задачи динамики. Адрес: Украина, 310002, Харьков, ул. Фрунзе, 21.
E - mail: lyubchik@lotus. kpi.kharkov.ua
Матусовский Григорий Абрамович, д-р юрид. наук, профессор кафедры криминалистики Национальной юридической академии им. Ярослава Мудрого, зав. сектором НИИ изучения проблем преступности Академии правовых наук Украины. Научные интересы: межнаучные связи криминалистики, математико-криминалистические методы, экономическая криминалистика. Увлечения: символика, геральдика. Адрес: Украина, 310022, Харьков, а/я 4539.
Плисс Ирина Павловна, канд. техн. наук, старший научный сотрудник, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы обработки информации и управления. Увлечения: фелинология, приготовление экзотических блюд. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 40-98-90.
РИ, 1999, № 3
81