УДК 517.977
ПРИНЦИП ПЕССИМИЗМА В ОЦЕНКЕ СТРАТЕГИИ НИЖНЕГО УРОВНЯ
ИЕРАРХИЧЕСКОЙ СИСТЕМЫ
© В.В. Мезго, А.Ф. Тараканов
Ключевые слова: иерархическая система; неопределенность; метод штрафных функций; принцип гарантированного результата.
Проведен анализ информационной дифференциальной модели иерархической системы в условиях неопределенности для случая, когда реакция подсистемы на решение Центра не единственна. Верхний уровень применяет принцип гарантированного результата (принцип пессимизма). Методом штрафных функционалов исходная максиминная задача сведена к задаче на максимум. Получены необходимые условия оптимальности.
Исследуемую модель задает набор
(Ы = {1, 2} , Е, [иг} , У, {Ъ (п1,п2,у)]г=1>2) , (1)
Е: Х(£) = /(«1 (£) ,П2 (£) ,у,х(г) ,г), х (£о) = Хо, г е [£о,$]. (2)
Критерии Центра и подсистемы определим как
Е1(«1,и2,у) = §1Х()+^1^1 (£) ,«2© ,у,х(г) ,1)йг, ^2(«1,«2,у) = ^,«2(£) ,у,$йг.
to
to
Каждый элемент иерархической системы оценивает выбранную им стратегию по разности между реализовавшимся и желаемым значениями его критерия, т. е. с помощью функции риска [1].
Пусть выбор подсистемы описывается многозначным отображением
R («i) = \ u2 G D2\ min J2 (u\,u2,y) = max min J2 (ui,z2,y)\ = 0 Vui G Di,
{ У& Z2^D2 y& )
и Центр максимизирует свой риск постратегии подсистемы u0(ui)=arg min minji(ui,u2,y).
u^ERui) yEY
Максимальный гарантированный результат будет обеспечен Центру при выборе стратегии:
u
1 Є Arg max min J1 (u1,U2 (u1), y) .
uiEDi yeY
(З)
Для существования оптимального управления u0 G Di достаточно непрерывности R (ui)
по Хаусдорфу и непрерывности min Ji (ui,u2,y) на произведении Di x D2 [2].
yeY
Использовав метод штрафов, получаем задачу
V (X,^,v,Y,n)= max V (ui,x,w,wi,w2,X, ^,v,Y,n),
Ui€Di,X,W,Wi 2
V (ui, x , wi, W2 , w, X, n, n, v, 7) = w - y j I min 0 , wi -vj (min [0 , Ji (ui, U2 , y)-wi] )2a (dy—
D2
Y
-VM (min[0,J2 (ui,U2,y) - W2]) 2 a (dy) - min / (min [0J (uu ,y) - W2]) 2 a (dy)) -
\J U2GD2 J /
Y Y
v
-n 11 ^ (t) - f (ui (t), U2 (t), y, x (t), t) II2 dt a (dy) - и
a (du2)
Y to
где (y, v, v, M,n) > 0 - штрафные параметры.
Теорема!.. Пуст,ь функции gl, g2, Ф1 удовлетворяют условию Липшица, по совокупности переменных. Для любых y, v, V, M, n > 0 имеет место равенство
lim V (M,v,v,Y,n)= max min min Jl(ul,u2,y)= w°.
M, v, v, y, П UieDl u2eR(«i) y&
Теорема2. Пуст,ь u° — оптимальное no риску управлен ие Центра, х0 — соответствующая траектория системы и w0 — гарантированная оценка риска Центра в задаче (1), (2), (3). Тогда, существуют неотрицательные ограниченные суммируемые функции Xi(u2) ,X2(u2,y) ,X3(u2,y) такие, что
Jxi(u2)a(du,2) = 1, J J Xi(u2) X2(u2,y) a(dy) a(du2) = 1,
D2 D2 Y
J J Xi(u2) X3 (u2,y) a(dy) a(du2)= J J Xi(u2) Xs(u2,y) a(dy) a(du2),
D2 Y D2 Y
а также не равные одновременно нулю число в ^ 0 и вектор-функция ограниченной вариации ф (u2,y, •) такие, что
1) вектор-функция ф (u2,y, ) на, [t0,$] при любом фиксированном y Е Y удовлетворяет уравнению
Ф (u2 ,y,t) = -фТ (u2,y,t) T-f(u°i,u2 ,y,xX ,t) - eX2 (u2,V) J^gi (u°,u2,y, X0 ,t)
д d дхf(ui,u2,y,xX,t) -eX2(u2,y) дхх
с условием трансверсальности
д
Ф (u2,y, &) = eX2 (u2, y) dX$i{ X0 (#)) ;
2) для любых ui Е Ui при почти всех t Е [t0,$] выполняется неравенство ( j Xi (u2)J |eX2 (u2,y) duui Ji {u°,u2,y) -
D2 Y i
( д д \
-в( X3(u2,y) д^ J2 (u0i,u2,y) - X3(u.2,y) дUl J2 (u° ,u,2,y)\ +
д д д^ J2 (u0,u2,y - X3(u.2,y) д^ J2 (u° "-
V T \ \
+J ^u— f (u0 (t), u2 (t), y, x0 (t) ,t)^j Ф (u,2, y, t) dt\a (dy) a (du2), u i (t) - u0 (t) \ ^ 0,
to
где u2 Е Arg min f (min [0, J2 (u0, u2, y) - u2] )2a (dy), и0 = max min J2 (u0, z2,y) . U2eD2 y Z2eD2 yeY
2
ЛИТЕРАТУРА
1. Мезго В.В., Тараканов А.Ф. Анализ информационной модели иерархической системы при неопределенности с однозначной реакцией нижнего уровня / / Системы управления и информационные технологии. 2010. № 4.1(42). С. 171-175.
2. Федоров В.В. Численные методы максимина. М.: Наука, 1979. 280 с.
Mezgo V.V., Tarakanov A.F. The pessimism principle in the estimation of strategies of the lower level of hierarchical system. An information differential model of the hierarchical system in conditions of uncertainty for the case where the answer of the lower level to the upper one’s decision is not unique is analysed. The lower level selects his answer within the unfavorably principle. Using the penalty technique, initial maxmin problem is reduced to the maximization one. The necessary optimality conditions are obtained.
Key words: hierarchical system; uncertainty; penalty technique; pessimism principle.
Мезго Виктор Владимирович, Борисоглебский государственный педагогический институт, г. Борисоглебск, Российская Федерация, аспирант кафедры прикладной математики и информатики, e-mail: [email protected].
Тараканов Андрей Федорович, Борисоглебский государственный педагогический институт, г. Борисоглебск, Российская Федерация, доктор физико-математических наук, профессор кафедры прикладной математики и информатики, e-mail: [email protected].
Ключевые слова: дельта-функции; многочлены Лежандра; формула Кристофеля-Дарбу.
В пространстве Уп С Ь2( —1,1), состоящем из многочленов степени < п, обобщенная функция 5(к)(х) есть скалярное произведение с некоторым многочленом. Мы находим явные выражения его и его нормы, находим асимптотику нормы.
Пусть Уп, п Е N = {0,1, 2,...}, - пространство многочленов над полем м степени ^ п. Его размерность равна п + 1. Введем в Уп скалярное произведение из Ь2(—1,1) :
Поступила в редакцию 10 апреля 2011 г.
УДК 517.98
ДЕЛЬТА-ФУНКЦИИ В ПРОСТРАНСТВЕ МНОГОЧЛЕНОВ
© В.Ф. Молчанов
Пусть к Е N. Рассмотрим в Vn линейный функционал 5(k') (к -я производная дельтафункции, сосредоточенной в нуле):