6. Численные эксперименты
В качестве тестового примера рассмотрим следующие исходные данные: w=20; vW=0,08; v0=0,05;
m=6; n=7 ; R1=3; ; R2=4,1; R3=2,7; R4= 3,7; R5 =2,2
R6=1 ,8; R7=2; v0 = 0,09 Х1 ; v° = 0,1 ; ’ °2 ’ v0 = °3 0,05
V0 = 0,12 : ■ V0 = 0,01 • v0 = 0,02 ; v0 = 07 0,03
x4 ' °5 °6 ’
v0 = 0,03 : ■ v0 = 0,14 ; v0 = 0,06 ; v0 = 0,07
У1 ' У2 У3 ’ У4
V0 = 0,04 : • v0 = 0,05; v0 = 0,05 .
У5 ’ У6 ’ У7
Применяя к решению поставленной задачи изложенный выше метод, получаем следующий результат: точное решение задачи (20), (21) равно: l=10,8577. Для сравнения, точное решение для идеализированного случая равно: l0=10,503, а точные нижняя и верхняя оценки оптимального решения задачи (20), (21) равны соответственно: l-= 9,657, l+=11,1442. Справедливо неравенство l-< l0<l< l+, причем предложенный в работе алгоритм позволяет улучшить верхнюю оценку l+ на 0,0965.
Литература: 1. Стоян Ю.Г., Гиль Н.И. Методы и алгоритмы размещения плоских геометрических объектов. К.: Наук. думка, 1976. 248с. 2. Стоян Ю.Г., Яковлев С.В. Математические модели и оптимизационные методы геометрического проектирования. К.: Наук.думка, 1986. 286с. 3. Новожилова М.В. Решение задачи поиска глобального экстремума линейной функции цели на структуре линейных неравенств. Харьков, 1988. 48с. / (Препр./ АН УССР. Ин-т проблем машиностроения; №292).
4. Milencovic V., DanielsK, Li Zh. Placement and compaction of nonconvex polygons for clothing manufacture // Paper for forth Canadian conference on computational geometry. St. John’s, Newfoundland, Canada. 1992. P.10-18. 5. Dowsland K.A., Dowsland W.B. Solution approaches to irregular nesting problems // Europ. Journ. Oper. Res. 1995. 84. P.506-521. 6. Элементы теории геометрического проектирования / Под ред. В.Л.Рвачева. К.: Наук. думка, 1995. 244с. 7. Сысоева Ю.А. Математическая модель и метод решения задачи размещения правильных ориентированных многоугольников в полосе. Харьков, 1996. 19с. Рукопись представлена Ин-том проблем машиностроения НАН Украины. Деп. в ВИНИТИ 22 января 1996 г. №242В-96. 8. Стоян Ю.Г. Метрическое пространство центрированных интервалов // Докл. НАН Украины. 1995. №7. С.23-25. 9. Стоян Ю.Г. Интервальные отображения // Докл. НАН Украины. 1996. №10. С.57-63. 10. Стоян Ю.Г. Интервальное пространство l2 (R) . Интервальные уравнения. Харьков, 1996. 19с. (Препр./ НАН Украины. Ин-т проблем машиностроения; №392). 11. Стоян Ю.Г. Интервальные множества. Харьков, 1997. 27с. (Препр./ НАН Украины. Ин-т проблем машиностроения; № 400 ). 12. Moore R.E. Interval analysis. Prentice Hall, 1966. 400p. 13. Kaucher E. Interval analysis in the extended interval space IR // Comp.Suppl. 1980. P.33-49. 14. Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. М.: Мир, 1987. 356с. 15. Ахо А., Хопкфорт Дж, Ульман Дж. Построение и анализ вычислительных алгоритмов. М.: Мир, 1979. 536с.
Поступила в редколегию 20.06.98
Рецензент: д-р физ.-мат. наук, проф. Чудинович И.Ю.
Сысоева Юлия Анатольевна, ассистент кафедры естественных наук ХТУРЭ. Научные интересы: оптимизационные методы геометрического проектирования. Адрес: 310726, Украина, Харьков, пр.Ленина, 14, тел. 30-09-03.
УДК 519.21
ФОКУСИРУЮЩИЕ ФАКТОРЫ. БАЗИСЫ ФОКУСИРОВКИ И СТАБИЛИЗАЦИИ
ДИКАРЕВ В.А.
Введены понятия меры фокусировки, базиса фокусировки и базиса стабилизации. Приведены примеры их применения при рассмотрении реальных процессов, которые могут быть описаны системами уравнений Колмогорова.
Рассмотрим задачи, связанные с процессами фокусировки и стабилизации [1—4]. Фокусировка и стабилизация имеют место в системах,эволюция которых может быть описана с помощью марковских процессов с непрерывным временем и конечным числом состояний. Явления фокусировки и стабилизации состоят в том, что при определенных воздействиях на процесс его основные характеристики (вероятности состояний, переходные вероятности и др.) с изменением времени все менее отличаются от наперед заданых значений. Эти воздействия можно выбрать так, что промежуток времени, необходимый для фокусировки и стабилизации, можно сделать сколь угодно малым. В статье основное внимание уделено именно этому случаю. Общий случай, когда время, необходимое для фокусировки и стабилизации, произвольно, рассматривается аналогично.
В [1,2] показано, что фокусировка в точке t0 может иметь место, если элементы Ai j (t) инфинитезимальной матрицы Л(t) (все или их часть) при 11 to быстро возрастают. Возникающие при этом в точке to разрывы функций М j (t) должны быть неин-тегрируемы (случай точной фокусировки) или почти неинтегрируемы (случай s-фокусировки). Если кроме этого выполняются некоторые условия (см. [2,4]),
то при 1110:
а) для случая точной фокусировки
Pj (So,t) ^nj; (1)
б) для случая s-фокусировки
lim Pj (So, t) є (n,■ —а,п,- + a), ttt0 1 J J
lim Pj (So, t) є (n j -a, n-j+a). (2)
ttto
Здесь индексом j нумеруются состояния Kj >0,
'^Kj = 1, (1) и (2) должны выполнятся для всех
j
состояний; величина s в (2) является нижней гранью
по всем a , для которых условия (2) имеют место. Случай точной фокусировки связан с бесконечными энергозатратами и является некоторой идеализацией, позволяющей наиболее полно исследовать про-
50
РИ, 1998, № 2
цесс фокусировки. Далее, где это не оговорено, под точками фокусировки будем понимать точки s-фокусировки.
Быстрый рост (при 1110 ) элементов матрицы L обычно возникает из-за воздействия на процесс быстро изменяющихся факторов, локализованных на малых промежутках времени. Часто бывает, что такие факторы, многократно воздействуя на процесс в течение некоторого промежутка времени, всякий раз вызывают сильные возмущения элементов матрицы L, что приводит к многократному “тиражированию” точек фокусировки, подобных тем, которые
были описаны выше для точки to. На практике приходится иметь дело с такими факторами, которые, непрерывно воздействуя на процесс в промежутке времени [a,b]M[0,P), приводят к появлению на нем точек фокусировки, распределённых почти непрерывно. Такие факторы будем называть фокусирующими. В этом случае для любого [t’,t”)M[a,b] можно ввести меру фокусировки F[t’,t”). Положим
F[1',1'')=sup{Rj (1', 1'') - rj (x',x'')}
Rj (1', 1'') = supPj j (1', 1''), rj = inf Rj j (1', 1''), (3)
i j
нижняя грань в (3) берётся по всем значениям j. Величина F(t’,t”) фиксирует суммарный фокусирующий эффект, возникающий за счет всех точек фокусировки, ’’размазанных” на [t’,t”).
Если вклад любой точки фокусировки из [a,b] в суммарный фокусирующий эффект на этом отрезке мал, можно ввести понятие плотности распределения
точек фокусировки Pf (1). При этом следует использовать макроскопическое описание понятия плотности (см, например, [5]), когда пренебрегают “микроскопическими” значениями усредняемых величин. Если среди точек фокусировки, распределённых на [a,b], есть точки, вклад которых в суммарный фокусирующий эффект существенен, при описании плотности Pf (1) следует использовать d-функции. В случае, когда плотность фокусировки постоянна на [a,b], для любого [t’,t”) мера F[t’,t”) зависит лишь от длины [t’,t”) и на любом [t’,t”) фокусировка процесса производится на одно и то же распределение.
Рассмотрим множество P векторов P(P1 ,P2,...), вообще говоря, бесконечномерных, таких что
Pj> 0 (i = 1,2,...), 2 Pj = 1.
i
Любой такой вектор можно рассматривать как вектор распределения вероятностей. Пусть{Pn} (n=1,2,...) -
s -сеть в П. С любым элементом Pn этой сети свяжем марковский процес с инфинитезимальной матрицей Л n (1) (S 0 < 1 < 10 ) , для которого 10 является точкой
фокусировки на Pn . Отметим,что матрицу Л n (1), реализующую эту фокусировку, можно выбрать неоднозначно. Множество {Лn (1)} = Q(10) всех таких
матриц будем называть базисом фокусировки на 10. Рассмотрим векторную кривую
р( 1) = (р1 (1), р2 (1),...), 1 є [а, в], вообще говоря, бесконечномерную, такую что
Pk(t)>0 (k = 1,2,...), ^рк(t) = 1 на [а,р\ k .
Для любого t є [а, в\ вектор р(t) можно рассматривать как вектор распределения вероятностей. Используя подход, изложенный в [2,3], можно проверить, что существует процесс с соответствующим
образом подобранной на [а, в] плотностью точек фокусировки, для вероятностей всех состояний которого выполняются условия
|Pj(а, 1)-Pj(1) <с, 1 є[а + Дв], j = 1,2,... (4)
Это (S, с) -стабилизация.
Решение задачи о стабилизации можно стандартизировать, введя понятие базиса стабилизации. Его построение (с некоторыми изменениями) производится так же, как и построение базиса фокусировки.
При решении многих прикладных задач о фокусировке и стабилизации особый интерес представляют такие ситуации, когда: а) фокусировка производится на распределение
п = ^ь..^ п,...), (5)
в котором все компоненты, кроме одной, например, пі, мало отличаются от нуля, а п лишь незначительно отличается от единицы; б) аналогично, стабилизация производится на такую векторную кривую
р (1) = (Pi (1), P2 (1),...)
Pk(1) > 0 2Pk(1) = 1 1 є[а,в (6)
k
в которой все компоненты, кроме пі, малы, а п мало отличается от единицы. Дело в том, что марковские процессы, с которыми приходится встречаться на практике, описывают определённые технологические, физические, экологические и другие процессы. Их состояниями являются конкретные экологическая или экономическая ситуации, которые можно реализовывать, воздействуя на процесс определённым образом подобранными факторами. Если выход на конкретное состояние (режим) производить с помощью процесса фокусировки (или стабилизации), то в качестве предельного распределения вероятностей, на которые производится фокусировка, следует выбрать то, в котором вероятность, отвечающая предпочтительному режиму, мало отличается от единицы.
При решении конкретных задач о фокусировке и стабилизации на распределения вида (5), (6) часто приходится иметь дело с такими, воздействующими на процесс факторами, которые, в свою очередь, подвергаются детерминованным или случайным возмущениям. Эти возмущения обычно приводят к тому, что отлаженный с помощью специальным образом подобранных воздействий технологический режим изменяет свои рабочие характеристики, в результате чего фокусировка (или стабилизация) уже не будет удовлетворять условиям (5), (6). Описанная ситуация приводит к задачам о возмущениях элементов базиса фокусировки (стабилизации), о потере
РИ, 1998, № 2
51
базисности и о том, как при этом будут изменяться линейные комбинации базисных элементов, реализующие заданный рабочий режим. Эти задачи здесь не рассматриваются.
При рассмотрении конкретного технологического процесса решение задачи о его фокусировке (стабилизации) на заданное распределение удобнее проводить с помощью естественного базиса фокусировки, который тесно связан с исследуемым процессом. Определим этот базис. Пусть {Fa }™=1 - множество воздействующих на процесс факторов и8аЛ, (a=1,...,m) - инфинитезимальная матрица, составленная из возмущений элементов матрицы L процесса, возникающих под воздействием возмущения
фактора Fa . Рассмотрим множество {8а Л} m=1 и отображение
8?а ^$аЛ (a = . (7)
Допустим, что каждое возмущение 8 а Л реализует фокусировку исследуемого процесса на некоторое
распределение Ра и что Pi,...,Pm линейно независимы. Тогда {8а Л} m=1 будем называть естественным базисом фокусировки. Особый интерес представляет случай, когда отображение (7) линейное.
Рассмотрим пример использования естественного базиса. Пусть этот базис известен и известно распределение вероятностей состояний Р , соответствующее паспортному технологическому режиму Rp .
Допустим, что реально действующему режиму Rd соответствует наблюдаемое распределение вероятно-
которых приводится ниже. Переход к этим функциям позволяет использовать отдельные результаты из теории пространств Г.Г.Лоренца [6,7]. Из приводимых ниже определений видно, что для функций f+ (t,t0), f+(t,s0, t1,..., tn-i, t0) также будет выполняться условие (8). Используя подход, изложенный в [1,2,4], можно проверить, что мера фокусировки на [So, to) полностью определяется функцией f(t). В связи с этим подчеркнем, что при переходе от f(t)
к f+ (t), f+ (t,s0,t1,...,tn-i,t0), мера фокусировки
F [S0, t0) не изменяется.
Пусть f(t) — произвольная функция, измеримая и почти всюду конечная на временной оси. Если
существует такое N>0, что множество E = {t: | f(t)| > N} имеет конечную меру, то определим функцию f * (t) (0 < t < да) убывающую, непрерывную справа, равноизмеримую с f(t):
mes{t: f * (t) > n} = mes{t: |f(t)| > N} (9)
для любого N>0. Здесь символ mes означает меру Лебега. Если носитель функции f(t) имеет конечную
меру, равную а, то доопределим f * (t) при t>a, полагая f * (t) =0. При рассмотрении процессов фокусировки удобнее работать с функцией f* (t, t0). Она определяется как f * (t), но здесь роль нуля играет точка фокусировки t0, а ось t направлена влево: -да < t < t. При этом f+ (t) по-прежнему определяется формулой
стей Pd , отличающееся от паспортного P . Требуется
найти возмущения 8 F а факторов F,;^, которые
приводят к несовпадению режимов Rp и Rd . Если
отображение (7) линейное, то решение этой задачи сводится к рассмотрению систем линейных алгебраических уравнений. Решение данной задачи для случая, когда отображение (7) нелинейное, не может быть получено без дополнительной информации о его свойствах.
Пусть процесс фокусировки исследуется на [s0, t0). Пусть, далее, существует такое состояние j0 , для которого
'!f<l)dt = да , (8)
s0
где f(t) = inf| A, j0 (t)|, t e[s0,t0), Лі j0 (t) - элементы
j0 -го столбца инфинитезимальной матрицы. Условие (8) является необходимым для того, чтобы фокусировка в t0 имела место [2]. При решении ряда задач о фокусировке и стабилизации в ряде случаев удобно перейти от функции f(t) к функциям
f*(t), f+(t,t0), f+(t,s0,t1,...,tn-i,t0), определение
(9). Определим f+ (t,s0, t1,..., tn-i, t0). Рассмотрим произвольное разбиение Т интервала [s0, t0) точками деления ti,...,tn-i; s0 < ti <...< tn-i < t0 . Для каждого частичного отрезка [ tk_i, tk ] зададим f+ (t,s0, t1,..., tn-i, t0), положив
f+ (t0,t1,...,tn,t) = ff+(t,tk), t Є [tk-1,tk)
0, t g [tk-i,tk]
(10)
где f + (t,tk) определяется для t є [tk-i, tk) так же, как и f + (t,t0). Можно проверить, что на каждом частичном отрезке[tk-i,tk) мера фокусировки при переходе от f(t) к f+ (t,s0, ti,..., tn-i, t0) сохраняется. Если f(t) измерима и почти всюду конечна на [s0, t0), то при
max(tk -tk-i)^0, f+ (t,s0,ti,...,tn-i,t0) сходится к k
f(t) на [s0, t0). Если же f(t) непрерывна на [s0, t0), то эта сходимость будет равномерной. Использование функций
f*(t), f+(t,t0), f+ (t,s0,ti,...,tn-i,t0) позволяет более точно оценивать меру фокусировки исследуемого
52
РИ, 1998, № 2
процесса и дает возможность проследить за ее вариациями при воздействии на процесс факторов, быстро изменяющихся во времени.
Литература: 1. Дикарев В. А. Точки эргодичности и сходимость к финальным вероятностям. Харьков, 1994. 7с. Деп. в ГНТБ Украины 17.10.94, №2017-Ук 94. 2. Дикарев В. А. Точки фокусировки и теоремы о существовании предельных вероятностей. Харьков, 1995. 11 с. Деп. в ГНТБ Украины 28.02.95, №526-Ук 95. 3. Дикарев В. А. Точки фокусировки и стабилизация неоднородных марковских процессов. Харьков, 1995. 9 с. Деп. в ГНТБ Украины 28.02.95, №533 — Ук 95. 4.Веприк А. Е, Герасим С. Н, Дикарев В. А., Родзинский А. А. Методы и алгоритмы фокусировки распределений марковских процессов.
Харьков, 1997.158 с. 5. Ландау Л. Д, Лифшиц Е.М. Электродинамика сплошных сред. М.: Наука, 1977. 532 с. 6. G. G. Lorentz, Some new functional spaces, Ann. of Math., 51 (1950). P. 37-55. 7. Дикарев В.А. Теоремы вложения для одного класса функциональных пространств. Докл. АН, СССР. Т. 168, N6 (1966). С. 1239-1241.
Поступила в редколлегию 12.05.98 Рецензент: д-р физ.-мат. наук, проф. Руткас А.Г. Дикарев Вадим Анатольевич, д-р физ.-мат. наук, профессор кафедры прикладной математики ХТУРЭ. Научные интересы: случайный анализ и его приложения. Адрес: 310164, Украина, Харьков, пр. Ленина, 14, тел. 33-57-03,40-94-36 .
УДК 681.513.7
СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ СО СТРУКТУРНЫМИ И ПАРАМЕТРИЧЕСКИМИ ОГРАНИЧЕНИЯМИ
УДОВЕНКО С.Г.
Предложен алгоритм синтеза цифровых регуляторов, учитывающий структурные ограничения на матрицу обратной связи. Рассмотрена возможность субоптимального управления стохастическими объектами с дополнительными ограничениями на переменные состояния.
Введение
Методы оптимального управления линейными системами при квадратичном критерии качества и заданных переменных состояния зачастую основаны на решении дискретного уравнения Риккати. Однако на практике такой подход не всегда является эффективным в силу следующих причин:
— как правило, не все переменные состояния системы доступны наблюдению;
— оценка недостающей информации о состоянии системы с помощью наблюдателя Люенбергера или фильтра Калмана существенно усложненяет расчеты на каждом такте управления;
— синтез многосвязных регуляторов требует определения большого числа обратных связей, задающих структуру управления;
— при ограниченной априорной информации о параметрах объекта необходимо применять адаптивные методы оценивания, что, в сочетании с трудоемкой многошаговой процедурой поиска оптимальных управлений, приводит к значительным вычислительным трудностям;
— в ряде практических случаев возникает необходимость соблюдения различных ограничений на переменные состояния.
Эти обстоятельства существенно ограничивают возможность применения стандартных методов оптимального управления с квадратичным функционалом качества, определяя целесообразность синтеза субоптимальных цифровых регуляторов [1].
На практике возникает необходимость такого синтеза для детерминированных и стохастических систем при наличии различных структурных и параметрических ограничений.
1. Субоптимальное управление детерминированной системой
Рассмотрим многомерную дискретную систему, уравнения состояния которой представлены в виде
x(k+1)=Ax(k)+By(k); (1)
u(k)=-Gx(k)=-GCy(k), (2)
где для переменных состояния, управления и выхода принимаются условия
x(k)eRn, u(k)eRm, y(k)eRl, а матрицы A, B, C и G имеют соответствующие размерности.
Оптимальным будем считать управление u*(k), минимизирующее на бесконечном интервале квадратичный функционал
J=Z[xT(k)Qx(k)]+uT(k)Ru(k)], (3)
где Q — положительно полуопределенная матрица размерности (nxn); R—положительно полуопределенная матрица размерности (mxm). Преобразуем уравнение системы к виду
x(k+1)=(A-BG)x(k). (4)
Представим матрицу обратной связи G суммой подматриц G0 и G1, где G0 — подматрица, отдельные элементы g0ij которой содержат предписанные постоянные значения (остальные элементы являются нулевыми); G1 — подматрица, отдельные элементы g1ij которой рассчитываются в соответствии с алгоритмом оптимизации (остальные элементы являются нулевыми).
Множество индексов (i, j), соответствующих ненулевым элементам g1ij, обозначим символом Q. При этом
g1ij=gij, если (i,j)eQ; g1ij=0, если (ij)eQ; (5)
g0ij=0, если (i,j)eQ; g0ij=const, если (i,j)gQ. (6)
Введя обозначение
K(G)=ZxT(k)[Q+GTRG]x(k), представим функционал (3) в виде
J=0,5tr[K(G)X(0)XT(0)], (7)
так как для симметрических матриц
xT(k)Kx(k)=tr[kx(k)xT(k)].
Для оптимизации системы с известными параметрами вместо (7) целесообразно использовать функционал
РИ, 1998, № 2
53