Научная статья на тему 'Субоптимальное управление многостадийными стохастическими системами'

Субоптимальное управление многостадийными стохастическими системами Текст научной статьи по специальности «Математика»

CC BY
87
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Удовенко Сергей Григорьевич, Кирияк Роман Дмитриевич

Предлагается подход к децентрализованному управлению многостадийными стохастическими объектами, предполагающий последовательное выполнение трех основных процедур. На первом этапе решается задача синтеза локальных управлений и текущей идентификации параметров подсистем. Второй этап состоит в коррекции локальных решений с учетом взаимодействия подсистем. На заключительном этапе формируется глобальная стратегия управления общей системой.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Удовенко Сергей Григорьевич, Кирияк Роман Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Suboptimal control of multistage stochastic systems

The problem of decentralized control of multistage dynamic processes is considered. The algorithm of digital controllers design that garantied suboptimality of system is proposed. The idea of method is based on real-time correction of local solutions.

Текст научной работы на тему «Субоптимальное управление многостадийными стохастическими системами»

Ы:

Ш

Ы:

Ш

(х2 - х\) + а2 = 0

- (У2 -Уі)+b > о (У2 - Уі) ^ 0

(У2 - Уі) - b1 = 0

- (Х2 - Хі) + аі > 0 (Х2 - Хі) + a2 > 0 (Х2 - Хі) - аі = 0

_ (y2 _уі) + Ьі - 0 (У2 -Уі) ^ 0

(y2 _Уі) + b2 = 0

- (Х2 - Хі) + аі > 0

(Х2 - Хі) + а2 > 0 .

(7)

б) gl = {s2,2,ті, рі}, g2 = (52,і,m2,Р2> •

Если условие аі > а2, Ьі > b2 выполнено, то поверхность Ф0 (рис .9) определяется совокупностью систем:

(Х2 - Хі) = 0

[/і]: • _(У2 _Уі) + Ьі _Ь2 ^ 0 (У2 -Уі) ^ 0 (У2 _Уі) _Ьі + Ь2 = 0 [/2]: (Х2 - Хі) + аі - а2 > 0

(Х2 - Хі) > 0 (Х2 - Хі) - аі + а 2 = 0 Ы--' _(У2 _Уі) + Ьі _Ь2 ^ 0 .(У2 -Уі) ^ 0 [(У2 -Уі) = 0

[/4]: (Х2 - Хі) + аі - а2 > 0

(Х2 - Хі) > 0

Таким образом, совокупности (1),(2), (3)-(6), (7),(8) описывают поверхности 0 -уровня пары множеств Ті,

(8)

Т2, граница которых обладает пространственной формой, либо окружность, либо окружность и прямоугольник, либо прямоугольник, соответственно.

Литература: 1. Стоян Ю. Г. Об одном обобщении функции плотного размещения. Докл. АН УССР. Сер. А. 1980. № 8. С. 70—74. 2. Стоян Ю.Г. Автоматизация объёмнопланировочного проектирования в машиностроении. Изв. АН УССР. 1979. № 3. С. 46-52. 3. Стоян Ю. Г., Яковлев С. В. Математические модели и оптимизационные методы геометрического проектирования. К.: Наук. думка, 1986. 267 с. 4. Романова Т.Е., Магдалина И.В. Особенности представления геометрической информации о ф -объекте пространства R // Радиоэлектроника и информатика, 1999. №1. С.68-71.

Поступила в редколлегию 21.02.2000

Рецензент: д-р физ.-мат. наук Руткас А.Г.

Романова Татьяна Евгеньевна, канд. физ.-мат. наук, старший научный сотрудник отдела математического моделирования и оптимального проектирования Института проблем машиностроения НАН Украины. Научные интересы: математическое моделирование. Адрес: Украина, 61046, Харьков, ул. Пожарского, 2/10, отдел № 52, тел. 95-95-36.

Магдалина Игорь Валерьевич, инженер отдела математического моделирования и оптимального проектирования Института проблем машиностроения НАН Украины. Научные интересы: математическое моделирование. Адрес: Украина, 61046, Харьков, ул. Пожарского, 2/ 10, отдел № 52, тел. 95-95-36.

УДК 681.513.7

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ МНОГОСТАДИЙНЫМИ СТОХАСТИЧЕСКИМИ СИСТЕМАМИ

УДОВЕНКО С.Г., КИРИЯКР.Д.___________

Предлагается подход к децентрализованному управлению многостадийными стохастическими объектами, предполагающий последовательное выполнение трех основных процедур. На первом этапе решается задача синтеза локальных управлений и текущей идентификации параметров подсистем. Второй этап состоит в коррекции локальных решений с учетом взаимодействия подсистем. На заключительном этапе формируется глобальная стратегия управления общей системой.

1. Введение

Для сложных технологических комплексов, основанных на последовательно-зависимой переработке сырья, характерны многостадийные технологические процессы. Отдельные стадии таких процессов характеризуются совокупностью переменных состояния, управления и выходных, причем переменные состояния входа последующих стадий определяются выходными переменными предыдущих стадий. При управлении многостадийными процессами применяется принцип децентрализации, предполагающий синтез взаимосвязанных многомерных локальных регуляторов. Очевидно, что при наличии дрейфа параметров отдельных стадий и высоком уровне помех общая схема управления должна содержать процедуры адаптации.

46

РИ, 2000, № 1

Рассмотрим один из возможных подходов к реализации децентрализованного управления при наличии случайных возмущающих воздействий. Определим для i-й подсистемы расширенный вектор входов upi = (wi,ui) , состоящий из локальных управлений u; и входных переменных взаимосвязи Wi. Таким же образом зададим и расширенный вектор выходов

т

y pi = (v;, y;) , содержащий выходы і -й подсистемы У;, не связанные с последующей стадией, и выходы

взаимосвязи v; . Локальный функционал дискретного управления каждой подсистемой в условиях воздействия помех можно представить в виде

N-1

I; = M{ £ F;(Aypi(k + 1), Aupi(k))} , (1)

k=0

где M{} — символ математического ожидания; N — горизонт управления; к=0,1,2, ...— дискретное время; Aypi (k +1) = y 0 pi (k +1) - y pi (k +1);

Aupi(k) = u0pi(k)-upi(k); y0pi = (v0;,y0;)T;

u0pi = (w0;,u0;)T; y0pi,u0pi,y0i,v0i,w0; - номинальные значения; Ayp;, Aup; — векторы отклонений

расширенных входов и выходов i-й подсистемы от номинальных значений.

Представляется целесообразным применение схемы формирования текущих управляющих воздействий, основанной на последовательной реализации следующих этапов:

— определение локальных управлений без учета взаимосвязей между подсистемами;

— коррекция решений в соответствии с ограничениями, определяемыми наличием взаимосвязей;

—определение параметров координации подсистем и формирование глобальной стратегии управления полной системой по некоторому аддитивному критерию.

2. Синтез локальных управлений

Определение локальных управляющих воздействий для каждой из подсистем по критерию вида (1) является достаточно тривиальной задачей, которая может быть решена одним из методов синтеза оптимальных или субоптимальных управлений стохасти -ческими многомерными объектами [1]. При этом локальные регуляторы должны быть дополнены рекуррентными процедурами переоценки параметров в реальном масштабе времени. В качестве таких процедур целесообразно выбрать алгоритмы байесовского параметрического оценивания, органично вписывающиеся в общую структуру многосвязных систем цифрового управления и позволяющие реализовать на практике эффективные схемы самонастраивающихся регуляторов [2].

Очевидно, что вектор up;, минимизирующий локальный функционал (1), не учитывает взаимодей-

ствий между подсистемами, поэтому в результате реализации первого этапа рассматриваемого метода возникнут отклонения между входными и соответствующими выходными векторами W; и V; .

3. Коррекция локальных решений с учетом взаимосвязей

Пусть выходы Vj подсистемы Sj соответствуют входам w; подсистемы S;. Рассмотрим модификацию связей этих подсистем, обеспечивающую когерентность соответствующих входов и выходов:

vkj = wk; = kij = Fjivj +(I - Fij)wi, (2)

где wki,Vkj — модифицированные векторы w; и Vj ; k;j — параметр согласования взаимодействий i-й и j-

й подсистем; Fj; — диагональная матрица, рассматриваемая на этапе определения глобальной управляющей стратегии; I — единичная матрица.

В пространстве состояний подсистема S; может быть описана следующим образом:

X; (k + 1) = A;X; (k) + Bp^; (k) + C;(k + 1) , (3)

ypi(k) = Cpixi(k),

здесь A;, Bp;, Cpi — матричные коэффициенты; X; — переменные состояния; e; — стохастическая составляющая, имеющая свойства белого шума.

Для постоянных значений y0p; и u0pi локальный функционал качества удобно представить в виде

N-1 т

Ii = 0,5M{ £ AyTpi(k + 1)Qpi Ay pi (k +1) +

T k=0 (4)

+ Auipi(k)Rp;Aupi(k)},

где Qp;,Rp; — штрафные матрицы.

В этом случае оптимальным будет следующее управление:

u*pi (k) = -L;X;(k) + Muu0pi - M2;y0pi .

Здесь

L; = P; (BTpiCTpiQp;Cp;A; + BTpiD; A; ) , (5)

Mu = P;BTp;(GT; -1)_1LT;Rpi + P;Rp;,

M2; = P;BTpi(GTi - I)_1CTpiQpi,

Gi = Ai - BpiLi,

Pi = (RpiBTpiCTpiQpiCpiBpi + BTp;D;Bp;) 1 .

РИ, 2000, № 1

47

Матричный коэффициент D; определяется решением соответствующего дискретного уравнения Рикка-ти [3]:

D; = A^iDjAj + ATiCTpiQpiCpiAj —

- (ATicTpiQpiCpiBpi + ATiDiBpi) * (6)

*Si(BTpicTpiQpiCpiAi + BTpiDiAi).

Коррекция связей между подсистемами Si и Sj с

учетом (2) приводит к изменению значений w0i для подсистемы Si. Коррекция взаимодействия Si и Sq вызывает необходимость соответствующего изменения номинального значения выхода v0i. Новые

значения w0i и v0i на k-м шаге для подсистемы Si определяются следующим образом:

Дщ(к) = Mjiwki -M2vki =Aui1 +Aui2, i—• (11)

На рис. 1 представлена общая схема рассмотренной процедуры децентрализованного управления.

xk

Рис.1. Схема координации локальных регуляторов

[wi(k),vi(k)]T =

Fp 0 - ' Sji(k) ' " 0 '

_ 0 Fiq _ /iq(k + 1)_ Aiq(k + 1)_

(7)

где Sji и Aiq — отклонения между vj и wi , vi и wk , определяемые по результатам 1-го этапа алгоритма.

4. Определение параметров координации

Эффективность управления i-й подсистемой в каждом такте процедуры первого уровня можно оценивать по значению функционала следующего вида:

I1i(k) = 0,5{(y0pi - ypi(k + 1))TQpi *

* (y0pi - ypi(k + D + (u0pi - upi(k))TRpi * (8)

* (u0pi - upi(k))}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Очевидно, что (8) соответствует текущему приращению общего функционала (5), не учитывающего связей между подсистемами. Аналогичным образом зададим функционал текущей оценки качества для процедуры второго уровня:

I2i(k) = 0,5{(y0pi - ykpi(k + 1))TQpi *

* (y0pi _ ykpi(k + P + (u% _ ukpi(k))TRpi * (9)

* (u°pi _ ukpi(k))}.

В этом случае в качестве критерия, позволяющего учесть эффективность процедур первого и второго уровней на всем горизонте управления, можно выбрать минимизацию суммы приращений функционалов (8) и (9), т.е.:

r N-1

ДІ = M{^X (I2i (k) - Iii (k))}-->min , (10)

i=1k=0 F

где r — количество подсистем.

Решение оптимизационной задачи (10) относительно параметров координации Fj позволяет скорректировать значения vki и wki в соответствии с (2) и определить приращения управляющих воздействий Дщ (k) для каждой из подсистем:

48

5. Результаты моделирования

Алгоритм моделировался для трехстадийного стохастического процесса вакуум—выпарки, техническое описание и уравнения состояния которого приведены в [4]. При этом предполагалось, что на каждую из подсистем действует аддитивная помеха, уровень которой не превышает 10% уровня полезного сигнала. На рис.2 и 3 приведены графики изменения основных управляемых параметров — плотностей пульпы на выходе каждой из подсистем (y1, y2, y3), а также изменения управляющих воздействий давления пара (u1, u2, u3) при коррекции уставок сис- Рис.2. Изменение управляемых

темы. параметров моделируемой

системы

0 10 20 30 40 50 K

Рис.3. Изменение управляющих параметров моделируемой системы

РИ, 2000, № 1

6. Выводы

Рассмотренный подход к управлению многостадийными процессами позволяет реализовать в реальном масштабе времени процедуру координации локальных цифровых регуляторов. В зависимости от размерности задачи, характера уравнений подсистем и наличия дополнительных ограничений структура матриц и трудоемкость алгоритма изменяются.

Полученные результаты с незначительными модификациями могут быть использованы при реализации схем адаптивного управления достаточно широким классом многосвязных детерминированных и стохастических систем.

Литература: 1. БодянскийЕ.В., Удовенко С.Г. Субоптимальное управление стохастическими процессами. X.: Основа, 1997. 140с. 2. Kulhavy R. Recursive bayesian estimation under memory limitation // Kybernetika. 1990. v 26, №1. P.1—

УДК 51: 330.115

О ВЫЧИСЛИТЕЛЬНОЙ СЛОЖНОСТИ СОСТАВЛЕНИЯ НЕПРЕРЫВНОГО РАСПИСАНИЯ ЗАДАЧИ ДЖОНСОНА

ПАНИШЕВА.В, СКРИПИШ И.В,ФАСТОВЕЦВ.И.

Приводится доказательство NP- полноты задачи трех станков при включении в условие задачи требования, запрещающего прерывание работы каждого станка.

При решении задач упорядочения работ в многопроцессорных системах основная про блема заключается в нахождении быстрых или эффективных алгоритмов оптимизации целевых функционалов.

Понятие эффективности алгоритма неразрывно связано с его “сложностью”. Под сложностью алгоритма понимают максимальное число элементарных операций, которые он должен выполнить при решении задачи размерности n в худшем случае.

Сложность можно задать функцией fa(n), которая входной последовательности длины n ставит в соответствие максимальное время, затрачиваемое алгоритмом на решение задачи.

Алгоритм называют полиномиальным, если f(n) растет быстрее, чем некоторый полином Pk(n) от переменной n фиксированной степени к, что обозначают f(n)=0(Pk(n)). Каждый полиномиальный алгоритм имеет свои коэффициенты Pk(n). Понятие временной сложности присуще только алгоритму и не зависит от реализующей программы.

Эффективным называют полиномиальный алгоритм. Мерой его эффективности служит время и память, необходимые для решения задачи. К классу Р-полиномиально разрешимых, относятся задачи, решаемые с помощью таких алгоритмов [1]. Большинство задач теории расписаний точно может быть решено только с помощью переборных алгоритмов. Такие задачи называют труднорешаемыми, так как объем вычислений экспоненциально растет с ростом размерности задачи.

РИ, 2000, № 1

16. 3. Kyo Б. Теория и проектирование цифровых систем управления. М.: Машиностроение, 1986. 448 с. 4. О.Г. Руденко, С.Г. Удовенко, Б.В. Шамша. Разработка системы идентификации химико—технологических комплексов // В сб. “Методы и средства автоматизации процессов проектирования”, К: ИК АН УССР, 1976. С.51-56.

Поступила в редколлегию16.12 99

Рецензент: д-р физ.-мат. наук, проф. Яковлев С.В.

Удовенко Сергей Григорьевич, канд. техн. наук, доцент кафедры ЭВМ ХТУРЭ. Научные интересы: теория адаптивных систем. Увлечения: иностранные языки, поэзия. Адрес: 310726, Украина, Харьков, пр. Ленина, 14, тел. 40-93-54.

Кирияк Роман Дмитриевич, инженер кафедры ЭВМ ХТУРЭ. Научные интересы: идентификация стохастических систем. Увлечения: компьютеры, Internet. Адрес: 310202, Украина, Харьков, пр. Л. Свободы, 35в, тел. 36-41-20.

Основным направлением в теории расписаний является поиск именно эффективных алгоритмов. Это объясняется прикладным характером задач, диктуемых современным производством и требующих получения ответа в жестком режиме “реального времени“.

Особое значение приобретает вопрос о том, является ли принципиально возможным получение полиномиально точного алгоритма решения задачи.

Использование теории сложности вычислений позволяет отличить полиномиально разрешимые задачи от переборных (трудноразрешимых). Основным в теории сложности является понятие NP-полноты.

Теория NP-полноты - важный инструмент для исследования моделей теории расписаний. Задача NP-полна, если ее невозможно решить никаким известным детерминированным алгоритмом за полиномиальное время [6]. Под детерминированным понимается такой алгоритм, в котором для любого состояния существует не более одного вполне определенного следующего состояния.

Задачи, которые можно решить за полиномиальное время с помощью недетерминированного алгоритма, образуют класс P. Он содержится в классе NP.

Предполагается, что если существует детерминированный полиномиальный алгоритм для какой-либо одной NP-полной задачи, то и все задачи этого класса будут полиномиально решены этим алгоритмом.

Для отдельных NP-полных задач, в условиях которых содержатся числовые параметры, удается построить псевдополиномиальный алгоритм. Под псевдополиномиальными понимаются алгоритмы, временная сложность которых оценивается значением О(р(пВ)), где р(иВ)-величина, которая не ограничена никаким полиномом от длины входа.

Однако существует целый ряд задач, решение которых не может быть получено даже псевдополиномиальным алгоритмом. Их называют NP-полными в сильном смысле.

К числу NP-полных относятся многие классические задачи исследования операций. Многие из задач

49

i Надоели баннеры? Вы всегда можете отключить рекламу.