Научная статья на тему 'О некоторых проблемах оптимального управления в реальном времени линейными стационарными системами'

О некоторых проблемах оптимального управления в реальном времени линейными стационарными системами Текст научной статьи по специальности «Математика»

CC BY
91
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНЫЕ СТАЦИОНАРНЫЕ СИСТЕМЫ / РЕАЛЬНОЕ ВРЕМЯ / ПОЗИЦИОННОЕ УПРАВЛЕНИЕ / ДВОЙСТВЕННЫЙ МЕТОД ЛП / НАБЛЮДЕНИЕ / РЕКУРРЕНТНЫЕ СООТНОШЕНИЯ / РАСПАРАЛЛЕЛИВАНИЕ АЛГОРИТМОВ / LINEAR STATIONARY SYSTEMS / POSITIONAL CONTROL / DUAL METHODS OF LINEARPROGRAMMING / RECCURENT PROPERTIES / OBSERVATION / PARALLELIZING PROCEDURE

Аннотация научной статьи по математике, автор научной работы — Габасов Рафаил Федорович, Кириллова Фаина Михайловна

В классе дискретных управляющих воздействий исследуется задача оптимального управления в реальном времени линейным стационарным динамическим объектом. Описывается метод построения реализаций оптимальных обратных связей (позиционных решений), основанный на редукции последовательности оптимальных программ к задачам линейного программирования (ЛП). Используется двойственный метод с длинным шагом (для коррекции опор), распараллеливание вычислений, метод ускорения вычислений с помощью рекуррентных уравнений и метод «разновесов». Исследована задача наблюдения в реальном времени линейного стационарного динамического объекта с дискретным измерительным устройством при множественной неопределенности в начальном состоянии, сводящаяся к решению серии задач линейного программирования (ЛП). Для ускорения вычислений в этой задаче также используется двойственный метод ЛП, дополняемый процедурой коррекции.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some Aspects of Real-time Control of Linear Stationary Dynamic Systems

The paper deals with the optimal positional control actions for linear discrete dynamic stationary objects. Methods of the real-time constructing of the implementations of optimal feedbacks are described based on reduction of the sequence of optimal programs to linear programming problems (LP).To solve the problem the duel method of LP with a long steps is used to correct supports, the parallelizing and acceleration of computations with the recurrent equation and methods of ¡¡set of weight¿¿ are applied. A real-time observation problem at uncertainty in initial states is considered to the linear dynamic object with discrete measurement devices which is reduced to the series of LP problems. Both of the problems are solved by the dual method of LP. To accelerate the computations of control actions it is suggested to use the parallelizing procedure.

Текст научной работы на тему «О некоторых проблемах оптимального управления в реальном времени линейными стационарными системами»

Онлайн-доступ к журналу: http: / / mathizv.isu.ru

Серия «Математика»

2019. Т. 27. С. 15-27

УДК 518.517 MSC 93С05, 93В52

DOI https://doi.org/10.26516/1997-7670.2019.27.15

О некоторых проблемах оптимального управления в реальном времени линейными стационарными системами *

Р. Габасов

Белорусский государственный университет, Минск, Республика Беларусь

Ф. М. Кириллова

Институт математики HAH Беларуси, Минск, Республика Беларусь

Аннотация. В классе дискретных управляющих воздействий исследуется задача оптимального управления в реальном времени линейным стационарным динамическим объектом. Описывается метод построения реализаций оптимальных обратных связей (позиционных решений), основанный на редукции последовательности оптимальных программ к задачам линейного программирования (ЛП). Используется двойственный метод с длинным шагом (для коррекции опор), распараллеливание вычислений, метод ускорения вычислений с помощью рекуррентных уравнений и метод «разновесов». Исследована задача наблюдения в реальном времени линейного стационарного динамического объекта с дискретным измерительным устройством при множественной неопределенности в начальном состоянии, сводящаяся к решению серии задач линейного программирования (ЛП). Для ускорения вычислений в этой задаче также используется двойственный метод ЛП, дополняемый процедурой коррекции.

Ключевые слова: линейные стационарные системы, реальное время, позиционное управление, двойственный метод ЛП, наблюдение, рекуррентные соотношения, распараллеливание алгоритмов.

* Работа выполнена при финансовой поддержке ГПНИ (Конвергенция: задание 1.3.01.2016-2020).

1. Введение

Создание и бурное развитие цифровой вычислительной техники существенным образом увеличило возможности синтеза оптимальных систем управления и привело к открытию нового принципа управления — управления в реальном времени. Этот принцип не требует предварительного построения обратной связи в аналитической или табулированной формах, а необходимые для управления текущие значения связей в цифровых системах вычисляются по ходу каждого конкретного процесса управления в реальном времени. Его использование понижает требования к оперативной памяти ЭВМ. Этот подход особенно актуален при синтезе оптимальных систем, где оптимальные связи чрезвычайно сложны и трудно реализуемы известными методами. Ниже описываются принципиальные методы оптимального управления и наблюдения в реальном времени стационарными динамическими объектами. Методы существенно повышает эффективность оптимального регулятора, предложенного в [1; 2] для линейных нестационарных динамических объектов.

2. Постановка задачи позиционного управления в реальном времени линейными стационарными объектами

Пусть Т = [0, ¿*] — промежуток времени; к = АГ(АГ > 1) —

натуральное число; Т^ = {0, /г,..., ¿* — К} — дискретный промежуток времени; Т(т) = [т,**]; Тн(т) = Т{т) С\Тн,х = ж(£) ей" - состояние модели объекта управления в момент времени и = и(Ь) € К, — значение управляющего воздействия, II = {и € К : \и\ < Ь}, 0 < Ь < оо] А е Кпхп,Ан = ещ>(АК)]Ъ, с е Кп,д*,д* е Кп,Н е Ктхп,1 = {1,2 = {1,2,..., п}, X* = {х € Кп : д* < Нх < д*},,1 =

{1,2,... ,п}, Жд € Кп — известное начальное состояние объекта управления, Х0 = {х £ Кп : й* < х < (I*}.

В классе дискретных управляющих воздействий1 рассмотрим линейную задачу оптимального управления:

с'х(Ь*) шах; ж = Ах + Ъи, ж(0) = ж£, х{?) € Х*;и(г) € II, £ € Т. (2.1)

Определение 1. Воздействие и(Ь) € [/, £ € Т, — программа, если х(и) € X*.

Определение 2. Программа € Т называется оптимальной

(программным решением задачи (2.1)), если на соответствующей ей (оптимальной) траектории х€ Т выполняется равенство:

1 Функция £ Т называется дискретной (с периодом квантования К), если

= [т,т + к[,т € Тн.

) = тахс'ж(£*), ж(£*) € X*.

и

Будем считать, что в процессе управления будут точно известны значения текущих состояний ж*(т), т € Т^, динамического объекта. Рассмотрим семейство задач

с'ж(£*) —> тах; ж = Ах + Ьи, ж(т) = г, (2.2)

ж(Г) €[/,^Т(г),Г = {х£Пп <Нх<д*},

зависящее от позиции (г € Т^, г € Кп).

Пусть и°Щт, г), £ € Т(т), — оптимальная программа задачи (2.2) для позиции (т, г)] Хт — множество состояний г, для которых эта задача имеет решение.

Определение 3. Функция

и°(т,г) =и°(т\т,г),г е Хт,т £ТН, (2.3)

— позиционное решение (оптимальная дискретная обратная связь по состоянию) задачи (2.2), а ее построение — синтез оптимальной системы управления.

При известном позиционном решении (2.3) управление динамическим объектом осуществляется следующим образом.

До начала процесса управления находится значение и*(0) = и°(0, Жц). Процесс управления начинается в момент £ = 0 с подачи на вход динамического объекта управляющего воздействия «*(£) = и°(0, Жд),£ > 0. В момент £ = к поступает информация о текущем состоянии объекта ж*(/г). Находится значение -и0(Л,, ж*(Л,)). Предыдущее управляющее воздействие заменяется на «*(£) = и0(к, ж*(/г)), £ > к + з(к), где «(/г) — время поиска значения и0 (к, ж*(/г)). При продолжении процесса получается последовательность значений управляющего воздействия

и*(0),и*(к),... ,«*(** -/г), (2.4)

время поиска которых равно: 8(0) = 0, в (к),..., «(£* — Л,).

Если «(г) < к, £ € Т/г, то будем говорить, что оптимальное управление объектом осуществляется в режиме реального времени. Устройство, формирующее последовательность (2.4), назовем оптимальным регулятором.

В динамическом программировании алгоритм работы оптимального регулятора основан на формульном или табличном представлениях оптимальных обратных связей, которые строятся до начала процесса управления. Используя последовательность (2.4), сформируем процесс управления с помощью оптимальных программ задачи (2.2):

«*(*) =и°Щ0,х*о),1 = и°(Цк,х*(к)),1 еТ(к)]..., (2.5)

Р. ГАБАСОВ, Ф. М. КИРИЛЛОВА

u*(t) = u°(t\t* — h, x(t* — h)),t € T(t* — h).

3. Редукция проблемы к задаче линейного программирования

3.1. В классе дискретных управляющих воздействий для фиксированной позиции (г, ж*(г)) задача (2.2) эквивалентна задаче линейного программирования:

с' Y^ Рь(в)Ъи(в) ->■ max, e&h(r)

g* < HF(t* - т)ж*(т) + H Fh(d)bu(d)<g*, (3.1)

в&Ыт)

\u(e)\<L,eeTh.

Здесь

гв+h

Fh(9) = / F(t* - s)ds, в € Th(r), (3.2)

Je

(F(t),t € T, — фундаментальная матрица решений однородной части уравнения (2.1): F = AF,F(0) = Е).

При использовании принципа оптимального управления в реальном времени нужно, чтобы для каждой позиции (г, ж*(г)) время вычисления оптимальной программы и°Щт,х*(т)),т € Т(т), не превосходило h. Если память ЭВМ позволяет хранить все параметры задачи (3.1), то для оптимального управления объектом достаточно использовать двойственный метод линейного программирования [1—3]. В этом случае в процессе управления можно обойтись без решения дифференциальных уравнений, с чем связаны основные затраты времени [6]. Другой крайний случай состоит в том, что значения функции € T/j(r), не вычисляются и не запоминаются, а необходимые их значения генерируются по ходу процесса управления.

Формирование последовательности (2.4) эквивалентно построению оптимальных программ(2.5): первая программа w°(i|0, Жд), t € Т, строится до начала процесса управления без ограничения на время построения, последующие программы являются коррекциями этой программы по мере поступления информация о поведении объекта.

3.2 Вспомогательные конструкции. В линейном программировании эффективным методом коррекции решений является двойственный метод [1]. Приведем некоторые понятия и факты этого метода решения задачи (3.1) в позиции (т,ж*(т)).

Пара Кои(т) = {/оп С /,Топ(г) С ТЦт) = Тн П Т(т)} - опора задачи (3.1) в позиции (т,ж*(т)), если detDou(T) ф 0,Don(r) = D(Iou(t), Топ(т)),

D(I,Th) = H(Fh(e)b,e € Th(r)). Множество Коа(т) = {/оп = 0,ТОП = 0} - (пустая) опора по определению. Опору сопровождают:

1) вектор (опорный) Лагранжа и(т) = (щ(т),г € I) = (г/оп(г), г/н(г)); щ{т) = 0, г € /н(т) = /\/оп(т); ^п(г) = ^(г)^"1^), соп(г) = №(0)6, 0бТоп(т));

2) копрограмма | г) = (с' - v{T)H){Fh{e)b, в € Тл(т)); 5(0|т) = О, если 0 € Топ(г); 3) псевдопрограмма ш(в\т),в € ТЦт), выходной псевдосигнал С(т) = (Соп(т),С(т)) : w(0|r) = € Th(t);(¿(t) = g*i, если щ{т) < 0;(¿(r) = д*, если v¿(r)>0,¿G 1оп(т);шоп(т),

Won(r) = Я"1 (г)[Con(г) - Я(/оп(г), J)]T(f - т)ж*(т) - роп(т) С„(г) = Я (/„(т), J)T(f - т)ж*(т) - Аж(тКп(т) - рн(г) р(т) = Я Fh(e)bu(e\T),T<=Th.

в&Тн(т)

Опора Кои(т) называется регулярной, если

щ(т) Ф 0, г € Im{ry,5h(e\т) / 0, 0 € Тн(т) = Тн(т) \ Топ(г).

Пусть задача (3.1) двойственно невырождена (опоры регулярны). Тогда опору сопровождают единственные псевдопрограмма и выходной псевдосигнал.

Опора К®ш(т) называется оптимальной, если ее мера неоптимальности равна нулю [1]. Для оптимальности опоры К®и{т) необходимо и достаточно, чтобы сопровождающие ее псевдопрограмма ш°{в\т),в € T/j(r), и выходной псевдосигнал ((т) удовлетворяли соотношениям:

|"°(0|т)| < Ь,в € Т°п(г);g*i < ?(т) < <7?, г € /„(г).

Псевдопрограмма w°(0|r),0 € ТЦт), сопровождающая оптимальную опору К®п(т), является оптимальной программой задачи (3.1) в позиции (г, ж*(г)) :и°(в\т,х*(т)) =Ш°(в\т,х%т)),веЫт).

Двойственный метод решения задачи (3.1) является итеративным методом преобразования опор с уменьшением на итерациях меры неоптимальности. Этот метод за конечное число итераций или строит оптимальную опору, или обнаруживает несовместимость ограничений задачи. Детали метода приведены в [1].

4. Рекуррентные уравнения для задачи 3.1

При использовании двойственного метода решения задачи (3.1) на каждой итерации дважды используется функция (3.2): один раз для проверки на оптимальность текущей опоры, второй раз — при переходе

к новой опоре. В случае, когда функция (3.2) табулируется заранее, в процессе управления не требуется времени на её построение. При учёте динамической природы задачи (3.1), функцию можно не табулировать, а генерировать в процессе управления. В этом случае уменьшаются требования к объёму оперативной памяти, но увеличиваются временные затраты по осуществлению итераций, поскольку приходится интегрировать дифференциальные уравнения. В [2] предложен метод, который позволяет распараллеливать процесс вычисления значений функции Рь(0), 0 € Т/^ и тем самым сократить (за счёт некоторого увеличения памяти) время для осуществления итерации. При этом в процессе управления достаточно интегрировать дифференциальные уравнения на малых участках.

4.1. Можно показать, что для стационарных объектов справедливо

Утверждение 1. Функция (3.2) удовлетворяет рекуррентным уравнениям: прямому

ад + л) = л_/1ад),.р/1(о)= / ехРА(Г-з)с18, веЩг), (4.1)

■)о

и обратному

Рн{в-к) = -Ь) = / ехр А(/!-#,0еВД. (4.2)

В силу (4.1) и (4.2) значения Рь(9), в € Т^, можно найти с помощью прямого или обратного уравнений. В этом случаев в процессе управления отпадает необходимость интегрирования дифференциальных уравнений.

4.2. Для ускорения вычисления значений функции (3.2) распараллелим процедуру вычисления этих значений.

До начала процесса управления выберем моменты:

вд(=Тн, д&Я = {1,2,...,д*}: (4.3)

0 = во < 0г < в2 < ... < вд* = е - к.

Пользуясь прямым уравнением (4.1), вычислим и запомним значения € Я ■ Моменты (4.3) разбивают множество Т^на участки:

{0, к,..., вг - К}, {въ вг + к,..., в2 - К},... (4.4)

{вд*-1,вд*-1 + Н, ■ ■ ■ , вд*-\,вд*}.

Вычисление значений функции (3.2) в процессе управления проводим параллельно на всех участках (4.4), используя прямое уравнение (4.1) с начальными условиями Рь(0д) = Р^вд), д € <5-

Ускоренное вычисление функции (3.2) можно проводить и с помощью обратного уравнения (4.2) с соответствующими начальными условиями. Возможно совместное использование прямого и обратного уравнений.

4.3. В случае стационарности динамического объекта вычисление функции (3.2) можно осуществить с помощью «разновесов».

положим А\ = 0\ ~ в0, = — в\, . . . , Ад* = Од* — Од*-

Пусть Ад, д € <5, — такой набор чисел, что для каждого 0 € Т^ найдётся поднабор С}(0) С Я, при котором 0 = Ад* Из уравнения (4.1) следует:

<7€<Э(0)

Элементы Т/г(Дд), д С Я, назовём «разновесами», а (4.5) — разложением Т/г(0), 0 € Т^, по «разновесам».

Метод «разновесов» для вычисления функции Т/г(0), 0 € Т/г,состоит в следующем. До начала процесса управления выбираем множество <5-Для каждого 0 € Т^ строим подмножество <5(0) € ф.

Вычисляем и запоминаем значения Т/г(Ад), д € Я(0). В процессе управления значения функции (3.2) вычисляем по формуле (4.5).

В основу метода можно положить и обратное уравнение (4.2), а также использовать эти методы в сочетании друг с другом. Метод «разновесов» можно применять вместе с методом распараллеливания вычислений.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Наблюдение в реальном времени стационарного объекта

Наблюдение динамического объекта — неотъемлемая часть процесса управления им в условиях неопределённости. Ниже на базе одной модели с множественной неопределённостью излагается метод наблюдения в реальном времени линейного стационарного динамического объекта. Он существенно улучшает результаты, полученные для нестационарного объекта [4; 5].

Рассмотрим динамический объект, поведение которого на отрезке Т описывается уравнением

ж = Ах,Х0 = {ж € Кп : сЦ < ж < <Г}, 3 = {1,2,...,п}. (5.1)

где ж = ж(£) € Кп — состояние объекта наблюдения в момент времени

Пусть начальное состояние ж(0) = Жо не задано, но известно, что оно принадлежит компакту Хо. Множество Хо назовём априорным 'распределением начального состояния жо- Оно характеризует начальную

неопределенность модели (5.1). Чтобы уменьшить эту неопределенность будем вести наблюдение за поведением объекта с помощью дискретного измерительного устройства

У{в) = Г с'х^з+т, е* < т <е,о& п, (5.2)

■)в-Н

где — ошибка измерения в момент 9.

Предположим, что наблюдение проведено на отрезке ТТ и записаны сигналы у*(Т= (у*(в), в € Пару (т,у*(Т£)) назовём позицией процесса наблюдения в момент т. Пара (т,у*(-)) — позиция системы наблюдения в момент т.

Определение 4. Множество Х$(т, у*(Т^)) — текущее распределение начального состояния объекта (5.1) в позиции (т,у*(Т£)), если оно состоит из тех и только тех Хо € Хо, которые способны вместе с возможными ошибками измерений ^(Т^) породить записанный сигнал

учч).

Текущей задачей наблюдения назовём задачу вычисления оценки множестваХо (г, у* (Т£)):

Ф,У\Ч)) = шахр'х, х € Х0(т, у*^)), (5.3)

где р - заданное направление.

Пусть У(т) — множество всех сигналов у (в), 9 € Т^, которые могут быть записаны устройством (5.2) к моменту т.

Определение 5. Функция

а{т,у{Ттн)), У(Ч) € ¥{т),т € ТН, (5.4)

называется позиционным решением задачи наблюдения (экстремально-размыкаемой обратной связью).

Построение функции (5.4) в формульном или табличном виде называется синтезом системы наблюдения (5.1),(5.2).

Предположим, что позиционное решение (5.4) построено. Тогда наблюдение объекта (5.1) осуществляется следующим образом. До начала процесса наблюдения в качестве оценки неопределённости модели (5.1) используем оценку априорного распределения: ск(0) = тахр'х, х € Хо.

Наблюдение начинается в момент £ = 0 с записывания наблюдаемого выходного сигнала с'ж(£), £ > 0,объекта (5.1). В момент т = ¡1 получаем первый сигнал у*(К) измерительного устройства (5.2). Пусть в(К) — время поиска значения а(к,у*(К)). Эта информация в момент Ъ + «(/г) подаётся в управляющий орган. При продолжении процесса получаются последовательности у*(т), а(т,у*(Т£)), в(т), т € Т^.

Если s(t) < h, т € T/j, то последовательность а(т, у*(Т£)), т € T/j, назовём реализацией позиционного решения в реальном времени в конкретном процессе наблюдения. Устройство, способное формировать реализации позиционных решений, — эстиматор системы наблюдения.

Таким образом, проблема позиционного наблюдения сводится к построению алгоритма работы эстиматора. Описанный выше способ наблюдения, основанный на формуле (5.3), трудно реализуем из-за «проклятия размерности».

Ниже предлагается алгоритм работы цифрового эстиматора, в котором формульное или табличное представления позиционного решения не используются, а его реализации вычисляются в реальном времени по ходу каждого процесса наблюдения. Алгоритм базируется на двойственном методе линейного программирования. Приведём необходимые понятия и факты.

3. Задача (5.3) эквивалентна задаче линейного программирования

р'х ->■ шах, < -с'Фк(в)х < С(д), в € T¿; d* < ж < d*. (5.5)

Здесь ш = £* - уЧО); С(0) = е- У*{0), F(t) € Rnxn, t е T]F = AF, F(0) = Е-

Ы0) = Í F(s)ds, в € T¿. (5.6)

Je-h

В рассматриваемом случае основным элементом двойственного метода линейного программирования решения задачи (5.5) также является опора. Пусть

грТ г грТ JT г т |ТТ I I тТ I . ЛОП v--'/l! ''оп U ronl l^onl)

-^оп = D({TOIÍ, Jou), F>(Th, J) = ^ ^^ r^^ ^ ,

— j-тый столбец матрицы Если det Т>оП ф 0, то KJm = {Т^п, JJn} - опора задачи (5.5). Пара KJm = {ТцП = 0, JJn = 0} = 0 - (пустая) опора, по определению. Опору сопровождают:

1) Множители Лагранжа

v(T¿) : K^S) = 0,TS = T¿VC, V'{Tla)D{Tla, ,roa) = v'mMU) = 0,

если KJm = 0;

2) косостояние

5(J) : ¿(Jon) = 0 : 5'(J5) = Í/(Jh) - J5),¿№) =?№),

если Ä7„ = 0.

3) псевдосостояние зет (7) и псевдопогрешности измерений 7

\йесли 5] < 0; .

аэт = есди ^ > о. аэт € [^*],если^ = 0, , € 75;

7Т(*) = еСЛИг/Тт^ < °п; 7Т(*) € [С*, Г], если^О?) = 0, 0 € Т^.

14, если V (в) > 0;

7(^п) = ОДп, ./£> атп) + ОДп, ^н) ае 7(Т5) = ОД, Ш + ОД, ж (75).

Критерий оптимальности опоры. Для оптимальности опоры необходимо и достаточно, чтобы для некоторых сопровождающих ее псевдосостояний зет0 и псевдопогрешностей 7го (0), 0 € Т^, выполнялись неравенства: й^ < < с?*,^ € < 7Т($) < 6 . При этом жт0= ает0 (жт0 — решение задачи (5.5)).

4. При решении задачи (5.5) двойственным методом основные затраты времени связаны с вычислением функции (5.6). Эту функцию можно традиционно табулировать до начала процесса наблюдения и использовать необходимые значения по ходу каждого процесса. Такой способ позиционного решения задачи (5.5) при наблюдении в реальном времени динамического объекта требует большого объёма памяти. Поэтому, опираясь на динамическую природу рассматриваемой задачи, будем генерировать необходимые значения функции (5.6) в процессе наблюдения в реальном времени.

Утверждение 2. Функция в € Т^ и{0}, удовлетворяет рекур-

рентным уравнениям: прямому

Фн(в + К) = АнФн(в), в € Тн = {0, к,..., Г - К}-Фн(к) = А*н, (5.7) и обратному

Фн(в -Ъ) = А_нФн(9), в € Тн- Фн{1* -Ъ) = А+А*~1. (5.8)

При использовании рекуррентных уравнений (5.7), (5.8) затраты времени [6] на вычисление функции (5.6) в реальном времени существенно сокращаются, если наблюдение ведётся за стационарным объектом. Кроме того, по аналогии с задачей управления [2; 5] процесс вычисления функции (5.6) можно распараллелить, если до начала процесса наблюдения вычислить и запомнить значения этой функции на выбранном наборе моментов. В процессе наблюдения эти значения используются как начальные значения для прямого или обратного уравнений (5.7), (5.8).

На задачи наблюдения переносится и метод «разновесов», описанный выше для задачи управления в реальном времени. Это не только сокра-

гцает время вычисления функции (5.6), но и препятствует накоплению ошибок округления.

5. Изложенный метод наблюдения с измерительным устройством (5.2) можно использовать при решении задач наблюдения с помощью других типов измерительных устройств.

Пусть, например, вместо дискретного измерительного устройства (5.2) используется импульсное измерительное устройство

У{в) = с'х(в)+т, е* < т <е,о<= fh. (5.9)

В этом случае задача наблюдения сводится к задаче линейного программирования вида

р'х ->■ max, < —c'F(Q)x < £*(0), в € Th- d* < х < d*.

а функция F(0), в € Т^,удовлетворяет рекуррентным уравнениям: прямому

F{0 + h) = AhF(0), F(0) = E, 9 e Th,

и обратному

F(0 -h)= A_hF(0), 0 € Th] F(t*) =

Основные операции при наблюдении в реальном времени с импульсным измерительным устройством (5.9) аналогичны операциям при использовании дискретного измерительного устройства.

Приведённые результаты по наблюдению в реальном времени можно использовать совместно с [5; 7] для управления в реальном времени линейным динамическим объектом в условиях неопределённости.

6. Заключение

В статье обоснованы методы построения в реальном времени оптимальных обратных связей (позиционных решений) для линейных стационарных динамических систем в классе дискретных управляющих воздействий. Приводятся методы построения позиционных решений, основанные на использовании двойственного метода ЛП, распараллеливания вычислении, методов ускорения вычислений с помощью рекуррентных уравнений и метода «разновесов». Наблюдение в реальном времени стационарного объекта исследуется для математической модели с множественной неопределённостью в начальном состоянии. Предложен алгоритм работы цифрового эстиматора, в котором реализации позиционного решения вычисляются в реальном времени по ходу каждого процесса наблюдения. Устанавливается эквивалентность задачи наблюдения задаче ЛП, которая решается двойственным методом ЛП, дополненной процедурой коррекции опор, распараллеливанием и использованием рекуррентных уравнений и метода «разновесов».

Список литературы

1. Габасов Р., Кириллова Ф. М., Тятюшкин А. И. Конструктивные методы оптимизации. Ч. 1. Линейные задачи. Минск, 1983. 214 с.

2. Габасов Р., Кириллова Ф. М., Павленок Н. С. Оптимальное управление динамическим объектом по совершенным измерениям его состояний // Докл. Акад. наук /РАН. 2016. №4. С. 371-375. https://doi.org/10.1134/S1064562412030209

3. Габасов Р., Кириллова Ф. М., Тхи Тань Ха Во. Оптимальное управление в реальном времени многомерным динамическим объектом // Автоматика и телемеханика. 2015. № 1. С. 121-135. https://doi.org/10.1134/S0005117915010099

4. Габасов Р., Кириллова Ф. М., Поясок Е. И. Оптимальное наблюдение в реальном времени линейного динамического объекта // Докл. Акад. наук / РАН. 2013. № 2. С. 145-148. https://doi.org/10.1134/S1064562413010080

5. Габасов Р., Кириллова Ф. М. Управление в реальном времени в условиях постоянно действующих возмущений // Докл. НАНБ. 2017. № 6. С. 7-11.

6. Федоренко Р. П. Приближённое решение задач оптимального управления. М., 1978. 486 с.

7. Gabasov R., Kirillova F. М., Poyasok Е. I. Robust Optimal Control on Imperfect Measurement of Dynamic Systems States // Appl. Comput. Math. 2009. N 1. P. 54-69.

Рафаил Федорович Габасов, доктор физико-математических наук, профессор, Белорусский государственный университет, Республика Беларусь, 220050, г. Минск, проспект Независимости, 4, тел.: (37517) 3270469, e-mail: kirillova.f@yandex.ru

Фаина Михайловна Кириллова, чл.-корр. HAH Беларуси, доктор физико-математических наук, главный научный сотрудник, Институт математики HAH Беларуси, Республика Беларусь, 220072, г. Минск, Сурганова, 11, тел.: (37517) 2841952, e-mail: kirillova.f@yandex.ru

Поступила в редакцию 31.01.19

Some Aspects of Real-time Control of Linear Stationary Dynamic Systems

R. Gabasov

Belarus State university, Minsk, Republic of Belarus F. M. Kirillova

Institute of Mathematics NASB, Minsk, Republic of Belarus

Abstract. The paper deals with the optimal positional control actions for linear discrete dynamic stationary objects. Methods of the real-time constructing of the implementations of optimal feedbacks are described based on reduction of the sequence of optimal programs to linear programming problems (LP).To solve the problem the duel method of LP with a long steps is used to correct supports, the parallelizing and acceleration of computations with the recurrent equation and methods of j ¡set of weigW^ are applied. A real-time observation problem at uncertainty in initial states is considered

to the linear dynamic object with discrete measurement devices which is reduced to the series of LP problems. Both of the problems are solved by the dual method of LP. To accelerate the computations of control actions it is suggested to use the parallelizing procedure.

Keywords: linear stationary systems, positional control, dual methods of linear programming, reccurent properties, observation, parallelizing procedure.

References

1. Gabasov R., Kirillova F.M. and Tyatyushkin A. I. Constructive optimization techniques. Vol. 1. Linear Problems. Minsk, BGU Publishing House, 1984. (in Russian).

2. Gabasov R., Kirillova F.M., Paulianok N.S. Optimal control of a dynamic system using perfect measurements of its states. Doklady Mathematics, 2012, no. 3, pp. 436-440. https://doi.org/10.1134/S1064562412030209

3. Gabasov R., Kirillova F.M., Vo Thi Tan Ha. Optimal real-time control of mul-tidemensional dynamic plant. Automation and Remote Control, 2015, no. 1(85), pp. 121-135. https://doi.org/10.1134/S0005117915010099

4. Gabasov R., Kirillova F.M., Poyasok E.I. Real-time optimal observation of a linear dynamic system. Doklady Mathematics, 2013, vol. 87, issue 1, pp. 120-123. https://doi.org/10.1134/S1064562413010080

5. Gabasov R., Kirillova F.M. Real-time control of a dynamic object under conditions of constantly acting disturbances. Doklady NAN of Belarus, 2017, no. 6, pp. 7-12. (in Russian)

6. Fedorenko R.P. Approximate solution of optimal control problems. Moscow, 1978, 486 p.

7. Gabasov R., Kirillova F.M., Poyasok E.I. Robust optimal control on imperfect measurement of dynamic systems states. Appl. Comput. Math, 2009, no. 1, pp. 54-69.

Rafail Gabasov, Doctor of Sciences (Physics and Mathematics), Professor, Belarus State University, 4, Nezavisimost avenue, Minsk, 220050, Republic of Belarus, tel.: (37517)3270469, e-mail: kirillova.f@yandex.ru

Faina Kirillova, Corresponding-member of National Academy of Science of Belarus, Doctor of Sciences (Physics and Mathematics), Professor, Principal Investigator, Institute of mathematics NASB, 11, Surganov st., Minsk, 200072, Republic of Belarus, tel.: ( 37517) 2841952, e-mail: kirillova.f@yandex.ru

Received 31.01.19

i Надоели баннеры? Вы всегда можете отключить рекламу.