ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК62.501.12 д Т КОГуТ
Л.А. ЛАВРУХИН
Омский государственный университет путей сообщения
ОЦЕНКА ТОЧНОСТИ МЕТОДОВ ПРЯМОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ МНОГОМЕРНЫМИ ОБЪЕКТАМИ_
В работе рассматриваются алгоритмы прямого оптимального управления многомерными нелинейными относительно управляющего воздействия объектами. Для реализации управления применяются методы полиномиальной аппроксимации, учитывающие вторые производные уравнения объекта. Получены формулы для оценки точности методов и доказано, что в методах второго порядка ошибка в каждый дискретный момент времени имеет третий порядок малости разности управляющих воздействий на соседних шагах. Рассмотрен пример с одномерным объектом.
Во многих прикладных областях возникают про- блюдаемости. При этом будем считать, что выходом блемы создания и автоматического подержания опти- объекта являются его переменные состояния. Для про-мальных режимов. Один из классов подобных задач - стоты предположим, что объект является нелинейным согласованное и траекторное управление, в котором только по управляющему воздействию. Пусть дина-требуется сохранять заданные функциональные соот- мика объекта описывается многомерным разностным ношения выходных переменных, а также стабилизи- уравнением первого порядка и для (к + 1 )-го шага ровать движение системы относительно некоторого = Ахк + /{ик+1), (1)
аттрактора выходного пространства, поддерживая же- гдехе Я" — вектор состояния (выход) объекта;
лаемое продольное движение по кривым или гиперпо- и е Я™ — управляющее воздействие;
верхностям [1]. Частным случаем является задача про- А - матрица размерности лхл; граммного оптимального управления, в которой /е Я" — нелинейная функция, требуется осуществлять движение системы по задан- Требуется спроектировать следящую систему,
ной траектории. Сложность теоретических исследова- обеспечивающую движение по заданной траектории: ний и практических реализаций привела к тому, что в (2)
настоящее время широко используются приближенные где д е Я" и является желаемым изменением регу-методы решения задач оптимального управления [2]. лируемой величины.
Будем рассматривать дискретный объекти модель Для этого необходимо создать регулятор, задаю-«вход — состояние — выход» при условии полной на- щий управляющее воздействие ик по значениям век-
торов текущего состояния объекта хк и следующего шага желаемой траектории дк + г Проблема синтеза связана с тем, что невозможно в общем случае найти прямую зависимость чк от желаемой траектории дк+, из-за нелинейности функции f[u). Основной подход, применяемый в таких случаях — представление управления ик в явном виде с помощью методов аппроксимации [3]. Простейшим приближением является линейное с использованием модели первого порядка, которая получается из уравнения (1) с помощью разложения функции /(и) в ряд Тейлора [4]: я/*
= А + /(м*) + (3)
он
где — матрица первых производных функ-
ции /(и) размерности лх/п, вычисленная в точке ик;
<1 е Я" — разность управлений на соседних итерациях, определяемая выражением
Зж =«*♦!-"*• (4)
Естественно, что аппроксимация (3) нелинейной
модели (1) справедлива при 5 (
► 0.
Учитывая требование отслеживания заданной траектории (2) и заменяя в выражении (3) значение х1+] надк+1, определим разность управлений:
!_«*♦! ~ ~ Iй* )} - (5)
где ( )+ — операция псевдообращения матрицы. Поскольку точность любой системы управления оценивается величиной ошибки, необходимо найти
отклонение реальной траектории от желаемой:
+ | = (6)
Определим ошибку для метода первого порядка путем представления в уравнении объекта (1) функции Ци) рядом Тейлора, когда
ди
(7)
+ -
2 ди
где а2/¡ди1 — матрица Гессе вторых производных функции /(и) размерности лх/п2, вычисленная в точке ик;
® — символ кронекеровского произведения матриц.
Подставим в уравнение (7) выражение (5) для первой степени 5,+, и получим формулу для ошибки:
Таким образом, при 8к
(8)
• 0 ошибка метода, основанного на линейном приближении, соответствует второму порядку малости 5к+1. Для ее уменьшения можно использовать аппроксимацию функции f[u) второго порядка, такую как полиномиальная аппроксимация, методика которой изложена в работе [5]. Уравнение модели объекта в этом случае принимает вид:
д/ л
, +—
2 du'
-(4..®^,). О)
гдеДд+1 £ И" — разность управлений в методе второго порядка на соседних итерациях, определяемая выражением:
="<ы-Ч- (10)
По аналогии с линейными моделями подставим в уравнение (9) вместо хк + | значение дк+1 и получим из него выражение для разности управлений:
. (11)
Для определения отклонения траектории полученной системы от желаемой траектории запишем уравнение объекта (1), представляя функцию /(и) рядом Тейлора:
= Ах> +/(«*) + и+ \® ) +
1 Я3 (12)
Подставим выражение (9) для хк +, в данное уравнение и, учитывая формулу (11), получим ошибку для полиномиальной аппроксимации второй формы (здесь и далее индексы (к+ 1) опущены):
(13)
+ 1|^(Д®Д®Д) + 0(<5')
Представим вектор Д в формуле (13) с учетом вы ражения (5) в виде:
2\ди ди1К '
(14)
Подставляя вектор разности управлений (14) в выражение (13), получим:
(15)
где введены матрицы
ди2 ди2
с размерностями тхт2 и лх/п2 соответственно. Допустим, что формулу (15) можно записать в форме:
е22, =С(5®г®<У) + 0(^), (16)
где некоторая матрица С имеет размерность лхт \ Для доказательства этого запишем матрицы формул (15) и (16) поэлементно. Учитывая, что матрица В и кронекеровское произведение (8®5) имеют следующую структуру:
В =
К А К,г
= ад ... 3,6т 6А ... 5Я3Я]\ запишем выражения для последовательности матричных операций в формуле (15) в виде:
В(ё®д) =
¿=1
».А5,
,=i I
[B(S® ¿)]®<У =
/=1 У=1
т т
/=I
Для второго слагаемого формулы (15) справедливо:
Таблица
Теоретические и экспериментальные ошибки системы при различных алгоритмах управления
к Метод первого порядка Метод на основе ПА-1 Метод на основе Г1А-2
5 б е<«> 5
теоретич. эксперим. георетич. эксперим. теоретич. эксперим.
7 -5,67 Ю"3 -5,86-10"1 1,3-10"' -5,63 10^ -5,96-10"4 1,3-10"' -8,98 10"4 -9,06-10^ -1,3-10"'
8 -6,46 10"3 -6,35-10"3 -1,4-10"' 8,87-Ю-1 6,65-10й -1,4-10"' 1,52-10"3 1,34-10"3 -1,4-10"'
9 -2,69-10"5 -2,70-10"5 9,2-10"3 1,84-10"9 1,84-10"' -2,0-10"3 2,00-10"* 2,00-10"8 -3,7-10"3
10 -8,86-10"6 -8,84-10"'' -5,2-10"3 -4,05-10"" -4,07-10"" 5,5-Ю"1 -5,29 Ю-10 -5,32-10"'° 1,1-10-°
£>{[Я(<?®<5)]®<?} =
г=1 -I /=1 М
Ё Ё ¿..-с,-»« Ё Ё ^»(мнА^А
(17)
Аналогично, рассматривая третье слагаемое правой части формулы (15), можно получить:
(18)
..= 1 /=1 г-
Р=\ «=1 ¿=1 У=1
Введем некоторые матрицы С1" и С'2', имеющие одинаковые размерности лхл^. Учитывая их структуры, а также, что
(<5®5®5) = [5Д<5, ... 8,8А ¿,¿,¿1
... ... ...
запишем выражение
с(1)(5®<?®<!»)=
(=1 Ы\ 1=I
I, ¿М
У У Ус0', <5 55
(19)
.1=1 |=| ; = |
Аналогичный вид будет иметь и выражение для матричных операций С,2) (8®5®5).
Сравнивая эти формулы с соотношениями (17) и (18) и, приравнивая слагаемые с одинаковыми произведениями 5, можно показать, что имеют место равенства:
£>{[В(5®5)]®5} = С(,)(<5®5®<5); (20)
£{г®[Я(5®5)]) = С<2)(5®5®<5). (21)
Соответствующие элементы матриц С"1 и С(2) будут иметь вид:
" ' ' (22)
Р=1
„<2>
(23)
1а5/ 1
с(|) -—С121
6 диу 4
хых=Ахк+/{ик) +
Заменяя в формуле (25) значение хк +, на дк +, с учетом условия (2), запишем выражение для разности управлений:
г^eiJ,p,s = l,m.
Заменим матричные операции в формуле (15) на полученные соотношения (20) и (21) и запишем выражение для ошибки:
+ (24)
А*.. =
-/("*)), (26)
где Е — единичная матрица размера шхт. Для оценки ошибки метода управления по формуле (6) необходимо рассмотреть уравнение объекта (12), подставив в него траекторию (25). Поскольку в уравнение (25) входит Дк+,, нужно определить зависимость Дк4, о1!' разности управлений метода первого порядка 5л+|. Вектор разности Дк + 1 по аналогии с формулой (14) представим степенным рядом в виде: А,', + + (27)
где требуется найти матрицы Б, Р, О и Я, имеющие соответствующие размерности лх 1, лхт, пхлз2 и пхт'.
Перепишем с учетом формулы (5) метода первого порядка уравнение для разности управлений (26):
ди'
(28)
Из сравнения уравнений (27) и (28) можно записать: +Л(<5®<5®5)
Щ(89Е)Л 2 ди1У ' ди
А
ди ■
(29)
Приравнивая коэффициенты при одинаковых степенях 8к + 1, получим, что 5 = 0, а для остальных неизвестных матриц будет справедлива следующая система алгебраических уравнений:
2 ди2К ' ди ди
0;
(30)
Д = 6-2
эу
ди2
(3®Е)
ди
9,х
Ошибка для данного метода имеет третии порядок малости 64+| при условии 5а + 1 ->0и, сравнивая формулы (24) и (8) можно заключить, что полиномиальная аппроксимация позволяет на порядок повысить точность.
Рассмотрим метод второго порядка, основанный на полиномиальной аппроксимации первой формы. В соответствии с работой [5] уравнение модели представляется в виде:
1-Г— -- Г 1 1
......ШЯ.......... 1 .............. -
/7.....!.......;...........г...................
(25)
Рис. 1. Желаемая траектория и выходы объекта при различных алгоритмах управления
1Ё1. ® Е) 0 (5 ® 8) + Я (8 ® 5 ® 8) = 0. 2 ди / ди
Решая эту систему, и определим выражения для матриц Р,0 и Я, при подстановке которых в формулу (26) после достаточно простых преобразований получим:
э2/,
(8®8) (31)
Ошибка метода второго порядка может быть по-
а) метод первого порядка
б) ПА первой формы
в) ПА второй формы
теоретическая ошибка
экспериментальная ошибка
Рис. 2. Теоретические и экспериментальные ошибки
э <
о. О в
лучена путем подстановки выражения (29) в уравнение модели (25) и будет определяться следующим образом:
ди) ди2К '
®4 + 0(<5-Д,)'
(32)
Поскольку второе слагаемое правой части полученного выражения совпадает со вторым слагаемым правой части соотношения (15), то его так же можно заменить на С1'1 ( 8®8®8 ( Таким образом
„(21) .
бди3 4
(33)
Итак, формулы (33) и (24) позволяют оценить ошибки методов прямого управления при использовании полиномиальной аппроксимации первой и второй формы. При 84 + 1 -»0 ошибки соответствуют третьему порядку малости 8^ +,. Из сравнения полученных формул с формулой (8) можно заключить, что вычислительная точность методов, основанных на полиномиальной аппроксимации, выше точности методов, использующих линейное приближение.
В качестве примера рассмотрим объект, динамика которого описывается разностным уравнением
**♦.=«*+А>)■ (34)
гдеа = 0,6; Ь = 0,9; Р = 1, при начальных условиях: х„ = 0, и„ = 0.
Требуется вывести объект в состояние х = 1 и обеспечить дальнейшую стабилизацию. Желаемой траекторией в этом случае будет дк = 1 при к > 0.
Данный случай является одномерным (л = 1, т = 1), поэтому многие выражения заметно упрощаются. В частности, матрицы С"1 и С1"1 вырождаются в скаляры и с учетом формул (22) и (23), в которых В и О также скалярные величины, становятся равными:
£1 Жг
ст = ^
Ли
сЬг
(35)
Формулы для ошибок (33) и (24) принимают вид:
е<22> =
е(2,) = ек*-1
1 д3/ 6 ди' '
1 а3/
6 ди3 "
Ц£
2\<1и
4 (¿/и
£1 скг
£1 Лг
О К).
(36)
(37)
Рассмотрим движение объекта для первых десяти шагов (0 < к < 10). Временные зависимости выхода при различных алгоритмах управления показаны на рис. 1. Несмотря на дискретный характер объекта, при построении линий для большей наглядности и различимости отдельных траекторий была использована линейная аппроксимация. Желаемой траектории дк соответствует линия а, координате х объекта, управляемого на основе метода первого порядка — линия б. Выходные сигналы для методов, основанных на полиномиальной аппроксимации, изображены линиями в (первая форма) и г (вторая форма).
Затухание переходных процессов происходит до 5-го шага. После этого, при к = 6 в систему искусственно вводится возмущение (делается изменение выходной величины х), после чего начинается компенсация возмущающего воздействия. На следующих шагах производится поиск управляющего воздействия в соответствии с линеаризованной моделью объекта. Возникают ошибки (рассогласование выхода объекта и желаемой траектории), которые можно оценить как экспериментально, так и рассчитать по полученным выше формулам (8), (33) и (24).
Значения ошибок е"\ ер" и е{т соответственно для методов первого порядка, полиномиальной аппроксимации первой формы (ПА-1) и второй формы (ПА-2) на шагах с 7-го по 10-й показаны на рис, 2, где для наглядности при построении также использована линейная аппроксимация. Для анализа точности полученных формул и сравнения рассмотренных методов управления эти же ошибки приведены в таблице. Кроме них представлены и величины разности управлений с! метода первого порядка. Приведенные данные подтверждают тот факт, что ошибка метода на основе линейной аппроксимации имеет второй порядок малости 8, а ошибка методов на основе полиномиальной аппроксимации — третий при условии что 8 -» 0. При малых значениях величины <1 наблюдается и близость экспериментальных и теоретических значений ошибок (при8 = 1,3-10_| расхождение после первого знака, при 8 = —5,2-Ю-'1 — после второго знака). В любом случае формулы позволяют достаточно точно определить порядок ошибки.
Сравнивая методы, основанные на полиномиальной аппроксимации, можно заключить, что для данного класса объектов первая форма позволяет достичь лучших результатов по сравнению со второй (в нашем примере достигается точность большая как минимум в полтора раза), поэтому метод, основанный на этой форме приближения можно рекомендовать для решения задач прямого оптимального управления.
Библиографический список
1. Мирошник И.В. Теория автоматического управления. Нелинейные и оптимальные системы. - СПб.: Питер, 2006.
- 272 с.
2. ФедоренкоР.П. Приближенное решение задач оптимального управления. - М.: Наука, 1978. - 488 с.
3. Медведев B.C., Потемкин В.Г. Нейронные сети. Matlab 6.
- М.: Диалог-МИФИ, 2002. - 496 с.
4. Рубан А.И. Адаптивное управление с идентификацией. — Томск: Иэд-во ТГУ, 1S82. - 302 с.
5. Когут А.Т. Полиномиальная аппроксимация в некото-
рых задачах оптимизации и управления. — Омск: Иэд-во Ом-ГУПС, 2003. - 244 с.
КОГУТ Алексей Тарасович, кандидат технических наук, доцент кафедры «Автоматика и системы управления», директор ИАТИТ.
ЛАВРУХИН Андрей Александрович, аспирант кафедры «Автоматика и системы управления».
Дата поступления статьи в редакцию: 05.09.2006 г. © Когут А.Т., Лаврухин A.A.
удк 681 3 06 В. Н. 3АДОРОЖНЫЙ,
Е. С. ЕРШОВ, О. Н. КАНЕВА
Омский государственный технический университет
ДВУХУРОВНЕВЫЕ ГРАДИЕНТНЫЕ МЕТОДЫ ДЛЯ ОПТИМИЗАЦИИ СЕТЕЙ С ОЧЕРЕДЯМИ __
Разрабатываются градиентные алгоритмы для оптимизации распределения ресурсов в сетях массового обслуживания. Решается задача анализа чувствительности оптимальных решений к изменениям параметров сети. Предлагается двухуровневая аналитико-имитационная модель сети, позволяющая осуществлять адаптивную аппроксимацию поверхности отклика и реализовать анализ чувствительности, основанный на точном формальном дифференцировании. Приводятся результаты, полученные в ходе программной реализации и испытания эффективности разработанных алгоритмов.
Введение
Эффективность функционирования многих сложных организационно-технических объектов, предназначенных для обработки или обслуживания дискретных потоков каких-либо однотипных единиц — заявок — часто оценивается по времени прохождения заявок через эти объекты. Унифицированным формализованным представлением подобных объектов являются т. н. сети массового обслуживания (СеМО), или, иначе, сети с очередями. Узлами сети являются системы массового обслуживания (СМО), которые обслуживают заявки, поступающие на их вход и передают, в соответствии с заданными переходными вероятностями, на входы других СМО или на выход из сети. В виде сетей с очередями представляются, например, информационно-вычислительные сети и системы (ИБС). В этом случае заявки могут рассматриваться как передаваемые между пользователями сообщения либо как пользовательские запросы, обрабатываемые устройствами системы [ 1 -5]. На рис. 1 показан пример сети с типичной для моделирования ИБС конфигурацией. Время прохождения заявки через сеть с очередями интерпретируется как время передачи сообщения от источника к получателю, либо, при обработке пользовательских запросов, как время ответа системы. В соответствии с последней интерпретацией время прохождения заявки
через сеть будем называть временем ответа. Среднее время ответа зависит оттого, как имеющиеся ресурсы сети распределены между её узлами.
Другими примерами объектов, которые могут моделироваться как сети с очередями, являются службы сервиса, крупные магазины, банковские филиалы и другие обслуживающие предприятия, клиенты которых чувствительны к времени обслуживания и к задержкам в очередях. При разработке схем развития транспортной сети города выделяемый ресурс (в стоимостном выражении) следует оптимально распределять на восстановление и повышение пропускной способности имеющихся транспортных линий и на строительство новых, учитывая при этом очереди автомобилей (заявок) перед светофорами и на маршрутных остановках. Время ответа здесь можно интерпретировать как среднее время прохождения транспортом выделенной (основной) доли маршрутов между отмеченными множествами пунктов или как время проезда через указанный район (например, через центр города). Заметим, что решение аналогичных задач имеет смысл и для должного оборудования основных пешеходных маршрутов.
Входной поток сети, имеющий среднюю интенсивность поступления заявок Л, будем считать рекуррентным, т. е. интервалы поступления заявок в сеть определяются как независимые случайные ве-