Известия Тульского государственного университета Естественные науки. 2013. Вып. 2. Ч.1. С. 137-147
= ИНФОРМАТИКА =
УДК 519.81
Возможность использования ЛПТ-поиска при решении задач оптимального управления динамическим объектом
М. В. Грязев, О. А. Кузнецова
Аннотация. Рассмотрена возможность использования ЛПт-поиска при решении задач оптимального управления динамическим объектом. Метод основан на использовании точек ЛПт-последовательности.
Ключевые слова: ЛПт-последовательность, пространство
варьируемых параметров, оптимизация, оптимальное управление.
Введение
Поиск оптимальной совокупности параметров сложного динамического объекта и его системы управления предусматривает определение расчетных значений принятых критериев по значениям расчетных точек, которые расположены определенным образом в многомерном пространстве варьируемых параметров. В этом случае происходит преобразование пространства параметров в пространство критериев с учетом принятых ограничений. Пространство варьируемых параметров равномерно зондируется точками ЛПТ-последовательности [3, 8, 24, 26].
Оценку эффективности работы такого динамического объекта целесообразно оценить совокупностью критериев, отражающих как статические, так и динамические режимы работы и имеющие противоречивый характер [25].
Задача управления динамическим объектом заключается в построении такой системы управления, которая реализует оптимальные режимы функционирования с учетом неопределенности внешних факторов и параметров модели и требуемых показателей качества.
Задачи оптимального управления могут быть решены с использованием ЛПТ-оптимизации [3].
1. Постановка задачи
Рассмотрим классическую постановку задачи оптимального управления [18, 19, 20]. Динамический объект может быть представлен системой
дифференциальных уравнений
ж = / (ж, и), (1)
где ж = [ж1,..., жп]Т — вектор параметров объекта в пространстве состояний, ж € Еп, и = [и1,..., ик]Т — вектор управления, и € и С , и — ограниченное замкнутое множество, / (ж, и) = [/1 (ж, и) ,...,/„ (ж, и)]Т — вектор-функции, соответственно размерности п, описывающие непрерывное однозначное отображение:
/ (ж, и) : Еп х ^ Яп
Для системы дифференциальных уравнений (1), описывающих динамику объекта управления, заданы начальные условия
ж0 = [ж?,...,жП]Т . (2)
Качество функционирования динамического объекта определяется критериями системы и критериями оптимального управления [7, 20, 23, 27]:
Су
Фг = © (ж (Ьу)) + ^ Fi (ж (Ь), и (£)) ^ ^ ш1п, г = 1, т, (3)
0
где Ьу — длительность процесса управления. Первое слагаемое выражения (3) характеризует точность управления конечным состоянием системы. Второе слагаемое определяет качество процесса управления на интервале [0, Ьу] и выполнение ограничений
■]а = j V (ж, и) ^ ^ 0, I = 1,р. (4)
0
Считаем, что определен класс однозначных отображений
^ (ж, А) : г = 1, т} , (5)
где А — вектор параметров, зЬ (ж, А) : Ет х Еп ^ Еп.
Решение задачи (1)-(4) представляет оптимальное множество Парето
Р = (ж, А) € 5 : г = 1, т, j = 1, п} . (6)
Множество Парето сформировано при следующих условиях [7]:
(ж, А) € 5, УА € Еп ЗвГ(ж, А) € Р ЗА € Яп, Ф ^ (ж, А^ ^ Ф (зЬ (ж, А)),
где Ф (зЬ (ж, А)) = [Ф1 (зЬ (ж, А)) ... Фт (зЬ (ж,А))]Т — вектор выполненных
критериев (3), считая, что и = зЬ (ж, А) и выполняются условия
Су
Ф (st (ж, A)) ^ Ф (st" (ж, A)), если Фг (st (x, A)) ^ Фг (st" (ж, A)), i = 1,Ш, и ЗФк (st (ж, A)) < Фк (st" (ж, A)), 1 ^ k ^ m.
Решение задачи (1)-(3) с учетом (6) связано с формированием множества эффективных расчетных вариантов [27], с разработкой процедур поиска оптимальных решений с учетом нескольких критериев [8], концепции многокритериальной оптимизации динамических объектов [9, 11, 12, 26]. Поиск оптимальных решений реализуется в работах [2, 3, 6, 8, 9, 11, 12, 13].
Для динамического объекта необходимо учитывать варьируемые параметры самого объекта и параметры, связанные с его системой управления.
Исследования, связанные с поиском оптимальных параметров динамического объекта, позволяют проводить синтез управления динамического объекта путем поиска оптимальных значений варьируемых параметров управляющего воздействия [2, 4, 5, 10, 16].
Численное решение выполняется с помощью программного комплекса [1, 14, 15], который выполняет диалоговые процедуры оптимизации.
Таким образом, перечисленные работы показывают возможность рассматривать вопросы оптимального управления динамическим объектом, находить структуру и значения параметров системы управления, применительно к динамическому объекту, обеспечивающие необходимое качество переходных процессов.
Применение ЛПТ-поиска для решения задачи оптимального управления динамическим объектом рассматривается применительно к решению известной задачи АКОР из монографии А.М. Летова [17].
2. Исходная задача аэродинамического торможения спутника
Рассматривается задача о баллистическом входе в атмосферу, после которого следует приземление искусственного спутника. Траектория приземления, заканчивающаяся в заданной точке f на поверхности Земли, определяется начальной точкой i на круговой траектории.
Решение задачи приведено в монографии А.М. Летова [17, пример 3, стр. 236]. Сохранены основные обозначения и терминология оригинала.
Задача аэродинамического торможения состоит в том, чтобы свести до минимума возможные небольшие отклонения от круговой траектории. В [17] приняты следующие допущения:
1. Программный угол достаточно мал (-1), а программная скорость v ~ « 7800 м/с.
2. Полное изменение высоты |Ду| < 30 км.
3. Тяга не имеет дополнительного регулирования.
4. Подъемная сила пренебрежительно мала и сравнима с весом.
5. Регулирование сопротивления Q осуществляется за счет изменения площади аэродинамического торможения.
В рамках этих допущений составлены уравнения возмущенного движения объекта управления, считая, что:
— переменные т, ш, в не варьируются,
— переменные А ж, А и> в силу их специфики выделяются из линейной модели уравнений возмущенного движения,
— переменная А у не оказывает существенного влияния на изменение и 008 О
г+у .
При этих предположениях находим уравнения возмущенного движения: Аг) = -д М - д А ( т_
А0 = г+у Аи Ау = V А 0,
Аш = *(ди)Аи + *(ду) АУ,
в которых в качестве функции управления выступает величина £ = А ( т2_
V т9 ,
В [17] уравнения разделяются на две группы, из которых первая интегрируется независимо от второй; вторая же нужна для оценки приращения тепла в корпусе спутника при стабилизации системы автопилотом, который будет найден. Предполагаем, что эти ограничения соблюдаются.
После упрощений имеем
Аи = —д А0 — д ,
А0 = Г+У Аи (7)
Ау = V Аб1.
Уравнения (7) преобразуем, сохраняя лишь переменную Ау.
АУ = — АУ —
V + у - + у
Введено новое управление и новые переменные
Ау = у1, Ау/ = у2, Ау = уз,
2д -Ау - = и.
- + у - + у Тогда математическая модель будет иметь вид
2/1 = у2, у/2 = уз, 2/3 = и. (8)
Оптимизация автопилота выполняется согласно функционалу [17]
СО
7 = I (у2 + а2у| + азу2 + и2) ^. (9)
Управление динамическим объектом и определяется структурой и значениями коэффициентов, входящих в структуру. Структура управления определяется функциональной зависимостью от координат у и коэффициентов Аав.
Для коэффициентов Аав производящей функции определим следующие уравнения [17]:
0 = 1 - А1з,
0 = 02 + 2Аі2 — А2з,
0 = аз + 2А2з — А2з, (10)
0 = Аіі — Аіз Азз, ( )
0 = Аі2 — Аіз Азз,
0 = Аіз + А22 — А2з Азз.
Численные значения для различных весовых коэффициентов приведены в табл.1 согласно расчету, изложенному в [17].
Таблица 1
Весовые коэффициенты
Случай 1 а2 = 1, а3=5 Случай 2 а2=аз=5 Случай 3 а2=10, аз=5
Аи=2,8 Аіі =3,5 Аіі=4,27
А ю ю 7 СЛ А ю ю 1 7 СЛ А22=13,50
А со со £> 2 Азз=3,2 Азз=3,4 А СО со 3, 6 О
Аі2=3,25 А12 =3,45 Аі2=3,65
А13 А23 Аіз=1,04 Аіз=1,04 Аіз=1,04
А2з=2,75 А2з=3,45 А ю со 4, 1 СЛ
Замкнутая система имеет вид
у1 = У2, у2 = У3,
Уз = Р1У1 + Р2У2 + РзУз, где коэффициенты усилия автопилота равны:
Р1 = —A13, Р2 = —A23, Рз = —Азз-
Для приведенной системы и значений коэффициентов (случай 1) получены графики переходных процессов (рис.1), которые отражают приведенные в [17] переходные процессы при р1 = —1,04, р2 = —2,75, Рз = —3, 2.
3. Синергетический подход к решению задачи А.М. Летова
А.А. Колесниковым рассмотрены несколько примеров, которые позволяют определить работоспособность и оценить эффективность метода синтеза оптимальных диссипативных систем управления в сравнении с
Рис. 1. Графики переходных процессов
классическим методом АКОР. В примере 9.3 [22] введены функциональное уравнение и зависимость для управления. К полученным уравнениям применена процедура покоординатного погружения с выполнением соответствующих преобразований в примере 9.3, получена оптимальная функция Ляпунова в виде
V = Лзз^2 + Л235Ж2Ж3 + ЛізЖі Хз + Л22ЖіЖ2 + Лцх^
где
Ліі = 2, Т32, Лі2 = 6, 4Т, Ліз = 2, Л22 = Т, 84, Л23 = 5, 465, Л33 = 3, 235 и оптимальный закон управления
U = —хі — 2, Т35х2 — 3, 235хз.
А.А.Колесников рассматривал решение задачи аэродинамического торможения методами синергетического подхода [21]. Система управления динамическим объектом (пример 9.3 [22]) имеет вид:
Х і = х2, Х 2 = хз, Х з = U.
Синтез автопилота, оптимального по критерию [22]
ГО
о
Уравнение автопилота
U = —ріхі — Р2Х2 — Рзхз-
Синтезируем закон управления динамическим объектом на основании метода АКАР. Для этого вводим в рассмотрение линейную макропеременную
ф = Хз + віХі + ^2X2-
Функциональное уравнение движения определяется
Тф + ф = 0.
После преобразования имеем
Р1 = ^ , Р2 = в1 + Т , Рз = в2 + Т
и закон управления
и = — ^Т"Х1 — ^1 + Х2 — ^2 + Хз- (11)
4. Применение ЛПТ-поиска для решения задачи А.М. Летова
В работах [17, 22] приведены значения коэффициентов закона управления в линейной постановке, полученные в результате численного решение задачи аэродинамического торможения [17]. Графики переходных процессов для примера 3 [17] и примера 9.3 [22] имеют одинаковые закономерности и практически совпадают (рис.1).
А.А. Колесниковым в работе [22] приведено решение задачи торможения с позиции синергетического подхода и для системы (8) приведена зависимость (11).
Рассмотрим возможность применение ЛПТ-поиска при решении ранее рассмотренной задачи. Рассматриваются два варианта решения.
Математическое описание объекта управления представляем системой дифференциальных уравнений
У/1 = У2, У/2 = Уз, Уз = и-
Начальные значения
У" (0) = —1,
У2 (0) = 0,
Уз (0) = —1.
При формировании закона управления принят критерий [17]
СО
.] = J (у2 + а2У2 + азУ2 + и2)
0
Управление представляем в линейной форме
и = аіУі + а2У2 + азУз.
Варьируемыми параметрами являются й1, а2, аз с параметрическими ограничениями
-1, 7 ^ а1 < 0,1,
-3, 0 < а2 < 0,1,
-4,0 < аз < 0,1.
При решении задачи поиска оптимального управления средствами ЛПТ-поиска получены значения коэффициентов а1, а2, аз для расчетного варианта 2560 оптимизационного расчета, интервал моделирования составлял 15 с.:
а1 = —1,097, а2 = -2,893, а3 = —3, 592.
Графики переходного процесса при вычисленных коэффициентах а1, а2, аз совпадают с приведенными на рис. 1.
Для второго варианта решения задачи принимаем, что конечные значения у1 = у2 = Уз = 0. Введем макропеременную ф, которая определяется значениями коэффициентов в
ф = в1У1 + в2У2 + Уз-
Уравнение движения
Тф + ф = 0.
При решении задачи управления введен сопровождающий функционал
СО
3 = у (Т2ф2 + ф2 + и2) ^.
о
Варьируемыми параметрами в данном случае являются въ в2, Т с параметрическими ограничениями
0,1 < в1 < 10,
0,1 < в2 < 10,
0,1 < Т < 10.
Полученные значения коэффициентов въ в2, Т в результате решения оптимизационной задачи (варианты 1 и 2) пересчитаны в коэффициенты а1, а2, аз и приведены в табл. 2.
Заключение
Применение метода исследования пространства параметров [8], использующий ЛПТ-последовательность, позволяет решать задачи поиска оптимальной совокупности параметров с учетом многих критериев и задачи оптимизации системы управления динамического объекта.
Полученные результаты решения (варианты 1 и 2), приведенные в табл. 2 сравниваются с результатами решения задачи аэродинамического
Таблица 2
Коэффициенты управления
аі а2 аз
пример 3 [17] -1,04 -2,75 -3,2
пример 9.3 [22] -2,0 -5,4б5 -3,235
пример 9.3 [22] ві T ві + в2 в2 + T
вариант 1 -1,097 -2,893 -3,592
вариант 2 -1,20 -2,721 -2,189
торможения спутника (А.М. Летов) и решением этой же задачи при синергетическом подходе из работы А.А. Колесникова.
Рассмотренные задачи решались численными методами, приведенные значения коэффициентов ai, a2, аз имеют хорошую сходимость с исходными результатами примера 3 [17].
Имеется возможность поиска оптимальных параметров с учетом дополнительных ограничений, выраженных в критериальной форме.
Полученные результаты решения задачи оптимального управления показывают, что с заданной точностью осуществляется поиск управляющего воздействия, можно выполнить на основе полученных зависимостей построение системы управления с пространственной траекторией, программных систем и систем со стабилизацией выходного параметра.
Список литературы
1. Афанасьева С.М., Кузнецова О.А. Программный комплекс многокритериальной оптимизации // Сборник научных трудов SWorld. Материалы международной научно-практической конференции «Современные направления теоретических и прикладных исследований ’2013». Т.9. Вып. 1. Технические науки. Одесса: КУПРИЕНКО, 2013. С.22-24.
2. Грязев М.В., Кузнецова О.А. Поиск оптимальной структуры системы
управления динамическим объектом // Механика и процессы управления: матер. ХХХХ11 Всероссийского симпозиума. М.: РАН, 2012. Т.3. С. 50-59.
3. Грязев М.В., Кузнецова О.А. Применение ЛПТ-последовательности при
оптимизации динамического объекта // Изв. ТулГУ. Естественные науки. 2013. Вып. 1. С. 142-153.
4. Грязев М.В., Кузнецова О.А. Оптимальное управление асинхронным электроприводом // Изв. ТулГУ. Технические науки. 2011. Вып. 5. Ч. 2. С. 212-220.
5. Грязев М.В., Кузнецова О.А. Формирование оптимального управления
электромеханическими системами // Изв. ТулГУ. Технические науки. 2012. Вып. 5. С. 130-135.
6. Грязев М.В., Кузнецова О.А. Оптимизация параметров и системы управления
динамического объекта с упругими связями // Матер. XVIII Междун.
конф. по вычислительной механике и современным прикладным системам (ВМСППС’2013), 22-31 мая 2013 г., Алушта. М.: Изд-во МАИ, 2013. С. 761-763.
7. Дивеев А.И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Изв. РАН. Теория и системы управления, 2012. №2. С. 63-78.
8. Кузнецова О.А. Адаптивный метод исследования пространства параметров. Тула: Изд-во ТулГУ, 2012. 288 с.
9. Кузнецова О.А. Многокритериальная оптимизация асинхронного электропривода. Тула: Изд-во ТулГУ, 2009. 104 с.
10. Кузнецова О.А. Формирование управления в пространстве варьируемых параметров // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т. 5. № 3. С. 61-62.
11. Кузнецова О.А. Многокритериальная концепция оптимального управления динамическим объектом // Сьома міжнародна науково-практична конференція. Математичне та імітаційне моделювання систем МОДС. Тези доповідей. 2012. С. 411-415.
12. Кузнецова О.А. Многокритериальная концепция энергоэффективных режимов электроприводов // Изв. ТулГУ. Технические науки. 2011. Вып. 6. Ч.1. С. 191-196.
13. Кузнецова О.А. Энергетические особенности регулируемого электропривода // Изв. ТулГУ. Технические науки. 2011. Вып. 6. Ч.1. С. 196-203.
14. Кузнецова О.А., Сушкин В.А. Адаптивный метод исследования пространства параметров // П‘ята науково-практична конференція з міжнародною участю "Математичне та імітаційне моделювания систем. МОДС "2010, Тези доповідей. Киів. 21-25 червня. 2010. С. 106-107.
15. Кузнецова О.А., Сушкин В.А. Диалоговая система многокритериальной оптимизации и синтеза оптимальных законов управления // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т. 4. № 2. С. 47-54.
16. Кузнецова О.А., Сушкин В.А. Формирование оптимального управления асинхронным электроприводом средствами АМИПП // Изв. ТулГУ. Технические науки. 2010. Вып. 3. Ч.1. С. 160-167.
17. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с.
18. Методы классической и современной теории автоматического управления: учебник в 5-и тт. Т.4: Теория оптимизации систем автоматического управления / под ред. К.А. Пупкова и Н.Д. Егупова. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. 744 с.
19. Понтрягин Л.С. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.
20. Пупков К.А., Фам С.Ф., Дивеев А.И. Синтез оптимального управления динамическим объектом со случайными начальными значениями // Наука и образование. 2012. №3. http://technomag.edu.ru/doc/376455.html
21. Синергетические методы управления сложными системами: Механические и электромеханические системы / Под общ. ред. А.А. Колесникова. М.: КомКнига, 2006. 304 с.
22. Современная прикладная теория управления: Синергетический подход в теории управления / под ред. А.А. Колесникова. Ч.ІІ. Таганрог: Изд-во ТРТУ, 2000. 559 с.
23. Справочник по теории автоматического управления / Под ред. А.А. Красовского. М.: Наука, 1987. 711 с.
24. Соболь И.М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с.
25. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М.: Дрофа, 2006. 175 с.
26. Сушкин В.А. Применение многокритериальной оптимизации на основе точек Соболя // Сборник научных трудов SWorld. Материалы международной научно-практической конференции «Современные направления теоретических и прикладных исследований ’2013». Т. 9. Вып. 1. Технические науки. Одесса: КУПРИЕНКО, 2013. С. 19-21.
27. Сушкин В.А., Кузнецова О.А. Эффективное множество расчетных вариантов оценки электромеханических систем. Тула: Изд-во ТулГУ, 2006. 80 с.
Грязев Михаил Васильевич ([email protected]), д.т.н., профессор, ректор, кафедра математического моделирования, Тульский государственный университет.
Кузнецова Ольга Алексеевна ([email protected]), к.т.н., доцент, кафедра математического моделирования, Тульский государственный университет.
Possibility of the use LPt-searching for at decision of the problems of optimum management dynamic object
M.V. Gryazev, O.A. Kuznetsova
Abstract. The Considered possibility of the use LPt -searching for at decision of the problems of optimum management dynamic object. Method is founded on use point to Sobol sequences.
Keywords: Sobol sequences, method of parameters’ space, optimization, optimal control.
Gryazev Michael ([email protected]), doctor of technical sciences, professor, rector, department of mathematical modeling, Tula State University.
Kuznetsova Olga ([email protected]), candidate of technical sciences, associate professor, department of mathematical modeling, Tula State University.
Поступила 15.06.2013