Научная статья на тему 'ВОЗМОЖНОСТЬ ИСПОЛЬЗОВАНИЯ $ЛП_\tau$-ПОИСКА ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ'

ВОЗМОЖНОСТЬ ИСПОЛЬЗОВАНИЯ $ЛП_\tau$-ПОИСКА ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ Текст научной статьи по специальности «Математика»

CC BY
192
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
$ЛП_\tau$-ПОСЛЕДОВАТЕЛЬНОСТЬ / ПРОСТРАНСТВО ВАРЬИРУЕМЫХ ПАРАМЕТРОВ / ОПТИМИЗАЦИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Грязев Михаил Васильевич, Кузнецова Ольга Алексеевна

Рассмотрена возможность использования $ЛП_\tau$-поиска при решении задач оптимального управления динамическим объектом. Метод основан на использовании точек $ЛП_\tau$-последовательности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Грязев Михаил Васильевич, Кузнецова Ольга Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ВОЗМОЖНОСТЬ ИСПОЛЬЗОВАНИЯ $ЛП_\tau$-ПОИСКА ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ»

Известия Тульского государственного университета Естественные науки. 2013. Вып. 2. Ч.1. С. 137-147

= ИНФОРМАТИКА =

УДК 519.81

Возможность использования ЛПТ-поиска при решении задач оптимального управления динамическим объектом

М. В. Грязев, О. А. Кузнецова

Аннотация. Рассмотрена возможность использования ЛПт-поиска при решении задач оптимального управления динамическим объектом. Метод основан на использовании точек ЛПт-последовательности.

Ключевые слова: ЛПт-последовательность, пространство

варьируемых параметров, оптимизация, оптимальное управление.

Введение

Поиск оптимальной совокупности параметров сложного динамического объекта и его системы управления предусматривает определение расчетных значений принятых критериев по значениям расчетных точек, которые расположены определенным образом в многомерном пространстве варьируемых параметров. В этом случае происходит преобразование пространства параметров в пространство критериев с учетом принятых ограничений. Пространство варьируемых параметров равномерно зондируется точками ЛПТ-последовательности [3, 8, 24, 26].

Оценку эффективности работы такого динамического объекта целесообразно оценить совокупностью критериев, отражающих как статические, так и динамические режимы работы и имеющие противоречивый характер [25].

Задача управления динамическим объектом заключается в построении такой системы управления, которая реализует оптимальные режимы функционирования с учетом неопределенности внешних факторов и параметров модели и требуемых показателей качества.

Задачи оптимального управления могут быть решены с использованием ЛПТ-оптимизации [3].

1. Постановка задачи

Рассмотрим классическую постановку задачи оптимального управления [18, 19, 20]. Динамический объект может быть представлен системой

дифференциальных уравнений

ж = / (ж, и), (1)

где ж = [ж1,..., жп]Т — вектор параметров объекта в пространстве состояний, ж € Еп, и = [и1,..., ик]Т — вектор управления, и € и С , и — ограниченное замкнутое множество, / (ж, и) = [/1 (ж, и) ,...,/„ (ж, и)]Т — вектор-функции, соответственно размерности п, описывающие непрерывное однозначное отображение:

/ (ж, и) : Еп х ^ Яп

Для системы дифференциальных уравнений (1), описывающих динамику объекта управления, заданы начальные условия

ж0 = [ж?,...,жП]Т . (2)

Качество функционирования динамического объекта определяется критериями системы и критериями оптимального управления [7, 20, 23, 27]:

Су

Фг = © (ж (Ьу)) + ^ Fi (ж (Ь), и (£)) ^ ^ ш1п, г = 1, т, (3)

0

где Ьу — длительность процесса управления. Первое слагаемое выражения (3) характеризует точность управления конечным состоянием системы. Второе слагаемое определяет качество процесса управления на интервале [0, Ьу] и выполнение ограничений

■]а = j V (ж, и) ^ ^ 0, I = 1,р. (4)

0

Считаем, что определен класс однозначных отображений

^ (ж, А) : г = 1, т} , (5)

где А — вектор параметров, зЬ (ж, А) : Ет х Еп ^ Еп.

Решение задачи (1)-(4) представляет оптимальное множество Парето

Р = (ж, А) € 5 : г = 1, т, j = 1, п} . (6)

Множество Парето сформировано при следующих условиях [7]:

(ж, А) € 5, УА € Еп ЗвГ(ж, А) € Р ЗА € Яп, Ф ^ (ж, А^ ^ Ф (зЬ (ж, А)),

где Ф (зЬ (ж, А)) = [Ф1 (зЬ (ж, А)) ... Фт (зЬ (ж,А))]Т — вектор выполненных

критериев (3), считая, что и = зЬ (ж, А) и выполняются условия

Су

Ф (st (ж, A)) ^ Ф (st" (ж, A)), если Фг (st (x, A)) ^ Фг (st" (ж, A)), i = 1,Ш, и ЗФк (st (ж, A)) < Фк (st" (ж, A)), 1 ^ k ^ m.

Решение задачи (1)-(3) с учетом (6) связано с формированием множества эффективных расчетных вариантов [27], с разработкой процедур поиска оптимальных решений с учетом нескольких критериев [8], концепции многокритериальной оптимизации динамических объектов [9, 11, 12, 26]. Поиск оптимальных решений реализуется в работах [2, 3, 6, 8, 9, 11, 12, 13].

Для динамического объекта необходимо учитывать варьируемые параметры самого объекта и параметры, связанные с его системой управления.

Исследования, связанные с поиском оптимальных параметров динамического объекта, позволяют проводить синтез управления динамического объекта путем поиска оптимальных значений варьируемых параметров управляющего воздействия [2, 4, 5, 10, 16].

Численное решение выполняется с помощью программного комплекса [1, 14, 15], который выполняет диалоговые процедуры оптимизации.

Таким образом, перечисленные работы показывают возможность рассматривать вопросы оптимального управления динамическим объектом, находить структуру и значения параметров системы управления, применительно к динамическому объекту, обеспечивающие необходимое качество переходных процессов.

Применение ЛПТ-поиска для решения задачи оптимального управления динамическим объектом рассматривается применительно к решению известной задачи АКОР из монографии А.М. Летова [17].

2. Исходная задача аэродинамического торможения спутника

Рассматривается задача о баллистическом входе в атмосферу, после которого следует приземление искусственного спутника. Траектория приземления, заканчивающаяся в заданной точке f на поверхности Земли, определяется начальной точкой i на круговой траектории.

Решение задачи приведено в монографии А.М. Летова [17, пример 3, стр. 236]. Сохранены основные обозначения и терминология оригинала.

Задача аэродинамического торможения состоит в том, чтобы свести до минимума возможные небольшие отклонения от круговой траектории. В [17] приняты следующие допущения:

1. Программный угол достаточно мал (-1), а программная скорость v ~ « 7800 м/с.

2. Полное изменение высоты |Ду| < 30 км.

3. Тяга не имеет дополнительного регулирования.

4. Подъемная сила пренебрежительно мала и сравнима с весом.

5. Регулирование сопротивления Q осуществляется за счет изменения площади аэродинамического торможения.

В рамках этих допущений составлены уравнения возмущенного движения объекта управления, считая, что:

— переменные т, ш, в не варьируются,

— переменные А ж, А и> в силу их специфики выделяются из линейной модели уравнений возмущенного движения,

— переменная А у не оказывает существенного влияния на изменение и 008 О

г+у .

При этих предположениях находим уравнения возмущенного движения: Аг) = -д М - д А ( т_

А0 = г+у Аи Ау = V А 0,

Аш = *(ди)Аи + *(ду) АУ,

в которых в качестве функции управления выступает величина £ = А ( т2_

V т9 ,

В [17] уравнения разделяются на две группы, из которых первая интегрируется независимо от второй; вторая же нужна для оценки приращения тепла в корпусе спутника при стабилизации системы автопилотом, который будет найден. Предполагаем, что эти ограничения соблюдаются.

После упрощений имеем

Аи = —д А0 — д ,

А0 = Г+У Аи (7)

Ау = V Аб1.

Уравнения (7) преобразуем, сохраняя лишь переменную Ау.

АУ = — АУ —

V + у - + у

Введено новое управление и новые переменные

Ау = у1, Ау/ = у2, Ау = уз,

2д -Ау - = и.

- + у - + у Тогда математическая модель будет иметь вид

2/1 = у2, у/2 = уз, 2/3 = и. (8)

Оптимизация автопилота выполняется согласно функционалу [17]

СО

7 = I (у2 + а2у| + азу2 + и2) ^. (9)

Управление динамическим объектом и определяется структурой и значениями коэффициентов, входящих в структуру. Структура управления определяется функциональной зависимостью от координат у и коэффициентов Аав.

Для коэффициентов Аав производящей функции определим следующие уравнения [17]:

0 = 1 - А1з,

0 = 02 + 2Аі2 — А2з,

0 = аз + 2А2з — А2з, (10)

0 = Аіі — Аіз Азз, ( )

0 = Аі2 — Аіз Азз,

0 = Аіз + А22 — А2з Азз.

Численные значения для различных весовых коэффициентов приведены в табл.1 согласно расчету, изложенному в [17].

Таблица 1

Весовые коэффициенты

Случай 1 а2 = 1, а3=5 Случай 2 а2=аз=5 Случай 3 а2=10, аз=5

Аи=2,8 Аіі =3,5 Аіі=4,27

А ю ю 7 СЛ А ю ю 1 7 СЛ А22=13,50

А со со £> 2 Азз=3,2 Азз=3,4 А СО со 3, 6 О

Аі2=3,25 А12 =3,45 Аі2=3,65

А13 А23 Аіз=1,04 Аіз=1,04 Аіз=1,04

А2з=2,75 А2з=3,45 А ю со 4, 1 СЛ

Замкнутая система имеет вид

у1 = У2, у2 = У3,

Уз = Р1У1 + Р2У2 + РзУз, где коэффициенты усилия автопилота равны:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р1 = —A13, Р2 = —A23, Рз = —Азз-

Для приведенной системы и значений коэффициентов (случай 1) получены графики переходных процессов (рис.1), которые отражают приведенные в [17] переходные процессы при р1 = —1,04, р2 = —2,75, Рз = —3, 2.

3. Синергетический подход к решению задачи А.М. Летова

А.А. Колесниковым рассмотрены несколько примеров, которые позволяют определить работоспособность и оценить эффективность метода синтеза оптимальных диссипативных систем управления в сравнении с

Рис. 1. Графики переходных процессов

классическим методом АКОР. В примере 9.3 [22] введены функциональное уравнение и зависимость для управления. К полученным уравнениям применена процедура покоординатного погружения с выполнением соответствующих преобразований в примере 9.3, получена оптимальная функция Ляпунова в виде

V = Лзз^2 + Л235Ж2Ж3 + ЛізЖі Хз + Л22ЖіЖ2 + Лцх^

где

Ліі = 2, Т32, Лі2 = 6, 4Т, Ліз = 2, Л22 = Т, 84, Л23 = 5, 465, Л33 = 3, 235 и оптимальный закон управления

U = —хі — 2, Т35х2 — 3, 235хз.

А.А.Колесников рассматривал решение задачи аэродинамического торможения методами синергетического подхода [21]. Система управления динамическим объектом (пример 9.3 [22]) имеет вид:

Х і = х2, Х 2 = хз, Х з = U.

Синтез автопилота, оптимального по критерию [22]

ГО

о

Уравнение автопилота

U = —ріхі — Р2Х2 — Рзхз-

Синтезируем закон управления динамическим объектом на основании метода АКАР. Для этого вводим в рассмотрение линейную макропеременную

ф = Хз + віХі + ^2X2-

Функциональное уравнение движения определяется

Тф + ф = 0.

После преобразования имеем

Р1 = ^ , Р2 = в1 + Т , Рз = в2 + Т

и закон управления

и = — ^Т"Х1 — ^1 + Х2 — ^2 + Хз- (11)

4. Применение ЛПТ-поиска для решения задачи А.М. Летова

В работах [17, 22] приведены значения коэффициентов закона управления в линейной постановке, полученные в результате численного решение задачи аэродинамического торможения [17]. Графики переходных процессов для примера 3 [17] и примера 9.3 [22] имеют одинаковые закономерности и практически совпадают (рис.1).

А.А. Колесниковым в работе [22] приведено решение задачи торможения с позиции синергетического подхода и для системы (8) приведена зависимость (11).

Рассмотрим возможность применение ЛПТ-поиска при решении ранее рассмотренной задачи. Рассматриваются два варианта решения.

Математическое описание объекта управления представляем системой дифференциальных уравнений

У/1 = У2, У/2 = Уз, Уз = и-

Начальные значения

У" (0) = —1,

У2 (0) = 0,

Уз (0) = —1.

При формировании закона управления принят критерий [17]

СО

.] = J (у2 + а2У2 + азУ2 + и2)

0

Управление представляем в линейной форме

и = аіУі + а2У2 + азУз.

Варьируемыми параметрами являются й1, а2, аз с параметрическими ограничениями

-1, 7 ^ а1 < 0,1,

-3, 0 < а2 < 0,1,

-4,0 < аз < 0,1.

При решении задачи поиска оптимального управления средствами ЛПТ-поиска получены значения коэффициентов а1, а2, аз для расчетного варианта 2560 оптимизационного расчета, интервал моделирования составлял 15 с.:

а1 = —1,097, а2 = -2,893, а3 = —3, 592.

Графики переходного процесса при вычисленных коэффициентах а1, а2, аз совпадают с приведенными на рис. 1.

Для второго варианта решения задачи принимаем, что конечные значения у1 = у2 = Уз = 0. Введем макропеременную ф, которая определяется значениями коэффициентов в

ф = в1У1 + в2У2 + Уз-

Уравнение движения

Тф + ф = 0.

При решении задачи управления введен сопровождающий функционал

СО

3 = у (Т2ф2 + ф2 + и2) ^.

о

Варьируемыми параметрами в данном случае являются въ в2, Т с параметрическими ограничениями

0,1 < в1 < 10,

0,1 < в2 < 10,

0,1 < Т < 10.

Полученные значения коэффициентов въ в2, Т в результате решения оптимизационной задачи (варианты 1 и 2) пересчитаны в коэффициенты а1, а2, аз и приведены в табл. 2.

Заключение

Применение метода исследования пространства параметров [8], использующий ЛПТ-последовательность, позволяет решать задачи поиска оптимальной совокупности параметров с учетом многих критериев и задачи оптимизации системы управления динамического объекта.

Полученные результаты решения (варианты 1 и 2), приведенные в табл. 2 сравниваются с результатами решения задачи аэродинамического

Таблица 2

Коэффициенты управления

аі а2 аз

пример 3 [17] -1,04 -2,75 -3,2

пример 9.3 [22] -2,0 -5,4б5 -3,235

пример 9.3 [22] ві T ві + в2 в2 + T

вариант 1 -1,097 -2,893 -3,592

вариант 2 -1,20 -2,721 -2,189

торможения спутника (А.М. Летов) и решением этой же задачи при синергетическом подходе из работы А.А. Колесникова.

Рассмотренные задачи решались численными методами, приведенные значения коэффициентов ai, a2, аз имеют хорошую сходимость с исходными результатами примера 3 [17].

Имеется возможность поиска оптимальных параметров с учетом дополнительных ограничений, выраженных в критериальной форме.

Полученные результаты решения задачи оптимального управления показывают, что с заданной точностью осуществляется поиск управляющего воздействия, можно выполнить на основе полученных зависимостей построение системы управления с пространственной траекторией, программных систем и систем со стабилизацией выходного параметра.

Список литературы

1. Афанасьева С.М., Кузнецова О.А. Программный комплекс многокритериальной оптимизации // Сборник научных трудов SWorld. Материалы международной научно-практической конференции «Современные направления теоретических и прикладных исследований ’2013». Т.9. Вып. 1. Технические науки. Одесса: КУПРИЕНКО, 2013. С.22-24.

2. Грязев М.В., Кузнецова О.А. Поиск оптимальной структуры системы

управления динамическим объектом // Механика и процессы управления: матер. ХХХХ11 Всероссийского симпозиума. М.: РАН, 2012. Т.3. С. 50-59.

3. Грязев М.В., Кузнецова О.А. Применение ЛПТ-последовательности при

оптимизации динамического объекта // Изв. ТулГУ. Естественные науки. 2013. Вып. 1. С. 142-153.

4. Грязев М.В., Кузнецова О.А. Оптимальное управление асинхронным электроприводом // Изв. ТулГУ. Технические науки. 2011. Вып. 5. Ч. 2. С. 212-220.

5. Грязев М.В., Кузнецова О.А. Формирование оптимального управления

электромеханическими системами // Изв. ТулГУ. Технические науки. 2012. Вып. 5. С. 130-135.

6. Грязев М.В., Кузнецова О.А. Оптимизация параметров и системы управления

динамического объекта с упругими связями // Матер. XVIII Междун.

конф. по вычислительной механике и современным прикладным системам (ВМСППС’2013), 22-31 мая 2013 г., Алушта. М.: Изд-во МАИ, 2013. С. 761-763.

7. Дивеев А.И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Изв. РАН. Теория и системы управления, 2012. №2. С. 63-78.

8. Кузнецова О.А. Адаптивный метод исследования пространства параметров. Тула: Изд-во ТулГУ, 2012. 288 с.

9. Кузнецова О.А. Многокритериальная оптимизация асинхронного электропривода. Тула: Изд-во ТулГУ, 2009. 104 с.

10. Кузнецова О.А. Формирование управления в пространстве варьируемых параметров // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т. 5. № 3. С. 61-62.

11. Кузнецова О.А. Многокритериальная концепция оптимального управления динамическим объектом // Сьома міжнародна науково-практична конференція. Математичне та імітаційне моделювання систем МОДС. Тези доповідей. 2012. С. 411-415.

12. Кузнецова О.А. Многокритериальная концепция энергоэффективных режимов электроприводов // Изв. ТулГУ. Технические науки. 2011. Вып. 6. Ч.1. С. 191-196.

13. Кузнецова О.А. Энергетические особенности регулируемого электропривода // Изв. ТулГУ. Технические науки. 2011. Вып. 6. Ч.1. С. 196-203.

14. Кузнецова О.А., Сушкин В.А. Адаптивный метод исследования пространства параметров // П‘ята науково-практична конференція з міжнародною участю "Математичне та імітаційне моделювания систем. МОДС "2010, Тези доповідей. Киів. 21-25 червня. 2010. С. 106-107.

15. Кузнецова О.А., Сушкин В.А. Диалоговая система многокритериальной оптимизации и синтеза оптимальных законов управления // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т. 4. № 2. С. 47-54.

16. Кузнецова О.А., Сушкин В.А. Формирование оптимального управления асинхронным электроприводом средствами АМИПП // Изв. ТулГУ. Технические науки. 2010. Вып. 3. Ч.1. С. 160-167.

17. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с.

18. Методы классической и современной теории автоматического управления: учебник в 5-и тт. Т.4: Теория оптимизации систем автоматического управления / под ред. К.А. Пупкова и Н.Д. Егупова. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. 744 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

19. Понтрягин Л.С. Математическая теория оптимальных процессов. М.: Наука, 1969. 384 с.

20. Пупков К.А., Фам С.Ф., Дивеев А.И. Синтез оптимального управления динамическим объектом со случайными начальными значениями // Наука и образование. 2012. №3. http://technomag.edu.ru/doc/376455.html

21. Синергетические методы управления сложными системами: Механические и электромеханические системы / Под общ. ред. А.А. Колесникова. М.: КомКнига, 2006. 304 с.

22. Современная прикладная теория управления: Синергетический подход в теории управления / под ред. А.А. Колесникова. Ч.ІІ. Таганрог: Изд-во ТРТУ, 2000. 559 с.

23. Справочник по теории автоматического управления / Под ред. А.А. Красовского. М.: Наука, 1987. 711 с.

24. Соболь И.М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с.

25. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М.: Дрофа, 2006. 175 с.

26. Сушкин В.А. Применение многокритериальной оптимизации на основе точек Соболя // Сборник научных трудов SWorld. Материалы международной научно-практической конференции «Современные направления теоретических и прикладных исследований ’2013». Т. 9. Вып. 1. Технические науки. Одесса: КУПРИЕНКО, 2013. С. 19-21.

27. Сушкин В.А., Кузнецова О.А. Эффективное множество расчетных вариантов оценки электромеханических систем. Тула: Изд-во ТулГУ, 2006. 80 с.

Грязев Михаил Васильевич (info@tsu.tula.ru), д.т.н., профессор, ректор, кафедра математического моделирования, Тульский государственный университет.

Кузнецова Ольга Алексеевна (o.a.kusnetsova@mail.ru), к.т.н., доцент, кафедра математического моделирования, Тульский государственный университет.

Possibility of the use LPt-searching for at decision of the problems of optimum management dynamic object

M.V. Gryazev, O.A. Kuznetsova

Abstract. The Considered possibility of the use LPt -searching for at decision of the problems of optimum management dynamic object. Method is founded on use point to Sobol sequences.

Keywords: Sobol sequences, method of parameters’ space, optimization, optimal control.

Gryazev Michael (info@tsu.tula.ru), doctor of technical sciences, professor, rector, department of mathematical modeling, Tula State University.

Kuznetsova Olga (o.a.kusnetsova@mail.ru), candidate of technical sciences, associate professor, department of mathematical modeling, Tula State University.

Поступила 15.06.2013

i Надоели баннеры? Вы всегда можете отключить рекламу.