Известия Тульского государственного университета Естественные науки. 2013. Вып. 1. С. 142-153
= ИНФОРМАТИКА =
УДК 519.6
Применение ЛПт-последовательности при оптимизации динамического объекта
М. В. Грязев, О. А. Кузнецова
Аннотация. Рассмотрены вопросы применения метода исследования пространства варьируемых параметров при решении задач оптимизации и управления динамическим объектом. Метод основан на использовании точек ЛПТ-последовательности.
Ключевые слова: ЛПТ-последовательность, пространство варьируемых параметров, оптимизация, оптимальное управление.
Введение
Поиск оптимальной совокупности параметров сложного динамического объекта и его системы управления предусматривает определение расчетных значений принятых критериев по значениям расчетных точек, которые расположены определенным образом в многомерном пространстве варьируемых параметров. В этом случае происходит преобразование пространства параметров в пространство критериев с учетом принятых ограничений. Таким образом, многокритериальная оптимизация сложного динамического объекта в первую очередь связана с формированием эффективного множества расчетных вариантов (критериев), на котором принимают окончательное решение.
Оценку эффективности работы такого динамического объекта целесообразно оценить совокупностью критериев, отражающих как статические, так и динамические режимы работы, и имеющих противоречивый характер.
Задача управления динамическим объектом заключается в построении такой системы управления, которая реализует оптимальные режимы функционирования с учетом неопределенности внешних факторов и параметров модели и требуемых показателей качества.
Задачи оптимального управления могут быть решены с использованием ЛПТ-оптимизации.
1. Постановка задачи
Рассмотрим классическую постановку задачи оптимального управления [14, 16]. Динамический объект может быть представлен системой дифферен-
циальных уравнений
x = f (x,u), (1)
где x = [x\,, xn]T — вектор параметров объекта в пространстве состояний, x € Rn, u = [u\,..., uk]T — вектор управления, u € U С Rk, U — ограниченное замкнутое множество, f (x, u) = [f\ (x,u) ,..., fn (x, u)]T — вектор функции, соответственно размерности n, описывающий непрерывное однозначное отображение:
f (x,u) : Rn х Rk — Rn.
Для системы дифференциальных уравнений (1), описывающих динамику объекта управления, заданы начальные условия
x0 = K...,xnf , (2)
Качество функционирования динамического объекта определяется критериями
ty
Фг = (x (ty)) + J Fi (x (t), u (t)) dt — min, i = 1,m, (3)
0
где ty — длительность процесса управления. Первое слагаемое выражения (3) характеризует точность управления конечным состоянием системы. Второе слагаемое определяет качество процесса управления на интервале [0, ty] и выполнение ограничений
■]а = j VI (х,и) (М ^ 0, I = 1,р. (4)
0
Считаем, что определен класс однозначных отображений
$ = {ви (х, А) : г = 1, ш} , (5)
где А — вектор параметров, (х, А) : Кт х Кп Кп.
Решение задачи (1)-(4) представляет оптимальное множество Парето
Р = (х,А) € $ : г = 1, ш, ] = 1,п} .
Множества Парето сформировано при следующих условиях [2, 3]:
Уst (х, А) € Б, У А € Еп Зв! (х, А) € Р ЗА € Кп
Ф ^ [х, А^ ^ Ф в (х, А)),
где Ф в (х,А)) = Ф в (х,А)) ... Фт в (х,А))]Т — вектор выполненных критериев (3), предполагается, что и = st (х,А) и выполняются условия Ф в (х,А)) ^ Ф (в^ (х,А)), если Фг в (х, А)) ^ Фг (вV' (х,А)), г = 1,ш и ЗФк в (х, А)) < Фк (вV' (х, А)), 1 ^ к ^ ш.
ty
2. Исследование пространства варьируемых параметров
Отыскание управления возможно осуществить путем поиска структуры и параметров системы управления динамическим объектом
либо путем формирования поисковой функции, определяющей параметры вектора управления в зависимости от времени
Необходимо при поиске вектора уравнения (7), (8) учитывать ограничения на управление u € U.
Процедуру поиска оптимальных параметров и оптимальной структуры (7) целесообразно объединить между собой [8]. Поиск оптимальных параметров и структур рассмотрен в [8-12].
Если отображение st (x, A) определяет структуру системы управления, а значение A — ее параметры, то при нескольких критериях (3) задачу (1)-(6) целесообразно называть задачей многокритериального структурнопараметрического синтеза [4,17].
В настоящее время известен один довольно общий класс липшицевых функционалов, удовлетворяющих условиям \J (x') — J (x'')\ ^ L \\x' — x''||, L = const > 0, для которых обеспечивается возможность локализации глобального минимума за обозримое машинное время [2, 15, 23].
Недостатком этих методов является требование знания константы Липшица для всей области изменения x. Неправильное назначение L может резко замедлить метод либо привести к потере глобального минимума. Вопросы глобальной оптимизации, включая и различные эвристические процедуры, рассмотрены в [7, 21].
Существующие методы поиска глобального экстремума, особенно в овражной ситуации, не могут рассматриваться как исчерпывающие при решении задач достаточно высокой размерности.
Если минимизируемая функция является липшицевой и решение задачи осуществляется по методу перебора, то с ростом размерности число узлов соответствующей сетки увеличивается экспоненциально. Экспоненциальное возрастание числа испытаний остается справедливым и для оптимальных алгоритмов [5], которые являются более экономными, чем перебор параметров. Построение покрытий сложных многомерных областей, необходимое для оценки экстремума и выбора испытаний, является тяжелой вычислительной задачей.
Аналогичные трудности реализации решающих правил возникают и при вероятностных подходах [15, 21]. Выполнен ряд работ, в основу которых положен принцип редукции [13], позволяющий сводить многокритериальные задачи к одномерным.
u = st (x, A)
(7)
u = ф (x, A, t).
(8)
Одним из наиболее плодотворных направлений глобальной оптимизации является идея неравномерных покрытий допустимого множества. Идея методов неравномерных покрытий, их программная реализация даны в [5,6]. Основной схемой расчета было так называемое послойное покрытие допустимого множества, в минимальной степени использующее машинную память. В этих работах был сформулирован следующий принцип: методы глобальной оптимизации должны допускать возможность использования вспомогательных методов локальной оптимизации для ускорения расчетов. В [5] был предложен алгоритм покрытия неравномерными параллелепипедами, активнее использующий память и благодаря этому более эффективный, чем послойные покрытия. Предложенный метод объединяет идеи неравномерных покрытий, половинное деление п-мерных параллелепипедов допустимого множества с использованием оценок, получаемых с помощью интервального анализа [2,3,5,6].
Трудность вопроса заключается в том, что для произвольного функционала ■] (х) задача глобальной оптимизации неразрешима с помощью вычислений .] (х) в любом сколь угодно большом, но конечном числе точек. Поэтому алгоритмы глобальной оптимизации должны развиваться для достаточно узких классов задач на основе имеющейся априорной информации [23, 24].
При моделировании динамических систем используется сеточный метод
[1].
Наиболее распространенный и эффективный эвристический метод заключается в задании некоторой грубой сетки начальных точек в допустимом множестве с последующим применением методов локальной оптимизации.
В качестве начальных точек для локальных процедур спуска могут использоваться только некоторые узлы сетки, которым отвечают наименьшие значения функционала. Таким образом, в настоящее время основным инструментом параметрической оптимизации продолжают оставаться локальные методы.
Другим направлением исследования пространства параметров следует считать зондирование пространства параметров точками ЛПТ-последовательности. Данный метод обеспечивает равномерное зондирование точками Соболя всего многомерного пространства параметров [18-20].
Рассмотрим отдельные вопросы, связанные с применением ЛПТ-последовательности при решении различных задач оптимизации динамического объекта.
Определение 1. ЛПТ-последовательность — последовательность до, д1,..., дг,... точек из единичного п-мерного гиперкуба Кп, любой двоичный участок которой, содержащий не менее чем 2Т+1 точек, представляет собой ПТ-сетку.
Определение 2. Двоичный участок последовательности — множество членов последовательности д0, д1,..., дг,..., номера которых удовлетворяют неравенству к2я-1 ^ г < (к + 1) 25; к = 0,1, 2,...; в = 1, 2,_
Определение 3. Двоичный отрезок — такой отрезок, который может быть получен путем деления отрезка [0, 1] на 2т равных частей.
Теорема. Решение задачи (1)-(6) существует, если выполняются следующие условия: вектор координат пространства состояний и вектор параметров принадлежат компактным множествам х € X, А € п; мощность множества отображений (5) конечна |Б| = М < ж; значения отображений определены Ух € X, У А € п и также принадлежат компактному множеству ви (х,А) € и, г = 1, |Б|; все функционалы (3) определены Ух € X, У и = st (х, А) € и и ограничены.
Доказательство. Если функционалы (3) определены для всех значений своих аргументов и ограничены, то каждый из функционалов может достигать своего минимума, следовательно, может достигать минимума и свертка функционалов
I
Ф (а) = ^2 агФг ^ (х, А)) ,
г=1
Т ___ I
где а = [а1,..., а] , а > 0, г = 1,1, ^ аг = 1.
г=1
Из однозначного отображения Б выберем stj (х, А) С Б и решим задачу
штФ (а). Для выбранного управления и = stj (х,А) € Б строим множество Л£ж
Парето, используя вариации весов а. По условию мощность Б конечна, строим множество Парето для всех отображений stj (х, А) С Б, ] = 1, |Б|. На основании полученного множества Парето и выполнения условий ограничений отбираются те отображения, которые удовлетворяют решению задачи (6).
Теорема доказана.
3. Параметрические, функциональные и критериальные
ограничения
При оптимизации как проектируемой, так и при модернизации действующей системы будем выделять п переменных параметров а1,а2,..., ап. Параметры могут быть естественными физическими величинами, например, масса, активное или индуктивное сопротивление и т.п., или если единицы измерения этих величин фиксированные, могут считаться безразмерными. Если функционирование системы описывается дифференциальными уравнениями, то в качестве параметров можно выбирать коэффициенты или начальные значения этих дифференциальных уравнений.
Пространством параметров П называется п-мерное пространство, состоящее из точек А с декартовыми координатами (а1, а2,..., ап). Таким образом,
каждой точке А пространства параметров соответствует конкретный набор параметров (а\, а2,..., ап) и наоборот (рис.1).
При решении конкретной задачи оптимизации можно всегда указать разумные пределы изменения каждого параметра, которые будем называть параметрическими ограничениями
а* ^ аг ^ а**, г = 1,п.
Рис. 1. Параллелепипед п в пространстве параметров П
Ограничения (9) выделяют в пространстве параметров параллелепипед п, объем которого (п-мерный) равен произведению:
К = а* - а**)... (а*п* - а*П).
В дальнейшем нас будут интересовать только точки А, принадлежащие п: им и только им соответствуют системы, параметры которых удовлетворяют ограничениям (9).
Так как метод основан на исследовании (зондировании) параллелепипеда п конечным числом точек, то без необходимости расширять границы (9) не рекомендуется: при этом объем возрастает, и для просмотра может потребоваться значительно больше точек и в итоге решение новой задачи.
Кроме перечисленных ограничений обычно в условиях задачи включаются функциональные ограничения с\:
с* < 11 (А) < с**, I = 1,1.
(10)
В этом выражении (А) — некоторые функции от параметров А = = (а\,... ,ап). Они могут быть заданы явно. Если функционирование системы описывается дифференциальными уравнениями, то (А) часто представляют собой функционалы, зависящие от интегральных кривых этих уравнений. Предполагаем, что функции /1 (А) непрерывны в п. Обозначим через О подмножество параллелепипеда п, состоящее из точек А. Множество О, вообще говоря, может быть любым замкнутым множеством. Единственное ограничение: объем Ус области О должен быть положительным (Ус > 0).
Кроме того, множество G должно совпадать с замыканием своих внутренних точек. Это требование обеспечивает отсутствие в G компонент меньшей размерности, чем п.
Требование Vg > 0 исключает из рассмотрения задачи с фиксированными ограничениями в форме равенств (f (А) = с). Эту ситуацию можно разрешить следующим образом:
fl (ai,..., an) = c, (l = l,t,t<n), относительно ai+i,... ,an:
aj = ф (ai,...,at; ci,... ct), j = t + l,n) .
Тогда можно рассматривать задачу в t-мерном пространстве параметров (ai,... ,at) без ограничений, а значения ai+i,... ,an считать известными функциями aj = ф от ai,..., at.
По мнению лица, принимающего решение (ЛПР), при решении практических задач целесообразно, чтобы некоторые значения Ф^ (А) не превышали некоторых допустимых значений, т.е. ввести критериальные ограничения
Ф^ (А) < Ф**, v = 1П. (ll)
Критериальное ограничение Ф** — это худшее значение критерия Ф^ (А), которое ЛПР считает приемлемым.
Пусть D — множество точек А, которые удовлетворяют всем ограничениям (9)—(11), так что D С G С п. Если множество D не пусто, то оно замкнуто, и его будем называть множеством допустимых точек (решений).
Тогда
Ф ^А^ = min Ф (А). (12)
Решение этой задачи всегда существует и устраивает ЛПР: если выполняются условия (11)—(12) для выбранного решающего критерия Ф(А), все значения Ф^ (А) удовлетворяют ограничениям (11).
Таким образом, ясно, что главная трудность при переходе к математической задаче состоит в выборе критериальных ограничений Ф**и в обеспечении непустоты множества допустимых точек D.
Формирование множеств D возможно путем равномерного покрытия многомерного множества варьируемых параметров А € п точками ЛПТ-последовательности, которые обеспечивают большую равномерность в отличие от случайных точек [19, 20, 22].
4. Пример оптимизации
Применительно к задаче (1)—(6) рассмотрим решение задачи 5.6, выполненное сеточным методом (применены сеточные функции), приведенное в [14], и предлагаемым методом [8]. Задача относится к задачам расчета управлений, имеющих минимальную энергию. В этом случае имеет место
задача оптимального перевода объекта из состояния X0 в состояние XТ таким образом, чтобы функционал
принимал минимальное значение.
Рассмотрен стационарный объект, позволяющий найти оптимальное программное управление и оптимальную программу и сравнить полученные результаты (рис.2).
Такое сравнение позволяет сделать выводы, касающиеся точности приближенного метода (метода математического программирования с использованием ЛПТ-последовательности) и достоверности полученных с его помощью результатов в сложных случаях (нестационарные объекты высокого порядка, задачи управления с ограничениями и др.).
В качестве примера в задаче 5.6 рассматривается управление положением ротора двигателя постоянного тока (управление током возбуждения) [14].
Напряжение п (Ь), являющееся скалярным управлением, приложено к обмотке возбуждения.
Опуская математическое описание и допущения, приведем формулировку задачи оптимизации для рассматриваемой системы:
Ограничения типа неравенств отсутствуют.
Постановка задачи: при заданном управлении объекта управления (13), отсутствии ограничений на управление п (Ь) и фазовый вектор X (Ь), заданных краевых условиях
времени управления Т = 14 с требуется найти такое управление п (Ь) и фазовые траектории х\ (Ь), х2 (Ь), при которых заданный функционал качества
1/2
Т
0
при следующих ограничениях:
(х 1 (Ь) = Х2 (Ь),
\х2 (Ь) = п (Ь),
X0 = [Х1 (0) Х2 (0)]Т , XТ = [Х1 (Т) Х2 (Т)]Т .
{
(13)
X0 = [-2 - 10]Т , XТ = [0 0]Т ,
Т
Проверим управляемость системы, используя критерий Калмана. Матрица управляемости имеет вид
0 1 1 0
Му = [В АВ] =
Объект (13) является полностью управляемым.
rank Му = 2.
Рис. 2. Графики функций п* (Ь), х\ (Ь), х* (Ь) расчетного и точного решения задачи (в, Ъ, е), а также фазовый портрет системы при оптимальном управлении (ё)
Для сформулированной задачи аналитические зависимости при оптимальном управлении и фазовых траекториях объекта (13) имеют вид
п* (Ь) = 2,9183673 - 0, 3148688Ь, х* (Ь) = -2 - 10Ь + 1, 4591836Ь2 - 0, 0524781Ь3, х* (Ь) = -10 + 2, 9183673Ь - 0,1574344Ь2.
(14)
Как видно из рис.2 точное (исходное) и расчетное решения задачи совпали с большой точностью.
Решение объекта управления выполнялось методом Рунге-Кутты 4-го порядка. Критерии определены при решении дифференциальных уравнений. Так как известно аналитическое решение (14), то поиск управления осу-
ществляется
п* (Ь) = а - Ы,
Ь
а
а
с
где 1 ^ а ^ 4, 0,1 ^ Ь ^ 0, 4 — неизвестные коэффициенты, также введены ограничения на конечную ошибку ех.
За счет покрытия пространства варьируемых параметров точками ЛПТ-последовательности получено решение.
Результаты решения приведены на рис.2 а,Ъ,е, где представлены графики функций п* (Ь), х1 (Ь), х* (Ь) расчетного и точного решения задачи, а также на рис.2, ё приведен фазовый портрет системы при оптимальном управлении.
Рассматриваемый подход может быть распространен и на системы с ограничениями.
Заключение
Применение метода исследования пространства параметров, использующий ЛПТ-последовательность, позволяет решать задачи поиска оптимальной совокупности параметров с учетом многих критериев и задачи оптимизации системы управления динамического объекта.
Полученные результаты решения задачи оптимального управления показывают, что с заданной точностью осуществляется поиск управляющего воздействия. Данный метод можно распространить на нелинейные системы с ограничениями, выполнять на основе полученных зависимостей построение системы управления с пространственной траекторией, программных систем и систем со стабилизацией выходного параметра.
Список литературы
1. Антонова Г.М. Сеточные методы равномерного зондирования для исследования и оптимизации динамических стохастических систем М.: ФИЗМАТЛИТ, 2007. 224 с.
2. Васильев Ф.П. Методы решения экстремальных задач. М.: Наука, 1981. 400 с.
3. Дегтярев Ю.И. Методы оптимизации. М.: Сов. Радио, 1980. 272 с.
4. Дивеев А.И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Изв. РАН. Теория и системы управления. 2012. №2. С.63-78.
5. Евтушенко Ю.Г. Ратькин В.А. Метод половинных делений для глобальной оптимизации функции многих переменных // Изв. АН СССР. Техническая кибернетика. 1987. №1. С.119=-127.
6. Евтушенко Ю.Г., Посыпкин М.А. Применение метода неравномерных покрытий для глобальной оптимизации частично целочисленных нелинейных задач // Журнал вычисл. матем. и матем. физики. 2011. Т.51. №8. С.1376-1389.
7. Иванов В.В. Об оптимальных алгоритмах минимизации функций некоторых классов // Кибернетика. 1972. № 4. С.81-84.
8. Кузнецова О.А. Адаптивный метод исследования пространства параметров. Тула: Изд-во ТулГУ, 2012. 288 с.
9. Кузнецова О.А. Многокритериальная оптимизация асинхронного электропривода. Тула: Изд-во ТулГУ, 2009. 104 с.
10. Кузнецова О.А. Формирование управления в пространстве варьируемых параметров // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т.5. №3. С.61-62.
11. Кузнецова О.А., Сушкин В.А. Адаптивный метод исследования пространства параметров // П‘ята науково-практична конференція з міжнародною участю «Математичне та імітаційне моделювания систем. МОДС 2010». Тези доповідей. Киів. 21-25 червня 2010. С.106-107.
12. Кузнецова О.А., Сушкин В.А. Диалоговая система многокритериальной оптимизации и синтеза оптимальных законов управления // Сборник научных трудов Б'ОгЫ по материалам международной научно-практической конференции. 2010. Т.4. №2. С.47-54.
13. Лузин Н.Н. Теория функций действительного переменного. М.: Учпедгиз, 1948. 319 с.
14. Методы классической и современной теории автоматического управления: учебник в 5 тт. Т.4: Теория оптимизации систем автоматического управления. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. 744 с.
15. Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983. 384 с.
16. Пупков К.А., Фам С.Ф., Дивеев А.И. Синтез оптимального управления динамическим объектом со случайными начальными значениями // Наука и образование. 2012. №3. http://technomag.edu.ru/doc/376455.html
17. Растригин Л.А. Адаптация сложных систем. Рига: Зинатне, 1981. 375 с.
18. Соболь И.М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с.
19. Соболь И.М. Об оценке точности простейшего многомерного поиска // Доклады АН СССР. 1982. Т.266. №3. С.569-572.
20. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М.: Дрофа, 2006. 175 с.
21. Стронгин Р.Г. Численные методы в многоэкстремальных задачах. М.: Наука, 1978. 240 с.
22. Сушкин В.А., Кузнецова О.А. Эффективное множество расчетных вариантов оценки электромеханических систем. Тула: Изд-во ТулГУ, 2006. 80 с.
23. Черноруцкий И.Г. Методы оптимизации в теории управления СПб.: Питер, 2004. 256 с.
24. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 488 с.
Грязев Михаил Васильевич ([email protected]), д.т.н., профессор, ректор, кафедра математического моделирования, Тульский государственный университет.
Кузнецова Ольга Алексеевна ([email protected]), к.т.н., доцент, кафедра математического моделирования, Тульский государственный университет.
Using Sobol sequences at optimization of the dynamic object M.V. Gryazev, O.A. Kuznetsova
Abstract. The Considered questions of the using the method of the study space running parameter at decision of the problems to optimization and dynamic object management. The Method is founded on use point to Sobol sequences.
Keywords: Sobol sequences, method of parameters’ space, optimization, optimal control.
Gryazev Michael ([email protected]), doctor of technical sciences, professor, rector, department of mathematical modeling, Tula State University.
Kuznetsova Olga ([email protected]), candidate of technical sciences, associated professor, department of mathematical modeling, Tula State University.
Поступила 19.01.2013