Научная статья на тему 'ФОРМИРОВАНИЕ ОПТИМАЛЬНОГО ЗАКОНА СИСТЕМЫ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ ЛП$_{\tau}$-ПОИСКОМ'

ФОРМИРОВАНИЕ ОПТИМАЛЬНОГО ЗАКОНА СИСТЕМЫ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ ЛП$_{\tau}$-ПОИСКОМ Текст научной статьи по специальности «Математика»

CC BY
285
86
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛП$_\tau$-ПОСЛЕДОВАТЕЛЬНОСТЬ / ПРОСТРАНСТВО ПАРАМЕТРОВ / ОПТИМИЗАЦИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / МАКРОПЕРЕМЕННЫЕ

Аннотация научной статьи по математике, автор научной работы — Грязев Михаил Васильевич, Кузнецова Ольга Алексеевна

Рассмотрены вопросы формирования оптимального закона системы управления динамическим объектом ЛП$_{\tau}$-поиском. Многокритериальная оптимизация осуществляется на основе использования ЛП$_{\tau}$-последовательности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Грязев Михаил Васильевич, Кузнецова Ольга Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ФОРМИРОВАНИЕ ОПТИМАЛЬНОГО ЗАКОНА СИСТЕМЫ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМ ОБЪЕКТОМ ЛП$_{\tau}$-ПОИСКОМ»

Известия Тульского государственного университета

Естественные науки. 2014. Вып. 3. С. 158-166 = Прикладная математика и информатика =

УДК 519.81

Формирование оптимального закона системы управления динамическим объектом ЛПТ-поиском

Аннотация. Рассмотрены вопросы формирования оптимального закона системы управления динамическим объектом ЛПТ-поиском. Многокритериальная оптимизация осуществляется на основе использования ЛПТ-последовательности.

Ключевые слова: ЛП Т-последовательность, пространство параметров, оптимизация, оптимальное управление, макропеременные.

Проблема синтеза эффективных систем управления различных объектов, связанная в первую очередь с удовлетворением совокупности технических требований, которые определяют качество движения в переходных процессах и в установившихся режимах работы, является кардинальной в теории и технике построения сложных систем автоматического управления.

Для динамического объекта заданы система дифференциальных уравнений (1)-(2), начальное состояние (3), установлены критерии качества управления (4) и ограничения (5).

Дифференциальные уравнения объекта в общем виде

М. В. Грязев, О. А. Кузнецова

Введение

1. Управляемый динамический объект

х = Г (х, и, ¿)

(1)

или в развернутом виде

¿7 (1) = 9] (¿1, ■■■ , гл, Х1, ... , Хп) , 3 = 1, й; Хi (^ = ¡г (Х1, ... , Хп) + , г = й + 1, ..., ц, ц ^ п; Хг+1 (¿) = ¡г+1 (Х1, ... ,Хп) + иг+1 + ¿7+1;

Хп (^ = ¡п (Х1, ... , Хп) + иг + .

В этой системе уравнений ж = [ж1,..., жп] т — вектор параметров объекта в пространстве состояний, ж € Еп, и = [и^... ,иг] т — вектор управления, и € и С Ет, и — ограниченное замкнутое множество, г = [г1,..., г^] —вектор внешних возмущений размерности / (ж, и) = [/1 (ж, и) ,..., /п (ж, и)] т — вектор функции, описывающий непрерывное однозначное отображение:

/ (ж, и): Яп х Яг ^ Яп

Каждая такая система уравнений удовлетворяет условиям существования решений, отвечающих любой совокупности начальных данных:

ж0 = [ж°,...,жП]Т, ж0 € Кп, * ^ 0. (3)

Каждое управление и и пара начальных данных ж0, определяют полное движение системы ж, и, т.е. кривую в п + г-мерном пространстве [1].

Оценка режимов управляемого динамического объекта определяется критериями следующего вида [2-4]:

Ф (и); = 6, (ж )) + ^ Ег (ж (*), и (*)) ^ ^ шш, г = 1,..., т, (4)

0

где *у — длительность процесса управления. Первое слагаемое выражения (4) характеризует точность управления конечным состоянием системы. Второе слагаемое определяет качество процесса управления на интервале [0, Ьу] и выполнение ограничений

¿у

= J г (ж,и) ^ 0, I = 1,... (5)

Необходимо найти оптимальное управление и (ж, Ь) за счет решения оптимизационной задачи (1)—(4) с учетом соответствующих ограничений. Определен класс однозначных отображений:

5 = { (ж, А) : г = 1,...,в} , (6)

где А — вектор параметров, в* (ж, А) : х Еп ^ Еп.

Решение задачи (1)—(9) представляет оптимальное множество Парето:

Р = { вЦ (ж, А) € 5 : г = 1,..., в, 3 = 1,...,п } . (7)

Множество Парето сформировано при следующих условиях:

Ув* (ж, А) € 5, УА € Яп Зв?(ж,А) € Р ЗА € Яп, Ф (в? (ж, А)) < Ф (ж, А)),

где Ф (ж, А)) = [Ф1 (ж, А)) ... Фт (в* (ж,А))]Т — вектор выполненных критериев (3), считая, что и = в* (ж, А) и выполняются условия Ф (в*' (ж, А)) < Ф (в*'' (ж, А)), если Ф; (в*' (ж, А)) < Ф; (в*'' (ж, А)), г = 1, ... , т и ЗФк (в*' (ж, А)) < Фк (в*'' (ж, А)), 1 < к < т.

2. Формирование оптимального управления

Поиск оптимальной системы управления динамическим объектом выполняется в соответствии с методологией ЛПт-поискового метода синтеза системы управления. Метод синтеза предполагает использование макропеременных, связанных с инвариантными множествами и скоростным градиентом.

Цели оптимального управления определяют макропеременные и инвариантные множества. Относительно макропеременных необходимо различать внешнее и внутреннее управление.

Можно привести несколько форм записи в форме уравнения с учетом внутренней переменной Фз [5]:

Фз = 7з1 (Жг+1 - VI) + ... + 7^ (Хп - и,п) , 8 = 1,..., Л, (8)

или

Фз = ^2 взк Хк + 6 (Х1,...,ХМ) , (9

к=1

где 7з,7в — весовые коэффициенты, — «внутренние» управления.

В окрестности этого многообразия функции фз непрерывны вместе с производными

дфз дфз дфз _ .

я—'я—'...^я-' 8 =1,...,Л>

дх1 дх2 дхп

т.е.

Иш Фз (Х1,... ,Хт) = Фз (аь ... ,ат).

Движение изображающей точки синтезируемой системы должно удовлетворять системе функциональных уравнений относительно макропеременных:

Тзфз (*) + Сз (Фз) =0' 8 = 1' . . . ' Л. (10)

Уравнения (10) являются уравнениями Эйлера-Лагранжа и доставляют минимум сопровождающего функционала (11), который отражает интегральные свойства синтезируемой системы

* = 0

о

^ л

Ес2 (Фз) + £ т2Ф 2 (<) + и2

,з=1 з=1

(11)

Уравнения определяют устойчивые экстремали Фз (¿), доставляющие минимум сопровождающего функционала (11), с выполнением ранговых условий [5], уравнения (10) определяют в фазовом пространстве координат Х1, ... , Хп некоторое п — ^-мерное многообразие переменных, образованное интегральными кривыми системы (10), из которых только одна проходит

через данную точку указанного многообразия. В окрестности этого многообразия функции ф8 непрерывны вместе с производными

(¿) = 9з (¿1, ... , га, XI, ... , Хп) , 3 = 1, ..., й;

X (^ = ¡г (Х1, ... , Хп) + , г = й + 1, ..., у, у ^ п;

Xг+1 (¿) = ¡г+1 (Х1, ... , Хп) + иг+1 + ;

Хп (^ = ¡п (Х1, ... , Хп) + и + га; (12)

Хп+* (*) = -1/% (фв), 8 = 1,... Л; л л

Хп++1 (¿) = ^ е2 ш ^ т2ф 2 (*) + и2.

8=1 8=1

При необходимости к системе уравнений (12) добавляются критериальные уравнения, учитывающие энергетические и другие свойства.

Отличительная особенность постановки проблемы синтеза системы состоит в способе генерации такой совокупности обратных связей - законов управления и (ф) = и (х) , которые переводят систему из произвольного исходного состояния в окрестность желаемых многообразий ф8 (х) = 0, а затем обеспечивают асимптотически устойчивое движение вдоль этих многообразий вплоть до попадания на заданный аттрактор. Необходимо, опираясь на модель объекта и системы управления, сформировать закон управления и.

Задача поиска оптимального закона управления может решаться различными методами, которые широко представлены в соответствующей литературе, например в [6].

3. Алгоритмы оптимального управления

Алгоритм 1. Разработанная модель оптимизационного расчета обладает следующими особенностями:

- обеспечивает учет нескольких критериев, имеющих разную физическую природу;

- обеспечивает учет желаемых свойств движения системы;

- выполняет учет влияния внешних возмущающих факторов за счет перевода их в дифференциальные уравнения;

- имеет возможность управления не только координатами системы, но и внутренними (производными) координатами.

Отличительная особенность постановки проблемы синтеза системы состоит в способе генерации такой совокупности обратных связей - законов управления и (ф) = и (х) , которые переводят систему из произвольного исходного состояния в окрестность желаемых многообразий ф8 (х) = 0, а затем обеспечивают асимптотически устойчивое движение вдоль этих многообразий вплоть до попадания на заданный аттрактор.

Необходимо, опираясь на модель объекта и системы управления, сформировать закон управления и.

Возможны следующие решения данного вопроса:

- управление и может иметь скалярную и векторную форму реализации;

- управление и может иметь аналитическую зависимость от координат и внешних факторов;

- при формировании закона управления может закладываться принцип «черного ящика»;

- создание структуры с генетическим алгоритмом;

- поисковый метод в сочетании с аналитическим способом формирования структуры.

Исходя из сформулированной ранее цели управления, рассмотрим схему поиска оптимального закона управления методом ЛПТ-поиска, применительно к задаче структурно-параметрического синтеза системы управления динамическим объектом.

На этапе поиска структуры управления используем принцип декомпозиции расширенной системы [5]. Размерность декомпозиции определяется соотношением

ё1ш£ = п + г — Лш, (13)

где п + г — размерность исходной расширенной системы, ш — размерность вектора управления, Л — число вводимых инвариантных многообразий.

Из соотношения следует, что с увеличением числа каналов управления процесс динамической декомпозиции системы значительно ускоряется, а процедура аналитического синтеза векторных законов управления существенно упрощается.

Выполняются обратные действия с полученными уравнениями (8)-(10) и уравнениями расширенной системы (12). Получаем, что уравнения вычисляются по формулам

Цг+1 = —/¿+1 (хЬ . . . ,Хп) — Zj+1 — Д1/Д,

..................(14)

= — /п (Х1, ...,Хп) — га — Дп/Д,

где

Д

711 712 721 722

7т 1 7т2

71т 7 2т

7тт

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 0, Д1 =

Ф1 712 Ф2 722

Фт

7т2

Дп

711 712 721 722

7т 1 7т2

71,т-1 Ф1

7 2т Ф2

7тт

Фт

71т 7 2т

7тт

= 0,

= 0,

при Ф8 = 0

Ф« = 7^ 1 (г) + 2 (г) + ... + 7 тЬп (г) - т1 ф« (<£«) •

т«

Выражения (14) позволяют установить перечень элементов, входящих в управления и соотношения между элементами.

На основании уравнения (14) введем следующую запись для управления в виде

п 1

и = ^ аг Хг + С3 • (15)

г=1 ¿=1

Коэффициенты при и образуют многомерное пространство варьируемых параметров ац, с^ € А. Решение исходной задачи (3)-(9) выполняется ЛП т-поиском [7-12] с использованием равномерного зондирования пространства параметров А точками ЛПт-последовательности и представляет оптимальное множество Парето (11), на основе которого окончательно принимается решение относительно вектора управления и = (вг, А).

Алгоритм 2. Для решения задачи синтеза управления используем метод скоростного градиента для отыскания функциональной зависимости управления. Скоростной градиент предназначен для решения задач управления непрерывными по времени системами, в которых цель управления задана при помощи целевой функции. Применим алгоритм скоростного градиента для непрерывной нестационарной системы (1) при цели управления, заданной соотношением Нш ( (х (г), г) = 0, где ( (х, г) —

гладкая целевая функция [13,14].

Для построения алгоритма вычисляется скалярная функция Я = и (х, и, г) — скорость изменения величины ( = ( (х (г), г) в силу уравнения объекта (1):

и (Х, и, г) = д(дх,ь) + [УхЯ (Х, г)]Т г (Х, и, г). (16)

Затем находят градиент функции и (х, и, г) по входным переменным

уии (х, и, г) =

ди Т 'дГ'

ди ди

Т

Ух Я (х,г). (17)

Наконец, задается алгоритм изменения и (г) дифференциальным уравнением

^ = -ГУади(х,и,г), (18)

где Г = ГТ > 0 — симметрическая положительно определенная матрица, например, Г = &ад • • •, 7т}, 7г > 0.

Для правильного и обоснованного выбора параметров алгоритмов скоростного градиента требуется проверка условий их применимости. Такие условия для различных случаев можно найти в [13-15]. Основные из них: выпуклость функции и (х,и,£) по и и существование «идеального управления» — вектора и* такого, что и (х,и*,£) ^ 0 для всех Х (условие достижимости).

Метод скоростного градиента (СГ) и градиентный метод тесно связаны с понятием функции Ляпунова V (х) — функции состояния системы, убывающей вдоль ее траекторий. Функция Ляпунова является абстрактным аналогом таких физических характеристик, как энергия и энтропия. Важно, что функция Ляпунова может использоваться не только для анализа, но и для синтеза систем, т.е. для решения обратных задач. В частности, конечная форма СГ-алгоритмов получается, если в качестве функции Ляпунова взять саму целевую функцию: V (х) = Q (х). Дифференциальная форма СГ-алгоритмов соответствует выбору V (х,и) = Q (х) + 0, 5 (и — и*)т Г-1 (и — и*), где и* - желаемое («идеальное») значение управляющих переменных. При обосновании градиентного метода в качестве функции Ляпунова используется квадрат расстояния до идеального управления: V (х) = |и — и*|2.

В окончательном виде система уравнений примет вид:

(¿) = 9з (¿1, ... , ¿а, Х1, ... , Хп) , 3 = 1, ..., й; Хг (¿) = ¡г (Х1, ... , Хп) + , г = й + 1, ..., ^ ^ п; хг+1 (¿) = ¡г+1 (Х1, ... , Хп) + иг+1 + ¿¿+1 ;

Хп (¿) = ¡п (х1, ... , Хп) + и + га; (19)

Хп+з (¿) = —1/ТзСз (Фз), 8 = 1, ... Л;

лл хХп+з+1 (¿) = £ С2 (Фз) + £ Тз2ФФ2 (¿) + и2;

з=1 з=1

и (¿) = —Г Уии (х, и, ¿).

В результате решения системы управления определяем структуру вектора управления

и = (8^, А) ,

где

8^ = — Г Уии (х, и, ¿) , значения варьируемых параметров А зависят от

Vx Q (х, ^ .

Остальные действия выполняются, как в алгоритме 1.

А = ¡

д^ ди

Заключение

Применение в математической модели оптимизационного расчета уравнений движения с макропеременными устанавливает желаемые свойства системы.

Совокупность значений варьируемых параметров A определяет основные характеристики процессов движения динамической системы.

Структура управления формируется алгоритмом скоростного градиента.

Список литературы

1. Зубов В.И. Лекции по теории управления. СПб.: Лань, 2009. 496 с.

2. Беллман Р., Дрейфус С. Прикладные методы динамического программирования. М.: Физматлит, 1965. 457 с.

3. Грязев М.В., Кузнецова О.А. Применение ЛП ^последовательности при оптимизации динамического объектом // Изв. ТулГУ. Естественные науки. 2013. Вып. 1. С. 142-153.

4. Грязев М.В., Кузнецова О.А. Возможность использования ЛП т-последова-тельности при оптимизации динамического объекта // Изв. ТулГУ. Естественные науки. 2013. Вып. 2. Ч. 1. С. 137-147.

5. Колесников А.А. Синергетические методы управления сложными системами: Теория системного синтеза. М.: КомКнига, 2006. 240 с.

6. Хлебников М.В., Поляк Б.Е., Кунцевич В.М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автоматика и телемеханика. 2011. № 11. С. 9-59.

7. Кузнецова О.А. Многокритериальная оптимизация асинхронного электропривода. Тула: Изд-во ТулГУ, 2009. 104 с.

8. Кузнецова О.А. Адаптивный метод исследования пространства параметров. Тула: Изд-во ТулГУ, 2012. 288 с.

9. Грязев М.В., Кузнецова О.А. ЛП т-поиск при решении задач оптимального управления динамическим объектом с упругими связями // Изв. ТулГУ. Естественные науки. 2013. Вып. 2. Ч. 1. С. 148-160.

10. Афанасьева С.М., Кузнецова О.А. Программный комплекс многокритериальной оптимизации // Современные направления теоретических и прикладных исследований 2013: сб. науч. трудов SWorld, матер. Междун. науч.-практич. конф. Технические науки. Одесса: КУПРИЕНКО, 2013. Т. 9. Вып. 1. С. 22-24.

11. Кузнецова О.А. , Сушкин В.А. Диалоговая система многокритериальной оптимизации и синтеза оптимальных законов управления // Сборник научных трудов Sworld: матер. Междун. науч.-практич. конф. Технические науки. Одесса: Черноморье, 2010. Т. 4. С. 47-55.

12. Кузнецова О.А. Формирование управления в пространстве варьируемых параметров // Сборник научных трудов Sworld: матер. Междун. науч.-практич. конф. Технические науки. Одесса: Черноморье, 2010. Т. 5. С. 61-63.

13. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. 550 с.

14. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с.

15. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.

Грязев Михаил Васильевич (info@tsu.tula.ru), д.т.н., профессор, ректор, кафедра математического моделирования, Тульский государственный университет.

Кузнецова Ольга Алексеевна (o.a.kusnetsova@mail.ru), к.т.н., доцент, кафедра математического моделирования, Тульский государственный университет.

Shaping the optimum law managerial system by dynamic object

LPT-searching for

M.V. Gryazev, O.A. Kuznetsova

Abstract. The Considered questions of the shaping the optimum law managerial system by dynamic object LPT-searching for. The Method is founded on use to Sobol sequences.

Keywords: Sobol sequences, method of parameters' space, optimization, optimal control, macrovariable.

Gryazev Michael (info@tsu.tula.ru), doctor of technical sciences, professor, rector, department of mathematical modeling, Tula State University.

Kuznetsova Olga (o.a.kusnetsova@mail.ru), candidate of technical sciences, associate professor, department of mathematical modeling, Tula State University.

Поступила 20.08.2014

i Надоели баннеры? Вы всегда можете отключить рекламу.