Научная статья на тему 'Анализ вариационных методов оптимального управления нестационарными колебаниями механических систем'

Анализ вариационных методов оптимального управления нестационарными колебаниями механических систем Текст научной статьи по специальности «Математика»

CC BY
266
78
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛіЗ / ВАРіАЦіЙНі МЕТОДИ / ОПТИМіЗАЦіЯ / ОПТИМАЛЬНЕ КЕРУВАННЯ / НЕСТАЦіОНАРНі КОЛИВАННЯ / МЕХАНіЧНі СИСТЕМИ / АНАЛИЗ / ВАРИАЦИОННЫЕ МЕТОДЫ / ОПТИМИЗАЦИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / НЕСТАЦИОНАРНЫЕ КОЛЕБАНИЯ / МЕХАНИЧЕСКИЕ СИСТЕМЫ / ANALYSIS / VARIATION METHODS / OPTIMIZATION / OPTIMUM CONTROL / NON-STATIONARY OSCILLATIONS / MECHANICAL SYSTEMS

Аннотация научной статьи по математике, автор научной работы — Ловейкин В. С., Човнюк Ю. В., Ромасевич Ю. О.

Проведен анализ вариационных методов оптимального управления нестационарными колебаниями механических систем. Приведен принцип максимума для крановых систем. Найдена связь принципа максимума Л.С. Понтрягина с методами классического вариационного исчисления. Приведены обоснования достаточных условий оптимальности В.Ф. Кротова, для которых намечены конструктивные пути выбора функции Р. Беллмана.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF VARIATION METHODS FOR OPTIMUM CONTROL OF NON-STATIONARY OSCILLATIONS IN MECHANICAL SYSTEMS

Variation methods for optimum control of non-stationary oscillations in mechanical systems have been analysed. The principle of maximum has been given for crane systems. Connection between Pontrjagin principle of maximum and methods of the classical calculus of variations has been established. V. Krotov sufficient optimality conditions have been substantiated, and constructive ways to choose R. Bellman function have been outlined for them.

Текст научной работы на тему «Анализ вариационных методов оптимального управления нестационарными колебаниями механических систем»

УДК 681.513.5

АНАЛІЗ ВАРІАЦІЙНИХ МЕТОДІВ ОПТИМАЛЬНОГО КЕРУВАННЯ НЕСТАЦІОНАРНИМИ КОЛИВАННЯМИ МЕХАНІЧНИХ СИСТЕМ

В.С. Ловейкін, професор, д.т.н., Ю.В. Човнюк, доцент, к.т.н.,

Ю.О. Ромасевич, докторант, к.т.н.,

Національний університет біоресурсів і природокористування України, м. Київ

Анотація. Проведено аналіз варіаційних методів оптимального керування нестаціонарними коливаннями механічних систем. Зазначено принцип максимуму для кранових систем. Знайдено зв ’язок принципу максимуму Л. С. Понтрягіна з методами класичного варіаційного числення. Наведено обґрунтування достатніх умов оптимальності В.Ф. Кротова, для яких намічено конструктивні шляхи вибору функції Р. Беллмана.

Ключові слова: аналіз, варіаційні методи, оптимізація, оптимальне керування, нестаціонарні коливання, механічні системи.

АНАЛИЗ ВАРИАЦИОННЫХ МЕТОДОВ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕСТАЦИОНАРНЫМИ КОЛЕБАНИЯМИ МЕХАНИЧЕСКИХ СИСТЕМ

В.С. Ловейкин, профессор, д.т.н., Ю.В. Човнюк, доцент, к.т.н.,

Ю.О. Ромасевич, докторант, к.т.н.,

Национальный университет биоресурсов и природопользования Украины,

г. Киев

Аннотация. Проведен анализ вариационных методов оптимального управления нестационарными колебаниями механических систем. Приведен принцип максимума для крановых систем. Найдена связь принципа максимума Л. С. Понтрягина с методами классического вариационного исчисления. Приведены обоснования достаточных условий оптимальности В.Ф. Кротова, для которых намечены конструктивные пути выбора функции Р. Беллмана.

Ключевые слова: анализ, вариационные методы, оптимизация, оптимальное управление, нестационарные колебания, механические системы.

ANALYSIS OF VARIATION METHODS FOR OPTIMUM CONTROL OF NON-STATIONARY OSCILLATIONS IN MECHANICAL SYSTEMS

V. Loveykin, Professor, Doctor of Engineering Sciences,

Yu. Chovnuk, Associate Professor, Candidate of Engineering Sciences,

Yu. Romasevich, Associate Professor, Candidate of Engineering Sciences, National University of Life and Environmental Sciences of Ukraine, Kyiv

Abstract. Variation methods for optimum control of non-stationary oscillations in mechanical systems have been analysed. The principle of maximum has been given for crane systems. Connection between Pontrjagin principle of maximum and methods of the classical calculus of variations has been established. V. Krotov sufficient optimality conditions have been substantiated, and constructive ways to choose R. Bellman function have been outlined for them.

Key words: analysis, variation methods, optimization, optimum control, non-stationary oscillations, mechanical systems.

Вступ

За аналогією з тим, як конструктор має бути добре обізнаний щодо технології виготовлення запропонованих ним виробів, вміти видавати завдання на їх виготовлення у стандартній, зрозумілій будь-якому верстатнику формі, так і сучасний інженер має знати сучасні методи розв’язку оптимізаційних задач та вміти формулювати ці задачі у точних термінах. Сучасні конструктори технічних (у тому числі і кранових) систем мають бути ознайомлені з оптимізаційними задачами, способами їх розв’язку та на прикладах навчені методиці їх формальної постановки.

Відомо, що постановка задачі оптимізації/ оптимального керування перехідними процесами механічних (кранових) систем тісно пов’язана з методикою й обчислювальною процедурою її розв’язку; у ряді випадків еквівалентне перетворення чи несуттєва зміна постановки кардинально змінює трудомісткість розв’язку. Тому для сучасного інженера важливим є не тільки знання методів оптимі-зації, але й розуміння того, як додавання чи відкидання тих чи інших умов вплине на ці методи. Подібна ситуація складається при виборі дослідником шляху розв’язку конкретної задачі оптимізації, - наприклад, розв’язувати її методами класичного варіаційного числення чи використати принцип максимуму Л.С. Понтрягіна. Для відповіді на таке питання слід знайти і використати спеціальні підходи (зокрема, модульний підхід), які дозволяють отримати умови оптимально-сті й тісно пов’язані з ними обчислювальні алгоритми. При такому підході умови опти-мальності будуються не як система розрахункових співвідношень для задачі конкретного типу, а як правило переходу до таких співвідношень, придатне для задачі з будь-яким сполученням критерію оптимальності й тих чи інших типів обмежень.

На думку авторів даної роботи, назріла нагальна потреба в аналізі вказаних підходів, які використовуються у варіаційних методах оп-тимізації та оптимального керування нестаціонарними коливаннями механічних (зокрема, кранових) систем.

Аналіз публікацій

Принцип максимуму для об’єктів, які характеризуються звичайними диференціальними рівняннями, розглянуто у роботах [1-9].

Аналіз саме цих робіт приведено у даному дослідженні. Зазначено розв’язок принципу максимуму Л.С. Понтрягіна методами класичного варіаційного числення. Особливу увагу приділено достатнім умовам оптимально-сті варіаційних задач, а саме: сформульовано умови оптимальності і способи задання функції Кротова [8], рівняння Р. Беллмана [6, 7]. Отримано розв’язки останнього у межах типових моделей динаміки кранових систем, які функціонують у перехідних режимах, котрим притаманні нестаціонарні коливання значної амплітуди.

Мета та постановка задачі

Метою роботи є відшукання оптимальних параметрів перехідного процесу (пуску/гальмування) для лінійного об’єкта другого порядку (моделі кранової системи) на відрізку часу, який моделює тривалість вказаного процесу. При цьому використано підхід автора [8] (зокрема, функцію Кротова) й отримано аналітичний розв’язок рівняння Р. Бел-лмана. Для досягнення поставленої мети необхідно вирішити такі завдання: 1) проаналізувати найпростішу задачу умовного оптимуму функціоналу (критерію оптиміза-ції); 2) привести необхідні умови оптималь-ності процесу згідно з принципом максимуму Л.С. Понтрягіна; 3) встановити зв’язок принципу максимуму із класичним варіаційним численням; 4) вказати достатні умови опти-мальності у задачах оптимального керування механічними системами (умови оптимально-сті В.Ф. Кротова, метод динамічного програмування Р. Беллмана).

Аналіз варіаційних методів оптимального керування

Для отримання умов оптимальності й тісно з ними пов’язаних алгоритмів розв’язку задач оптимізації функціоналів можна йти двома шляхами [6, 7]. Перший з них полягає у формулюванні умов оптимальності для ряду найбільш типових поєднань критерію опти-мальності й того чи іншого типу обмежень. При цьому кожного разу необхідно доводити умови оптимальності, з’ясовувати, якою є множина порівняння L тощо.

Однак стосовно всієї множини можливих постановок такий підхід має суттєві недоліки. По-перше, задача не завжди виявляється типовою, й у цьому останньому випадку доводиться виводити її умови оптимальності,

що для інженера (конструктора, проектувальника), а іноді й для математика є зовсім не простою задачею. По-друге, неможливо прослідкувати вплив вилучення чи додавання того чи іншого обмеження на умови оптима-льності задачі, якщо задача не є типовою.

Другий шлях полягає у використанні модульної [6, 7] форми оптимальності. У варіаційних задачах таке алгоритмічне формулювання умов оптимальності через деяку стандартну конструкцію і правило складання цієї конструкції з готових модулів є набагато актуальнішими, завдяки великому розмаїттю різноманітних типів зв’язків і, головне, завдяки тому, що різноманітні функціональні складові по-різному входять до умов опти-мальності.

Нижче розглянуто найбільш ретельно вивчені типові задачі, наведені для цих задач умови оптимальності та шляхи їх використання, дані формулювання й обґрунтування умов оптимальності у модульній формі, а також буде показано, як випливають з них відомі умови оптимальності і як ними користуватись для «нетипових» поєднань критеріїв та обмежень, характерних для кранових систем, що працюють у перехідних режимах пуску/гальмування .

Розглянемо задачу умовного оптимуму функціоналу (його максимуму)

І%= Л0( х, и, ?) + ф? (х, ?) +1

п

п

+ЕФху (х, t) • f (х, и, t),

■у=1

(1)

де /0 - задана функція своїх аргументів; и -функція керування системою; Т - тривалість процесу керування; на множині допустимих рішень, яка характеризується зв’язками між змінними стану х (переміщення, швидкість, прискорення, прискорення вищих порядків кранової системи) та керуючими змінними и у формі диференціальних рівнянь спеціального виду

х *(0) = аі^ тах ф(х(0), 0);

X (0)є^.

х*(Т) = аі^ тах [F0(х(Т),Т)-ф(х(Т),Т)]

х(Т )є^

(2)

XV(0) = х^;ху (Т) = хУт;V = (1,п), (3)

а також автономними (незалежними від часу ?) обмеженнями на керування и(?) еУи.

Особливості цієї задачі полягають у тому, що змінні стану не входять ні до критерію оптимальності І, ні до правих частин диференціальних рівнянь, тому граничні умови (3) через диференціальні рівняння (2) задають інтегральні обмеження на и(?)

I = {л (и(?Ы - с = 0,

(4)

де С = XV (Т) - XV (0).

Максимально досяжне значення критерію І* (значення задачі) абсолютно не залежить від початкових та кінцевих значень вектора х, а залежить лише від різниць між ними Л . Тому в задачі (1)-(4) існує рівносильний аналог

I = | ./¿(Ч? М

IV = 1Л (“М? - С = 0;

(5)

^ (1, п); и є¥и.

і умовами на границях оптимальної траєкторії

Після знаходження розв’язку цієї задачі и * (?) та значення І* можна, підставляючи у (2), знайти для заданих початкових умов х *(?).

Поставлена задача для кранових систем є важливою не лише сама по собі, але й тому, що дозволяє виявити одну з головних особливостей задач умовного максимуму функціоналу, яка полягає у тому, що конструкція, аналогічна функції Лагранжа у нелінійному програмуванні (НП), повинна бути не стаціонарною, а максимальною на оптимальному розв’язку.

Задача (5) може мати нескінченну кількість оптимальних розв’язків. Покажемо це, для чого, припускаючи Т фіксованим (тривалість перехідного періоду/режиму кранової системи), перепишемо його у формі усередненої задачі НП (НП). Риска над абревіатурою (позначення змінної тощо) означає, як завжди, операцію усереднення. Згідно з отриманими у [6, 7] умовами оптимальності усереднених задач оптимальний розв’язок и * може набувати не більше ніж (п+1) базових значень (ик)* за період Т. Кожне з цих значень надає максимуму функції Лагранжа

0

0

0

я = Л0(и)+Ë^v Л (и)

(6)

Я = /0(и) + 1^ /V (и), (9)

на множині Vu.

Загальний термін часу, протягом якого

п

и* = (ик)*, дорівнює Ук • т (Ук >0;^Ук = 1).

к=0

Якщо максимум Я на Ки є єдиним, наприклад функція Я є опуклою по и, тоді базове значення є єдиним; якщо максимумів є кілька, то при одних і тих самих частках ук керування може мати різний вид, набуваючи базових значень у різній послідовності.

На рис. 1 показано розв’язок и * (?) для п=2. Він має три ділянки постійних значень, які відповідають базовим значенням (и0)*,

(и1)*, (и2)*. Зображене штриховою лінією керування також є оптимальним, оскільки задовольняє зв’язкам у формі усередненої задачі (НП)

Т = /0(и) ^ тах

___ С __________

/V (и)-^г = Фv (и) = 0;

Т , (7)

V = (1,п);и є¥и;

набуває тих самих базових значень протягом тих самих часток ук від періоду Т. Зрозуміло, що таких розв’язків можна побудувати скільки завгодно багато.

Рис. 1. Різні оптимальні розв’язки задачі (5) Введемо у розгляд функціонал

V V V=1 0

/0(и)+£^ /V (и)

dt, (8)

який назвемо функціоналом Лагранжа (для кранових систем), а його підінтегральний вираз

назвемо функцією Лагранжа задачі (5).

З тотожності із задачею НП випливають необхідні умови оптимальності задачі (5): якщо и *(?) - оптимальний розв’язок задачі (5), тоді знайдеться такий вектор А = (А^..., ,...,Аи), що на оптимальному

розв’язку функції Лагранжа Я досягає абсолютного максимуму по и

и *(?) = а^ тахЯ(и, А).

иєИ,

(10)

Від функцій ^ (V = (0, п)) вимагають неперервності по «, а сам розв’язок шукають у класі кусково-неперервних функцій.

Ускладнімо задачу (1)-(3) тим, що будемо вважати функції f{) та ^ залежними не тільки від и, але й від ґ

I = | /0(и, ? М?

и ;

& = ^(u, ?); Xv (0) = Xv0; Xv (Т) = Xvт .

(11)

Задача (11), як і раніше, є рівносильною задачі з інтегральними обмеженнями, але остання тепер має вигляд

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I = | /0(и, ? М?

¿V = íфv(u, t)dt =0;

0 (12)

и є¥„,

де Фv = /V(и, ?)-с; С = Xvт -Xv0.

Функції /0 та /, як і вище, будемо вважати неперервними по и та по ?, а розв’язок задачі и * (?) - шукати у класі кусково-

неперервних функцій. За цим же правилом, як і вище, можна сформувати функціонал Лагранжа для задачі (12)

І

5 = I+£А,},=

v=1

п

/0(и, ?) + ZАvФv (и, ?)

V=1

У=1

У=1

0

т

0

т

У=1

й через нього сформувати умови оптималь-ності її розв’язку: якщо розв’язок задачі (11) існує й дорівнює и *(?), тоді знайдеться такий вектор А = (А1, А2, ..., Ап), що для кожного ? є [0, Т] функція Лагранжа

Я = /0(и, ?) + ¿АvФv (и, ?) (14)

v=1

є максимальною по и в точці и *

и *(?) = а^тахЯ(и, А,?). (15)

иє^

Як і вище, ми розглянемо тільки невироджені розв’язки і вважатимемо множник А 0 перед I рівним одиниці.

Зазначимо, що умови (15) за формою співпадають з умовами (10), але якщо останні випливали безпосередньо з того, що задача (5) виявилась усередненою задачею НП, і не вимагали доведення, то тепер цього сказати не можна. Задача (12) не співпадає із задачею НП , оскільки функції, що її визначають, залежать від ?. Однак щоб були справедливими умови у формі вимоги максимуму функції Лагранжа, достатньо, щоб співпадіння з усередненою задачею НП існувало лише на кожному як завгодно малому інтервалі

лк = ?к+1 -?к всередині [0, Т].

T

I = |f0(х, u, t)dt + F(x(T)) ^ max (16)

о

й умовами у формі диференціальних рівнянь

х& = /V(х, и, ?); V = (1, п), (17)

де и(?) - вектор-функція керуючих змінних, а х(?) - вектор-функція змінних стану (кранової системи). Керування є обмеженим

и(?) єУи (18)

і розшукується у класі кусково-неперервних функцій.

Задачу (16)-( 18) зазвичай називають задачею оптимального керування, хоча ця постановка включає набагато більш широкий клас задач оптимізації.

Необхідні умови оптимальності для задачі (16)-(18) було сформульовано Л.С. Понтря-гіним у 1956 р. після того, як у результаті ряду робіт з оптимального керування і, перш за все, статей О.О. Фельдбаума [6] було чітко усвідомлено той факт, що цій задачі є адекватним цілий ряд реальних постановок і що використання методів класичного варіаційного числення для її розв’язку є неефективним.

Умови (10) та (15) є принципово відмінними від необхідних умов у формі теореми Куна-Таккера й випливаючих з них умов оптима-льності багатостадійних процесів. Вимоги стаціонарності функції Лагранжа всередині та локальної непокращуваності на границі області допустимих значень змінних заміняються у них вимогою максимуму Я . Такого типу умови зазвичай називають умовами у формі принципу максимуму [1]. Вони не вимагають диференційованості / 0 та ф^, по и й дозволяють шукати и * (?) у класі кусково-неперервних обмежених функцій.

Для задач більш загального вигляду, ніж (12), умови принципу максимуму зводяться до вимог максимуму Я не за всіма, а тільки за частиною шуканих змінних.

Розглянемо задачу оптимізації за критерієм

Необхідні умови оптимальності задач оптимального керування зводяться до таких: нехай існує оптимальний розв’язок задачі (16)-(18) {и * (?), х * (?)} , тоді знайдеться така

вектор-функція А = (А1 (?),..., Аи (?)), яка дорівнює нулю за межами [0, Т], що складена з її допомогою функція Лагранжа

R( x, u, A, t) = f0( x, u, t) + F (x(t)) • 5(t - T) +

+ :

n n

XAvf (x, u, t) + X&V--*

(19)

V=1

V=1

на оптимальному розв’язку є стаціонарною за всіма складовими вектора стану х(?)

dR( x, u*, A, t) dxv

= 0; v = (1, n ) (20)

і досягає максимуму за керуючими впливами и *(?) = а^тахЯ(х*,и, А,?). (21)

v

Функції /0, й і7 є неперервними за всіма своїми аргументами й неперервно-диферен-ційованими по х.

При формулюванні умов оптимальності зручно ввести функцію

П

Я = /0 (х, и, і) + 2 АV (0 • /у (х, и, 0, (22)

У=1

яку зазвичай називають функцією Гамільто-на. У неї ввійшли всі ті складові функції Лагранжа, що залежать від керуючих змінних. Із використанням функції Гамільтона умови оптимальності буде подано у формі

& =-

дН _ Э/7

дх, Эх,

5(/-Г);у = (и); (23)

и * (?) = а^тахі/(х*,м, А,/)-

гієК.

(24)

А,

МО"" **

К

х , г

4 и т

-І\* ¿>(1-7')

Рис. 2. Характер зміни функції А(ї) в околі моменту ї = Т

Основним об’єктом досліджень у класичному варіаційному численні є задача

I = І /0(х, &)dt ^ тах

(26)

Запишемо для неї умови принципу максимуму. Для цього введемо позначення: и = X й перепишемо критерій оптимальності як

Враховуючи той факт, що при / > Т функція А(/) дорівнює нулю, а при і = Т її похідна має складову у формі 8 -функції, можна зробити висновок, що Ау (ї) при і = Т має роз-

дЕ а

рив першого роду ---------. Якщо, наприклад,

дхх

Э/7 . .

----= а, тоді А(/) при наближенні / до Т

дхх

додатна, у момент Т дорівнює а і стрибком зменшується до нуля (рис. 2). Таким чином

(Т)

дР_

дх.. ,

; у = (1, п).

(25)

Умови максимуму (24) разом з диференціальними рівняннями (23), які мають крайові умови (25), утворюють розрахункові співвідношення принципу максимуму Л.С. Понтря-гіна, котрі, як і будь-які умови оптимальнос-ті, слід використати разом із рівняннями зв’язків (17) та крайовими умовами для них.

Слід зазначити, що змінні задачі виявилися розбитими на дві групи. За змінними однієї групи, керуваннями, функція R повинна бути максимальною, а за другою групою змінних, станами, функція Лагранжа на оптимальному розв’язку є стаціонарною. Зазначимо також, що крайові умови для х та А визначено на різних кінцях відрізку [0, Т].

I = | /0 (х, и, t)dt ^ тах.

(27)

Функція Гамільтона для задачі (26), (27) запишеться як

Н = /0 (х, и, t) + Аи,

(28)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а умови принципу максимуму Л.С. Понтрягі-на набудуть форми

до дх

и ) = а^тах Н (х, и, А, t)

&=-д/0;

дх

(29)

на інтервалі (0, Т). Функція /0(х, и, ї) може бути неперервною, від неї не вимагають диференційованості по и = х&; сама ж величина и може бути обмежена.

Звузимо клас розглядуваних задач, вимагаючи від /0 диференційованості не тільки по х, але й по х& а обмеження на X будемо вважати відсутніми. Крім того, вимоги максимуму Н замінимо необхідною умовою цього максимуму - умовою стаціонарності Н по и. За цих припущень ми прийдемо до рівнянь

&=-% .

дх

д/о + А = 0 ди

дх

ди

= 0. (30)

0

0

Рівняння, отримане після виключення А, є рівнянням Ейлера. Його одержано з умов принципу максимуму при звуженні класу розглядуваних задач та заміні вимог максимуму більш слабкими умовами стаціонарності Н по и.

Вимогу максимуму Н на оптимальному керуванні можна для задачі класичного варіаційного числення переписати як

E = H(x*,u*, X, t) - H(x*,u, X, t) =

= f0(x*,u*, t) - f0(x*,u, t) + X(u * -u) > 0.

(31)

Якщо замінити X з умови стаціонарності Н

/

на оптимальному розв’язку (30), Х =--------0,

ди

тоді нерівність (31) буде записано у формі

E = f0(х*,u*,t) -f0(х*,u,t) -

fo(x*,u, t)

du

(u * -u) > 0.

(32)

Функцію E називають функцією Вейєршт-расса, а умову (32) - умовою Вейєрштрасса.

т

I = |/0[x(t),u(t),a, t]dt ^ max, (33)

0

де a - параметр (вектор параметрів), за умов

x& = / (x, u, a, t);u eVu; (34)

xv(0) = xV0;v = ( 1,m ). Складемо функцію R

(35)

R = X<)/0( x, u, a, t) + X&V

V xv +

+IXv/v(x,u,a,t) + X%V(xv -xv0)5(t),

(36)

де 5(і) - дельта-функція П. Дірака аргументу і.

До змінних першої групи віднесемо функції и(і), які входять до правих частин диференціальних рівнянь, оскільки

К1 =Х)/о( х, и, а, і) + XXv / (х, и, а, і). (37)

Умови оптимальності для X0 = 1 набувають вигляду

+

= argmax {[ /0( x*, u, a*, t)] +

YjXv/v (x*, u, a*, t)

(38)

— = 0 ^X . = 0 = -dRL + %5(t); dxj dxj (39)

(І = (1,т )).

Оскільки при і<0 Xі (і) = 0, а & при ї=0 дорівнює 5 -функції, то при ї=0 Xі (0) = . На

правому кінці інтервалу при і<Т X(і) = 0, а при і=Т вона є неперервною, тому

X, (T) = 0;(j = (1,m )).

(40)

Для всіх t є (0, T) маємо

dx,

;(j = ( 1, m )).

(41)

Насамкінець стаціонарність S по а приводить у даному випадку до співвідношень

fdRi. п І----dt = 0.

J da

(42)

Умови (38)-(42) утворюють принцип максимуму Л.С. Понтрягіна для інтегрального критерію (33).

У тому випадку, коли /0 і / диференційовані не тільки по х, але й по и, а множина Vu є незамкненою, можна замінити вимогу максимуму по и вимогою стаціонарності (більш слабкою). У цьому випадку ми приходимо до умов оптимальності класичного варіаційного числення (30).

Розглянемо задачу оптимізації з критерієм

I = | /0 [ x(t), u(t), t ]dt

0

+F0 (x(T),T) ^ max,

+

(43)

u

v

*

u =u

v

v

v

зв’язками між змінними стану процесу х(:) і керуючими впливами и(ї) у формі диференціальних рівнянь

& = /V(х(0,u(t),t);У = ( 1,п ) (44)

й обмеженнями виду

х(0 єVx;и^) єVu, (45)

накладеними у кожний момент t на х і на и. Множини допустимих значень Vx та Vu можуть залежати від t. Від (класичної) задачі оптимального керування (1)-(3) поставлена задача відрізняється обмеженістю не тільки керувань, але і станів.

Введемо у розгляд довільну диференційовану функцію ф(х, і) , для котрої, як і для усякої подібної функції, є справедливою рівність

Т

I = І &х, і)Л = ф(х(Т), Т) - ф(х(0), 0), (46)

і сформуємо допоміжну задачу

Л T

S = ||^ f0( x, u, t) + &(x, t)J dt +F0(x(T), T) +

0

ф(x(0),0) -ф(x(T),T) ^ maxi.

xeVx

(47)

де фх =^-дФ / (х, и, і) . Якщо тепер у функ-

V дxv

л

ціонал % підставити замість ф&х(і), і) праву частину (49), тоді отриманий функціонал (позначимо його %)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

stj

f0(x,u, t) + фг (x, t) + +Фх (x, t) • f (x, u, t)

‘ +

(50)

+F0 (x(T), T) + ф( x(0), 0) - ф( x(T), T)

буде дорівнювати критерію оптимальності вихідної задачі І (43) лише для таких х(і) і и(і), які зв’язані одне з одним рівняннями (44), оскільки тільки для них сума двох останніх складових у підінтегральному виразі % дорівнює ф(х, і).

Визначимо множину допустимих розв’язків вихідної задачі (43)-(45) через D, а множину допустимих розв’язків, що виділяється умовами (45), - через V. Функціонал % дорівнює І на D, тому [7] максимум функціоналу % на V не менше, ніж максимум І* функціоналу І на D

max S% max I = I *.

yeV yeD

(51)

Рівність досягається тоді, коли максимум % на V виявляється у точці у* = (х*, и*), що належить D.

Функціонал ^ у цій задачі у силу (46) дорівнює функціоналу І, тому задача (47) є еквівалентною безумовній оптимізації І по х й по и як по незалежних змінних із урахуванням тільки автономних обмежень (45). Задача про безумовний максимум функціоналу зводиться до вимог

y *(t) = (x *(t), u *(t)) =

= arg max { f0( x, u, t) + &(x, t)};

ysV * *

x *(0) = arg max ф(x(0), 0); x * (T) = (48)

x(0)eVx

= arg max [F0 (x(T),T) - ф(x(T),T)].

x (T Wxl

Уточнімо тепер вид похідної ф&х(і), і), обчислюючи її вподовж рівнянь системи (44)

, t) = Фt (x, t) + фx (x, t) • f (x, u, t), (49)

Наведені міркування є основою достатніх умов оптимальності розв’язку задачі (43)-(45), які сформульовано В.Ф. Кротовим [8] (в усякому разі, є обґрунтуванням вказаних умов).

Теорема В.Ф. Кротова зводиться до такого: якщо існує така функція ф(х, і), неперервна за сукупністю аргументів і така, що має неперервні частинні похідні по х і і для всіх і, за виключенням, можливо, скінченної кількості перерізів ї=const простору (х, і), і що

1) підінтегральний вираз функціоналу % (функція Кротова)

R= f0( x, u, t) + фt (x, t) +

n

+IФxv (t) • f (^U, t)

V=1

0

0

досягає максимуму по х і по и як по незалеж-нихм зміннихм при х = х * (і); и є и *(і) при майже всіх і є (0, Т);

2) початкове й кінцеве значення х задовольняють вимогам

х *(0) = ащ тах ф(х(0),0);

х(0)єКх

х * (Т) = аг§ тах

х(Т Єх

*0( х(Т ),Т) --ф( х(Т ),Т)

(53)

3) пара (х * (И), и * (И)) є D, тобто є допустимою за умовами вихідної задачі, тоді розв’язок х *(0, и *(И) є оптимальним розв’язком задачі (43)-(45).

В умовах теореми В.Ф Кротова нічого не сказано про те, яким чином знайти функцію ф(х, t), що забезпечує попадання на множину D пари х *(И) , и *(И), для якої функціонал & досягає безумовного екстремуму. Обмеження, накладені на функцію умовами теореми В.Ф. Кротова, є досить слабкими, тому для її вибору залишається багато свободи. Тому не менш важливим, ніж сама теорема, є конструктивні шляхи вибору функції ф , що задовольняє умовам вказаної теореми.

Вибір ф(х, И) здійснимо з умови, щоб максимум функції Кротова по и не залежав від х. У цьому випадку % досягає максимуму по х і по и як по незалежних змінних при и(И) = и * для довільних функцій х(И) . Адже незалежну від х функцію можна вважати за довільних х максимальною, як, до речі, й мінімальною по х. Таким чином, як х *(И) можна прийняти розв’язок рівнянь (44), отриманий при підстановці у них и * (И, х).

Вимога незалежності від х максимуму функції ^по и має вигляд

тах

иєУи

/0(х, и, t) + ф, (х, И) +

+фх (х, t) • /(х, и, t)

= С (И), (54)

де С(і) - деяка функція часу. Цю функцію можна прийняти рівною нулю, оскільки якщо для деякої С (і) знайдеться функція ф0, що задовольняє рівнянню (54), тоді знайдеться і функція

ф(х, И) = ф0(х, И) -1С(т)Лт,

(55)

що, у свою чергу, задовольняє аналітичному рівнянню, права частина котрого дорівнює нулю. Якщо врахувати це міркування, а також той факт, що друга складова у (54) не залежить від и, отримаємо для розрахунку ф(х, И) рівняння

фИ (х, t) = тах

/0(х,и, и ) +

+фх (х, И) • / (х, и, И)

(56)

У процесі розв’язання цього рівняння поряд з ф(х, і) отримаємо й и *(х, і) - оптимальне керування як функцію часу і і змінних стану х.

Рівняння (56) було отримано Р. Беллманом із принципу оптимальності й називається рівнянням Беллмана. На жаль, розв’язати рівняння Беллмана аналітично вдається достатньо рідко!

Якщо функцію ф(х, і), яка задовольняє (56), знайдено, тоді першу з умов теореми Кротова виконано. Для виконання другої умови ф(х, і) обирають так, щоб різниця F(х(Т), Т) - ф(х(Т), Т) не залежала від х(Т)

і для всіх Т перетворювалась у нуль, а функція ф(х(0), 0) не залежала від х(0) . Таким чином, для ф(х(Т), Т) маємо

ф( х(Т), Т) = F (х(Т), Т).

(57)

Незалежність від х(Т) й від х(0) гарантує максимум за цими змінними.

У рівнянні Беллмана (56) ніде не фігурує множина Ух . Якщо вона є необмеженою, тоді розв’язок рівняння (44), знайдений після підстановки у них и * (х, і), отриманого з (56), є допустимим. Якщо ж Ух є обмеженою, тоді функцію /0(х, и, і) можна вважати за межами Ух достатньо великою за модулем і від’ємною, що приведе до попадання оптимального розв’язку у допустиму область. Тим самим третю умову теореми Кротова також виконано.

Функція Беллмана ф(х, і) являє собою те максимальне значення функціоналу І, яке можна отримати, якщо початковий стан співпадає з точкою х, а час (тривалість) про-

0

цесу відраховується від моменту t; u * (x, t) є тим оптимальним керуванням, яке є необхідним для використання у момент t, якщо система опинилась у стані х.

Розв’язок рівняння Беллмана значно ускладнюється тією обставиною, що він має у своєму складі операцію максимуму. За чисельного розв’язування зазвичай переходять від дискретної задачі із заміною частинних похідних відповідними різницями (різницевими схемами). Оскільки крайові умови (57) для ф задано у кінці інтервалу, то розрахунок здійснюють рухаючись від t = T до t = 0. Підкреслимо, що, як і для багатостадійних процесів, розв’язок у формі синтезу дозволяє побудувати керуючий пристрій, на входи котрого подаються сигнали з датчиків, що вимірюють стан об’єкта х, а виходом є керування u.

Розглянемо задачу з критерієм

т

I = -|(УЛ2 +Y2x22 +Y1u2)dt* ^max (58)

| %&dt | a&dt

-; y 2 _-

-; Y3 = 1(61)

| F(t)&dt | F(t)&dt

Звичайно, значення вагових коефіцієнтів може бути обрано з інших (наприклад, експертних) міркувань.

Рівняння Р. Беллмана для даної задача запишеться як

фt = -max T-Y1x12 - Y2x22 -Y3u2 +

u<eVu L

+фч & + фx2(ax2 + cx1 + bu) J.

(62)

Оскільки обмеження на керування и відсутні й вираз, котрий стоїть у квадратних дужках, є опуклим за и, знайдемо и * (х, і) з умови стаціонарності цього виразу

u *(^ t) = + x, t)

2Y 3

(63)

та рівняннями зв язків

& = x2; & = ax2 + cx1 + bu;

*1(0) = x^; x2(0) = x20.

(59)

%_ T„

Tm

Задача має зміст, що полягає в оптимізації перехідного процесу (пуску) протягом

( % ї

, а и - керування крано-

1 пуску у

вою системою. У даному випадку остання є лінійною системою другого порядку на відрізку И* є [0, 1]. Щодо вагових коефіцієнтів у1, у2, у3 наведено нижче такі міркування.

Нехай пуск кранової системи адекватно моделює наступна модель (дискретна) із зосередженими параметрами

а& + % _ F (t),

(60)

де М - еквівалентна маса кранової системи; а - коефіцієнт в’язкого тертя; % - жорсткість вказаної системи; F(і) - сила (керування), яка залежить від часу; х1 (і) - змінна стану кранової системи (наприклад, відхилення її центру мас від положення рівноваги). Тоді коефіцієнти у1, у2, у3 можна обрати з енергетичних міркувань

і підставимо u * (x, t) у (62)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ф = Y1x12 + Y2 x22 -фЧ x2 -

-^2(ax2 + cx1) - ф22.

2 4Y 3 2

(64)

Ми дійшли до диференціального рівняння у частинних похідних звичайного типу, в якому немає операції максимуму. Одним зі способів розв’язку таких рівнянь є задання виду очікуваного розв’язку з точністю до коефіцієнтів із наступним їх визначенням. Задамо ф(х, і) у формі

ф( x, t) = Ax\ + 2 Bx1x2 + Cx22

(65)

й підставимо у (64). Прирівнюючи коефіціє-

2 2 • • ~ нти при х1 , х2, х х2 у лівій та правій частинах отриманого виразу, знайдемо

B _-2CYl + J4c2Y2 , Y1Y3

^2 - >2 I n 1.4 "5 г.2

, 1/2

3bl

9b 3b

(66)

1/2

C1,2 _- 2aY3 i^ - (. ;(67)

3b2

9b4

3b2

A _ -Ba - cC - 3fBc.

2Y3

0

0

0

0

0

Зрозуміло, що два значення С12 відповідають певному значенню В (В1 чи В2). Тому,

враховуючи, що В має два значення, С має чотири значення, а А - вісім різних значень.

Отже у загальному випадку маємо

2сІ3

3b2

4c 2УІ + Y1Y3

3b

; i - (1,2); (69)

C = _ 2073 І 4a2y32 _ (4B. -Y2 )Y3

1/2

J ^U2

3Ь I 9b4 3b2 I (70)

J - (1,4 );

Ak = _cCj _ Bi

v

2Y

;k - (1,8). (71)

/

Зрозуміло, що коефіцієнти B. , Cj , Ak є дій-

сними числами, тому

4а 2Y32 (4B. _ Y2 )Y3

9b4

3b2

> 0.

(72)

Підставляючи ф у вираз для u

■- (x, t) - +—ГBx1 + Cx21 = — ГBx1 + Cx&] .(73)

Y3 Y3

Початкове значення х(0) задано. Тому, підставляючи и * (х, И) у рівняння зв’язків (59), отримаємо х *(И), яке, завдяки відсутності обмежень на х, є допустимим, а за теоремою В.Ф. Кротова - оптимальним. Зазначимо, що оптимальний розв’язок у формі синтезу (73) лінійно залежить від змінних стану (х1, &), тобто оптимальним регулятором у даній задачі виявляється лінійний регулятор руху кранової системи.

Висновки

Приведений аналіз варіаційних методів оп-тимізації та оптимального керування нестаціонарних коливань механічних (кранових) систем дозволив сформулювати алгоритм пошуку оптимальних розв’язків щодо перехідного процесу (пуску) в межах моделі лінійного об’єкта другого порядку на відрізку

часу И є [0,ТпуСК].

Використання підходу В.Ф. Кротова та рівняння Р. Беллмана дозволило встановити основні параметри: а) лінійного регулятора руху кранової системи; б) оптимального динамічного стану системи в режим її пуску.

Отримані у роботі результати можуть бути надалі використані для уточнення й удосконалення існуючих інженерних методів розрахунку оптимальних параметрів пуску кранових систем як у процесах їх проектування/ конструювання, так і у режимах реальної експлуатації сучасних вантажопідйомних кранів, оснащених мехатронними системами керування рухом.

Література

1. Математическая теория оптимальных про-

цессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко.

- М.: Физматгиз, 1961. - 360 с.

2. Уальд Д.Д. Методы поиска экстремума /

Д.Д. Уальд. - М: Наука, 1967. - 218 с.

3. Численные методы условной оптимизации

/ под ред. Ф. Гилла, У. Мюррея. - М.: Мир, 1977. - 318 с.

4. Поляк Б.Т. Введение в оптимизацию /

Б.Т. Поляк. - М.: Наука, 1983. - 384 с.

5. Первозванский А.А. Декомпозиция, агре-

гирование и приближенная оптимизация / А.А. Первозванский, В.Г. Гайцгорн. -М.: Наука, 1979. - 365 с.

6. Цирлин А.М. Вариационные методы оп-

тимизации управляемых объектов / А.И. Цирлин, В.С. Балакирев, Е.Г. Дудников. - М.: Энергия, 1976. - 448 с.

7. Цирлин А.М. Оптимальное управление

технологическими процесами / А.М. Цирлин. - М.: Энергоатомиздат, 1986. -400 с.

8. Кротов В.Ф. Методы и задачи оптималь-

ного управления / В.Ф. Кротов, В.И. Гурман. - М.: Наука, 1973. - 389 с.

9. Брайсон А. Прикладная теория оптималь-

ного управления / А. Брайсон, Хо-Ю-Ши.

- М: Мир, 1972. - 389 с.

Рецензент: О.В. Григоров, професор, д.т.н.. ХНАДУ.

Стаття надійшла до редакції 7 травня 2012 р.

*

u

i Надоели баннеры? Вы всегда можете отключить рекламу.