Научная статья на тему 'Метод случайных покрытий для задачи оптимального управления'

Метод случайных покрытий для задачи оптимального управления Текст научной статьи по специальности «Математика»

CC BY
336
99
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / ГЛОБАЛЬНЫЙ ЭКСТРЕМУМ / МЕТОД ПОКРЫТИЙ / ЛИПШИЦЕВА ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ / OPTIMAL CONTROL PROBLEM / GLOBAL EXTREMUM / METHOD OF COVERINGS / LIPSCHITZ GLOBAL OPTIMIZATION

Аннотация научной статьи по математике, автор научной работы — Горнов Александр Юрьевич, Зароднюк Татьяна Сергеевна

Рассматривается алгоритм поиска глобального экстремума в задаче оптимального управления, основанный на идее покрытия множества достижимости разновеликими шарами. Предложенный алгоритм включает метод генерации случайных допустимых управлений и встроенные механизмы оценки константы Липшица целевого функционала. Приводятся результаты вычислительных экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The method of stochastic coverage for optimal control problems

An algorithm for finding the global extremum in an optimal control problem, based on the idea of coverage of the reachable set with spheres of the same dimension, is considered. The proposed algorithm includes the method designed for generation of admissible stochastic controls, as well as embedded mechanisms for assessing the Lipschitz constant for the target functional. Results of computational experiments are presented.

Текст научной работы на тему «Метод случайных покрытий для задачи оптимального управления»

Вычислительные технологии

Том 17, № 2, 2012

Метод случайных покрытий

для задачи оптимального управления*

А. Ю. Горнов, Т. С. Здроднюк Институт динамики систем и теории управления СО РАН, Иркутск, Россия

e-mail: [email protected], [email protected]

Рассматривается алгоритм поиска глобального экстремума в задаче оптимального управления, основанный на идее покрытия множества достижимости разновеликими шарами. Предложенный алгоритм включает метод генерации случайных допустимых управлений и встроенные механизмы оценки константы Липшица целевого функционала. Приводятся результаты вычислительных экспериментов.

Ключевые слова: задача оптимального управления, глобальный экстремум, метод покрытий, липшицева глобальная оптимизация.

Введение

Поиск глобального экстремума функционалов, определенных на траекториях динамических систем, остается на сегодня одной из сложнейших экстремальных задач. В теории оптимального управления пока не найдено подходов, гарантирующих получение глобально оптимального решения для нелинейных систем, на основе которых возможно построение эффективно работающих алгоритмов. Применение прямых методов редукции к конечномерным задачам приводит к появлению аппроксимативных задач математического программирования, включающих сотни и тысячи переменных. Даже поиск локального экстремума для задач таких размерностей в ряде случаев представляет серьезную проблему, исследование же на глобальный экстремум может оказаться малореальным и на практике потребовать астрономических затрат процессорного времени с использованием самых современных суперкомпьютеров. По классификации, предложенной недавно Ю.Г. Евтушенко, задачи поиска глобального экстремума многоэкстремальной функции размерностью 200-300 переменных должны считаться сверхтрудными [1].

В теории глобальной оптимизации методы принято условно разделять на "математические, рациональные", основанные на конкретной модели целевой функции, и "эвристические" — все остальные (см., например, [2, с. 18]). Заметим, что отношение многих специалистов к эвристическим методам в последние десятилетия существенно изменилось: "некогда презренные, а ныне весьма респектабельные" ("heuristic methods: once scorned, now highly respectable") [3, с. 21; 4]. "Окончательным судьей" в данной многолетней дискуссии, очевидно, будет выступать практика применения методов при решении сложных прикладных задач.

* Работа выполнена при финансовой поддержке РФФИ (гранты № 12-01-00193 и 10-01-00595) и Междисциплинарного интеграционного проекта СО РАН № 83.

Одними из наиболее надежных математических методов для конечномерных задач считаются методы покрытий, в основе конструкции которых лежит гипотеза об ограниченности скорости роста оптимизируемой функции (см., например, [1, 2, 5-7]). Чаще всего эта гипотеза формализуется в виде оценок констант Липшица функции или ее производных. Построенные с применением такого подхода алгоритмы хотя и требуют значительных вычислительных затрат, справедливо относятся к наиболее надежным, гарантирующим получение оптимальных решений.

В приведенной выше терминологии все известные к настоящему времени алгоритмы поиска глобального экстремума в нелинейных задачах оптимального управления: методы генетического поиска (см., например, [8, 9]), методы случайного мультистарта [10], методы овыпуклений [11], методы стохастических аппроксимаций множества достижимости [12], методы "криволинейного поиска" [13] и др., следует считать эвристическими. По мнению авторов, к настоящему времени не получено теоретических результатов, которые могли бы стать идеологическим базисом для построения гарантированных алгоритмов поиска оптимального управления. Тем не менее проблема достижения гарантий, а точнее, повышения надежности вычислений (уменьшения "степени эвристичности") остается актуальной.

В работе рассматривается эвристический метод поиска глобального экстремума в задаче оптимального управления, основанный на идее покрытия множества достижимости п-мерными шарами, включающий встроенные механизмы оценки константы Липшица целевого функционала.

1. Постановка задачи

Управляемый процесс описывается системой обыкновенных дифференциальных уравнений с начальными условиями

х = f(х(г),и(г),г), х(г0) = х0, (1)

где Ь — время из интервала [¿0,Ь1], х(Ь) = (х1(Ь),х2(¿),... , хп(¿)) — вектор фазовых координат, и(Ь) = (и1(Ь),и2(Ь),... ,иг(¿)) — вектор управляющих воздействий. Вектор-функция f (х(Ь),и(Ь),Ь) предполагается непрерывно дифференцируемой по всем аргументам, кроме ¿. Допустимыми будем называть кусочно-непрерывные управляющие функции и(Ь) для любых значений времени ¿, принадлежащие множеству и, где

и = {и(Ь) е Мг : п < и(Ь) < ид}, (2)

П1,Пд е — векторы нижнего и верхнего ограничений на управление. Задача оптимального управления в стандартной постановке состоит в поиске допустимого управления и* (¿), доставляющего минимум терминальному функционалу

I (и) = ф(Ь)). (3)

Терминальная функция '-р(х) предполагается липшицевой.

2. Основной алгоритм

Построение метода покрытий в полном соответствии с традицией сводится к генерации последовательности пробных точек и соответствующей последовательности множеств,

объединение которых должно покрыть множество достижимости. Однако в отличие от задачи безусловной оптимизации генерируемые квазислучайные пробные точки строятся в пространстве управлений, а покрывающие множества — в терминальном фазовом пространстве. Основной задачей алгоритма является полное покрытие множества достижимости системы. В качестве элементарных покрывающих множеств выбраны шары В (Я, и) в п-мерном евклидовом пространстве, где Я — радиус шара, и — управление, для которого конец соответствующей траектории является центром шара. На итерациях с набором информации о задаче уточняется и оценка константы Липшица. Для повышения надежности покрытия вводится, как и в классических работах (см., например, [14]), "страховочный коэффициент" К8, кратно увеличивающий значение оценки константы Липшица. Последовательность рекордов при этом получается монотонно убывающей. Однако суммарный объем покрытия может на итерациях как увеличиваться — при появлении новых покрывающих шаров, так и уменьшаться — при увеличении оценки константы Липшица. Работа алгоритма разбивается на итерации, на каждой из которых генерируется заданное количество пробных точек. На итерации подсчитывается число пробных точек, попавших в уже построенные шары покрытия, а также число новых проб, в шарах которых могут находиться точки, меньшие текущего рекорда. Эти характеристики могут служить эвристическими критериями окончания процесса поиска. Традиционно задается "точность по функционалу" е^. Таким образом, генерируемое алгоритмом покрытие состоит из разновеликих шаров, размер каждого из которых зависит от значения функционала в пробной точке, текущей оценки константы Липшица и величины е^: радиус шара Я3 = (13 — /дес + е^)/(К ' Ь), ] = 1, Мх, где /дес — текущее рекордное значение, Мх — число шаров в покрытии.

Алгоритм 1.

0. Задаются алгоритмические параметры:

М — число пробных точек на итерации,

Мтах — максимальное число проб,

Ь0 — начальное значение оценки константы Липшица, — "точность по целевому функционалу",

К — "страховочный коэффициент".

1. Задается рекордное значение /дес = полагается оценка константы Липшица Ь = Ь0, задается пустое начальное покрытие Х0, Мх = 0, полагается к =1.

2. На к-й итерации генерируется М пробных точек {и1,... , им}.

3. Для всех и3 интегрируется прямая система дифференциальных уравнений, запоминаются х3 (¿1), ] = 1,М.

4. Для всех х3 (¿1) вычисляются значения целевого функционала /3, ] = 1, М.

5. Улучшается рекордное значение, если 3] : /3 < /дес, /дес = /3, ] = 1, М.

6. Вычисляется Му — число проб на итерации, не попавших ни в один из уже имеющихся в покрытии шаров.

7. Вычисляется Мч — число проб, в шаре которых возможно улучшение рекордного значения: /3 < /дес + е^, ] = 1, М.

8. Для всех х3 (¿1) вычисляются локальные оценки константы Липшица в сравнении с пробами, уже имеющимися в покрытии Ь3 = К3 ■ |/3 — /г| / ||х3(¿1) — хг(^1)|, где ] = 1, М, г =1, Мх, выбирается наибольшая оценка.

9. Уточняется оценка константы Липшица, если 3] : Ь3 > Ь, Ь = Ь3, ] = 1, М.

10. Полагается Хк+1 = Хк и {В (Я3, и1),..., В (Я3, им)}, Мх = Мх + М.

Итерация закончена.

Число итераций алгоритма 1 зависит от заданного значения алгоритмического параметра Мтах.

3. Алгоритм генерации пробных управлений

Для получения квазислучайных допустимых управлений, позволяющих строить внутреннюю аппроксимацию множества достижимости, в работе [10] были предложены алгоритмы генерации релейных, кусочно-линейных, табличных и сплайн-функций. С учетом полученного ранее вычислительного опыта представлен новый алгоритм генерации функций релейного типа, позволяющий случайным образом получать различное число точек переключения. При этом математическое ожидание числа точек переключения управлений, последовательно генерируемых на итерациях алгоритма, равно априори заданному алгоритмическому параметру.

Зададим сетку дискретизации по времени из N узлов Т = {¿0 = т0 < т1 < ... < тN = ¿1}. Обозначим через Б очередное квазислучайное число, равномерно распределенное в интервале [0,1], генерируемое стандартным алгоритмом иИАЫВ [15].

Алгоритм 2.

0. Задается алгоритмический параметр Кр — рекомендуемое число переключений управления.

1. Вычисляется значение "уровня вероятности переключения" Рр = Кр— 1).

2. Для ¿-компоненты вектора управлений, г = 1,г, выполняется:

если Б < 1/2, полагается щ(Ь0) = (щ)^, иначе щ(Ь0) = (ид

3. Для ]-го узла сетки Т, ] = 1, N, выполняется:

если Б < Рр, полагается щ(т^) = щ(т^-1) (на интервале [т^-1,т^] нет переключения), иначе

если и1(т^-1) = (и{)г, то полагается щ(т^) = (ид)г,

если щ(т^-1) = (ид)г, то полагается щ(т^) = (щ)г (на интервале [т^-1,т^] есть переключение).

Алгоритм закончен.

4. Критерии остановки алгоритма

Критерий остановки алгоритма может опираться на полученные на очередных итерациях значения Му. Ясно, что чем реже новые пробные точки попадают в еще непокрытую часть множества достижимости, тем меньше вероятность того, что глобальный экстремум еще не найден. Дополнительным критерием оценки качества полученного решения может быть число проб на итерации Мч, недалеко от которых возможно в принципе улучшение рекордного значения функционала. При нулевых значениях указанных величин в течение заданного числа последних итераций можно принимать решение об окончании работы алгоритма.

5. Режимы работы алгоритма. Алгоритмические параметры

Эффективность работы алгоритма весьма существенным образом зависит от параметра Кр. Для получения приемлемой аппроксимации множества достижимости и, следовательно, успешной работы алгоритма число рекомендуемых точек переключения Кр не

Таблица 1. Результаты вычислительных экспериментов (см. ниже тестовую задачу 1), отражающие работу метода в различных режимах

Алгоритмический Обычный Режим ограниченной Режим без оценки Режим без

параметр режим оценки константы Липшица константы Липшица покрытия

Число точек стоха-

стической аппрокси-

мации за один шаг

метода 500 500 500 500

Максимальное число

проб 10000 10000 10000 10000

Число проб с оцен-

кой константы Лип-

шица 10000 2000 0 0

Рекордное значение

функционала -42.46458 -42.46458 -42.46458 -42.46458

Оценка константы

Липшица 14.093 14.093 — —

Процессорное время

решения задачи (с) 120 96 95 93

должно быть ни слишком малым, ни слишком большим. При малом числе Кр алгоритм не сможет построить достаточно представительный набор пробных управлений, при большом Кр пробные точки на множестве достижимости могут сгущаться в одной локальной области. В обоих случаях аппроксимация множества достижимости будет недостаточно корректной. На основе вычислительного опыта по умолчанию рекомендуется Кр = 5. Для повышения надежности работы алгоритма имеет смысл произвести расчеты с различными Кр Е [2,10].

Выше описан полный режим работы алгоритма. Во многих случаях целесообразно иметь возможность экономии времени вычислений, что выполняется при других режимах работы алгоритма. В настоящее время реализованы следующие варианты технологии.

Режим ограниченной оценки константы Липшица. В данном режиме вычисления оценок константы Липшица проводятся только на указанном числе начальных итераций (М0 — алгоритмический параметр). Во многих случаях за это время алгоритм успевает получить хорошую оценку, которая в дальнейшем не улучшается, а время вычислений существенно увеличивается с ростом размера базиса пробных точек.

Режим без оценки константы Липшица. Применение этого режима разумно в случае, когда оценка константы уже априори известна, например, при линейном терминальном функционале.

Режим без покрытия. В данном режиме имеет место полная экономия времени на промежуточных вычислениях, но рассматриваемый метод превращается в обычный метод сеток [12].

Результаты вычислительных экспериментов, проведенных в различных режимах работы алгоритма, отражены в табл. 1. Во всех случаях получено одно и то же значение целевого функционала.

6. Вычислительные эксперименты

Расчеты проводились на задачах из тестовой коллекции [16] с использованием персонального компьютера с характеристиками: Intel Core 2 Quad CPU Q8200 @ 2.33 GHz. Приведем несколько многоэкстремальных примеров с невыпуклыми множествами достижимости. Выбирались следующие значения алгоритмических параметров: число пробных точек на итерации M = 500, максимальное число проб Mmax = 10000, начальное значение оценки константы Липшица L0 = 0, "точность по целевому функционалу" £v = 0.1, "страховочный коэффициент" Ks = 2.

6.1. Тестовая задача 1 [17]

Рассмотрим многоэкстремальную задачу оптимального управления, в которой динамический процесс описывается системой уравнений x1 = esinХ2, X2 = u — cos xi. Траектория в начальный момент времени зафиксирована x1(0) = x2(0) = 1, на интервале t Е [0, 5] необходимо найти программное управление u(t), удовлетворяющее ограничениям |u(t)| < 1 и доставляющее минимум функционалу I(u) = x1(t1) • x2(t1) ^ min. Глобальный минимум (—42.46458) достигается в точке (x1(t1), x2(t1)) = (9.26586, —4.58345), локальный (—13.98914) — в точке (x1(t1),x2(t1)) = (12.52900, —1.11654). Множество достижимости, оптимальные траектории и управление в рассмотренной задаче оптимального управления (ЗОУ) представлены на рис. 1.

Значение константы Липшица L, полученное на 20-й итерации метода покрытий, равно 14.093. При этом число проб на данной итерации, не попавших ни в один из уже имеющихся в покрытии шаров, — My и число проб, в шаре которых возможно улучшение рекордного значения, — Mq, равны нулю (табл. 2). Процесс покрытия множества достижимости отражен на рис. 2.

6.2. Тестовая задача 2 [13]

В следующей тестовой ЗОУ динамический процесс определен на интервале Т = [¿о, ¿1] = [0,2] и описывается системой нелинейных дифференциальных уравнений х 1 = х2,

5

8.0—I -t:

4.0-

0-

-4.0-

-8.0-

| | | | | | | | | | | | 0 6.0 8.0 10.0 12.0 14.0 16.0

12.0-1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8.0-

4.0-

0-

-4.0-

-8.0-

и, х

-1-1-1-1-1-1-1-1-1

0 1.0 2.0 3.0 4.0 5.0

a

Рис. 1. Множество достижимости и точки, в которых достигаются экстремумы (темный — глобальный, светлый — локальный) (а), оптимальное управление и соответствующие ему траектории в задаче 1 (б)

Таблица 2. Результат работы программной реализации метода покрытий (20 итераций) для решения тестовой задачи 1

Номер Рекордное Оценка Число пробных Номер My Mq t, c

итерации значение функционала константы Липшица точек на итерации лучшей пробы

1 —42.33596 13.677 500 279 29 11 0.1

2 —42.33596 14.093 1000 279 0 0 0.2

3 —42.33596 14.093 1500 279 5 0 0.4

4 —42.33596 14.093 2000 279 3 0 0.6

5 —42.33596 14.093 2500 279 1 0 0.8

6 —42.33596 14.093 3000 279 1 0 1.0

7 —42.33596 14.093 3500 279 0 0 1.2

8 —42.41551 14.093 4000 3755 1 1 1.5

9 —42.41551 14.093 4500 3755 1 0 1.8

10 —42.41551 14.093 5000 3755 1 0 2.1

11 —42.41551 14.093 5500 3755 1 0 2.5

12 —42.41551 14.093 6000 3755 0 0 2.9

13 —42.41551 14.093 6500 3755 0 0 3.3

14 —42.41551 14.093 7000 3755 1 0 3.7

15 —42.41551 14.093 7500 3755 2 0 4.1

16 —42.41551 14.093 8000 3755 1 0 4.6

17 —42.41551 14.093 8500 3755 1 1 5.1

18 —42.46458 14.093 9000 8869 1 1 5.6

19 —42.46458 14.093 9500 8869 2 1 6.1

20 —42.46458 14.093 10000 8869 0 0 6.7

8.0 п Л"2

4.0-

8.0 и х2

-4.0-

-8.0-

4.0

8.0

12.0

—^ -8.0--

16.0 4.0

8.0-

4.0-

-4.0-

-8.0-

8.0

*2

12.0

4.0

8.0

12.0

16.0

Рис. 2. Покрытие множества достижимости в задаче 1: a — 100, б — 500, в — 1000 шаров

a

в

Х2 = — 2xi — 3x2 — 2/п ■ arctan(5x2) ■ e-x2 + u — sin(15xi). Терминальный критерий качества в этой задаче выглядит следующим образом: I(u) = 2x1 (t1) — 1.05x|(t1) + Xi(t1)/6 — x1(t1)x2(t1) + ^2(t1) + 1 ^ min. Поиск траектории, берущей начало в точке (xi(to), x2(t0)) = (—1, — 1) и минимизирующей приведенный функционал, осуществляется по всем допустимым управлениям u(t) из множества U = [—10,10]. Глобальный минимум I*(u) = 1 достигается в точке (0.000015, 0.000011) при оптимальном управле-

4.0—, х2

2.0-

0-

-2.0-

-4.0-

8.0-, и. х

-4.0 -2.0

2.0 4.0

Рис. 3. Множество достижимости и точки, в которых достигаются экстремумы (темный — глобальный, светлый — локальный) (а), оптимальное управление и соответствующие ему траектории в задаче 2 (б)

4.0 п х-,

-\v о •-V- о

2.0-

О

О

"о О

-2.0-

О

5

4.0П х2

2.0-

-2.0-

4.0П х2

2.0-

-2.0-

X, Xi Xi

-4.0--,-1-,-,-,- -4.0--,-1-,-1-1-1 -4.0--,-,-1-,-1-,-1

-4.0 -2.0 0 2.0 4.0 -4.0 -2.0 0 2.0 4.0 -4.0 -2.0 0 2.0 4.0

а

а

в

Рис. 4. Покрытие множества достижимости в задаче 2: а — 100, б — 1000, в — 10000 шаров

нии системой, приведенном на рис. 3, б. Результат покрытия множества достижимости на разных итерациях и ход вычислительного процесса решения тестовой задачи 2 представлены на рис. 4 и в табл. 3.

6.3. Тестовая задача 3

Для описания динамического процесса в модельной задаче 3 используется система xXi = x2 — xf + ui, X2 = л/3 — ui + sin;ti, определенная на интервале T = [0, 2]. Заданы начальный фазовый вектор и ограничения на управление Xi (to) = x2(t0) = 0, |u1| < 1, при которых необходимо минимизировать линейный функционал I(u) = x1(t1) ^ min. Множество достижимости и этапы его покрытия шарами разного диаметра приведены на рис. 5 и 6. Результаты численного решения задачи, выполненные с помощью программной реализации метода покрытий, представлены в табл. 4.

Во всех рассмотренных задачах получены управления, близкие к известным оптимальным решениям. В первой задаче, как видно из табл. 2, алгоритму за указанное количество задач Коши (проб) удалось построить достаточно хорошее покрытие

Таблица 3. Результат работы программной реализации метода покрытий (20 итераций) для решения тестовой задачи 2

Номер Рекордное Оценка Число пробных Номер Му Мд с

итерации значение функционала константы Липшица точек на итерации лучшей пробы

1 1.01312 228.010 500 359 475 14 0.1

2 1.00198 258.990 1000 955 480 5 0.3

3 1.00198 258.990 1500 955 468 1 0.5

4 1.00198 258.990 2000 955 461 5 0.7

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 1.00198 264.530 2500 955 452 6 1.0

6 1.00198 264.530 3000 955 457 9 1.3

7 1.00198 264.530 3500 955 453 9 1.7

8 1.00198 264.530 4000 955 452 4 2.0

9 1.00198 264.530 4500 955 426 3 2.5

10 1.00198 264.530 5000 955 443 6 2.9

11 1.00198 264.530 5500 955 439 3 3.4

12 1.00198 264.530 6000 955 426 5 4.0

13 1.00198 264.530 6500 955 421 7 4.5

14 1.00198 264.530 7000 955 438 6 5.1

15 1.00198 264.530 7500 955 431 3 5.8

16 1.00198 264.530 8000 955 438 5 6.5

17 1.00198 264.530 8500 955 427 7 7.2

18 1.00198 269.790 9000 955 396 1 8.0

19 1.00198 269.790 9500 955 412 9 8.7

20 1.00198 269.790 10000 955 420 3 9.5

4.2—1

4.0-

3.8-

3.6-

3.4-

3.2-

и, х

1.2

1.4

1.6

1.8

2.0

-2.0

Рис. 5. Множество достижимости и точки, в которых достигаются экстремумы (темный — глобальный, светлый — локальный) (а), оптимальное управление и соответствующие ему траектории в тестовой задаче 3 (б)

а

множества достижимости, при этом количество проб, попадающих в еще непокрытую часть множества достижимости, к завершению вычислений не превышает 0.4 %. Можно утверждать, что тестовая задача 1 решена с высокой степенью надежности. Во второй задаче (см. табл. 3) размер покрывающих шаров невелик, поскольку оценка константы

Липшица значительно выше. Для уверенности в полученном результате целесообразно продолжить расчет с большим количеством проб. Третья задача может служить примером успешного решения по типовому сценарию: оптимальное значение получается быстро (за 72 пробы) и в дальнейшем ресурсы алгоритма направляются на доказательство оптимальности решения.

1.2 1.4 1.6 1.8 2.0 1.2 1.4 1.6 1.8 2.0 1.2 1.4 1.6 1.8 2.0

Рис. 6. Покрытие множества достижимости в задаче 3: а — 100, б — 1000, в — 10000 шаров

Таблица 4. Результат работы программной реализации метода покрытий (20 итераций) для решения тестовой задачи 3

Номер Рекордное Оценка Число пробных Номер Му Мч г, с

итерации значение функционала константы Липшица точек на итерации лучшей пробы

1 1.35391 1.000 500 72 9 47 0.1

2 1.35391 1.000 1000 72 0 22 0.1

3 1.35391 1.000 1500 72 0 24 0.2

4 1.35391 1.000 2000 72 0 24 0.4

5 1.35391 1.000 2500 72 0 33 0.5

6 1.35391 1.000 3000 72 0 24 0.7

7 1.35391 1.000 3500 72 0 18 0.9

8 1.35391 1.000 4000 72 0 22 1.1

9 1.35391 1.000 4500 72 0 30 1.4

10 1.35391 1.000 5000 72 0 37 1.6

11 1.35391 1.000 5500 72 0 18 1.9

12 1.35391 1.000 6000 72 0 18 2.3

13 1.35391 1.000 6500 72 0 25 2.6

14 1.35391 1.000 7000 72 0 22 3.0

15 1.35391 1.000 7500 72 0 20 3.4

16 1.35391 1.000 8000 72 0 21 3.8

17 1.35391 1.000 8500 72 0 27 4.2

18 1.35391 1.000 9000 72 0 27 4.7

19 1.35391 1.000 9500 72 0 24 5.2

20 1.35391 1.000 10000 72 0 16 5.7

Таким образом, предложенный алгоритм позволяет повысить надежность поиска глобального экстремума в задаче оптимального управления и получить эвристические оценки вероятности достижения оптимального результата. Для получения более точных решений целесообразно дополнить вычислительную технологию алгоритмом уточнения локального экстремума. Простота алгоритма позволяет надеяться на несложную разработку его модификаций для параллельных вычислительных систем.

Список литературы

[1] Евтушенко Ю.Г., Половинкин М.А. Параллельные методы решения задач глобальной оптимизации // Труды IV Междунар. конф. "Параллельные вычисления и задачи управления". М., 2008. С. 18-39.

[2] Жиглявский А.А., ЖилинскАс А.Г. Методы поиска глобального экстремума. М.: Наука, 1991. 248 с.

[3] Zhigljavsky A., Zilinskas A. Stochastic Global Optimization. Springer Science-Business Media, 2008. 262 p.

[4] Torn A., Zilinskas A. Global Optimization. Springer, 1989. 225 p.

[5] Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982. 432 с.

[6] Strongin R.G., Sergeyev Ya.D. Global Optimization With Non-Convex Constraints: Sequential and Parallel Algorithms. Dordrecht: Kluwer Acad. Publ., 2000. 728 p.

[7] Сергеев Я.Д., Квасов Д.Е. Диагональные методы глобальной оптимизации. М.: Физ-матлит, 2008. 351 с.

[8] Floudas C.A., Gounaris C.E. A review of recent advanced in global optimization // J. Global Optimizat. 2009. No. 1. P. 3-38.

[9] Lopez Cruz I.L. PhD-Thesis: Efficient Evolutionary Algorithms for Optimal Control. Wageningen Univ., Netherlands, 2002. 122 р.

[10] Горнов А.Ю. Вычислительные технологии решения задач оптимального управления. Новосибирск: Наука, 2009. 279 с.

[11] Толстоногов А.А. Дифференциальные включения в банаховом пространстве. Новосибирск: Наука, 1986. 295 с.

[12] Gornov A.Yu., Zarodnuk T.S. Optimal control problem: Heuristic algorithm for global minimum // Proc. of the Second Intern. Conf. on Optimization and Control. Ulanbaatar, Mongolia, 2007. P. 27-28.

[13] Горнов А.Ю., Зароднюк Т.С. Метод "криволинейного поиска" глобального экстремума в задаче оптимального управления // Современные технологии. Системный анализ. Моделирование. ИрГУПС. 2009. № 3. С. 19-26.

[14] Стронгин Р.Г. Численные методы в многоэкстремальных задачах. Информационно-статистический подход. М.: Наука, 1978. 240 с.

[15] Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений. М.: Мир, 1980. 279 с.

[16] Gornov A.Yu., Zarodnyuk T.S., Madzhara T.I. et al. A collection of test multi-extremal optimal control problems // Springer Book. 2011 (in appear).

[17] Горнов А.Ю., Данеева А.В. Подход к исследованию невыпуклых задач оптимального управления с параллелепипедными ограничениями // Вестник Бурятского ун-та. Серия 13. Математика и информатика. Вып. 2. Улан-Удэ: Изд-во Бурятского гос. ун-та, 2005. C. 122-130.

Поступила в 'редакцию 26 апреля 2010 г., с доработки — 9 декабря 2011 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.