Научная статья на тему 'Технология поиска глобального экстремума в задаче оптимального управления'

Технология поиска глобального экстремума в задаче оптимального управления Текст научной статьи по специальности «Математика»

CC BY
453
38
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Зароднюк Татьяна Сергеевна, Горнов Александр Юрьевич

Предложена вычислительная технология поиска глобального экстремума в невыпуклой задаче оптимального управления, основанная на "конечномерных" алгоритмах и редукции исходной задачи к последовательности задач безусловной минимизации. Разработанный подход показал себя работоспособным при решении тридцати сложных невыпуклых нелинейных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Технология поиска глобального экстремума в задаче оптимального управления»

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

заключение отметим, что данный пример является иллюстративным и выбран в силу своей наглядности. Но и более сложные системы могут исследоваться по такой же схеме: выявление множества положений равновесия, выбор целевого множества и анализ неравенства (8).

Работа (частично) поддержана грантом РФФИ (проект № 06-01-00247), грантом президента РФ НШ-1676.2008.1 и грантом ИНТАС-СО РАН (проект № 06-100013-9019).

БИБЛИОГРАФИЯ

1. Пятницкий, Е.С. Синтез иерархических систем управления механическими и электромеханическими объектами на принципе декомпозиции. I, II - Пятницкий Е.С. // Автоматика и телемеханика. 1989. № 1. С. 87-98, № 2. С. 57-71.

2. Матросов, В.М. Аналитическая динамика систем твердых тел с трением - Финогенко И.А. ISBN 5-2121-0091-2 // В кн.: Нелинейная механика - М.: Физматлит, 2001. С. 39-61.

3. Матюхин, В.И. Универсальные законы управления механическими системами. М.: МАКС Пресс, 2001. 249 с.

4. Финогенко, И.А. О правосторонних решениях одного класса разрывных систем 1,2 -Финогенко И.А. // Автоматика и телемеханика. 2001. № 9. С149-158, № 11. С. 95-108.

5. Финогенко, И.А. О неявном доопределении и "правосторонних решениях" одного класса разрывных систем, возникающих в задачах управления механическими объектами - Финогенко И.А. // Автометрия. 2006. Т. 42. № 5. С. 73-82.

6. Finogenko, I.A. To the Control of the Lagrange Systems on the Basis of the Decomposition Principle - Finogenko I.A. // Proc. of the Second IASTED International Multi-Conference on Automation, Control and Infermation Technology, 2005. Novosibirsk, Russia, pp. 254-258.

7. Дыхта, В.А. Оптимальное импульсное управление с приложениями - Самсонюк О.Н. ISBN 5-9221-0352-0. М.: Физматлит, 2000. 255 с.

8. Филиппов, А.Ф. Дифференциальные уравнения с разрывной правой частью - Филиппов А.Ф. М.: Наука, 1985. 223 с.

9. Андронов, А.А. Теория колебаний - Витт А.А., Хайкин С.Э. М.: Наука, 1981. 568 с.

ЗароднюкТ.С., Горнов А.Ю.

УДК 519.652

ТЕХНОЛОГИЯ ПОИСКА ГЛОБАЛЬНОГО ЭКСТРЕМУМА В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

1. Введение.

Большинство известных алгоритмов поиска оптимального управления в нелинейных системах предназначены для нахождения только локального экстремума целевого функционала. Разработка методов исследования невыпуклых задач оптимизации динамических систем ведется многими специалистами, среди которых нельзя не отметить В.Ф. Крото-ва [1], Ю.Г.Евтушенко [2], А.С. Стрекаловского [3], В.А. Срочко [4], С.А. Floudas [5], I.L. Lopez-Cruz [6] и других. Но, по мнению многих авторитетных ученых, разработанные к настоящему времени методы поиска глобального экстремума в задаче оптимального управления

(ЗОУ) пока недостаточно развиты и не могут служить инструментом для эффективного решения практических задач. Проблема создания методов невыпуклой оптимизации динамических систем продолжает оставаться актуальной. В данной работе предложена вычислительная технология поиска глобального экстремума в невыпуклой ЗОУ, основанная на "конечномерных" алгоритмах и редукции исходной задачи к последовательности задач безусловной минимизации.

В стандартной постановке задачи динамика процесса описывается системой обыкновенных дифференциальных уравнений с начальными условиями: х = 1(х,иЛ), х((0) = х0, где í -

время из интервала T = [^Д1],х = (х1,х2,...,хп)-вектор фазовых координат, и - управляющее воздействие. Вектор-функция f(x,u,t) предполагается непрерывно дифференцируемой по всем аргументам. Допустимыми называются кусочно-непрерывные управляющие функции u = u(t), для любых значений времени t, принадлежащие множеству U, где U = {u е R: и, <u<ug}. ЗОУ заключается в поиске допустимого управления u* = u*(t), доставляющего минимум терминальному функционалу Ди) = ф(х(^)) ^ min, здесь функция 9(x(t)) также предполагается непрерывно дифференцируемой.

2. Технология решения невыпуклой ЗОУ.

Для решения невыпуклых ЗОУ в приведенной постановке разработана вычислительная технология, состоящая из двух этапов. На первом этапе выполняется редукция ЗОУ к конечномерной задаче безусловной минимизации (БМ) с прямыми ограничениями на оптимизируемые переменные. При этом искомое управление грубо аппроксимируется с помощью кусочно-линейных функций с большим шагом дискретизации. Далее ищется глобальный минимум в поставленной конечномерной задаче с небольшим числом переменных, что позволяет найти грубое приближение к оптимальному управлению. На втором этапе решения строится уточненная аппроксимация управления с использованием полученного на первом этапе приближения в качестве начального. В результате находим более точное приближение к оптимальному управлению на основе применения алгоритмов золотого сечения и параболической интерполяции.

Общая схема предлагаемого подхода изображена на рис. 1. Ядром рассматриваемой технологии является глобальный алгоритм парабол [7, 8], позволяющий с большой вероятностью находить минимальное значение невыпуклой функции. Программная реализация предлагаемой технологии протестирована с помощью коллекции невыпуклых модельных ЗОУ.

Представленная технология, конечно, не может гарантировать нахождение глобального экстремума в любой задаче. Тем не менее, в рамках рассматриваемого подхода показала себя эффективной для быстрого нахождения управлений из области притяжения глобального экстремума в ЗОУ.

3. Вспомогательная задача БМ.

Рис. 1. Схема технологии решения невыпуклой ЗОУ.

Для решения исходной ЗОУ осуществляется ее редукция к вспомогательной задаче БМ (рис. 1), которая заключается в поиске минимума невыпуклой функции нескольких переменных g(y) по всем у из множества Y, где Y -m-мерный параллелепипед

ming(y), 7 ={y е Rm: а, < yt < ß,, i =üi},

yeY

здесь g(y) имеет вид исходного функционала, зависящего от дискретизованного управления, доставляющего грубую аппроксимацию траектории в результате интегрирования системы дифференциальных уравнений. На следующем этапе выбирается более мелкое разбиение интервала времени функционирования системы, что приводит к задаче БМ большей размерности. При ее решении, найденное на крупной сетке управление используется в качестве начального приближения к искомому оптимальному управлению.

4. Описание основного алгоритма подхода.

Подход к решению рассматриваемой конечномерной задачи (1) основывается на комбинации следующих методов: покоординатного спуска для многомерной задачи нахождения экстремума и глобального метода парабол для вспомогательного одномерного поиска. Уточнение управления из области притяжения глобального экстремума осуществляется с помощью методов параболической интерполяции и золотого сечения. Приведем описание

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

одной итерации алгоритма решения вспомогательной задачи БМ. На k-м шаге:

1. Фиксируются все координаты функции д(У„У2,-,У»-,Ут), кроме k-ой, где k =1,m.

2. На отрезке [а k ,ßk ] изменения значений переменной ук генерируется случайная сетка

С = {ct} t =щ, что c1 = аk и см=ßk.

3. В узлах сетки вычисляются значения

функции g(yi,y2,...,Ci,...,ym), i =1,M.

4. Производится поиск "выпуклых троек" <см, с4, с1+1> - последовательно расположенных точек c1-1 < с1 < c1+1, значения в которых удовлетворяют следующему двойному неравенству

д(У1,У2,...,с-1,...,Ут) ^ g(yi,y2,...,ci,...,ym) <

< g(y1,y2,...,c+1,...,ym).

5. В каждой "выпуклой тройке" с помощью комбинации локальных методов одномерного поиска находится минимальное значение функции min h( z),

где h(z)=g(y1,y2Z.i:l.<,Z1.У^Ь z=yk.

6. На отрезке [а k ,ßk ] выбирается наименьшее значение целевой функции, из найденных в каждой "выпуклой тройке".

7. Полученная точка (yu у,,...^*,...^) используется в качестве начального приближения на следующем шаге. Итерация завершена.

5. Технологическая постановка ЗОУ.

Технологическая постановка включает в себя, кроме математической постановки ЗОУ, задание параметров, управляющих работой алгоритмов. Указывается размерность задачи п, интервал времени функционирования системы Т = [t0, t1] значение траектории в начальный момент времени x1(t0), i =1, n и прямые

ограничения на управление ul < u < ug , система дифференциальных уравнений и вид минимизируемого функционала.

Приведем пример постановки задачи в терминах реализованной вычислительной технологии. В задаче 1 [9] технологическая постановка будет выглядеть следующим образом: n = 2, T = [0, 1.5], х1(0) = 0, х2(0) = 0, |u|<1,

x = X 2 ,

x 2 = (2+x 1 - x 1 x 2 + xf x 2)u,

I(u) = x2 (1.5) ^ min.

Основными алгоритмическими параметрами являются размерности используемых сеток дискретизации. Для редукции задачи на первом этапе используется грубая сетка, состоящая из k узлов. На втором - осуществляет-

ся локальное уточнение полученного решения на основе более мелкой сетки, включающей 1 узлов. В приведенном примере выбраны следующие значения основных алгоритмических параметров: к = 5, 1 = 101. Для нахождения траекторий системы использовалась программная реализация явного метода Рунге-Кутты, основанная на формулах Дормана-Принса с автоматическим управлением длиной шага [10].

На первом этапе решения рассматриваемой задачи полученное управление (рис.2) доставляет функционалу значение, равное -3.439. Машинное время решения - менее 1 сек. Полученная грубая аппроксимация оптимального управления выбирается в качестве начального приближения, на следующем этапе осуществляется его локальное уточнение. Генерируется сетка {Рг.}. — из 1 узлов с постоянным шагом Л1=(11 - у/]! - 1), такая, что Р, =¿0 Но(I-1), I =й

С помощью рассматриваемого подхода удалось получить следующее рекордное значение функционала Ди*) = -4.041, за время решения, равное 4 сек. Соответствующие оптимальные траектории и управление в рассматриваемой задаче 1 приведены на рис. З(а).

Построена проекция множества достижимости с выделенными точками, в которых достигаются экстремальные значения функционала. Локальный экстремум и область его притяжения выделены серым цветом, глобальный - черным. Нахождение локальных экстремумов и построение аппроксимации множества достижимости осуществлялось с помощью программного комплекса ОРТСОЫ-Ш (Горнов

Рис. 2. Рекордное управление и соответствующие ему траектории, полученные на первом этапе решения задачи 1.

Рис. 3. Оптимальные траектории и управление (а), проекция множества достижимости и экстремальные точки (б) в задаче 1.

А. Ю., Зароднюк Т.С.), основанного на методе мультистарта [7]

6. Модельная ЗОУ колебаниями нелинейного маятника.

Рассмотрим известную модельную задачу гашения колебаний нелинейного маятника [11] xj=x2, x2 = u - sin Xj, Xj(0) = 5, x2(0) = 0, |u(t)|<1, t g [0,5]. Целевой функционал в классической постановке выглядит следующим образом I(u) = х12(5) + x22(5) ^ min .

С помощью рассматриваемой технологии известное из первоисточника минимальное значение целевого функционала I(u*) = 11.908 найдено за 12 секунд (на выполнение первого этапа потрачено менее 1 сек). На рис.4(а) пунктирной линией изображена грубая аппроксимация, сплошной - уточненная аппроксимация оптимального управления, полученная с использованием комбинации локальных методов.

7. Модельная задача 2 [12].

Управляемый динамический процесс описывается системой обыкновенных дифференциальных уравнений xx1 = sinx2, x2 = и -ex 1,с заданными начальными условиями х1(0) = х2(0) = 1 и ограничениями на управление |u(t)|< 1, t е [0,5]. Необходимо минимизировать функционал вида /(u) = x1(5) + х2(5) ^ min.

За общее время решения задачи - 15 сек -найдено следующее минимальное значение функционала: /(u*) =-16.446. Экстремальное управление, соответствующие емутраектории и проекция множества достижимости представлены на рис. 5.

8. Модельная задача 3.

Нелинейная система дифференциальных уравнений, описывающая процесс в модельной задаче 3 на интервале Т = [0,1], выглядит следующим образом ^1=(х1+х2) и, x2=sin(x1 +x2 + u). Начальный фазовый вектор и интервал изменения управляющей

Рис. 4. Оптимальные траектории и управление (а), проекция множества достижимости и экстремальные точки (б) в ЗОУ колебаниями нелинейною маятника.

0.0 1.0 2.0 3.0 4.0 SO -4.0 -3.0 -2.0 -1.0 0.0 10 ZO

Рис. 5. Оптимальные траектории и управление (а), проекция множества достижимости и экстремальные точки (б) в модельной задаче 2.

функции заданы: х1(0) = -0.9, х2(0) = 1,|и(1)|<1. Поиск оптимального управления осуществляется на основании критерия качества вида /(и) = -х1 (1) ^-шт.

Рассматриваемая технология позволила получить минимальное значение функционала /(и*) = -0.056 за время, равное 5 сек (на выполнение первого этапа ушло менее 1 сек). Визуализация полученного решения приведена на рис. 6.

9. Модельная ЗОУ энергетической системой.

Одним из традиционных подходов к исследованию энергетических проблем является математическое моделирование с использованием управляемых систем обыкновенных дифференциальных уравнений. Приведем известную модельную энергетическую задачу, рассмотренную в разных источниках [11, стр. 140], [13, с.115], [14, с. 204].

Данная система представляет собой линеаризованную модель простейшей энергосистемы: генератор - шины бесконечной мощности

x 2 = -6.725x1 -1619x3 + 0194, x3 -0.066x1 -0.257x3 + 019u + 0.018, xj(0) = 0115,x2(0) =1.926, x3(0) = 0.055,

|u(i)|< 2.59,i e [0,1.4], I(u) = ||x(1.4||2 ^ min.

Здесь u - ЭДС возбуждения, x1 - угол поворота ротора генератора по отношению к синхронной оси сдвига фазовой ЭДС и напряжения. В задаче рассматривается возмущенное движение, возникающее во время аварий в электропередаче. Необходимо за время Т=1.4 привести энергосистему в положение, как можно более близкое к 0.

В процессе минимизации рекордное значение функционала 0.002 в [11] было получено за время 157 секунд. В [13] минимальное значе-

Рис. 6. Оптимальные траектории и управление (а), проекция множества достижимости и экстремальные точки (б) в модельной задаче 3.

Рис. 7. Проекции множества достижимости в модельной энергетической задаче.

ние функционала равно 0.00127. Решение, полученное с помощью рассматриваемого подхода на порядок лучше - Ди*) = 0.00054. Общее время решения задачи на ПК РепЬит-ГУ^ 593 сек. Проекции множества достижимости и точка, в которой достигается минимальное значение функционала, приведены на рис. 7. Оптимальные траектории и управление - на рис. 8.

Заключение.

Любой метод поиска глобального экстремума, явно или неявно, включает два этапа: грубый сканирующий поиск экстремума на всем допустимом множестве и точный локальный поиск в тех областях, где вероятнее всего находится глобальный экстремум. Предложенный подход позволяет конструировать вычислительные схемы, вполне удовлетворяющие данным требованиям, и может служить основой для создания эффективных алгорит-

Рис. 8. Оптимальные траектории и управление в модельной энергетической задаче.

мов решения невыпуклых задач оптимального управления. Свойства рассматриваемых методов исследовались с помощью тестирования алгоритмов.

Представленная методика является эвристической и не может дать гарантии нахождения экстремума в любой задаче. Тем не менее, в большинстве решавшихся задач известный из первоисточника глобальный экстремум был найден. Предложенный подход показал себя работоспособным при решении тридцати сложных невыпуклых нелинейных задач.

БИБЛИОГРАФИЯ

1. KrotovV.F. Global methods in optimal control theory - N.Y.: Marcel Dekker Inc., 1996. -348 c.

2. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации // М.: Наука, 1982. 432 с.

3. Стрекаловский А.С. Элементы невыпуклой оптимизации. - Новосибирск: Наука, 2003. - 356 с.

4. Срочко В.А. Итерационные методы решения задач оптимального управления. - М.: ФИЗМАТЛИТ, 2000. - 160 с.

5. Floudas C.A. Deterministic Global Optimization: Theory, Methods and Applications; Nonconvex Optimization and its Applications. - Kluwer Academic Publishers, 2000. 508 p.

6. I.L. Lopez Cruz, L.G. van Willigenburg, G. van Straten. Efficient evolutionary algorithms for multimodal optimal control problems // Journal of Applied Soft Computing. - 2003. - T. 2. № 3.- p.p. 97-122.

7. Жилинскас А.Г. Глобальная оптимизация: Аксиоматика статистических моделей, алгоритмы, применения. - Вильнюс: Мок-слас, 1986. - 168 с.

ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ

8. Ершов А.Р., Хамисов О.В. Автоматическая глобальная оптимизация // Журн. Дискретный анализ и исследование операций. - 2004. - Т. 11, № 2. - С. 45-68.

9. Горнов А.Ю., Диваков А.О. Комплекс программ для численного решения задач оптимального управления. Руководство пользователя. - Иркутск, 1990. - 27 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Хайрер Э., Нерсетт С, Ваннер Г. Решение обыкновенных дифференциальных уравнений. Нежесткие задачи: Пер. с англ. - М.: Мир, 1990. - 512 с.

11. Тятюшкин А.И. Численные методы и программные средства оптимизации управляемых систем. -Новосибирск: Наука. Сиб. отд-ние, 1992. - 193 с.

12. Горнов А.Ю., Данеева А.В. Подход к исследованию невыпуклых задач оптимального управления с параллелепипедными ограничениями // Вестник Бурятского университета. Серия 13: Математика и информатика. Вып. 2. - Улан-Удэ: Изд-во Бурятского госуниверситета, 2005. - С. 125-131.

13. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. -Новосибирск: Наука. Сиб. предприятие РАН. 1997. -175 с.

14. Ащепков Л.Т. Оптимальное управление разрывными системами. - Новосибирск: Наука, 1987.-226 с.

Федоров В.В., Молчанова Е.И.

УДК 004.85

РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОГО РЕДАКТОРА БАЗЫ ЗНАНИЙ ДЛЯ СОЗДАНИЯ ЭКСПЕРТНЫХ СИСТЕМ В СРЕДЕ CUPS

Актуальность.

Анализ современного состояния рынка информационных систем (ИС) показывает устойчивую тенденцию роста спроса на ИС организационного управления. Причем спрос продолжает расти именно на интегрированные системы управления. Автоматизация отдельной функции, например, бухгалтерского учета или сбыта готовой продукции, считается уже пройденным -паном для многих предприятий. ИС специалистов - обеспечивают работу с данными и -знаниями, повышают продуктивность и производительность работы инженеров и проектировщиков. Одним из направлений таких ИС являются экспертные системы (ЭС), осуществляющие поддержку принятия решений. В ИрГУПС выполняется разработка экспертной системы для обучения инженера-методиста по рентгенофлуоресцентному анализу. Число потенциальных потребителей этой системы очень велико. Только отечественные рентгеновские спектрометры, выпущенные ЗАО «Научприбор», работают более

чем на 500 предприятиях металлургии, цементной и стекольной промышленности, в машиностроении и в научных учреждениях. Кроме того, многие заводские лаборатории оснащены аналитическими комплексами импортного производства. Проблемы, на решение которых направлен проект, сформулированы в Федеральной целевой программе - Национальная технологическая база - раздел VII (направление 78), раздел XVIII (направление 168).

Предлагаемые методы и подходы.

Осуществляемый проект отвечает требованиям, предъявляемым к программным комплексам нового поколения: имеет многослойную архитектуру, предусматривающую использование серверов приложений и серверов баз данных; ориентирован на работу в вычислительных сетях; имеет свойство расширяемости программного обеспечения (Рис.1).

В качестве среды разработки экспертной системы выбран Clips.Clips - С Language Integrated Production System (продукционная система, интегрируемая с языком С) [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.