Научная статья на тему 'Увеличение свободы выбора в прямых методах оптимального управления экономическими системами'

Увеличение свободы выбора в прямых методах оптимального управления экономическими системами Текст научной статьи по специальности «Математика»

CC BY
80
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЭКОНОМИЧЕСКАЯ СИСТЕМА / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ПРЯМОЙ МЕТОД / ЭЛЕМЕНТАРНАЯ ОПЕРАЦИЯ / ПОИСК В ШИРИНУ / ПОИСК В ГЛУБИНУ / ECONOMIC SYSTEM / OPTIMAL CONTROL / DIRECT METHOD / ELEMENTARY OPERATION / BREADTH FIRST SEARCH / DEPTH FIRST SEARCH

Аннотация научной статьи по математике, автор научной работы — Орёл Е. Н.

Рассматриваются прямые методы решения задач оптимального управления экономическими системами, не ограничивающие свободу выбора и, следовательно, не использующие “элементарную операцию ”.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FREEDOM IN CHOOSING INCREASE IN DIRECT METHODS OF OPTIMAL ECONOMIC SYSTEM CONTROL

Direct methods of optimal economic system control problems solving that do not restrict freedom of choice and, therefore, do not use “elementary operation” are considered.

Текст научной работы на тему «Увеличение свободы выбора в прямых методах оптимального управления экономическими системами»

приятия. В этом отношении можно принять нашедшую распространение в современной маркетинговой науке точку зрения отдельных исследователей дифференциации поставщиков комплектующих изделий на две группы: простые и стратегические поставщики.

Приведенную схему альянса между производителем конечной продукции, машин и оборудования и поставщиками комплектующих изделий следует дополнить одним существенным замечанием. Простые посредники также могут участвовать наравне со стратегическими партнерами в решении инновационных задач, поскольку небольшим предприятиям-поставщикам также доступно решение некоторых инновационных задач на условиях рискового бизнеса.

При этом преимуществами подобных стратегических альянсов является необязательность институированных элементов и организационных структур, в то же время достаточно эффективны устные соглашения, координация совместной деятельности, доверительные отношения, реализация неполных контрактов.

Литература:

1. Багиев Г.Л, Тарасевич В.М. Анн Х. Маркетинг.- М.: Изд-во «Экономика», 2001.- С. 698.

2. Основные итоги социально-экономического развития Свер-

дловской области в 2005 г. - Екатеринбург, Минэкономики и труда Свердловской области, 2006 г;

3. Анисимов В.П. Российские регионы как субъекты промышленной политики // Российский экономический журнал, 2006, №78.- С. 42.

4. Опрос проводился на машиностроительных предприятиях Пензенской области (ОАО «Дизельный завод», ОАО «Компрессорный завод», «Химмаш»).

5. Уильямсон О.И. Экономические институты капитализма: фирмы, рынки, «отношенческая контрактация. - СПб.: Лениздат: CEV Press, 1996.- С. 51.

6. Материалы отчетов деятельности предприятий за 1 -е полугодие 2009 г.

7. Бельских И.Е. Корпоративные коммуникации промышленного предприятия: в поисках эффективной национальной стратегии// Маркетинг в России и за рубежом, №5, 2006.- С.-26.

8. Ф. Котлер, Г. Армстронг и др. Основы маркетинга. - СПб.; Питер, 2001. - С. 98

9. Гавриленко Н.И. Роль и место маркетингового управления в работе с хозяйствующими субъектами// Менеджмент в России и за рубежом, 2006, № 1. - С. 44.

УВЕЛИЧЕНИЕ СВОБОДЫ ВЫБОРА В ПРЯМЫХ МЕТОДАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ЭКОНОМИЧЕСКИМИ СИСТЕМАМИ

Орёл Е.Н., Финансовый университет при Правительстве РФ

Рассматриваются прямые методы решения задач оптимального управления экономическими системами, не ограничивающие свободу выбора и, следовательно, не использующие “элементарную операцию ”.

Ключевые слова: экономическая система, оптимальное управление, прямой метод, элементарная операция, поиск в ширину, поиск в глубину.

FREEDOM IN CHOOSING INCREASE IN DIRECT METHODS OF OPTIMAL ECONOMIC SYSTEM CONTROL

Oryol E., Financial University under the Government of RF

Direct methods of optimal economic system control problems solving that do not restrict freedom of choice and, therefore, do not use “elementary operation” are considered.

Keywords: economic system, optimal control, direct method, elementary operation, breadth first search, depth first search.

Введение

Методы решения задач оптимального управления экономическими системами подразделяются на методы, использующие необходимые условия экстремума (как правило, условия, составляющие принцип максимума Понтрягина), и прямые методы (например, методы, основанные на принципе оптимальности Беллмана). Прямые методы, которые будут рассмотрены в данной статье, отличаются тем, что они не предъявляют особых требований к гладкости функций и траекторий. В частности, время может быть как дискретно, так и непрерывно. Прямые методы активно используются в задачах с экономическим содержанием. Так, уже в работах Беллмана [1] решались задачи управления запасами, календарного планирования (в частности, задача об оптимальной последовательности обработки деталей на станках) и оптимального распределения прибыли. В дальнейшем прямые методы рассматривались в экономико-математических моделях макроэкономической динамики, логистики, маркетинга и финансового анализа [2].

Таким образом, прямые методы оптимального управления, родоначальником которых считается Леонард Эйлер, характерны тем, что они позволяют находить в определенном смысле глобальный экстремум [3], причем в них используются не необходимые условия, а идеи переборного характера и принцип оптимальности Бел-лмана. Основная трудность прямых методов состоит в том, что функция Беллмана имеет континуум значений, вычислить которые в точности невозможно. Как правило, прямые методы строят аналог

^ функции Беллмана, принадлежащий конечномерному классу функций. Областью определения функции ^ может быть всё про-

странство состояний (и тогда нужно заранее выбрать подходящий конечномерный подкласс К из множества всех функций,

определенных на X ) или конечное подмножество состояний (и тогда возникает необходимость использования “элементарной операции” [3], которая строит траекторию, ведущую из одного состояния в другое, достаточно близкое состояние из этого подмножества).

В монографии [3] большое внимание уделяется наиболее распространённому прямому методу, который известен как алгоритм “киевский веник” В.С. Михалевича и Н.З. Шора.

Трудность использования этого алгоритма состоит в том, что пространство состояний имеет мощность континуума, а двигаться приходится в рамках заранее заданной конечной сетки. Задача поиска в бесконечном пространстве состояний сводится к задаче построения пути на конечном графе. Возникает необходимость построения управления, переводящего систему из одного заданного состояния в другое, достаточно близкое к нему, что реализуется с помощью “элементарной операции” [3]. При этом очевидно, что иногда для попадания в соседнее состояние необходим довольно сложный “манёвр разворота”. Получается, что задача на графе сильно отличается в сторону увеличения экстремума функционала от исходной задачи.

В настоящей работе показано, что нет необходимости заставлять систему перемещаться по заранее заданным точкам - она сама может выбрать подходящее управление и оказаться в состоянии, которое заранее не намечалось.

Ограничить процесс ветвления сети можно с помощью разбиения пространства состояний на конечное число (^ ) подмножеств.

При построении дерева вариантов система может сама выбирать очередное состояние, но все выбранные ею состояния должны принадлежать разным подмножествам. Это позволяет хранить в памяти не более ^ единиц информации. Для построения траектории,

претендующей на оптимальность, можно использовать алгоритмы поиска в глубину или в ширину [4-7].

В настоящей работе рассмотрен прямой метод решения задач оптимального управления, основанный на кусочно-постоянной аппроксимации функции Беллмана и не нуждающийся в использовании “элементарной операции”. Искомая траектория составляется из элементарных участков, каждый из которых получается как реализация того или иного управляющего воздействия в течение небольшого промежутка времени. Тем самым исходная задача трансформируется в задачу поиска пути на бесконечном графе. Метод является достаточно гибким и имеет несколько вариантов [5-7].

Постановка задачи

Приведём упрощённую постановку задачи. Будем считать, что каждое выбранное управление действует в течение конечного промежутка времени. Упрощение состоит в том, что мы выбираем сразу участки траекторий, или фрагменты процесса управления.

х0 = я, хп е У0 и с(п) ^ ш1п.

Функция Беллмана определяется формулой

о)(х) = шт \с(п) I х0 = х].

Численный метод

Основу предлагаемого метода составляет разбиение пространства состояний на конечное число подмножеств и формирование стратегии, основу которой составляет кусочно-постоянная функция, являющаяся аналогом функции Беллмана. Значения этой функции формируются в процессе реализации метода.

Таким образом, важную роль играют множества

11 ,К , 1 , на которых формируемая функция ^ принимает постоянные значения. Для произвольного состояния х е X положим х = I , если х е . Кроме того, если х, У е X

Имеется пространство состояний X и пространство управ- и х = У , то будем писать х ~ У .

лений и . Если выбрано управление Ц £ ЦУ , то система из со-

x

X

переходит в новое состояние,

Р(х, М ) е X . При этом затрачивается ресурс I (х, М ) единиц. Этим ресурсом может быть время движения, затраченная энергия, стоимость и т.д. Имеется множество терминальных состояний

Уо с X . Процесс управления определяется траекторией

п = (х0,м0;хг,М{К ;хп-1,мп-1;хп).

При этом расходуется ресурс в размере п-1

Имеется несколько разновидностей метода. Прежде всего, они подразделяются на способ поиска (перебора). Как известно, поиск на деревьях и графах может проходить в глубину (с возвращениями) или в ширину.

Если осуществлять поиск в глубину с возвращениями, то надо строить кусочно-постоянное приближение функции Беллмана. Это приближение принимает нулевые значения на терминальном множестве. При коррекции значения кусочно-постоянной функции надо делать шаг назад. Начальные значения кусочно-постоянной функции можно брать нулевыми или, что быстрее приводит к цели, можно брать из равными значениям эвристической функции Нильсона

[4].

Остановимся на варианте, при котором процесс формирования кусочно-постоянной функции ^ идет одновременно с процессом

с(п) = Х l (Xj, Uj )

j=0

формирования дерева траекторий с корнем в я . Основу варианта составляет модификация алгоритма Дейкстры поиска в ширину. Здесь опять-таки можно использовать функцию Нильсона.

Алгоритм можно интерпретировать таким образом, что он строит и постепенно расширяет фронт волны с источником, располо-

я е X \ У0 выбрать такой процесс управления П , что женным в стартовой точке Я е X . Наиболее перспективная точ-

единиц.

Требуется для заданного начального условия

Рис. 1. Сложные манёвры разворота, найденные компьютером

ка ^ фронта волны сначала становится источником вторичного фронта, а затем присоединяется к дереву оптимальных путей. Одновременно запоминается стоимость пути из Я в ^ . Работа алгоритма завершается, когда волна дойдет до терминального множества 10 .

Суть модификации алгоритма состоит в том, что если какая-либо точка х е 1 оказалась в дереве оптимальных путей, то

никакая другая точка у е 1 уже не сможет попасть в дерево.

Вследствие этого требуемая память расширяется лишь в ограниченных пределах и содержит не более единиц информации.

Метод тестировался на сравнительно простой задаче, которую можно назвать задачей о движении автомобиля при наличии заранее неизвестных препятствий. Управление ведётся по боковому ускорению, которое не должно превосходить константы [8]. На рисунке 1 приводятся некоторые траектории, полученные с экрана монитора, которые находит блок управления, обходя препятствия для выхода на противоположную сторону прямоугольника, точки которого образуют пространство состояний.

В работах [5,6] было предложено рассматривать данную задачу как типовую модель для сравнения различных методов оптимального управления. Данное приглашение не могло остаться не-

замеченным, и поскольку иных подходов предложено не было, можно сделать вывод, что преимущества подобной системы принятия решений, обладающей большой свободой выбора и не нуждающейся в использовании элементарной операции, достаточно очевидны. Такая система принятия решений может эффективно использоваться в задачах управления экономическими системами.

Литература:

1. Беллман Р. Динамическое программирование. - М.: ИЛ, 1962. 359 с.

2. Optimal Control and Dynamic Games: Applications in Finance, Management Science and Economics. Edited by R.F. Hart and H. Deissenberg. - N.-Y., Springer, 2005. - 342 p.

3. Моисеев Н.Н. Численные методы в теории оптимальных систем. - М.: Наука, 1971. 424 с.

4. Нильсон. Принципы искусственного интеллекта. - М.: Радио и связь, 1985. 374 с.

5. Орёл Е.Н. Метод решения задач оптимального управления / / Докл. АН СССР, 1989, т. 306, № 6. С. 1301-1304.

6. Орёл Е.Н. Алгоритмы поиска квазиоптимального управления, использующие разбиение пространства состояний // Журнал вычисл. матем. и матем. физ. Т. 29. 1990. № 9. С. 1283-1293.

7. Орёл Е.Н. Обобщение алгоритма Дейкстры для задач оптимального управления // Прикладные аспекты анализа распределенных систем. - М.: РАН, ИФТП, 1990. С.72-78.

8. Айзекс Р. Дифференциальные игры. - М.: Мир, 1967. 479 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.