Научная статья на тему 'Об использовании метода динамического программирования Р. Беллмана в задачах экономического содержания'

Об использовании метода динамического программирования Р. Беллмана в задачах экономического содержания Текст научной статьи по специальности «Математика»

CC BY
2079
178
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Бизнес Информ
Область наук
Ключевые слова
ОПТИМАЛЬНЕ УПРАВЛіННЯ / БАГАТОКРОКОВЕ ПРИЙНЯТТЯ РіШЕНЬ / ПРИНЦИП ОПТИМАЛЬНОСТі БЕЛЛМАНА / ДИНАМіЧНЕ ПРОГРАМУВАННЯ / ФУНКЦіОНАЛЬНЕ РіВНЯННЯ БЕЛЛМАНА / ПРИНЦИП МАКСИМУМУ ПОНТРЯГіНА / ЕКОНОМіЧНі ПРОГРАМИ МЕТОДУ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / МНОГОШАГОВОСТЬ ПРИНЯТИЯ РЕШЕНИЙ / ПРИНЦИП ОПТИМАЛЬНОСТИ БЕЛЛМАНА / ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ БЕЛЛМАНА / ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА / ЭКОНОМИЧЕСКИЕ ПРИЛОЖЕНИЯ МЕТОДА / OPTIMAL MANAGEMENT / MULTISTAGE NATURE OF DECISION MAKING / BELLMAN’S PRINCIPLE OF OPTIMALITY / DYNAMIC PROGRAMMING / BELLMAN’S FUNCTIONAL EQUATION / PONTRYAGIN’S MAXIMUM PRINCIPLE / ECONOMIC APPLICATIONS OF THE METHOD

Аннотация научной статьи по математике, автор научной работы — Чернышев Сергей Иванович

Метод динамического программирования (МДП) Беллмана исключительно эффективен для решения широкого класса задач экономико-математического моделирования. В целом ряде случаев МДП является безальтернативным. Между тем, высказывания специалистов о корректности обоснования МДП, а также, в целом, о достижениях Р. Беллмана противоречивы. Во всяком случае, такой была ситуация на период деятельности Р. Беллмана и его оппонентов. Анализ показывает, что в значительной мере эти противоречия были обусловлены соперничеством ученых СССР и США на этапе освоения космического пространства. МДП базируется на принципе оптимальности Беллмана, который нельзя охарактеризовать иначе, как гениальный. Это предельно прозрачный алгоритм поиска глобального экстремума, идеально приспособленный к возможностям вычислительной техники. Наследие Р. Беллмана велико: от оптимального управления, дифференциальных уравнений и теории игр – до экономики и медицины. Вместе с тем, методологические подходы Р. Беллмана далеки от ортодоксальных представлений о математике, чем отчасти можно объяснить критику в его адрес. Наследие Р. Беллмана (619 статей и 39 книг, которые переведены на разные языки) заслуживает тщательного исследования, включая ракурс его экономико-математической значимости.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On Use of the Method of Dynamic Programming of Bellman in Economic Tasks

Method of dynamic programming (MDP) of Bellman is exceptionally efficient for solving a wide class of tasks of economic and mathematical modelling. In a number of cases MDP has no alternative. Meanwhile, statements of specialists with respect to correctness of justification of MDP and also with respect to achievements of R. Bellman are contradictory. In any case, that was the situation during the period of activity of R. Bellman and his opponents. Analysis shows that, to a big extent, these contradictions were caused by competition between Soviet and American scientists at the stage of space exploration. MDP ids based on the Bellman’s principle of optimality, which could be characterised as purely ingenious. This is an extremely transparent algorithm of the search for global extremum and is ideally fit for capabilities of computing equipment. Heritage of R. Bellman is great: from the optimal management, differential equations and game theory to economy and medicine. At the same time, methodological approaches of R. Bellman are far from orthodox views on mathematics, which partially explains critics in his address. Heritage of R. Bellman (619 articles and 39 books translated into many languages) deserves a thorough study including perspective of his economic and mathematical magnitude.

Текст научной работы на тему «Об использовании метода динамического программирования Р. Беллмана в задачах экономического содержания»

ЕКОНОМІКА Економіко-МАТЕМАТИЧИЕ моделювання

REFERENCES

Blank, I. A. Upravlenie finansovymi riskami [Financial Risk Management.]. Kyiv: NIKA-TsENTR, 2005.

Holtiaieva, L. A. "Stsenarne prohnozuvannia v systemi up-ravlinnia finansovymy ryzykamy pidpryiemstva" [The scenario forecasting system in financial risk management company]. Ak-tualnipytannia ekonomiky ta upravlinnia. Dnipropetrovsk: Pers-pektyva, 2012. 140-.

Kaminskyi., A. B. Modeliuvannia finansovykh ryzykiv [Modeling financial risks]. Kyiv: Kyivskyi universytet, 2006.

Rohov., M. A. Rysk-menedzhment [Risk management]. Moscow: Fynansy y statystyka, 2001.

Shapkin, A. S. Ekonomicheskie i finansovye riski. Otsenka, upravlenie, portfel investitsiy [Economic and financial risks. Assessment, management, investment portfolio]. Moscow: Dashkov i K, 2003.

Ustenko., O. L. Teoriia ekonomicheskogo riska [The theory of economic risk]. Kyiv: MAUP, 1997.

Vitlinskyi, V. V., and Velykoivanenko, H. I. Ryzykolohiia v ekonomitsi ta pidpryiemnytstvi [Ryzykolohiya in economics and business]. Kyiv: KNEU, 2004.

Vnukova, N. M., and Smoliak, V. A. Ekonomichna otsinka ryzyku diialnosti pidpryiemstv: problemy teorii ta praktyky [Economic risk assessment of enterprises: problems of theory and practice]. Kharkiv: INZhEK, 2006.

УДК 519.6

об использовании метода динамического программирования р. беллмана в задачах экономического содержания

ЧЕРНЫШЕВ с. и.

УДК 519.6

чернышев С. И. Об использовании метода динамического программирования Р. Беллмана в задачах экономического содержания

Метод динамического программирования (МДП) Беллмана исключительно эффективен для решения широкого класса задач экономико-математического моделирования. В целом ряде случаев МДП является безальтернативным. Между тем, высказывания специалистов о корректности обоснования МДП, а также в целом о достижениях Р. Беллмана противоречивы. Во всяком случае, такой была ситуация на период деятельности Р. Беллмана и его оппонентов. Анализ показывает, что в значительной мере эти противоречия были обусловлены соперничеством ученых СССР и США на этапе освоения космического пространства. МДП базируется на принципе оптимальности Беллмана, который нельзя охарактеризовать иначе, как гениальный. Это предельно прозрачный алгоритм поиска глобального экстремума, идеально приспособленный к возможностям вычислительной техники. Наследие Р. Беллмана велико: от оптимального управления, дифференциальных уравнений и теории игр - до экономики и медицины. Вместе с тем, методологические подходы Р. Беллмана далеки от ортодоксальных представлений о математике, чем отчасти можно объяснить критику в его адрес. Наследие Р. Беллмана (619 статей и 39 книг, которые переведены на разные языки) заслуживает тщательного исследования, включая ракурс его экономико-математической значимости.

Ключевые слова: оптимальное управление; многошаговость принятия решений; принцип оптимальности Беллмана; динамическое программирование; функциональное уравнение Беллмана; принцип максимума Понтрягина; экономические приложения метода.

Формул: 7. Библ.: 21.

Чернышев Сергей Иванович - кандидат технических наук, преподаватель, кафедра статистики и экономического прогнозирования, Харьковский национальный экономический университет (пр. Ленина, 9а, Харьков, 61166, Украина)

УДК 519.6

Чернишов С. І. Про використання методу динамічного програмування Р. Беллмана в задачах економічного змісту

Метод динамічного програмування (МДП) Беллмана є винятково ефективним для вирішення широкого класу задач економіко-математичного моделювання.

У цілому ряді випадків МДП є безальтернативним. Разом із тим, висловлювання фахівців щодо коректності обґрунтування МДП, а також, в цілому, про досягнення Р. Беллмана, досить суперечливі. В усякому разі, такою була ситуація на період діяльності Р. Беллмана та його опонентів. Аналіз показує, що значною мірою ці протиріччя були обумовлені суперництвом вчених СРСР і США на етапі освоєння космічного простору. МДП базується на принципі оптимальності Беллмана, який не можна охарактеризувати інакше, як геніальний. Це гранично прозорий алгоритм пошуку глобального екстремуму, ідеально пристосований до можливостей обчислювальної техніки. Спадок Р. Беллмана великий: від оптимального управління, диференціальних рівнянь і теорії ігор - до економіки і медицини. Разом із тим, методологічні підходи Р. Беллмана далекі від ортодоксальних уявлень про математику, чим частково можна пояснити критику на його адресу. Спадок Р. Беллмана (619 статей і 39 книг, які перекладені різними мовами) заслуговує ретельного дослідження, включаючи ракурс його економіко-математичної значущості.

Ключові слова: оптимальне управління; багатокрокове прийняття рішень; принцип оптимальності Беллмана; динамічне програмування; функціональне рівняння Беллмана; принцип максимуму Понтрягіна; економічні програми методу.

Формул: 7. Бібл.: 21.

Чернишов Сергій Іванович - кандидат технічних наук, викладач, кафедра статистики та економічного прогнозування, Харківський національний економічний університет (пр. Леніна, 9а, Харків, 61166, Україна)

UDC 519.6

Chernyshov S. I. On Use of the Method of Dynamic Programming of Bellman in Economic Tasks

HeuMethod of dynamic programming (MDP) of Bellman is exceptionally efficient for solving a wide class of tasks of economic and mathematical modelling. In a number of cases MDP has no alternative. Meanwhile, statements of specialists with respect to correctness of justification of MDP and also with respect to achievements of R. Bellman are contradictory. In any case, that was the situation during the period of activity of R. Bellman and his opponents. Analysis shows that, to a big extent, these contradictions were caused by competition between Soviet and American scientists at the stage of space exploration. MDP ids based on the Bellman's principle of optimality, which could be characterised as purely ingenious. This is an extremely transparent algorithm of the search for global extremum and is ideally fit for capabilities of computing equipment. Heritage of R. Bellman is great: from the optimal management, differential equations and game theory to economy and medicine. At the same time, methodological approaches of R. Bellman are far from orthodox views on mathematics, which partially explains critics in his address. Heritage of R. Bellman (619 articles and 39 books translated into many languages) deserves a thorough study including perspective of his economic and mathematical magnitude.

Key words: optimal management; multistage nature of decision making; Bellman's principle of optimality; dynamic programming; Bellman's functional equation; Pontryagin's maximum principle; economic applications of the method. Formulae: 7. Bibl.: 21.

Chernyshov Sergey I.- Candidate of Sciences (Engineering), Lecturer, Department of Statistics and Economic Projections, Kharkiv National University of Economics (pr. Lenina, 9a, Kharkiv, 61166, Ukraine)

Метод динамического программирования (МДП), в общем, хорошо известен. Он с разной степенью детализации фигурирует в изданиях как прикладного характера, так и математической направленности. Весьма непривычным для математика является свободный, скажем так, стиль изложения работ Р. Беллмана и его сотрудников (имеется целый ряд русскоязычных изданий; см. список литературы к статье). Наряду с вопросами расчетно-теоретического обоснования они охватывают чрезвычайно широкий круг задач из различных областей. Как нам представляется, большинство из этих задач легко интерпретировать в плоскости экономических приложений. Мы приведем ниже соответствующие примеры.

Можно встретить критику МДП, причем, казалось бы, в его основополагающей части, со стороны видных математиков. И одновременно они же, если перевести на обычный язык, отмечают исключительную универсальность МДП. Существуют издания, в которых вопрос об эффективности МДП, а также и корректности обоснования, можно сказать, опущен, тогда как именно здесь должны были бы находиться конкретные ответы. Высокая активность публикаций по МДП относится к периоду 1960 - 1970-х гг.- в чем причина? Мы скажем о ней ниже. В общем, пожалуй, может быть сделан вывод

о том, что акценты в оценках возможностей МДП расставлены весьма неоднозначно.

Заметим, что в отличие от эмоциональных публикаций с участием Р. Беллмана, монографии, пособия, а также справочные издания по вычислительной математике, как правило, пишутся сухо (мы подобрали в статье несколько исключений). Оценки сравнительной эффективности методов, как и сфер их приложений, даются с большой осторожностью. Получается, каждый метод имеет свойственные ему достоинства и недостатки, но как, почему, насколько они друг друга перевешивают, и нет ли здесь качественного превосходства?

Конечно, такое может быть в очень редком случае. По нашему мнению, его олицетворяет разработанный Р. Беллманом МДП, поскольку беспрецедентно, наверное, широкий класс задач, в первую очередь прикладных, стал доступен для расчетно-теоретических исследований с использованием эффективных алгоритмов, базирующихся на единой основе. Это принцип оптимальности, который сформулировал Р. Беллман (см. ниже). Иначе говоря, в основе МДП лежит глобальный принцип, обусловливающий как эффективность алгоритмов численной реализации, так и универсальность в отношении постановок рассматриваемых задач.

Р. Беллман отмечает, что человека со всех сторон окружают многошаговые процессы принятия решений. В частности, это касается программ инвестирования и страховой деятельности. Некоторые из этих процессов настолько сложны, что остается лишь попытка «угадать решение и смиренно уповать на удачу» [1, с. 8]. Более того, автор искусственно привлекает многошаговость, даже если она отсутствует, путем придания статичной задаче динамических свойств.

Идея многошаговости, наряду с принципом оптимальности, представляет собой фундаментальную осно-

ву математико-методологического открытия Р. Беллма-на. Приведем выдержку: «Сначала мы сосредоточим внимание на тех задачах, которые по своему характеру формулируются как многошаговые процессы решения. Затем мы воспользуемся привилегией математики изучать любой процесс, который можно рассматривать как многошаговый процесс решения» [2, с. 18].

Обратимся к материалу книги Р. Беллмана и С. Дрейфуса [2, п. 1]. Итак, весьма общая постановка задачи об оптимальном распределении ограниченного ресурса по бизнес-процессам. То есть, мы хотим так разделить имеющиеся средства, чтобы суммарный доход от их вложения в производство продукции, виды страхования, банковскую деятельность, человеческий капитал и т. п. был максимальным. Вместо понятия «процесс» мы могли бы говорить о коммерческом проекте, видах деятельности; смысл очевиден.

Гораздо важнее функция полезности, или же доход gi, I = 1, 2, ..., Ы, зависящий от выделяемых ресурсов хг В отношении gi(xi) предполагается:

+ доходы, полученные от различных процессов, могут быть измерены общей единицей (далее подразумеваем доллар);

+ доход, получаемый от любого данного процесса, не зависит от того, какие количества ресурсов были выделены для других процессов (конечно, здесь подразумевается не размер, доллар, а вид функции);

+ общий доход может быть определен как сумма доходов, полученных от отдельных процессов.

Следует подчеркнуть существенный момент, а именно: алгоритм численной реализации МДП предполагает функции gi данными, наряду с чем значения х1 как раз и подлежат определению. Поэтому, говоря о функции gi(xi), мы трактуем аргумент х1 - переменным. Для экономики характерно отсутствие доходов, когда вложения средств малы, и напротив, - эффект насыщения в условиях избыточного финансирования.

В этой связи заметим, что МДП, с одной стороны, практически не налагает каких-либо ограничений на вид функций gi(xi); с другой,- «хорошо приспособлен для учета индивидуальных особенностей конкретных процессов» [2, с. 19]. Вместе с тем, решив задачу в рассматриваемой далее постановке, МДП одновременно позволяет понять, какие из функций gi(xi) требуют своего уточнения, поскольку издержки данной процедуры перекроет получаемый в итоге доход. А может быть, окажется целесообразным занять средства, увеличив x, отказаться от какого-то процесса и т. п.

То есть, здесь имеется обратная связь, и все же следует четко сказать о том, что в данном контексте определение функций gi(xi) представляет собой самостоятельную задачу. Она может решаться, в частности, посредством моделирования бизнес-процессов. По существу, с каким-то шагом по аргументу xi требуется построить графики gi(xi), характеризующие зависимость дохода от вложенных средств. Это - фактически фундаментальная задача любого бизнеса, включая развитие видов страхования и формирование портфеля ценных бумаг, с учетом рисков в их денежном эквиваленте.

ЕКОНОМІКА ЕКОНОМІКО-МАТЕМАТИЧИЕ МОДЕЛЮВАННЯ

ЕКОНОМІКА економіко-математичне моделювання

Сформулируем постановку конкретной задачи. Требуется определить размеры финансирования бизнес-процессов xt при ограничительном условии

Xi + Х2 +... + xN = X, Xj > 0, (1)

где значение x дано так, чтобы суммарный доход, как функция N переменных,

R(xb Х2, ..., XN ) = gjCXj) + g2(X2) + ... + gN (xN) (2) был максимальным. При этом функции являются данными.

В МДП вместо одной задачи (1), (2) с данным количеством ресурсов и фиксированным числом процессов, рассматривается целое семейство подобного рода задач, в которых x может принимать любые положительные значения, и N может принимать любые целые значения. «То, что на первый взгляд, по-видимому, может показаться статическим процессом, мы искусственно развертываем во времени, допуская, а в действительности требуя, производить распределения ресурсов в каждую единицу времени». Сначала какое-то количество ресурсов назначается N-му процессу, затем (N - 1)-му и т. д. Поступая таким образом, мы вводим динамический процесс распределения» [2, с. 35].

Оптимальный доход, получаемый от распределения суммы по процессам,

In(x) = maxR(xj, X2,..., Xn)

\xi f

при условиях (1). Очевидно,

In (0) = 0, N = 1, 2,...

если g.(0) = 0 для любого i, и также

fi (x) = gi(x), (3)

когда x > 0.

Развитие этих рассуждений приводит к основному функциональному уравнению

In (x) = max [gN(Xn) + In-i(x- Xn)], (4)

0<xn <x

если N = 2, 3, ...; x > 0, причем f1(x) определяется со гласно (3). «В ходе предшествующего изложения мы применили очень общий метод, известный под названием принципа оптимальности» [2, с. 36]. Здесь подразумевается вывод уравнения (4).

Принцип оптимальности Р. Беллмана [1, с. 105]: Оптимальное поведение обладает тем свойством, что каковы бы ни были первоначальное состояние и решение в начальный момент, последующие решения долж-ны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения. «Вся наша дальнейшая работа будет основана на применении этого простого свойства многошаговых процессов решения» [2, с. 37].

На практике вычисления по формуле (4) производят с использованием дискретизации, когда x принимает значения 0, А, 2А, ..., иА. При этом определяются наибольшие величины чисел. Например,

f (x )= max [ g2 (к A) + f1( x - к A)];

k=0,1,..., n

простота и эффективность данного алгоритма очевидна. Авторы [2] объясняют это тем, что применение функ-

ционального уравнения (4) эквивалентно использованию процесса поиска, который является гораздо более эффективным чем, если бы примитивно обследовать всевозможные варианты в исходной постановке (1), (2).

«Ключ доставляется принципом оптимальности. Согласно этому принципу, выбрав некоторое значение xЫ, мы затем отказываемся от обследования всех поведений, включающих этот частный выбор xЫ, а рассматриваем только те поведения, которые оптимальны для (Ы - 1)-шагового процесса с ресурсами x - xЫ. Этот магический способ позволяет сохранить аддитивность, а не мкльтипликативность числа операций. Время, требуемое для двадцатишагового процесса, теперь оказывается примерно вдвое больше времени, требуемого для десятишагового процесса» [2, с. 43 - 44].

В случае простого перебора вариантов, если каждая из переменных xi может принимать десять различных значений, то процесс максимизации с Ы переменными приводит к 10Ы множествам выбора. Если Ы = 10, получаем 1010, а когда Ы = 20 в 1010 раз больше, т. е. 1020. Эта тенденция делает простой перебор возможных вариантов практически неосуществимым.

На пути применения методов классического анализа (подразумевается аппарат вариационного исчисления) к решению задачи (1), (2) возникают осложнения принципиального характера. Так, в точке максимума функции g(x) ее производная ^) равна нулю. Однако таким же

является значение (^) в точках минимума и перегибов. И еще: максимум может быть не единственным, а также располагаться на границе рассматриваемого интервала. К тому же для дифференцирования функцию g(x) нужно представить в виде аналитического выражения.

В этой связи о преимуществах МДП. Во-первых, метод дает абсолютный, а не относительный максимум. Во-вторых, любое условие вида < xi < Ь, ограничивающее число возможностей на каждом шаге, упрощает процесс поиска. Иначе говоря, чем меньше поведений имеется на каждом шаге, тем быстрее вычисления. Те же доводы применимы к задачам максимизации по дискретным множествам. Так как используются только табличные значения рассматриваемых функций, их аналитическая структура, в смысле наличия производных, или же линейности (также очень неудобной для вариационного исчисления), не имеет значения.

Авторы отмечают существенные преимущества МДП, исходя из следующих соображений [2, с. 34]. «В большинстве случаев при исследовании данной физической системы мы не довольствуемся определением оптимального поведения системы для какого-либо одного множества значений параметров. Нас не оставляет желание позволить параметрам изменяться в некоторой критической области значений и затем наблюдать, насколько оптимальное поведение затрагивается этими изменениями. Именно отмечая изменение в структуре линий поведения вследствие изменения в параметрах, мы и добываем наиболее существенную информацию».

Вопросы, естественно возникающие в ходе теоретической постановки и решения задач распределения ресурсов вида (1), (2), сформулированы следующим образом [2, с. 45]:

f как доход (fN) и поведение (совокупность xi) зависят от начальных условий (x, N)? f каков результат изменения начального состояния при использовании некоторого оптимального поведения? f какова выгода от добавления еще одного способа (gN+1(xN+1)) или от продолжения процесса еще на один шаг (x + Ax)?

«Не имея достаточно прозрачного аналитического решения, довольно трудно извлечь из стандартной формулировки информацию этого типа. Однако формулировка в терминах динамического программирования автоматически включает первоначальную задачу в семейство аналогичных задач, в которых основные параметры x и N принимают значения из некоторых множеств, и это позволяет нам ответить на поставленные фундаментальные вопросы». Ответы на них «автоматически сопутствуют решению».

Следует отметить, что процедура численной реализации может быть распараллелена. Это является весьма важным, когда требуется повысить быстродействие алгоритма, «проигрывая» большое количество вариантов, или же возникают ограничения по оперативной памяти ЭВМ. Следует заметить, что на современном этапе развития вычислительной техники последнее из указанных обстоятельств в данной задаче едва ли актуально. Даже при большом N и частом делении интервала x. Вычислительный алгоритм - предельно экономичен в смысле требований к машинной памяти. Максимизация функции

R2 N (xh ^.^ x2 N ) = gl(x1) + (5)

+ g2(x2) + ... + g2N (x2N)

в области

X1 + ... + Xn + Xn+1 + ... + X2 n = X,

где xt > 0, осуществляется следующим образом. Если использовать обозначение

X1 +... + XN = л; XN+1 +... + x2N = У2,

то аналог функционального уравнения (4) приобретает вид:

In (у1) = max [g1(x1) + ... + gN (xn )];

X1+...+XN =У1

hN (y2) = max [gN+1(XN+1) + ■■■ + g2N (x2N)]

XN+1+...+X2 N =У2

Функции fN(yx) и hN(y2) могут быть вычислены одновременно. После этого решение исходной задачи находится путем максимизации fN (yx) + hN (y2) в области значений y1 + y2 = x; yv y2 > 0.

В ситуации, когда имеются два вида ресурсов, задача сводится к максимизации

N

R(xb ^ ..., XN ; Уь У2, ..., yN ) = 2gi (xi, У,)

,=1

при ограничениях [2, п. 2]

N N

2 x, = x; 2 Уг = у; x, > Уг > °.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

,=1 ,=1

Если действовать аналогично предыдущему, то требования к памяти ЭВМ возрастают. В этой связи авторами разработаны весьма эффективные приемы. В частности, предложено использование множителей Лагранжа из классического анализа. Характерным представляется их соображение: «Ограничения на объем памяти вычислительных машин таковы, что легче иметь дело с большим числом одномерных задач, нежели с одной многомерной задачей, а потому указанная здесь процедура очень часто дает нам возможность рассматривать задачи, которые другими способами не удалось бы решить» [2, с. 83].

Однако если вести речь о приложениях в экономике, здесь видится затруднение совсем другой природы, а именно - как построить функции gi Ц, у)? То есть, их еще требуется осмысленно интерпретировать, в отличие от одномерного случая: «затраты - доход». Поэтому предвзятым следует назвать утверждение: «Поскольку численная реализация динамического программирования весьма сложна, т. к. требует большого объема памяти ЭВМ, то его целесообразно применять в тех случаях, когда необходимо многократно решать типовые задачи (скажем определение оптимального режима полета самолета при меняющихся погодных условиях)» [3]. И это в статье из Математической энциклопедии где, казалось бы, каждое слово должно быть выверенным.

На самом деле, следовало сказать, что одномерная задача для функций gi Ц) решается очень просто. В самом деле, фактически имеем в (4) вычисление fN(x) с шагом по аргументу x. При этом сохраняется максимальный результат, а если требуется, то и значения, находящиеся неподалеку. Процедура последовательно повторяется с увеличением количества бизнес-процессов (Ы = 2, 3, ...). На этом, с вычислительной точки зрения,-всё; остается лишь анализировать варианты, используя различного рода вариативность. Двумерная задача, с gi Ц, у^, также не вызывает затруднений. Когда же размерность функций gi высока, что является характерным для ряда технических приложений, возникают серьезные осложнения, которые, однако, испытывают любые методы численной реализации.

Некоторые процессы, в отличие от кратко охарактеризованных выше постановок (придание многошаговости), естественно возникают в динамической форме. Это, в частности, задача управления запасами [2, п. 3]. Рассмотрено формирование запасов товара одного наименования. Предполагается, что в каждый из конечного числа промежутков времени производятся заказы на дальнейшие поставки этого товара на склад, причем их немедленно выполняют. После того, как заказ на товар удовлетворен, на него возникает спрос. Этот спрос удовлетворяется по мере возможностей, причем каждое превышение спроса над уровнем запасов ведет к убыткам.

Математическое ожидание издержек для Ы-шаго-вого процесса при начальном запасе и оптимальной политике заказов

ЕКОНОМІКА економіко-математичне моделювання

ЕКОНОМІКА економіко-математичне моделювання

fN (x) = min

y>x

к(У - x) + / p (s - у)р(s) ds +

+ fN-l (0)/ p(s) ds + / fN-l (y - s)p(s)d s] N > 2;

fl( x) = min

y>x

к(У - x) +/ p (s - y)p(s) ds

Здесь даны функции:

ty(s)ds - вероятность того, что размер спроса находится между величинами з и

к(х) - стоимость заказа партии размером х единиц для пополнения уровня запасов;

р(х) - стоимость заказа партии размером х единиц для покрытия неудовлетворенного спроса, или размер штрафа.

Для упрощения предполагается, что эти функции не зависят от времени. Целью является определение политики заказов, которая бы минимизировала ожидаемые расходы за весь Ы-шаговый процесс. На первом шаге заказывается у - x единиц товара. Соответственно уровень запасов поднимается до величины у. В таком случае ожидаемые издержки

к (у - X):

: min

y>x

к(У - x) + / p(s - у)p(s)ds

В отношении данной трактовки Р. Беллман отмечает: «Хотя может показаться странным заказывать количество у - x вместо, скажем, у, однако оказывается, что проще представлять себе заказ, пополняющий величину запасов до определенного уровня у. Оптимальный уровень запасов оказывается более существенной величиной, чем размер заказа» [1, с. 186].

Весьма интересен линейный случай:

к (г) = кг, р (г )= рг, к, р > 0,

поскольку оптимальная политика является очень прозрачной. Для каждого Ы существует такой уровень запасов 5Ы, что если x > 8Ы, мы ничего не заказываем, если же x < 8Ы, мы заказываем 8Ы- x, поднимая уровень запасов до БЫ [2, с. 188]. Конечно, у данной задачи может быть множество других интерпретаций. В частности, речь может идти о формировании резервного фонда страховой компании.

Различные обобщения рассмотренной задачи представлены в работах [1, п. 5; 4, п. 10]. Например, издержки предполагаются пропорциональными размерам партий товара; учитываются скидки, запаздывание со штрафом, или же неограниченность процесса во времени. Представляет интерес соображение: «Часто оказывается, что определение оптимальной стратегии основывается на гораздо меньшем числе различных факторов, чем это могло бы показаться на первый взгляд. Так, в задачах минимизации ожидаемой стоимости нам в некоторых случаях достаточно знать только ожидаемый спрос или некоторый другой простой функционал от функции распределения» [4, с. 220].

Отметим, что среди весьма большого спектра поднятых в книге [2] тем, присутствует также оптимизация собственно алгоритмов поиска экстремумов. В целом, упомянутый «спектр» характеризует выдержка: «Как показано на предыдущих страницах, процессы динамического программирования могут принимать различные формы. Мы изучали процессы, в которых переменные, описывающие политику, могут принимать дискретное множество значений, и процессы, где они могут принимать континуум значений. Иногда область допустимых решений ограничивалась дополнительными условиями. Параметры состояния, описывающие систему, были как дискретными, так и непрерывными, а сами процессы - как детерминированными, стохастическими, так и адаптивными.

В первых десяти главах дан единый вычислительный алгоритм, одинаково применимый к линейным и нелинейным критериям, к детерминированным и стохастическим процессам. Будучи общим методом, он не нуждается в перекройке для применения к конкретному процессу. В гл. 10 показано, как можно, воспользовавшись конкретной аналитической структурой задачи, дать вычислительные алгоритмы более простые, чем даваемые классическими методами или прямым методом динамического программирования» [2, с. 381]. Следует заметить, что выше мы находились в рамках «прямого» метода.

Очень интересна рассмотренная Р. Беллманом задача из теории игр [5, с. 307 - 317]. Игрок получает информацию об исходах не связанных между собой состязаний по каналу с шумами. Пусть p -вероятность правильной передачи сообщения; q = 1 - p -вероятность ошибки. Игрок имеет начальный капитал x. Если шумы в канале связи отсутствуют и p = 1, то игрок автоматически выигрывает каждое пари. Если игрок стремится к тому, чтобы максимизировать математическое ожидание своего капитала после N состязаний, то очевидно, ему нужно ставить все свои деньги каждый раз, когда p > 1/2, и не ставить ничего, когда p < 1/2.

Однако эта стратегия сопряжена с риском. В действительности, для любого p > 1/2, но меньше 1, вероятность того, что на одном из шагов данного процесса, игрок потеряет все свои деньги - очень велика. Предположим теперь, что игрок собирается более осторожно выбрать стратегию, а именно так, чтобы обезопасить себя от возможности разорения. Рассмотрим тогда ситуацию, в которой игрок собирается максимизировать математическое ожидание логарифма той суммы, которая останется у него после N состязаний. Этот критерий полностью исключает возможность принятия любой стратегии, в которой возможно уменьшение капитала до нуля.

Математическое ожидание логарифма конечного капитала игрока после N игр при условии, что он начал игру с капиталом x и придерживался оптимальной стратегии

In (x) = max [pIn-1(x + y) +1_ 1 x - y)],

0<y<x (6)

f1( x) = log X + K,

где K =

log2 + plogp + qlogq, p > q; 0, p < q,

У

У =

(7)

и оказывается - оптимальная стратегия не зависит от значения Ы в (6), что, на первый взгляд, кажется неожиданным. В самом деле, она является следующей:

Г (р - я)х, р > я;

0, р < 4.

Далее рассмотрены случаи: характеристики канала изменяются в течение времени; правильность передачи сообщения на каждом шаге зависит от правильности предыдущего сигнала; сигнал может содержать любой символ из некоторой совокупности; источник может генерировать несчетное множество сигналов; продолжительность процесса - стохастическая величина, которая зависит от последовательности принимаемых решений; вероятностные свойства канала известны не полностью.

Заметим, не часто задача из области теории игр допускает решение в замкнутом виде, аналогично (7). Касаясь практических приложений, представим владельца киоска, который регулярно закупает для реализации мелкий опт одинакового ассортимента. За какой-то период времени статистика таких операций становится достаточно представительной. Пусть в 80% операций ему сопутствовал успех. Значит р = 0,8, соответственно q = 0,2. На основании (7) можно сделать вывод: владелец не разорится, если будет пускать в оборот

0,8 - 0,2 = 0,6, то есть, 60% имеющихся средств. Конечно, могут быть сюрпризы налогообложения и т. п. моменты, однако база для дальнейших размышлений является достаточно солидной.

Известный специалист в области оптимального управления К. А. Лурье высказался так: «Хорошо известна роль, которую в теории оптимального управления играет принадлежащий Р. Беллману метод динамического программирования. Наряду с принципом максимума Понтрягина этот метод представляет важное средство решения задач об оптимальном управлении, особенно хорошо приспособленное для широкого использования ЭВМ» [6, с. 386]. Кстати, для рассмотренного им класса задач МДП оказался гораздо более предпочтительным.

Однако если обратиться к книге наиболее авторитетного специалиста бывшего СССР в области численной реализации методов оптимального управления акад Н. Н. Моисеева [7], впечатление становится другим. Результат, установленный Л. С. Понтрягиным [8], назван замечательным: «Благодаря принципу максимума, редукция вариационной задачи к краевой получила широкое распространение и в настоящее время лежит в основе большинства используемых алгоритмов» [7, с. 46].

Касаясь МДП, Н. Н. Моисеев с первой же строки констатирует, что его истоки «лежат в замечательных исследованиях русского математика А. А. Маркова по теории «марковских процессов». Их основная особенность состоит в том, что последующее течение процесса зависит только от состояния в данный момент и не зависит от его предыстории» [7, с. 229]. Но марковские процессы находятся в центре внимания Р. Беллмана, как вследствие упомянутого их свойства, так и по ряду других причин [2, п. 11; 5, п. 11]. И, вместе с тем, принцип

оптимальности (см. выше), а также идея погружения задачи в динамический процесс распределения, предложенные Р. Беллманом, совершенно оригинальны.

Обнаружить формулировку принципа и расстановку акцентов на счет приоритетности идей Р. Беллма-на в книге [7] не удалось. Возникает вопрос - в чем источник такой предвзятости, ведь суть вопроса не просто в установлении исторической справедливости, от трактовки МДП ученым высшей квалификации зависит объективность нашего понимания ценности метода? Ситуацию разъясняет сборник биографических очерков «Моисеев Никита Николаевич. Как дожить до завтрашнего дня 1917 - 1993» в электронной библиотеке.

Итак, начиная с середины 1950-х гг. между сверхдержавами СССР и США развернулась острейшая борьба за освоение космического пространства. При этом в центре внимания оказались задачи оптимального управления движением космических объектов. В служебном отчете Н. Н. Моисеев изложил численный метод многошагового принятия решений; одновременно В. С. Михалевич (Киев), впоследствии академик, опубликовал аналогичный результат. Вскоре они узнали, что раньше, по нашей оценке - на 12 лет, вышли в свет работы Р. Беллмана по МДП в более общей постановке рассматриваемых задач. Кстати, Н. Н. Моисеев и Р. Беллман часто обсуждали общие проблемы, их связывала многолетняя дружба.

Следует заметить, книга Н. Н. Моисеева, вышедшая в 1975 г., до настоящего времени остается, можно сказать, знаковой. Затем, со слов Н. Н. Моисеева в его мемуарах, интерес к математическому управлению упал, поскольку был достигнут военный паритет между СССР и США на уровне, позволяющем уничтожить планету в случае возникновения конфликта. США перенесли профильные разработки в плоскость управления промышленностью, включая информационные технологии. СССР, напротив, «успокоился», ученые стали не нужны (соответственно перестали выходить прорывные публикации), произошел «застой», окончившийся распадом империи.

В контексте настоящего изложения следует констатировать, что книгу Н. Н. Моисеева [7], несомненно, очень во многом достойной личности и ученого, нельзя рассматривать как объективный обзор эффективности методов оптимального управления. Это отчет руководителя представительного ведомства, в общем,- из сферы ВПК, о результатах своего коллектива и близких к нему специалистов. Поэтому название соответствующего раздела его книги звучит так: «Последовательный анализ вариантов. Схемы динамического программирования» (п. 3.3). Здесь алгоритмы «киевский веник» (В. С. Михале-вич и сотрудники); «блуждающая трубка» (Н. Н. Моисеев и сотрудники) и т. п., Р. Беллман упоминается вскользь.

Поскольку в [7] речь об успехах советской науки, принцип максимума Л. С. Понтрягина высвечен в качестве большого достижения. Вообще, как представляется, если даже сейчас экономист или инженер хотел бы, впервые заняться оптимизацией, его взору предстали бы две вершины: принцип максимума и динамическое

ЕКОНОМІКА ЕКОНОМІКО-МАТЕМАТИЧИЕ МОДЕЛЮВАННЯ

ЕКОНОМІКА економіко-математичне моделювання

программирование. Более того, коллектив Л. С. Пон-трягина, имея, так сказать, принцип максимума, фактически присвоил себе и обоснование МДП, о чем свидетельствует выдержка:

«Для решения задач динамического программирования обычные методы математического анализа либо вообще не применимы, либо приводят к огромному числу вычислений» [3]. То есть, значимость МДП не отрицается. И далее: «Метод динамического программирования был предложен Р. Беллманом. Строгое обоснование метода динамического программирования было получено в результате работ Л. С. Понтрягина и его учеников по математической теории управляемых процессов». Здесь очень важный момент, поскольку в современной математике (во всяком случае, постсоветской), главным является строгость доказательства, а не приведшая к его необходимости идея, если, конечно, она не принадлежит такой личности, как Л. С. Понтрягин (мы вернемся к этому ниже, ссылаясь на Н. Н. Моисеева).

Из монографии [8, с. 80]: «Метод динамического программирования был разработан для нужд оптимального управления процессами, имеющими гораздо более общий характер, чем процессы, описываемые системами дифференциальных уравнений. Поэтому метод динамического программирования носит более универсальный характер, чем принцип максимума. Однако в отличие от последнего, этот метод не имеет строгого логического обоснования во всех тех случаях, когда им можно с успехом пользоваться как ценным эвристическим средством. ...

Обоснование метода динамического программирования, данное Беллманом, предполагает, что к естественным условиям задачи (см. нашу теорему 1) добавляется еще одно существенное требование - требование дифференцируемости определяемой ниже функции ы(х). Это предположение не вытекает из постановки задачи и представляет собой ограничение, которое, как мы увидим ниже, не выполняется даже в самых простых примерах». Заметим, что 1-е издание данной книги 1961 г. удостоено Ленинской премии.

При этом изложение ведется под углом зрения задачи оптимального быстродействия. Авторы показали, как из МДП может быть выведен принцип максимума [8, с. 83 - 85]. Однако о «строгом» обосновании МДП (см. ссылку на статью [3] выше) здесь не упоминается. Эта тема в центре внимания книги В. Г. Болтянского [9], которая также посвящена задаче быстродействия. Здесь присутствует подраздел «Обоснование метода динамического программирования и достаточные условия оптимальности». Следует заметить, что Р. Беллман долгое время проработал в RAND Corporation, занимаясь исследованиями для ВВС США.

Проблематику оптимального управления полетами, включая и аспект быстродействия, отражают, в частности, его публикации [2, п. 6; 10]. Причем здесь присутствуют функциональные уравнения, как содержащие производную dxw(x), так и без нее. Ситуацию проясняет Ф. Чаки [11, с. 217 - 220]. Уравнение, носящее имя Гамильтона - Якоби - Беллмана, имеет две формы

представления, в одном из которых производная функции ы(х) отсутствует. Его, может быть, и следует использовать в задаче быстродействия. Заметим, преобразования Р. Беллмана весьма внимательно исследованы в работе [6]. Причем К. А. Лурье не высказал каких-либо замечаний и, более того, предложил свой вывод функционального уравнения Р. Беллмана [6, п. 4.2]. Это весьма серьезный аргумент в пользу корректности обоснования МДП.

Что же касается упомянутой работы В. Г. Болтянского [9], то в ней, по-видимому, содержится еще один альтернативный вывод условия оптимальности МДП. Кстати, Ф. Чаки [9], аналогично [8], наоборот, вывел принцип максимума из МДП. Другие выводы такого же характера содержатся в статье Р. Копа [12]. Однако авторы [8, 9] ведут изложение применительно к задаче оптимального быстродействия (выход спутника на орбиту и т. п.), у которой есть дифференциальные уравнения. Почему бы ясно не сказать, что на остальной класс задач применения МДП (в частности, об оптимальном распределении ресурсов, см. выше) мы в ракурсе своей строгости не претендуем?

Крайне интересно разъяснение ситуации, которое представил в мемуарах (ссылка выше) Н. Н. Моисеев. Приведем пространную выдержку: «Вывод на орбиту некоторого груза требует огромных затрат энергии. Поэтому становится весьма актуальной проблема выбора такой траектории стартового участка космической ракеты, при движении вдоль которой, с той же затратой топлива, можно было бы вывести на орбиту лишний килограмм полезного груза. Первый, который понял суть этой проблемы, был Д. Е. Охоцимский [впоследствии академик, лауреат, герой и т. д.]. Еще в 46-ом году, будучи студентом, он опубликовал работу, ей посвященную.

Оказалось, что задачи выбора оптимальной траектории выходят за рамки классического анализа (того вариационного исчисления, которое было создано Эйлером и Лагранжем) и требуют разработки новых математических подходов. И он уже содержался в знаменитой статье Охоцимского. Но решающий шаг, увы, сделал не он. А о статье Охоцимского помнят только отдельные специалисты. Дело в том, что лет через пять после этой работы Л. С. Понтрягин опубликовал свой принцип максимума [из других источников, в частности [11], это 1956 год, то есть, имеем 10 лет разницы].

Им была предложена чрезвычайно простая и элегантная конструкция, позволяющая сводить эти нестандартные задачи анализа к краевым задачам для обыкновенных дифференциальных уравнений - задачам трудным, но все же разрешимым классическими методами численного анализа. Но, по моему глубокому убеждению, решающий шаг все-таки был сделан Охоцим-ским - именно он впервые показал, пусть на примере, как надо решать такие задачи. Для этого он использовал так называемые игольчатые вариации и объяснил некоторые особенности оптимальных траекторий. Впрочем, игольчатые вариации придумал еще Лежандр в начале XIX века, но кто помнит о таких вещах?

Так или иначе, заключительное слово было сказано Понтрягиным. И это - «абсолютная истина»! Мне всегда было жаль, что «понтрягинцы» не ссылались на основополагающую работу студента-дипломника мехмата МГУ, каким был в ту пору Дмитрий Евгеньевич Охоцимский. Впрочем, таков стиль наших математиков - не замечать того, что сделано не ими. Понтрягин-цев - особенно. Мне всегда казалось, что самое главное в науке - понять основную сущность, основную идею, дать ее рельефную интерпретацию.

Строгое доказательство, возможность его предельного обобщения также необходимы - это закрепление позиций знания, но истинное развитие науки определяют интерпретации, они несут нечто существенно более важное, чем строгое доказательство - то понимание, которое необходимо для продуцирования новых идей. Не чисто спортивный результат, не техническое преодоление трудностей, что традиционно особенно ценится математиками, а понимание «души проблемы» - вот, что меня всегда привлекало в первую очередь. Вот почему я так ценю работу Охоцимского. Почему и сам ушел из чистой математики».

Э. Копп отмечает: «Принцип максимума Понтря-гина представляет собой весьма изящный метод исследования вариационных задач со связями, ограничивающими управления. Что же касается вычислительной стороны дела, то вопрос о каких-либо существенных преимуществах, даваемых этим методом, остается дискуссионным» [12].

По мнению автора данной статьи: «Преимущество схемы динамического программирования состоит в том, что она допускает систематический процесс численного решения. Для систем с достаточно большим числом степеней свободы объем вычислений становится несовместимым с возможностями современной вычислительной счетно-решающей техники. Преимущество принципа Понтрягина, как и других вариационных методов, состоит в том, что многие характеристики оптимальной траектории можно получить с его помощью без того, чтобы решать задачу во всем объеме».

Однако Р. Беллман, рассматривая задачу об оптимальной траектории [10] (см. также [2, п. 6]), показал, что одно- и двумерный случаи не представляют осложнений для МДП. Задача, содержащая по три проекции положения и скорости, приводит к использованию функций от шести переменных. Вместе с тем, Р. Беллман считает возможным решение такой задачи путем сокращения объема оперативной памяти за счет использования полиномиальных разложений и ряда других приемов. Следует учесть, что для широких классов задач экономического содержания подобные осложнения совсем не характерны.

Интересно представление о потенциале МДТ его создателя: «Выше мы привели очерк общей идеи полиномиального приближения. Комбинируя эту идею с различными другими приемами в форме приближения в пространстве управлений или каким-либо иным образом, можно уже в настоящее время осуществлять стандартизацию решений трехмерных

задач о траекториях, содержащих шесть переменных состояния. С помощью тех вычислительных машин, которые появятся через 10 лет, с емкостью памяти в 10 - 30 раз большей и скоростями, в 10 - 30 раз превышающими современные, мы сможем получить стандартные решения задач, содержащих такие переменные состояния, как количество топлива, массу и т. д.» [10]. Заметим, в оригинале это писалось более 50 лет назад.

Как уже отмечалось, условие оптимальности МДП может быть представлено в виде нелинейного уравнения в частных производных. Решению задач математической физики для подобного вида уравнений посвящены монографии [13, 14]. В отношении линейных задач авторы отмечают: «Эта устойчивость [вычислительного алгоритма] не является неожиданной. В действительности при некоторых весьма общих условиях она по существу гарантируется теорией динамического программирования. Решение, которое мы ищем, представляет собой оптимальный путь, соответствующий функционалу, из которого он возникает.

Принцип оптимальности указывает, как выбрать оптимальный путь, начинающийся из произвольного состояния. Если из-за погрешности вычислений мы окажемся в некотором состоянии, отличном от вычисленного, то в дальнейшем автоматически пойдем по пути, оптимальному по отношению к данному состоянию. Следовательно, на каждом шаге процесса мы осуществляем оптимизацию, основываясь на реальном состоянии. Этот многошаговый процесс принятия решений препятствует накоплению ошибок» [13, с. 52].

В сочетании с квазилинеаризацией (представляет собой развитие метода Ньютона - Канторовича) МДП использовался для решения ряда нелинейных задач [13, п. 11; 14]. При этом с целью обоснования сходимости задействован аппарат дифференциальных неравенств [15, п. 5]. В задачах экономики весьма актуальны уравнения, учитывающие запаздывания по времени, иначе говоря, система имеет «память» [14, п. 6] (здесь также привлекается МДП). В этой связи заметим, что книга [16], посвященная теории дифференциально-разностных уравнений, до настоящего времени находится в центре внимания специалистов.

Очень прозрачным в ракурсе МДП становится решение систем линейных алгебраических уравнений [17, п. 9]. Следует принять во внимание, что в том случае, когда функции gi (х) из (2), (5) являются квадратичными,- реализация МДП становится, по существу, аналитической (см. также [2, п. 10]). Иначе говоря, зависимости «затраты - доход» должны иметь вид парабол, что иногда может оказаться приемлемым. Более того, как отметил Р. П. Федоренко, аналогичный результат достигается, если начальное и конечное состояния не фиксированы и хотя бы одна из функций gi (х) в (4) является квадратичной [18, п. 44]. Заметим, что упомянутый автор представил весьма квалифицированный анализ вычислительных методов решения задач в оптимальном управлении. Практически все они подвергнуты резкой критике.

При этом стандартными он, аналогично Р. Беллма-ну, назвал алгоритмы, которые «используются в каче-

ЕКОНОМІКА ЕКОНОМІКО-МАТЕМАТИЧИЕ МОДЕЛЮВАННЯ

ЕКОНОМІКА ЕКОНОМІКО-МАТЕМАТИЧИЕ МОДЕЛЮВАННЯ

стве рабочего инструмента при решении задач оптимизации». В общем, это алгоритмы - надежные, они проверены практикой и, кроме того, не создают серьезных проблем в части доказательств корректности вычислительных процедур. Они также сравнительно не трудоемки в своей реализации. Однако таких алгоритмов, если говорить по большому счету, оказалось всего лишь пять. Среди них «дискретное динамическое программирование», то есть, работа с уравнениями вида (4), (6). Причем, остальные, в частности, линейное программирование, имеют сугубо специализированные сферы применения. Принцип максимума, кстати, отсутствует. Предельно прозрачным является доказательство сходимости дискретного МДП [19, с. 297-298].

Наконец, последняя книга ушедшего из жизни в 63 года выдающегося ученого Ричарда Беллмана (автора 619 статей и 39 книг, переведенных на многое языки) посвящена моделированию процессов фармакокинетики, реализация которых базируется на МДП [20]. Речь идет об оптимизации дозирования в организме лекарственных препаратов, количество которых может быть достаточно большим. Заменив понятие «лекарственный препарат» на ресурс, мы можем использовать тот же математический аппарат, например, в задаче оптимального обеспечения региона видами материально-финансовых ресурсов.

Подводя итог настоящего изложения, хотелось бы отметить следующее. Из названия статьи вытекает, что речь в ней пойдет о применении математического метода для решения экономических задач, и как бы подразумевается, что, скорее всего, мы будем его пропагандировать. Действительно, возможности МДП, в его интерпретации Р. Беллманом, исключительно велики. В этой связи, наверное, мнения специалистов, включая титулованных, достаточно противоречивы. Критические замечания касаются как приоритетов в части обоснования метода, так и, по существу, его корректности. В силу указанных выше обстоятельств, предметная «арена» дискуссии вокруг МДП оказалась в сфере оптимального управления движением космических объектов. Поэтому в статье пришлось много места посвятить как «космосу», так и воззрениям ученых.

Что же мы предлагаем - активно заняться внедрением МДП в практику экономико-математического моделирования? В общем, конечно,- да, но следует учесть - в статье проанализирована ситуация периода 1960 - середины 1970-х гг., о чем свидетельствует также и список литературы. Как представляется, сейчас очень актуален вопрос о том, как МДП выдержал испытание временем в условиях кардинального повышения возможностей вычислительной техники (на что он был изначально и, в первую очередь, ориентирован). Иначе говоря, целесообразно подытожить достижения, а также критические соображения в адрес МДП, а может быть, и - вновь возникшие доводы в его пользу, на текущий период времени.

И, наконец, последний момент. Весьма популярным стал метод анализа иерархий (МАИ) Томаса Саати [21]. Аналогично МДП он базируется на глубокой идее. По нашему мнению, с помощью МАИ достигнут, как иногда говорят, не улучшаемый результат рациональ-

ного синтеза возможностей человека и компьютера в поддержке принятия управленческих решений. Включая реструктуризацию проблемы, парность сравнений, оцифрование разнотипной информации. Можно предположить, что сопряжение МДП и МАИ способно пробудить какие-то синергетические начала, но сейчас не о них. Обратившись к источникам информации, мы видим повышенно активные замечания в отношении недостатков МАИ.

В связи со сказанным представляется, что многое как в отношении МДП, так и МАИ объясняет действие механизма, искажающего конструктивизм математической теории. Этот механизм включает три компонента: + если метод по настоящему эффективен, то определенный круг специалистов, работающих в области аналогичной проблематики, настраивается к нему негативно, а также не прочь позаимствовать авторство;

+ если субъект, будь-то фирма или государство, на практике убедился в полезности интеллектуального продукта, он не станет рекламировать его среди потенциальных конкурентов, а может быть, и постарается их дезинформировать;

+ существование, в большой численности, ортодоксов от математики, которые вполне могли чинить препятствия развитию методологии Р. Беллмана, однако даже в таком случае - почему бы не воспользоваться его достижениями в экономической сфере? ■

ЛИТЕРАТУРА

1. Беллман Р. Динамическое программирование / Р. Беллман. - М. : Изд-во иностр. лит., 1960. - 400 с.

2. Беллман Р. Прикладные задачи динамического программирования / Р. Беллман, С. Дрейфус. - М. : Наука, 1965. - 459 с.

3. Ашманов С. А. Динамическое программирование / С. А. Ашманов, В. Г. Карманов // Математическая энциклопедия. - М. : Советская энциклопедия, 1979. - Т. 2. -С. 154 - 155.

4. Беллман Р. Некоторые вопросы математической теории процессов управления / Р. Беллман, И. Гликсберг, О. Гросс. - М. : Изд-во иностр. лит., 1962. - 336 с.

5. Беллман Р. Процессы регулирования с адаптацией / Р. Беллман. - М. : Наука, 1964. - 360 с.

6. Лурье К. А. Оптимальное управление в задачах математической физики / К. А. Лурье. - М. : Наука, 1976. - 479 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Моисеев Н. Н. Элементы теории оптимальных систем / Н. Н. Моисеев. - М. : Наука, 1975. - 527 с.

8. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкерлидзе, Е. Ф. Мищенко. - М. : Наука, 1976. - 392 с.

9. Болтянский В. Г. Математические методы оптимального управления / В. Г. Болтянский. - М. : Наука, 1969. -408 с.

10. Беллман Р. Об определении оптимальных траекторий методом динамического программирования / Р. Беллман / Методы оптимизации с приложениями к механике космического полета / Под ред. Дж. Лейтмана. - М. : Наука, 1965. - С. 338 - 350.

11. Чаки Ф. Современная теория управления / Ф. Чаки. -М. : Мир, 1975. - 424 с.

12. Копп Р. Принцип максимума Понтрягина / Методы оптимизации с приложениями к механике космического полета / Р. Копи / Под ред. Дж. Лейтмана. - М. : Наука, 1965. -С. 307 - 337.

13. Беллман Р. Динамическое программирование и уравнения в частных производных / Р. Беллман, Э. Энджел. -М. : Мир, 1974. - 208 с.

14. Беллман Р. Квазилинеаризация и нелинейные краевые задачи / Р. Беллман, Р. Калаба. - М. : Мир, 1968. - 184 с.

15. Беккенбах Э. Неравенства / Э. Беккенбах, Р. Беллман. - М. : Мир, 1965. - 276 с.

16. Беллман Р. Дифференциально-разностные уравнения / Р. Беллман, К. Кук. - М.: Мир, 1967. - 548 с.

17. Беллман Р. Введение в теорию матриц / Р. Беллман. - М. : Наука, 1969. - 368 с.

18. Федоренко Р. П. Приближенное решение задач оптимального управления / Р. П. Федоренко. - М. : Наука, 1978. - 488 с.

19. Иоффе А. Д. Теория экстремальных задач / А. Д. Иоффе, В. М. Тихомиров. - М.: Наука, 1974. - 480 с.

20. Беллман Р. Математические методы в медицине / Р. Беллман. - М. : Мир, 1987. - 200 с.

21. Саати Т. Аналитическое планирование. Организация систем / Т. Саати, К. Кернс. - М. : Радио и связь, 1991. -224 с.

REFERENCES

Bellman, R., and Kuk, K. Differentsialno-raznostnye ura-vneniia [Differential-difference equations]. Moscow: Mir, 1967.

Bellman, R. Vvedenie v teoriiu matrits [Introduction to the theory of matrices]. Moscow: Nauka, 1969.

Bellman, R. Matematicheskie metody vmeditsine [Mathematical methods in medicine]. Moscow: Mir, 1987.

Chaki, F. Sovremennaia teoriia upravleniia [Modern control theory]. Moscow: Mir, 1975.

Fedorenko, R. P. Priblizhennoe reshenie zadach optimalno-go upravleniia [Approximate solution of optimal control problems]. Moscow: Nauka, 1978.

Ioffe, A. D., and Tikhomirov, V. M. Teoriia ekstremalnykh zadach [The theory of extreme problems]. Moscow: Nauka, 1974.

Kopp, R. "Printsip maksimuma Pontriagina" [Pontryagin maximum principle]. In Metody optimizatsii s prilozheniiami k mekhanike kosmicheskogo poleta, 307-337. Moscow: Nauka, 1965.

Lure, K. A. Optimalnoe upravlenie vzadachakh matemat-icheskoy fiziki [Optimal control in problems of mathematical physics]. Moscow: Nauka, 1976.

Moiseev, N. N. Elementy teorii optimalnykh sistem [Elements of the theory of optimal systems]. Moscow: Nauka, 1975.

Pontriagin, L. S., Boltianskiy, V. G., and Gamkerlidze, R. V. Matematicheskaia teoriia optimalnykh protsessov [Mathematical theory of optimal processes]. Moscow: Nauka, 1976.

Saati, T., and Kerns, K. Analiticheskoe planirovanie. Organi-zatsiia sistem [Analytical planning. Organization systems]. Moscow: Radio i sviaz, 1991.

Ashmanov, S. A., and Karmanov, V. G. "Dinamicheskoe programmirovanie" [Dynamic programming]. In Matematicheskaia entsiklopediia, 154-155. Moscow: Sovetskaia entsiklope-diia, 1979.

Bellman, R., and Dreyfus, S. Prikladnye zadachi dinami-cheskogoprogrammirovaniia [Dynamic programming. Applications of dynamic programming]. Moscow: Nauka, 1965.

Bellman, R. Dinamicheskoe programmirovanie [Dynamic programming]. Moscow: Izdatelstvo inostrannoy literatury,

1960.

Bellman, R., Gliksberg, I., and Gross, O. Nekotorye voprosy matematicheskoy teorii protsessov upravleniia [Some of the mathematical theory of control processes]. Moscow: Izdatel-stvo inostrannoy literatury, 1962.

Bellman, R. Protsessy regulirovaniia s adaptatsiey [Regulatory processes of adaptation]. Moscow: Nauka, 1964.

Boltianskiy, V. G. Matematicheskie metody optimalnogo upravleniia [Mathematical methods of optimal control]. Moscow: Nauka, 1969.

Bellman, R. "Ob opredelenii optimalnykh traektoriy met-odom dinamicheskogo programmirovaniia" [Determination of optimal trajectories of dynamic programming method]. In Metody optimizatsii s prilozheniiami k mekhanike kosmicheskogo poleta, 338-350. Moscow: Nauka, 1965.

Bellman, R., and Endzhel, E. Dinamicheskoe programmirovanie i uravneniia vchastnykh proizvodnykh [Dynamic programming. Dynamic programming equations and differential equations]. Moscow: Mir, 1974.

Bellman, R., and Kalaba, R. Kvazilinearizatsiia i nelineynye kraevyezadachi [Kvazilinearizacia and nonlinear boundary value problems]. Moscow: Mir, 1968.

Bekkenbakh, E., and Bellman, R. Neravenstva [Inequalitya].

Moscow: Mir, 1965.

BI3HECIHQOPM № 6 '2013 119

www.business-inform.net

ЕКОНОМІКА економіко-математичне моделювання

i Надоели баннеры? Вы всегда можете отключить рекламу.