№ 6 (42) 2012
Е. И. Веремей, докт. физ.-мат. наук, профессор Санкт-Петербургского государственного университета
Оптимизационный подход к моделированию и разработке информационно-управляющих систем
Различные подходы к построению математических моделей существующих и создаваемых информационно-управляющих систем определяют разнообразные варианты постановки оптимизационных задач и методы их решения. Тем не менее, в последние десятилетия определилось в известной мере универсальное множество задач, основанное на единой оптимизационной идеологии.
Введение
Исследование и разработка современных информационно-управляющих систем в подавляющем большинстве случаев осуществляются в рамках различных формализованных подходов, основанных на математических моделях таких систем и протекающих в них процессов.
Применительно к реально существующим системам, для которых модели отсутствуют, создание последних составляет суть задач идентификации, которые решаются на начальных стадиях исследовательских работ.
Если же создаются новые информационно-управляющие системы, то построение их математических моделей является целью исследовательского проектирования, направленного на достижение предварительно поставленных на формальном уровне целей.
Так или иначе, но постановка этих целей, прежде всего, базируется на формировании математического описания системы, причем оно должно обладать наперед заданной функциональностью, наделенной вполне определенными свойствами и особенностями, характеризующими конкретную систему и соответствующие ей информационные процессы.
Следует отметить, что построение математических моделей является исключитель-
но сложной проблемой, от решения которой в значительной мере зависит эффективность всех последующих этапов исследований, проектирования и реализации. Очевидно, что хорошо построенная математическая модель реального объекта или явления должна удовлетворять двум противоречивым требованиям.
С одной стороны, она должна быть достаточно детальной, чтобы с приемлемой мерой адекватности отражать все основные особенности моделируемой реальности.
С другой стороны, математическая модель должна быть достаточно простой, чтобы ее использование в рамках формализованных подходов позволяло получать решения соответствующих математических задач. Если же математическая модель является предметом аналитического поиска, то возникает дополнительное требование практической реализуемости полученного аналитического проекта в виде конкретных устройств или алгоритмов обработки информации.
Различные варианты математических моделей существующих и создаваемых информационно-управляющих систем предполагают разные варианты постановки и методы решения задач их поиска. Тем не менее, в последние десятилетия сложился в известной мере универсальный круг задач, определяемых единой теоретической и практической идеологией.
-ч ПРИКЛАДНАЯ ИНФОРМАТИКА
№ 6 (42) 2012 ' -
Речь идет о такой формализации задач моделирования и проектирования, которая приводит к оптимизационной постановке [1, 2], что позволяет широко применять современные методы численного анализа и компьютерные технологии на всех этапах их решения. При этом повышаются эффективность и качество исследуемых и разрабатываемых систем и существенно сокращаются сроки проведения проектных и исследовательских работ, поскольку специалисты освобождаются от ряда проблем, решение которых можно автоматизировать.
При подобной формализации искомые (настраиваемые) элементы системы, а точнее — их математические модели формируются как результаты решения оптимизационных задач по отношению к конкретным | функционалам, заданным на допустимых § множествах варьируемых элементов. ^ Для получения строгой математической Л постановки задач оптимизации предвари-§ тельно необходимо:
[I • сформулировать содержательные и формализованные цели моделирования, § обусловленные конкретной функциональ-
=| ностью системы; §
|1 • указать элементы искомой математической модели, которые изначально зада-
щ ны, а также те ее части, которые подлежат
о выбору;
^ • определить ограничения и требования,
^ предъявляемые к модели в целом и к ее от-
| дельным элементам;
■с • задать количественные ограничения
§ на параметры системы и характер проте-
§ кающих в ней процессов;
Ц • выбрать совокупность показателей ка-
2 чества функционирования системы.
§ С учетом полученных результатов при
Ц создании любой информационно-управляю-
>5 щей системы формулируется содержательная задача построения ее математической
§■ модели: для принятой структуры системы
| необходимо обеспечить достижение постав-
| ленных целей при соблюдении всех усло-
с5 вий, требований и ограничений.
В зависимости от конкретной ситуации, в соответствии с содержательной постановкой задачи формулируется тот или иной вариант оптимизационной задачи, решение которой ведет к построению искомой модели. Однако при всем разнообразии таких вариантов существует определенная единая основа применения оптимизационного подхода, рассмотрению которой и посвящена данная статья.
Общая идеология оптимизационного подхода
Основу оптимизационных задач составляет формализация представления о качестве математических моделей информационно-управляющих систем. Она предполагает, прежде всего, построение некоторой совокупности количественных характеристик качества, величины которых зависят от принимаемых проектных решений по их выбору. Такими характеристиками могут служить различные функционалы, задаваемые в соответствующих метрических пространствах, элементами которых служат искомые модели.
Следует заметить, что задача моделирования не обязательно ставится как задача поиска экстремума тех или иных характеристик качества. Тем не менее, идеология оптимизационной формализации оказывается применимой в подавляющем большинстве практических ситуаций и в этом смысле является универсальным средством привлечения современных компьютерных технологий.
Для пояснения смысла последнего утверждения рассмотрим множество X элементов х произвольной природы, которое будем трактовать как множество возможных проектных решений по построению математической модели существующей или проектируемой информационно-управляющей системы. Будем считать, что это множество является метрическим пространством с конкретной метрикой р(х1,х2), определяющей расстояние между двумя любыми элементами х1, х2 е X.
№ 6 (42) 2012
d(x,G)
X
Рис. 1. Пространство возможных и желаемых проектных решений
На множестве X выделим некоторое подмножество G (рис. 1), которое назовем множеством желаемых (допустимых) проектных решений. Такое выделение определяется совокупностью условий, требований и ограничений, которым должна удовлетворять создаваемая модель. По существу, задача исследователя состоит в том, чтобы выбрать в качестве проектного решения любой элемент из заданного множества G (оно полагается не пустым).
Следует отметить, что для реальных задач поиск элемента, принадлежащего множеству желаемых решений, как правило, не решается простыми, а тем более очевидными способами.
Это значит, что если без принятия специальных мер осуществить произвольный выбор какого-либо решения х, то чаще всего оно окажется за пределами множества G. Иными словами, если ввести расстояние от точки х до множества G
d (x,G) = inf р( x, g),
qeG
ны коэффициентов ap+1, ap+2,
Очевидно, что произвольный выбор величин
коэффициентов а1, a2, ..., ap не гарантирует расположение корней полинома Д(г) внутри единичного круга на комплексной плоскости, что для цифрового фильтра недопустимо.
Если использовать в качестве критерия расстояние (1), то требованиям проектирования удовлетворяет только выбор элемента с d (х,Ь) = 0, представляющий собой граничную или внутреннюю точку множества желаемых решений. В подобной ситуации целесообразно определить некоторый единый подход, позволяющий формально отыскать элемент х, который бы принадлежал множеству G. В качестве такого подхода можно предложить постановку оптимизационной задачи в виде
J(x) = d(x,G) i min,
x eX
(2)
(1)
то для указанного случайного варианта с большой вероятностью получим d(х,G) > 0.
Простейшим примером служит выбор величин коэффициентов a2, ..., ap характеристического полинома q-й степени (4 > P)
Д(г) = ^ + а^4 -1 + ... + apzq -р + + ар- Р-1 + ••• + ая+ ая
цифрового фильтра, для которого величи-
а4 заданы.
'S £
£
заключающейся в минимизации расстояния (1) от произвольной текущей точки x до множества G. Заметим, что если это множество не пусто, то решение задачи (2) существует. А если множество G состоит из более чем одного элемента, то такое решение не является единственным. На любом элементе из множества G функционал J(x) принимает нулевое минимальное значение, причем любое из решений задачи соответствует желаемой модели системы.
В связи с тем, что в основе предлагаемого подхода лежит оптимизационная задача (2), возникает естественный вопрос о методах ее решения, которые по существу определяют и методы формирования желаемой модели (проекта) соответствующей информационно-управляющей системы.
Отметим, что при практическом построении математических моделей крайне редко встречаются ситуации, когда решение поставленной задачи может быть найдено аналитическим путем. В связи с этим обстоятельством наиболее реальным вариантом следует считать формирование специальных численных методов, которые позволяют построить такую последовательность [xt}e X проектных элементов, что выполняется условие lim [xi} = x0 e G.
33
№ 6 (42) 2012
Естественно, что в силу универсальности оптимизационного подхода желательно использовать и некоторую единую идеологию формирования численных методов решения задач типа (2), которую разумно базировать на применении необходимых условий локального экстремума.
Далее будем считать, что пространство X является линейным пространством, на котором задана норма ||x||, причем метрика введена через эту норму. Достижение в точке x0 е X локального минимума функционала J(x) подразумевает существование такой e-окрестности M(x0,e) этой точки x0, что для любого элемента x е M(x0,e) будет выполнено неравенство J(x) - J(x0) > 0.
Будем также считать, что функционал J(x) является сильно дифференцируемым в точке x0, т. е. его приращение при пере! ходе от точки x0 е X к точке x0 + h можно представить в виде
£
Ц А J = J( Х0 + h) - J( X0) = (3)
§ = dJ(x0,h) + r(x0,h) Vh е X. |
i Здесь функционал dJ(x0,h) (дифферен-
g циал Фреше) является линейным по аргу-
=| менту h е X и непрерывным функционалом, а для второго слагаемого в правой части вы-
■§■ полняется равенство lim r(x0,h)/| |h|| = 0 при
щ условии ||h|| ^ 0.
<э Легко доказывается, что если в точке
S^ x0 е X сильно дифференцируемый функ-
S^ ционал J(x) имеет локальный экстремум,
| то имеет место равенство =§
1 dJ(x0,h) = 0 Vh е X, (4) t
g т. е. элемент x0 — стационарная точка это-
2 го функционала.
I
3 Приведенное известное необходимое ус->ss ловие экстремума служит основой для по-jg давляющего большинства численных мето-§. дов решения задач типа (2). Существо по-| строения конкретных вариантов этих мето-! дов состоит в следующем. Прежде всего, <§ формируется указанное выше приращение
функционала, причем если его удается привести к виду (3), то делается вывод о существовании сильного дифференциала и заодно формируется выражение для него.
Далее оно приравнивается нулю и получившееся равенство подвергается различным упрощающим преобразованиям, если для этого есть возможность и необходимость. В результате формируются окончательные соотношения, которые трактуются как уравнения по отношению к неизвестным элементам х, обеспечивающим их выполнение. И, наконец, применяются те или иные численные методы для поиска решений полученных уравнений.
Обратим внимание на тот факт, что для задач типа (2) достаточность легко проверяется, поскольку она определяется принадлежностью найденного решения желаемому множеству G. Заметим также, что проверка выполнения условия х1 е G (I = 1,2,...) на каждом шаге соответствующего численного метода поиска регламентирует момент остановки вычислительного процесса.
Настройка параметров по заданным динамическим допускам
Ярким примером применения оптимизационной идеологии к формированию математического описания информационно-управляющих систем является целенаправленный поиск таких значений настраиваемых параметров моделей, которые обеспечивают принадлежность определяемых ими динамически меняющихся параметров информационных процессов заданным интервалам.
Суть подхода состоит в следующем. Предположим, что объективно существует система разностных уравнений, записанных в рекурсивной форме
х[п +1] = ^х[п],5[п]Дп]), (5)
которая идеально представляет динамику цифровой информационно-управляющей системы в дискретном времени п е N1, где
№ 6 (42) 2012
N — множество натуральных чисел. Здесь х е Е" — вектор ее состояния, d е Ец — вектор внешних воздействий, 5 е Ет — вектор состояния управляющей части системы, определяющей алгоритм ее функционирования.
Заметим, что в практических ситуациях все компоненты вектора х крайне редко доступны непосредственному измерению, в связи с чем уравнения (5) должны быть дополнены уравнениями измерения, которые для простоты рассмотрим в линейном варианте:
¡и
у[п] = Сх[п] + D5[n]
(6)
где у е Ек — вектор измеряемых переменных, к < п, С и D — матрицы соответствующих размерностей.
Несмотря на объективное существование системы (5), будем считать, что конкретный вид функции F в ее правой части не известен и является предметом поиска. Если эта функция (или определенное приближение к ней) будет найдена, будет сформирована искомая математическая модель.
Рассмотрим определенное движение х = х = {XX[п]} реальной информационно-управляющей системы, удовлетворяющее (5), которое регламентируется конкретными начальными условиями х[0] = х 0, а также заданными на отрезке п е[0^] дискретного времени последовательностями 5 = {5[п]}, d = { [п]}. 1 5
В частности, если это движение реализуется в ходе проведения специального эксперимента с реальной системой, то на основе измерений можно зафиксировать его результат в виде записи выходной последовательности у = {у[п]}.
Теперь введем в рассмотрение искомую математическую модель объекта, которая, естественно, отличается от моделируемой системы (5), (6):
Здесь х8 е Еф (ф < V) — вектор состояния модели, у8 е Ек — вектор измерений, век- Ц торы 5 и d имеют тот же смысл, что и для ^ системы (5), однако в отличие от нее функ- ^ ция Fs (х8, известна, но неизвестным является вектор h е Ер параметров модели. Если его найти тем или иным способом, построение модели (7) будет завершено.
Зафиксируем некоторый конкретный вектор h и получим решение х8 = х8 = {[п,К|} уравнения состояния системы (7) при
тех же управляющем 5 = 5 = {5[п]} и внешнем воздействии d = ^ = {[п]}, при которых строилось движение х = {зё[п]} реального объекта (3) в ходе эксперимента. В качестве начальных условий х8 [0] = х08 для уравнений модели примем любой вектор х08, удовлетворяющий равенству у 8 [0] = С х0 8 + Ds 5[0] = Сх0 + D5[0] = у[0].
По найденной последовательности х8 = {х8[n,h]} векторов состояния сформируем выходную последовательность у8 = {у8[п^]} для модели (7), где
у 8 [п,Ч = С х 8 [п,Ч + Ds 5[п].
Далее введем в рассмотрение последовательность х = {х[n,h]}, где
х 8 [п +1] = Fs (х 8 [п], 5[n],d[n],h), у 8 [п] = С х 8 [п] + Ds 5[п].
(7)
х[п,Ь] = ||е[п,Ч|| ^ 1Уё7^МРё[пй], e[n,h] = у [п] - у 8 [п^],
характеризующую отклонение выхода у 8 модели (7) от экспериментально полученного выхода у моделируемой системы.
Для того чтобы оценить качество модели (7) с заданным вектором ^ введем две числовые последовательности х1 = {х1[п]} и х2 = {х2[п]} такие, что справедливы неравенства х2[п] < х1[п] Уп е N1.
Будем говорить, что модель (7) реальной информационно-управляющей системы удовлетворяет всем предъявляемым к ней требованиям (является допустимой), если вектор настраиваемых параметров h е Ер выбран так, что выполняются следующие соотношения:
35
№ 6 (42) 2012
х2 [п] < х[п,^ < х1 [п] Уп 6 [0, Щ. (8)
Иными словами, настройка параметров должна обеспечить нахождение последовательности х = {х[п,К|} в пределах заданных допусков (рис. 2).
X п
' /Г. 1 : /
-IL. - J'
\ I \
х [n,h]
х2
' /
X
о 1
4 ... N-2N-1 N
I I ä t S
t
0 §
1 f
I
to =s
и
s 00 О
!
§
§ Ьс
S?
0
=1 S
1
Рис. 2. Допустимая динамическая область для последовательности х
Если такое нахождение не имеет места, т. е. процесс не является допустимым, необходимо так изменить выбор вектора h параметров, чтобы ввести процесс в допустимую область, т. е. обеспечить выполнение ограничений (8).
Существует эффективный способ достижения этой цели путем постановки и решения специальной задачи конечномерной оптимизации. Введем в рассмотрение следующую функцию а^), определяющую меру выхода последовательности х = {х[п,К|} за пределы допустимой области в момент п:
ап (h) =
0, если x2[n] < x[n,h] < x1[n]; x[n, h] - x1 [n], если x[n, h] > x1[n]; x2[n] - x[n,h], если x[n,h] < x2[n].
Тогда общая мера выхода за пределы области на отрезке n е [0,N] может быть оп-
N
ределена суммой a(h) = ^а n (h). При этом
n=0
оптимизационная задача по обеспечению заданных динамических допусков принимает вид
a(h) ^ min. (9)
heEp
Описанный подход к поиску параметров математических моделей информационно-управляющих систем имеет весьма эффективную компьютерную поддержку в математической среде MATLAB, реализованную в рамках инструментальных средств NCD-blockset или Simulink Design Optimization (в зависимости от конкретной версии среды). Модификация указанных инструментов, позволяющая решать задачи типа (9) на определенных сужениях пространства Ep, представлена в работе [3].
Оптимизация цифровых систем с обратной связью
Типичной проблемой, которая возникает в практике проектирования цифровых систем управления и обработки сигналов, является проблема корректировки динамических свойств тех частей системы, которые задаются в виде ограничений и не допускают каких-либо изменений в процессе проектирования. В их состав могут входить реальные технические (физические, химические, биологические, экономические и т. д.) элементы либо программы, регламентирующие работу цифровых устройств, для которых отсутствуют исходные коды, что исключает возможность прямого вмешательства в их функционирование.
Если динамические свойства заданной части цифровой системы не удовлетворяют желаемым требованиям, можно косвенно воздействовать на ее свойства путем введения дополнительных цифровых элементов, влияющих на динамику. Наиболее эффективным способом, который широко используется в современных информационно-управляющих системах, служит установление обратных связей в виде элементов, которые на основе информации о доступных для измерения выходных сигналах формируют корректирующие воздействия, подаваемые на специальные входы системы. Сущность аналитического синтеза систем с обратными связями состоит в выборе их математических моделей, т. е. алгоритмов
36
№ 6 (42) 2012
функционирования корректирующих (управляющих) воздействий.
В ряде случаев синтез осуществляется путем постановки и решения соответствующих оптимизационных задач. Рассмотрим, в частности, один из наиболее характерных случаев, когда нужно определить параметры обратной связи для линейной стационарной цифровой системы (рис. 3), представленной математической моделью
(10) (11)
(е > ГВД !
1у 7 1^(7) !
Г
- Т(г)
Vи 7
и = К(*)у,
где d е Е4 — вектор внешних входных воздействий, е е Е^ — вектор контролируемых выходных переменных, и е Е™5 — вектор корректирующих воздействий, у е Ек — вектор измеряемых выходных переменных, г — комплексная переменная преобразования Лорана.
Будем считать, что Т(г) — известная передаточная матрица заданной фиксированной части (10) системы, разбиение которой на указанные блоки соответствует размерностям входных и выходных переменных.
Передаточная матрица К(г) обратной связи (11) изначально не задается и должна быть определена в процессе синтеза.
Рис. 3. Цифровая линейная стационарная система с обратной связью
Нетрудно показать, что уравнение замкнутой системы (10), (11) в изображениях по Лорану представляется в виде
/=/(К)=|| Н£,К)|| ^ теп,
(13)
где О — множество матриц с дробно-рациональными компонентами, для которых все корни характеристического полинома замкнутой системы (10), (11) расположены в открытом единичном круге на комплексной плоскости.
Выбор конкретной нормы в (13) порождает различные классы задач оптимального синтеза обратных связей в цифровых системах, среди которых в настоящее время наиболее популярными являются следующие:
— задачи о минимизации нормы ||Н|| 2 (типичными примерами служат задачи среднеквадратичной оптимизации);
— задачи о минимизации нормы ЦнЦ^ (различные варианты задач гарантирующего оптимального синтеза).
Указанные нормы соответственно задаются соотношениями
37
£
£
е = Н(г,К^, Н(*,К) = Т„( 7) + ^
+ Т12(7)К(7) [Е - Т22(7)К(7)]-1 Т21(7). (12) *
Очевидно, что передаточная матрица Н(г,К) может трактоваться как обобщенный «матричный коэффициент усиления» между внешним входным сигналом d и обобщенным выходным сигналом е системы.
Если считать целью функционирования замкнутой системы уменьшение интенсивности выходного сигнала е(Г), то целесообразно сформулировать задачу о наилучшем подавлении внешних воздействий на замкнутую систему путем уменьшения матричного коэффициента Н(г,К) в уравнении (12) за счет выбора передаточной матрицы обратной связи К(г).
При этом понятие «малости» указанного коэффициента можно ввести на базе некоторой матричной нормы ||Н(2,К)||, что порождает следующую обобщенную задачу о подавления внешних воздействий на систему:
№ 6 (42) 2012
||H||2 = J tr[H'(e-'a ,K)H(ejm ,K)]da ,
||H|| = max a[H(ejm ,K)],
где 6[H(ejm ),K] — максимальное сингулярное число матрицы H(ejm ,K).
Задачи оптимизации по нормам пространства Харди H2 и H в последние десятилетия находятся в центре особого внимания специалистов по управлению динамическими объектами. Соответствующие методы решения задач синтеза типа (13) широко используются в теоретических исследованиях и в практических разработках. Для них существует развитая программная поддержка, например, реализованная в среде пакета ! MATLAB. Тем не менее, в рамках H-теории § продолжаются интенсивные исследования, sg направленные на повышение вычислительна ной эффективности алгоритмов синтеза § и реализуемости получаемых с их помощью [I решений. Это, в первую очередь, связано ¡t с тем, что существующие алгоритмы числен-g ного решения задачи (2-Риккати и LMI-под-Ц ход) не всегда подходят для адаптивной перенастройки оптимальных обратных связей в режиме реального времени, в частности, щ для встраиваемых систем или для подвиж-<э ных объектов, поскольку их вычислительные S^ ресурсы весьма ограничены. S^ В связи с вышесказанным возникает про-| блема формирования экономичных алгоритме мов расчета, ориентированных на реализа-§ цию на компьютерах ограниченной произ-§ водительности. В известной мере проблема Ц решается в рамках альтернативного направ-J ления, объединяющего спектральные мето-§ ды синтеза, которые в ряде ситуаций позво-I ляют существенно снизить вычислительные >5 затраты на поиск решений. Примеры по-jg строения соответствующих алгоритмов да-| ны в работе [4].
| Обратим особое внимание на тот факт, | что синтез передаточной матрицы K(z) об-с5 ратной связи однозначно определяет мно-
гомерный цифровой фильтр, обладающий линейным и стационарным свойством. Его реализация в виде программного кода не вызывает никаких трудностей и легко автоматизируется. В этом смысле применение оптимизационного подхода в рассматриваемом случае можно трактовать как автоматизированное формирование программного обеспечения, реализующего обратные связи в замкнутых цифровых системах.
Ситуации с не формализуемым качеством моделирования
Современные информационно-управляющие системы являются исключительно сложными аппаратно-программными комплексами, содержащими огромное количество элементов и обладающими глубоко развитой иерархической структурой, которая, в принципе, может изменяться в процессе функционирования. В силу этого обстоятельства проблема полностью формализованного построения математического описания таких систем может оказаться слишком сложной и практически до конца не решаемой.
В частности, рассмотрим простой случай, когда по тем или иным причинам трудно построить некоторый единый функционал, характеризующий качество формируемой математической модели, т. е. на формальном математическом уровне трудно определить расстояние до множества желаемых (допустимых) вариантов. В этом случае естественно привлечь не формализуемое мнение эксперта, который в силу имеющейся у него системы предпочтений может сравнивать любые две модели и выбирать лучшую из них.
Естественно, что для использования экспертных оценок в практических задачах моделирования должны быть созданы вполне определенные условия, позволяющие эксперту формировать свое мнение относительно той или иной модели и представляемых ею информационных процессов.
Для обеспечения таких условий создается специализированный вариант эксперт-
№ 6 (42) 2012
ной системы, включающей самого эксперта и вычислительную среду, поддерживающую его действия. Она строится на базе передовых компьютерных технологий с использованием современных методов системного анализа и теории математического моделирования. Задача функционирования среды состоит в том, чтобы для любой модели М, представляющей информационно-управляющую систему, сформировать моделирующую ситуацию S(M) для оценки экспертом. Под моделирующей ситуацией будем понимать совокупность объективной информации, характеризующей выбор конкретной модели М, которая нужна эксперту для формирования своего мнения о качестве этой модели.
Неформальное оценивание качества математических моделей состоит в предоставлении возможности эксперту сравнивать любые два варианта и выбирать из них лучший. Это значит, что если имеется совокупность моделей
¡и
М1, М2,
,МК,
(14)
для которых вычислительная среда порождает соответствующие моделирующие
ситуации S(M1), S(M2).....S(MK), то эксперт,
в силу собственных не формализуемых представлений о качестве моделирования, может осуществить ранжирование ситуаций, а следовательно, и совокупности (14), например:
S(M1) ^ S(M2) S(MK) ^ М1 ^ М2 Мк.
Заметим, что если система предпочтений, на основе которой эксперт осуществляет ранжирование, транзитивна [5], то существует некоторый функционал Ф(М), соответствующий данной системе предпочтений, хотя его конкретное формальное представление для эксперта неизвестно.
Простейшая идея приближения к минимуму этого функционала состоит в выборе наилучшего решения среди конечного множества вариантов. Однако в практических
ситуациях такой выбор может потребовать слишком больших вычислительных затрат, Ц что неприемлемо для режима реального ^ времени. ^
Рассмотрим иную концепцию формирования математических моделей с использованием оценок экспертов, ограничиваясь ситуацией с выбором вектора h е Ер настраиваемых параметров для моделей типа (7), когда не формализуемое качество моделирования объективно отражается функцией Ф^), зависящей от р вещественных переменных. Основная идея здесь состоит в том, что каждый шаг приближения к минимуму этой функции связывается с некоторым направлением в пространстве Ер в сторону ее убывания. При этом по некоторому начальному вектору
h = ^ = {/7°, /.....}
вычислительная среда должна предложить новый вариант h = ^ = ^ +ре так, чтобы S(h*) ^ S(h0), где е е Ер (||е = 1) — направление движения, р — величина шага.
Очевидно, что если бы функция Ф^) была задана на формальном уровне, являясь при этом непрерывно-дифференцируемой, то это направление следовало бы определить на базе ее градиента в точке ^ е = - д/||д||, д = д^ Ф^)| Н=Н0, однако отсутствие формального описания не позволяет непосредственно найти градиент. Тем не менее, система предпочтений эксперта позволяет получить информацию о градиенте функции Ф^) [5].
Действительно, рассмотрим наряду с заданной точкой h = ^ систему вспомогательных векторов
= {, /.....+ А/...../°р },
к = 1, 2.....р,
(15)
которые расположены в достаточно малой ее окрестности. В соответствии со своими неформальными предпочтениями эксперт может ранжировать эту систему совместно с точкой h = что породит соотношения
39
№ 6 (42) 2012
Ф^0к)-Фф°) > (<)0, к = 1,р, (16)
Ф(h0')-Ф(h0у) > (<)0, I,у = 1р, у > I, (17)
в которых выбор конкретного знака неравенств однозначно определяется системой предпочтений эксперта. Функция Ф^) отражает понимание экспертом практического смысла решаемой задачи (в частности, он может оценивать ситуацию, базируясь на понятии полезности). При этом на основании формул (16) имеем:
дк =
ЭФ^)
Ф^0к) -Ф(о°
> (<)0,
к = 1, р,
I
8
^
I I
I
0 §
1 I
«
I =8 I
со
0
1
¡5 € Ьс
0
1
G = { д е Ер :дк > (<)0,к = ХрМду --Щд, > (<)0,I,у = 1р,у > /}.
...п , ^ ЭФ(h) Aф(h0,e) = р£ ек
к=1 к
У
+0(р) екдк = р(e, д),
где (е,д) — скалярное произведение векторов е и д, причем д е G.
Будем выбирать направление е еЕр (|| е|| = 1), минимизируя приращение АФ(^,е) при наличии фактора неопределенности д, что следует делать для его наихудшего значения на множестве G:
тахр(е,д) ^ тип .
деб ееЕр Ле|| =1
(20)
В работе [5] показано, что минимаксная задача (20) сводится к задаче квадратичного программирования, решением которой будет искомый вектор
е = е = агд
тип тахр(е,д).
еЕр Ле||=1 деб 1 4 '
(21)
а на основании (17)получаем
А1пд1 - Ah¡g¡ > (<)0, I,у = 1,р, у > I.
Тогда, исходя из системы предпочтений эксперта, можно утверждать, что градиент д функции Ф^) в точке h = ^ принадлежит многогранному конусу
(18)
Факт принадлежности неизвестного градиента известному множеству б можно трактовать как обычно рассматриваемую в системном анализе ситуацию с неопределенностью природы, которую можно снять построением гарантирующего решения. В рамках этой идеи среда должна найти некоторую новую точку h = ^ = ^ +ре, для которой Ф(К*) <Ф(^), т. е. при заданном шаге р нужно указать соответствующее направление е. Для его поиска представим приращение АФ^°,е) = +ре)-Ф(h0) в виде ряда:
(19)
В результате можно сформировать следующую схему взаимодействия эксперта и вычислительной среды в рамках данной не формализуемой ситуации.
1. Эксперт задает начальную точку ^ и величину шага р.
2. Вычислительная среда генерирует систему (15) вспомогательных векторов и для каждого из них, а также для начальной точки порождает моделирующую ситуацию, подлежащую оценке со стороны эксперта.
3. Эксперт выполняет ранжирование ситуаций и соответствующих им указанных векторов, вводя в среду систему своих предпочтений.
4. Вычислительная среда строит множество б (18) и решает задачу (21), предлагая эксперту новую начальную точку ^ = ^ + ре*.
Далее процесс повторяется до остановки экспертом.
Заметим, что принятый подход, представляющий собой диалоговый вариант [5] схемы градиентного спуска, обладает рядом недостатков [2], связанных с необходимостью вычисления градиента и связанных с этим требования достаточной гладкости минимизируемой функции, проблемы типа овражного эффекта, плохой сходимости в окрестности стационарной точки и т. д.
40
+
№ 6 (42) 2012
В связи с отмеченным обстоятельством приведенная схема может быть видоизменена с привлечением метода деформируемых многогранников Нелдера-Мида [6]. Идея метода состоит в рассмотрении совокупности P = {Н01, Н02.....^(р+1)} вершин правильного многогранника, среди которых находится начальная точка Н0, с последующим выбором среди них лучшего и худшего вариантов. Далее по определенным правилам (отражение от худшей точки через центр тяжести, растяжения или сжатия многогранника и т. д.) строится точка НЬ2 такая, что Ф(^2) <Ф(НЬ1). Если данная точка нашлась, то в совокупности P осуществляется замена точки на точку Ньг, после чего шаги алгоритма повторяются.
Как следует из существа метода, его применение в схеме диалоговой оптимизации при отсутствии аналитической информации о функции Ф(Н) исключительно удобно, поскольку метод в ней не нуждается. Действительно, в алгоритме используется лишь факт предпочтения, но не значения этой функции, что позволяет непосредственно привлекать мнение эксперта.
Однако заметим, что по сравнению с градиентным подходом алгоритм Нелдера-Мида работает медленно. Это определяет целесообразность разработки различных комбинированных вариантов, объединяющих преимущества приведенных методов диалоговой оптимизации.
Заключение
В статье представлена общая идеология и конкретные варианты применения оптимизационного подхода для формирования математических моделей существующих и проектируемых информационно-управляющих систем. Анализ возможности и целесообразности его применения для решения практических задач позволяет сделать следующие выводы:
1. В случае задания количественного критерия эффективности искомой модели ее оптимизация ведет к повышению
эффективности и качества моделирования § в смысле, определяемом заданным крите- ^ рием. ^
2. Если количественный критерий эф- ^ фективности отсутствует, то постановка
и решение соответствующей задачи оптимизации могут использоваться в качестве инструментального средства, обеспечивающего достижение желаемых свойств модели.
3. В любом варианте постановки оптимизационная задача и численный метод ее решения должны быть адаптированы к заданным условиям, в особенности к условиям работы в режиме реального времени.
4. В ряде случаев, в частности, для линейных стационарных цифровых систем, применение методов оптимизации может быть автоматизировано, включая этап написания программного кода, реализующего модель.
5. Применение оптимизационного подхода в наиболее сложных ситуациях моделирования может быть осуществлено с помощью специализированных экспертных систем, функционирующих на базе диалога эксперта и вычислительной среды.
Список литературы
1. Краснощеков П. С., Морозов В. В., Попов Н. М. Оптимизация в автоматизированном проектировании. М.: МАКС-Пресс, 2008. — 323 с.
2. Моисеев Н. Н., Иванилов Ю. П., Столярова Е. Н. Методы оптимизации. М.: Наука, 1978. — 352 с.
3. Веремей Е. И., Коровкин М. В. Применение пакета NCD для решения задач модальной параметрической оптимизации // Труды II Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде МАТ1_АВ». М.: ИПУ РАН, 2004. — С. 884-896.
4. Веремей Е. И. Среднеквадратичный синтез цифровых систем методами Н-теории // Вестник С.-Петерб. ун-та. 2011. Сер. 10. Вып. 2. С. 9-20.
5. Краснощёков П. С., Петров А. А, Фёдоров В. В. Информатика и проектирование. М.: Знание, 1986. — 48 с.
6. Химмельблау Д. Прикладное нелинейное программирование. М.: Мир, 1975. — 534 с.