щ
оделирование систем
УДК 681.5.015
СЛОЖНЫЕ СТАТИСТИЧЕСКИЕ КРИТЕРИИ И МОДЕЛИ, ОПТИМАЛЬНЫЕ НА КЛАССЕ КРИТЕРИЕВ
И.С. Дургарян, Ф.Ф. Пащенко
Рассмотрены задачи моделирования и идентификации стохастических систем по сложным статистическим критериям. Исследованы условия эквивалентности критериев. Получены условия эквивалентности и оптимальности моделей, построенных по различным критериям идентификации.
ВВЕДЕНИЕ
Существенным моментом в решении задач идентификации и управления является выбор критерия. Заметим, что как в практических, так и в теоретических работах по идентификации выбор критерия определяется обычно не столько физическим смыслом задачи, сколько традициями, степенью полноты и характером исходных данных, степенью разработанности соответствующего математического аппарата и относительной сложностью необходимой вычислительной работы.
Замена одного критерия, физически обоснованного, другим, более удобным для решения, часто приводит к результатам, которые считаются приемлемыми. Видимо, этими причинами и объясняется тот факт, что обычно в качестве критериев идентификации выбираются критерии типа минимума среднеквадратической ошибки. Эти критерии, приводя к достаточно простым и отработанным вычислительным схемам, зачастую дают малочувствительные к изменению критерия качества функционирования объекта оценки параметров математических моделей. Причем эти оценки обладают рядом полезных статистических свойств. Однако критерии типа минимума среднеквадратической ошибки часто не связаны с конечной целью идентификации, т. е. с тем, для чего и как предполагается использовать математическую модель.
В связи с этим в идентификации и управлении возникает необходимость применения более сложных критериев. Например, при решении задач управления качеством управляющее воздействие обычно находится из условия равенства модельного (прогнозируемого) значения выходной переменной некоторому постоянному значению (заданию). Ясно, что, благодаря вероятностным свойствам объекта управления, задание в точности никогда не будет выполнено, и можно говорить лишь о вероятности выполнения задания. Требования к качеству выходного продукта задаются обычно не в виде кон-
кретного значения того или иного показателя качества, а в форме допуска или допусков, соответствующих различным сортам. В этом случае в качестве критерия идентификации естественен критерий максимума вероятности нахождения ошибки Е (?) = <(?) — <0(0, где <(?) и <0 (?) — выходные процессы объекта и модели, ? — время, в некоторых допусках, а критерием для формирования управляющего воздействия (или воздействий) может служить максимум вероятности нахождения выходной переменной в допусках, определяемых требованиями к качеству выходного продукта [1, 2].
Известен хрестоматийный пример: средняя температура больных в больнице, не отражающая истиной картины ни общего состояния больных, ни состояния конкретного больного. В диагностике нас обычно интересует вероятность данного состояния, в задаче поражения цели — вероятность ее поражения и т. п. Вероятностные критерии, на наш взгляд, более реалистичные, более полно отражают реальные условия функционирования объекта, например, при моделировании состояния человека или в диагностических задачах.
Они допускают обобщения, позволяющие охватить широкий круг практически встречающихся задач моделирования [1, 3, 4]. Если выходной продукт подразделяется на несколько сортов, то применение вероятностного критерия для формирования управления позволяет максимизировать вероятность получения продукта требуемого сорта, минимизировать вероятность получения бракованной продукции и т. п. Если каждому сорту поставлена в соответствие некоторая экономическая характеристика (например, отпускная цена), то вероятностному критерию может быть придан экономический смысл.
Многие задачи такого типа встречаются в биологии, экономике и медицине. Аналогичные вопросы возникают при идентификации следящих и измерительных систем, создании систем принятия решений и построении прогнозирующих моделей.
Интересно отметить, что вероятностное обоснование метода наименьших квадратов, данное К. Гауссом, состоит в том, что получаемая оценка значений зависимой переменной является наилучшей в смысле критерия максимума вероятности нахождения ошибки в заданных пределах.
Безусловно, идентификация объектов по сложным статистическим критериям сложнее, однако они глубже отражают конечную цель идентификации. Например, при построении математической модели функционирования человеческого организма в критических ситуациях (предынфарктное состояние и т. п.) более естественно принять в качестве критерия идентификации критерий максимума вероятного нахождения ошибки в заданных пределах.
1. КРИТЕРИИ ИДЕНТИФИКАЦИИ
Рассмотрим следующий критерий идентификации:
/ = М [ф(Е)] о ех1х, (1)
где М — знак математического ожидания, ф(Е) — заданная функция. Из него при ф(Е) = Е2 следует критерий минимума дисперсии ошибки идентификации (при М(Е) = 0) или критерий минимума квадратической ошибки (если М(Е) ф 0). В том случае, когда
ф(() =
0, ( є [1І5 12]
1, ( є [с?і, ],
этот критерий представляет собой вероятность того, что ошибка идентификации находится в заданных допусках: 1[ф(Е)] = 3(1 Р Е Р 12), где ^ и 12 — границы допуска.
Критерий (1) обладает достаточно большой общностью, но его применение для решения задач идентификации сопряжено со значительными трудностями, обойти которые позволяют методы теории оптимальных статистических систем, развитые в работах В.С. Пугачева, Н.И. Андреева, И.Е. Казакова, В.В. Солодовникова и др.
Задача идентификации по вероятностному критерию является частным случаем более общей задачи идентификации по сложному статистическому критерию вида
- = А-Г, -„) о ехіх,
(2)
где / — заданная функция некоторых функционалов /р ..., /п от параметров модели и объекта.
2
Например, при /1 = тЕ, /2 = "Е (тЕ — математическое ожидание, а "Е — дисперсия ошибки) и гауссовских сигналах на входе и выходе системы вероятностный критерий при малом 1 = ^ = 12 примет вид: / = /(/1, /2) =
= 21 ехр{—//2/2}/72^"Е, а критерий минимума среднеквадратической ошибки запишется в виде: / = -1 + -2.
В настоящей статье для решения задач идентификации по критерию (2) существенно используются результаты Н.И. Андреева по линейным статистическим оптимальным системам [1].
В пп. 5 и 6 рассматриваются случаи, когда построенные по разным критериям модели являются равносильными, т. е. оптимальными на классе критериев.
2. ИДЕНТИФИКАЦИЯ ЛИНЕЙНЫХ ОБЪЕКТОВ
Рассмотрим стандартную схему идентификации. В качестве критерия близости оценки оператора объекта к его истинному значению примем критерий экстремума квадратического функционала вида:
- = (т,)
і = 1
(3)
где .Е (т;) — значение корреляционной функции ошибки в момент ?, [ — некоторые постоянные коэффициенты,
п
2
удовлетворяющие условию ^ [ ф 0. Оптимальную
/ = 1
оценку оператора объекта будем искать в классе линейных интегральных стационарных операторов:
7(0 = $Х(0 = | £(т)Д? - т)Л,
(4)
где g (т) — весовая функция оператора к. Предположим, что статистические характеристики входного ;(г) и выходного 7(г) процессов объекта известны или вытисле-ны по данным нормальной эксплуатации, а сами случайные процессы ;(г) и 7(г) — стационарны и стационарно связаны. Выражая функционал (3) через исходные данные и учитывая физическую реализуемость системыг — g(т) = 0 при т < 0, т > 7, получаем:
7 7
І І(ті — 0 + т^(т)йМ0
00
— 2 | (т; + т)g(т)Л + ^
о ■
(5)
где и ш< — математические ожидания входного и выходного сигналов, (•) и (•) — авто- и взаимно
корреляционная функции случайных процессов ;(?) и <(?). Выражение (5) представляет собой функционал от весовой функции модели типа:
гі гі
- = | |<[г, V, g(г), g(л)]^,
го го
экстремали которого удовлетворяет уравнению [1]
Г Г¿< + с<'] * = о, о р г р 7.
| Г <Эgw ,
(6)
(7)
Решение этого уравнения не всегда принадлежит классу непрерывных функций, в общем случае оно лежит в классе обобщенных функций. Если функционал \ представляет собой симметричную билинейную форму относительно функций g (?) и g (V), то интегральное урав-
нение (7), определяющее экстремаль £0 = я0(?), принимает вид
?1
Г ^ IV = 0, 0 Р ? Р 7 (8)
?0
При некоторых условиях выражение (8) представляет собой интегральное уравнение Фредгольма первого рода и решение его в общем случае лежит в классе обобщенных функций, содержащих разрывы и 3-функции. Если выражение (8) представляет собой уравнение Фредгольма второго ряда, то оно имеет решение в классе непрерывных функций. Функционалы (3), фигурирующие в критерии идентификации, являются частными случаями функционалов (6).
В нашем случае подынтегральная функция имеет вид:
<(т, о, я(т), g(0)) = £ (Т — 0 + т)я(т)g(0) —
I = 1
— 1 £ [[.ЛГ(т1 + т)я(т) + (т,- + 0)я(0)] +
/ = 1
+ Р7 [ я (т) + я (0)]
и представляет собой симметричную билинейную форму от функций я (т) и я (0). Решение задачи идентификации системы (линейной или нелинейной) в классе моделей (4) по критерию (3) дается следующей теоремой.
Теорема 1. Пусть идентифицируемый объект — линейный, стационарный и физически реализуемый (я(т) ф 0, т е [0, 7], я(т) = 0, т < 0, т > 7), случайные процессы на входе ;(?) и выходе У(?) объекта стационарны и стационарно связаны. Пусть выполняются условия:
пп
£ ф 0; £ |.Е(т,-)| ф 0; весовая функция я(т) интегри-
I = 1 I = 1
руема на отрезке [0, 7 ]. Тогда: существует модель объекта в классе линейных стационарных физически реализуемых операторов типа (4), оптимальная по критерию экстремума функционала (3); оценка я0(0) весовой функции модели объекта удовлетворяет линейному интегральному уравнению
7 п
Г £ (т — 0 + т)я(т)1 т10 —
0 I = 1
П Р
— £ [.у(т,- + т) + ^ = 0. (9)
г = 1
Доказательство теоремы следует из решения уравнения (8) при условии, что функционал < определяется выражением (5).
Уравнение идентификации (9) представляет собой линейное интегральное уравнение Фредгольма первого рода. Его решение можно найти известными методами [3].
3. ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ ОБЪЕКТОВ
Методы идентификации по сложным статистическим критериям, рассмотренные в п. 2, применимы для
построения оптимальных оценок операторов линейных и нелинейных объектов в классе линейных операторов, в классе линейных в среднем операторов и операторов Гаммерштейна. Однако для нелинейных стохастических объектов корреляционные функции не являются исчерпывающими характеристиками связи между входными и выходными сигналами. В общем случае изложенный выше корреляционный метод идентификации будет давать заниженную оценку статистической связи входных и выходных сигналов, а, следовательно, приводить к ошибкам решения задачи идентификации.
Рассмотрим состоятельный метод идентификации по сложным статистическим критериям, основанный на идеях метода функциональных преобразований [5]. Для простоты рассмотрим случай стационарного объекта, хотя все изложенное очевидным образом распространяется и на нестационарный случай. В качестве критерия близости модели и оператора объекта примем экстремум билинейного функционала вида:
/ = Ре + £[Д (т,), (10)
г = 1
где (т,) — значение функциональной корреляцион-
ной функции ошибки идентификации в момент тг [5],
— некоторые постоянные коэффициенты, удовлетво-
п
2
ряющие условию £ ф 0. Весовые коэффициенты
г = 1
учитывают вклад значений функции (тг) в различные
моменты времени т,- или интервалы времени, если т,- = гД, где Д — интервал времени, а = 1, 2, ..., п. Задавая различные значения коэффициентов , получаем семейство функционалов вида (10), которые можно использовать для приближенной оценки качества идентификации. Критерии, использующие функционалы типа (10), эффективны не только при идентификации по вероятностным критериям, но и в том случае, когда надо построить модель, наилучшим образом приближающую идентифицируемый объект на заданном отрезке времени, или режиме функционирования, или в данный момент времени, при решении задачи терминального управления. Аналогичные задачи возникают не только при идентификации с целью диагностики критических режимов, но и при идентификации сложных объектов, имеющих несколько, в том числе и стационарных, режимов функционирования, например, ядерный реактор, доменная печь или социально-экономическая система.
Оптимальную модель нелинейного объекта будем искать в классе стационарных полулинейных систем
я(1 — / — 12) [5]:
%[<(?)] = Г я(т)с[;(? — т)]1т. (11)
—ю
В соответствии с методом функциональных преобразований, опираясь на результаты работы [5], сначала найдем преобразования В и С случайных процессов на выходе и входе объекта, определяющие нелинейные звенья модели. Далее, воспользуясь изложенной методи-
кой, найдем оптимальную весовую функцию линейной части модели.
Пусть случ айные процессы ;(?) и У(?) — ф-стационар-ны и ф-стационарно связаны [5]. Тогда, с учетом физической реализуемости линейного звена, функциональная (обобщенная) автокорреляционная функция ошибки идентификации имеет вид
77
5'
((т;) = | | 5; (т; — 0 + т?(т)g(0)1 т d0
00
— 21 (т + т)?(т)dт + Зф7(т;).
0
Функционал (10) в этом случае можно представить в виде
п Г 7 7
І І 5; (т; — 0 + т?(т?(0^т d0
00
- = + Е [
і = 1
7
— 21 (т. + т)?(т)dт + Зф7(ті)
(12)
где тЕ — математическое ожидание ошибки идентификации, 5;(•), (•) и (•) — соответственно обоб-
щенные авто- и взаимная корреляционные функции случайных процессов ;(?) и У(?) [5].
Выражение (12) представляет собой функционал от весовой функции модели типа (6). Учитывая, что математическое ожидание обобщенной ошибки идентификации при сделанных выше предположениях можно записать в виде
т( = тс; | ? (т)d т
%7’
получим следующее выражение для подынтегральной функции функционала (6):
<(т, 0, я(т), я(0)) = £ [,.я; (т,- — 0 + т)я(т)я(0) —
, = 1
7 Е [.[(т; + т)?(т) + (т; + 0)?(0)]
+
і = 1
+
с;
2 7
где РС; = М{С(X (?))}; т%у = М{%(<(?))}.
Функция < представляет собой симметричную билинейную форму от функций я (т) и я (0). Решение задачи идентификации нелинейного объекта в этом случае определяется следующей теоремой.
Теорема 2. Пусть идентифицируемый объект представляет собой нелинейный динамический объект. Случайные процессы на входе ;(?) и выходе у(?) объекта ф-стационарны и ф-стационарно связаны. Модель объекта ищется на множестве полулинейных систем вида
п
2
(11). Пусть выполняются условия: £ [,• ф 0; существу, = 1
ют преобразования В и С такие, что автокорреляцион-
ная функция 5( (т) не равна тождественно нулю на отрезке [0, ' ]; весовая функция линейной части модели (11) удовлетворяет условиям физической реализуемости и интегрируема на отрезке [0, 7 ].
Тогда: существует модель объекта в классе полулинейный систем вида (11), оптимальная по критерию экстремума функционала (10); оценка оптимальной весовой функции ?0(т) линейной части модели (11) удовлетворяет линейному интегральному уравнению идентификации
| (т; — 0 + т)?(0) d0 —
0 і = 1
Е [,5*7(т; + т) + Р&* = 0.
(13)
і = 1
Уравнение (13) представляет собой интегральное уравнение Фредгольма первого рода, решение которого в общем случае лежит в классе обобщенных функций, содержащих не только непрерывные, но и разрывные функции и 3-функции.
Замечание. Выполнение равенства (13) является необходимым и достаточным условием экстремума функционала (10). Однако это условие может соответствовать как минимуму, так и максимуму функционала (10). На существование минимума или максимума критерия влияют конкретные выбранные значения параметров .
Если существует максимальная взаимная корреляционная функция случайных процессов ;(?) и У(?), то справедлива следующая
Теорема 3. Пусть выполняются условия теоремы 2. Пусть существует и не равна тождественно нулю на отрезке [0, 7] максимальная взаимная корреляционная
функция Зрух(т). Тогда: существует модель объекта в классе полулинейных систем вида (11), оптимальная по критерию экстремума функционала
- = +
Е [¿5Р7хф (т),
і = 1
где обозначение Зр<?ф (т,.) указывает на то, что ошибка
идентификации Е (?) определяется при условии, что преобразования % (У(?)) и С (;(?)) удовлетворяют теореме 7.2.3 (см. работу [5]); оценка оптимальной весовой функции я0(т) линейной части модели (11) удовлетворяет линейному интегральному уравнению идентификации
І Е [¿5* (т; — 0 + т)?(0) d0
0 і = 1
Е [<5;7 (т + т) + = 0.
і = 1
(14)
Доказательство теорем 2 и 3 осуществляется в два этапа. На первом этапе, учитывая результаты работ [6—8] находят преобразования В и С случайных процессов на выходе У(?) и входе ;(V) объекта, определяющие обобщенные авто- и взаимные корреляционные функции и максимальную взаимную корреляционную функцию
случайный процессов ;(V) и <(?). На втором этапе по теореме 1 находят оптимальную весовую функцию линейной части модели.
Как важные частные случаи из теорем 2—3 следуют дисперсионные методы идентификации и синтеза оптимальных стохастических систем по сложным статистическим критериям, рассмотренным в работах [2, 9]. Заметим, что при идентификации нелинейных объектов, описываемых монотонными зависимостями, уравнения дисперсионной идентификации совпадают с уравнениями (13) и (14). Легко показать, что теорема 1 также является частным случаем теорем 2 и 3.
4. ИДЕНТИФИКАЦИЯ СИСТЕМ ПО ВЕКТОРНОМУ КРИТЕРИЮ
Постановка задачи идентификации, особенно в случае сложных иерархических систем, часто приводит к векторному критерию построения оптимальной модели:
- = Ц, ..., -„), (15)
т. е. к задаче многокритериальной оптимизации. При этом для определения области решений, например, оптимальный по Парето, необходимо перейти от задачи векторной оптимизации к задаче нелинейной оптимизации со специально сконструированной скалярной функцией цели:
- = /(-1, ..., -„). (16)
Существуют различные способы образования такой функции, наиболее распространенный среди них метод взвешенных сумм:
Q Q
- = £ N.-., где NL O 0 и £ NL = 1. i = 1 i = 1
Вопросы построения обобщеннык критериев оптимальности рассмотрены в работах В.С. Пугачева, Н.И. Андреева, И.Е. Казакова и др.
Функционалы (15) и (16) охватывают довольно широкий класс критериев. Как частные случаи, они включают в себя критерии вероятности выхода ошибки из заданных допусков, минимума средней квадратической ошибки и т. п. Кроме того, некоторые из критериев -i могут иметь смысл производительности, себестоимости, экономической эффективности. Идентификация объектов по критерию экстремума функционала (16) представляет собой трудную задачу, которую можно значительно упростить, воспользовавшись следующей модификацией результатов Н.И. Андреева по теории статистически оптимальных систем.
Теорема 4. Пусть в функционале (16) -1, -2, ..., -„ — действительные выпуклые функционалы, определенные в банаховом пространстве. Пусть функционалы -1, ..., -„ — сильно дифференцируемы в области * т. е. существует дифференциал Фреше — G-(j), j е G. Пусть функция /(•) — выпуклая, монотонная и дифференцируемая в области G. Тогда для того, чтобы функционал - достигал экстремума на функции j0, необходимо, чтобы G-(j0, K) = = -\§0)K = 0 при всех K е * функция j0, на которой функционал J принимает экстремальное значение, при-
надлежит множеству решений задачи поиска экстремума приведенного функционала
-(J) = П£N,.-.(j) + -„(j), N. O 0, L = 1, ..., и — 1. (17)
L = 1
Другими словами, для того чтобы функция j (W), принадлежащая классу допустимых функций, соответствовала экстремуму функционала (16), необходимо, чтобы она соответствовала экстремуму приведенного функционала (17) при некоторый значениях согласующих параметров N1, ..., Nq — 1. Примерами вышуклыгх функционалов являются квадратические функционалы (3) и (10). Для вышуклыгх функционалов необходимое условие экстремума является и достаточным.
Функция j0(W, N1, ..., Nq — 1), соответствующая экстремуму функционала (16), зависит от Q — 1 согласующих параметров NL. Подставляя найденное значение j0(W, N1, ..., Nq — 1) в выражение (16), получим некоторую функцию параметров N1, ..., Nq — 1:
- = /[-1(J(W, N1, ..., N„ — 1)), ..., -„(W, N1, ..., N„ — 1))]] =
= )(N1, ..., N„ — 1).
Определяя экстремум функционала - как функцию от N1, ..., Nq — 1, найдем соответствующие ему значения N1 = N1 0, ..., Nq — 1 0. Тогда искомая оценка весовой функции объекта j0(W) = j (W, N10, ..., Nq — 10). Способы определения значений согласующих параметров N1 = N1 0, ..., Nq — 1 = Nq — 1 0, соответствующих экстремуму функционала (16), приведены в работах Н.И. Андреева по теории статистически оптимальных систем [1].
Если функция )(N1, ..., Nq — 1) имеет несколько максимумов или минимумов, то в качестве sup - или inf-следует брать, соответственно, наибольший из максимумов или наименьший из минимумов и соответствующие этим значениям оптимальные значения согласующих параметров. При этом необходимо, чтобы полученная в результате весовая функция модели принадлежала классу допустимых функций.
Отыскание экстремума функционала (17) по трудности равносильно отысканию экстремума функционала
Q
£ -. Если, например, функционалы -1, ..., -„ — квад-
L = 1
ратические, то и функционал (17) тоже квадратический, и, следовательно, независимо от вида функции /, поиск экстремума функционала (17) сводится к задаче определения экстремума квадратического функционала, для решения которой имеется хорошо развитый аппарат. Таким образом, задача отыскания экстремума функционала (16) сводится к решению более простых задач: определению функции j (W, N1, ..., Nq — 1) и отысканию согласующих параметров N1 0, ..., Nq — 10.
В качестве функционалов -1, ..., -„ в выражении (16) могут использоваться функционалы типа (3) и (10), что приводит к критериям, имеющим смысл вероятности того, что ошибка идентификации находится в заданных допусках:
• в некоторый момент времени;
• в течение некоторого отрезка времени,
• к более сложным обобщениям этих критериев.
ПРОБЛЕМЫ УПРАВЛЕНИЯ № 2 • 2ППЗ
131
5. О МОДЕЛЯХ, ОПТИМАЛЬНЫХ ПО РАЗЛИЧНЫМ КРИТЕРИЯМ
Задача идентификации систем и построения моделей, оптимальный по вероятности выхода ошибки идентификации за пределы заданного интервала или по сложным статистическим критериям, рассмотренная в пп. 1—4, связана с сер ьезными математическими затруднениями, громоздкими и большими вычислительными затратами, в отличие от идентификации по среднеквадратическому критерию. Понятно, что критерий идентификации должен отражать цель создания модели, например, критерий последующей оптимизации системы или критерий управления идентифицируемым объектом. Однако, применение сложных статистических критериев не гарантирует, что в результате будет получен более существенный эффект, нежели при классическом среднеквадратическом критерии.
В работах В.С. Пугачева, Н.И. Андреева, О.М. Козлова, П. Эйкхоффа [1, 3, 10] и других исследователей показано, что для гауссовских процессов синтез оптимальных систем и идентификация объектов по различным критериям часто приводит соответственно к одному и тому же результату.
В связи с этим представляет интерес отыскание свойств систем, по которым можно было бы определить, будут совпадать или отличаться результаты идентификации по различным критериям.
Рассмотрим различные критерии близости выгходныгх сигналов системы 7(W) и модели 7M(W) вида:
/(Ф) = /(ф (7(0, $ВД) =
= 0 [Ф (7М(0 - 7(0)] o min, (18)
-(m) = 0>M(|7M(W) — <(01)] o min, (19)
7м
где m — произвольная неотрицательная неубывающая функция, m( •) z const, 70 _ выгходной сигнал модели 70(W) = $[;(v), v е 7W ], где k — оператор модели, 7W — интервал времени.
Критерии вида (18) и (19) охватывают критерии минимума среднеквадратической ошибки м( •) = Р2, среднего значения модуля ошибки, среднее значение взвешенной суммы ошибки £dn |( |N, вероятности выхода ошибки идентификации из заданной области радиуса S при
Ф(Р) =
(20)
и другие.
Посколыку при решении задач идентификации применяются методы, учитывающие знания о системе и действующих на нее си гналов, и дисперсионные методы идентификации [5], рассмотрим также функционалы вида
/(Ф(-)/вд) = ж[Ф(|<м(о - 7(оі)/т V є 7] (2і)
/(Ф( •)/.(), х^, <(/)) =
= 0[Ф( •)/.()(•), ад, <(/)], (22)
где, как и ранее, М[/] означает условное математическое ожидание функционала ф( •) относительно реализации случайного сигнала [(V) или знаний К(•) о системе )(•), входном Х^) и выгходном сигнале 7(?) системы.
Пусть Ф — класс моделей (например, линейныгх, нелинейный, полулинейныгх), в котором ищется идентифицируемая модель системы. Требуется найти модель системы из класса Ф, оптимальную в смысле критериев (18) и (19) или (21) и (22).
6. СУЩЕСТВОВАНИЕ ОПТИМАЛЬНЫХ МОДЕЛЕЙ
Определение оптимальной модели по данному критерию или по набору критериев на заданных классах моделей, входныгх и выгходныгх сигналов является одним из основный этапов решения задачи идентификации в широком смысле. Однако прежде чем приступить к построению оптимальной модели, необходимо ответить на вопрос: существует ли оптимальная модель идентифицируемой системы? В данной работе будем искать оптимальные модели в смысле следующих определений.
Определение 1. Модель $° называется оптимальной «в среднем» в классе Ф, если $° е Ф и для любыгх $ е Ф, Х(V) и любого критерия (18) или (19) выполняется неравенство —(ф, $°) Р -(Ф, $).
Определение 2. Модель $° называется оптимальной «в целом» в классе Ф, если $° е Ф и для любых $ е Ф, Х(V) и любого критерия (21) или (22) выполняются неравенства —(ф, $°/Х(V)) Р —(ф, $/Х(V)) и —(ф, $°/К(•)) Р Р —(ф, $/К( •)).
Из этих определений следует, что модель, оптимальная «в целом», дает наилучшую аппроксимацию выходного сигнала системы: не только «в среднем» по всем возможным реализациям Х(V), но и для каждой конкретной реализации [(V) или набора знаний К(•) в отдельности. Конечно, возникает вопрос: существуют ли такие модели? Ответ дают следующие теоремы.
Теорема 5. Пусть условное распределение процесса 7(?) относительно процесса Х(V)
)\/[(и) = 3(7(?) Р и/Х(4 V е 7?) (23)
унимодально и симметрично. Тогда существует оптимальная модель «в целом», ее выгходная реакция 7М(?) = = 0(7(0/Х(V), V е 7?).
Справедливо и обратное утверждение.
Теорема 6. Пусть существует оптимальная «в целом» модель. Тогда соответствующие условные распределения (23) унимодальны и симметричны.
Доказательства теорем 5 и 6 следуют из работ [3, 4].
При доказательстве теорем существенен учет свойств унимодальности и симметричности (функция распределения )(и) называется унимодальной, если существует такое число и°, что )(и) выпукла при и < и° и вогнута при и > и°; функция распределения называется симметричной, если )(и° — и) = 1 — )(и° + и)).
321
CONTROL SCIENCES № 2 • 2ППЗ
Как известно, унимодальные функции распределения непрерывны и обладают производными слева и справа в каждой точке, за исключением, быть может, одной точки вершины, где возможен разрыв.
Примером систем, соответствующих теоремам 5 и 6 являются системы, случайные процессы на входе Х(^) и выходе <(?) которых представляют собой гауссовские процессы -^(р., 61) и 12(ОТ\, 62).
Следствие 1. Если условная функция распределения )д(и) имеет более одной точки разрыва, то )д(и) не унимодальна и оптимальной «в целом» модели не существует.
Следствие 2. Если условная функция распределения )д(и) несимметрична, то оптимальной «в целом» модели не существует.
В случае выполнения условий следствий 1 и 2 оптимальная модель по среднеквадратической ошибке не совпадает с моделью, полученной по критерию минимума выхода ошибки идентификации из заданной области (интервала). В частности, рассмотренный в работе [2] пример нелинейного квадратического преобразователя <(?) = ; (?) является примером нарушения условия симметричности условной функции распределения )д(и). Следовательно, для идентификации по сложным статистическим критериям в этом случае следует применять методы идентификации, рассмотренные в работах [2, 9].
Таким образом, существование оптимальной модели, вообще говоря, не дает оснований заменять при идентификации одни критерии другими. Условия, при которых такая замена возможна, определяются следующими теоремами.
Теорема 7. Пусть выполнены условия теоремы 5 и условие а) плотность ,Р\д(и) условного распределения случайного процесса <(?) относительно наблюдаемых значений ;(£) при и > и° = 0[<(?)/;(V), V е 7?] строго убывающая функция или условие б) функция ф°(Р) строго возрастающая. Тогда существует и единственна оптимальная «в целом» модель идентифицируемой системы, определяемая уравнением
-(Мо, $7ДФ) = тш/(Фо, $ВД).
Доказательство. Пусть выполняются условия теоремы 5 и условие а) и существуют оптимальные модели
$°(Дт)) = 0{<(?)/;(т), т е 7?} = а°,
%°([(т)) = 6° * а°.
Пусть ^\/х(и) = ),'/. (и + а°) — условная плотность распределения.
В силу условий (23) и а) теоремы
_р(и) = ^(—и), ^(и2) > ^(и1) при и2 > и1 > ° (24)
Тогда имеем:
ГО го
-(Ф°, $°/;(т)) = | Ф°(\ — а°М\ — а°)4\ = | Ф°(и)^(и)й?и,
—ГО —го
го
-(Ф°, %°/;(т)) = | Ф°(\ — 6°М\ — а°)4\ =
—го
го
= | Ф°(и + 2с)^(и)1и,
—го
где с = (а° — 6°)/2. Отсюда
-(Ф°, $°/;(т)) — -(Ф°, %°/;(т)) =
го
= | [р(и — с) — _р(и + с)]>Ф°(и + с) — Ф°(и — с)]1и = °.
—го
Поскольку последний интеграл равен нулю, то подынтегральное выражение (в силу своей не отрицательности) равно нулю
[р(и — с) — _р(и + с)]Ф°(и + с) — Ф°(и — с)] = °
почти при всех и. В силу условий (24) первый сомножитель строго больше нуля, следовательно
Ф°(и + с) = Ф°(и — с) — почти всюду.
Последнее невозможно, так как функция Ф°(и) отлична от нуля и монотонна (см. формулы (18) и (19)). Следовательно, оптимальная модель к° единственна. Аналогично доказывается единственность оптимальной модели при условиях (23) и б).
Теорема 8. Пусть выполняются условия теоремы 7. Пусть существует модель %°, оптимальная «в среднем» по критерию (19):
-(Ф°, %°) = -(Ф°, $°) = тш-(ф, $). (25)
Тогда выходные сигналы моделей $° и % ° тождественны почти всюду для всех реализаций входного сигнала ;(V); модель % ° оптимальна по всем критериям
-(Ф, $) (19).
Доказательство. Первое утверждение теоремы следует из теорем 5 и 7. Действительно, в силу теоремы 5 оптимальная модель существует, а в силу теоремы 7 она единственна.
Докажем второе утверждение. Из теоремы 7 следует
-(ф°, %°/;(т)) о -(ф°, $°/;(т)). (26)
В силу условия (25)
-(ф°, %°) = -(Ф°, $°). (27)
Выражения (26) и (27) не противоречат друг другу только в случае, когда с вероятностью 1 выражение (26) превращается в равенство. Отсюда в силу единственности оптимальной модели {°(•) = к°( •) с вероятностью 1.
Поскольку значения условного критерия -(ф, $/х) на множестве реализаций ;(т) вероятностной меры нуль не влияют на значение критерия -(ф, $), то
-(Ф^ %°) = -(Ф0, $°) = тр-(Ф, $)
что и требовалось доказать.
Из теорем 5—8 следует, что если условные распределения унимодальны и симметричны, то модель, оптимальная по минимуму среднеквадратического отклонения ошибки идентификации, оптимальна по всем критериям с функционалом типа (18), в том числе и по критерию минимума вероятности выхода ошибки идентификации из заданного диапазона: 3 {|<0(?) — <(? )| > 8} при любом 8.
Полученная при этом модель к° отличается от оптимальной «в целом» модели лишь на множестве входных сигналов меры нуль.
Если модель к° обеспечивает минимум среднеквадратического отклонения для каждой реализации входного сигнала ;(V), т. е. выполняется условие (2°), то модель к° оптимальна «в целом».
Отметим, что условие а) теоремы 7 выполняется для гауссовского процесса, а условие б) — для степенной функции, т. е. для среднеквадратического, среднекубического отклонений и т. п. Поэтому все вышесказанное справедливо для моделей оптимальных по среднему значению любой степени и отклонения: |<0(?) — <(?)|и.
Необходимыми условиями существования модели, оптимальной «в среднем» по всем критериям типа (19), являются унимодальность и симметричность распределения следующей случайной величины: [(?) = <(?) — 0{ <(?)/;( V), V е 7?}. Наличие этого свойства способствует высокой эффективности дисперсионных моделей и методов идентификации.
ЗАКЛЮЧЕНИЕ
Один из основных этапов решения задачи идентификации в широком смысле заключается в определении оптимальной модели системы на заданных классах моделей, входных и выходных сигналов. Рассмотрены вопросы выбора и обоснования критериев при моделировании систем. Предложены методы идентификации по сложным вероятностным критериям. Показано, что задача идентификации по векторным критериям в ряде случаев сводится к задаче идентификации по приведенным билинейным критериям, впервые рассмотренным Н.И. Андреевым [1].
Даны определения моделей, оптимальных «в среднем» и «в целом» на выбранном классе моделей. Получены условия существования моделей, оптимальных по разным критериям идентификации. Показано, что если существует оптимальная «в целом» модель, то условные распределения выходного сигнала системы относительно входного сигнала должны быть унимодальны и симметричны. Рассмотрен частный случай, когда входной и выходной сигналы системы являются гауссовскими. Если указанные выше условия не выполняются, идентификацию систем следует проводить методами, изложенными в пп. 2—4 и в работах [2, 9].
Изложенный подход к исследованию и применению сложных статистических критериев для решения задач идентификации может быть полезен и для решения задач синтеза оптимальных стохастических систем, прогнозирования, экстраполяции и фильтрации.
ЛИТЕРАТУРА
1. кяфеет Л.Л Корреляционная теория статистически оптимальных систем. — М.: Наука, 1966. — 386 с.
2. Дургоряя j.Cv Лоцеяко Ф.Ф. Идентификация нелинейных объектов по сложным критериям // Автоматика и телемеханика. — 1980. — № 7. — С. 61—71.
3. Лугочет 5.С. Теория случайных функций. — М.: Физмат-гиз, 1962.
4. Геряо^кий Ф.Л, Лоцеяко Ф.Ф., Хоноталото Г.Р. Идентификация и управление технологическими объектами по сложным критериям. — Владивосток: ИАПУ ДВНЦ АН СССР, 1983. — С. 34.
5. Лроягиштили И.В., Лоцеяко Ф.Ф., Гусыгия Г.Л. Системные законы и закономерности в электродинамике, природе и обществе. — М.: Наука, 2001. 526 с.
6. Сорлояот 0.5. Собственные корреляционные функции и их применение в теории стационарных марковских процессов // Докл. АН СССР. 1960. — Т. 132, № 4. — С. 769—772.
7. Лоцеяко Ф.Ф., Теряьшет Х.Р. Применение метода функциональных преобразований в идентификации нелинейных систем // Автоматика и телемеханика. — 1992. — № 4. — С. 77—85.
8. 5га'маи )n'erfrna« /.Л. Estimating Optimal Transformations for Multiple Régression and Corrélation //J. of the American Statistical Association. — 1985. Vol. 80, № 391. — Р. 580—598.
9. Дургоряя Л.С., Лоцеяко Ф.Ф. Дисперсионный критерий статистической оптимизации систем // Автоматика и телемеханика. — 1974. — № 12. С. 46—52.
10. Эйкхофф Л. Основы идентификации систем управления. — М.: Мир, 1975.
в 554-90-20
(-таг/: □
РЕДАКЦИЯ ЖУРНАЛА «ПРОБЛЕМЫ УПРАВЛЕНИЯ»:
117997, ГСП-7, Москва, Профсоюзная ул., 65, оф.104, тел./факсы: (095) 330-42-66, 334-92-00, www.ipu.rssi.ru; e-mail: [email protected]
Подписку на журнал «Проблемы управления» можно оформить с любого месяца в любом почтовом отделении (подписной индекс 81708 в каталоге "Роспечать"), а также через редакцию. Отдельные номера редакция высылает по первому же требованию. Стоимость одного номера — 440 руб.
34
CONTROL SCIENCES № 2 • 2003