Научная статья на тему 'Идентифицируемость математических моделей эволюционных процессов'

Идентифицируемость математических моделей эволюционных процессов Текст научной статьи по специальности «Математика»

CC BY
57
11
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — И. К. Волков

Получены достаточные условия идентифицируемости математических моделей эволюционных процессов, линейных по оцениваемым параматрам, с использованием результатов дискретных косвенных измерений их векторов состояний при наличии априорной информации относительно начальных (граничных) условий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идентифицируемость математических моделей эволюционных процессов»

Александр Анатольевич Борисов родился в 1958 г., окончил в 1980 г. Даугавпилсское высшее военное авиационное инженерное училище. Канд. техн. наук, начальник ЦНИИИ МО РФ. Автор более 60 научных работ в области надежности сложных технических систем.

A.A. Borisov (b. 1958) graduated from the Daugavpils Higher Air Force Engineering School in 1980. Ph. D. (Eng.), head of administration of Central Institute for Research and Testing of the Defense Ministry of the Russian Federation. Author of more than 60 publications in the field of complex technical systems.

Геннадий Дмитриевич Карташов родился в 1938 г., окончил в 1961 г. Воронежский государственный университет, Заслуженный деятель науки и техники РФ. Д-р техн. наук, профессор, заведующий кафедрой "Высшая математика" МГТУ им. Н.Э. Баумана. Автор около 200 научных работ в области теории вероятностей и математической статистики, теории надежности и актуарной математики.

G.D. Kartashov (b. 1938) graduated from the Voronezh State University in 1961, Honored Worker in Science and Technology of the Russian Federation. D. Sc. (Eng.), professor, head of "Higher Mathematics" department of the Bauman Moscow State Technical University. Author of about 200 publications in the field of theory of probabilities and mathematical atatistics, theory of probability and Actuarial Mathematics.

УДК 62.505

И. К. Волков

ИДЕНТИФИЦИРУЕМОСТЬ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ЭВОЛЮЦИОННЫХ ПРОЦЕССОВ

Получены достаточные условия идентифицируемости математических моделей эволюционных процессов, линейных по оцениваемым параматрам, с использованием результатов дискретных косвенных измерений их векторов состояний при наличии априорной информации относительно начальных (граничных) условий.

Один из аспектов широкого внедрения методов математического моделирования в практику научных исследований непосредственно связан с проблемой идентифицируемости математических моделей эволюционных процессов различной природы по данным дискретных косвенных измерений вектора состояния [1-6]. При этом в биомедицинских исследованиях наиболее часто реализуется частный случай косвенных измерений — "частично наблюдаемый вектор состояния" [3,4].

Известные результаты практического и имитационного моделирования, полученные с использованием данных косвенных измерений векторов состояний эволюционных процессов различной природы, весьма противоречивы. Их анализ позволяет утверждать, что эти противоречия в значительной степени обусловлены наличием или отсутствием априорной информации относительно начальных (а для моделей с распределенными параметрами — оде и граничных) условий.

Основная цель проведенных исследований — изучение проблемы статистической разрешимости задач параметрической идентификации математических моделей эволюционных процессов на ограниченных выборках экспериментальных данных, представляющих собой результаты дискретных косвенных измерений значений их векторов состояний, при наличии априорной информации относительно начальных (граничных) условий.

Исходные допущения и математическая модель. При дальней-их рассу дениях будем предполагать, что изучаемая математическая модель является линейной по оцениваемым параметрам. оэтому без потери общности дальнейших выводов [7-9] ограничимся анализом задачи параметрической идентификации простейшей линейной модели:

Xi+1 = AXj Vj > 0, Yk = DXk + £k, k = 1, 2p - 1, (1)

Zo = BXo,

где A E Mnxn(R) — матрица неизвестных параметров рассматриваемой математической модели; D E Mmxn(R) и B E MNxn(R) — матрицы измерений, являющиеся известными матрицами полных строчных рангов и

rank D = m < n, rank B = N < n; (2)

{Yk}kp=-1 — экспериментальные данные, а z0 — известный детерминированный вектор; {Xk ikl-1 — неизвестные значения вектора состояния изучаемого эволюционного процесса; {ek j^l-1 — случайные ошибки измерений, являющиеся независимыми случайными векторами, имеющими распределение N(©m1, £), где £ E Mmxm(R) — неизвестная положительно определенная ковариационная матрица.

Согласно работе [5] при использовании матриц

Y = [Ya, Y5, . . . , Y2p_1] E Mmx(p-1)(R), Y„ = [Y2, Y4, . . . , Y2p_2] E Mmx(p_1) (R), X = [X2,X4, . . . ,X2P_2] E M„x(p_1)(R), (3)

= ^ ^ . . . , ^2p_1] E Mmx(p_ 1) (R), = . . . ,^2p_2] E Mmx(p_ 1) (R)

исходная задача (1) может быть преобразована к эквивалентной ей задаче линейного оценивания:

У = БЛХо + £Ь го = ВХо,

0 (4)

У* = БЛХ + £*,

Таким образом, по т + N + 2т (р — 1) уравнениям связи (4) с учетом обозначений (3) необходимо идентифицировать п2 элементов матрицы Л неизвестных параметров исходной модели (1), п(р — 1) элементов матрицы X неизвестных значений вектора состояния, п элементов вектора начального состояния Х0 и т(т +1)/2 элементов неизвестной положительно определенной ковариационной матрицы £ случайных ошибок измерений — всего п2 + пр + т(т + 1)/2 параметров. Согласно теории статистических выводов [10] для разрешимости рассматриваемой задачи параметрической идентификации должно выполняться условие

2 т( т " 1)

2тр — т + N > п + пр +-----+ 1

2

п) ( п2 + т(т + 3)/2 — N +1] , ч

т > Л (р>-2т-п-) • (5)

Для упрощения дальнейших выкладок будем предполагать, что

£ = а21т, (6)

где а2 — неизвестный положительный параметр, т. е. т(т + 1)/2 = 1. Кроме того, будем считать, что с учетом предположения (6) условие (5) выполняется.

Условие идентифицируемости. Согласно соотношениям (3), (4), (6) и теории инвариантности Джеффриса [11] байесовская совместная апостериорная плотность распределения вероятностей неизвестных параметров исходной математической модели (1), представленных матрицей Л, неизвестной дисперсии а2 и неизвестных значений вектора состояния, представленных матрицей X и вектором Х0, имеет следующий вид:

/(Л,а2,Х,Хо|Уьго,У,У*,Б,В) - (а2)-1т+2+2(р-1)]т/2ехр(—^ ,

Ф = (zo - BXof(zo - BXo) + tr{(Yi - DAXo)(Yi - DAX0)т+

+ (Y, - DAX)(Y - DAX)т + (Y„ - DX)(Y„ - DX)т}, (7)

где использован символ эквивалентности ~ и опущен нормирующий множитель. При этом функционал Ф, определенный формулой (7), целесообразно представить в эквивалентом виде:

Ф = Цр^ - AXo)(D+Y1 - АХ0)тDтD+ + (В+го - Хо)(В+го - Хо)тВтВ + р+П - АХ)р+П - АХ

+ (D+Y„ - Х)р+П, - Х)тDтD }; (8)

здесь мы воспользовались допущениями (2), свойствами псевдообратных матриц [12] и свойствами следа матриц [13].

Для удобства дальнейших рассуждений воспользуемся обозначениями (3) и введем в рассмотрение блочные матрицы

д x =

Y Д

Xo ©„,.(„_

0,

n,1

n,(p-1)

X

£ M

2nxp

z д

d д

b Д

д a =

D+Yi 0n,(p-i)

0n,i d+y

B+Zo 0n,(p-1)

0n,1 D Y**

D 0r

0m

m,n

D

'm,n

B 0N,n

0m,n D

A0 0A

^n,n ■ri

£ M2nxp( £ M2nxp( £ M2mx2n( e M(n+ m)x2n{ £ M2nx2n(

В этом случае согласно соотношениям (8) и (9) имеем

(9)

Ф = - аж)^ - аж)т^+ (£ - ж)(£ - ж)тЬтЬ}.

При этом если X £ М2пХр(М) — оценка матриц х, определяемая согласно формулам (9) и (3), то, используя свойства следа [13], докажем, что

Ф = Ф1 + Ф2 - 2Ф3,

д

Ф1 = tr{(Y - aX)(Y - aX)тdтd + (Z - X)(Z - Х)тЬтb},

Ф2 = tr{(x - X)(x - X)т[(da)т(da) + ЬтЬ]},

(10)

Фз = tr{[(da)"1 d(Y - aX) + Ьтb(Z - X)](x - X^}.

Таким образом, из соотношений (7) и (10) следует, что X является оценкой максимального правдоподобия для матрицы x [10] тогда только тогда, когда Ф3 = 0, или, что то же самое, когда

(da)Td(Y - ax) + bTb(Z - x) = ©2П,Р.

(11)

Уравнение (11) позволяет представить оценку максимального правдоподобия X в явном виде:

x = s [(da)TdY + bTbZ ],

д

s = (da)Tda + bTb =

q ©n,?

©n,n Q

G M

2nx 2n

Д

(12)

q = (DA)TDA + BTB G Mn

д

Q = (DA)TDA + DTD G Mn

Согласно (12) оценка максимального правдоподобия x cyniecrayeT

тогда и только тогда, когда существует s , т. е. когда

rank q = n = rank Q.

(13)

Заметим, что условие идентифицируемости типа (13) приведено в [2] и получено при анализе линейных моделей с сосредоточенными параметрами при отсутствии априорной информации о начальном состоянии с использованием методов калмановской фильтрации.

Предположим, что условия (13) выполнены. В этом случае оценка максимального правдоподобия X существует и опеределена равенствами (12). Воспользовавшись этим фактом, свойствами псевдообратных матриц [12] и уравнением (11), преобразуем функционал Ф1, определенный в (10), к следующему виду:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ф1 = ^{(У — aX)(Y — aX)тd

+ [ЬтЬ^ — X)][bт Ь^ — X)]т(bтb)+} = Ц(У — aX)(Y — aX)тdт d+ + [(da)тd(У — aX)][(da)тd(У — X)]т(bтb)+} = = Ц(У — aX)(У — aX)т[d ^ + d т(da)(bтb)+(da)тd]}. (14)

Поскольку согласно равенствам (12)

Y — aX = У — as-1[(da)тdУ + Ьт bZ ] =

= [/2п — as-1(da)тd]У — as-1bтbZ = [/2« — as-1 (da)тd]У—

— as-1[s — = [/2п — as-1(da)тd](У — aZ),

то с учетом соотношений (14) получаем

Ф1 = tr{(Y - а^)(Y - а^)тe}, (15)

где использована матрица

e = [/2п - аs-1(dа)тd]т[dтй + йт(йа)(Ьт6)+(йа)тй][/2П - as-1(da)тd] = = йт[/2ш - (йа^-1(йа)т][/2т + (йа)(6т6)+(йа)т][/2т - (йа^-1(йа)т]й.

При этом если воспользоваться равенствами (12), определяющими матрицу s, и известными свойствами псевдообратных матриц [12], то выражение для нахождения матрицы е можно существенно упростить:

е = йт[/2т - (йа^-1(йа)т]й. (16)

Таким образом, при выполнении условий (5),(6), (13) согласно соотношениям (7), (10), (12), (15), (16) имеем

Ф = - а£)(Y - а^)тйт[/2т - (йа^-1(йа)т]й+

+ (х - Х)(х - Х)"^}. (17)

Пусть далее

J = [/n./n] £ Mnx2n

Y = JY = [D+Y1 .D+Y,] e Mnxp

V = JZ = [B+Z0.D+Y,,] e M

(18)

nxp

W = Jx = [Xo.X] e Mnxp

Рассматривая три последних тождества в (18) как матричные линейные алгебраические уравнения относительно Y, Z и х соответственно и воспользовавшись свойствами псевдообратных матриц [12], мы можем утверждать, что их решения, обладающие минимальной евклидовой нормой, могут быть представлены в следуем виде:

Y = 0,57Z = 0,57тУ, х = 0,57 Ж

Поскольку согласно (9), (18) имеет место очевидное тождество

А7т = 7 тА,

то с учетом соотношения (17) и свойств следа [13] имеем

Ф = 0,25 -г{(У — А^ )(У — А^ )тJd т[/2т — (da)s-1(da)т ]dJ т+

+ (Ж — Ж )(Ж — т}.

олученное представление функционала Ф мо ет быть преобразовано к виду, удобному для дальнейшего использования:

Ф = 0,25 -г{(У — А^ )(У — А^ )т£т [/т — £А(д-1 + д-1)(£А)т ]£+

+ (Ж — Ж )(Ж — Ж )т(д + ф)}, (19)

если учесть очевидные тождества, следующие из соотношений (9)

и (12):

т = д + ф, Jda = [ЯА.ЯА] = £А7,

Jdт = [£т.£т] = £т7, Js-17т = д-1 + ф-1.

Для нахождения байесовской совместной апостериорной плотности распределения вероятностей неизвестных параметров исходной математической модели (1), представленных матрицей А, и неизвестной дисперсии а2 случайных ошибок измерений достаточно воспользоваться результатами (7), (19), обозначениями (18), свойствами многомерных плотностей распределения вероятностей и известными методами вычисления многомерных несобственных интегралов [11]:

f (А,а2|Уь,го,У,У«,А£) =

= I f(А,а2,Х,Хо|Уь,го,У,У*,АВ^Ж -

М„ХР(К)

- (а2)-И+р]т/2|д + д|р/2 ехр(—^ ; (20)

Ф4 = -г{(У — А^)(У — А^)т£т[/т — (£А)(д-1 + д-1)(£А)т]£}. ри этом если предполо ить, что

А = У^+, (21)

то с учетом свойств псевдообратных матриц [12] будем иметь следую -ие то дества:

(У — А^ )(У — А^ )т =

= [(У — А^) — (А — А)У][(У — А^) — (А — А)^]т =

= £2 + (А — А)Ф(А — А)т, (22)

для компактной записи которых введены матрицы

52 = ^ - А^)(Y - /IV)т,

= ( ) , (23)

Ф = = В+гс(В+го)т +

Воспользовавшись свойствами следа матриц и результатами (20) - (23), приходим к эквивалентному представлению для функционала Ф4:

Ф4 = + £(А - А)Ф(А - А)т£т] х

х [!т - (£А)(д-1 + д-1)(ДА)т]}. (24)

Поскольку непосредственной проверкой с использованием (12) и известных результатов теории матриц [13] можно убедиться в корректности соотношений

[1т - (£А)(д-1 + д-1)(£А)т]-1 =

= 1т + (£А)[(£А)т(£А) + д(д + д)-1д]-1(£А)т; det{Jm + (£А)[(£А)т(£А) + д(д + д)-1д]-1(£А)т} - аеЦд + ф),

(25)

то существуют все основания утверждать, что матрица А, определяемая равенством (21), является оценкой максимального правдоподобия для матрицы А неизвестных параметров исходной математической модели (1). Для нахождения байесовской совместной апостериорной плотности распределения вероятностей элементов матрицы А достаточно воспользоваться соотношениями (20), (24), (25) и известным подходом из работы [11]:

/ (А^ь;го,П,П„АВ) =

сю

= [ /(А,а2|П,;о,^,П„ ДВ)йа2

r^j

~ |DS2DT + - А)Ф(А - A)TDT|-p/2. (26)

Вид плотности распределения вероятностей (26) аналогичен виду плотности распределения вероятностей обобщенного распределения Стьюдента [11]. Для невырожденности полученного распределения должно выполняться условие

rank Ф = n. (27)

Согласно допущению (2) и свойствам псевдообратных матриц [12] имеем

D+ = DT(DDT)-1, B + = BT(BBT)-1.

Воспользовавшись этими результатами и представлением (23) для матрицы Ф, приходим к тождеству

ф = [bt:dti

(ßßT)-1ZQZoT(BBT)-1 ©N,m

0m,N (DDT)-1Y„YT (DDT)-

B D

из которого следует [14] более удобная для практического использования форма представления условия (27):

rank

B D

= n.

(28)

Выводы. При выполнении условий (5), (28) задача параметрической идентификации математической модели (1), (2) является статистически разрешимой, а ее решение полностью определяется оценкой максимального правдоподобия (21) и байесовской совместной апостериорной плотностью распределения вероятностей (26).

сновным элементом условий идентифицируемости математической модели эволюционного процесса любой природа, линейной по оцениваемым параметрам, при наличии априорной информации относительно начальных (граничных) условий является требование полного столбцового ранга матрицы наблюдений [Вт.Дт]т.

При выполнении условий (5), (28) точечная оценка Хо вектора начального состояния Хо, определяемая равенствами (12), (9), (21), может быть выписана в явном виде:

Хо = [(£А)т(£А) + £т£]-1{(£А)тУ1 + Вт^о},

а для нахождения ее плотности распределения вероятностей достаточно воспользоваться байесовской плотностью (7) и известным подходом, приведенным в работе [15].

СПИСОК ЛИТЕРАТУРЫ

1. Евланов Л. Г., Константинов В. М. Системы со случайными параметрами. - М.: Наука, 1976.

2. Sannevend G. A new stable identification scheme and its error estmation for nonlinear systems without imputs // Frac. of 9-th IFAC World Congress. - Budapest, 1981.-V. 10.-P.23-29.

3. Cherruault Y. Mathematical Modelling in Biomedicine. - Dordrecht-Boston-Lancaster-Tokyo: D. Reidel Publishing Company, 1985.

4. Зуев С. М. Статистическое оценивание параметров математических моделей заболеваний. - М.: Наука, 1988.

5. В о л к о в И .К. Условия идентифицируемости математических моделей эволо -ционных процессов по результатам дискретных косвенных измерений вектора состояния // Изв. РАН. Техническая кибернетика. - 1994. - № 6. - C. 65-72.

6. V o l k o v I. K., Zuy e v S. M. On identifiability of mathematical models of evolutionary processes from data of discrete measurements of state vector // Russ. J. Numer. Anal. Math. Modelling. - 1994. - V. 9, № 4. - P. 395^04.

7. В о л к о в И. К. Задачи идентификации математических моделей эволоционных процессов на конечных выборках экспериментальных данных / Препринт № 170.

- М.: ОВМАН СССР, 1987.-48 с.

8. В олков И. К. К задаче параметрической идентификации непрерывных моделей управляемых систем // Изв. АН СССР. Техническая кибернетика. - 1989.

- № 1.-C. 101-104.

9. В о л к о в И. К. Задачи параметрической идентификации дифференциальных моделей эволоционных процессов на конечных выборках экспериментальных данных //С опряженные уравнения и алгоритм! возм^;ений в задачах математической физики. - М.: ОВМ АН СССР, 1989. - С. 112-133.

10. З а к с Ш. Теория статистических выводов. - М.: Мир, 1975.

11. Зельнер А. Байесовские методы в эконометрии. - М.: Статистика, 1980.

12. А л б е р т А. Регрессия, псевдоинверсия и рекуррентное оценивание. - М.: Наука, 1977.

13. Маркус М., Минк Х. Обзор по теории матриц и матричных неравенств. -М.: Наука, 1972.

14. С е б е р Д. Линейный регрессионный анализ. - М.: Мир, 1980.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Пугачев В. С. Теория вероятностей и математическая статистика. - М.: Наука, 1979.

Статья поступила в редакцию 25.04.2005

Игорь Куприянович Волков родился в 1946 г., окончил в 1970 г. Казанский университет. Д-р физ.-мат. наук, профессор кафедры "Математическое моделирование" МГТУ им. Н.Э. Баумана, лауреат Государственной премии и Премии правительства Москвы. Автор более 100 научных работ в области теории вероятностей и уравнений математической физики.

I.K. Volkov (b. 1946) graduated from the Kazansky University in 1970. D. Sc. (Phys.-Math.), professor of "Mathematical Simulation" department of the Bauman Moscow State Technical University, winner of the State Prize and Prize of Moscow Government. Author of more than 100 publications in the field of theory of probabilities and equations of mathematical physics.

i Надоели баннеры? Вы всегда можете отключить рекламу.