Научная статья на тему 'Достижение стационарного распределения марковского процесса за конечное время'

Достижение стационарного распределения марковского процесса за конечное время Текст научной статьи по специальности «Математика»

CC BY
131
23
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Веприк Александр Ефимович

Построен алгоритм управления матрицей интенсивностей перехода однородного марковского случайного процесса с непрерывным временем в целях достижения стационарного распределения вероятностей за конечный промежуток времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Веприк Александр Ефимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Markovian process stationary distribution achievement for finite time

Homogeneous markovian process infinitesimal matrix control algorithm is constructed to achieve stationary distribution for finite time interval.

Текст научной работы на тему «Достижение стационарного распределения марковского процесса за конечное время»

менты которой ajj (1 < i,j < n) удовлетворяют следующим условиям:

1) ajj < 0 1 < i < n ;

2) aij > 0 1 < i,j < n,i ф j;

n

3) ^aij = 0 1 < i < n •

j=1

Пусть p — максимальный по модулю диагональный элемент матрицы A • Из условия 1 следует, что p — максимальный по модулю отрицательный элемент матрицы A, а из условий 2 и 3 следует, что p — максимальный по модулю элемент матрицы A.

Построим матрицу следующим образом:

B = (A+|p|E)/|p|,

где e — единичная матрица. Элементы матрицы bij (1 < i, j < n) удовлетворяют следующим условиям:

1) 0 < bij < 1, 1 < i,j < n;

n

2) ^bij = 1, 1 < i < n •

j=1

Таким образом, матрица А является стохастической. Найдем границы множества собственных значений квазистохастической матрицы A. Пусть некоторое число X 0 является характеристическим корнем матрицы A. Тогда оно удовлетворяет характеристическому уравнению матрицы A:

|A -X 0E|= 0,

||p|(B-E)-X0E|= 0 ,

||p|B - (X 0 +|p)E/|p||= 0.

Таким образом, число (X 0 +|p|)/|p| удовлетворяет характеристическому уравнению матрицы B и, следовательно, является характеристическим корнем стохастической матрицы B.

Обозначим множество характеристических корней всех квазистохастических матриц n -го порядка

с максимальным по модулю элементом p через кП . Из сказанного следует, что все элементы множества Kn получаются из элементов множества Mn умножением на число |p| и вычитанием числа | p|. Таким образом, для квазистохастических матриц n -го порядка с максимальным по модулю элементом p справедливы следующие утверждения:

Kp представляет собой отрезок действительной

оси [-2|p|,0]. Kp представляет объединение треугольника с вершинами в точках (0,0), |p|exp(2ni / 3)-|p|, |p|exp(4ni / 3)-|p| с отрезком действительной оси

[ 2|p|,0].

Для n > 3 фигура кП заключена в круге |z+|p||<|p| и имеет с окружностью |z+|p||=|p| общие точки

|p|exp(2nia / b)-|p|, где 0 < a < b < n . Граница кП состоит из этих точек и соединяющих их в круговом порядке криволинейных дуг.

Отрезки границы множества Kp, проходящие

через точку комплексной плоскости (0,0), представляют собой отрезки прямых, соединяющих точки |p|exp(2ni(n -1) / n)-|p| и (0,0), (0,0) и |p|exp(2ni / n)-|p| соответственно.

Литература: 1 .Дмитриев Н.А., Дынкин Е.Б. Характеристические корни стохастических матриц // Изв. АН СССР. Серия математическая. 1946. № 10. C.167-184. 2.Карпеле-вич Ф.И. О корнях матриц с неотрицательными элементами // Изв. АН СССР. Серия математчиеская. 1951. № 15. C.361-383.

Поступила в редколлегию 22.09.98 Рецензент: д-р техн. наук Гиль Н.И. Веприк Александр Ефимович, научный сотрудник кафедры ПМ ХТУРЭ. Адрес: Украина, Харьков, ул. Командарма Уборевича, 20-А, кв.10, тел. 65-90-38.

УДК 519.217.8

ДОСТИЖЕНИЕ СТАЦИОНАРНОГО

РАСПРЕДЕЛЕНИЯ МАРКОВСКОГО ПРОЦЕССА ЗА КОНЕЧНОЕ ВРЕМЯ

ВЕПРИКА.Е.

Рассматривается однородный марковский случайный процесс с непрерывным временем, для которого выполняются условия сходимости к стационарному распределению. Предлагается способ управления параметрами процесса в целях достижения стационарного распределения марковского процесса за конечное время.

Рассмотрим однородный марковский случайный процесс с непрерывным временем x(t) и конечным состоянием n. Такой процесс рассмотрен в [ 1]. Пусть для этого процесса выполнены условия теоремы о

сходимости к стационарному распределению. Тогда существует набор стационарных вероятностей, к которым стремятся с течением времени соответствующие вероятности нахождения данного процесса в его состояниях, причем этот набор единственен. Ставится задача управления значениями параметров однородного марковского случайного процесса в целях ускорения достижения вероятностями нахождения данного процесса в его состояниях стационар -ных вероятностей. Для решения этой задачи разработан алгоритм управления значениями параметров данного процесса.

Лемма 1. Рассмотрим однородный марковский процесс с конечным числом состояний n и параметрами X ij (1 < i, j < n). Пусть для этого процесса выполняются условия теоремы о сходимости к стационарному распределению, причем все стационарные вероятности не равны нулю: p* ф 0, 1 < i < n.

Определим матрицу A следующим образом:

РИ, 1998, № 3

61

aij = Pjnji’ 1 - i,j - n •

Рассмотрим произвольный набор несовпадающих номеров (d1,...,dm) с (1,...,n), 1 - m - n.Тогда для элементов матрицы B, определяемой формулами

bij = akk. (ki є (di ’.. ,dm)’ 1 - i,j - m) , выполняет-

J j j '

m

ся условие £ bij - 0 (1 - j - n), и существует такой i=1

m

номер l є (dj,dn ) , что £ bii < 0 . (Доказатель-

i=1

ство см. в работе [2]).

Лемма 2.

Рассмотрим систему линейных уравнений

Az = b j (1)

где A єRnxn,z є Rn,b єRn .

Пусть выполняются условия:

1. aii < 0 Vi;

2. aij > 0 Vi Ф j;

n n

3. £ aij - 0,1 - j - n; 31, 1 -1 - n, £ ail < 0;

"i=1 i=1

4. bi - 0 Vi, bj < 0;

5. bi = 0 ^ 31,1 - 1 < 0, ai1 > 0;

6. Для любого набора несовпадающих номеров (db...,dm) с (1,...,n), 1 - m- n условие выполняется. (Доказательство см. в работе [2]).

Перейдем к рассмотрению собственно алгоритма. Предположим, что начальное распределение вероятностей имеет следующий вид. Вероятность нахождения процесса в одном из состояний в начальный момент времени равна единице, во всех остальных она равна нулю. Основная идея алгоритма заключается в следующем. В момент времени t=0 считаем, что

X i (t) = 0 для всех состояний, кроме состояния V , в

котором начальная вероятность не равна нулю. X i

зависят от t, так как мы будем изменять их с течением времени. На каждом шаге алгоритма вероятность нахождения процесса достигает стационарного значения в одном или нескольких состояниях. С каждым шагом число состояний, вероятности нахождения процесса в которых достигли стационарных значений, увеличивается. В момент достижения стационарных значений в новых на данном шаге

состояниях параметры X i изменяются таким образом, чтобы, начиная с этого момента времени, значения вероятностей нахождения процесса в этих состояниях не изменялись, т. е. в любой момент времени после момента достижения были равны

стационарным вероятностям. Параметры X i для состояний, в которых стационарные значения еще не достигнуты, равны нулю. Параметр Xv остается неизменным всегда.

Пусть завершился k-й шаг алгоритма (перенумеруем состояния по порядку достижения в них стационарных вероятностей, нулевой номер присвоим

состоянию v). Вероятности нахождения процесса в состояниях с 1-го по k-е удовлетоворяют системе дифференциальных уравнений Колмогорова [1]:

k

Pi(t) = X0п0iP0(t) + £X jn jiPj (t) 1 - і- k j=1

Требуя сохранения стационарных значений вероятностей Pi (t) (1 - i - k), имеем

k *

X0п0iP0(t) + £XjпjiPj = 0 1 - i - k j=1

P0(t) > 0 Vt > 0, k X j

X0п0i + £ 77Tп jiPj = 0 1 - i - k .

j=1 P0 (t)

Пусть Xi = ZiP0(t), где Zi неизвестный коэффициент, подлежащий определению:

k *

X0п0i + £ zjn jiPj = 0 1 - i - k (2)

j=1

Решив систему (2), находим коэффициенты Zi и

вычисляем необходимые значения Xi = ZiP0(t). Система (2) удовлетворяет условиям 1—6 леммы 2 для 1 - k < n . Следовательно, она имеет единственное

решение Zi > 0 1 - i - k .

Докажем конечность промежутка времени, за который при работе алгоритма вероятности нахождения процесса во всех его состояниях достигают стационарных значений. В начальный момент времени t = 0 все параметры X i = 0, кроме Х0 . Тогда для

всех i таких, что п0i >0 : Pi(t) = п0iX0P0(t) .

Так как до того момента времени, когда

£ Pi(t) = 1 -,p0 P0(t) > p0 , то Pi(t) >п0iX0p0 .

i=1

Следовательно, промежуток времени

tj(Pi(t) <P* Vt<tj;Pi(t)>p* Vt>tj

конечен.

Выбираем t1 = mint* . X 1(t) выбирается таким

* *

образом, чтобы p1(t) = р1 Vt > t1.

Пусть стационарные вероятности достигнуты в m-1 вершинах. Тогда решается система (1) для k=m-1, которая имеет единственное решение:

Zj > 0 1 - j - m - 1.

* *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Полагаем Xj = Zjp0(t) (1 - j - k -1; tm-1 - t - tm). Для состояний j таких, что

m - j - n -1, п ij > 0,1 - i - m -1,

m-1 * A

£ Pi пijzi +X0п0j IP0(t) ,

i=1 У

p_j (t) > const > 0 (m - j - n - 1) . Следовательно, промежуток времени tm тоже конечен для всех m. В момент времени t*j-1 стаци-

62

РИ, 1998, № 3

онарные значения достигнуты в состояниях с 1-го по (п-1)-е. Значит, и p0(t) = p0 . Следовательно,

если число состоянии конечно, то промежуток времени, за который при работе алгоритма вероятности нахождения процесса во всех состояниях достигают стационарных значении, конечен. Оценим этот промежуток времени. Очевидно, что он совпадает со временем достижения стационарного значения вероятностью нахождения процесса в состоянии 0:

Тогда

' n—1

P0(t) = exp-jl E^ i(t) п ioPi (t) 0 It \

Ц=1

p0 = exp

n—1

E pin i0zi(t0)p0 —^ 0 jt

t* =________l^Po_________

0 n—1 * * *

E pin i0zi(t0)p0 —^ 0

i=1

Вычислим

n—1 * * * * n—1 Д

Epini0zi(t0)p0 = p0 Epi i=1 i=1 V

n—1

En ij

j=1 j

zi(t0) =

Тогда

* n—1n—1 * * * n—1 *

p0 E Epinijzi(t0) = p0 E^0n0j = p0^0

j=1i=1 j=1

Литература:І.Розанов Ю.А. Теория вероятностей. Случайные процессы и математическая статистика. М.: Наука. 1989. 312 с. 2.Веприк А.Е., Герасин С.А., Дикарев В.А., Родзинский А.А., Числин Н.И. Методы и алгоритмы фокусировки распределении марковских процессов. Харьков, 1997. 159 с.

Поступила в редколлегию 27.09.98 Рецензент: д-р техн. наук Гиль Н.И. Веприк Александр Ефимович, научный сотрудник кафедры ПМ ХТУРЭ. Адрес: Украина, Харьков, ул. Командарма Уборевича, 20-А, кв.10, тел. 65-90-38.

УДК 681.513.7

ОБ ОДНОМ АЛГОРИТМЕ ТАКСОНОМИЧЕСКОЙ КЛАССИФИКАЦИИ НА ОСНОВЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

БОДЯНСКИЙ Е.В., ЛЮБЧИК Л.М., МАТУСОВСКИЙ Г.А., ПЛИСС И.И

Предлагается алгоритм сжатия массивов финансово-экономической информации на основе таксономического показателя уровня развития. Процедура предназначается для работы в режиме реального времени и реализована с помощью нейросетевой технологии.

В настоящее время в социально-экономических, экономико-математических, математико-криминалистических [1-4] исследованиях для анализа объектов и систем с большим числом показателей используются таксономические процедуры классификации [5]. Они основаны на расчете так называемого таксономического показателя уровня развития, представляющего собой синтетическую величину.Пос-ледняя включает в себя все множество контролируемых технических, экономических, финансовых и других показателей и позволяет ответить на вопросы: насколько хорошо или плохо функционировал объект в каждый текущий момент контроля; каков его рейтинг в системе аналогичных объектов; какие показатели “виновны” в плохих результатах (низком рейтинге); каким должен быть гипотетический эталонный объект и насколько далеко наш контролируемый объект отстоит от эталона.

Рассмотрим процесс построения таксономического показателя уровня развития для объекта с п

технико-экономическими и финансовыми показателями, наблюдавшегося на временном интервале от 1 до t.

Первым этапом является построение (t х n) мат-

рицы наблюдений

'x 11 x 12 . • x 1k x1,k+1 . •• x1n ^

x 21 x 22 . • x 2k x2,k+1 . •• x 2n

Xt =

x i1 xi2 . • x ik xi,k+1 . •• xin (1)

Vx t1 xt2 . • xtk xt,k+1 . • • x tn j

сод ержащей t строк, которые соответствуют разным моментам времени контроля, и п столбцов, отвечающих разным показателям. Таким образом, Xim — это значение m-го показателя в i-й момент времени. Все показатели в матрице Xt разбиты на две группы: показатели-стимуляторы и показатели- дестимуляторы, которые отличаются тем, что если увеличение значения показателя улучшает общее состояние объекта, то это стимулятор, если же наоборот (чем больше показатель, тем хуже) — то это дестимулятор. Показатели-стимуляторы будем обозначать с помощью символа л, дестимуляторы — v . Если же в процессе вычислений разделение на стимуляторы и дестимуляторы непринципиально — символы л и v не используются. С формальной точки зрения такое разбиение соответствует введению двух подмножеств: стимуляторов Xц...xik таких, что xij ь xi+ц,

если xij > xi+1,j, j = 1,2,...,k , и дестимуляторов xi,k+1. xin таких, что xa ь xi+11, если xa < xi+11, l = k +1,... ,n.

РИ, 1998, № 3

63

i Надоели баннеры? Вы всегда можете отключить рекламу.