Научная статья на тему 'Математические модели систем с латентными переменными'

Математические модели систем с латентными переменными Текст научной статьи по специальности «Математика»

CC BY
245
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМЫ С ЛАТЕНТНЫМИ ПЕРЕМЕННЫМИ / РЕГРЕССИОННЫЙ АНАЛИЗ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ / ДЕКОМПОЗИЦИЯ ИГРЫ / LATENT VARIABLE MODELS / REGRESSION ANALYSIS / PRINCIPAL COMPONENT ANALYSIS / GAME-THEORETIC MODELS / GAME DECOMPOSITION

Аннотация научной статьи по математике, автор научной работы — Оскорбин Николай Михайлович

В статье рассмотрены проблемы математического моделирования трех классов систем с латентными переменными, для которых предложены структуры моделей и методы идентификации параметров. Результаты исследования носят теоретический характер, а предложенные модели и методы требуют детализации с учетом особенностей систем с латентными переменными и имеющейся априорной информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Оскорбин Николай Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical Models of Systems with Latent Variables

In the paper author consider problems of mathematical modeling of three classes of systems with latent variables. For these classes of systems structures of models and methods for identification of parameters are proposed. Results of research have theoretical character, and the offered models and methods demand on specification taking into account features of systems with latent variables and available a priori information.

Текст научной работы на тему «Математические модели систем с латентными переменными»

УДК 519.833

Н.М. Оскорбин

Математические модели систем

*

с латентными переменными

N.M. Oskorbin

Mathematical Models of Systems with Latent Variables

В статье рассмотрены проблемы математического моделирования трех классов систем с латентными переменными, для которых предложены структуры моделей и методы идентификации параметров. Результаты исследования носят теоретический характер, а предложенные модели и методы требуют детализации с учетом особенностей систем с латентными переменными и имеющейся априорной информации.

Ключевые слова: системы с латентными переменными; регрессионный анализ, метод главных компонент, теоретико-игровые модели, декомпозиция игры.

In the paper author consider problems of mathematical modeling of three classes of systems with latent variables. For these classes of systems structures of models and methods for identification of parameters are proposed. Results of research have theoretical character, and the offered models and methods demand on specification taking into account features of systems with latent variables and available a priori information. Key word: latent variable models, regression analysis, principal component analysis, game-theoretic models, game decomposition.

Рассматриваются проблемы математического моделирования систем, в которых в процессе их функционирования отдельные существенные переменные не наблюдаются. В литературе этот тип переменных называют латентными [1]. Введем обозначения: V е Ят - латентные переменные; г е Я" - наблюдаемые (контролируемые) переменные; у е Я р - выходные переменные моделируемого объекта. Тогда система с латентными переменными может быть представлена в следующем виде:

у = /г (г, V), г е 1 е Я", V е¥ е Ят. (1)

В данном случае без потери общности мы рассматриваем частный случай реальных объектов, которые характеризуются только количественными переменными, а их функционирование не зависит от времени.

Системы типа (1) изучаются, например, в психологии и социологии [2], когда переменные г - результаты тестирования индивида, V - параметры состояния личности. При моделировании экономических процессов исходной информацией выступает статистическая, бухгалтерская отчетность. При этом скрытыми остаются параметры поведения производственного персонала, технические и технологические факторы.

Проведем исследование трех классов систем (1), для которых возможно построение работоспособных

математических моделей. Первый класс систем (1) рассматривается в классическом регрессионном анализе, в рамках которого искомая математическая модель представляется в следующем виде (р = 1):

У = / (г, р) + 8(v), (2)

где Р - идентифицируемые параметры заданной структуры функциональной зависимости; 8 - агрегированная переменная, которая предполагается нормально распределенной случайной величиной, имеющей нулевое математическое ожидание и постоянную дисперсию.

Предположим, что переменные {у , г1 }^=1 для N

независимых объектов аналогов измеряются точно. Тогда идентификации подлежит функция регрессии /(г, Р) = М8[у / г] - условное математическое ожидание выходной переменной системы при фиксированном значении г, а задача решается методом наименьших квадратов. Качество моделирования (показатель работоспособности полученной математической модели) оценивается, например, коэффициентом детерминации, нормативные значения которого приведены в [3]. Заметим, что при наличии ошибок измерения переменной у , / = 1,..., N

в моделях прогноза необходима коррекция этого показателя [4], которая способствует более точной идентификации дисперсии переменной £ в модели (2). В результате математического моделирования систем

*

Работа выполнена в соответствии с проектом РФФИ №12-01-98008 (конкурс р_сибирь_а).

с латентными переменными получается модель (2), которая широко используется в теоретических и прикладных исследованиях.

Второй класс систем (1) имеет структуру следующего вида:

у = I(г, V(г)), г е 7 е Я". (3)

В данном случае идентификации подлежат вектор-функция 1( г) : 1 ^ V и системная вектор-

функция I (г, V) : 1 х V ^ У, где У - множество значений выходных переменных моделируемого объекта. В этом классе систем (1) значения латентных переменных полностью определяются наблюдаемыми переменными. Как будет показано ниже, в частном случае структуры модели (3) задача идентификации решается методом главных компонент (МГК), который эффективно применяется не только для оценки латентных структур, но и как метод многомерного анализа экспериментальных данных [2]. В практике применения МГК задача моделирования решается успешно, если достаточно высоко значение коэффициента детерминации, а латентные переменные допускают непротиворечивую интерпретацию в рамках теории рассматриваемой предметной области. Модель (3) может быть рассмотрена в контексте модели (2), т.е. с включением в ее структуру аддитивной или мультипликативной составляющей ошибки описания системы (1).

Рассмотрим подход к решению задачи идентификации модели (3). Пусть функции / (г, “Р( г)), “Р( г)

заданы с точностью до значений векторов Р°, р, т.е.:

V = V(г,Р); у = I(г,р°,V(г,Р)). (4)

Тогда при известной выборке {y, z{

для

N

объектов-аналогов задача идентификации модели (4) может быть записана так. Найти оптимальные зна-

/70* /?*

чения Р , Р векторных параметров из условия

(Р= 1):

s = mm<

где

у - у

- УР

i = І,..., n} , (З)

норма разности векторов

уэ = Oi,...,yN)T и yp с элементами yf = f (Zi,р0,

v ( Zi , P)) ; B - множество допустимых значений вектора P; l - размерность вектора р0.

Условия задачи (5) при моделировании реальных систем необходимо конкретизировать с учетом дополнительной информации о свойствах объекта моделирования, в частности, о характере распределения латентных переменных. В вычислительном отношении эта задача может быть решена с использованием пакетов программ математических вычислений, в том числе с помощью инструмента «Поиск решения» в среде Excel. Возможны ее постановки в рамках прикладного интервального анализа и в рамках блочного программирования [5].

В частном случае линейных вектор-функций

V = V(г, Р), у = I (Р°, V)), условий ортогональности латентных переменных и использования для Р собственных векторов матрицы (гэТ • гэ),

где гэ = (г1,...,г¥!)Т решение задачи (5) совпадает

с оценками МГК. Пусть р = 1, " = т (размерность вектора латентных переменных совпадает с размерностью вектора г), а функции V = V(г, Р),

ур = I(Р°,V)) заданы при всех / = 1,..., N следующими выражениями:

ур = X +Р0, ^ = X Р}кггк, 1 = N , (6)

у=1 к=1

где Р - квадратная (п х п) матрица коэффициентов связи латентных переменных с наблюдаемыми переменными системы (1); V1 = (^ ■,...,VN!■ )Т -

вектор значений латентной переменной 1 для всех объектов-аналогов; Р° = (Р0,..., Р"") - (п + 1)-мер-ный вектор коэффициентов связи латентных переменных с выходной переменной у .

Можно показать, что в условиях невырожденности матрицы (гэТ • гэ) решение задачи (5)

с функциями (6) и евклидовой нормой совпадает с оценками МГК, если множество В задать следующими выражениями:

(РРТ) = Еп; (V1,/) = 0,

1 = 1,...,п; к = (1 +1),...,п, (7)

где Еп - единичная матрица размера п; (V1, V ) -

скалярное произведение соответствующих векторов.

Установленная связь задачи (5) с МГК позволяет предложить пути ее конкретизации и рассмотреть проблемные аспекты. Основная проблема постановки и решения задачи (5) возникает в связи с тем, что область значений функции V = V( г, Р) не задана.

В задаче (5) эта область косвенно задается множеством В, которое в МГК задано ограничениями (7). Недостатки данного способа связаны с тем, что предполагается зависимость латентных переменных от всех наблюдаемых переменных и ортогональность соответствующих векторов, т.е. их взаимная независимость в моделируемой системе. По нашему мнению, это требование существенно ограничивает сферу применения МГК, приводит к ошибкам интерпретации латентных переменных и к усложнению вычислительных процессов при моделировании систем (1) в случае их большой размерности. Для задачи (5) можно предложить достаточно универсальную систему ограничений, аналогичную (7), которая используется при декомпозиции блочных задач стохастического программирования [5]. Суть ее состоит в задании функции распределения значений латентных переменных с последующей

9S

настройкой параметров этой функции в процессе моделирования. На практике можно ограничиться заданием начальных моментов этого многомерного распределения вероятностей. Учитывая избыточность искомых параметров, в задаче (5) практически приемлемым способом является поиск нормированных значений латентных переменных с нулевыми средними и единичными разбросами. В качестве начального приближения для множества В можно предложить следующие условия:

1 N 1 N

И Я; N%У'] = 0; N= 1 ]=1, ',т. (8)

В данном случае не регламентируется число латентных переменных и структура функции

V = у(г, И). Внешний параметр Я в (8) настраивается при решении задачи (5), а в случае, когда выполняется равенство ||И|| = Я, система ограничений (8) или структура функции V = V ( г, И )

корректируются с использованием дополнительной информации о свойствах исследуемой системы.

Рассмотрим системы (1), которые имеют следующее описание:

у = /(г(V)), V е V с Ят; г(V): V ^ I. (9)

В данном случае латентные переменные детерминируют контролируемые переменные г , но непосредственно не оказывают влияния на значения выходных переменных. Такие системы возникают, например, при моделировании социально-экономических процессов, в которых переменные г контролируются верхним уровнем системы (центром), а значения латентных (скрытых для центра) переменных выбирают активные элементы системы. Тогда модель (9) может быть представлена игрой двух лиц в следующем виде:

Уц = /(г 0, г ^)) ^ тах;

УАЭ = /аз (г0.г(У)) ^ тах.

(10)

(11)

Решение игры (10), (11) базируется на эквивалентном ее преобразовании:

Задача центра:

г 0єг 0

Задача активных элементов системы: У АЭ = /аз (г 0, г) ^ П1ах-

(12)

(13)

Вспомогательная

системы:

8 = тіп

задача активных элементов

= 0.

(14)

лируемых переменных системы, поскольку при известном игрокам множестве I выражения (12), (13)

не зависят от латентных переменных. При нахожде-

/ 0* * \

нии компромиссного решения (г , г ) активный

элемент системы выбирает оптимальные значения

латентных переменных из задачи (14), обеспечивая

тем самым реализацию своего игрового решения

* ~ / * \ * г = г (V ) , где V - оптимальное для системы

поведение активных элементов. Описанный подход моделирования можно применять при произвольном числе активных элементов.

Рассмотрим в качестве примера экономическую систему (9), в которой активный элемент выбором латентных для центра переменных способен получить дополнительную прибыль А е [0, А], А> 0. Центр часть прибыли и А, се [0,1] передает

активный элемент в качестве вознаграждения. Модельное описание данной системы (выражения (10), (11)) примет вид:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Уц = /ц(с А(У)) = (1 -с) А(V) ^ тах; (15)

се[0,1]

Уаэ = /аэ с, А (v ),Ф (А (v))) =

= а А(V) - ф(А(V)) ^ тах

(16)

где ф (А (V )) - функция трудозатрат АЭ, которая, по предположению, зависит только от контролируемой центром переменной А = А (V) .

Установив соответствия переменных моделей (10), (11) и (15), (16): 20 оа; 2 •О (А, ф), запишем

выражения, аналогичные (12)-(14):

Задача центра:

Уц = /ц (а>А) = (1 -а) А ^ тах. (17)

ає[0,1]

Задача активных элементов системы:

Уаз = /аз (а,А) = а А - ф(А) ^ тах- (18)

Ає[0,А ]

Вспомогательная задача активных элементов системы:

8 = тіп

А * -А (V) = А* -А (V*)

= 0, (19)

Экономический смысл полученных выражений состоит в следующем. Центр и активные элементы системы «играют» на множествах значений контро-

А*

- оптимальная стратегия активных элементов системы в игре (17), (18); V - решение задачи (19).

Игра (17), (18) исследована в литературе как одна из базовых моделей стимулирования [6], как модель «Государство-Предприниматели» [7] в предположении, что игрокам известны все ее функции и значения параметров. Выбор латентных переменных осуществляет активный элемент, как «чистый исполнитель» решений, найденных на множествах контролируемых переменных моделируемой системы. Модель (17)-(19) полностью определяет поведение центра и активных элементов, значения

системных (выходных) переменных и адекватна реальному объекту в том случае, когда в (19) имеет место равенство 8 = 0 . Если 8 > 0, то полученная модель не адекватна реальной системе. Приведенные условия контролируются после реализации решения в рассматриваемой системе или на объектах-аналогах.

Заключение. На основании проведенных исследований можно утверждать, что проблема математического моделирования систем (1) в общем случае не разрешима. Выделены частные случаи систем (1), для которых возможно построение работоспособных моделей:

1. Системы с оцениваемой неопределенностью (модель (2)).

2. Системы с латентными агрегатами (модель (3)), которые назовем ЬС-системами.

3. Системы с управляемыми латентными переменными (модель (9)), которые назовем СЬ-сис-темами.

Для моделирования ЬС-систем предложен метод идентификации латентных переменных, который является обобщением МГК, и рассмотрены вычислительные проблемы решения соответствующих математических задач.

Записан вариант математической модели управляемых СЬ-систем, в которых задача выбора латентных переменных сформулирована как задача реализации согласованных значений контролируемых переменных. Результаты исследования носят теоретический характер, а предложенные модели требуют детализации с учетом особенностей систем с латентными переменными и имеющейся априорной информации.

Библиографический список

1. Латентные переменные (Latent variable) [Электронный ресурс]. - URL: http://en.wikipedia.org/wiki/Latent_variable.

2. Гуц А.К., Фролова Ю.В. Математические методы в социологии. - М., 2007.

3. Ехлаков Ю.П. Теоретические основы автоматизированного управления. - Томск, 2001.

4. Максимов А.В., Оскорбин Н.М. Многопользовательские информационные системы: основы теории и методы исследования. - Барнаул, 2005.

5. Мамченко О.П., Оскорбин Н.М. Моделирование иерархических систем. - Барнаул, 2007.

6. Новиков Д.А., Губко М.В. Теория игр в управлении организационными системами. - М., 2002.

7. Денисенко В.В., Оскорбин Н.М. Сравнение стратегий Г1 и Г2 в игре «Государство-Предприниматели» // Известия АлтГУ. - 2010. - №1.

i Надоели баннеры? Вы всегда можете отключить рекламу.