Научная статья на тему 'Т-модель многомерной стохастической системы'

Т-модель многомерной стохастической системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
77
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕПАРАМЕТРИЧЕСКИЕ АЛГОРИТМЫ УПРАВЛЕНИЯ / АПРИОРНАЯ ИНФОРМАЦИЯ / МНОГОСВЯЗНОСТЬ / КОЛОКОЛООБРАЗНЫЕ ФУНКЦИИ / ПРОГНОЗИРОВАНИЕ / NONPARAMETRIC CONTROL ALGORITHMS / PRIOR INFORMATION / MULTIPLY / KERNEL FUNCTION / FORECASTING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузьмин М.В., Медведев А.В.

Рассматривается задача идентификации многомерной стохастической системы: компоненты вектора выходных переменных стохастически зависимы, априорная информация о каналах связи соответствует различным уровням неопределённости.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

T-MODEL OF MULTIDIMENTIONAL STOCHASTIQUE SYSTEM

The paper deals with the problem of identification of a multidimensional free-wheeling system for the case where the components of the output variables are stochastically dependent. A priori information about the link of multidimensional system corresponds to the level of different uncertainty.

Текст научной работы на тему «Т-модель многомерной стохастической системы»

<Тешетневс^ие чтения. 2016

УДК 62. 501

Т-МОДЕЛЬ МНОГОМЕРНОЙ СТОХАСТИЧЕСКОЙ СИСТЕМЫ

М. В. Кузьмин, А. В. Медведев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: kuzminmv95@mail.ru

Рассматривается задача идентификации многомерной стохастической системы: компоненты вектора выходных переменных стохастически зависимы, априорная информация о каналах связи соответствует различным уровням неопределённости.

Ключевые слова: непараметрические алгоритмы управления, априорная информация, многосвязность, ко-локолообразные функции, прогнозирование.

T-MODEL OF MULTIDIMENTIONAL STOCHASTIQUE SYSTEM

M. V. Kuz'min, A. V. Medvedev

Reshetnev Siberian State Aerospace University

31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: kuzminmv95@mail.ru

The paper deals with the problem of identification of a multidimensional free-wheeling system for the case where the components of the output variables are stochastically dependent. A priori information about the link of multidimensional system corresponds to the level of different uncertainty.

Keywords: nonparametric control algorithms, prior information, multiply, kernel function, forecasting.

Поднимается проблема стохастической зависимости между переменными объекта. Безусловно, моделируя любой объект, всегда можно условно разделить все переменные на входы и выходы, но такое разбиение является очень упрощённым. В реальности же существует не только связь между входными и выходными переменными, но и неявные связи между некоторыми входными переменными (аналогично и для выходных).

Именно за счёт сложных связей между всеми переменными объекта, который рассматривается в данной статье, этот объект можно считать стохастическим.

Особенность идентификации многомерного стохастического объекта состоит в том, что исследуемый процесс описывается системой неявных стохастических уравнений [1; 2]:

F¡(u(t - т), х(Ц $ = 0, ] = , (1)

где (.) - не известны; т - запаздывание по различным каналам многомерной системы. В дальнейшем, из соображений простоты, т по различным каналам не будет индексировано, а учёт влияния т достигается соответствующим сдвигом элементов выборки наблюдений

х,- = (Хт ^ и = ( Щи ^ ' = 1,

Процесс, описываемый системой неявных стохастических уравнений вида (1), будем называть Т-процессом, а его модель, соответственно, Т-моделью [3; 5]:

F,- (u<< >, x<j >, xt, ut-T ) = 0, j = 1, m .

(2)

В общем виде исследуемая многомерная система, реализующая Т-процесс может быть представлена на рис. 1.

Рис. 1. Многомерный объект со стохастическими связями

Математические методы моделирования, управления и анализа данных.

Вертикальные стрелки на рис. 1 у компонент вектора

Ё Xj ['" ] ХП Ф

8, (i) = Fj (u<j >, x, (i)) = x, (i) --

f Г-Л uk- uk M

c

suk

ЁП ф

f Г.Л

uk- uk M

или компоненты вектора и иллюстрируют их неизвестную стохастическую зависимость. На рис. 1 приняты обозначения: и = («1, ..., ип) - п-мерный вектор входных переменных; х = (,...хт) - т-мерный

вектор выходных переменных.

Задача сводится к тому, что при заданном значении вектора входных переменных и = и' необходимо решить систему (1) относительно вектора выходных переменных х. Общая схема решения такой системы:

1. Сначала в систему (1) подставляется 1-е поступ-

ление входных переменных щ = (ь

,), l=1, s

где s - объём обучающей выборка; л - тестовой, соответственно; I - вновь поступивший набор входных воздействий, для которого необходимо произвести прогноз, затем последовательно подставляются элементы выходных переменных из обучающей выборки

XI = (хя,...хт), I = 1, л , в результате получаем невязки £1 для каждого вновь полученного 1-го набора

входных данных, где 1 = 1, л .

Невязки вычисляются по формуле

£ (0 = ^-(и^ ,хД0) =

¿хД1] х П )

= Xj(i)--

k=1

Ё П )

i=1 k=1 csuv

где ] = 1,т, (3)

где <п> - размерность составного вектора

ик, <п > < п.

В дальнейшем это обозначение используется и для других переменных. В качестве колоколообразных функций Ф(*) взяты гауссовы функции:

2. Следующий шаг состоит в оценивании условного математического ожидания [1; 4], а в качестве его оценки примем непараметрическую оценку регрессии Надарая-Ватсона [3]:

s < n> Ё Xj [i] хП Ф i=1 k1 =1 ' uk1 - uk1[i] ^ Csu ) < m> П Ф k2 =1 Г 8k2 [i] ^ l Cse )

s <n> Ё П Ф i=1 k1 =1 r uk1- uk1[i] уд ф V csu ) k2 =1 Г 8k2[i] ^ l Cse )

j = 1, m .

(4)

Таким образом, оценка (4) даёт решение системы (1), которое и является оценкой (прогнозом) Xу выходных переменных х при значениях входной переменной и = и.

На рис. 2 продемонстрирован пример прогноза одного из компонент вектора выхода объекта.

- »Тестовое значение ■ Прогнозное значение Рис. 2. Прогноз одного из выходов объекта Библиографические ссылки

1. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ, 2010. № 4(31). С. 4-9.

2. Хардле В. Прикладная непараметрическая регрессия : пер. с англ. М. : Мир, 1993. 327 с.

3. Медведев А. В. Основы теории адаптивных систем ; СибГАУ. Красноярск, 2015. 525 с.

4. Цыпкин Я. 3. Информационная теория идентификации. М. : Наука. Физматлит, 1995. 336 с.

5. Кузьмин М. В., Медведев А. В., Мальцева Т. В. О КТ-моделях многомерных безынерционных систем с запаздыванием // Решетневские чтения : материалы XIX Междунар. науч.-практ. конф. / СибГАУ. Красноярск, 2015. Ч. 2. С. 55-57.

References

1. Medvedev A. V. Teoria neperametricheskih sistem. Modelirovanie (Theory of nonparametric systems. Simulation). VestnikSibGAU, 2010. № 4(31). P. 4-9.

su

k

=1 k =1

i=1 k=1

Решетневс^ие чтения. 2016

2. Hardie V. Prikladnaya neparametricheskaya regressiya. (Applied nonparametric regression). M. : Mir. 1993. 327 p.

3. Medvedev A. V. Osnovy teorii adaptivnyh sistem. (Fundamentals of the adaptive systems theory). Izd: SibGAU. Krasnoyarsk. 2015. 525 p.

4. Cypkin Ja. 3. Informacionnaja teorija identifikacii. (Information theory of identification). M. : Nauka. Fizmatlit, 1995. 336 p.

5. Kuz'min M. V., Maltseva T. V., Medvedev A. V. O KT-modeliah mnogomernih bezinercionnih sistem s zpazdivaniem. (About KT-models of of multidimensional inertialess systems with lags). Reshetnevskie chtenia: material of XIX Sibsau conferention. Krasnoyarsk, 2015. Vol. 2, pp. 55-57.

© Кузьмин М. В., Медведев А. В., 2016

УДК 519.854.33

СРАВНЕНИЕ МОДИФИЦИРОВАННОГО МЕТОДА ЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ С ДРУГИМИ АЛГОРИТМАМИ НА ПРАКТИЧЕСКИХ ЗАДАЧАХ*

Р. И. Кузьмич1, И. С. Масич2

1Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79 2Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: kuzrom88@mail.ru

Приводится сравнительный анализ модифицированного метода логического анализа данных с известными алгоритмами классификации данных. Сравнение проводится на задачах классификации результатов радарного сканирования ионосферы и выявления спама.

Ключевые слова: закономерность, классификация, классификатор.

COMPARISON OF THE MODIFIED METHOD OF LOGICAL DATA ANALYSIS WITH OTHER ALGORITHMS BASED ON PRACTICAL PROBLEMS

R. I. Kuzmich1, I. S. Masich2

1Siberian Federal University 79, Svobodny Av., Krasnoyarsk, 660041, Russian Federation

2Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: kuzrom88@mail.ru

The comparative analysis of the modified method of logical data analysis with known data classification algorithms is conducted. A comparison is carried out based on the problems of the classification results of the radar scan of the ionosphere and the spam detection.

Keywords: pattern, classification, classifier.

Основным объектом изучения в проводимой авторами работе является метод логического анализа данных, относящийся к логическим алгоритмам классификации, принцип работы которых состоит в выявлении закономерностей в данных и формализации их в виде набора правил, т. е. набора закономерностей, описываемых простой логической формулой. В работе проводится сравнение модифицированного метода логического анализа данных с известными алгоритмами классификации: алгоритм построения 1-правил (1-Я), RIPPER, CART, C4.5, Random Forest, Adaboost [1-3].

* Работа выполнена в рамках проекта № 346 государственного задания № 2014/211.

Экспериментальное сравнение проводится на задачах классификации результатов радарного сканирования ионосферы и выявления спама.

В основе предлагаемого подхода к классификации данных лежит метод, происходящий из теории комбинаторной оптимизации и называемый логическим анализом данных [4].

Последовательные элементы метода [4]: 1. Для исключения избыточных переменных в исходной выборке данных во множестве переменных определяется некоторое подмножество Б, используя которое можно отличать положительные наблюдения от отрицательных. Далее для работы метода используются проекции О/ и множеств О+ и О- на Б.

i Надоели баннеры? Вы всегда можете отключить рекламу.