ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013 Управление, вычислительная техника и информатика № 1(22)
УДК 519.68
А.А. Корнеева, Н.А. Сергеева, Е.А. Чжан
О НЕПАРАМЕТРИЧЕСКОМ АНАЛИЗЕ ДАННЫХ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ
Исследуется задача восстановления матрицы наблюдений при оценивании функции регрессии по измерениям со случайными ошибками. Заполнение пропусков осуществляется с помощью непараметрической оценки кривой регрессии. Приводятся результаты численных исследований, иллюстрирующих эффективность работы предложенной методики. Рассматривается моделирование нового класса процессов стохастических объектов со статистической зависимостью компонент вектора входа.
Ключевые слова: идентификация, непараметрические модели, «трубчатые» процессы.
Проблема моделирования, идентификации, безусловно, надолго останется одной из центральных проблем кибернетики. При формулировке задач идентификации и управления особую роль играет уровень априорной информации. Он зависит как от априорных знаний о процессе, имеющихся средствах контроля, так и от самой технологии измерения переменных. Более того, отличие в средствах контроля неизбежно будет приводить к различным постановкам задач идентификации и моделирования даже для процессов одного и того же типа.
Приведем достаточно общую схему исследуемого процесса:
Рис. 1. Общая схема исследуемого процесса и контроля переменных
На рис. 1 приняты обозначения: А - неизвестный оператор объекта, х(?) е х) с Я1 - выходная переменная процесса,
и(0 = ((/),и2(0,...,ит(?)) е О-(и) с Ят - входное воздействие, §(/) - векторное случайное воздействие, ? - непрерывное время, Ни, Нх - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, Ни (?), Нх (?) - случайные помехи измерений
соответствующих переменных процесса с нулевыми математическими ожиданиями и ограниченной дисперсией. Контроль и (ґ) осуществляется через интервал времени Дґ, контроль х(ґ) - через АТ , причем Дґ << АТ . Пример матрицы измерений подобного рода объектов представлен в табл. 1 («-» - пропуск матрицы наблюдений).
Т аблица 1
Матрица наблюдений исследуемого процесса
Входная переменная и х
и1 и2 ит
ип и21 ит1 Х1
и12 и22 ит2 -
и13 и23 ит3 -
и14 и24 ит4 Х4
иЬ и2„ ит5 х*
Отличие дискретности измерения переменных, характеризующих состояние исследуемого процесса, обусловлено средствами контроля. В частности, измерения некоторых переменных может осуществляться электрическими средствами и быть достаточно малой величиной. Измерения же других переменных может быть проведено только в результате химического анализа, который требует значительно больше времени.
1. Идентификация в «узком» и «широком» смыслах
При моделировании разнообразных дискретно-непрерывных процессов в настоящее время доминирует теория идентификации в «узком» смысле [1]. Ее содержание состоит в том, что на первом этапе, на основании имеющейся априорной информации, определяется параметрический класс операторов Аа, например:
Ха «) = Аа (и(Г), а), (1)
где Аа - параметрическая структура модели, а а - вектор параметров. На втором этапе осуществляется оценка параметров а на основе имеющейся выборки {хг- , иг-, I = 1,5}, 5 - объем выборки. Оценка параметров может осуществляться с
помощью многочисленных рекуррентных процедур, в частности методом стохастических аппроксимаций либо методом наименьших квадратов. Успех решения задачи идентификации в этом случае существенно зависит от того, насколько «удачно» определен оператор (1). В настоящее время теория параметрической идентификации является наиболее развитой [1].
Идентификация в «широком» смысле предполагает отсутствие этапа выбора параметрического класса оператора [2]. Часто оказывается значительно проще определить класс операторов на основе сведений качественного характера, например линейности процесса или типа нелинейности, однозначности либо неоднозначности и др. В этом случае задача идентификации состоит в оценивании
этого оператора на основе выборки {хг-, и{, /' = 1,5} в форме
х* (!) = А* (и (/), ^, йх), (2)
где х* = (х1,х2,...,х*),и* = (и1,и2,...,и*) - временные векторы. Оценка оператора А* может быть осуществлена средствами непараметрической статистики [3, 4]. Примечательным здесь является то, что при этом исключается этап выбора параметрической структуры. Тем самым можно утверждать, что идентификация в этом случае, а это вариант идентификации в «широком» смысле, является более адекватной для некоторых реальных задач.
2. Непараметрические оценки функции регрессии по наблюдениям
Пусть даны наблюдения {хг, иг, г = 1, случайных величин х, и , распределенных с неизвестными плотностями вероятности р( х, и), р(и) > 0 У и е 0.(и). Для восстановления х = М {х | и} используются непараметрические оценки [2,4]:
* т / * т
х (и) = £ х Пф(с-1 (- и)) / £Пф(с- (- и/)) , (3)
г =1 ] =1 / г=1 ] =1
где Ф(с- (и1 - иг)), г = 1, *, ] = 1, т, - ядерная колоколообразная функция и коэффициент размытости ядра с* удовлетворяют следующим условиям сходимости [2, 4]:
с* > 0; Ф(с-: (и1 - и/)) > 0;
Иш с* = 0; [ Ф(с-1(и1 - и/ ))ёи] <да;
0,(и)
Иш $с”т = да; Иш с-1Ф(с-1 (и1 - и/)) = 5(и] - и/).
В данном случае в качестве колоколообразной функции Ф(с-1(и1 - и/)) было
использовано треугольное ядро:
|1 - с-1 (и1 - и/), если I с-1(и1 - и/) < 1,
Ф(с-1(и1 - и/)) = ] 1 1 I . 1 1
|^0, если | с6, (и1 - и/) > 1.
Параметр размытости с* определяется путем решения задачи минимизации квадратичного показателя соответствия выхода объекта и выхода модели, основанного на «методе скользящего экзамена», когда в модели (3) исключается г-я переменная, предъявляемая для экзамена:
*
К(с*) = £ ( - х* (ик, с* )2 = шin, к фI.
к=1 с*
В случае, если каждой компоненте вектора и соответствует компонента вектора с*, то во многих практических задачах с* можно принять скалярной величиной, если предварительно привести компоненты вектора и по выборке наблюдений к одному и тому же интервалу, например использовать операции центрирования и нормирования.
3. Методика заполнения матрицы наблюдений
На практике часто возникают случаи, как было замечено ранее, когда дискретность измерения «входных-выходных» переменных исследуемого процесса может не совпадать. В результате матрица наблюдений состоит из не полностью заполненных строк (табл. 1).
Для решения задач идентификации предпочтительно иметь выборки большего объема. Отсюда возникает проблема восстановления пропусков в незаполненных строках матрицы наблюдений. Конечно, при решении задачи идентификации можно использовать только заполненные строки матрицы наблюдений. Но в этом случае объем выборки становится существенно меньше. В настоящей работе предлагается дать оценки х в незаполненных строках матрицы наблюдений при известных значениях входных переменных и . Таким образом, используется выборка, состоящая из результатов заполненных строк матрицы наблюдений (табл. 1). В этом случае получим заполненную матрицу, представленную в табл. 2, и оценку х(и) класса (1) или (2) будем осуществлять уже на основании заполненной матрицы наблюдений.
Т аблица 2
Матрица наблюдений с заполненными строками
Входная переменная и х
и1 и2 ит
иіі и21 ит1 Х1
и12 и22 ит2 Хs2
и13 и23 ит3 х*з
и14 и24 ит4 х4
и15 и2* ит* Х*
В качестве оценки х = М {х | и} можно использовать как параметрические оценки функции регрессии [1], так и непараметрические [2-4]. Такой прием, как это будет показано ниже, оказывается вполне оправданным, так как задача идентификации в последнем случае (табл. 2) решается более точно, чем в случае, когда мы исключаем строки с пропусками из матрицы наблюдений (табл. 1), тем самым уменьшая объем выборки.
4. Этапы восстановления пропусков матрицы наблюдений
Методику восстановления пропусков матрицы наблюдений можно разделить на три этапа [5].
На первом этапе восстанавливается функция регрессии по наблюдениям и , полностью представленным в исходной матрице измерений, то есть по полностью заполненным строкам в результате эксперимента (табл. 1). Подбирается оптимальное значение коэффициента размытости Оц.
На втором этапе происходит заполнение пропусков матрицы с использованием оценки х^ и оптимального значения коэффициента размытости ядра о^ полученных на предыдущем этапе. Там, где наблюдения х пропущены, в оценку х^ (и1, и2,..., ит) подставляем значения измеренных и = (и1, и2,..., ит) и вычисляем
соответствующую оценку х!1, которой восполняем недостающее наблюдение х (например, недостающее значение х2 в представленной выше матрице наблюдений заполняется значением х52). После этого этапа матрица наблюдений принимает вид, представленный в табл. 2.
Заключительный этап восстановления зависимости х от и = (и1,и2,...,ит) состоит в построении модели. В данном случае была использована непараметрическая оценка функции регрессии (3) по всей имеющейся (заполненной) матрице наблюдений (табл. 2). При этом коэффициент размытости о5 подбирается по всей имеющейся выборке еще раз.
На исследуемый объект действует векторное входное воздействие и = (и1, и2, и3) е [0;3], х - выходная переменная, скаляр. Имеются выборки статистически независимых наблюдений (ui,хг,г = 1,я), где 5 - объем выборки. Пусть матрица наблюдений объекта имеет вид, представленный в табл. 1, т.е. ДТ = 3Д/. Зададим структуру объекта следующим уравнением:
Вычислительный эксперимент состоял из двух этапов. На первом этапе оценка (3) строилась по исходной матрице наблюдений с пропусками (табл. 1). Затем данная матрица заполнялась при помощи предложенной выше методики. На втором этапе оценка строилась уже по восстановленной матрице наблюдений без пропусков (табл. 2).
На нижеследующем рисунке приведены результаты вычислительного эксперимента для объекта, описываемого (4). На выход объекта £, накладывалась помеха по формуле
где д - случайная величина, нормально распределенная в интервале [-1;1].
Объем выборки 5 варьировался от 100 до 1200. На рис. 2 представлено два графика, соответствующих оцениванию по исходной матрице наблюдений с пропусками (табл. 1) и по восстановленной (табл. 2). Графики показывают зависимость относительной ошибки моделирования ст от объема выборки 5. Относительная ошибка моделирования ст находится по формуле
где т - оценка математического ожидания.
Так как мы имеем дело со случайными величинами, то необходимо провести усреднение полученных результатов. В данном случае производилось усреднение по результатам десяти экспериментов.
Как видно из приведенного рис. 2, ошибка моделирования, полученная при оценке по восстановленной матрице наблюдений, меньше, чем ошибка - по матрице с пропусками. В среднем качество оценивания повышается на 5-10 %. Данный численный эксперимент демонстрирует, что задача идентификации по вос-
5. Вычислительный эксперимент
х = 0,5и^ + єіпи2 + 2у[щ .
(4)
|= 0.05 х,
становленной (заполненной) матрице наблюдений решается более точно, чем по матрице с пропусками.
Рис. 2. Зависимость ошибки моделирования ст от объема выборки *
6. Н-модели
На практике достаточно часто встречаются процессы, имеющие стохастическую зависимость компонент вектора входных переменных. Будем говорить, что объекты, обладающие подобной особенностью, имеют «трубчатую» структуру [6].
Рассмотрим в качестве примера процесса с «трубчатой» структурой объект, представленный на рис. 3.
Рис. 3. Объект с «трубчатой структурой»
Как видно из рисунка, область протекания процесса 0.(и, х) є Я представляет
собой, без нарушения общности, единичный гиперкуб, где и є Я2, х є Я1. Однако если исследуемый процесс имеет «трубчатую» структуру, то область его протекания ограничивается не всем объемом гиперкуба 0.(и, х), а его подобластью
0.н (и, х) є 0.(и, х), которая нам никогда не известна. Поскольку подобласть
0.н (и, х) никогда не известна, то и вид самой «трубчатой» структуры нам неиз-
вестен. При этом заметим, что объем гиперкуба, как это видно из вышеприведенного рисунка, может значительно превышать объем «трубки».
Рассмотрим моделирование процессов, имеющих подобную структуру. Обычно в задаче идентификации безынерционных объектов предполагается наличие некоторой параметризованной модели, представляющей собою поверхность в пространстве «входных-выходных» переменных:
^ (и) = f (и, а ж), (5)
где а5 - вектор параметров. В том случае, когда компоненты вектора входных переменных статистически зависимы, т.е. мы имеем дело с «трубчатой» структурой объекта, необходимо ввести индикатор I (и). Модель вышеприведенного типа при этом должна быть скорректирована следующим образом:
х* (и) = / (и, а ж) 16, (и), (6)
где в качестве оценки индикатора можно принять следующее приближение:
5 т
I5 (и) = Б§П( )£ПФ( ( - и/ )), ()
1 =1 у=1
Параметр размытости ядра с5 определяется так же, как и в (3), а колоколообразная функция Ф (с-1 (и1 - и/)) имеет вид треугольного ядра.
Логика построения такого индикатора состоит в том, что при произвольно заданном значении текущей переменной и = и' индикатор 15(и) примет значение
единицы, если и’ принадлежит «трубчатой» структуре, определяемой имеющейся
выборкой {хг,и1,г = 1,я}, если же и' приняло значение за пределами «трубки», то
индикатор равен нулю. Заметим, что если процесс описывается поверхностью в
пространстве 0.(и, х), то модели (5) и (6) совпадают. Если же процесс имеет труб-
чатую структуру в этом пространстве, то необходимо использовать модель (6).
7. Численное исследование Н-модели
Рассмотрим результаты численного эксперимента. Пусть исследуемый объект описывается системой уравнений:
Г х(/) = 0.5и1(/) + 0.5и2(/) + |;
(8)
и2 (/) = и1 (/) + у,
где % и у - случайные числа, распределенные по равномерному закону на интервале [-0,05; 0,05], и1, и2 е [0;3]. В данном случае уравнение объекта задано с целью получения выборок «входных-выходных» переменных для решения задачи идентификации. При построении модели на основе полученных выборок, структура зависимости выходной переменной х от входных переменных и принята с точностью до параметров. При оценивании параметров используется метод наименьших квадратов (МНК).
Итак, получена выборка статистически независимых наблюдений {хг, иг, г = 1,5} , где х - измеряемая выходная переменная, и = (и1, и2) - векторное входное воздействие, 5 - объем выборки.
Построим параметрическую модель исследуемого объекта. Результаты моделирования показаны на рис. 4 (5 = 100 ), где черными точками обозначен исследуемый объект, серыми - полученная параметрическая модель. Как видно из рис. 4, исследуемый объект является «трубкой». Модель (5) при этом представляет собой плоскость. Как известно, прямую, в данном случае «трубку», можно аппроксимировать бесконечным числом плоскостей. Пусть имеется шесть выборок статистически независимых измерений {хг, и1г, и2г, г = 1,5} объемом 5 = 100. Для каждого случая построим 6 моделей с помощью МНК. Результаты моделирования представлены на рис. 5.
Рис. 4. Объект с «трубчатой структурой» Рис. 5. Множество параметрических моделей
и его параметрическая модель объекта с «трубчатой» структурой
В результате моделирования было получено 6 моделей с различными оценками параметров, так как в каждом случае выборки были различны. Можно сделать вывод о том, что полученные модели не являются адекватными. Кроме того, для построения параметрической модели необходим большой объем выборки.
Теперь для рассматриваемого объекта (8) будем использовать модель (6), содержащую индикатор. Вид индикатора описан формулой (7). Результаты численного моделирования объекта (8) для объема выборки 5 = 1000 представлены на рис. 6.
Как мы видим, индикаторная функция (7) при построении модели учитывала только те точки, которые принадлежат области протекания «трубчатого» процесса, т. е. (и) = 1. В остальных точках выборки значение выхода модели не восстанавливалось, т. е. (и) = 0 . В частности, из общего объема выборки 5 =1000
объему трубки принадлежат лишь 20.
Изменим систему уравнений, которой описывается исследуемый объект, на следующую:
[и2 (/) = и1 (/) + у.
Результаты аналогичных экспериментов представлены на нижеследующих рисунках:
На рис. 7, а показан объект, описываемый системой (9) и имеющий «трубчатую» структуру (черные точки на графике). Плоскость (рис. 7, а) показывает восстановленную с помощью МНК параметрическую модель объекта. Также построена (рис. 7, б) параметрическая модель с использованием индикаторной функции (6). Как и в предыдущем эксперименте показано, что индикатор учитывает только те точки, которые принадлежат объему «трубки» ((и) = 1), в остальных точках выборки индикатор становится равным нулю и в дальнейшем эти точки не участвуют в построении модели.
Рассмотрена задача восстановления матрицы наблюдений с пропусками для повышения эффективности решения задачи идентификации стохастических безынерционных объектов. Предложена методика восстановления пропусков матрицы наблюдений и приведены соответствующие алгоритмы, основанные на использовании непараметрической оценки функции регрессии. Результаты численных экспериментов иллюстрируют, что задача идентификации по заполненной матрице решается более точно, чем по незаполненной.
Рассмотрен класс объектов, имеющих «трубчатую» структуру. При моделировании объектов такого рода необходимо учитывать ряд его особенностей и использовать Н-модели. Предложенные модели процессов, имеющих «трубчатую» структуру, относятся к категории новых по отношению к своим предшественни-
х(ґ) = и;2 (ґ) + и22 (ґ) +
(9)
Рис. 7. Моделирование «трубчатого» процесса
Заключение
кам, рассматриваемым в теории идентификации. Здесь важно иметь в виду, что область протекания такого процесса никогда не известна и при моделировании должна подлежать определению. H-модели отличаются от общепринятых моделей безынерционных систем наличием индикаторной функции, которая, по существу, определяет область протекания «трубчатого» процесса.
ЛИТЕРАТУРА
1. ЭйкхофП. Основы идентификации систем управления. М.: Мир, 1975. 683 с.
2. Медведев А.В. Непараметрические системы адаптации. Новосибирск: Наука, 1983.174 с.
3. Кошкин Г.М. Пивен И.Г. Непараметрическая идентификация стохастических объектов. Хабаровск: Российская академия наук. Дальневосточное отделение, 2009. 336 с.
4. Надарая Э.А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси: Изд-во Тбил. ун-та, 1983. 194 с.
5. Корнеева А.А. О непараметрическом восстановлении матрицы наблюдений с пропусками в задаче идентификации с шумами / Молодой ученый. 2012. № 3(38). С. 51-60.
6. Медведев А.В. Анализ данных в задаче идентификации // Компьютерный анализ данных моделирования. Минск: БГУ, 1995. Т. 2. С. 201-206.
7. Чжан Е.А. О непараметрической идентификации стохастических систем с запаздыванием / Е.А. Чжан, Н.А. Сергеева // Кибернетика и высокие технологии XXI века: труды XIII Международной научно-технической конференции. Воронеж, 2012. Т. 1. С. 63-74.
Корнеева Анна Анатольевна Сергеева Наталья Александровна Чжан Екатерина Анатольевна Сибирский федеральный университет,
E-mail: [email protected]; [email protected];
[email protected] Поступила в редакцию 30 апреля 2012 г.
Korneeva Anna A., Sergeeva Natalya A., Chzhan Ekaterina A. (Siberian Federal University). Nonparametric data analysis in identification problem.
Keywords: identification, nonparametric models, «tubular» processes.
By investigation of many processes it is necessary to solve the modeling and identification problem. The qualitatively constructed models help to simplify the control of the object as well as to predict its future behavior. This paper focuses on the identification of a new class of processes which have statistical relationship between the components of the input variables. Further, these objects will be called «tubular».
As it is known, the quality of the identification problem solution is determined by the quality of source data, so the stage of data preprocessing is an important part of the modeling process. In this paper some peculiarities of the samples, as blanks are described. There are proposed two nonparametric estimation algorithms using the regression function.
The use of parametric identification methods does not give satisfactory results in modeling «tubular» processes.
A modification of the parametric identification algorithm using the indicator function is suggested. The indicator shows whether the points belong to the true course of the process or not. The experimental results demonstrate the feasibility of the proposed algorithms.