Решетневские чтения. 2017
УДК 52-601
ОБ ОДНОМ ПОДХОДЕ НЕПАРАМЕТРИЧЕСКОГО РОБАСТНОГО ОЦЕНИВАНИЯ
С. С. Чернова
Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79 E-mail: chsvetlanas@gmail.com
Рассматривается задача восстановления функции по наблюдениям с выбросами. Предлагается методика робастного непараметрического оценивания. Особенность робастного оценивания заключается в исключении выбросов и их влияния на восстановление функции.
Ключевые слова: непараметрические оценки функции регрессии, непараметрическая модель, процедура ро-бастного оценивания.
ABOUT AN APPROACH OF NON-PARAMETRIC ROBUST ESTIMATION
S. S. Chernova
Siberian Federal University 79, Svobodny Av., Krasnoyarsk, 660041, Russian Federation E-mail: chsvetlanas@gmail.com
We consider the problem of restoration offunction for the observations with outliers. The article proposes a technique for robust non-parametric estimation. The feature of robust estimation is to exclude outliers and their influence on recovery of function.
Keywords: nonparametric estimate of the regression function, nonparametric model, the procedure of robust estimation.
Введение. Рассматривается задача восстановления функции регрессии по наблюдениям с выбросами [1-3]. Предложенная методика робастного оценивания заключается в корректировке обучающей выборки, не содержащей выбросы.
Непараметрическая оценка функции регрессии по наблюдениям. В качестве непараметрической оценки функции регрессии по наблюдениям примем [4; 5]:
у, (x) = 2 У, Ф
2 ф
(1)
где Ф(у)- ядро - финитная колоколообразная интегрируемая с квадратом функция, удовлетворяющая условиям [4; 5]:
0 < Ф(у) < да Vv е п(у),
1Í Ф
г J
= 1,
(2)
lim„
± ф (^Их-,),
= 2 (у,-" У,(X))
(4)
где у, - истинная выборка, полученная по приведенным выше формулам; у,(х,) - непараметрическая оценка.
Элементы обучающей выборки, удовлетворяющие требованию:
р, > 2а2
(5)
где cs - параметр размытости, удовлетворяет следующим условиям:
Cs > 0 , limsc)k = да , lim^„ Cs = 0 , (3)
Вычислительный эксперимент. Для проведения эксперимента была выбрана функция y = sin (х)2. При формировании обучающей выборки были искусственно добавлены два выброса.
В качестве критерия точности непараметрической оценки используем квадратичный критерий:
где р, = (у1 - у,. (х1)), I = 1,5 , удаляются из исходной выборки.
Обозначим на рисунках цифрой 1 - обучающую выборку, 2 - непараметрическую оценку.
Приведем результаты численного исследования, иллюстрирующие эффективность алгоритма. Рассмотрим восстановление функции регрессии по наблюдениям, которая имеет несколько выбросов при объеме выборки 100.
На рис. 1 приведены элементы выборки, ее аппроксимация и два выброса. Точность восстановления составляет 0,36.
Используя р, > 2ст2, удаляем выбросы, мешающие хорошему восстановлению.
На рис. 2 продемонстрирована работа алгоритма с учетом робастного оценивания. В данном случае объем выборки составляет не 100, а 98 точек, так как программа убрала два выброса. Также можно заметить, что точность восстановления стала значительно выше, не 0,36, а 0,06. Это значит, что заданная функция была восстановлена, практически, полностью.
2
i=1
Математические методы моделирования, управления и анализа данных
Рис. 1. Восстановленная функция с учетом выбросов
Рис. 2. Восстановленная функция без учета выбросов
5. Медведев А. В. Основы теории адаптивных систем / Сиб. гос. аэрокосмич. ун-т. Красноярск, 2015. 526 с.
References
1. H'yuberg P. Robastnost v statistike [Robustness in statistics]. M. : Mir Publ., 1984. 304 p.
2. SHulenin V. P. Robastnye metody matematicheskoj statistiki [Robust methods of mathematical statistics]. Tomsk : NTL Publ., 2016, 210 p.
3. Chernova S. S., Shishkina A. V. [On nonparametric estimation of mutually ambiguous functions from observations] // Molodoi uchenyi. 2017. № 25. P. 13-20. (In Russ.)
4. Nadaraia E. A. Neparametricheskoe otsenivanie plotnosti veroiatnostei i krivoi regressii [Nonparametric estimation of probability density and regression curve]. Tbilisi : TGU Publ., 1983. 194 p.
5. Medvedev A. V. Osnovy teorii adaptivnykh system [Fundamentals of the theory of adaptive systems] / SibGAU. Krasnoyarsk, 2015. 526 p.
ТГУ, 1983. 194 с. © Чернова С. С., 2017
Заключение. Основным результатом статьи является то, что с помощью предложенного приема роба-стного оценивания можно получить существенно лучшее качество восстановления функции по наблюдения. Стоит заметить, что точность восстановления значительно возросла после того, как мы избавились от выбросов. Сначала точность восстановления была 0,36, после применения робастного оценивая - 0,06. Также наглядно увидели на рис. 1 и 2 восстановление функции по наблюдениям без использования робаст-ного оценивая и, соответственно, с ним.
Библиографические ссылки
1. Хьюберг П. Робастность в статистике. М. : Мир, 1984. 304 с.
2. Шуленин В. П. Робастные методы математической статистики. Томск : НТЛ, 2016. 210 с.
3. Чернова С. С., Шишкина А. В. О непараметрическом оценивании взаимно неоднозначных функций по наблюдениям // Молодой ученый, 2017. № 25. С. 13-20.
4. Надарая Э. А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси :