Об одной робастной оценке функции регрессии по наблюдениям с выбросами

Голуб Л.Н.; Медведев А.В.

Обобщенные результаты численных исследований

Среднеквадратичная ошибка

Время расчета тестового примера

0,034

15:48

0,046

10:15

0,559

12:30

0,571

14:16

0,713

14:55

Графическое изображение колокообразных _функций_

Колокообразные функции

|еов^) +1

н (•) = ^ 2п

|0 I • |>п

• < п

Н (•) =

с-1 if I • |< с,

0 if I • |> с,

Гад if Ц < (•) < г2

Н(•) = к(0 if '2 < (•) < '3 10 ойег^чзе

н (•) =

1 Я ^ <1 • |< с, 2 1 1 '

1 * I • |< ^

2 х 1 2

0 ^ I

> с,

Н (•) =

(•) if (•) >'1 0 if (•) > '2 0 if I • |<

В связи с этим, не менее существенно растут объемы выборок, по которым осуществляются наблюдения за протекающим в объекте процессом.

Естественно ожидать, что при увеличении объемов выборок, также будет расти и машинное время, которое затрачивает компьютер на реализацию математических расчетов. И, причем, это время растет настолько, что становится практически неудобно, а, порой, и невозможно качественно проводить исследования динамических процессов. В связи со всем перечисленным, возникает проблема существенного сокращения вышеупомянутого времени счета, при этом, разумеется, время регулирования и, соответственно, объемы выборок остаются прежними.

Применение кусочно-постоянных аналогов значительно уменьшает время вычислений, что в практических задачах, конечно, если они не требуют доскональной точности, может гораздо упростить работу.

Библиографические ссылки

1. Иконников О. А. Разработка и исследование непараметрической модели линейной динамической системы высоких порядков // Вестник НИИ СУВПТ. Вып.4. - Красноярск : НИИ СУВПТ, 2000, С. 164-171.

2. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983.

УДК 62.506.1

Л. Н. Голуб Научный руководитель - А. В. Медведев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ОБ ОДНОЙ РОБАСТНОЙ ОЦЕНКЕ ФУНКЦИИ РЕГРЕССИИ ПО НАБЛЮДЕНИЯМ С ВЫБРОСАМИ

Рассматривается задача восстановления функций регрессии по наблюдениям с случайными ошибками. Исследуется случай, когда при измерении соответствующих переменных могут иметь место выбросы. Приводятся непараметрические робастные оценки функции регрессии по наблюдениям с выбросами и результаты их численного исследования.

При восстановлении стохастической зависимости Y, которые часто связаны неизвестной регрессионной по наблюдениям с ошибками случайных величин X и характеристикой ~ = M {у | x}, сталкиваемся с ситуа-

Актуальные проблемы авиации и космонавтики. Информационные технологии

циеи, когда зависимость в классе непараметрических априори неизвестна. В этом случае в качестве оценки может быть использована непараметрическая оценка Надарая-Ватсона вида:

П(Х ) = £ ^ Ф

X - X,.

1 / V

Ф|

X - X,.

(1)

¥ 2(Х )=£ у, Ф

X - х,.

Ф

¥, - у,

/

Ф

X - х.

1 Г Ф

¥, - у1

V Ч

где = 1, п, ф((х - х{)/ сп) - некоторая колоколообраз-ная интегрируемая функция («ядро»), обладающая некоторыми свойствами сходимости [1]:

На практике часто приходится сталкиваться с ситуацией, когда в выборке измерений присутствуют выбросы. Тогда непараметрическая оценка (1) может давать неудовлетворительные результаты.

Ниже рассмотрим задачу восстановления непараметрической зависимости в условиях выбросов.

Требуется восстановить зависимость уп (х) по

имеющейся выборке (х{, уi), , = 1, п, где п - объем выборки. Введена 5 % помеха. Так же присутствуют несколько значительных выбросов.

Для преодоления этой трудности предлагается следующий прием:

где ¥, =Х У1Ф

1=1

,=1

/ V ф1 х х

Параметр размытости С] определяется путем решения задачи минимизации квадратичного показателя соответствия выхода объекта и выхода модели, основанного на «методе скользящего экзамена» (при малом объеме выборки п), когда при построении модели ¥1 не учитывается ,-я пара измерений:

п

I = - ¥1(х, ))= ПС Ш

■ 1 Сп

,=1

Введем коэффициент а, отражающий взаимное расположение выбросов, а определяется как частное расстояния между выбросами на размер выборки.

Начальные условия: п = 100, х е [0;30], у е [- 0,986;1,061]. а = 0,6. Результаты представлены на рис. 1.

X

Рис. 1

У1(Х)

У2(Х)

X

Рис. 2

Среднеквадратическая ошибка для У2 - 0,2, для У1 - 1,6.

Теперь а = 0,02 (рис. 2).

Среднеквадратическая ошибка для У2 - 0.98, для У1 - 5.7.

Рассмотрим многомерный вариант:

¥ 2^ ) = £ у, П ,=1 3=1

/ к (

/ у, П

^У

V я V

¥, - у,

/

V ч

з=1

X1 - х1 ¥■ - уЛ

Ф

V я

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

е [0;30] Количество входов - 5.

с

,=1

с

,=1

1=1

хх

с

0

10

20

30

10

20

30

V с1 V

х

Объем Коэффициент Помеха, Ошибка Ошибка

выборки сгущения % для (1) для (2)

100 0,63 5 1,31 0,087

500 0,55 5 0,585 0,022

100 0,02 5 0,722 0,373

500 0,03 5 0,723 0,023

100 0,63 10 1,724 0,415

500 0,55 10 0,731 0,252

100 0,02 10 1,315 0,908

500 0,03 10 0,95 0,264

Библиографическая ссылка

2. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. С. 21-34.

УДК 681.34

И. С. Гончарова Научный руководитель - И. В. Ковалев Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ МЕТОДА БЕЛ ЗА СЧЕТ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА ПАРАМЕТРОВ ПРЕДПРИЯТИЯ

Современные методы оценки деятельности предприятия в силе решить любую поставленную задачу. Несмотря на эффективный математический аппарат, который реализован во многих программных продуктах, применение любого из них должно быть обоснованно. Для реализации любой оценки потребуется выбор параметров, которые стоит учитывать при построении математической модели.

Метод Data Envelopment Analysis был предложен в 1978 г. американскими учеными A. Chames, W.W. Cooper, E. Rhodes, которые основывались на идеях M. J. Farrell. Данный метод с успехом применяется на Западе для оценки эффективности функционирования однородных объектов в различных социально-экономических системах. Такими объектами могут быть промышленные и сельскохозяйственные предприятия. Данный метод является, по сути, способом оценки производственной функции, которая на практике неизвестна. Метод DEA-АСФ основан на построении так называемой границы эффективности, которая и является аналогом производственной функции для случая, когда выпуск производства не скалярный, а векторный. Эта граница имеет форму выпуклой оболочки в пространстве входных и выходных переменных, описывающих каждый объект в исследуемой совокупности. Граница эффективности используется в качестве эталона для получения численного значения показателя эффективности каждого из оцениваемых объектов. Степень эффективности объектов определяется степенью их близости к границе эффективности в многомерном пространстве входов/выходов. Способ построения границы эффективности - многократное решение задачи линейного программирования.

Если для оценки процесса производства методом DEA-АСФ используется один вид продукции y из двух видов ресурсов x1 и x2, то для получения наиболее адекватной модели потребуется определение именно тех факторов, которые наибольшим образом влияют на деятельность организации. В нашем случае будет проводиться анализ деятельности трех структурно связанных подразделений, занимающихся как оптовой, так и розничной продажей строительных материалов. Эти материалы организация поставляет

сама с завода изготовителя. Задачей анализа является прогноз продаж подразделений.

Метод DEA используется для оценки каждого подразделения и выявления рекомендации для каждого подразделения. Далее на основе данных рекомендаций будет определяться прогноз продаж на будущие периоды.

Прежде чем начать анализ с помощью метода DEA, необходимо определить, какие факторы стоит учитывать на входе, чтобы понять, что мы ожидаем на выходе. Сначала определяется количество ресурсов, которые существенно оказывают влияние на выходной параметр. В качестве выходного параметра рассматривается выручка. В процессе анализа было выделено три основных параметра, влияющих на выручку с учетом специфики данного предприятия [1].

1. Оборачиваемость товара.

2. Разница между себестоимостью товара и розничной ценной.

3. Сумму активов фирмы.

Оборачиваемость товара - это показатель, характеризующий скорость оборота товаров, их движение в сфере обращения (от производителя к потребителю через торговлю).

В рассматриваемых организациях, занимающихся стройматериалами, очень важными составляющими являются следующие. Во-первых, наличие товара в нужный момент. Во-вторых, товар не должен залеживаться на складах, пространство для его хранения ограниченно и это необходимо учитывать. Для подсчета этого показателя понадобится информация о среднем товарном запасе за период (неделя, месяц, год) и товарооборот за период. Так же можно использовать два вида этого показателя. Первый - это оборачиваемость в днях, второй - оборачиваемость в разах (сколько раз за период товар «обернулся», продался). Повышение

Об одной робастной оценке функции регрессии по наблюдениям с выбросами Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Голуб Л. Н., Медведев А. В.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Голуб Л. Н., Медведев А. В.

Текст научной работы на тему «Об одной робастной оценке функции регрессии по наблюдениям с выбросами»