Научная статья на тему 'Исследование свойств регрессионной оценки плотности вероятности от методов дискретизации области её определения'

Исследование свойств регрессионной оценки плотности вероятности от методов дискретизации области её определения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
50
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борисов Д.В., Лапко В.А.

Исследуются аппроксимационные свойства регрессионной оценки плотности вероятности. Устанавливается зависимость свойств регрессионной оценки плотности вероятности от методов дискретизации интервала значений случайной величины. Определена процедура оптимального выбора количества интервалов дискретизации. Результаты исследований имеют важное значение при решении задач проверки гипотез о распределениях случайных величин и доверительного оценивания плотности вероятности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Борисов Д.В., Лапко В.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование свойств регрессионной оценки плотности вероятности от методов дискретизации области её определения»

Секция

«МАТЕМАТИЧЕСКИЕ МЕТОДЫ МОДЕЛИРОВАНИЯ, УПРАВЛЕНИЯ

И АНАЛИЗА ДАННЫХ»

УДК 519.863

С. Н. Бондаренко Научный руководитель - О. В. Шестернева Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

РАЗРАБОТКА АЛГОРИТМА ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ КАПИТАЛЬНЫХ ВЛОЖЕНИЙ В ПРЕДПРИЯТИЕ ИНТЕРНЕТ ТОРГОВЛИ

Приводятся пути решения задачи повышения эффективности капитальных вложений в предприятие интернет торговли с целью получения максимальной прибыли при минимальных затратах на маркетинговую компанию.

В современном мире все чаще люди совершают свои покупки с помощью сети интернет, что, несомненно, приводит к росту количества предприятий интернет торговли. Начиная свой бизнес в сфере интернет продаж многие предприниматели сталкиваются с необходимостью привлечения клиентов, определения наиболее эффективных категорий продаваемых товаров, прогнозирования спроса, а так же создания оптимального, с точки зрения эффективности, маркетингового плана. Основной проблемой является то, что для каждого интернет магазина необходимо разрабатывать свой алгоритм продвижения ресурса, его рекламную компанию, анализировать рынок и не каждый предприниматель может позволить себе выделить большую часть бюджета для реализации этих целей.

На сегодняшний день не существует стандартизированных подходов для решения этой проблемы, существующие алгоритмы либо малоэффективны, либо очень дороги в реализации. В связи с этим были рассмотрены и проанализированы два подхода решения данной задачи - статический и динамический. В статическом случае бюджет компании не меняется с течением времени, в динамическом случае бюджет каждого следующего месяца рассчитывается на основании разницы доходов предыдущих месяцев.

Для решения этой задачи в статическом случае используется разработка алгоритма, основанного на анализе эффективности различных групп товаров [1] и последующем построении оптимального маркетингового плана. В данном случае под эффективностью понимается отношение числа просмотров к количеству заказов.

В динамическом же случае возникает необходимость решения задачи прогнозирования доходов с помощью нейронной сети [2], для ежемесячного переопределения маркетингового бюджета предприятия и разработки маркетингового плана, который бы позволил вывести предприятие на границу эффективности.

В настоящее время вышеизложенные подходы проходят тестирование на интернет ресурсе «Muzman.ru».

Библиографические ссылки

1. Замков О. О., Толстопятенко А. В., Черемных Ю. Н. Математические методы в экономике. М. : Дело и Сервис, 2004.

2. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М. : ЮНИТИ, 1998.

© Бондаренко С. Н., 2014

УДК 519.7

Д. В. Борисов Научный руководитель - В. А. Лапко Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИССЛЕДОВАНИЕ СВОЙСТВ РЕГРЕССИОННОЙ ОЦЕНКИ ПЛОТНОСТИ ВЕРОЯТНОСТИ ОТ МЕТОДОВ ДИСКРЕТИЗАЦИИ ОБЛАСТИ ЕЁ ОПРЕДЕЛЕНИЯ

Исследуются аппроксимационные свойства регрессионной оценки плотности вероятности. Устанавливается зависимость свойств регрессионной оценки плотности вероятности от методов дискретизации интервала значений случайной величины. Определена процедура оптимального выбора количества интервалов дискретизации. Результаты исследований имеют важное значение при решении задач проверки гипотез о распределениях случайных величин и доверительного оценивания плотности вероятности.

Секция «Математические методы моделирования, управления и анализа данных»

Пусть имеется выборка V = (, 1 = 1, п) из п независимых значений одномерной случайной величины х с неизвестной плотностью вероятности р(х). Разобьем область определения р(х) на N непересекающихся интервалов длиной 2р и сформируем множества случайных величин X3, 3 = 1, N . В качестве характеристик X3 примем частоту Р3 попадания случайной

величины х в 3-й интервал и его центр г3. На основе полученной информации определим массив данных

V1 = (3, Р3 / (2Р), 3 = 1, N), составленный из центров

г3 введенных интервалов и соответствующих им значений оценок плотности вероятности. В качестве приближения по эмпирическим данным V1 искомой плотности вероятности р(х) примем статистику [1; 2]

N ( х - г' Л р (х) = с-1 X Р3 Ф , (1)

3=1 V с

в которой ядерные функции Ф(и) являются положительными, симметричными и нормированными. Коэффициенты размытости с ядерных функций характеризуют область их определения.

W2 (N) =

(и«)«2 )4| р(2)(х)

1

2 М

2 N4

3 И р (x )112 f

N 2

\1/5

(2)

ч '(^Р (х)2) ,

В работе [1; 2] получено асимптотическое выражение среднеквадратического отклонения

М|(р(х)-р(х))2йх регрессионной оценки р(х) (2) от восстанавливаемой плотности вероятности р (х). Здесь приняты следующие обозначения:

||р(х)||2 = |р2 (х) йх , |р(2) (х)||2 = (х))2 йх ,

||ф(и)|2 =|Ф2 (х) йх; р(2) (х) - вторая производная р (х) по х; Д - длина интервала значений случайной

величины; М - знак математического ожидания. Будем восстанавливать плотность вероятности случайной величины с нормальным законом распределения. Для выбора количества интервалов дискретизации области изменения значений случайной величины используются формулы: Хайнкольда и Гаеде

N = 4п , (3)

Брукса и Каррузера

N = 5 п , (4)

Старджесса

N = 1оя2 п +1. (5)

Синтез непараметрической оценки плотности вероятности (1) осуществлялся на основе ядерных функций В. А. Епанечникова. В данных условиях выражение (2) запишется в виде

W2 = — 2 10

W

15 N 4

N

2

Зависимость критерия Ш2 качества оценивания

плотности вероятности, соответствующих конкретным объёмам п исходных данных и формулам дискретизации

n Методы дискретизации

(3) (4) (5)

100 0,112 0,112 0,121

150 0,096 0,099 0,113

200 0,085 0,09 0,102

250 0,078 0,086 0,099

300 0,073 0,083 0,097

350 0,068 0,078 0,096

400 0,065 0,076 0,089

450 0,062 0,075 0,088

500 0,059 0,074 0,087

При увеличении объёма n исходных статистических данных применение исследуемых методов дискретизации интервала изменения значений случайной величины приводит к уменьшению значений W2 (табл. 1). Наблюдаемое улучшение аппроксимацион-ных свойств р (x) объясняется увеличением объёма N массива данных V1, используемого при построении регрессионной оценки плотности вероятности. Применение формулы (3) при выборе количества N интервалов дискретизации является более предпочтительным по сравнению с другими. Менее предпочтительна формула (5). Результаты использования формулы дискретизации (4) при оценивании плотности вероятности занимает промежуточное положение.

Библиографические ссылки

1. Лапко А. В., Лапко В. А. Оптимальный выбор количества интервалов дискретизации области изменения одномерной случайной величины при оценивании плотности вероятности // Измерительная техника. 2013. № 7. С. 24-27.

2. Lapko A. V., Lapko V. A. Optimal selection of the number of sampling intervals in domain of variation of a one-dimensional random variable in estimation of the probability density // Measurement Techniques. 2013. Vol. 56, No. 7. P. 24-27. (DOI: 10.1007/s11018-013-0279-x).

© Борисов Д. В., 2014

i Надоели баннеры? Вы всегда можете отключить рекламу.