Известия Кабардино-Балкарского научного центра РАН № 3 (89) 2019
- МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ ЭКОНОМИКИ-
УДК: 330.42(045), 51-77(045)
DOI: 10.35330/1991-6639-2019-3-89-48-77
ПОГРЕШНОСТЬ ЕМКОСТНОГО МЕТОДА АНАЛИЗА РЕДКИХ СОБЫТИЙ, УДАЛЕННОСТЬ ОТ КОНЕЧНОГО ПОТРЕБИТЕЛЯ*
Ю.А. КОРАБЛЕВ
Финансовый университет при Правительстве Российской Федерации 125993, г. Москва, Ленинградский проспект, 49 E-mail: academy@fa.ru
Работ, посвященных методам исследования редких событий, крайне мало. Наиболее популярным методом анализа редких событий является теория случайных процессов, когда события представляются потоками Пуассона или Пальма. Другие методы обладают еще меньшей точностью и обоснованностью. Тем не менее теория случайных процессов способна определить не момент возникновения события, а только вероятность заданного количества событий за интервал времени фиксированной длины.
В работе описана методика исследования редких событий, которая основана на различии источников событий и восстановлении параметров предполагаемого процесса, лежащего в основе возникновения этих событий. После восстановления параметров процесса ищется закономерность любыми другими известными методами, после чего закономерности экстраполируются на будущее. После экстраполяции параметров процессов запускается сам процесс для получения прогноза моментов времени возникновения следующих событий.
Наиболее распространёнными в экономике являются процессы потребления, или расхода продукции, или накопления возмущения до определенного уровня. В этом случае источники событий можно моделировать как емкости. Параметром процесса является скорость опустошения этой емкости. Предложен метод восстановления этой скорости, после чего можно прогнозировать будущие события. Такой метод анализа и прогнозирования редких событий автор называет «емкостным» методом.
В статье проводится анализ влияния позиции в цепочке распространителей на точность восстановления исходной неизвестной функции скорости потребления продукции с помощью емкостного метода. Другой целью является нахождение величины относительной погрешности восстановления исходной неизвестной функции расхода продукции.
С помощью математического анализа рассматривается процесс потребления для цепочки распространителей, строится обратная задача, анализируется погрешность. В результате текущего исследования получены значения величины погрешности восстановления исходной зависимости при реализации продукции через одного посредника, а также при реализации продукции через двух последовательно расположенных посредников. Получены крайние значения интервалов для ошибки восстановления исходной зависимости. На конкретном численном примере подтверждена справедливость полученных формул. Показано, что ошибка не является систематической и что возрастание ошибки из-за удаленности от конечного потребителя при неизменности всех других факторов растет как сумма геометрически убывающей прогрессии. Рассчитаны значения дисперсии и среднего квадратичного отклонения для относительной ошибки, показано, что они растут очень медленно.
Ключевые слова: редкие события, емкостный метод, скорость потребления, точность, ошибка, погрешность, дисперсия, последовательность распространителей, посредники.
Введение
В экономике методы получения дополнительной информации [1] и построения прогнозов [2] играют чрезвычайно важную роль. Чем точнее окажется прогноз, тем больше может быть выгода лица, принимающего решение. Выгоду получают не только сами отдельные лица, руководители компаний или организаций, но и рядовые служащие этих компаний, которые напрямую не связаны с принятием важных решений, а также их родные и близкие. Принятие
* Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-010-00154 48
каждого решения влияет на стабильность, спокойствие, уверенность в завтрашнем дне, общественное настроение, на ситуацию в стране в целом, что во все времена являлось ключевым в исторических свершениях стран, их расцвете или разрушении.
Развитие и совершенствование методов выявления закономерностей и способностей прогнозировать будущие события или некоторые показатели является чрезвычайно важным как с практической, так и с теоретической точки зрения. Среди методов анализа и прогнозирования отдельно выделяют методы для работы с регулярными (частыми) и редкими событиями. Как правило, в математических методах под регулярными событиями понимается набор данных, где каждая порция данных указывает количество событий. Чаще всего это временной ряд. Для работы с регулярными событиями существует большое количество проверенных и зарекомендовавших себя методов: методы фильтрации и сглаживания [3], спектральный анализ [4], фазовый анализ [5, с. 240-247], методы аппроксимации и интерполяции [6], методы исследования временных рядов, факторный анализ [7, 8], адаптивные методы [5] и другие.
Редкие события в математических методах, как правило, представляются не количеством событий за каждый период времени, а длительностью времени между событиями. События возникают дискретно в разные моменты времени. Время между событиями может быть совершенно различным, где-то это могут быть годы или месяцы, где-то секунды или миллисекунды. Какое количество событий за единицу времени является редким, а какое уже нет, является диалектическим вопросом. Важным является само представление данных. Если редкие события представить в виде стандартного временного ряда, то такой временной ряд будет содержать множество нулей. Классические методы обработки и анализа данных к редким событиям не подходят. Анализ редких событий представляет большую сложность для аналитиков. Редкие события характерны своей нерегулярностью, отсутствием четкой закономерности между интервалами возникновения. Сами по себе редкие события сложно анализировать и прогнозировать.
В торговле для анализа редких продаж иногда применяют метод логистической регрессии [9], метод ближайшего соседа [10], метод Кростона [11, 12], метод бутстрэппинга (Виллемейна) [13, 14]. Иногда используются селективные методы [15], которые в зависимости от входных данных переключают модель работы с редкими событиями на одну из нескольких возможных (с выбором самого метода по значению ошибки прогноза на предыдущем шаге). В этих методах осуществляются определенные манипуляции над все теми же временными рядами, но которые содержат уже большое количество нулевых значений. Хорошо, если эти методы позволят хотя бы наполовину приблизиться к истинному значению, но на практике получается, что полученный прогноз очень сильно отличается от наблюдаемых значений. Иногда получается, что там, где прогнозировался спрос, спроса не было, там, где значение спроса должно было расти, упало в 10 раз и т.д. Более того, эти методы не выявляют закономерности, почему редкие события происходят, а лишь ограничиваются статистическим законом распределения.
Для анализа редких событий иногда используют теорию случайных процессов [16], когда анализируется процесс поступления событий, как правило, в виде Пуассоновского потока или обобщенного потока Эрганга, в более сложном варианте это может быть поток Пальма с ограниченным последействием. Иногда используют бета-распределение для моделирования редких событий [17], иногда вводят модифицированные Пуассоновские процессы для «сверхредких» событий [18]. Наиболее распространены классические Пуассоновские процессы. Так, в работе [19, 20, 21] на основе статистических данных редких продаж определяют параметры потока событий, после чего определяют размер собственных запасов. Зная характеристики потоков, можно определить вероятность возникновения события за определенный период времени. Однако сами моменты времени наступления событий не определяются. Вместе с тем не определяется и величина воздействия каждого события. В итоге компании вынуждены разрабатывать собственные эвристические методы для анализа редких продаж, состоящие из статистических математических методов и
собственного опыта. До сих пор нет удовлетворительного математического инструментария, способного с приемлемой точностью и достоверностью выявлять соответствующие закономерности и предсказывать будущие редкие события.
Неужели совсем нет никакой информации о том, как возникают эти события? Почему процессы случайны? Откуда взялась эта случайность? Ведь случайность - это лишь мера неопределенности или отсутствия знания. Добавив некоторые знания и представления, можно избавится от большей степени существующей неопределенности.
В предлагаемом подходе автор как раз вносит дополнительную информацию, которая элиминирует большую часть неопределенности. Для этого предлагается следующая схема этапов.
1. Первым шагом мы предлагаем разделять источники событий, а не смешивать их. На самом деле причина огромных ошибок перечисленных ранее методов в том, что анализируются не исходные данные (в торговле - продаж), а агрегированные. Например, когда события (продажи) суммируются по временным интервалам от всех источников (покупателей), таким как дни, недели, месяцы, или когда потоки событий объединяются в один общий поток событий. После такого суммирования данные превращаются во временной ряд или в перемешанный поток событий и в дальнейшем анализируются. В результате такого агрегирования теряется много важной информации. Если каждое событие характеризуется своим источником, моментом времени и воздействием, то при агрегировании во время построения временного ряда получается единственное значение, относящееся к заданному интервалу времени. При получении агрегированного потока событий моменты времени и (иногда) величины воздействия этих событий остаются, а вот информация об источниках теряется. Ситуация с агрегированием данных от всех участников похожа на картину (рис. 1), когда следопыт вместо того, чтобы распознавать и отслеживать каждый оставленный след, начинает суммировать площадь следов на каждом метре и затем разбираться в полученной мешанине данных. В современную эпоху цифровых технологий обмена и хранения данных этот метод представляется крайне расточительным, теряется очень много информации.
Рис. 1. Суммирование площади следов
2. На следующем шаге надо использовать имеющуюся информацию о характере протекающего в источнике процесса, приводящего к возникновению событий. Наверное, это самый главный и ответственный этап. В случае если информации недостаточно, можно использовать предположение о процессе. Чем ближе предположение окажется к действительности, тем точнее будет результат в дальнейшем.
3. После того как процесс установлен, необходимо из имеющихся статистических данных восстановить параметры этого процесса, то есть выполнить регрессию параметров процесса из данных редких событий.
4. Когда значения параметров процесса восстановлены, в дальнейшем следует произвести поиск закономерностей в том, как эти параметры изменялись со временем или в зависимости от других внешних факторов. Цель этого этапа - произвести экстраполяцию параметров процесса на будущее. Для этого можно использовать любые другие известные математические или статистические методы.
5. Завершающим этапом будет запуск самого процесса с экстраполированными значениями параметров, определенными на предыдущем этапе. В результате этого этапа получается прогноз будущих событий, возникающих в конкретном источнике.
Такие действия необходимо выполнить с каждым источником. Затем, если в дальнейшем потребуется получить прогноз будущих событий в виде временного ряда, не составит труда просуммировать эти же события за выбранные интервалы времени. Схема этого метода анализа и прогнозирования редких событий представлена на рисунке ниже (рис. 2).
Разделение источников
/ Предположение Л о процессе
Инвертирование процесса и определение его параметров (регрессия)
Определение закономерностей и их экстраполяция
Экстраполяция процесса и определение будущих событий
Рис. 2. Схема анализа и прогнозирования редких событий
Необходимо отметить, что процесс, протекающий в каждом источнике, может быть полностью уникальным, а не только различаться параметрами. Но если информации об источнике недостаточно, можно по-прежнему предположить, что процесс в этом источнике соответствует некоторому ранее определенному процессу.
Процессов, протекающих в источниках, может быть большое множество, но в экономике, на наш взгляд, самым распространенным является процесс потребления и расхода продукции, когда запас ведет себя как опустошающаяся емкость, или процесс накопления воздействия до определенного уровня. В случае использования такого процесса, когда источники событий можно моделировать как емкости, предложенный метод анализа и прогнозирования редких событий мы называем «ёмкостным методом» [22-24]. Параметром процесса является нестационарная функция скорости расхода запаса или накопления воздействия f(t), подлежащая
определению. Такой функцией могут являться спрос от времени, индивидуальная скорость потребления продукции, интенсивность покупок у выбранного покупателя (источника, не путать со спросом или интенсивностью покупок у нас самих).
После определения вида процесса восстанавливаем его параметры, то есть функцию f(t) скорости изменения запаса или накопления воздействия. Для этого инвертируем процесс потребления продукции, получаем обратную задачу к задаче управления запасами (алгоритм в минус первой степени), когда по имеющимся данным (^,у{) - моментам времени и величинам воздействия события (покупок) - определяется скорость воздействия /(0. Для этого используем основное предположение - величина совершенного события у± есть интеграл от функции /(0 за время от момента совершения этого события ^ до момента совершения следующего события (рис. 3).
С использованием этого предположения задача определения (регрессии) /(0 представляет собой оптимизационную задачу восстановления неизвестной функции, для которой известна последовательность интегралов за известные непересекающиеся периоды времени:
где: второе слагаемое - штраф на нелинейность; С - произвольная большая константа, влияющая на сглаживание; п - номер последнего события.
Решение этой задачи должно осуществляться сложными математическими методами (данная задача автором пока не решена, но имеются некоторые соображения по этому поводу). Можно предложить упрощенный способ, где достаточно ограничиться рассмотрением лишь средней скорости У[/(^¿+1 — с которой накапливается воздействие на каждом интервале, после чего сгладить полученную ступенчатую функцию любым известным методом для дальнейшего анализа. Последовательность средних скоростей будет представлять собой ступенчатую функцию (рис. 4).
Для получения гладкой функции можно воспользоваться кубическим регрессионным сплайном (со штрафной функцией на нелинейность) [25], который нивелирует все неровности и в то же время при построении учтет погрешности в исходных данных. В результате функция скорости расхода продукции /(0 будет представлена набором полиномов третьей степени с непрерывной первой производной в точках сочленения, что приблизительно эквивалентно решению исходной задачи. Для практического использования этого будет достаточно. Причем по результатам моделирования точность восстановления упрощенным способом оказывается очень высокой (рис. 4), причем чем чаще происходят покупки, тем больше точность.
/(0
Рис. 3. Основное предположение
Ю.А. КОРАБЛЕВ Средняя относительная погрешность 1,64714364124218%
17...... Original
17 Restored
17 Approximated
35 ! К Т К Т
30 | —гМ —й- =¿1
25 | У К— /
20 ! V—^
15 |
10- | 5 |
0 -
20.04.2016 18.08.2016 16.12.2016 15.04.2017 13.08.2017 11.12.2017
Рис. 4. Точность восстановления упрощенным способом
Отдельно несколько слов надо сказать о системах управления запасами [26], в которых на первый взгляд может показаться есть что-то похожее. Во-первых, в системах управления запасами моделируется расход собственных запасов или запасов подконтрольных нам пунктов распространения, а в емкостном методе анализируется запас неподконтрольных нам покупателей. Во-вторых, в задачах управления запасами прогноз спроса уже задан в каждом подконтрольном пункте распространения, когда здесь, наоборот, происходит определение спроса покупателей (скорость расхода продукции, а затем можно определить дискретные моменты возникновения спроса каждого покупателя). В-третьих, используя данный метод, мы не управляем ничьими запасами, не считаем издержки и не определяем точку заказа. В-четвертых, нам не надо знать ни максимальную величину заказа, ни критическую точку запасов, ни величину страховых запасов. Предлагаемый метод является как бы обратным алгоритмом, алгоритмом в минус первой степени, по сравнению с системами управления запасами. Получается некий регрессионный анализ, цель которого - определить скорость расхода продукции, причем индивидуально по каждому нашему покупателю. С другой стороны, этот метод можно отнести к непараметрическим методам прогнозирования. Его можно использовать для любых видов редких событий, для которых выполняется основное предположение, не только для анализа продаж (например, социальных, политических и др. событий).
Подробнее об условии применения этого метода, предположениях о поведении покупателей и др. можно ознакомиться в работах [22-24]. В [23] дано математическое обоснование преимуществ этого метода по сравнению с классическим подходом, когда данные представляются в виде временного ряда и агрегируются за фиксированные интервалы времени.
Отдельный интерес представляет изучение вопросов точности, в каких случаях и на сколько падает точность восстановления исходной зависимости /Ю. Говорить будем в контексте анализа редких продаж в торговле. В этом исследовании определим, как изменяется точность в случае, если процесс распространения продукции происходит через цепочку распространителей, причем промежуточные распространители продукцию не потребляют, потребление происходит лишь конечными потребителями. Другими словами, у нас будет иметься серия посредников, которые реализуют товар, и товару необходимо пройти по цепочке от распространителя к распространителю прежде чем попасть к конечному потребителю, где он и будет расходован.
Постановка задачи
Под определением точности тогда будем понимать нахождение ошибки восстановления исходной суммарной скорости расхода продукции. Причем истинная исходная функция на практике не известна, поэтому определение ошибки возможно только во время моделирования. С помощью имитационного моделирования были получены интересные результаты, для объяснения которых воспользуемся математическим моделированием.
При определении ошибки восстановления исходной функции отдельно надо сказать о сравниваемых величинах. Так как промежуточными распространителями потребление не осуществляется, будем сравнивать восстановленную функцию с функцией расхода продукции конечными потребителями. Однако в иерархической цепочке распространителей у каждого распространителя может быть по несколько покупателей (посредников, дочерних распространителей). У выбранного распространителя может быть несколько посредников, у тех в свою очередь также какое-то количество посредников и так далее, пока не дойдем до конечных потребителей. В результате у выбранного распространителя через серию посредников пополняет продукцию множество конечных потребителей. Выбранный распространитель имеет данные о покупках только своих непосредственных покупателей (посредников). Тогда восстанавливаемую функцию скорости расхода продукции из этих данных будем сравнивать с суммарной исходной функцией абсолютно всех конечных потребителей, которые через цепочку посредников покупают продукцию у распространителя, чьи данные покупок есть у выбранного распространителя. Пример такого моделирования изображен ниже (рис. 5). В этом примере у выбранного распространителя (у нас) есть посредник, у этого посредника (нашего покупателя) есть 3 конечных потребителя, скорость расхода продукции которых задана некоторой функцией, в данном примере это гармоническая функция, отличающаяся амплитудой, частотой и фазой. По данным продаж посреднику выбранный распространитель восстанавливает суммарную скорость расхода продукции всеми покупателями, которые потребляют товар через этого посредника. При увеличении длины цепочки (уровней) посредников увеличивается абсолютное значение суммарной скорости расхода продукции, тогда для оценки зависимости точности от позиции в цепочке распространителей нас будет интересовать значение относительной ошибки, причем усредненной по всему времени моделирования.
Рис. 5. Пример моделирования с одним уровнем посредников, сверху скорость расхода продукции 3 конечными потребителями, снизу восстановленная (упрощенным способом) функция из данных о покупках вышестоящего распространителя
Подробно описывать этапы создания модели и процесса проведения моделирования не будем. Стоит лишь сказать, что при моделировании были приняты меры по обеспечению достоверности результатов моделирования таким образом, чтобы на ошибку влияла непосредственно только позиция в цепочке распространения, а не многие другие факторы. Более подробно об этом исследовании можно прочитать в работе [24]. Приведем лишь результаты исследования, которые показали, что для распространителей, удаленных на несколько позиций от конечного потребителя, точность метода падает незначительно при удалении от конечного потребителя. Результаты исследования были следующими (табл. 1, 2, 3).
Таблица 1
Данные 20 прогонов для распространителя с 3 покупателями у каждого
Номер Среднее относительное отклонение в %
прогона 0 посредников 1 посредник 2 посредника 3 посредника
1 6,0589 8,1665 7,7042
2 4,4492 7,0122 8,5183
3 3,8206 12,1525 8,9015
4 9,6343 6,9123 10,9366
5 5,3771 11,1905 9,6241
6 4,3904 8,2253 10,9213
7 5,7136 9,2977 8,6745
8 6,018 8,3653 8,1735
9 8,688 7,0874 7,0018
10 ~1-3% 12,2289 8,7743 4,1247
11 9,7904 8,2171 9,5669
12 6,846 12,9519 6,3553
13 3,3225 11,818 7,9162
14 7,6846 8,6079 6,6991
15 3,1397 6,8984 9,7203
16 4,9831 8,3273 10,0206
17 7,616 4,0429 7,1258
18 10,428 7,8877 7,1145
19 7,3258 4,9267 10,2031
20 4,1924 8,0084 8,8516
Таблица 2
Результаты моделирования для схемы распространителей с 3 покупателями у каждого
1 посредник 2 посредника 3 посредника
Среднее значение относительного отклонения по 20 прогонам, в % 6,5854 8,3305 8,3606
Корень выборочной дисперсии относительного отклонения по 20 прогонам, в % 2,5562 2,2392 1,6748
Таблица 3 Результаты моделирования для схемы распространителей с 5 покупателями у каждого
1 посредник 2 посредника 3 посредника
Среднее значение относительного отклонения по 20 прогонам 4,2889 5,6544 6,0386
Корень выборочной дисперсии относительного отклонения по 20 прогонам 1,0284 1,3967 1,2145
По 20 прогонам видим, что точность падает, но падает незначительно. Разброс точности относительно среднего значения достаточно велик, поэтому полной уверенности в том, что погрешность растет именно таким образом, нет.
В этой работе исследуется данный феномен. Требуется определить и объяснить погрешность восстановления исходной функции скорости потребления продукции покупателей в зависимости от позиции в цепочке распространителей.
Один промежуточный распространитель Итак, пусть расход продукции некоторого покупателя] задан функцией /-'(О, когда запас продукции подходит к концу, покупатели совершают покупки у распространителя верхнего уровня. В свою очередь у распространителя верхнего уровня заканчивается запас продукции, и он также пополняет запас, совершая покупки у распространителя, находящегося на уровень выше. Пусть есть 3 покупателя (посредника), которые покупают продукцию у одного распространителя (верхнего уровня) (рис. 6).
Рис. 6. Один уровень посредников до конечного потребителя
Имеются данные наблюдений у/, которые не связаны друг с другом. Пусть первый раз запас продукции верхнего распространителя заканчивается в момент когда к
нему пришел второй покупатель в момент времени ¿;(2_х. Затем покупатели совершали другие покупки, и пусть очередной раз запас закончился в момент времени , когда пришел первый покупатель в момент времени ^ И так далее. Также имеются данные об объеме совершенной покупки у" в моменты времени . Попробуем определить погрешность определения суммарной скорости потребления продукции (О по отметкам у", . Изобразим процесс пополнения продукции на рисунке (рис. 7). Нас не интересует уровень запасов посредников и самого распространителя как функция от времени, поэтому привычных пилообразных графиков из моделей управления запасами мы строить не будем, иначе это только усложнит восприятие. На рисунке стрелки показывают покупки распространителей, когда у тех заканчивается продукция, жирными стрелками показаны покупки, которые приводят к тому, что у верхнего распространителя (в самом низу рисунка) заканчивается продукция, и он пополняет ее, делая покупки у", уже у своего вышестоящего распространителя. Каждая стрелка обозначает покупку, причем объем покупки по основному предположению соответствует интегралу скорости расхода продукции от времени покупки до времени следующей покупки (см. рис. 3). Такое представление более информативно для объяснения величины ошибки нежели пилообразные картины из систем управления запасами, здесь площадь под графиком функции будет показывать величину расходуемой продукции за определенной период.
Объема сделанной покупки у" хватает на все покупки, совершенные покупателями (посредниками) в период с до (рис. 8). На рисунке овалами обведены покупки у/, на которые хватает запаса верхнего распространителя у", сделанного в момент времени
Причем покупка у1 не включается, так как она расходует запасы у^-1, сделанные в предшествующий период времени (пока не рассматриваем необходимость использования страховых запасов). В то же время покупка у2+ 5, сделанная в момент времени 12+5 = £¿+1, включается, так как именно она исчерпывает запасы распространителя (пока без использования страховых запасов) и заставляет его делать следующую покупку у^+1 для восстановления своих запасов.
/-П
1к
/-П
1к+1
Рис. 7. Пополнение продукции с одним уровнем промежуточных посредников
л11
Т'Л!
А11
Рис. 8. Запаса хватает на обозначенные покупки
1. Для начала будем предполагать, что объема продукции у" хватает на все покупки без необходимости использования страхового запаса, а потом усложним и введем страховой запас. Если объема запаса у" точно хватает на все покупки, включая последнюю (пока без использования страхового запаса), то можно записать:
I
л
Й+1
Сравним наблюдаемый объем покупки у" с расходуемым Г.П+1 ^ - объемом
потребления за время от ^ до ^+1. Еще раз вспомним основное предположение (рис. 2), объем совершенной покупки у/ есть интеграл от функции /-'(0 скорости потребления за время от момента совершения этой покупки ^ до момента времени совершения следующей покупки ^+1 (у/ = Г^/ЧО^). Так как + /Ь7У(0^ = /Т^Ж то
1
]
тах(1)+1 min(¡)
С;
I:
к+1
Фигурными скобками на рисунке 8 указаны временные промежутки, за которые происходит расходование продукции у".
В итоге видим (рис. 9), что наблюдаемый из данных продаж объем покупки у" занижен на Еу5^ и превышен на Еу5^+1 по сравнению с ненаблюдаемым расходуемым объемом сп
продукции Г п+1 Еу/'/'(0 & на интервале от г;" до ¿д^, где величина показывает зна-
чение объема потребляемой продукции, относящегося к предшествующей покупке:
^ 1-К1-11
Г1 min( 0' 1 ¡> 1 к
^ = I ЯаЖ
Ли
5
П 1 ------- г!
я IX ЦГ 1 ' 1 г 1
Л7И
у"
у"+1
1 £+1
Рис. 9. Объем занижен на Еу , и превышен на Еу5^+1
II
II
С11
Величина несоответствия между у" и Гп+1 Е/'/'ЧО & будет
= £ 5/+1 - ^ ^ = - ^ У У У
Оценим величины 5^. Можно увидеть, что
0 < — Ушт(0-1 = Упредш.й'
Величина УпредшА: показывает объем предшествующей покупки покупателя ] относительно момента времени ^, причем если запас верхнего распространителя заканчивается как раз из-за покупки в момент ^ = г;", то 5^ = = у/ • Есть основания полагать,
что величина 5^ распределена в интервале (0,УпредшА по равномерному закону. Тогда среднее значение можно грубо посчитать как
Ушт(0-1 .
7^7 ~ _ Упредш.&
^ = 2 = 2 ■ ¡.II
Величина несоответствия Д между у" и /п+1 ^ лежит в диапазоне
Упредш.& , / | Уп]
Упредш.к , ^^ Упредш.к+1 Г
Стоит сказать, что только в самом худшем из худших случаев возможно, что Д будет близко к границам этого интервала, ведь в начале по каждому покупателю } величины 5^+1 и 5^ могут компенсировать друг друга, а потом, когда складываются по _/', могут еще раз компенсировать друг друга. Если 5^ равномерные случайные величины, то = Еу(5^+1 — 5^) приближается к нормальному распределению (есть основания полагать,
что линейная корреляция между 5^+1 и 5^ отсутствует).
Стоит сказать, что в случае, когда покупатели не меняют свой максимальный запас продукции, т.е. когда величина покупок у/ постоянна (пока не считая восполнение страхового запаса), то никакой дополнительной систематической ошибки возникать не будет, так как среднее значение несоответствия будет равно нулю
Д7777 = Еу(5^+1 — = 12у(УПредш.^+1 — Упредш.^) = 0. Но разброс относительно нуля этого несоответствия все равно останется, причем приблизительно по нормальному закону распределения.
Тут стоит сделать несколько замечаний относительно расчета таких характеристик, как 5/с = /™1П(1) 1 /-'(О^. Во-первых эту характеристику можно наблюдать только при
моделировании, ведь истинных значений функции расхода продукции /-'(О и запасов продукции покупателей знать невозможно. Во-вторых, при моделировании надо учесть также дискретность исчисления времени, то есть на самом деле запас должен закончится чуть раньше на время от полной единицы времени, когда происходит проверка и выявляется необходимость пополнения запаса (моделирование проводится по дням, а не миллисекундам). В этом случае каждый покупатель использует собственные страховые запа-
сы 55^ = / / у/-'(Ойкоторые приводят к тому, что величина 5^ также должна считаться за интервал времени на короче, так как 55/ включаются в наблюдаемую покупку у/. Подробнее об этом было рассказано в [27], картина будет похожа на ту, что описана ниже, но относительно торговли посредников и конечных потребителей.
2. Теперь проанализируем случай использования страховых запасов, когда запасов у" распространителя верхнего уровня не хватает точь в точь на все покупки и приходится использовать страховые запасы. В моменты ^ и когда приходили покупатель 1 и 2, был превышен критический уровень запаса, и запасы брались из страховых запасов (рис. 10).
Рис. 10. Использование страховых запасов
После того как первый покупатель совершил покупку у1 в момент времени ^ = ^ наш распространитель выдал часть товара из запаса, затем запас закончился (превышен критический уровень), часть товара он взял из страхового запаса. После этой сделки, так как критический уровень запаса был превышен, распространитель совершил покупку у" + 55)-.1 (или сделал заказ) у своего поставщика, из которой часть продукции опять отложилась в страховой запас 55". Но при этом дальше расходовалась только продукция у", то есть наблюдаем превышение на 55)-.1.
Когда в момент времени ^+1 приходит второй покупатель и совершает покупку в мо-
2 II
мент t¿+5 = когда эта покупка приводит к израсходованию запаса, часть продукции берется из запасов, а часть берется из страховых запасов. Общий расход продукции
за наблюдаемый интервал времени от г;;1.1 до ^1+1 составит у" +
Имеем дело с несовпадением наблюдаемого сделанного запаса продукции с расходуемым:
у"+55"^у»+55»+1.
Можно показать, что
0 < 55^ < тахуп;редш^
Есть основания предполагать, что величина 55^ распределена приблизительно равномерно по интервалу (0; тахуп;редш^].
Среднее значение можно приблизительно посчитать как
УУ
■<./-1 ■'предш.к
С СП -
- 2п '
где п - количество покупателей (в рассматриваемом примере 3).
Несовпадение наблюдаемого и расходуемого объема продукции на интервале времени от г;" до из-за необходимости использовать страховые запасы будет:
Д(55 = 55^+1 -55^ е (-тахуПредш.^,тахуПредш.^+1).
Аналогично предыдущему случаю можно сказать, что если покупатель не склонен изменять объем заказа продукции, то систематической ошибки возникать не будет, разброс будет относительно нуля Д (П55 = 0. Причем если величина распределена равномерно, то так как в образовании несовпадения Д (55 участвуют только две величины, распределение погрешности из-за использования страховых запасов будет подчинено треугольному распределению.
В итоге имеем два вида погрешности:
1) Д(5 - из-за того, что часть покупок идет в зачет другого периода времени;
2) Д(55 - из-за того, что приходится использовать страховые запасы.
Причем эти два вида погрешности обязательно вычитаются друг из друга, так как объем покупки у" занижен на и завышен на З^1. Это приводит к тому, что общая погрешность Д ( будет:
Д ( = Д (5 - Д(
55
Численный пример
Рассмотрим конкретный числовой пример, где один распространитель продает продукцию трем другим более мелким распространителям, которые работают напрямую с конечными покупателями. На рисунке 11 сплошной гладкой линией изображена суммарная исходная функция расхода продукции, ступенчатой функцией изображена восстановленная функция (упрощенным способом), пунктирными горизонтальными линиями указана средняя истинная скорость расхода продукции.
Даннные моделирования 1s.08.2016 17.10.201в 16.12.2016 14.02.2017 15.04.2017
Рис. 11. Пример расчета погрешности с одним уровнем промежуточных распространителей
У распространителя имеется информация (табл. 4) только о времени и объеме покупок, столбцы 2 и 3. Общее исходное потребление за время между покупками представлено в столбце 4. Во время моделирования также можно узнать величину используемых страховых запасов, столбец 5, а также величину оставшейся части покупок, которая относится к предыдущему периоду.
Таблица 4
Результаты численного примера
Индекс Дата 41 Покупка у" rzk+1 ^—i Jn ^fi(t)dt tk i Ь' J
к- 1 13.10.2016 4336,58 4811,05 736,59 1784,22
к 26.11.2016 4168,35 3506,35 568,35 1141,51
к + 1 24.12.2016 3701,08 3696,03 101,08 1336,24
к + 2 22.01.2017 4123,84 4470,85 523,84 1764,05
к + 3 01.03.2017 762,38 1655,59
При моделировании наблюдается определенная сложность со сбором данных Б}к, так как посредники тоже используют свои страховые запасы. Для этого надо с момента времени последней покупки суммировать /-'(О до момента времени ^¡„ф, ^ > ^ (следующей покупки покупателя _/'). После этого от данной суммы надо отнять величину страховых запасов, которые использовал покупатель } перед тем как совершил покупку
— — -
4-2 uk+1
4+2
4 4 Lir i -э
AJJ
/
17 Original
k Restored
Г Approximated
Утт(£), ^ > для обслуживания уже своих покупателей (в нашем случае конечных потребителей, потребление которых задается функцией /( *;)).
Для интервала к — 1 имеем несоответствие Д( в объемах купленной и израсходованной продукции, наблюдаем средний расход /(О оригинальной и /(О восстановленной функции (упрощенным способом):
¡.II
Д( = у^1_1 — | к ^ = 4336.58 — 4811.05 = —474.47
^к-1 у ¡.II
/С1к 4811.05
/(О = -л-= „„ = 109.34
АО = ¿п—лг-
у^_1 4336.58
44
= 98.56.
Наблюдаем занижение на 10.78, на графике также видим соответствующую разницу (ступенчатая функция лежит ниже пунктирной, которая усредняет оригинальную функцию).
Воспользуемся формулой:
Д (5 = — = 1141.51 — 1784.22 = — 642.71
Д (55 = 55^ — 55/'1_1 = 568.35 — 736.59 = —168.24
Д( = Д(5 — Д(55 = —642.71 — (—168.24) = —474.47.
Что полностью совпадает с разницей наблюдаемой покупки и интегралом от суммарного потребления на временном участке к — 1.
Проделаем аналогичные расчеты для интервала к:
Г1 к+1
Д ( = у" — I N /(0 ^ = 4168.35 — 3506.35 = 662
^ у
/-II
_ /лГЕу/ЧО^ 3506.35
/ (*;) = —-=-= 125 23
4+1 — 4 28 125.23
У*
I1 4168.35
АО = ТЙТ^-Гл = = 148.87
^+1 — ^ 28
Наблюдаем превышение на 23.64, на графике также видим соответствующую разницу (ступенчатая функция лежит выше пунктирной, которая усредняет оригинальную функцию). Воспользуемся формулой
Д(5 = — = 1336.24 — 1141.51 = 194.73
Д (55 = 55^ — 55^ = 101.08 — 568.35 = —467.27
Д Q = Д Q5 - Д^55 = 194.73 - (-467.27) = 662.
Что также полностью совпадает с разницей наблюдаемой покупки и интегралом от суммарного потребления на временном участке к.
Для остальных интервалов к + 1, к + 2 значения расчетов ДQ, полученных по разнице между покупкой и интегралом и по формулам, также будут полностью совпадать, можете в этом убедиться самостоятельно.
Этот пример показывает справедливость полученных нами формул, поясняет, откуда берется разница между восстановленной и оригинальной суммарной функцией скорости потребления. Однако мы еще не ответили на главный вопрос, почему и как с удалением распространителя от конечного потребителя растет относительная погрешность.
Два промежуточных распространителя
Проведем похожие рассуждения относительно распространителя, у которого два уровня посредников до конечного потребителя. Сравним наблюдаемый объем покупки у|и с
Jt ni+1 Ir I у /rj(0 ^ - суммарным объемом потребления за время от t|H до tl^ (г - количество покупателей у распространителя).
На рисунке 12 в самом низу изображены покупки распространителя у|и и уЦх в моменты времени t|n и ¿х^. Причем объема покупки хватает на все продажи своим клиентам вплоть до момента времени ix1^. Однако каждый клиент также реализует свою продукцию через других посредников. Посредников наших посредников изобразим выше и в стороне. Для удобства восприятия рассмотрим случай, когда только продажи посреднику с номером = 1 приводят к завершению запаса нашего распространителя.
Если объема запаса точно хватает на все покупки, включая последнюю (пока без использования страхового запаса), то можно записать:
yi" = I I уГ = ! III
г к г к у i
к. tIII^tr,II<tIII к. ЛИ .(.г,11 ли .. T,IKtrj r,II
На рисунке 12 обведены овалами покупки у£'и и у^, которые содержатся в большой покупке у|и (на которые хватает запаса у"1). Фигурными стрелками обозначены периоды времени, за которые расходуется этот запас продукции.
r,
... V"1 V / max(i)+i
yl11 = >>| ?J /rj(Orft.
i—i ¿—I J Lmin( i) r J r II r i r II
III r,II III k ri <rfe —^L+1
Опять видим, что объем покупки у}}1 занижен на Хг^'11 и превышен на £г51+\, где
,.г,п fr,IK iii
Но на предыдущем уровне также наблюдается занижение на Еу^'"' и превышение на £у аналогично рассмотренному примеру с одним промежуточным распространителем.
Величина несоответствия из-за того, что часть покупок идет в зачет других периодов, будет:
=X ^ -1+-
г г г у
Помимо этого, возникает та же ситуация с использованием страховых запасов, наблюдается завышение на 55/11 и занижение на Но на предыдущем уровне также возникает потребность использовать страховые запасы, поэтому наблюдается завышение на
ССТ"'П ссЛИ
ЬЬь и занижение наоо^ 1.
Величина несоответствия в связи с использованием страховых запасов:
A Q55 = 55^ - SS»1 + ^(SS^ - 55['").
г
Эти два вида погрешности вычитаются друг из друга:
A Q = A Q5 - AQ55.
Величины S,'11 и SS,11 имеют такой же интервал значений относительно предшествующих покупок, как и в случае с одним промежуточным распространителем:
0 < З?" < У^дшх.
0 < SSi" < шаху^,
А величины 5,' и 55,' привязаны к покупкам на предыдущем (ближе к потребителям) уровне и имеют то же самое значение, как и в случае с одним промежуточным распространителем.
Справедливость полученных формул можно подтвердить численным примером, однако он не нагляден, его трудно изобразить одним рисунком, и он занимает много объема. Если есть желание, можете самостоятельно представить ход моделирования с помощью таблиц Excel, это займет более 400 строк и 30 столбцов, или какого-нибудь языка программирования. При расчете величин 5£'п во время моделирования как сумму значений функции /^(t), надо делать корректировку на величину используемых страховых запасов (величина покупки минус максимальный запас), так как они расходуются в текущем периоде, а не в предыдущем. С помощью численного примера убеждаемся, что полученные формулы для величины несоответствия наблюдаемой и расходуемой продукции верны.
Теперь нам достаточно абсолютно всего, чтобы можно было объяснить рост погрешности при удалении от конечного потребителя.
Определение скорости роста погрешности с удалением от конечного потребителя
Как было показано здесь, в текущем исследовании, абсолютное значение разброса погрешности определения исходной зависимости зависит от объема совершаемых покупок.
При отдалении от конечного потребителя объемы покупок растут. Причем, если бы в погрешности не участвовали покупки от более низких уровней, то относительная погрешность оставалась бы одинаковой. Но у нас в итоговую погрешность включаются погрешности с предшествующих уровней в цепочке распространения, поэтому погрешность растет.
Стоит заметить, что влияние значения объема покупок предшествующих распространителей на относительную погрешность падает с экспоненциальной скоростью при удалении от конечного потребителя. Это происходит из -за того, что объем покупок распространителей верхнего уровня всегда в несколько раз больше, чем предшествующих распространителей. Вклад предшествующих распространителей в погрешность при расчете относительной погрешности надо будет делить на значение, зависящее от объемов покупок на текущем уровне.
Рассмотрим еще раз величину несоответствия из-за того, что часть покупок относилась к другому временному интервалу:
1 уровень посредников - А Qs = — ^к)-
2 уровня посредников - А Qs = ХгС^ТН! — 5['1!) + ХгХ^ь^ — 5[,]).
Для сокращения записи обозначим разницу в скобках как ,й5г'и,й5г']. Величина несоответствия будет:
1 уровень посредников - АQs = Х } ЛБ1.
2 уровня посредников - АQs = Хг dSr'u + Хг Х] ЛБГ'}.
Если повторить все рассуждения для 3 уровней посредников, можно показать, что величина несоответствия будет:
3 уровня посредников - А Qs = Хт ЛБт'т + Хт Хг Л5т'г'и + Хт Хг Ху ЛБт'г'К
Теперь рассмотрим величину несоответствия из-за использования страховых запасов:
1 уровень посредников - А Qss = —
2 уровня посредников - А Qss = (ББ^ — ББ^1) + ХгО^Й! — ^Г'").
Также для сокращения записи сделаем замену:
1 уровень посредников - А Qss = йББи.
2 уровня посредников - АQss = йББ111 + Хг Л5Бг'и.
Повторяя все рассуждения для трех уровней посредников, можно показать, что величина несоответствия будет:
3 уровня посредников - А Qss = йББ™ + Хт Л5Бт'111 + ХтХг й55т'г'п.
Величины превышений/занижения наблюдаемой и реально расходуемой продукции зависят от величин предшествующих покупок: Б}к распределена в интервале (0' УпредШ/с]'
''предш.Ы
SSk распределена в интервале (0, maxy^ fc]. Значит, разницы dS', dSSu также пропор-
циональны предыдущим покупкам.
Зафиксируем все условия, чтобы определить влияние только позиции в цепочке распространения на величину ошибки, а все остальные факторы не вносили своего влияния. Для этого предположим, что на каждом уровне посредников, у каждого распространителя одинаковое количество покупателей max т = max г = max j = п. Также предположим, что запасов распространителей хватает на одинаковое количество покупок Р более мелких
- ^ гД
распространителей. То есть величина покупки распространителя Упредш^ всегда относится к величине покупки Упредш к (дочерних распространителей) как некоторая постоянная величина Р. Тогда величина dSr,u относится к dS} так же, как Р, и dSm,m относится к dSr,u как Р. Аналогично остальные величины dSSw, dSS111, dSS11 также относятся последовательно друг к другу как Р.
Величина несоответствия в зависимости от количества уровней посредников будет выглядеть следующим образом:
1 уровень - = Еу = п • ^5.
2 уровня - Д^5 = Ег + Ег Еу = п • Р • + п2^.
3 уровня - Д@5 = Еж + Еж Ег ¿^.п + Еж Ег Еу ^^.у =
= п • Р2 • + п2 • Р • + п3 • ^5. Для величины несоответствия Д@55 в связи с использованием страхового запаса аналогично получаем следующее:
1 уровень посредников - Д@55 = = ^55.
2 уровня посредников - = + Ег 11 = Р • + п • ^55.
3 уровня посредников - Д <?55 = + Еж 111 + ЕжЕг =
= Р2 • ^55 + п • Р • ^55 + п2 • ^55. Общее несоответствие = — Д@55 тогда будет:
1 уровень - = п • — ^55.
2 уровня - = п • Р • + п2^5 — Р • ^55 — п • ^55 =
= Р • (п • — ^55) + п • (п • — ^55) = (п • — ^55)(Р + п).
3 уровня -
Д£ = п • Р2 • + п2 • Р • + п3 • — Р2 • ¿55 + п • Р • ¿55 + п2 • ¿55 = = Р2( п • ¿5 — ¿55) + пР(п • ¿5 — ¿55) + п2(п • ¿5 — ¿55) = = ( п • ¿5 — ¿55)(Р2 + пР + п2).
Так как нас интересует относительная погрешность, то надо делить величину несоответствия на объем покупки рассматриваемого распространителя. То есть для 1 уровня посредников величину Д@, которая пропорциональна объему покупок у/ на предшествующем уровне, надо делить на объем покупки у", который, как было условлено, будет в Р раз больше.
1 уровень посредников
_ (п • ¿5 — ¿55) _ (п • ¿5 — ¿55) У" = У" = Р • у/ .
2 уровня посредников
_ (п • ¿5 — ¿55)(Р + п) _ (п • ¿5 — ¿55)(Р + п) _ (п • ¿5 — ¿55)(Р + п) ,ш = Тли
у"1 у!!! р • у" Р2^у/
(п • ¿5 — ¿55) ^
р •у/
3 уровня посредников
Д ^ _ ( п • ¿5 — ¿55)(Р2 + пР + п2) _ У1?= уР =
_ (^¿5 — ¿55)(Р2 + пР + п2)_ (^¿5 — ¿55)/ п /Пч2\ = рз • у/ = р • у/ (1+Р + (Р) )
Если продолжить эту последовательность дальше, то получим следующее: # уровней посредников
Д ^ (п • ¿5 — ¿55) / п /Пч2 /Пч№-1\
у[№+1] р^у/ V Р ^рУ ^р
Выражение в скобках является суммой геометрически убывающей прогрессии при условии, что величина (П) меньше 1. Эта величина будет меньше единицы, так как Р показывает,
на сколько покупок хватает запаса продукции распространителя, а п показывает количество покупателей у распространителя. Только в случае, если п > Р, выражение в скобках не будет убывающей прогрессией, это возможно, если объема покупок распространителя не хватает, чтобы удовлетворить лишь по одной покупке своих покупателей, то есть объем покупок покупателей превосходит доли 1/п от объема покупки распространителя.
Расчет дисперсии
При увеличении количества уровней посредников увеличивается общее количество задействованных покупателей и увеличивается общее количество случайных (неопределенны) величин. Если дисперсия будет расти как убывающая геометрическая прогрессия, то относительно среднее квадратичное отклонение должно расти как корень из этой дисперсии, то есть еще медленнее (ошибки могут компенсировать друг друга). Однако большая часть вклада в дисперсию осуществляется первыми 2(п + 1) случайными величинами (по 2 величины на значения йБ и йББ), вклад следующих 2 (п2 + п) случайных величин падает в Р раз, а очередных 2(п3 + п2) падает уже в Р2 раз и так далее. Закон распределения относительной погрешности не будет соответствовать нормальному распределению, так как в нормальном распределении предполагается, что вклад всех случайных величин одинаков. Закон распределения относительной погрешности будет характеризоваться в основном суммой первых 2(п + 1) равномерных случайных величин (распределенных от 0 до -,
так как каждая величина лежит в диапазоне от 0 до Упредш к, а затем она делится на у", которое в Р раз больше).
Попробуем определить дисперсию относительного отклонения ^^]. Дисперсия базовых равномерных величин равна 1/12. Тогда суммарная дисперсия первых 2(п + 1) величин будет (дисперсия суммы/разницы независимых случайных величин равна сумме дисперсий, умножение случайной величины на константу приводит к увеличению дисперсии в константу в квадрате раз). Следующие 2(п2 + п) случайных величин увеличивают дисперсию
2(п2+п) 3 2 2(п3+п2)
на 12р4 , а очередные 2(п3 + п2) случайные величины на —— и так далее.
В результате дисперсия относительного отклонения в связи с наличием N уровней посредников будет:
Б
у[М+1]
2(п + 1) 2(п2 + п) 2(п3 + п2) 2(п+1)пи-1
+ —гтгтг:;— +-^тгт-+ ■■■ +
12Р2 12Р4 12Р6 12РШ
п + 1 ( п1 п2 пм-1 \
6 Р2 \ Р2 (Р2)2 (Р2)И-1)'
Выражение в скобках опять является суммой геометрически убывающей прогрессии. Сумма первых N слагаемых будет 1^ , где ц = -П - знаменатель прогрессии. В результате можем получить значение дисперсии для относительного отклонения:
Б
у[Ы+1]
6Р2(1-П)
Среднее квадратичное отклонение получаем как корень из дисперсии:
|("+1)(1-(£П
Для рассмотренного абстрактного примера, когда у распространителя по 3 покупателя (п = 3 более мелких распространителей), если объем покупок распространителей при удалении от конечного потребителя растет как Р = 10, то можем посчитать дисперсию и среднее квадратичное отклонение для относительного отклонения, столбец 1 (табл. 5). График зависимости относительной погрешности от удаленности от конечных потребителей представлен на рисунке ниже (рис. 14). Как видно из таблицы и графика, относительная погрешность растет незначительно, уже при удаленности на 3 позиции погрешность изменяется лишь в четвертом знаке.
Таблица 5
Расчет дисперсии и среднего квадратичного отклонения относительной ошибки
при удалении от конечного потребителя
о
У
Д<2
[№+1]
N п = 3, Р = 10 п = 3, Р = 4 п = 20, Р = 20
0 о в % 0 о в % 0 о в %
1 0,006666667 8.164966 0,041666667 20.412415 0,00875 9.3541435
2 0,006866667 8.286535 0,049479167 22.243910 0,0091875 9.5851448
3 0,006872667 8.290155 0,05094401 22.570780 0,009209375 9.5965489
4 0,006872847 8.290263 0,051218669 22.631542 0,009210469 9.5971187
5 0,006872852 8.290267 0,051270167 22.642917 0,009210523 9.5971472
СКО (о) в %
23
21
19
17
15
13
11
9
7
1 2 3 4 5
-п=3, p=10 -п=3, p=4 -п=20, p=20
Рис. 14. Относительная погрешность в % в зависимости от удаленности от конечных потребителей (длины цепочки посредников)
Заключение
Подведем итоги. Получены формулы для расчета ошибки восстановления исходной зависимости в зависимости от позиции в цепочке распространителей. Получены значения интервалов, в которых лежит ошибка. Ошибка имеет нулевое математическое ожидание при неизменности исходных факторов. На численном примере показана справедливость формул. Определено, что относительная погрешность при удалении от конечного потребителя (без влияния других факторов) будет расти приблизительно так же, как растет сумма геометрически убывающей прогрессии. Однако так как элементы суммы являются случайными величинами, дисперсия и среднее квадратичное отклонение растут еще медленнее. Получены формулы для их расчета в идеальных условиях, когда никакие другие факторы не оказывают никакого воздействия. Показано что при удалении от конечного потребителя дисперсия и среднее квадратичное отклонение для относительной ошибки растут очень медленно. Однако даже в худшем случае, когда все случайные величины накладываются и ошибка увеличивается, а не компенсируется, погрешность все равно не превысит суммы геометрической убывающей прогрессии.
Тем не менее в реальных условиях при изменении позиции в цепочке распространителей могут происходить разные вещи, например, может изменяться количество дочерних распространителей, меняться схема цепи распространителей, объем покупок текущего распространителя может непропорционально меняться относительно объемов покупок дочерних распространителей (или исходной суммарной функции потребления), может меняться максимальный запас продукции в зависимости от спроса и т.д. Все это приведет к увеличению погрешности, однако это уже другая история, и к текущему исследованию это отношения не имеет.
Что касается погрешности за множество интервалов времени между покупками, например, за время моделирования 2 года, когда было совершено много покупок, в разных покупках ошибка могла быть либо отрицательной, либо положительной, причем маловероятно, чтобы в соседних покупках ошибка была с одинаковым знаком. Тогда при сглаживании восстановленная функция будет еще ближе к исходной функции на всем периоде наблюдений.
Результаты исследования с уверенностью позволяют сказать, что при анализе данных из истории продаж по возможности следует всегда переходить на емкостный метод анализа редких событий, вместо агрегирования данных по временным интервалам и дальнейшего анализа этих временных интервалов. Для этого необходимо от всех покупателей раздельно собирать такие данные, как дата, объем покупки и идентификатор покупающего, все это, наверное, уже давно реализовано в условиях цифровой экономики, когда большой брат следит за всеми твоими действиями, осталось это только грамотно использовать. Не стоит лишний раз агрегировать в кучу данные продаж по временным интервалам, так как при таком агрегировании теряется важная индивидуальная информация.
Следующие исследования будут направлены на изучение вопросов точности в зависимости от влияния конкуренции, когда покупатель при пополнении своего запаса переключается с одного распространителя на другого, а также на определение точности при потере части данных, когда часть данных теряется бесследно. Еще интересным кажется определить, как изменяется точность, если покупатели нестрого следят за своими запасами, а проверка запасов осуществляется с разбросом критического уровня.
ЛИТЕРАТУРА
1. Dudewicz Edward J., Karian Zaven A. The role of statistics in is/it: practical gains from mined data // Information systems frontiers. 1999. № 1(3). Р. 259-266.
2. Makridakis S. Forecasting: its role and value for planning and strategy // International journal of forecasting. 1996. № 12(4). Р. 513-537.
3. Saerkkae S. Bayesian Filtering and Smoothing. Cambridge University Press. 2013. URL: http://www.cambridge.org/9781107030657 (дата обращения: 03.03.2019).
4. Lambert Koopmans. The Spectral Analysis of Time Series. 1st Edition. University of New Mexico. Academic Press. 1995. URL: https://www.elsevier.com/books/the-spectral-analysis-of-time-series/koopmans/978-0-12-419251-5 (дата обращения: 03.03.2019).
5. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов. М: Финансы и статистика. 2003.
6. Голубинский А.Н. Методы аппроксимации экспериментальных данных и построения моделей // Вестник Воронежского института МВД России. 2007. № 2. С. 138-143.
7. Jackson J.E. Principal components and factor analysis: Part I - principal components // Journal of Quality Technology. 1980. № 12. Р. 201-213.
8. Jackson J.E. Principal components and factor analysis: Part II - additional topics related to principal components // Journal of Quality Technology. 1981. № 13. С. 46-58.
9. Корректировка числа редких событий в логистической регрессии. URL: http://www. statmethods.ru/ stati/178-korrektirovka-chisla-redkikh-sobytij -v-modeli-logisticheskoj -regressii.html (дата обращения: 03.03.2019).
10. Altman N.S. An introduction to kernel and nearest-neighbor nonparametric regression // The American Statistician. 1992. № 46(3). С. 175-185. doi:10.1080/00031305.1992.10475879.
11. Croston J.D. Forecasting and stock control for intermittent demands // Operational Research Quarterly (1970-1977). 1972. № 23(3). С. 289-303.
12. Johnston F.R., Boylan J.E. Forecasting intermittent demand: a comparative evaluation of Croston's method. Comment // International journal of forecasting. 1996. № 12(2). Р. 297-298.
13. Efron B. and Tibshirani R.J. An introduction of the Bootstrap. New York: Chapman & Hall, 1993.
14. Willemain T.R., Park D.S., Kim Y.B., Shin K.I. Simulation output analysis using the threshold bootstrap. 2001. № 134(1). Р. 17-28.
15. Иванько Р.С. Краткосрочное прогнозирование нестационарного спроса в оптовой торговле: дис. ... канд. эконом. наук. М., 2005.
16. Вентцель Е.С., Овчаров Л.А. Теория случайных процессов и ее инженерные приложения: Учеб. пособие для втузов. 2-е изд., стер. М.: Высш. шк., 2000. 383 с.
17. Жуков М.М., Кудряш В.И. Математическая модель рисков распределенных технических систем при бета-распределении плотности вероятности наступления ущерба // Общественная безопасность, законность и правопорядок в III тысячелетии. Воронеж: Воронежский институт МВД РФ, 2017. № 3-3. С. 278-281.
18. Дзанагова И.Т., Хугаева Л.Т. Информационно-статистические методы построения экстремальных моделей редких событий // Фундаментальные исследования. Пенза: Академия естествознания. 2015. № 11-6. С. 1081-1084.
19. Лукинский В., Замалетдинова Д. Методы управления запасами: расчет показателей запаса для товарных групп, относящихся к редким событиям (часть I). Логистика. 2015. № 1 (98). С. 28-33.
20. Лукинский В., Замалетдинова Д. Методы управления запасами: расчет показателей запаса для товарных групп, относящихся к редким событиям (часть II). Логистика. 2015. № 2 (99). С. 24-27.
21. Вожжов А.П., Луняков О.В., Вожжов С.П. Формирование страховых запасов предприятия при пуассоновском характере поступающих и выдаваемых потоков // Экономика и управление: теория и практика. 2015. № 1(1). С. 30-35.
22. Кораблев Ю.А. Емкостный метод определения функции скорости потребления // Экономика и менеджмент систем управления. Воронеж: Изд-во «Научная книга». 2015. № 15(1.1). С. 140-150.
23. Кораблев Ю.А. Обоснование емкостного метода определения спроса // Экономика, статистика и информатика. Вестник УМО. М.: РЭУ им. Плеханова. 2015. № (5). С. 96-101.
24. Кораблев Ю.А. Исследование точности емкостного метода от позиции в цепочке распространителей // Экономика и управление: проблемы, решения. М.: Научная библиотека. 2018. №7(5). С. 106-121.
25. Аппроксимация линейным или нелинейным МНК. Кросс-платформенная библиотека численного анализа ALGLIB. URL: http://alglib.sources.ru/interpolation/ leastsquares.php#header0 (дата обращения: 03.03.2019).
26. Бауэрсокс Дональд Дж., Клосс Девид Дж. Логистика: интегрированная цепь поставок. 2-е изд. / Пер. с англ. Н.Н. Барышниковой, Б.С. Пинскера. М.: ЗАО «Олимп-Бизнес», 2008. 640 с.
27. Кораблев Ю.А. Разбор причин и оценка погрешности аномальных картин в емкостном методе анализа редких событий // Экономика и управление: проблемы, решения. М.: Научная библиотека. 2017. № 8(6). С. 8-12.
REFERENCES
1. Dudewicz Edward J., Karian Zaven A. The role of statistics in is/it: practical gains from mined data // Information systems frontiers. 1999. № 1(3). Р. 259-266.
2. Makridakis S. Forecasting: its role and value for planning and strategy // International journal of forecasting. 1996. №12(4). Р. 513-537.
3. Saerkkae S. Bayesian Filtering and Smoothing. Cambridge University Press. 2013. URL: http://www.cambridge.org/9781107030657 (дата обращения: 03.03.2019).
4. Lambert Koopmans. The Spectral Analysis of Time Series. 1st Edition // University of New Mexico. Academic Press. 1995. URL: https://www.elsevier.com/books/the-spectral-analysis-of-time-series/koopmans/978-0-12-419251-5 (дата обращения: 03.03.2019).
5. Lukashin Yu.P. Adaptivnyye metody kratkosrochnogo prognozirovaniya vremennykh rya-dov [Adaptive methods of short-term forecasting of time series]. M: Finance and statistics. 2003.
6. Golubinsky A.N. Metody approksimatsii eksperimental'nykh dannykh i postroyeniya mod-eley [Methods of approximation of experimental data and model building] // Vestnik Voronezh-skogo institutaMVD Rossii [Bulletin of the Voronezh Institute of the Ministry of Internal Affairs of Russia]. 2007. No. 2. P. 138-143.
7. Jackson J.E. Principal components and factor analysis: Part I - principal components // Journal of Quality Technology. 1980. № 12. Р. 201-213.
8. Jackson J. E. Principal components and factor analysis: Part II - additional topics related to principal components // Journal of Quality Technology. 1981. № 13. Р. 46-58.
9. Korrektirovka chisla redkikh sobytiy v logisticheskoy regressii [Adjustment of the number of rare events in the logistic regression. URL: http://www.statmethods.ru/stati/178-korrektirovka-chisla-redkikh-sobytij-v-modeli-logisticheskoj- regressii.html (appeal date: 03/03/2019)].
10. Altman N.S. An introduction to kernel and nearest-neighbor nonparametric regression // The American Statistician. 1992. № 46(3). Р. 175-185. doi:10.1080/00031305.1992.10475879.
11. Croston J.D. Forecasting and stock control for intermittent demands // Operational Research Quarterly (1970-1977). 1972. № 23(3). Р. 289-303.
12. Johnston F.R., Boylan J.E. Forecasting intermittent demand: a comparative evaluation of Croston's method. Comment // International journal of forecasting. 1996. № 12(2). Р. 297-298.
13. Efron B. and Tibshirani R.J. An introduction of the Bootstrap. New York: Chapman & Hall, 1993.
14. Willemain T.R., Park D.S., Kim Y.B., Shin K.I. Simulation output analysis using the threshold bootstrap. 2001. № 134(1). Р. 17-28.
15. Ivanko R.S. Kratkosrochnoye prognozirovaniye nestatsionarnogo sprosa v optovoy tor-govle: dis. ... kand. ekonom. nauk [Short-term forecasting of non-stationary demand for wholesale trade: thesis for Cand. of economics]. Moscow, 2005.
16. Wentzel E.S., Ovcharov L.A. Teoriya sluchaynykh protsessov i yeye inzhenernyye pri-lozheniya: Ucheb. posobiye dlya vtuzov [The theory of random processes and its engineering applications. Training manual for technical colleges]. 2nd ed., Sr. M.: Higher. school, 2000. 383 P.
17. Zhukov M.M., Kudryash V.I. Matematicheskaya model' riskov raspredelennykh tekhni-cheskikh sistem pri beta-raspredelenii plotnosti veroyatnosti nastupleniya ushcherba [Mathematical model of risks of distributed technical systems for beta-distribution of density of probability of suffering of damage] // Obshchestvennaya bezopasnost', zakonnost' i pravoporyadok v III ty-syacheletii. Voronezh: Voronezhskii institut MVD RF, 2017. № 3-3. Pp. 278-281.
18. Dzanagova I.T., Khugaeva L.T. Informatsionno-statisticheskiye metody postroyeniya ekstremal'nykh modeley redkikh sobytiy [Method of operator series for constructing extremal models of rare events] // Fundamental'nye issledovaniya. Penza: Akademiya Estestvoznaniya. 2015. № 11-6. Pp. 1081-1084.
19. Lukinsky V., Zamaletdinova D. Metody upravleniya zapasami: raschetpokazateley zapa-sa dlya tovarnykh grupp, otnosyashchikhsya k redkim sobytiyam (chast' I) [Methods of inventory management: the calculation of inventory indicators for product groups related to rare events (Part I)] // Logistika. 2015. № 1 (98). Pp. 28-33.
20. Lukinsky V., Zamaletdinova D. Metody upravleniya zapasami: raschet pokazateley zapa-sa dlya tovarnykh grupp, otnosyashchikhsya k redkim sobytiyam (chast' II) [Methods of inventory management: the calculation of inventory indicators for product groups related to rare events (Part II)] // Logistika. 2015. № 2 (99). Pp. 24-27.
21. Vozhzhov A.P., Lunyakov Ü.V., Vozhzhov S.P. Formirovaniye strakhovykh zapasov predpriyatiya pri puassonovskom kharaktere postupayushchikh i vydavayemykh potokov [Formation of safety stock with application of the Poisson processes to incoming and outgoing flows] // Ekonomika i upravlenie: teorija i praktika [Economics and Management: Theory and Practice]. 2015. № 1(1). S. 30-35.
22. Korablev Yu.A. Yemkostnyy metod opredeleniya funktsii skorosti potrebleniya [Capacity method of determination consumption rate function] // Ekonomika i menedzhment sistem uprav-leniya [Economics and management systems management] Voronezh: Izd-vo «Nauchnaya kni-ga». 2015. № 15(1.1). S. 140-150.
23. Korablev Yu.A. Obosnovaniye yemkostnogo metoda opredeleniya sprosa [Argumentation of capacity method demand determination] // Ekonomika, statistika i informatika. Vestnik UMO [Economy, statistics and computer science. Herald UMO]. M.: REU Im. Plehanova. 2015. № (5). S. 96-101.
24. Korablev Yu.A. Issledovaniye tochnosti yemkostnogo metoda ot pozitsii v tsepochke rasprostraniteley [The study of the capacitive method accuracy from the position in the chain of distributors] // Ekonomika i upravlenie: problemy, resheniya [Economics and Management: problems, solutions]. M.: Nauchnaya biblioteka. 2018. № 7(5). S. 106-121.
25. Approksimatsiya lineynym ili nelineynym MNK. Kross-platformennaya biblioteka chislen-nogo analiza ALGLIB [Approximation of linear or nonlinear OLS. Cross-platform biblio-tech numerical analysis ALGLIB]. URL: http://alglib.sources.ru/interpolation/leastsquares.php # header0 (appeal date: 03/03/2019).
26. Bowersox, Donald J., Kloss David J. Logistika: integrirovannaya tsep'postavok. 2-ye izd [Logistics: an integrated supply chain. 2nd ed.] / Per. from English N.N. Baryshnikova, B.S. Pinsker. M.: ZAO Olimp-Business, 2008. 640 p.
27. Korablev Yu.A. Razbor prichin i otsenka pogreshnosti anomal'nykh kartin v yemkostnom metode analiza redkikh sobytiy [The causes analysis and error estimation of the anomalous pictures in the capacity method for the analysis of rare events] // Ekonomika i upravlenie: problemy, resheniya [Economics and Management: problems, solutions]. M.: Nauchnaya biblioteka. 2017. № 8(6). S. 8-12.
ERROR OF THE CAPACITY METHOD OF RARE EVENTS ANALYSIS, REMOTENESS FROM THE END USER
Yu.A. KORABLEV
Financial University under the Government of the Russian Federation 125993, Moscow, Russia, Leningradsky Prospect, 49 Email: academy@fa.ru
The works devoted to the study of rare events are very few. The most popular method for analyzing rare events is the theory of random processes, when events are represented by Poisson or Palm flows. Other methods have even less accuracy and validity. Nevertheless, the theory of random processes is not able to determine the event occurrence moment but only the probability of a given number of events for a fixed length time interval.
The paper describes the methodology for the rare events study, which is based on the difference in the events sources and the restoration of the proposed process parameters underlying the occurrence of these events. After the restoration of the process parameters, a pattern is sought by any other known methods, after which the patterns are extrapolated for the future. After extrapolating the process parameters, the process starts to obtain a forecast of the time moments of the following events occurrence.
The most common process in the economy is the process of consuming, or expenditure ofproducts, or accumulating disturbances to a certain level. In this case, event sources can be modeled as capacities. The process parameter is the emptying speed of this capacity. A method for restoring this speed is proposed, after which future events can be predicted. I call this method of analyzing and predicting rare events the "capacity" method.
The article analyzes the influence of the position in the chain of distributors on the accuracy of restoring the original unknown function of the products consumption rate using the capacity method. Another goal is to find the magnitude of the relative error in the restoration of the original unknown function of product consumption.
With the help of mathematical analysis, the consumption process for the chain of distributors is considered, the inverse problem is constructed, the error is analyzed. As a result of the current study, the values of the error in restoring the original dependence in the sale of products through one intermediary, as well as in the sale of products through two successive intermediaries, are obtained. The extreme values of the intervals for the error of restoring the original dependence were obtained. On a specific numerical example, the validity of the formulas obtained is confirmed. It is shown that the error is not systematic. It is shown that the increase in error from the distance from the end user, with all other factors remaining unchanged, grows as a sum of a geometrically decreasing progression. Values of the variance and standard deviation for the relative error were calculated; it is shown that they grow very slowly.
Keywords: rare events; capacity method; consumption rate; accuracy; error; dispersion; sequence of distributors; intermediaries.
Работа поступила 07.06.2019 г.