Научная статья на тему 'МЕТОДИКА И ПРОБЛЕМЫ ПОСТРОЕНИЯ ПРОГНОЗА СПРОСА РАСПРЕДЕЛЕННЫХ ТОРГОВЫХ СЕТЕЙ НА ОСНОВЕ BIG DATA'

МЕТОДИКА И ПРОБЛЕМЫ ПОСТРОЕНИЯ ПРОГНОЗА СПРОСА РАСПРЕДЕЛЕННЫХ ТОРГОВЫХ СЕТЕЙ НА ОСНОВЕ BIG DATA Текст научной статьи по специальности «Экономика и бизнес»

CC BY
12
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Big Data / распределенные торговые сети / торговые точки / прогноз спроса / методика и проблемы / Big Data / distributed retail networks / retail outlets / demand forecast / gradient boosting / methodology and problems

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Горобченко Станислав Львович, Ковалёв Дмитрий Александрович, Войнаш Сергей Александрович, Тарабан Мария Всеволодовна, Теппоев Алексей Викторович

Рассмотрены проблемы и методика построения прогноза спроса распределенных торговых сетей на основе Big Data. Показано, что значительные трудности возникают при прогнозировании спроса и пополнении запасов на удаленных точках торговой сети. Для решения задач прогнозирования могут быть применены методы анализа временных рядов, особенно, градиентного бустинга. В тоже время задача прогнозирования временных рядов в распределенном ритейле имеет свои особенности. Приходится учитывать изменение данных при введении новых товаров, внедрении системы уценок, доступности товаров, маркетинговых акций, а также проблемы, свойственные обработке данных таких сетей (невозможность достаточной экстраполяции, неправильные показатели чувствительности к трендам, выбросы и шумы). Приведен уточненный алгоритм коррекции данных для повышения точности прогноза.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Горобченко Станислав Львович, Ковалёв Дмитрий Александрович, Войнаш Сергей Александрович, Тарабан Мария Всеволодовна, Теппоев Алексей Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS AND PROBLEMS OF FORECASTING THE DEMAND OF DISTRIBUTED RETAIL CHAINS BASED ON BIG DATA

The problems and methods of forecasting the demand of distributed retail chains based on Big Data are considered. It is shown that significant difficulties arise when forecasting demand and replenishing stocks at remote points of the retail network. Time series analysis methods, especially gradient boosting, can be used to solve forecasting problems. At the same time, the task of forecasting time series in distributed retail has its own characteristics. Data changes have to be taken into account when introducing new products, introducing a markdown system, product availability, marketing campaigns, as well as problems inherent in processing data from such networks (inability to sufficiently extrapolate, incorrect trend sensitivity indicators, emissions and noise). A refined data correction algorithm is presented to improve the accuracy of the forecast.

Текст научной работы на тему «МЕТОДИКА И ПРОБЛЕМЫ ПОСТРОЕНИЯ ПРОГНОЗА СПРОСА РАСПРЕДЕЛЕННЫХ ТОРГОВЫХ СЕТЕЙ НА ОСНОВЕ BIG DATA»

8. Головин К.А., Ковалев Р.А., Копылов А.Б. Расчёт крепей, взаимодействующих со слоем расширяющихся пород // Известия Тульского государственного университета. Науки о Земле, 2016. Вып. 4. С. 174-179.

9. Булычев Н.С. Механика подземных сооружений в примерах и задачах: Учебное пособие для вузов. М.: Недра, 1989. 270 с.

10. Власов В.З., Леонтьев Н.Н. Балки, плиты и оболочки на упругом основании. М.: Физматгиз, 1960.

491 с.

11. Ржаницын А.Р. Теория составных стержней строительных конструкций. М.: Госстройиздат, 1948.

192 с.

Головин Константин Александрович, д-р техн. наук, профессор, заведующий кафедрой, [email protected], Россия, Тула, Тульский государственный университет,

Копылов Андрей Борисович, д-р техн. наук, профессор, toolart@mail. ru, Россия, Тула, Тульский государственный университет,

Сушков Сергей Леонидович, канд. техн. наук, доцент, [email protected], Россия,Тула, Тульский государственный университет,

Сушков Артем Даниилович, студент, Россия, Москва, Российский университет транспорта (МИИТ)

TO DETERMINE THE LOADS ON THE SUPPORT OF MINE WORKINGS

K.A. Golovin, A.B. Kopylov, S.L. Sushkov, A.D. Sushkov

When developing coal seams with a transition to great depths characterized by difficult mining and geological conditions, the costs of maintaining mine workings increase, and therefore the task of ensuring their stability based on the development of calculation methods that allow revealing the reserves of the bearing capacity of the support becomes particularly important and relevant.

Key words: load on the support, rock pressure, rock mass, support-array system.

Golovin Konstantin Aleksandrovich, doctor of technical sciences, professor, head of chair, [email protected], Russia, Tula, Tula State University,

Kopylov Andrei Borisovich, doctor of technical sciences, professor, toolart@mail. ru, Russia, Tula, Tula State

University,

Sushkov Sergei Leonidovich, candidate of technical sciences, docent, [email protected], Russia, Tula, Tula State

University,

Sushkov Artem Daniilovich, student, Russia, Moscow, Russian University of Transport (MIIT)

УДК 681.5

DOI: 10.24412/2071-6168-2024-4-188-189

МЕТОДИКА И ПРОБЛЕМЫ ПОСТРОЕНИЯ ПРОГНОЗА СПРОСА РАСПРЕДЕЛЕННЫХ ТОРГОВЫХ

СЕТЕЙ НА ОСНОВЕ BIG DATA

С.Л. Горобченко, Д.А. Ковалёв, С.А. Войнаш, М.В. Тарабан, А.В. Теппоев

Рассмотрены проблемы и методика построения прогноза спроса распределенных торговых сетей на основе Big Data. Показано, что значительные трудности возникают при прогнозировании спроса и пополнении запасов на удаленных точках торговой сети. Для решения задач прогнозирования могут быть применены методы анализа временных рядов, особенно, градиентного бустинга. В тоже время задача прогнозирования временных рядов в распределенном ритейле имеет свои особенности. Приходится учитывать изменение данных при введении новых товаров, внедрении системы уценок, доступности товаров, маркетинговых акций, а также проблемы, свойственные обработке данных таких сетей (невозможность достаточной экстраполяции, неправильные показатели чувствительности к трендам, выбросы и шумы). Приведен уточненный алгоритм коррекции данных для повышения точности прогноза.

Ключевые слова: Big Data, распределенные торговые сети, торговые точки, прогноз спроса, методика и

проблемы.

Традиционно шаги по росту бизнеса во многом связываются с задачами дальнейшей автоматизации прогноза. Это особенно важно для распределенных сетей с большими ограничениями по количеству одновременно хранимых товаров, к которым можно отнести Darkstore (дарксторы). Задачи прогнозирования продаж одновременно влекут за собой необходимость моделирования и планирования закупок. В частности, при прогнозировании спроса для нескольких десятков дарксторов приходится строить прогноз по всем товарам для всех дарксторов, включая и планируемые к открытию. Товаров может быть и сотни и тысячи для одного даркстора и миллионы для всей сети. К этой сложной задаче следует добавить и то, что будет множество акций, скидок, разные типы ценообразования, конкурсов и промо-акций. Отражением этого всего должны быть соответствующие паттерны в разрабатываемой системе автоматизации.

В статье рассматриваются практические пути создания концепции прогноза спроса и методики решения этой задачи.

Задачам внедрения в различных отраслях в профессиональной литературе уделяется большое внимание [1-8]. Наиболее значительные результаты в применении Data Science и обработки больших данных получены в процессах планирования и прогнозирования налоговых поступлений [1], в задачах автоматизации производственных процессов [2, 15], авторитейла [3] и др. Значительные успехи достигнуты при разработке моделей и прогнозировании реализации инвестиционных проектов [4]. Новыми направлениями можно считать системы автоматизации прогнозирования процесса разработки документооборота в области стандартизации [5] и технических систем [6]. Однако основные задачи решаются в области создания платформ интегрированного планирования и прогнозирования бизнес-процессов в организациях [7].

В решении задач прогнозирования развития организаций, создания моделей развития бизнеса с учетом использования больших данных большое значение уделяется созданию платформ стратегического планирования и прогнозирования [8], структуризации бизнес процессов в т.ч. и под возможности цифровой обработки получаемых данных, например, на основе блочно-структурных бизнес-процессов [9].

Задачи создания интегрированных платформ планирования и прогнозирования связываются с новыми возможностями использования сильных скриптов [10], а также расширением возможностей использования интегрированных платформ, типа 1С, ставших стандартом в России, практически для всех бизнесов [11]. При этом в развитии цифровых платформ значительное развитие по отношению к другим подсистемам получают именно создание ориентированных на интеллектуальную обработку базы данных [12]. Базы big data и возможности их обработки становятся центром интеграции остальных подсистем интегрированных платформ [13].

Использование больших данных часто выходит за пределы возможностей локальных управляющих вычислительных комплексов, в связи с чем они включаются в сети на основе облачных технологий, позволяющие проводить обработку больших массивов данных в распределенной сети [14], что также требует и в методическое обеспечение обработки данных и методов искусственного интеллекта, ориентированного на обработку больших данных [17]. Для этих целей также начинают отрабатывать и новые методические подходы, например, с использованием новых методик обработки данных [15] и специализированного программного инструментария [19]. Развитие бизнес методик, учитывающих комплексные программно-целевые показатели работы бизнеса, также включаются в дополнительные блоки планирования и прогнозирования показателей, в частности на основе интеграции системы сбалансированных показателей системы управления бизнес-системами [16], систем маркетинговой информации [18] с ориентацией на развитие функциональных возможностей системы интегрированного бизнес планирования [20] и совершенствованию общих подходов к управлению информацией в современных интегрированных системах для повышения их роли применительно к стратегическому планированию и прогнозированию [21]. Наиболее сильные результаты использования Big Data для распределенных торговых сетей на основе Darkstore показаны в работе [22].

Таким образом, направление применения обработки больших данных в задачах автоматизации бизнес планирования и прогнозирования получает в настоящее время широкое развитие, опирается на достижения в области обработки больших данных. Имеющиеся методики могут быть применены к построению прогноза спроса распределенных торговых сетей.

Самый быстрый рост наблюдается в сегменте распределенных сетевых торговых точек и дарксторов. Так, дарксторы растут и развиваются, сети развиваются, поставщиков появляется всё больше, растёт ассортимент. В таких условиях необходимость в оптимизации закупок становится постоянной. Напрашивающийся способ оптимизировать их работу - это автоматический заказ и прогнозирование спроса.

Задача максимальной автоматизации закупок распределенных торговых и складских сетей обычно сопрягается с требованием глубины и количества прогнозов. Так, если принять за прогнозную точку единицу спроса на товар, на одном дарксторе за один день, то потребуется построить прогноз по 2 миллионам точек с горизонтом прогнозирования шесть недель. Это более 87 миллионов прогнозов ежедневно. Справляться с этими объёмами возможно только выстраиванием автоматизированного процесса.

Задача может быть решена за счет анализа временных рядов, характеризующих динамику продаж на одной торговой точке, для которой возможно получить недельные средние значения. Основой является история продаж и предположение сохранения исторического тренда. Пример выделения среднего по продажам из анализа временных рядов больших данных показан на рис. 1.

Рис. 1. Пример построения двухнедельного среднего

На графике представлены восстановленные продажи, т.е. с учётом доступности товара. Предположением является то, что планируемые и исторические продажи являются регулярными.

Задача прогнозирования временных рядов. В зависимости от конкретной предметной области задача формулируется по-разному, но, как правило, звучит она так: имеются последовательные точки процесса в определённые моменты времени 1, нужно предсказать, где эти точки будут в последующие моменты времени, по возможности извлекая информацию из временной зависимости от 1

Базовые подходы к извлечению этой информации, как правило, строятся на разных скользящих статистиках и сглаживаниях. Обычно применяется модель Хольта-Винтерса. Туда же можно отнести выявление авторегрессионных и сезонных компонент - семейство алгоритмов ARIMA, SARIMA, SARIMAX и др. Пример математического выражения подходов на основе исторических данных можно показать в виде:

xt+1 = F(xo,...., xt) + H(yo, ym).

Задача прогнозирования на основе исторических данных усложняется тем, что обычно нужно учитывать множество разнородных данных. В этом случае появляются ограничения, связанные с тем, что многие программы не дают возможности прогнозирования факторов спроса без истории. Так, подобные задачи с трудом и медленно решаются в программе Prophet, также как и Neuroprophet, в котором затруднительно сохранять интерпретируемость для закупщиков и бизнеса. Есть ещё семейство подходов MCMC, которые позволяют строить прогноз даже без исторических данных. Однако эта платформа тяжело поддерживается и масштабируется.

Оптимальным могут стать методы классического машинного обучения, а именно: модели градиентного бу-стинга. Они позволяют получать достаточный прогноз по большой сети, легко масштабируются и учитывают много факторов.

Подход с применением градиентного бустинга

Градиентный бустинг - это ансамблевый метод, который объединяет в себе множество деревьев для создания более мощной модели. В отличие от случайного леса, градиентный бустинг строит последовательность деревьев, в которой каждое дерево пытается исправить ошибки предыдущего. В градиентном бустинге деревьев часто используются деревья небольшой глубины (от одного до пяти уровней), что делает модель меньше с точки зрения памяти и ускоряет вычисление прогнозов. Основная идея градиентного бустинга заключается в объединении множества простых моделей (деревьев небольшой глубины), каждое из которых может дать хорошие прогнозы только для части данных. Для итеративного улучшения качества добавляется всё большее количество деревьев.

Бустинг имеет ряд известных ограничений математической модели. Так, используя метод бустинга, нельзя сразу получить хороший прогноз на коротком временном ряду или на отсутствующей истории (пока ещё нет). Слабые экстраполирующие способности бустинга - это тоже проблема, потому что сеть и обороты будут расти и можно просто не успевать за растущим трендом. К тому же прерывистый временной ряд всегда является проблемой для прогнозирования.

Однако требования к сверхточному прогнозу не всегда оправданы. На самом деле бизнесу не нужен хороший прогноз по всей сети, бизнесу важен отличный прогноз по 5-10% самым маржинальным и самым важным для клиента товарам. Товары не равнозначны с точки зрения ошибки модели. Подходы к оценке бизнес-процессов с точки их маржинальности оказываются важнее, чем стремление удовлетворить всем условиям поставки и всех потребностей клиентов.

Задача решается нахождением правильной середины между перепрогнозом и недопрогнозом. Это позволяет понять, какие цены ошибок нужно назначать, в каком направлении и для каких товаров.

Ограничения прогнозирования

Новые товары. Первое очевидное препятствие на пути автоматизации - это прогнозирование того, о чём еще нет информации, в частности, это новые товары. Этот вопрос в случае градиентного бустинга довольно просто нивелируется количеством и многообразием факторов в данных (датасете). Важно добавить максимальное число факторов, которые не зависят от продаж товаров. Это категориальные признаки группы товаров: категории, подкатегории и их характеристики.

Также важно включать информацию о динамике продаж в категориях. Здесь исходят из того, что товары объединены в категории по некоторым общим свойствам, которые также могут отражать спрос на них. Поэтому если предполагается, что доминант в этих категориях нет, то спрос на новый товар будет стремиться к некоторому обобщённому спросу на усреднённый товар в категории. В целом это даёт уже неплохое приближение в случае, если продаж еще не было.

Если новый товар стартует с промо, это тоже обязательно нужно учесть в факторах, а также добавить информацию о ценовой категории, о средней цене в категориях и подкатегориях и о соотношениях между ними. В этом случае можно проводить усреднение и обобщение по товарным категориям. Тоже самое можно сделать и в том случае, если новых товаров много, либо торговая точка только открывается и нет статистики продаж. В этом случае можно использовать подход с метаинформацией, с характеристиками конкретной торговой точки, которые не зависят от продаж. В частности, можно использовать информацию о том, что это вообще за точка, как далеко она находится от центра, какая рядом плотность населения, какая у нее зона покрытия и пр.

Эти характеристики позволяют построить многомерное пространство признаков торговой точки и использовать метод K (ближайших соседей). Таким образом, можно найти K, наиболее похожих точек сети, и предположить, что спрос на них будет в целом походить на новую точку сети. Тогда в качестве прогноза можно использовать статистики продаж за последний период на реальных и самых похожих торговых точках сети.

Если ассортимент товаров от точки к точке сильно варьируется, и есть много товаров, по которым нет статистик, в том числе в наиболее похожих точках сети, то в этом случае можно использовать уже упомянутый подход с усреднением статистик в динамике категорий.

Очень часто бывает так, что новая точка сети открывается с переездом и отнимает часть зоны от уже существовавшей точки. Эта зона может занимать разный процент от территории к территории: от 1% до 99%. В этом случае задача решается чрез взятие имеющихся в базе данных других сопряженных точек сети. Если заранее можно перенести часть заказов из общей зоны к обоим точкам, то есть создать дубликаты заказов для ещё не открывшейся точки, то это можно принять за историю продаж для этого переезда ещё до начала прогнозирования.

Таким образом, появляется возможность совместить прогноз, построенный на реальных данных с "общей" территории точек сети, с усреднённым прогнозом от наиболее похожих соседей пропорционально долям этих территорий в зоне открывающейся точки сети. Этот вклад позволит дополнительно улучшить прогноз.

Заниженная доступность / уценка. Следующее препятствие - это баланс между перепрогнозированием и недопрогнозированием. Есть ловушка, в которую можно попасть, если смотреть только на сырые данные продаж. Предположим, что заказано мало товаров для точки сети, случилось недопрогнозирование, и товар быстро закончился. Таким образом, его купили не так много, как могли бы. Модель увидела низкие продажи, построила на этом заниженные статистики и снова даёт низкий прогноз. Налицо, порочный круг моделирования, рис. 2.

Рис. 2. Ловушка моделирования в прогнозе ЦФЗ - центр формирования заказов

Это называется «ловушка заниженной доступности». Для его исключения применяется преобразование под названием «восстановление спроса с учётом доступности».

Доступность - это очень важный фактор, который присутствует в любом ритейле; он отражает реальную причину того, почему продажи товара низкие. Либо на товар существует в действительности низкий спрос, и товар просто никто не хочет покупать; либо в торговой точке присутствует постоянный недостаток товара на полках. Это весьма нежелательная ситуация для бизнеса - выручка не максимизируется, и необходимо искусственно увеличить эти продажи.

На рис.3 показывается, как преобразуется линия фактических продаж с учётом доступности. Понятно, что если необходимо максимизировать выручку с точки, нужно стремиться к жёлтой линии, а не к розовой.

Продажи

Восстановленные продажи

ввввввввв^в

1 апр &апо И апр 16 апр 21 апр 26 апр 1 мая 6 мал 11 мая

III

1 апр б апр 11 апр 16 апр 21 апр 26 апр 1 мая 6 мая 11 мая

Рис.3. Преобразование линии фактических продаж с учетом доступности

При преобразовании функция должна быть подобрана достаточно аккуратно, потому что нельзя просто завысить продажи, так как они получатся слишком большими - такими, как никогда не могли бы быть в реальности. Поэтому в преобразованиях всегда добавляется информация о том, насколько изменены целевые показатели, насколько они достоверны в базе данных. В этом случае модель сможет взвешивать, в какой мере это истинный ответ, а в какой мере - ожидаемые целевые показатели бизнеса.

Есть также противоположная ловушка с перепрогнозами, рис.4. Так, в ритейле есть система автоуценки: если заказано слишком много, и срок годности товаров скоро истекает, то назначаются большие скидки автоматически. Это то, что можно видеть в блоке "Распродажа".

МАЛО ЗАКАЗАЛИ Е ЦФЗ

ЗАНИЖЕННЫЕ СТАТИСТИКИ О МОДЕЛИ

ЙЛ ИО-ГО ЗАКАЗАЛИ В ЦФЗ

НИЗШИЕ ВЫСОКИЕ высок иь

ПРОДАЖИ ПРОГНОЗЫ ПРОПАЖИ

ВЫСШИЕ ПРОДАЖИ И СТАТИСТИКИ

Рис.4. Ловушка "скидок" в модели

Модель здесь может попасть в ловушку "Люди любят большие скидки, люди покупают много товара". Однако, бизнес при этом недополучает. Модель видит большие продажи и строит завышенные статистики.

Выход из этой ловушки получается чуть более техническим. В частности, просто исключается преобразование данных. В системе хранения данных обязательно должен быть однозначный источник скидки, который отражает, насколько эта продажа соответствует запланированному процессу. Важно показывать модели те целевые данные и такое поведение, где доступность составит порядка 90-100%. Для них используются исключительно запланированные промоакции.

Плохая экстраполяция и нечувствительность к трендам. Большая часть моделей машинного обучения построена таким образом, чтобы обобщать и интерполировать, а не экстраполировать. В частности, если рассматриваются деревья решений, то кусочно-линейное приближение с постоянным ответом в областях разбиения закономерно не помогает приближаться к ответу вне примеров обучающей выборки. В случае с прогнозом спроса, когда целевой таргет неотрицательный, это ещё значит, что модель будет склонна недопрогнозировать.

На практике существует три способа этого избежать. Первый способ - это логистика. Всегда должны быть страховые запасы. Они позволяют не сильно обращать внимание на ошибку с товарами с низким оборотом -всегда есть какой-то минимальный запас, который хранится на торговой точке. Но при этом в случае со скоропортящимися товарами и высокооборотистыми товарами страховые запасы довольно сильно влияют на доступность и на другие бизнес-показатели. Поэтому нужно как можно глубже интегрировать эти данные в прогноз. Второй способ -несимметричные лоссы. Если проводить штрафование модели за недопрогноз больше (потому что бизнесу, как правило, недопрогнозы обходятся дороже, чем перепрогнозы), то модель будет больше обращать внимания на недопро-гнозы - результаты улучшатся, бизнес удовлетворится. Третий способ, очевидно, самый эффективный - это дополнительный модуль управления уже готовым прогнозом.

Дополнительный модуль управления готовым прогнозом. Этапы построения прогноза включают: построение модуля статистических корректировок, чтобы напрямую влиять на экстраполирующие свойства градиентного бустинга и подталкивать модель. Статистический блок рассматривает последние сформированные прогнозы, исторические продажи за последний период и строит распределение ошибок, рис.5

Рис. 5. Построение распределения ошибок в прогнозе

Алгоритм прогноза с корректировкой показан на рис.6.

■ ПРЕДЫДУЩИЕ ПРОГНОЗЫ МОДЕЛИ Ч,

■ *

ИСТОРИЧЕСКИЕ ПРОДАЖИ illl + AS _\ СКОРЕКТИРОВАННЫЙ ПРОГНОЗ

р\ РАСПРЕДЕЛЕНИЕ ДЕТЕКЦИЯ ТРЕНДА ОШИБКИ ПРОГНОЗА

ПОСЛЕДНИЙ ПРОГНОЗ / /

Рис. 6. Алгоритм прогноза с корректировкой

Если видно, что ошибки сохраняют знак на протяжении длительного времени, и если они увеличиваются в абсолюте, то добавляется смещение. Смещение, естественно, вычислено в зависимости от направления ошибки и в зависимости от её величины. Также можно использовать детектор тренда. Это могут быть разные математические инструменты его обнаружения. В данном случае применимы базовые линейные подходы. Если видно определенный тренд, то также можно добавить смещение. В итоге получается более корректный прогноз и ускоренная реакция модели на изменение поведения временного ряда. Примеры таких прогнозов приведены на рис. 7.

Рис. 7. Пример прогноза с корректировкой

192

Если сохраняется ошибка, постоянная по направлению, или детектирован тренд (ряд снизу), то добавляется смещение к готовому прогнозу. На примере с перепрогнозом (сверху) видно, что спрос снижается, в то время как исходный прогноз остаётся на прежнем уровне, корректировки улучшают ситуацию.

Таким образом, решение задачи может быть основано на методике, включающем бустинг, который учится на хорошем таргете - преобразованном или исключённом, дополнительный модуль, добавляющий смещение к нашему прогнозу, чтобы модель реагировала оперативнее и лучше экстраполировала, а также рекомендуется включать дополнительный блок с ЬМЫ", позволяющий получать прогнозы на новых точках сети.

Выбросы и шумы. Выбросы и шумы - это пики продаж любые ошибки и внешние обстоятельства.

Масло подсолнечное, 1 л

3 мар 9 мар 15мар 21 мар 27 мар 2апр 6 агр 14 апр 20 апр 26апр 2 мая 8 ман 14 мая

Вода негазированная, 250 мл г'л ^ ! 35 шт

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А , , Ц/1 , Л

1 А Л Л к к К Л1\1У\ Л/1

ДА и г ХГАлгУ ЛЛ/ _ ' /у

УТ. 2ШТ у и Ч

10 кар 16 мар 22 мар 28 мар Эапр 9 апр 15 апр 21 апр 27 апр Э мая 9 мая

Рис.8. Выбросы и шумы в данных при прогнозировании

На рис.9 представлен временной ряд с выбросами. Так, видно, что при обычных колебаниях продаж в пределах 20 штук ежедневно внезапно появляются выбросы больше 60, и даже больше 150 штук в день. В нижнем ряду - пример волатильного временного ряда. Помимо зашумлённых рядов есть суперволатильные временные ряды, где подневные продажи варьируются от 2 до 35 штук, что тоже довольно неприятно. Причиной исчезновения товара может служить разнообразные причины: внезапный вывод товара из ассортимента, разрыв отношений с поставщиком, массовое разочарование в продукте и пр.

Чипсы классические, 42 г

1 1

1 1 I И

И 1 1 Не. I

май 2021 июн 2021 авг 2021 окт 2021 дек 2021 ныв 2022 мар 2022 май 2022

1/\ А

^^-ДЦ.Ь--

Сахар белый» 1 кг

3 мар 10 мар 17 мар 24 мар 31 мар 7 апр 14 апр 21 апр 28 апр 5 мая

Рис. 9. Виды выбросов

В верхнем ряду временное прекращение поставок делает характер спроса гораздо более прерывистым, чем это есть в действительности - получается сильный недопрогноз. Внизу пример того, что в юридической литературе называется внешними обстоятельствами непреодолимой силы.

Скорее всего, решение каждой этой проблемы потребует построения системы, по сложности и громоздкости сравнимой со всей остальной архитектурой прогноза. В частности, если имеется детектор аномалий, то можно "скрывать" эти всплески от модели. В этом случае временная дестабилизация временного ряда не исказит все последующие прогнозы. Решение также будет найдено, если в модель будут зашиты разные виды сглаживания - либо исторических продаж, либо прогнозов и пр. Ставка при этом делается на сходимость сумм продаж и прогнозов в среднем и прогнозировании волатильных рядов с помощью агрегаций. Также решение есть, если есть механизм исключения подозрительных пробелов из данных. В представленном случае работает исключение данных с нулевой доступностью для построения статистик. Также, если вшит механизм учёта сезонности товара, то резкое повышение спроса или снижение спроса не будет сюрпризом.

Таким образом, были перечислены инструменты того, чтобы градиентный бустинг более или менее хорошо работал.

Алгоритм разработки модели. Общая схема прогноза на основе данных выглядит следующим образом: имеющиеся данные отдаются в модель, модель выдаёт адекватный прогноз. На практике нужно очень много данных, очень разных, из разных источников, а ещё должна быть разработана логика преобразования таргета. При этом должен добавляться модуль с кластерным анализом и с ЬМЫ", чтобы получать прогноз по новым товарам и для новых торговых точек в сети. Далее, поскольку прогноз все еще не идеален, то необходимо добавить модуль статистиче-

ских корректировок, чтобы подталкивать его в нужном направлении изменения спроса. В связи с этим добавляется еще детектор тренда, чтобы корректировать прогноз ещё лучше. При необходимости должны рассматриваться и другие инструменты обработки данных. Общая схема прогноза тогда будет выглядеть по рис. 10.

.||| + а/

РАСПРЕДЕЛЕНИЕ ДЕТЕКЦИЯ

ОШИБКИ ПРОГНОЗА ТРЕНДА

ПРОГНОЗЫ ПОХОЖИ* ДАРКСТОРОВ

КЛАСТЕРНЫЙ АНАЛИЗ

Рис. 10. Алгоритм разработки модели

Таким образом, разработанная схема архитектуры прогноза способна решать гораздо больше задач, чем просто прогнозирование числа проданных товаров в торговых точках. Этот факт может остаться незамеченным при стандартной методике подсчёта ошибок прогноза, но достаточно сильно при этом влияет на бизнес-показатели и сказывается на бизнесе.

Переход от простого прогноза спроса к интеллектуальной системе прогнозирования. Как видно из построенной методики переход от простого прогноза спроса к интеллектуальной системе прогнозирования может быть проведен в определенной последовательности, образующей методику.

Для этого важно изначально понимать суть бизнес-задачи. Это позволит от исходной схемы, где есть только данные, модель и прогноз с простой установкой: «прогнозируем все товары на всех точках сети», прийти к более детальной задаче о построении полноценной интеллектуальной системы.

Чтобы эта система максимизировала выручку, нужно пройти четыре этапа:

1. Хорошо отфильтровать данные. Необходимо провести фильтрацию данных и провести изначальный препроцессинг.

2. Построить упрощённые подходы для новых товаров.

3. Восстановить спрос, преобразовав таргет там, где это необходимо.

4. Помочь деревьям экстраполировать и улавливать тренды. Необходимо подталкивать модель там, где она недотягивает.

Таким образом, появляется в дальнейшем возможности создавать и более точные бизнес-метрики, включающем прогноз спроса и организации закупок. Разработанные схемы в дальнейшем позволят моделировать механику промо-акций, эластичность спроса по различным факторам, проанализировать эффекты перетекания спроса и каннибализации продуктов.

Список литературы

1. Чечнева Ю.В. Интегрированная модель процесса планирования и прогнозирования налоговых поступлений // Актуальные проблемы гуманитарных и естественных наук. 2013. № 10-1. С. 259-263.

2. Акимов В.И., Полуказаков А.В., Наливайко И.А. Разработка интегрированной системы моделирования в задачах автоматизации производственных процессов // Информационные технологии в строительных, социальных и экономических системах. 2019. № 1 (15). С. 127-130.

3. Жеварина А.В. Цифровые платформы как инструменты прогнозирования и планирования в менеджменте предприятий авторитейла // Вестник факультета управления СПбГЭУ. 2021. № 10. С. 38-41.

4. Епишкина А.Д., Горшков К.А., Орлов М.В. Разработка системы автоматизации процесса планирования и контроля реализации инвестиционных проектов // Современные наукоемкие технологии. 2023. № 12-1. С. 26-32.

5. Князев А.В., Черемухина Ю.Ю. Применение системы мониторинга и прогнозирования в автоматизации процесса разработки документооборота в области стандартизации // Известия Тульского государственного университета. Технические науки. 2024. № 1. С. 258-267.

6. Назаревич С.А. Автоматизация процессов прогнозирования и развития сложных технических систем // Автоматизация и моделирование в проектировании и управлении. 2019. № 1 (3). С. 29-33.

7. Бушуева Л.И., Афанасьев В.Б. Оценка состояния автоматизации информационной системы планирования и контроля показателей бизнес-процессов в организации // Корпоративное управление и инновационное развитие экономики Севера: Вестник Научно-исследовательского центра корпоративного права, управления и венчурного инвестирования Сыктывкарского государственного университета. 2023. Т. 3. № 4. С. 484-496.

8. Андрианов Д., Ивлиев С., Максимов В. Платформа стратегического планирования и прогнозирования // Открытые системы. СУБД. 2013. № 10. С. 38-39.

9. Васильев Н.В., Яшин А.И., Довжиков С.Н. Интегрированная платформа анализа и исполнения блочно-структурированных бизнес-процессов // Техника средств связи. 2021. № 3 (155). С. 79-90.

10. Ожгибесов О.А., Соболева Е.В. Использование скрипта в MSvisual Basic для применения в автоматизации рабочих процессов интегрированного моделирования // Проблемы разработки месторождений углеводородных и рудных полезных ископаемых. 2020. Т. 2. С. 307-313.

11. Панов П.Р. Автоматизация бизнес-процессов на платформе 1С-Предприятие // Тенденции развития науки и образования. 2023. № 97-7. С. 152-154.

12. Баранова Е.М., Баранов А.Н., Кулешова Н.В., Бурцев Д.С. Современные интегрированные платформы для работы с системами управления базами данных // Известия Тульского государственного университета. Технические науки. 2023. № 12. С. 495-497.

13. Жукова И.В. Цифровая платформа как единое интегрированное пространство системы управления в сфере недропользования // Тенденции развития науки и образования. 2017. № 33-2. С. 5-8.

14. Мирошниченко М.А., Балбекова А.В., Крыловской Н.А. Разработка модели интегрированной интеллектуальной системы государственного учреждения на платформе облачных технологий // Вестник Академии знаний. 2022. № 48 (1). С. 203-210.

15. Стенников В.А., Барахтенко Е.А., Соколов Д.В., Майоров Г.С. Методический подход к построению программной платформы для управления развитием интегрированных энергетических систем // Информационные и математические технологии в науке и управлении. 2022. № 4 (28). С. 19-31.

16. Бричеева Н.Н. Комплексная методика автоматизации стратегического планирования на основе интеграции системы сбалансированных показателей системы управления бизнес-процессами // Известия ЮФУ. Технические науки. 2010. № 4 (105). С. 63-70.

17. Балашов О.В., Букачев Д.С. Искусственный интеллект в автоматизации процессов планирования и оперативного управления // Международный журнал информационных технологий и энергоэффективности. 2022. Т. 7. № 1 (23). С. 25-30.

18. Веклова Е.В. Автоматизация и программное обеспечение функционирования интегрированных систем маркетинговой информации // Современные тенденции развития науки и технологий. 2015. № 4-5. С. 36-41.

19. Калачев В.А., Овчаренко О.И. Выбор программного инструментария для автоматизации процессов бизнес-планирования // Известия ТРТУ. 2004. № 3 (38). С. 144-149.

20. Староверова О.В., Кафизова Р.И. Функциональные возможности системы интегрированного бизнес-планирования SAP IBP // Управление в России: проблемы и перспективы. 2019. № 2. С. 35-41.

21. Подгорнов В.В. Подходы к управлению информацией в современных интегрированных системах и их значение на этапах стратегического планирования // Вестник Казанского государственного аграрного университета. 2011. Т. 6. № 4 (22). С. 57-60.

22. Мария Суртаева. Как построить прогноз спроса и не потерять голову. [Электронный ресурс] URL: https://habr.com/ru/companies/samokat tech/articles/698118 (дата доступа: 03.05.2024).

Горобченко Станислав Львович, канд. техн. наук, sgorobchenko@yandex. ru, Россия, Санкт-Петербург, Санкт-Петербургский государственный университет промышленных технологий и дизайна,

Ковалёв Дмитрий Александрович, канд. техн. наук, доцент, [email protected], Россия, Санкт-Петербург, Санкт-Петербургский государственный университет промышленных технологий и дизайна,

Войнаш Сергей Александрович, младший научный сотрудник научно-исследовательской лаборатории, sergey_voi@mail. ru, Россия, Казань, Казанский федеральный университет,

Тарабан Мария Всеволодовна, канд. техн. наук, доцент, [email protected], Россия, Санкт-Петербург, Санкт-Петербургский государственный архитектурно-строительный университет,

Теппоев Алексей Викторович, канд. техн. наук, доцент, avt01@inbox. ru, Россия, Санкт-Петербург, Санкт-Петербургский государственный лесотехнический университет имени С.М. Кирова

METHODS AND PROBLEMS OF FORECASTING THE DEMAND OF DISTRIBUTED RETAIL CHAINS BASED ON BIG DATA

S.L. Gorobchenko, D.A. Kovalev, S.A. Voinash, M. V. Taraban, A. V. Teppoev

The problems and methods of forecasting the demand of distributed retail chains based on Big Data are considered. It is shown that significant difficulties arise when forecasting demand and replenishing stocks at remote points of the retail network. Time series analysis methods, especially gradient boosting, can be used to solve forecasting problems. At the same time, the task of forecasting time series in distributed retail has its own characteristics. Data changes have to be taken into account when introducing new products, introducing a markdown system, product availability, marketing campaigns, as well as problems inherent in processing data from such networks (inability to sufficiently extrapolate, incorrect trend sensitivity indicators, emissions and noise). A refined data correction algorithm is presented to improve the accuracy of the forecast.

Key words: Big Data, distributed retail networks, retail outlets, demand forecast, gradient boosting, methodology and problems.

Gorobchenko Stanislav Lvovich, candidate of technical sciences, sgorobchenko@yandex. ru, Russia, St. Petersburg, St. Petersburg State University of Industrial Technologies and Design,

Kovalev Dmitry Aleksandrovich, candidate of technical sciences, docent, [email protected], Russia, St. Petersburg, St. Petersburg State University of Industrial Technologies and Design,

Voinash Sergey Aleksandrovich, junior researcher at the research laboratory, [email protected], Russia, Kazan, Kazan Federal University,

Taraban Maria Vsevolodovna, candidate of technical sciences, docent, arcan65@mail. ru, Russia, St. Petersburg, St. Petersburg State University of Architecture and Civil Engineering,

Teppoev Alexey Viktorovich, candidate of technical sciences, docent, avt01@inbox. ru, Russia, St. Petersburg, St. Petersburg State Forest Technical University named after S.M. Kirov

УДК 65.011.42

DOI: 10.24412/2071-6168-2024-4-196-197

«НОУ-ХАУ» И ЗАЩИТА НАУЧНО-ТЕХНИЧЕСКИХ ДОСТИЖЕНИЙ

Ю.А. Щепочкина, С.А. Войнаш, Р.Р. Загидуллин, В.А. Соколова, А.А. Ореховская

В традиционном понимании «ноу-хау» - это конструктивные, технологические секреты производства, имеющие промышленную и коммерческую ценность. «Ноу-хау» может быть реализовано путем внедрения его в собственное производство, вклада в новое предприятие (как уставной капитал) или передачи (продажи) ее для внедрения другому лицу. Определенную помощь при отборе, оценке информации о «ноу-хау», принятии решений, может оказать приведенная матрица. Возможно формирование электронных банков данных, содержащих рекламную информацию о «ноу-хау». Использование «ноу-хау» наряду с изобретениями позволяет заметно повысить шанс выживания и укрепления малого бизнеса.

Ключевые слова: «ноу-хау», внедрение, отбор, искусственный интеллект.

В последние годы особенно активно начал использоваться термин «ноу-хау». Смысловой перевод этого английского выражения (know how) буквально означает «знать, как сделать». При этом суть разработки «закрыта», то есть сохраняется в тайне.

Напротив, название «патент», происходящее от латинского названия (litterae patentes) в буквальном переводе означает «открытая грамота». Патент является документом, раскрывающим разработку (изобретение) и защищающим таким путем права его владельца. Отметим, что количество изобретений в мире увеличивается [1, 2].

Под «ноу-хау» обычно понимают коммерческую тайну, которая касается технических объектов, не защищенных как объекты промышленной собственности. Иногда имеют ввиду экономические сведения, правовые знания, управленческие приемы и другое.

В традиционном понимании «ноу-хау» - это научно-технические достижения, конструктивные, технологические секреты производства, имеющие промышленную и коммерческую ценность. Обладатель «ноу-хау» может реализовать разработку путем внедрения ее в собственное производство, вклада в новое предприятие (как уставной капитал) или передачи (продажи) ее для внедрения другому лицу, например, на основе опционного договора. Под термином «внедрение» здесь понимается процесс нововведения, то есть доведения «ноу-хау» до социально-экономического результата. Наиболее безопасен и предпочтителен первый вариант реализации «ноу-хау» в собственном производстве, а последний вариант является рискованным как для продавца, так и для покупателя «ноу-хау». Продавец рискует, раскрывая информацию, надеясь на добросовестность покупателя, а покупатель рискует, не имея полного представления о разработке и возможности ее эффективного использования.

Поскольку право защиты в отношении «ноу-хау» предоставляется только на условиях сохранения сведений о нем в тайне, четко определится с ценностью предлагаемого научно-технического достижения весьма затруднительно. Прежде всего, надо обратить внимание на принцип технологичности - разработка должна быть такой, чтобы ее можно было реализовать при помощи существующих, имеющихся в наличии средств производства. В случае работы с «ноу-хау» необходимо убедиться в отсутствии сведений о разработке у третьих лиц. Возможно, уже кто-то раньше проявлял интерес, и, например, нарушил условия опционного договора либо приобрел информацию незаконным путем. Известно, что используя «ноу-хау», некоторые предприятия (фирмы) опережают по уровню техники своих конкурентов на 5-10 и более лет. При этом надо иметь ввиду, что любая работа с «ноу-хау» связана с риском. Право защиты «ноу-хау» предоставляется на условиях сохранения сведений о новшестве в тайне. Таким образом, разработка имеет ценность действительную или потенциальную только при отсутствии сведений о ней у третьих лиц. Следовательно, принимаются все меры к охране конфиденциальности разработки.

Что конкретно нужно для того, чтобы облегчить внедрение «ноу-хау» в производство? Возможно, это меры по поддержанию инновационных разработок, включая наличие финансовых механизмов, позволяющих минимизировать риск при создании новой техники, новой технологии; выход на низкие кредитные ставки или на полное государственное субсидирование «ноу-хау» и первичного этапа освоения новой продукции; наличие структур, способных защитить промышленную собственность.

Определенную помощь при отборе, оценке «ноу-хау», принятии решений, может оказать предлагаемая нами матрица [3], табл.1.

Сейчас поступает очень много разнообразной информации о возможностях искусственного интеллекта. Сразу отметим, что надеяться на помощь искусственного интеллекта на пути к новым научно-техническим достижениям, при создании новых разработок не стоит, а вот в поиске и отборе нужных источников технической информации (в том числе, рекламной о «ноу-хау») он может быть полезен.

Напомним, что искусственный интеллект - научное направление, появившееся в середине 60-х годов прошлого века. В это время в Шотландии собрался коллектив исследователей (А. Тьюринг, Д. фон Нейман, Д. Мичи и др.), образовавших ядро школы в области интеллектуальных технологий, которая получила название эдинбургской. С 1967 г. стали выходить международные сборники Machine Intelligence, отражавшие развитие этого

i Надоели баннеры? Вы всегда можете отключить рекламу.