Научная статья на тему 'Процесс моделирования спроса на товары с использованием алгоритмов машинного обучения'

Процесс моделирования спроса на товары с использованием алгоритмов машинного обучения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
59
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
линейная регрессия / прогнозирование спроса / анализ данных / электронная коммерция / зависимость переменных / машинное обучение / эффективность моделирования. / linear regression / demand forecasting / data analysis / e-commerce / variable dependence / machine learning / modeling efficiency.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Камилов Мирзаян Мирзаахмедович, Худайбердиев Мирзаакбар Хаккулмирзаевич, Алимжанова Ойимбуш Собиржон Кизи

В данной статье исследуется процесс моделирования спроса на товары с применением методов машинного обучения. Каждый метод оценивается по точности прогноза, способности адаптироваться к изменениям на рынке и времени обучения. Целью исследования является определение наиболее эффективного метода для прогнозирования спроса на товары.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Камилов Мирзаян Мирзаахмедович, Худайбердиев Мирзаакбар Хаккулмирзаевич, Алимжанова Ойимбуш Собиржон Кизи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The process of modeling demand for goods using machine learning algorithms

This paper examines the process of modeling product demand using machine learning methods. Each method is evaluated based on forecast accuracy, ability to adapt to market changes, and training time. The goal of the study is to determine the most effective method for forecasting product demand.

Текст научной работы на тему «Процесс моделирования спроса на товары с использованием алгоритмов машинного обучения»

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year

Электронный научный журнал "'Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год

Процесс моделирования спроса на товары с использованием алгоритмов машинного

обучения

I

Введение

С учетом современных технологических изменений и эволюции потребительского поведения, электронная коммерция становится важным элементом современного бизнеса. Прогнозирование спроса входит в стратегическое планирование компаний, позволяя им адаптироваться к динамике потребительских предпочтений, оптимизировать запасы и повышать уровень обслуживания клиентов. В свете стремительного развития рынка электронной коммерции в Узбекистане и быстро меняющихся потребительских предпочтений, эффективное управление спросом на продукты питания становится более актуальным, чем когда-либо. Прогнозирование спроса является ключевым элементом успеха в данной отрасли. Научные исследования в этой области играют важную роль в оптимизации управления ресурсами и обеспечении качественного обслуживания на

Камилов Мирзаян Мирзаахмедович,

академик, д.т.н., профессор, Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта

Худайбердиев Мирзаакбар Хаккулмирзаевич

д.т.н., профессор, Ташкентский университет информационных технологий имени Мухаммада

ал-Хоразмий

Алимжанова Ойимбуш Собиржон кизи

магистрант Ташкентский университет информационных технологий имени Мухаммада

ал-Хоразмий

рынке продуктов питания. В данной статье проводится анализ различных методов прогнозирования спроса на товары в Узбекистане. Исследование основано на данных о покупательском поведении, ценообразовании, сезонных колебаниях и других факторах, влияющих на выбор продуктов. Методы машинного обучения такие как случайный лес, линейная регрессия, нейронные сети и алгоритм Байеса подробно рассматриваются в контексте их применимости и эффективности для Узбекистана. Каждый метод подвергается сравнительному анализу по точности прогноза, способности адаптироваться к изменениям на рынке и времени обучения.

Актуальность данного исследования для узбекского рынка обусловлена несколькими факторами. Современные рыночные условия характеризуются высокой динамикой спроса и предложения, что создает вызовы для бизнеса в

Аннотация: В данной статье исследуется процесс моделирования спроса на товары с применением методов машинного обучения. Каждый метод оценивается по точности прогноза, способности адаптироваться к изменениям на рынке и времени обучения. Целью исследования является определение наиболее эффективного метода для прогнозирования спроса на товары.

Ключевые слова: линейная регрессия, прогнозирование спроса, анализ данных, электронная коммерция, зависимость переменных, машинное обучение, эффективность моделирования.

249

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год

плане оптимизации производства, управления запасами и маркетинга. Узбекистан, переживающий период интенсивных социально-экономических изменений, сталкивается с быстрым ростом населения, увеличением уровня доходов и изменениями в потребительском поведении. Внедрение современных технологий, таких как электронная коммерция и цифровые платформы, обогащает данные о покупательском поведении, предоставляя возможности для применения методов анализа больших данных и искусственного интеллекта. Это требует глубокого исследования эффективности этих методов в контексте Узбекистана.

Методология

Разработка обучаемой системы для сравнения которая, проанализировав данные введенные в виде таблицы, сможет спрогнозировать возможное количество товара которое будет продано в следующий период времени (от 1 до 10 месяцев), опираясь на данные . В исследовании спроса были выбраны 3 основные категории размер одежды, пол и возраст покупателей. Основной метод, применяемый для предсказания спроса, построение линейной модели. В качестве исходных данных для построения модели для предсказания возможной потребности на определенный товар, были использованы данные за двенадцать месяцев. Данные были взяты с сайта: https://www.kaggle.com ввиде электронной таблицы в формат CSV (рис.1)

Для предсказания воспользуемся моделью сравнения данных основанных на 4 алгоритмах машинного обучения: Случайный лес, Алгоритм Байеса, Линейная регрессия и Нейронные сети. В качестве зависимой переменной будет количество проданных единиц, а независимыми переменными будут размер одежды, пол и возраст покупателей, т.е. item.Gender === 'Male' ? 0 : 1 // Пример кодирования категориальной переменной

// Разделение данных на признаки (X) и целевую переменную (у)

const X = numericData.map(item => [ sizeClothesHandler(item.Size), +item.Age,

item.Gender ]);

const y = numericData.map(item => +item['Purchase Amount']); setXvalue(X); setYvalue(y); };

reader.readAsBinaryString(event.target.files[0

]); };

О А В С В E F G H I

Customer ID Аде Sender item Purchased Category Purchase Amount Location Size Color

1 55 Male Blouse Clothing 53 Kentucky L Gray

г 19 Male Sweater Clothing 64 Maine L Maroon

3 50 Male Jeans Clothing 73 Massachusetts S Maroon

4 21 Male Sandals Footwear 90 Rhode Island M Maroon

5 45 Male Blouse Clothing 49 Oregon M Turquoise

е 46 Male Sneakers Footwear 20 Wyoming M While

7 63 Male Shirt Clothing B5 Montana M Gray

в 27 Male Shorts Clothing 34 Louisiana L Charcoal

9 26 Male Coat Outerwear 97 West Virginia L Silver

10 57 Male Handbag Accessories 31 Missouh M Pink

11 53 Male Shoes Footwear 34 Arkansas L Purple

12 30 Male Shorts Clothing № Hawaii S Olive

11 61 Male Coat Outerwear 72 Delaware M Gold

14 65 Male Dress Clothing 51 New Hampshire M Violet

1S 64 Male Coat Outerwear 53 New York L Teal

16 64 Male Skirt Clothing B1 Rhode Island M Teal

17 25 Male Sunglasses Accessories 36 Alabama S Gray

1Î 53 Male Dress Clothing 36 Mississippi XL Lavender

19 52 Male Sweater Clothing 48 Montana S Black

2D 66 Male Parts Clothing 90 Rhode Island M Green

21 21 Male Pants Clothing 51 Louisiana M Black

22 31 Male Parts Clothing 62 North Carolina M Charcoal

21 56 Male Parts Clothing 37 California M Peach

24 31 Male Parts Clothing 88 Oklahoma XL White

25 13 Male Jacket Outerwear 22 Florida M Green

25 18 Male Hoodie Clothing 25 Texas M Silver

27 38 Male Jewelry Accessories 20 Nevada M Red

20 56 Male Shorts Clothing 56 Kentucky L Cyan

2» 54 Male Handbag Accessories 94 North Carolina M Gray

30 31 Male Dress Clothing 46 Wyoming s Black

31 57 Male Jewelry Accessories 31 North Carolina L Black

32 33 Male Dress Clothing 79 West Virginia L Brown

33 36 Male Jacket Outerwear 57 Kansas M Silver

34 54 Male Pants Clothing 36 Cctorado L Green

3D 36 Male T-shirt Clothing 91 North Dakota L Violet

36 54 Male Blouse Clothing 33 Massachusetts M Cyan

Я 35 Male T-shirt Clothing 59 Illinois M Maroon

3t 35 Male Jeans Clothing 45 Indiana s Cyan

39 29 Male Dress Clothing 37 Florida M Red

« 70 Male Parts Clothing 60 Arizona S Turquoise

Рис. 1. Фрагмент исходной таблицы.

Для предсказания воспользуемся моделью сравнения данных основанных на 4 алгоритмах машинного обучения: Случайный лес, Алгоритм

250

"Descendants of Al-Farghani" electronic scientific Электронный научный журнал "Потомки Аль-

journal of Fergana branch of TATU named after Фаргани" Ферганского филиала ТАТУ имени

Muhammad al-Khorazmi. ISSN 2181-4252 Мухаммада аль-Хоразми ISSN 2181-4252

Vol: 1 | Iss: 2 | 2024 year Том: 1 | Выпуск: 2 | 2024 год

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

Байеса, Линейная регрессия и Нейронные сети. В качестве зависимой переменной будет количество проданных единиц, а независимыми переменными будут размер одежды, пол и возраст покупателей, т.е. item.Gender === 'Male' ? 0 : 1 // Пример кодирования категориальной переменной

// Разделение данных на признаки (X) и целевую переменную (у)

const X = numericData.map(item => [ sizeClothesHandler(item.Size), +item.Age,

item.Gender ]);

const y = numericData.map(item => +item['Purchase Amount']); setXvalue(X); setYvalue(y); };

reader.readAsBinaryString(event.target.files[0

]); };

Для проведения сравнительного анализа мы использовали набор данных о продажах, характеристиках товаров и истории спроса.

1. Случайный лес (Random Forest). Случайный лес является ансамблевым методом, объединяющим несколько деревьев решений для улучшения качества прогноза. Он подходит для работы с большими объемами данных и автоматически обрабатывает отбор признаков. Случайный лес (Random Forest) - это ансамблевый метод машинного обучения, который состоит из множества деревьев решений. Он работает путем построения множества деревьев решений во время обучения и выводит среднее предсказание отдельных деревьев для получения окончательного предсказания. Процесс работы случайного леса основан на предсказание с помощью обученной модели. Здесь

newDemandPrediction содержит

предсказания для каждого элемента входного массива, а setPredictForestData используется для сохранения

предсказанных значений. Важно отметить, что параметры numTrees (количество деревьев) и maxFeatures (максимальное

количество признаков для каждого дерева) могут быть настроены для улучшения производительности модели в зависимости от конкретной задачи.

2. Линейная регрессия. Линейная регрессия используется для моделирования зависимости между зависимой переменной (спросом на товары) и набором независимых переменных (характеристиками товаров). В нашем исследовании линейная регрессия использовалась как базовый метод для сравнения с другими алгоритмами. Линейная регрессия является методом обучения с учителем, который использует размеченные данные для обучения модели и последующего прогнозирования новых данных. Она применяется для предсказания вещественной переменной, стремясь моделировать линейную зависимость от признаков. Другими словами, она пытается найти зависимости между переменными, где одна переменная (зависимая) зависит от других переменных (независимых). Для построения модели линейной регрессии мы используем библиотеку scikit-learn (sklearn). Для этого импортируем соответствующий класс LinearRegression из модуля linear_model и создаем экземпляр этого класса - модель, которую мы затем обучаем. Для обучения модели в scikit-learn используется метод fit, который является стандартным интерфейсом для большинства методов обучения с учителем в этой библиотеке.

3. Нейронные сети. Нейронные сети представляют собой модель, вдохновленную работой человеческого мозга. Они способны обрабатывать сложные нелинейные зависимости в данных, что делает их мощным инструментом для прогнозирования спроса на товары. Для обучения нейронной сети используются исторические данные о

251

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year

Электронный научный журнал "Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год

продажах и характеристиках товаров. В процессе обучения нейронная сеть корректирует свои веса и параметры, чтобы минимизировать ошибку прогнозирования. Это позволяет ей находить скрытые закономерности в данных и делать более точные прогнозы. Например, если нейронная сеть обнаруживает, что товары определенного размера и цвета пользуются большим спросом у молодежи определенного пола, она может использовать эту информацию для предсказания спроса на аналогичные товары в будущем.После обучения нейронная сеть может быть использована для прогнозирования спроса на товары на основе новых данных о характеристиках товаров. Это помогает компаниям оптимизировать свои запасы, улучшить обслуживание клиентов и адаптироваться к изменениям на рынке. Одним из главных преимуществ использования нейронных сетей для прогнозирования спроса на товары является их способность работать с большими объемами данных и обнаруживать сложные зависимости между различными характеристиками товаров и спросом на них. Это позволяет делать более точные прогнозы и улучшать стратегии управления запасами и маркетинга. Таким образом, нейронные сети представляют собой мощный инструмент для прогнозирования спроса на товары, который помогает компаниям быть более эффективными и конкурентоспособными на рынке.

4. Алгоритм Байеса. Алгоритм Байеса основан на принципе байесовской статистики и используется для оценки вероятности событий. В контексте прогнозирования спроса на товары алгоритм Байеса может использоваться для учета неопределенности и изменчивости в данных. Алгоритм Байеса

- это метод статистического моделирования, основанный на теореме Байеса, который используется для оценки вероятности событий и принятия решений в условиях неопределенности. В контексте

прогнозирования спроса на товары, алгоритм Байеса может быть использован для учета неопределенности и изменчивости в данных, что позволяет делать более точные прогнозы. Алгоритм Байеса работает на основе апостериорной вероятности, которая вычисляется на основе априорной вероятности и данных об условной вероятности. Он использует информацию о предшествующих событиях и предположениях для оценки вероятности будущих событий. Для прогнозирования спроса на товары с использованием алгоритма Байеса, мы можем использовать исторические данные о продажах и характеристиках товаров для оценки вероятности спроса на основе предшествующих паттернов и тенденций. Например, если определенный товар обычно пользуется большим спросом в определенное время года или при определенных условиях рынка, алгоритм Байеса может учесть эту информацию при прогнозировании будущего спроса на этот товар. Преимуществом алгоритма Байеса является его способность учитывать неопределенность и изменчивость в данных, что позволяет делать более робастные прогнозы в условиях переменчивости рынка. Он также может быть эффективным инструментом для принятия решений в условиях ограниченной информации или

неопределенности.

Результаты

По результатам наших экспериментов линейная регрессия показала наилучшие результаты среди всех рассмотренных методов.

252

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year

Электронный научный журнал "'Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год

Она продемонстрировала высокую точность прогнозирования и низкую степень ошибки. В частности, линейная регрессия позволяет достичь значительно более точных прогнозов спроса на товары по сравнению с другими методами. Линейная регрессия часто считается эффективным методом для прогнозирования спроса на товары из-за своей простоты и интерпретируемости. На основе примера выше изученных данных, есть данные о продажах конкретного товара за последние несколько месяцев, а также данные о его цене за тот же период. В построенной модели линейной регрессии, где зависимой переменной является количество проданных единиц товара, а независимой переменной - его цена. Если модель показывает отрицательный коэффициент для цены, это означает, что с увеличением цены спрос на товар снижается. Например, если коэффициент равен -0.5, это означает, что при увеличении цены на 1 у.е. количество проданных единиц товара снижается в среднем на 0.5 единиц. Также линейная регрессия может быть применена для анализа влияния других факторов на спрос на товары. Например, можно добавить в модель данные о сезонности, маркетинговых акциях или характеристиках товара, таких как бренд или качество. Если коэффициент для какого-то из этих факторов значимо отличается от нуля, это указывает на наличие связи между этим фактором и спросом на товар.

Однако, модель предполагает линейную зависимость между переменными и требует выполнения предпосылок, таких как нормальное распределение остатков. Таким образом, линейная регрессия представляет собой мощный инструмент для анализа и прогнозирования спроса на товары, однако ее использование должно быть осознанным и контекстуальным, учитывая ограничения и особенности конкретной ситуации.

ПРЕДСКАЗАНИЕ СПРОСА НА ТОВАР

Рис. 2. Результат сравнения методов предсказания спроса на товар.

Выводы

Наше исследование подтверждает эффективность применения методов машинного обучения для моделирования спроса на товары. Более того, оно выделяет линейную регрессию как наиболее подходящий метод для данной задачи. Линейная регрессия является важным инструментом для анализа и прогнозирования спроса на товары в современной экономике. Ее преимущества включают простоту интерпретации результатов, возможность адаптации к различным видам данных и относительную легкость в использовании. Мы обнаружили, что линейная регрессия эффективна при моделировании зависимости между характеристиками товаров и их спросом, особенно в случаях, когда зависимость линейна или можно линеаризовать. Кроме того, линейная регрессия может быть эффективным инструментом для анализа влияния различных факторов, таких как цена, сезонность или маркетинговые акции, на спрос на товары.Результаты могут быть полезны для компаний, занимающихся управлением запасами и прогнозированием спроса, в разработке эффективных стратегий и принятии решений. В дальнейших исследованиях можно рассмотреть более сложные модели и улучшить процесс обработки данных для дальнейшего повышения точности прогнозирования спроса на товары.

253

Muhammad al-Xorazmiy nomidagi TATU Farg'ona filiali "Al-Farg'oniy avlodlari" elektron ilmiy jurnali ISSN 2181-4252 Tom: 1 | Son: 2 | 2024-yil

"Descendants of Al-Farghani" electronic scientific journal of Fergana branch of TATU named after Muhammad al-Khorazmi. ISSN 2181-4252 Vol: 1 | Iss: 2 | 2024 year

Электронный научный журнал "'Потомки Аль-Фаргани" Ферганского филиала ТАТУ имени Мухаммада аль-Хоразми ISSN 2181-4252 Том: 1 | Выпуск: 2 | 2024 год

Список литературы

1. Дасаева, Д. А., & Мокшин, В. В. (2022). ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ СПРОСА НА ОНЛАЙН ПЛОЩАДКАХ.

2. Капитонова, Е. А. (2020). Прогнозирование цен на жилье на основе модели линейной регрессии. PHYSICS AND MATHEMATICS, 14.

3. Мезенин, А., Салихова, М., & Побединский, В. (2023). ПРОГНОЗИРОВАНИЕ МЕТОДОМ МАШИННОГО ОБУЧЕНИЯ MACHINE LEARNING FORECASTING. ББК 30 Р 68, 287.

4. Yerlankyzy, A. (2023). АНАЛИЗ МЕТОДОВ ПРОГНОЗИРОВАНИЯ ПОТРЕБЛЕНИЯ ПРОДУКТОВ ПИТАНИЯ. МЕЖДУНАРОДНЫЙ ЖУРНАЛ ИНФОРМАЦИОННЫХ И КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ, 4(4), 56-65.

5. Зюсько, К. Д. (2020). Прогноз спроса на товар с помощью нейронных сетей в условиях меняющейся размерности входных данных. Экономика и качество систем связи, (1 (15)), 36-41.

6. Дрогобыцкий, И. Н. (2023). МОДЕЛИРОВАНИЕ ПРЕДСКАЗАНИЙ И ОЖИДАНИЙ. Вестник Таганрогского института управления и экономики, (2 (38)), 3-8.

7. Зюсько, К. Д. (2020). Прогноз спроса на товар с помощью нейронных сетей в условиях меняющейся размерности входных данных. Экономика и качество систем связи, (1 (15)), 36-41.

254

i Надоели баннеры? Вы всегда можете отключить рекламу.