Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МОДЕЛИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЦЕН НА КАЛИЙНУЮ ПРОДУКЦИЮ'

ИСПОЛЬЗОВАНИЕ МОДЕЛИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЦЕН НА КАЛИЙНУЮ ПРОДУКЦИЮ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
16
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
множественная линейная регрессия / статистические данные / калийная отрасль / краткосрочное прогнозирование / цена калийной продукции / multiple linear regression / statistical data / potash industry / short-term forecasting / potash products price

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Копотева Анна Владимировна, Затонский Андрей Владимирович

Нестабильность современной экономики вследствие глобальных и региональных конфликтов и противоречий приводит к существенным колебаниям на сырьевых рынках. Непредсказуемость спроса и цен приводит к повышению рисков деятельности добывающих отраслей и ограничивает их успешное функционирование и развитие. Цель исследования. В данной работе произведена попытка использования модели множественной линейной регрессии для получения приемлемого качества прогнозной цены калийной продукции. Несмотря на распространенность и простоту построения и интерпретации, прогностические свойства таких моделей, как правило, неудовлетворительны. Тем не менее при адекватном подборе факторов и объема выборки, используемой для оценки неизвестных параметров модели, можно добиться приемлемого качества прогноза на ее основании. Материалы и методы. Оценка неизвестных параметров модели множественной линейной регрессии в работе осуществляется на основании данных государственной геологической службы Соединенных Штатов Америки. Выборка содержит сведения об американском рынке калийной продукции в период с 1900 по 2020 г. Качество прогнозирования проверяется методом постпрогноза на 2019 и 2020 гг. Модель, построенная на всем доступном временном интервале, дает неудовлетворительное значение относительной ошибки прогнозирования. Для уменьшения ее значения в работе выполнен перебор объемов выборок, на основании которых оцениваются параметры модели, и выбран тот из них, для которого ошибка прогноза минимальна. Расчеты выполнены средствами MS Excel и Python 3.8.5 в среде Jupyter Notebook 6.1.4. Результаты. Проведенное исследование позволило установить, что для минимизации относительной погрешности прогнозирования цены калийной продукции на внутреннем рынке США моделирование целесообразно производить с использованием временных интервалов длиной от 9 до 13 лет. При этом удается улучшить прогноз на 2019 г. на 118-летнем временном интервале на 23,9 %, а аналогичный прогноз на 2020 г. – на 83,70 %. Заключение. По результатам проделанной работы можно утверждать, что модель множественной линейной регрессии может быть успешно использована для краткосрочного прогнозирования цены калийной продукции, а удачный выбор длины интервала моделирования позволяет достичь приемлемого качества прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Копотева Анна Владимировна, Затонский Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF MULTIPLE LINEAR REGRESSION MODEL FOR POTASH PRICES SHORT-TERM FORECASTING

The modern economy instability due to global and regional conflicts and contradictions leads to significant fluctuations in commodity markets. The demand and prices unpredictability leads to the raw materials industries risks increase and limits their successful functioning and development. The purpose of the study. In this paper, we made an attempt of a multiple linear regression model application to obtain a forecast price of potash products acceptable quality. Despite the wide application and simplicity of construction and interpretation, the forecasting properties of such models are usually unsatisfactory. Nevertheless, an adequate selection of factors and the sample size used to estimate unknown parameters of the model, allows to achieve an acceptable forecasting quality. Materials and methods. In the issue the evaluation of the multiple linear regression model unknown parameters is performed on the basis of United States of America Geological Survey data. The sample contains information about the American potash market in the period from 1900 to 2020. The quality of forecasting is tested using the post-forecast method for years 2019 and 2020. The model built using the entire dataset gives an unsatisfactory relative prediction error. To reduce its value, a search of the sample volumes of data used for model parameters estimation was performed, and the one with the minimal forecast error was selected as optimal. The calculations were performed using MS Excel and Jupyter Notebook 6.1.4 environment for Python 3.8.5. Results. The conducted research allowed us to determine that in order to minimize the US domestic market potash products price relative error, it is necessary to use from 9 to 13 years time intervals for modeling. By doing that it is possible to improve the 118-year time interval forecast for 2019 year by 23.9%, and a similar forecast for 2020 by 83.70%. Conclusion. Based on the results of the work done, it can be stated that the multiple linear regression model can be successfully used for short-term forecasting of the potash products price, and by an adequate modeling interval length choice it is possible to achieve acceptable forecasting quality.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МОДЕЛИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЦЕН НА КАЛИЙНУЮ ПРОДУКЦИЮ»

Научная статья УДК 519.25

DOI: 10.14529/ctcr230409

ИСПОЛЬЗОВАНИЕ МОДЕЛИ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЦЕН НА КАЛИЙНУЮ ПРОДУКЦИЮ

А.В. Копотева, kopoteva_av@mail.ru

А.В. Затонский, zxenon@narod.ru, https://orcid.org/0000-0003-1863-2535 Пермский национальный исследовательский политехнический университет, Березниковский филиал, Березники, Россия

Аннотация. Нестабильность современной экономики вследствие глобальных и региональных конфликтов и противоречий приводит к существенным колебаниям на сырьевых рынках. Непредсказуемость спроса и цен приводит к повышению рисков деятельности добывающих отраслей и ограничивает их успешное функционирование и развитие. Цель исследования. В данной работе произведена попытка использования модели множественной линейной регрессии для получения приемлемого качества прогнозной цены калийной продукции. Несмотря на распространенность и простоту построения и интерпретации, прогностические свойства таких моделей, как правило, неудовлетворительны. Тем не менее при адекватном подборе факторов и объема выборки, используемой для оценки неизвестных параметров модели, можно добиться приемлемого качества прогноза на ее основании. Материалы и методы. Оценка неизвестных параметров модели множественной линейной регрессии в работе осуществляется на основании данных государственной геологической службы Соединенных Штатов Америки. Выборка содержит сведения об американском рынке калийной продукции в период с 1900 по 2020 г. Качество прогнозирования проверяется методом постпрогноза на 2019 и 2020 гг. Модель, построенная на всем доступном временном интервале, дает неудовлетворительное значение относительной ошибки прогнозирования. Для уменьшения ее значения в работе выполнен перебор объемов выборок, на основании которых оцениваются параметры модели, и выбран тот из них, для которого ошибка прогноза минимальна. Расчеты выполнены средствами MS Excel и Python 3.8.5 в среде Jupyter Notebook 6.1.4. Результаты. Проведенное исследование позволило установить, что для минимизации относительной погрешности прогнозирования цены калийной продукции на внутреннем рынке США моделирование целесообразно производить с использованием временных интервалов длиной от 9 до 13 лет. При этом удается улучшить прогноз на 2019 г. на 118-летнем временном интервале на 23,9 %, а аналогичный прогноз на 2020 г. - на 83,70 %. Заключение. По результатам проделанной работы можно утверждать, что модель множественной линейной регрессии может быть успешно использована для краткосрочного прогнозирования цены калийной продукции, а удачный выбор длины интервала моделирования позволяет достичь приемлемого качества прогнозирования.

Ключевые слова: множественная линейная регрессия, статистические данные, калийная отрасль, краткосрочное прогнозирование, цена калийной продукции

Для цитирования: Копотева А.В., Затонский А.В. Использование модели множественной линейной регрессии для краткосрочного прогнозирования цен на калийную продукцию // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». 2023. Т. 23, № 4. С. 89-97. DOI: 10.14529/ctcr230409

© Копотева А.В., Затонский А.В., 2023

Original article

DOI: 10.14529/ctcr230409

APPLICATION OF MULTIPLE LINEAR REGRESSION MODEL FOR POTASH PRICES SHORT-TERM FORECASTING

A.V. Kopoteva, kopoteva_av@mail.ru

A.V. Zatonskiy, zxenon@narod.ru, https://orcid.org/0000-0003-1863-2535 Perm National Research Polytechnic University, Berezniki Branch, Berezniki, Russia

Abstract. The modern economy instability due to global and regional conflicts and contradictions leads to significant fluctuations in commodity markets. The demand and prices unpredictability leads to the raw materials industries risks increase and limits their successful functioning and development. The purpose of the study. In this paper, we made an attempt of a multiple linear regression model application to obtain a forecast price of potash products acceptable quality. Despite the wide application and simplicity of construction and interpretation, the forecasting properties of such models are usually unsatisfactory. Nevertheless, an adequate selection of factors and the sample size used to estimate unknown parameters of the model, allows to achieve an acceptable forecasting quality. Materials and methods. In the issue the evaluation of the multiple linear regression model unknown parameters is performed on the basis of United States of America Geological Survey data. The sample contains information about the American potash market in the period from 1900 to 2020. The quality of forecasting is tested using the post-forecast method for years 2019 and 2020. The model built using the entire dataset gives an unsatisfactory relative prediction error. To reduce its value, a search of the sample volumes of data used for model parameters estimation was performed, and the one with the minimal forecast error was selected as optimal. The calculations were performed using MS Excel and Jupyter Notebook 6.1.4 environment for Python 3.8.5. Results. The conducted research allowed us to determine that in order to minimize the US domestic market potash products price relative error, it is necessary to use from 9 to 13 years time intervals for modeling. By doing that it is possible to improve the 118-year time interval forecast for 2019 year by 23.9%, and a similar forecast for 2020 by 83.70%. Conclusion. Based on the results of the work done, it can be stated that the multiple linear regression model can be successfully used for short-term forecasting of the potash products price, and by an adequate modeling interval length choice it is possible to achieve acceptable forecasting quality.

Keywords: multiple linear regression, statistical data, potash industry, short-term forecasting, potash products price

For citation: Kopoteva A.V., Zatonskiy A.V. Application of multiple linear regression model for potash prices short-term forecasting. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics. 2023;23(4):89-97. (In Russ.) DOI: 10.14529/ctcr230409

Введение

К настоящему времени внутри мирового сообщества накопились многочисленные противоречия, приводящие к локальным экономическим, политическим и военным конфликтам и, как следствие, к нестабильности мировой экономики. Резким скачкам цен и спроса подвержены и сырьевые отрасли Российской Федерации, обеспечивающие существенные доли доходов бюджетов всех уровней. Не является исключением и калийная отрасль, представленная на территории Березниковско-Соликамского промышленного узла предприятиями ПАО «Уралкалий» и ООО «ЕвроХим-Усольский калийный комбинат». С учетом ограниченного числа месторождений калийных солей, а также достаточно стабильного спроса на калий как один из основных жизненно важных для сельскохозяйственных культур элементов наибольшие риски при краткосрочном планировании операционной и инвестиционной деятельности калийных предприятий связаны с волатильностью отраслевых цен. Сложность их прогнозирования повышает производственные и финансовые риски и снижает инвестиционную привлекательность отрасли. В данной работе предпринята попытка построения многофакторной линейной эконометрической модели средней годовой цены 1 т калийной продукции на основании данных открытой долгосрочной статистики с целью достижения приемлемого качества ее краткосрочного прогноза. Наличие такого прогноза

является необходимым условием эффективного краткосрочного производственного и инвестиционного планирования, а также быстрой окупаемости реализуемых предприятиями инвестиционных программ.

Существуют различные методы прогнозирования цен на природные ресурсы [1, 2]. Наиболее активно отечественные и иностранные исследователи занимаются прогнозированием цен на энергетических рынках [3, 4]. Обзор открытых источников не выявил актуальных исследований по прогнозированию цен в калийной отрасли. Наиболее свежий англоязычный обзор мировой торговли удобрениями в целом выполнен за период 2014-2018 гг. [5]. Русскоязычный обзор тенденций мирового рынка минеральных удобрений выполнен в [6], обзор калийной отрасли - в [7]. В [8] авторы строят прогнозы биржевых цен на азотные удобрения. В [9] представлены результаты исследования на тему прогноза пиковой добычи и потребления калия в рамках теории жизненного цикла продукции. В [10] авторы моделируют и прогнозируют соотношения спроса и предложения в калийной отрасли, а в [11] выполнен сценарный анализ динамики запасов сырья для производства калийных удобрений в Китае в зависимости от их потребления. При наличии статистических данных для прогнозирования используются эконометрические модели. Модели временных рядов строятся в случае, если имеются сведения только о динамике изучаемого показателя в последовательные моменты времени [12]. При наличии данных о значениях системы показателей, определяющих уровень и динамику изучаемой величины, возможно построение линейных и нелинейных многофакторных моделей [13], а также моделей машинного обучения [14]. При этом не существует универсального метода прогнозирования, дающего гарантированно приемлемое качество результата, а прогнозирование цен на хлористый калий если и выполняется, то в специализированных платных отраслевых обзорах, не доступных широкой общественности.

В данном исследовании рассмотрена возможность использования модели множественной линейной регрессии для целей оперативного прогнозирования цен в калийной отрасли на примере внутреннего рынка Соединенных Штатов Америки. Для этого необходимо выполнить сбор статистических данных о стоимости 1 т хлористого калия и влияющих на него факторах из открытых источников, построить модель множественной линейной регрессии, оценить качество прогноза на ее основе и, в случае неудовлетворительного его уровня, попытаться подобрать факторы и параметры моделирования для его улучшения.

1. Моделирование цены калийной продукции на внутреннем рынке

Соединенных Штатов Америки

Построение эконометрических моделей предполагает выбор формы зависимости объясняемой переменной от определяющих ее факторов, оценку неизвестных параметров этого уравнения по статистической выборке и проверку качества полученной модели. Эконометрическая модель с одной объясняемой переменной y и p объясняющими переменными Х1, x2,..., xp определяется уравнением

y = f (x1, x2,xp) + e,

где f — функция, выражающая зависимость y от x^ x2,..., xp ; s - ошибка модели, выражаемая

случайной величиной. В случае линейной функции f возникает модель множественной линейной регрессии

y = ßö +ß1 • x1 +ß2 • x2 +. + ßp ■ xp + S где ß = (ßo, ß1,..., ßp) — вектор неизвестных параметров модели, подлежащих определению методом наименьших квадратов [15]. Для оценки качества аппроксимации модели множественной регрессии используется, в частности, исправленный коэффициент детерминации Radj е [0; 1], чем

ближе значение показателя к единице, тем выше качество построенной модели. Для целей прогнозирования более важной характеристикой модели является качество прогноза, которое может быть оценено методом постпрогноза1, когда модель оценивается по укороченной на несколько

1 https://help.sap.com/saphelp_scm70/helpdata/ru/ac/216b77337b11d398290000e8a49608/frameset.htm.

наблюдений выборке, для пропущенных наблюдений строятся прогнозные значения объясняемой переменной и сравниваются с фактическими.

Оценка параметров эконометрического уравнения осуществляется на основании статистических данных об изучаемой величине и определяющих ее факторах. При этом чем больше объем выборки, тем более высокого качества моделирования можно добиться. Анализ открытых источников показал, что наибольший объем данных по ценам в калийной отрасли доступен для внутреннего рынка Соединенных Штатов Америки на официальном сайте U.S. Geological Survey2. Данные включают сведения об объемах внутреннего выпуска (Production), импорта (Imports), экспорта (Exports), складских запасов (Stocks), потребления (Apparentconsumption), цене в пересчете на 1 т K2O (Uni_value), а также мировых объемах производства (World_production) с 1900 по 2020 г., причем данные о производстве, экспорте, складских запасах и мировом производстве не полные. Таким образом, непосредственно в качестве факторов начиная с 1900 г. можно выбрать только Imports (коэффициент корреляции с ценой 0,504) и Apparentconsumption (коэффициент корреляции с ценой 0,377), т. е. для обоих факторов характерна прямая средняя теснота связи с объясняемым показателем. Несмотря на достаточно тесную корреляцию двух данных фактов, в модель пришлось включить оба, поскольку расчеты показали, что исключение одного из них приводит к существенному ухудшению качества модели. Также в качестве фактора, влияющего на цену, можно выбрать время t = 1, 2,..., 120, поскольку динамика имеет выраженный восходящий тренд. Коэффициент парной линейной корреляции времени с ценой составляет 0,531, т. е. связь показателей также является прямой средней. Кроме того, анализ автокорреляционной функции цены 1 т K2O показал наличие тесной прямой зависимости текущего Unit_valuet и предшествующего Unit_valuet_i значений, коэффициент корреляции составил 0,925. Таким образом, результирующая модель оказалась четырехфакторной с уравнением вида

Unit _ valuet = b0 + b1 • t + b2 • Unit _ valuet_j + b3 • Importst + b4 • Apparent _ consumption. (1)

Оценка неизвестных параметров уравнения (1) на всем доступном временном интервале была выполнена с помощью средства «Регрессия» надстройки «Пакет анализа» MS Excel. Были рассмотрены варианты с нулевым и ненулевым значениями константы b0 (см. таблицу).

Модели цены K2O в 2019 и 2020 гг. по данным за 1901-2018 гг. K2O price models in 2019 and 2020 based on 1901-2018 data

№ b0 b\ b2 b3 b4 R2 Kadj Ошибка прогноза, %

2019 2020

1 0,00 0,73 1,88-10-5 -2Д0-10-5 0,86141 0,92 31,46 -52,71

2 -0,57 0,75 1,87-10-5 -2,1110-5 0,86142 0,87 34,45 -51,46

Обе модели оказались значимыми на 5%-ном уровне значимости, причем более высоким исправленным коэффициентом детерминации (почти 91,8 %) обладает модель с нулевой константой. Тем не менее обе модели по данным за 118 лет дают низкое качество прогноза: более 31 % на 2019 г. и более 51 % - на 2020 г. по абсолютной величине.

2. Выбор длины интервала моделирования с целью минимизации погрешности прогноза цены калийной продукции на внутреннем рынке Соединенных Штатов Америки

Высокая погрешность прогноза цены калийной продукции по данным за 1901-2018 гг. позволяет предположить, что для прогнозирования цены калийных удобрений на основании выбранной модели следует выбрать более короткий временной интервал. При этом минимизировать можно как среднюю ошибку прогнозирования на этом интервале, так и актуальную ошибку прогнозирования (в случае рассмотренных данных это 2019 и 2020 гг.). Практическая реализация поставленной задачи предполагает:

- определение количества наблюдений в частичных рядах п, для целей данного исследования мы ограничились случаями 8 < п < 27;

2 https://www.usgs.gov/centers/national-minerals-information-center/potash-statistics-and-information.

— выбор из полного набора данных частичных рядов длины n;

— разбивку каждого частичного ряда на обучающую и тестовую выборки. В данном исследовании прогноз выполняется на 2 временных периода, поэтому в тестовую часть необходимо включить 2 последних наблюдения частичного временного ряда, в обучающую — первые n — 2 наблюдения;

— оценку неизвестных параметров уравнения (1) по обучающей выборке;

— прогнозирование значений Unit_vaiuerm°d для i = n — 1, n (наблюдений тестовой выборки);

— расчет относительной погрешности прогноза по формуле

s'n = (Unit_valuei - UniY_va/ueimod^Unii_va/uei • 100 %, i = n — 1, n;

— расчет абсолютной величины относительной погрешности

расчет среднего значения

ср

i = n -1, n; по всем частичным рядам длины n;

- выбор длины частичных рядов n1 , обеспечивающего минимум в^ , i = n -1, n;

ср

- выбор длины частичных рядов n2 , обеспечивающего минимум погрешности прогноза в 2019 и 2020 гг.

При относительно небольшом объеме исходных данных рассмотренный алгоритм может быть реализован вручную, однако в нашем распоряжении сведения за 120 лет, что приводит к необходимости оценить параметры от 95 уравнений в случае n = 27 до 114 уравнений в случае n = 8. Такой объем действий потребовал программной реализации, выполненной нами средствами MS Excel и Python 3.8.5 в среде Jupyter Notebook 6.1.4. В Jupyter Notebook были выполнены перебор по длине частичных рядов с формированием соответствующих выборок, оценка параметров регрессии, расчет относительной погрешности вычислений и формирование таблиц погрешностей, которые выгружались в книгу MS Excel. Результирующая книга содержала 20 листов с данными об относительных погрешностях прогнозирования на 2 года при различных n. На их основании в книге MS Excel рассчитывались абсолютные значения погрешностей, их средние величины и формировались итоговая таблица и график зависимости абсолютной величины средней относительной погрешности прогнозирования от объема обучающей выборки n - 2 (рис. 1). Кроме того, была построена зависимость средней погрешности прогноза на 2019 и 2020 гг. от объема обучающей выборки n - 2 (рис. 2).

Анализ средней погрешности прогноза по абсолютной величине показал, что наименьшая ее величина на 1 год достигается на 13-летнем объеме обучающей выборки, соответствующее значение составляет 26,19 % с размахом вариации от 0,08 до 232,36 %. Наименьшая средняя погрешность прогноза на 2 года достигается на 24-летнем объеме обучающей выборки, ее величина при этом составляет 38,38 % с размахом вариации от 0,24 до 424,84 %.

Анализ погрешности прогноза по абсолютной величине на 2019 г. показал, что наименьшая ее величина достигается при 9-летнем объеме обучающей выборки. Соответствующее значение погрешности составляет 23,95 %, а уравнение регрессии имеет вид

Unit_valuet = 5816,6985-36,9229• t-0,5732• Unit_valuet-l -

- 0,0003 • Importst + 0,0001- Apparent _ consumption.

Это значение точнее, чем наилучший прогноз на 118-летнем временном интервале, равный 31,46 % (см. таблицу), на 23,87 %. Наименьшая погрешность прогноза на 2020 г. достигается на 10-летнем объеме обучающей выборки. Соответствующее значение погрешности составляет 8,39 %, а уравнение регрессии имеет вид

Unit _valuet = 2959,6712 -19,0386 • t - 0,1083 • Unit _valuet-1 -

- 0,0003 • Importst + 0,0003 • Apparent _ consumption.

Это значение точнее, чем наилучший прогноз на 118-летнем временном интервале, равный 51,46 % (см. таблицу), на 83,70 %.

8

450,0

400,0

350,0

300,0

250,0

200,0 183,S 150,0

100,0

50,0

0,0

погрешность прогноза, %

II ♦ средняя погрешность прогноза на 1 год

■ 1 389,4 - -■■ - ср едняя погрешн ость прогноз а на 2 года

\ '

\ 1 объем о бучающей вы борки

" \ 76,8 65,6 55,0 47,5 42,8 40,0 41,5 42,8 46,4 53,3 53,3 53,6 49,3 !---■-. + 44,0 40,4 39,3 39,1 3 8,4 39,1

40,5 *-♦--- 7,6 33,6 0,4~27,6_' 26,3H26,2 -♦-< 28,2 29,3 3 2,3 35,5-4 32,5_,34,8~< 31,1 30,9 ---j---_ . - , 28,3 28,3 27,7 27

10

12

14

16

18

20

22

24

Рис. 1. Зависимость средней погрешности прогноза на 1 и 2 года от объема обучающей выборки Fig. 1. 1 and 2 years average forecast error dependence on training sample volume

6

8

Рис. 2. Зависимость средней погрешности прогноза на 2019 и 2020 гг. от объема обучающей выборки Fig. 2. 2019 and 2020 average forecast error dependence on training sample volume

Таким образом, прогнозирование цены 1 т К20 на внутреннем рынке США на два ближайших года на основании модели линейной зависимости ее от времени, значения цены в предыдущий год, а также уровней импорта и внутреннего потребления (1) целесообразно производить с использованием временных интервалов длиной от 9 до 13 лет, поскольку именно при таких объемах обучающих выборок достигаются минимальные погрешности прогноза на 1 и 2 года. При этом существенно улучшается качество прогнозной цены по сравнению с ее значением, смоделированным по полному ряду данных за 118 лет, - погрешность на один год сокращается примерно на треть, на два года - более чем на 80 %.

Заключение

На основании проведенного исследования можно заключить, что модель множественной линейной регрессии может быть успешно использована для краткосрочного прогнозирования цены калийной продукции на внутреннем рынке США. В качестве исходных данных использовалась статистика с официального сайта американской геологической службы за 120 лет. Установлено, что линейная зависимость цены 1 т К20 от времени, значения цены в предыдущий год, импорта и внутреннего потребления обеспечивает минимальную погрешность актуального прогноза на два года при моделировании на временных интервалах длиной от 9 до 13 лет. Наименьшая средняя

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

погрешность прогноза на 1 год равна 26,19 % и достигается на 13-летнем временном интервале. Наименьшая средняя погрешность прогноза на 2 года составляет 38,38 % и достигается на 24-летнем временном интервале. Наименьшая погрешность прогнозирования на 2019 г., равная 23,95 %, достигается на 9-летнем временном интервале. Наименьшая погрешность прогнозирования на 2020 г., равная 8,39 %, достигается на 10-летнем временном интервале. Несмотря на существенное улучшение прогностических свойств модели за счет подбора длины интервала моделирования, погрешность среднего прогноза на два года составляет почти 40 %, т. е. остается на достаточно высоком уровне. При этом объем доступных данных достаточно велик, что позволяет попытаться использовать для получения более точных прогнозов модели машинного обучения.

Список литературы

1. Alternative techniques for forecasting mineral commodity prices / C.A. Tapia Cortez, S. Saydam, J. Coulton, C. Sammut // International Journal of Mining Science and Technology. 2018. Vol. 28, iss. 2. P. 309-322. DOI: 10.1016/j.ijmst.2017.09.001

2. Progress and prospects of data-driven stock price forecasting research / C. Zhao, M. Wu, J. Liu et al. // International Journal of Cognitive Computing in Engineering. 2023. Vol. 4. P. 100-108. DOI: 10.1016/j.ijcce.2023.03.001

3. Бушуев В.В. Cтруктурноволновой анализ и прогноз мировой динамики нефтяных цен // Энергетическая политика. 2019. № 3. C. 54-61.

4. Forecasting oil, coal, and natural gas prices in the pre-and post-COVID scenarios: Contextual evidence from India using time series forecasting tools / M.Sh. Alam, M. Murshed, P. Manigandan et al. // Resources Policy. 2023. Vol. 81. DOI: 10.1016/j.resourpol.2023.103342. URL: https://www.sciencedirect.com/science/article/pii/S0301420723000508 (дата обращения: 20.07.2023).

5. Gutiérrez-Moya E., Lozano S., Adenso-Díaz B. A pre-pandemic analysis of the global fertiliser trade network // Resources Policy. 2023. Vol. 85. Part B. DOI: 10.1016/j.resourpol.2023.103859. URL: https://www.sciencedirect.com/science/article/pii/S0301420723005706 (дата обращения: 20.07.2023).

6. Торопцев Е.Л., Гурнович Т.Г., Мурадова И.Ю. Прогнозирование ценовой конъюнктуры рынка минеральных удобрений // n-Economy. 2010. № 1 (92). С. 73-82.

7. Земсков А.А., Максимович Н.Г., Мещерякова О.Ю. Современные тенденции в развитии калийной промышленности в мире // Известия ТулГУ. Науки о Земле. 2022. № 3. URL: https://cyberleninka.ru/article/n/sovremennye-tendentsii-v-razvitii-kaliynoy-promyshlennosti-v-mire (дата обращения: 20.07.2023).

8. Mao S., Zeng X.-J. SimVGNets: Similarity-Based Visibility Graph Networks for Carbon Price Forecasting // Expert Systems with Applications. 2023. Vol. 230. DOI: 10.1016/j.eswa.2023.120647. URL: https://www.sciencedirect.com/science/article/pii/S0957417423011491 (дата обращения 20.07.2023).

9. Al Rawashdeh R. World peak potash: An analytical study // Resources Policy. 2020. Vol. 69. DOI: 10.1016/j.resourpol.2020.101834. URL: https://www.sciencedirect.com/science/article/pii/ S0301420720308667 (дата обращения: 20.07.2023).

10. Al Rawashdeh R., Xavier-Oliveira E., Maxwell P. The potash market and its future prospects // Resources Policy. 2016. Vol. 47. P. 154-163. DOI: 10.1016/j.resourpol.2016.01.011

11. Dynamic potassium flows analysis in China for 2010-2019 / X. Song, Y. Geng, Y. Zhang et al. // Resources Policy. 2022. Vol. 78. DOI: 10.1016/j.resourpol.2022.102803. URL: https://www.sciencedirect.com/science/article/pii/S0301420722002513 (дата обращения: 20.07.2023).

12. Morales M.Á.S., Anguiano F.I.S. Data science - time series analysis of oil & gas production in mexican fields // Procedia Computer Science. 2022. Vol. 200. P. 21-30. DOI: 10.1016/j.procs.2022.01.201

13. Сиротина Н.А., Копотева А.В., Затонский А.В. Метод конечно-разностного социально-экономического прогнозирования // Прикладная математика и вопросы управления. 2021. № 1. С. 174-189. DOI: 10.15593/2499-9873/2021.1.10

14. Копотева А.В., Максимов А.А., Сиротина Н.А. Модели машинного обучения в задаче прогнозирования природно-ресурсного потенциала Пермского края // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». 2021. Т. 21, № 4. С. 126-136. DOI: 10.14529/ctcr210411

15. Эконометрика / Елисеева И.И., Курышева С.В., Костеева Т.В. и др.; под ред. И.И. Елисеевой. М.: Финансы и статистика, 2007. 576 с.

References

1. Tapia Cortez C.A., Saydam S., Coulton J., Sammut C. Alternative techniques for forecasting mineral commodity prices. International Journal of Mining Science and Technology. 2018;28(2):309-322. DOI: 10.1016/j.ijmst.2017.09.001

2. Zhao C., Wu M., Liu J., Duan Z., Li J., Shen L., Shangguan X., Liu D., Wang Y. Progress and prospects of data-driven stock price forecasting research. International Journal of Cognitive Computing in Engineering. 2023;4:100-108. DOI: 10.1016/j.ijcce.2023.03.001

3. Bushuev V.V. Structural and wave analysis and the forecast of world dynamics of oil prices. Energy Policy. 2019;3:54-61. (In Russ.)

4. Alam M.Sh., Murshed M., Manigandan P., Pachiyappan D., Shamansurova Z.A. Forecasting oil, coal, and natural gas prices in the pre-and post-COVID scenarios: Contextual evidence from India using time series forecasting tools. Resources Policy. 2023;81. DOI: 10.1016/j.resourpol.2023.103342. Available at: https://www.sciencedirect.com/science/article/pii/S0301420723000508 (accessed 20.07.2023).

5. Gutiérrez-Moya E., Lozano S., Adenso-Díaz B. A pre-pandemic analysis of the global fertiliser trade network. Resources Policy. 2023;85(B). DOI: 10.1016/j.resourpol.2023.103859. Available at: https://www.sciencedirect.com/science/article/pii/S0301420723005706) (accessed 20.07.2023)

6. Toroptsev E.L., Gurnovich T.G., Muradova I.Yu. [Mineral Fertilizers Market Price Situation Forecasting]. п-Economy. 2010;1(92):73-82. (In Russ.)

7. Zemskov A.N., Maksimovich N.G., Meshcheryakova O.Yu. Modern trends in the development of potassium industry in the world. Izvestiya Tula State University. Nauki o Zemle. 2022;3. (In Russ.) Available at: https://cyberleninka.ru/article/n/sovremennye-tendentsii-v-razvitii-kaliynoy-promyshlennosti-v-mire (accessed 20.07.2023).

8. Mao S., Zeng X.-J. SimVGNets: Similarity-Based Visibility Graph Networks for Carbon Price Forecasting. Expert Systems with Applications. 2023;230. DOI: 10.1016/j.eswa.2023.120647. Available at: https://www.sciencedirect.com/science/article/pii/S0957417423011491 (accessed 20.07.2023).

9. Al Rawashdeh R. World peak potash: An analytical study. Resources Policy. 2020;69. DOI: 10.1016/j.resourpol.2020.101834. Available at: https://www.sciencedirect.com/science/article/ pii/S0301420720308667 (accessed 20.07.2023).

10. Al Rawashdeh R., Xavier-Oliveira E., Maxwell P. The potash market and its future prospects. Resources Policy. 2016;47:154-163. DOI: 10.1016/j.resourpol.2016.01.011

11. Song X., Geng Y., Zhang Y., Zhang X., Gao Z., Li M. Dynamic potassium flows analysis in China for 2010-2019. Resources Policy. 2022;78. DOI: 10.1016/j.resourpol.2022.102803. Available at: https://www.sciencedirect.com/science/article/pii/S0301420722002513 (accessed 20.07.2023).

12. Morales M.Á.S., Anguiano F.I.S. Data science - time series analysis of oil & gas production in mexican fields. Procedia Computer Science. 2022;200:21-30. DOI: 10.1016/j.procs.2022.01.201

13. Sirotina N.A., Kopoteva A.V., Zatonskiy A.V. Finite Differences Method for Socio-Economic Modeling Applied Mathematics and Control Sciences. 2021;1:174-189. DOI: 10.15593/24999873/2021.1.10 (In Russ.)

14. Kopoteva A.V., Maksimov A.A., Sirotina N.A. Perm Region Natural Resource Potential Forecasting Using Machine Learning Models. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics, 2021;21(4): 126-136. (In Russ.) DOI: 10. 14529/ctcr210411

15. Eliseeva I.I., Kurysheva S.V., Kosteeva T.V. et al. Ekonometrika [Econometrics]. Moscow: Finansy i statistika; 2007. 576 p. (In Russ.)

Информация об авторах

Копотева Анна Владимировна, канд. техн. наук, доц. кафедры общенаучных дисциплин, Пермский национальный исследовательский политехнический университет, Березниковский филиал, Березники, Россия; kopoteva_av@mail.ru.

Затонский Андрей Владимирович, д-р техн. наук, проф., заведующий кафедрой автоматизации технологических процессов, Пермский национальный исследовательский политехнический университет, Березниковский филиал, Березники, Россия; zxenon@narod.ru.

Information about the authors

Anna V. Kopoteva, Cand. Sci. (Eng.), Ass. Prof. of the Department of General Scientific Disciplines, Perm National Research Polytechnic University, Berezniki Branch, Berezniki, Russia; kopoteva_av@mail.ru.

Andrey V. Zatonskiy, Dr. Sci. (Eng.), Prof., Head of the Department of Automation of Technological Processes, Perm National Research Polytechnic University, Berezniki Branch, Berezniki, Russia; zxenon@narod.ru.

Статья поступила в редакцию 20.07.2023

The article was submitted 20.07.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.