Ильясов Р.Х., Хуан Т., Родионов Д.Г., Конников Е.А. МОДЕЛИРОВАНИЕ СВОЙСТВ РАСПРЕДЕЛЕНИЯ ЦЕН НА РЫНКЕ ЗОЛОТА
Аннотация. В данной статье исследуются свойства распределения цен на рынке золота с использованием различных статистических моделей, включая смеси нормальных распределений (Гаусса), гамма-распределений, бета-распределений, распределений Стьюдента, триангулярных распределений и распределений фон Мизеса. Анализ основан на данных о ценах на золото за период с 2015 по 2022 годы. Каждая из использованных моделей позволила выявить особенности ценовой динамики, такие как центральная тенденция, дисперсия, асимметрия, тяжелые хвосты и мультимо-дальность. Особенно высокую точность аппроксимации продемонстрировали смеси распределений фон Мизеса, эффективно уловившие циклические паттерны в данных. Полученные результаты углубляют понимание статистических свойств распределения цен на золото и закладывают основу для дальнейших исследований и практических применений в области моделирования и прогнозирования финансовых рынков.
Ключевые слова. Рынок золота, распределение цен, смеси распределений, нормальное распределение, гамма-распределение, бета-распределение, распределение Стьюдента, триангулярное распределение, распределение фон Мизеса.
Ilyasov R.Kh., Huang T., Rodionov D.G., Konnikov E.A. MODELING THE PROPERTIES OF PRICE DISTRIBUTION IN THE GOLD MARKET
Abstract. This article explores the properties of price distribution in the gold market using various statistical models, including mixtures of normal distributions (Gaussian), gamma distributions, beta distributions, Student's t-distributions, triangular distributions, and von Mises distributions. The analysis is based on gold price data for the period from 2015 to 2022. Each of the models used allowed for identifying specific features of price dynamics, such as central tendency, dispersion, asymmetry, heavy tails, and multimodality. Mixtures of von Mises distributions demonstrated particularly high accuracy of approximation, effectively capturing cyclical patterns in the data. The obtained results deepen the understanding of the statistical properties of gold price distribution and lay the foundation for further research and practical applications in the field of financial market modeling and forecasting.
Keywords. Gold market, price distribution, mixture distributions, normal distribution, gamma distribution, beta distribution, Student's t-distribution, triangular distribution, von Mises distribution.
ГРНТИ 06.56.21 EDN YXGQEY
© Ильясов Р.Х., Хуан Т., Родионов Д.Г., Конников Е.А., 2024
Руслан Хизраилевич Ильясов - доктор экономических наук, доцент, заведующий кафедрой учёта, анализа и аудита в цифровой экономике Чеченского государственного университета имени А.А. Кадырова (г. Грозный). Хуан Тао - кандидат экономических наук, генеральный директор ООО «Российско-Китайский Союз» (г. Санкт-Петербург).
Дмитрий Григорьевич Родионов - доктор экономических наук, профессор, директор Высшей инженерно-экономической школы Санкт-Петербургского политехнического университета Петра Великого.
Евгений Александрович Конников - кандидат экономических наук, доцент Высшей инженерно-экономической школы Санкт-Петербургского политехнического университета Петра Великого.
Контактные данные для связи с авторами (Конников Е.А.): 195251, Санкт-Петербург, ул. Политехническая, д. 29 (Russia, St.Petersburg, Polytechnicheskaya, 29). Тел.: +7 (981) 017-92-30. Е-mail: konnikov.evgeniy@gmail.com. Статья поступила в редакцию 25.04.2024.
Введение
Рынок золота занимает уникальное место в глобальной экономике в силу своей устойчивости, ликвидности и значения в качестве безопасного актива. Золото часто рассматривается инвесторами как средство хеджирования рисков, сохранения стоимости на долгосрочную перспективу и как надежный инструмент в условиях экономической нестабильности. Цены на золото играют важнейшую роль в формировании стратегий центральных банков, иррегуляции финансовых рынков и управлении национальными резервами. Изучение свойств распределения цен на рынке золота является критически важным для понимания его динамики и факторов, влияющих на колебания цен. Основной задачей данной статьи является моделирование свойств распределения цен на золото.
В рамках данного исследования будут рассмотрены подробный анализ текущего состояния рынка золота и изучение исторических данных, обоснование выбора метода моментов для моделирования цен и анализ его преимуществ, применение различных функций непрерывных распределений для аппроксимации эмпирического распределения цен, будут сформулированы выводы по полученным моделям и описано их практическое значение для различных категорий участников рынка. В ходе исследования будут использованы данные с основными характеристиками цен на золото, включая их среднее значение, дисперсию, асимметрию и эксцесс. Актуальность исследования обеспечивается не только многолетней значимостью золота как финансового актива, но и необходимостью детального анализа его цен в условиях меняющейся мировой экономики. Ожидается, что результаты исследования помогут лучше понять физические и экономические механизмы, влияющие на распределение цен на золото.
Материалы и методы
Источником данных в рамках данного исследования выступил датасет, размещённый на портале Kaggle [1]. Данный датасет содержит информацию о ценах на золото, это - важный показатель стоимости, который, несмотря на отказ мирового сообщества от золотого стандарта, продемонстрировал существенное увеличение цен после вспышки Covid-19. Тренды на рынке золота в Китае, второй по величине экономике мира, имеют важное значение для понимания динамики китайской экономики и формирования глобальных экономических прогнозов.
В рамках данного исследования выбран столбец price_avg, представляющий собой среднюю цену на золото, что обусловлено его аналитической ценностью, объективностью измерения и наличием полных данных. Средняя цена на золото является важным индикатором рыночных условий и трендов, позволяя получить объективное представление о колебаниях цен и выявить основные тенденции на рынке золота, а также исследовать текущую рыночную ситуацию и спрогнозировать будущие изменения, что критически важно для разработки стратегий инвестирования и принятия экономических решений. На рисунке 1 представлено распределение цен на золото в период с 2015 по 2022 год.
0.0175 -0.0150 -0.0125 -
■в о.оюо -
а
0.0075 -0.0050 -0.0025 -0.0000 -
250 300 350 400 450
\talue
Рис. 1. Распределение цен на золото в период с 2015 по 2022 год
На рисунке 1 представлено распределение цен на золото в период с 2015 по 2022 год. Данный рисунок имеет характерную структуру с четырьмя пиками, что указывает на сложную многомодальную природу распределения цен. Наличие нескольких пиков может свидетельствовать о существовании различных рыночных состояний или сегментов, каждый из которых характеризуется своим уровнем цен, что может быть обусловлено влиянием множества факторов, таких как сезонные колебания, экономические шоки, изменения спроса и предложения, а также спекулятивные действия участников рынка. Многомодальное распределение цен на золото может также отражать фазовые изменения рынка, включая периоды стабильности и волатильности, которые происходят на фоне глобальных экономических и политических событий.
Например, значение различных фискальных и монетарных факторов, а также случайные большие покупки или продажи крупными игроками на рынке могут существенно влиять на формирование таких пиков в распределении цен. Для точного описания свойств данного многомодального распределения предлагается аппроксимировать его форму с использованием смесей Гаусса. Смеси Гаусса способны эффективно моделировать данные с несколькими пиками, обеспечивая тем самым гибкость и точность в соответствии эмпирическим данным. В рамках смесей Гаусса будут использованы несколько видов распределений [2, 3]:
• Гауссово (нормальное) распределение - основное распределение для моделирования данных, позволяющее точно описывать центральные тенденции и разброс цен. Данное распределение используется благодаря своей простоте и способности описывать разнообразные данные с нормальным распределением ошибок;
• гамма распределение - подходит для моделирования данных с положительными значениями, включая случаи с асимметричным распределением, что важно для учета экстремальных значений и длинных хвостов в распределении цен;
• бета распределение - используется для моделирования данных, ограниченных в определённом диапазоне, что позволяет учитывать различные уровни асимметрии, важные для корректного описания рынка золота;
• распределение Стьюдента - подходит для данных с тяжелыми хвостами, что важно для учета редких, но значительных колебаний цен на золото, которые могут существенно отклоняться от среднего значения;
• триангулярное распределение - простое распределение, реагирующее на центральные тенденции и крайние значения данных, что помогает в понимании центральных и граничных характеристик цены;
• распределение фон Мизеса - применяется для моделирования данных в замкнутых интервалах, что полезно для описания циклических и сезонных изменений в ценах на золото.
Основные результаты
На рисунке 2 представлена аппроксимация распределения цен смесью функций Гаусса. График не в полной мере точно описывает эмпирическое распределение цен, что указывает на дополнительную сложность данных, которая не может быть полностью учтена текущей моделью. С весом 0.0875 и средним значением 338.2511, компонента 1 описывает небольшую группу данных с более высокими значениями цены. Высокая дисперсия (303.1547) указывает на значительный разброс цен в этом сегменте, что может быть связано с периодами повышенной волатильности или спекулятивной активности. С весом 0.1308 и средним значением 233.4891, компонента 2 описывает группу данных с более низкими значениями цены. Небольшая дисперсия (64.5688) указывает на относительно стабильные цены в данном сегменте. С весом 0.3567 и средним значением 385.5370, компонента 3 имеет наибольшее влияние на общее распределение. Высокая дисперсия (285.2009) свидетельствует о значительной вариативности цен в данном сегменте. С весом 0.4250 и средним значением 274.1189, компонента 4 также имеет значительное влияние на общее распределение. Относительно небольшая дисперсия (78.9432) указывает на умеренную вариативность цен в данном сегменте.
Наличие четырех компонент в смеси функций Гаусса отражает многомодальную структуру эмпирического распределения цен на золото, что указывает на существование нескольких различных рыночных состояний или сегментов. Тот факт, что текущая смесь функций Гаусса не в полной мере точно
описывает эмпирическое распределение, может быть связан с недостаточным количеством компонент или с особенностями рыночной динамики, включающей аномалии и экстремальные значения.
На рисунке 3 представлена аппроксимация распределения цен смесью гамма-функций. График практически полностью идентичен нормальному распределению, что указывает на то, что смесь гамма-функций эффективно захватывает основные характеристики распределения цен на золото. С весом 0.0875, shape = 377.4107 и scale = 0.8962, компонента 1 описывает небольшую группу данных с высокой концентрацией значений вокруг среднего. С весом 0.1308, shape = 844.3266 и scale = 0.2765, компонента 2 представляет группу данных с более низкой вариативностью и высокой концентрацией вокруг среднего значения. С весом 0.3567, shape = 521.1721 и scale = 0.7397, компонента 3 имеет наибольшее влияние на общее распределение и описывает группу данных с умеренной вариативностью. С весом 0.4250, shape = 951.8385 и scale = 0.2880, компонента 4 также имеет значительное влияние на общее распределение и представляет группу данных с низкой вариативностью и высокой концентрацией вокруг среднего.
Рис. 2. Аппроксимация распределения цен смесью функций Гаусса
Рис. 3. Аппроксимация распределения цен смесью гамма-функций
Тот факт, что смесь гамма-функций практически полностью идентична нормальному распределению, указывает на то, что распределение цен на золото в целом следует нормальному закону, несмотря на наличие нескольких различных компонент. Данное сходство может быть обусловлено действием центральной предельной теоремы, согласно которой сумма большого числа независимых случайных величин стремится к нормальному распределению, независимо от распределения отдельных величин. Использование смеси гамма-функций в дополнение к смеси функций Гаусса предоставляет следующие преимущества [4, 5]:
• гамма-распределение способно моделировать данные с положительной асимметрией и тяжелыми хвостами, что может быть полезно для учета экстремальных значений и нелинейных эффектов на рынке золота;
• параметры гамма-распределения (shape и scale) имеют ясную интерпретацию в терминах формы и масштаба распределения, что облегчает понимание и объяснение результатов;
• смесь гамма-функций может обеспечить лучшее соответствие эмпирическим данным по сравнению со смесью функций Гаусса, особенно в случае асимметричных распределений или наличия тяжелых хвостов.
На рисунке 4 представлена аппроксимация распределения цен смесью бета-функций. Бета-функция намного лучше описывает пики с правой стороны графика, но сильно хуже с левой стороны по сравнению с гамма-смесями или гаусс-смесями, что указывает на то, что смесь бета-функций лучше улавливает характеристики распределения цен на золото в области высоких значений, но менее точна в области низких значений. С весом 0.0875, alpha = 22.3919 и beta = 19.9139, компонента 1 описывает небольшую группу данных с относительно симметричным распределением вокруг среднего значения. С весом 0.1308, alpha = 3.9511 и beta = 50.2063, компонента 2 представляет группу данных с сильной правосторонней асимметрией и концентрацией значений в области низких цен. С весом 0.3567, alpha = 25.7073 и beta = 9.2572, компонента 3 имеет наибольшее влияние на общее распределение и описывает группу данных с левосторонней асимметрией и концентрацией значений в области высоких цен. С весом 0.4250, alpha = 31.0079 и beta = 93.0583, компонента 4 также имеет значительное влияние на общее распределение и представляет группу данных с сильной правосторонней асимметрией и концентрацией значений в области низких цен.
Рис. 4. Аппроксимация распределения цен смесью бета-функций
Лучшее соответствие пикам с правой стороны графика указывает на то, что смесь бета-функций эффективно захватывает характеристики распределения цен на золото в области высоких значений,
что может быть связано с периодами повышенного спроса или спекулятивной активности. Худшее соответствие левой стороне графика свидетельствует о том, что смесь бета-функций менее точно описывает динамику цен в области низких значений, что может быть обусловлено наличием других факторов или ограничений, влияющих на ценообразование в данном диапазоне. Использование смеси бета-функций в дополнение к смеси функций Гаусса и гамма-функций предоставляет следующие преимущества:
• бета-распределение естественным образом подходит для моделирования данных, ограниченных в определенном диапазоне (например, цены на золото не могут быть отрицательными), что может обеспечить более реалистичное описание рыночной динамики;
• параметры бета-распределения (alpha и beta) позволяют моделировать различные типы асимметрии, что может быть полезно для учета специфических характеристик распределения цен на золото, таких как длинные хвосты или скошенность;
• смесь бета-функций может обеспечить лучшее соответствие эмпирическим данным в определенных областях распределения (например, в области высоких цен), что может быть полезно для более точного моделирования и прогнозирования экстремальных событий на рынке золота.
На рисунке 5 представлена аппроксимация распределения цен смесью функций Стьюдента. График намного лучше описывает более высокие пики, но намного хуже менее высокие пики по сравнению с предыдущими моделями, что указывает на то, что смесь функций Стьюдента хуже улавливает характеристики распределения цен на золото в области экстремальных значений, но более точна в описании более типичных значений. С весом 0.0875, mean = 338.2511, scale = 15.5732 и df = 10, компонента 1 описывает небольшую группу данных с относительно высоким средним значением и умеренной вариативностью. С весом 0.1308, mean = 233.4891, scale = 7.1871 и df = 10, компонента 2 представляет группу данных с низким средним значением и небольшой вариативностью. С весом 0.3567, mean = 385.5370, scale = 15.1050 и df = 10, компонента 3 имеет наибольшее влияние на общее распределение и описывает группу данных с высоким средним значением и умеренной вариативностью. С весом 0.4250, mean = 274.1189, scale = 7.9470 и df = 10, компонента 4 также имеет значительное влияние на общее распределение и представляет группу данных со средним значением ниже среднего и небольшой вариативностью.
0.0200 0.0175 0.0150
^ 0.0125
'¡л
g 0.0100 0.0075 0.0050 0.0025 0.0000
Рис. 5. Аппроксимация распределения цен смесью функций Стьюдента
Лучшее описание более высоких пиков указывает на то, что смесь функций Стьюдента менее эффективно захватывает характеристики распределения цен на золото в области экстремальных значений, что может быть связано с редкими, но значительными событиями на рынке, такими как финансовые
кризисы или геополитические потрясения. Более эффективное описание менее высоких пиков свидетельствует о том, что смесь функций Стьюдента более точно описывает динамику цен в области более типичных значений, что может быть обусловлено наличием типичных факторов или ограничений, влияющих на ценообразование в данном диапазоне. Использование смеси функций Стьюдента в дополнение к смесям функций Гаусса, гамма-функций и бета-функций предоставляет следующие преимущества:
• распределение Стьюдента имеет более тяжелые хвосты по сравнению с нормальным распределением, что позволяет лучше моделировать данные с большим количеством экстремальных значений или выбросов, характерных для финансовых временных рядов, таких как цены на золото;
• параметр степеней свободы (df) в распределении Стьюдента позволяет регулировать толщину хвостов распределения, что может быть полезно для учета специфических характеристик распределения цен на золото, таких как склонность к редким, но значительным скачкам цен;
• смесь функций Стьюдента может обеспечить лучшее соответствие эмпирическим данным в области экстремальных значений, что может быть полезно для более точного моделирования и прогнозирования редких, но значительных событий на рынке золота, таких как финансовые кризисы или резкие изменения в спросе и предложении.
На рисунке 6 представлена аппроксимация распределения цен смесью триангулярных функций. График намного лучше описывает более часто встречающиеся значения, но хуже менее часто встречающиеся значения по сравнению с предыдущими моделями, указывает на то, что смесь триангулярных функций лучше улавливает характеристики распределения цен на золото в области наиболее типичных значений, но менее точна в описании редких или экстремальных значений. С весом 0.0875, компонента 1 описывает небольшую группу данных с диапазоном цен от 308.09 до 368.41 и наиболее вероятным значением (mode) 338.25. С весом 0.1308, компонента 2 представляет группу данных с диапазоном цен от 219.57 до 247.41 и наиболее вероятным значением 233.49. С весом 0.3567, компонента 3 имеет наибольшее влияние на общее распределение и описывает группу данных с диапазоном цен от 356.29 до 414.79 и наиболее вероятным значением 385.54. С весом 0.4250, компонента 4 также имеет значительное влияние на общее распределение и представляет группу данных с диапазоном цен от 258.73 до 289.51 и наиболее вероятным значением 274.12.
Рис. 6. Аппроксимация распределения цен смесью триангулярных функций
Лучшее описание более часто встречающихся значений указывает на то, что смесь триангулярных функций эффективно захватывает характеристики распределения цен на золото в области наиболее типичных значений, что может быть связано с устойчивыми рыночными условиями и сбалансированным
спросом и предложением. Худшее описание менее часто встречающихся значений свидетельствует о том, что смесь триангулярных функций менее точно описывает динамику цен в области редких или экстремальных значений, что может быть обусловлено наличием других факторов или ограничений, влияющих на ценообразование в данных диапазонах, таких как непредвиденные события или шоки. Использование смеси триангулярных функций предоставляет следующие преимущества:
• триангулярное распределение является простым и интуитивно понятным, с легко интерпретируемыми параметрами (нижняя граница, мода и верхняя граница), что может облегчить понимание и объяснение результатов моделирования;
• триангулярное распределение позволяет моделировать асимметричные данные, что может быть полезно для учета специфических характеристик распределения цен на золото, таких как склонность к определенным диапазонам значений;
• в отличие от иных распределений, триангулярное распределение менее чувствительно к влиянию выбросов или экстремальных значений, что может быть полезно для получения более устойчивых оценок типичных уровней цен на золото.
На рисунке 7 представлена аппроксимация распределения цен смесью функций фон Мизеса. График намного лучше описывает распределение данных по сравнению со всеми остальными рассмотренными моделями, что указывает на то, что смесь функций фон Мизеса эффективно улавливает ключевые характеристики распределения цен на золото, включая центральную тенденцию, дисперсию и форму распределения. С весом 0.0875, mu = 0.18 и kappa = 4.40, компонента 1 описывает небольшую группу данных с центральной тенденцией, близкой к нулю (после нормировки), и умеренной концентрацией вокруг среднего значения. С весом 0.1308, mu = -2.68 и kappa = 20.68, компонента 2 представляет группу данных с отрицательной центральной тенденцией и высокой концентрацией вокруг среднего значения. С весом 0.3567, mu = 1.48 и kappa = 4.68, компонента 3 имеет наибольшее влияние на общее распределение и описывает группу данных с положительной центральной тенденцией и умеренной концентрацией вокруг среднего значения. С весом 0.4250, mu = -1.57 и kappa = 16.91, компонента 4 также имеет значительное влияние на общее распределение и представляет группу данных с отрицательной центральной тенденцией и высокой концентрацией вокруг среднего значения.
Angle (radians)
Рис. 7. Аппроксимация распределения цен смесью функций фон Мизеса
Лучшее описание распределения данных смесью функций фон Мизеса по сравнению с другими моделями указывает на то, что данное распределение эффективно захватывает ключевые особенности динамики цен на золото, такие как циклические или сезонные паттерны, а также асимметрию и мульти-модальность. Высокая точность аппроксимации смесью функций фон Мизеса свидетельствует о том,
что цены на золото могут демонстрировать некоторую периодичность или зависимость от циклических факторов, таких как экономические или деловые циклы, сезонные изменения спроса и предложения, или повторяющиеся паттерны рыночных настроений. Использование смеси функций фон Мизеса предоставляет следующие преимущества:
• распределение фон Мизеса естественным образом подходит для моделирования циклических или периодических данных, что может быть особенно полезно для учета сезонных или повторяющихся паттернов в динамике цен на золото;
• смесь функций фон Мизеса способна эффективно описывать асимметричные и мультимодальные распределения, что позволяет точно моделировать сложные структуры в данных цен на золото;
• параметры распределения фон Мизеса, такие как среднее направление (mu) и концентрация (kappa), имеют ясную интерпретацию, что может облегчить понимание и объяснение результатов моделирования.
Заключение
Полученные результаты подчеркивают сложность и многогранность рынка золота, на котором цены формируются под влиянием множества факторов, включая макроэкономические условия, геополитические события, рыночные настроения и циклические паттерны. Использование различных статистических моделей позволяет глубже понять эту динамику и обеспечивает основу для более точного моделирования и прогнозирования цен. Дальнейшие исследования могут быть направлены на интеграцию данных моделей с фундаментальными и техническими факторами, влияющими на рынок золота, а также на разработку гибридных подходов, сочетающих сильные стороны различных моделей, что позволит получить более полное и детальное понимание ценовой динамики и повысить эффективность принятия решений для широкого круга заинтересованных сторон, включая инвесторов, трейдеров и политиков.
Благодарности
Работы выполнены в рамках реализации проекта «Разработка методологии формирования инструментальной базы анализа и моделирования пространственного социально-экономического развития систем в условиях цифровизации с опорой на внутренние резервы» (FSEG-2023-0008).
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
1. Liqiang Li. Gold Price of China - Full data 2015-2022. [Электронный ресурс]. Режим доступа: https://www.kaggle.com/datasets/liqiang2022/gold-price-of-china-fuU-data-20152022 (дата обращения 23.04.2023).
2. Родионов Д.Г., Чан Х.Х., Конников Е.А., Унгвари Л. Методы машинного обучения в исследовании рынка жилой недвижимости // Известия Санкт-Петербургского государственного экономического университета. 2023. № 6-2 (144). С. 123-130.
3. Чан Х.Х., Конников Е.А., Родионов Д.Г. Методика анализа рыночного отклика в контексте рынка жилой недвижимости // Modern Economy Success. 2024. № 3. С. 257-264.
4. Чан Х.Х., Конников Е.А., Родионов Д.Г., Борисов О.Ю. Кластерный анализ рынка вторичной жилой недвижимости // Modern Economy Success. 2024. № 3. С. 212-220.
5. Уварова В.А., Бугаева Т.М., Конников Е.А. Сравнительный анализ свойств распределений цен рыночных энергетических активов средствами имитационного моделирования // Мягкие измерения и вычисления. 2024. Т. 75, № 2. С. 55-71.