Научная статья на тему 'ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ'

ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
прогнозирование электропотребления / машинное обучение / деревья решений / градиентный бустинг / electricity consumption forecasting / machine learning / decision trees / gradient boosting

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горшенин Алексей Юрьевич, Грицай Александр Сергеевич, Денисова Людмила Альбертовна

В работе рассмотрены вопросы краткосрочного прогнозирования электрической энергии с использованием машинного обучения ансамбля деревьев решений градиентного бустинга Catboost. Определены значимые технологические параметры и размер обучающей выборки для построения прогноза электропотребления на сутки вперёд с требуемой точностью.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горшенин Алексей Юрьевич, Грицай Александр Сергеевич, Денисова Людмила Альбертовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF MACHINE LEARNING OF DECISION TREES FOR SHORT-TERM FORECASTING OF ELECTRICITY CONSUMPTION

The paper examines the issues of short-term forecasting of electrical energy using machine learning of an ensemble of decision trees for gradient boosting Catboost. Significant technological parameters and the size of the training sample were determined to build a forecast of power consumption for the day ahead with the required accuracy.

Текст научной работы на тему «ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ»

УДК 004.896

DOI: 10.24412/2071-6168-2023-11-226-227

ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ

А.Ю. Горшенин, А.С. Грицай, Л.А. Денисова

В работе рассмотрены вопросы краткосрочного прогнозирования электрической энергии с использованием машинного обучения ансамбля деревьев решений градиентного бустинга Catboost. Определены значимые технологические параметры и размер обучающей выборки для построения прогноза электропотребления на сутки вперёд с требуемой точностью.

Ключевые слова: прогнозирование электропотребления, машинное обучение, деревья решений, градиентный бустинг.

Введение. В настоящее время энергосбытовым компаниям необходимо иметь возможность как можно точнее прогнозировать электропотребление для обеспечения эффективного управления и планирования распределения электроэнергии между потребителями [1-8]. Поэтому разработка методов и средств прогнозирования электропотребления является актуальной задачей. Наиболее популярными методами в прогнозировании электропотребления являются - статистические, которые основаны на построении временных рядов, такие как ARIMA (AutoRegressive Integrated Moving Average) [1] и использование взвешенных средних для прогнозирования будущих значений временного ряда (экспоненциальное сглаживание) [2].

Широкое распространение получили методы на основе искусственных нейронных сетей (ИНС), например, рекуррентные нейронные сети [3], LSTM (Long Short-Term Memory) [9]. Ключевыми преимуществами являются возможности обработки последовательных данных (в том числе обновляемые в реальном масштабе времени), и осуществление многоэтапного прогнозирования, уточняя будущие значения на несколько временных шагов вперед.

Также востребованными являются методы машинного обучения, основанные на построении деревьев решений, такие как, метод случайного леса [10] и градиентный бустинг деревьев решений [11]. В отличие от методов на основе ИНС, методы градиентного бустинга ансамблей деревьев решений (далее, рассмотрено применение метода Catboost [12]) используют наименьшее количество данных и времени для обучения, менее подвержены переобучению, и не так чувствительны к выбору гиперпараметров. Методы на основе ИНС часто считаются «черными ящиками», то есть их решения сложно интерпретируются [3]. Отличительной характеристикой ансамбля деревьев решений является более легкая интерпретируемость [12] и возможность проведения анализа важности каждого признака, в том числе объяснение принятия решений моделью.

В работе рассмотрены вопросы формирования обучающей выборки для модели краткосрочного (на сутки вперед) прогнозирования электропотребления с использованием метода Catboost, определяя значимые технологические параметры и размер обучающей выборки.

Исходные данные. В исследовании использованы данные, полученные от энергосбытовой компании АО «АтомЭнергоСбыт» и представленные массивом, состоящих из почасовых наблюдений технологических параметров [13], за период от 01.12.2021 г. до 30.06.2023 г. (два года). Фрагмент исходных данных представлен в табл. 1, в которую включены ретроспективные данные по электропотреблению (W, МВт*ч) в каждый момент сбора данных (Timestamp). Также в таблицу входят метеоданные: Ta - температура окружающей среды, °C; ф - относительная влажность воздуха, %; Vw - скорость ветра, м/с. Учитывалась доля длительности светового дня: Ld = ((т/60 + К)/24) * 100, где m(h) - минуты(часы) продолжительности светового дня (выбраны с информационных сервисов погоды [14]). Кроме того, учитывались технологические параметры региональной инфраструктуры, такие как: Cwd - индекс рабочего дня: рабочие (0), выходные (1), предпраздничные (3), праздничные дни (2), новогодние выходные (4) и нерабочие дни, связанные с событиями пандемии COVID-19 (5), на основе производственных календарей [15]; Nd (Nm, Nmd) - номера дней недели (месяца, порядковый номер дня в месяце); H - время, час; L - индекс работы городского освещения; Ih - индекс включения/отключения центрального отопления. Информация о работе городского освещения и центрального отопления получена из официальных источников Мурманской области [16]; Wp - значение электропотребления (за предыдущие сутки), МВт*ч. В таблице дополнительно рассчитан мультипликативный параметр Mult (произведение относительной влажности воздуха, ф и скорость ветра, Vw).

Установлено, что параметры потребления электроэнергии зависят от метеоусловий и других технологических параметров, поэтому они предварительно проверялись на наличие корреляционных зависимостей (описание выявления корреляционных связей, проводимого аналогично, между параметрами энерговыработки изложены в [3]). Исходя из результатов корреляционного анализа было решено провести анализ возможности сокращения признакового пространства для построения прогноза.

При выполнении исследования рассмотрена модель прогнозирования на основе метода машинного обучения Catboost, который является одним из немногочисленных методов, не требующих предварительной обработки данных. Catboost автоматически обрабатывает категориальные переменные (обозначаемые не числами, а условными символами) и дополняет пропущенные значения, что упрощает его применение. К недостаткам метода можно отнести отсутствие автоматической обработки аномальных значений, поэтому входные данные предварительно обрабатывались (очищались от выбросов) с использованием метода инквартильного размаха (IQR - Interquartile Range) [17]. На основе этих исходных данных формировались обучающие и тестовые выборки.

Для определения структуры и необходимого объема обучающей выборки, обеспечивающих требуемую точность прогнозирования, сформировано два варианта обучающей выборки. В первом случае, рассматриваются все доступные технологические параметры в исходном наборе данных (вариант В1). Во втором случае, выбираются параметры, имеющие наибольшее значение коэффициента корреляции с электропотреблением (вариант В2). Для оценки функционирования модели в качестве критерия рассматривалась ошибка прогноза электропотребления.

Для обоих полученных вариантов обучающей выборки производился анализ вклада каждого входного параметра в значение прогноза с целью определения возможности сокращения количества входных параметров в модель.

Таблица 1

Исходные данные для прогнозирования электропотребления (фрагмент)_

Момент времени (Timestamp) Технологические параметры

W Ta Ld Cwd Nd Nm Nmd H L Ф Vw Ih Wp Mult

01.12.2021 0:00 504,3 -8,3 0,032 0 3 12 1 0 1 90 2 1 526,2 180

01.12.2021 1:00 483,7 -7,1 0,032 0 3 12 1 1 1 89,6 3 1 506,2 268,8

01.12.2021 2:00 469,231 -6,0 0,032 0 3 12 1 2 1 89,3 4 1 495,4 357,3

01.12.2021 3:00 462,988 -4,8 0,032 0 3 12 1 3 1 89 5 1 490,8 445

01.12.2021 4:00 461,717 -4,3 0,032 0 3 12 1 4 1 83 5,3 1 487,3 439,9

30.06.2023 23:00 286,8 7,7 1 0 5 6 30 23 0 74,3 3 0 256,9 222,9

Определение вклада входных технологических параметров в значение прогноза. Для определения вклада каждого из технологических параметров в прогноз электропотребления использовался метод SHAP [18] (SHapley Additive explanations). Этот метод позволяет определить важность и вклад каждого параметра в результат прогноза при машинном обучении.

Вклад каждого параметра определяется с помощью SHAP-значений, вычисляемых по формуле:

SiО) => -г^-[/Os и {(}) - f(xs)],

где Si(x) - SHAP-значение для i-го параметра и наблюдения x; N - множество параметров, |N| - его размер; S - подмножество параметров, исключая i-й параметр; |S| - размер подмножества S; xs - наблюдение x с учетом только параметров из множества S; fxs U {i}) - прогноз модели для наблюдения xs, включая i-й параметр; f(xs) - прогноз для наблюдения xS.

В основе понятия SHAP-значений заложена идея распределения вклада каждого признака (параметра) в предсказание между всеми возможными комбинациями параметров. Происходит учет всех возможных перестановок признаков, определяющих насколько изменяется предсказание при добавлении или удалении отдельных параметров. Каждому параметру присваивается его SHAP-значение, которое показывает, насколько он внес вклад в прогнозируемое значение.

Для определения структуры обучающей выборки и выявления значимости каждого параметра построены графики для двух вариантов структуры входных данных (рис. 1). Графики 1,а и 1,б созданы на основе обработки исходных данных Bi и В2, соответственно.

Рис. 1. Выявление наиболее важных параметров для вариантов прогнозирования: а - Ви б - В2

На рис. 1 цветовая схема на графиках указывает на обозначение силы влияний параметров на прогноз: красный цвет указывает сильное влияние, синий цвет - на слабое. Значимость параметра определяется его очередностью (сверху вниз), чем выше находится параметр, тем больше его значения воздействуют на итоговый прогноз. Степень влияния на увеличение или уменьшение прогнозных значений определяется по оси абсцисс: чем больше параметр распределяется по оси абсцисс, тем больше он склонен к увеличению или уменьшению прогнозных значений. Параметры, которые не имеют распределения и сфокусированы на нулевом значении не вносят никаких изменений в прогноз.

Таким образом, на графиках отображены наиболее значимые по воздействию параметры вне зависимости от размера обучающей выборки, такими параметрами являются Шр, Н, Та, Та Получено, что наибольшее распределе-

ние (по оси абсцисс) имеет Wp (значение электропотребления за предыдущие сутки), определяющий сильную зависимость прогноза от значений Wp. Но даже при наименьшем значении параметра, (например, L не выходящем за переделы от -25 до 25 по оси абсцисс) он вносит вклад в итоговый выход модели.

С использованием метода SHAP получены интерпретируемые значения вклада каждого признака в конкретный прогноз модели. При этом входные параметры сравнивались между собой для определения значимости для конечного результата и определения их вклада в прогнозные значения. Те параметры, значимость которых высока, должны быть использованы для построения прогноза в обязательном порядке. Параметры, вносящие наименьший вклад, могут не рассматриваться, если не предъявляются высокие требования к точности прогноза. Отсутствие менее значимых параметров (в случае трудности сбора данных) позволяет сделать прогноз, но качество прогноза ухудшится.

По итогу метода анализа SHAP для рассматриваемых вариантов выявлены значимые параметры (в порядке убывания): значение электропотребления за предыдущие сутки Wp, время в часах Н, температура окружающей среды TA, доля длительности светового дня Ld, которые требуют обязательного присутствие в обучающей выборке для прогнозирования электропотребления.

Прогнозирование электропотребления с использованием деревьев решений. Для получения краткосрочного прогноза электропотребления с помощью метода Catboost [12], построен ансамбль деревьев решений. На рис. 2. показана структура построенного ансамбля деревьев решений (h0(x), ht(x), ..., ^"(х)).

Первое дере» йнслрлПпя где г - О

7 = 1

Рис. 2. Ансамбль деревьев решений

Рассмотрим подробнее построенный ансамбль деревьев решений. Видно, что ансамбль состоит из 1000 деревьев (которые строятся итерационно), выход каждого предыдущего дерева является входом в последующее (см. рис. 2). Автоматически формируется гиперпараметр, такой как максимальная глубина деревьев, а гиперпараметр, соответствующий их количеству, определяется методом поиска по сетке (Grid Search). Метод поиска Grid Search принято использовать при машинном обучении совместно с методом градиентного бустинга Catboost. Результат анализа устанавливает, что оптимальное расстояние от корневой вершины до любого из листьев составляет 10 узлов, итераций (деревьев) в ансамбле - 1000. При прогнозировании с использованием таких гиперпараметров модели переобучение не происходит.

В построенном ансамбле деревьев решений Catboost, первое дерево иллюстрирует начальное приближение целевой функции, так как ансамбль деревьев стремится аппроксимировать целевую функцию, чтобы производить наиболее точные прогнозы на основе обучающей выборки. Последующие деревья обучаются так, чтобы уточнить предсказания, сделанные предыдущими деревьями. Каждое последующее дерево пытается скорректировать ошибки и улучшить аппроксимацию целевой функции. Этот процесс продолжается итеративно, и ансамбль стремится приблизиться к оптимальной модели, которая минимизирует ошибку на обучающих данных и способна прогнозировать на новых.

Ансамбль деревьев решений основан на исходном наборе данных D = {(xtyt)}*=0...n, где xt = (xt1, ... , xtm) -случайный вектор из m признаков, аyt е R - числовая целевая переменная; вектор признаков x = {Ta, Ld, Cwd ,Nd, Nm, Nmd, H, L, ф, Vw, Ih, Wp, Mult}. Задача метода построения деревьев решений заключается в обучении функции F : Rm^R, которая минимизирует ожидаемую функцию потерь L(F):= EL(y,F(x)), где L(.,.) - функция потерь, а (x,y) тестовый пример выбранный из обучающего набора D.

Поясним работу градиентного бустинга, который последовательно улучшает прогнозы, создавая функции Ft (суммарный прогноз) для каждой итерации t. К каждой новой функции Ft добавляется предыдущая F-1 с определенным размером шага а, чтобы минимизировать потери. Для оптимизации каждой функции ht (базовая функция,

которая добавляется к Р, чтобы улучшить его на следующей итерации) применяется градиентный бустинг и аппроксимация методом наименьших квадратов. Применяемый метод Catboost использует бинарные деревья решений в качестве базовых предсказателей, что позволяет разделять пространство признаков на области, основываясь на значениях атрибутов разделения.

Каждой конечной области (листу дерева) присваивается значение, которое является оценкой целевой переменной у для задачи регрессии [17]. Таким образом, дерево решений к можно записать как к1(х) = £у=1 Ьу1|хек.-|, где Я, - непересекающиеся области, соответствующие листьям дерева; Ъ - значение, присвоенное листу дерева ] (как оценка целевой переменной).

Результаты краткосрочного прогнозирования электропотребления. Для оценивания качества работы и производительности сформированного ансамбля деревьев решений СаЛсюзЬ применялись метрики, характеризующие точность модели [3]. Значения метрик качества модели от различных структур входных данных и объемов обучающей выборки представлены в табл. 2.

Таблица 2

Метрики качества модели прогнозирования электропотребления_

Метрики прогноза Вариант прогноза

В1 В2

МАРЕтсЛ, 1.39% 2.05%

МАРЕ 1.94% 2.76%

КМБЕ 7.03 11.46

Я2 0.994 0.986

Используя набор данных В1 с полными технологическими параметрами, модель продемонстрировала лучшие результаты прогнозирования, как указано в таблице 2. Метрика ЯМБЕ показала небольшую разницу между фактическими и прогнозируемыми значениями (7.03 МВт*ч в лучшем варианте В1), и коэффициент детерминации Я2 = 0.994, что говорит о хорошем соответствии модели фактическим данным (99.4%). Метрика МАРЕ также подтвердила качество прогноза средней абсолютной процентной ошибкой в 1.94%.

На основании полученных результатов сделан вывод о том, что для краткосрочного (на сутки вперед) прогнозирования электропотребления целесообразно использовать полный набор доступных технологических параметров, так как он позволяет модели выявить существующие закономерности и зависимости в данных.

График краткосрочного прогнозирования электропотребления методом машинного обучения Са1Ъсс&1 за период с 01.07.2023 по 31.07.2023 г. представлен на рис. 3.

375

X 350 *

I-

ш

£ 325 О)

из ш

о

ф с;

(П 225

У.

I

Фактиче«кое электропотреблемие С /четом выборочных параметров, 2.76% С учетом всех параметров. 1.94%

ш

2023 0705 2023-07-09 2023 07.(3 3023-0717

Время, сутки

2023 07.21 2023-07-25 2023-07-29 2023-08 01

а)

/у -

V

б)

1 / \

\ \ / / в)

Рис. 3. Прогнозирование электропотребления на сутки вперед в полном диапазоне (а): и в увеличенном масштабе в период выходного (б) и рабочего дня (в)

Синим цветом на графике представлено распределение ретроспективных данных за июль 2023 года, желтым - значения прогноза модели с набором данных В2, зеленым - значения прогноза модели с полным набором технологических параметров. Рис. 3, а иллюстрирует качество прогнозирования электропотребления на сутки вперед (полный диапазон значений). Для наглядности на рис. 3, б и 3, в показаны периоды выходного и рабочего дней (в увеличенном масштабе), в которых наблюдается присутствие ошибки между прогнозируемыми значениями электропотребления и реальными (ретроспективными) данными. Прослеживается, что на графиках в увеличенном мас-

229

штабе (выходной и рабочий дни) наилучшие результаты получены моделью с полным набором технологических параметров (Bi). Ошибка прогноза уменьшилась на 0.82% по метрике MAPE, что является существенным улучшением точности прогнозирования электропотребления.

Обсуждение результатов. В результате исследования сформирована обучающая выборка, выбрана структура данных для прогнозирования электропотребления методом машинного обучения на основе градиентного бустинга деревьев решений Catboost. Сделан вывод о том, что количество наблюдений и параметров в обучающей выборке влияют на конечные результаты прогнозных значений (Bi MAPE = 1,94%, В2 MAPE = 2,76%). Выявление значимых параметров позволяет не включать в обучающую выборку параметры, имеющих наименьших вклад, отсутствие которых позволит сделать прогноз, но с потерей качества.

Заключение. Проведенные исследования позволили установить, что использование метода машинного обучения на основе градиентного бустинга деревьев решений Catboost [12] для прогнозирования электропотребления на краткосрочный период является эффективным подходом.

Метод градиентного бустинга деревьев решений, использованный в исследовании, уменьшает дисперсию прогнозов и обладает устойчивостью к переобучению, что доказывает его функциональность на больших обучающих выборках. Модель, обученная на большой выборке, также более устойчива к случайным флуктуациям данных и аномалиям.

В дальнейшем планируется исследовать возможность использования эффективного метода градиентного бустинга XGBoost [19] (имеет более гибкую настройку, в отличие от Catboost) для краткосрочного прогнозирования электропотребления, и объединение этих двух методов. Применение представленных методов позволит в дальнейшем энергосбытовым компаниям планировать необходимый объем резерва электроэнергии.

Список литературы

1. Валь П.В. Краткосрочное прогнозирование электропотребления горного предприятия с использованием однофакторных методов // Вестник Сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. 2011. № 2(35). С. 12-17.

2. Исследование методов аппроксимации для решения задачи краткосрочного прогнозирования суточного электропотребления / Р.Н. Хамитов, А.С. Грицай, И.В. Червенчук, Г.Э. Синицин // Вестник Самарского государственного технического университета. Серия: Технические науки. 2016. № 4(52). С. 91-98.

3. Горшенин А.Ю., Денисова Л.А. Прогнозирование выработки электроэнергии ветроэлектростанцией с применением рекуррентной нейронной сети // Известия Тульского государственного университета. Технические науки. 2023. № 4. С. 39-45.

4. Денисова Л.А. Математическая модель цифровой системы регулирования с переменными параметрами // Автоматизация в промышленности. 2011. №9. С. 45-48.

5. Горшенин, А. Ю. Методы прогнозирования в информационных системах // Прикладная математика и фундаментальная информатика: Материалы XII Международной молодежной научно-практической конференции с элементами научной школы, Омск, 16-21 мая 2022 года / Отв. редактор А.В. Зыкина. Омск: Омский государственный технический университет. 2022. С. 82-83.

6. Васина, Д. И. Актуальные проблемы применения солнечной электроэнергии и прогнозирования // Информационные технологии в науке и производстве : Материалы X Всероссийской молодежной научно-технической конференции, Омск, 18 апреля 2023 года / Редколлегия: А.Г. Янишевская (отв. ред.) [и др.]. Омск: Омский государственный технический университет, 2023. С. 89-91.

7. Васина, Д. И. Описание программы для проведения анализа выработки мощности постоянного и переменного токов солнечной электростанции // Актуальные вопросы энергетики : Материалы Всероссийской научно-практической конференции с международным участием, Омск, 25-26 мая 2023 года / Редколлегия: П.А. Батраков (отв. ред.) [и др.]. - Омск: Омский государственный технический университет, 2023. С. 133-137.

8. Свидетельство о государственной регистрации программы для ЭВМ № 2023663519 Российская Федерация. Предварительная обработка: заполнения пропусков в данных : № 2023662273 : заявл. 13.06.2023 : опубл. 23.06.2023 / А. Ю. Горшенин, Д. И. Васина ; заявитель Федеральное государственное автономное образовательное учреждение высшего образования «Омский государственный технический университет».

9. Свидетельство о государственной регистрации программы для ЭВМ № 2023611595 Российская Федерация. Программа для прогнозирования выработки электроэнергии ветроэлектростанции методом LSTM : № 2022686636 : заявл. 30.12.2022 : опубл. 23.01.2023 / А. Ю. Горшенин ; заявитель Федеральное государственное автономное образовательное учреждение высшего образования «Омский государственный технический университет».

10. Воевода А.Е., Харитонова Д.Д., Валь П.В. Краткосрочное прогнозирование электропотребления на основе метода случайного леса // Электроэнергетика глазами молодежи - 2016 : Материалы VII Международной молодёжной научно-технической конференции. В 3 т., Казань, 19-23 сентября 2016 года. Том 2. - Казань: Казанский государственный энергетический университет. 2016. С. 124-127.

11. Горшенин А.К., Мартынов О.П. Гибридные модели экстремального градиентного бустинга для восстановления пропущенных значений в данных об осадках // Информатика и ее применения. 2019. Т. 13, № 3. С. 3440.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. CatBoost: unbiased boosting with categorical features / L. Prokhorenkova, G. Gusev, A. Vorobev, A. V. Do-rogush, A. Gulin // Advances in Neural Information Processing Systems. 2018. PP. 6638-6648. URL : https://arxiv.org/pdf/1706.09516.pdf

13. Горшенин А.Ю., Николаев А.В. Прогнозирование энергопотребления: анализ ежедневных моделей и факторов влияния // Актуальные вопросы энергетики : Материалы Всероссийской научно-практической конференции с международным участием, Омск, 25-26 мая 2023 года / Редколлегия: П.А. Батраков (отв. ред.) [и др.]. - Омск: Омский государственный технический университет. 2023. С. 152-154.

14. Восход и заход солнца. // Datetime : URL: https://dateandtime.info/ru/ (дата обращения: 25.09.2023).

15. Производственные календари. // КонсультантПлюс [Электронный ресурс] URL: https://www.consultant.ru/law/ref/calendar/proizvodstvennye (дата обращения: 25.09.2023).

230

16. Администрация города Мурманска. // Официальный сайт администрации города Мурманска [Электронный ресурс] URL: https://www.citymurmansk.ru (дата обращения: 25.09.2023).

17. Wan X. et al. Estimating the sample mean and standard deviation from the sample size, median, range and/or interquartile range //BMC medical research methodology. 2014. Т. 14. С. 1-13.

18. Friedman. J. H. Greedy function approximation: a gradient boosting machine // Annals of statistics. 2001. PP.

1189-1232.

19. Chen, T., Guestrin, C. XGBoost: A scalable tree boosting system, arXiv.org. Available at, 2016. DOI: 10.48550/arXiv.1603.02754.

Горшенин Алексей Юрьевич, аспирант, [email protected], Россия, Омск, Омский государственный технический университет,

Грицай Александр Сергеевич, канд. техн. наук, доцент, заведующий кафедрой, [email protected]. Россия, Омск, Омский государственный технический университет,

Денисова Людмила Альбертовна, д-р техн. наук, профессор, denisova@asoiu. com, Россия, Омск, Омский государственный технический университет

APPLICATION OF MACHINE LEARNING OF DECISION TREES FOR SHORT-TERM FORECASTING OF ELECTRICITY

CONSUMPTION

A.Y. Gorshenin, A.S. Gritsay, L.A. Denisova

The paper examines the issues of short-term forecasting of electrical energy using machine learning of an ensemble of decision trees for gradient boosting Catboost. Significant technological parameters and the size of the training sample were determined to build a forecast ofpower consumption for the day ahead with the required accuracy.

Key words: electricity consumption forecasting, machine learning, decision trees, gradient boosting.

Gorshenin Alexey Yurievich, postgraduate, [email protected], Russia, Omsk, Omsk State Technical University,

Gritsay Alexander Sergeevich, candidate of technical sciences, docent, head of the department, [email protected], Russia, Omsk, Omsk State Technical University,

Denisova Lyudmila Albertovna, doctor of technical science, professor, denisova@asoiu. com, Russia, Omsk, Omsk State Technical University

УДК 624.139

DOI: 10.24412/2071-6168-2023-11-231-232

РЕКОМЕНДАЦИИ ПО ИНЖЕНЕРНОЙ ПОДГОТОВКЕ ТЕРРИТОРИИ С МНОГОЛЕТНЕМЕРЗЛЫМИ ГРУНТАМИ

Г.С. Ладышкин, А.В. Федоренко

В статье представлены результаты анализа грунтов на крайнем севере, при этом особое внимание уделено рассмотрению многолетнемерзлым грунтам. Предложены и рассмотрены особенности организации и проведения инженерной подготовки территорий с этими грунтами, на которых планируется строительство или проведение других земляных работ. Рассматриваются рекомендации по расчету их объема и проведению, с целью снижения стоимости работ и сохранению целостности мерзлого грунта в первозданном состоянии.

Ключевые слова: многолетнемерзлые грунты, инженерная подготовка территории.

В последнее время уделяется большое внимание развитию северных территорий. Суровые климатические условия и удалённость от центров с развитой инфраструктурой, сложности логистики являются лишь малой частью тех факторов, которые делают строительство на этих территориях особенным. Однако, современные технологии и материалы, а также новые подходы к организации процессов строительства позволяют достигать успеха в этой области. В целом, тенденции развития строительства на Крайнем Севере показывают, что это направление имеет потенциал для дальнейшего развития и роста. Однако, для успешной реализации проектов необходимо учитывать все особенности региона и применять подходы, которые бы максимально учитывали интересы всех заинтересованных сторон и экологические нормы.

На Крайнем Севере нашей страны интенсивно осваивают районы с многолетнемерзлыми грунтами. Одной из главных проблем, с которыми сталкиваются там строители, является суровый климат и особенности грунтовых условий. Инженерная подготовка территорий с такими грунтами сложна и проектируют ее с учетом условий, необычных для других районов.

Анализ территорий с многолетнемерзлыми грунтами. Многолетнемерзлыми грунтами называется толща промороженных грунтов, всегда имеющая отрицательную или нулевую температуру. Обычно температура грунта колеблется от 0°С до минус 7°С. В таком состоянии многолетнемерзлые грунты могут сохраняться неопределенно долгое время - до нескольких тысячелетий.

i Надоели баннеры? Вы всегда можете отключить рекламу.