Научная статья на тему 'ВЫБОР ОПТИМАЛЬНОЙ МОДЕЛИ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПАРАМЕТРОВ НА НЕФТЕГАЗОВОМ МЕСТОРОЖДЕНИИ'

ВЫБОР ОПТИМАЛЬНОЙ МОДЕЛИ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПАРАМЕТРОВ НА НЕФТЕГАЗОВОМ МЕСТОРОЖДЕНИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
предиктивная аналитика / нейронные сети / нефтегазовое месторождение / временные ряды / predictive analytics / neural networks / oil gas field / time series / PatchTST / DLinear

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Солдатова П.Д.

В данной статье рассматривается задача выбора оптимальной модели нейронной сети для предиктивной аналитики нефтегазового месторождения. Проведено сравнительное анализ метрик и эффективности работы различных моделей, включая рекуррентные нейронные сети (RNN, LSTM, GRU), модель ARIMA, DLinear и PatchTST. Результаты экспериментов на реальных данных показали, что модели PatchTST и DLinear превосходят другие модели по точности прогнозирования, при этом PatchTST демонстрирует более стабильное обучение.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Солдатова П.Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHOOSING OPTIMAL NEURAL NETWORK MODEL TO PREDICT PARAMETERS AT OIL AND GAS FIELD

This article discusses the problem of choosing the optimal neural network model for predictive analytics of an oil and gas field. A comparative analysis of metrics and performance of various models, including recurrent neural networks (RNN, LSTM, GRU), the ARIMA model, DLinear and PatchTST, was carried out. The results of experiments on real data showed that the PatchTST and DLinear models are superior to other models in terms of prediction accuracy, while PatchTST demonstrates more stable learning.

Текст научной работы на тему «ВЫБОР ОПТИМАЛЬНОЙ МОДЕЛИ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПАРАМЕТРОВ НА НЕФТЕГАЗОВОМ МЕСТОРОЖДЕНИИ»

УДК 004

Солдатова П.Д.

студент факультета естественных и технических наук направления подготовки 01.04.02 Прикладная математика и информатика, профиль «Математическое моделирование и вычислительные технологии» Камчатский государственный университет им. Витуса Беринга (г. Петропавловск-Камчатский, Россия)

ВЫБОР ОПТИМАЛЬНОЙ МОДЕЛИ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ПАРАМЕТРОВ НА НЕФТЕГАЗОВОМ МЕСТОРОЖДЕНИИ

Аннотация: в данной статье рассматривается задача выбора оптимальной модели нейронной сети для предиктивной аналитики нефтегазового месторождения. Проведено сравнительное анализ метрик и эффективности работы различных моделей, включая рекуррентные нейронные сети (^Ы, LSTM, GRU), модель ARIMA, DLinear и PatchTST. Результаты экспериментов на реальных данных показали, что модели PatchTST и DLinear превосходят другие модели по точности прогнозирования, при этом PatchTST демонстрирует более стабильное обучение.

Ключевые слова: предиктивная аналитика, нейронные сети, нефтегазовое месторождение, временные ряды.

С развитием технологий добычи нефти растет потребность в эффективных методах оптимизации процессов на нефтедобывающих объектах для повышения производительности и снижения затрат. В данной работе мы исследуем потенциал нейронных сетей для решения производственных задач в данной области.

В исследовании были рассмотрены следующие модели:

1. Рекуррентные нейронные сети (КЫЫ, LSTM, GRU): Эти модели способны учитывать временные зависимости в данных. [3]

2. Модель ARIMA: Статистическая модель, широко используемая для анализа и прогнозирования временных рядов. [2]

3. DLinear: Линейная модель, основанная на прогнозировании скользящего среднего и остатка временного ряда. [1]

4. PatchTST: Модель на основе архитектуры трансформеров, адаптированная для работы с временными рядами. [4]

Модели были обучены на реальных данных, собранных с нефтегазового месторождения. Для оценки производительности использовались метрики средней абсолютной ошибки (MAE), среднеквадратичной ошибки (MSE) и времени работы.

До обучения была произведена предобработка данных. В этот этап входят удаление дублирующей информации, преобразование типов (например, из пустых или неопределенных), агрегация данных, построение корреляционных матриц для каждой агрегации.

t

Рис. 1. Корреляционная матрица по одной аппроксимации.

Во-первых, хотелось бы прокомментировать название точек х и у. Они совпадают по значению (последовательность в х и в у). Первым указано время,

а дальше наименование тега, чье значение заводилось как параметр для анализа. Цветовая кодировка представлена справа. Согласно данной кодировке, мы можем наблюдать, что параметр 2 имеет корреляцию примерно в 0,8с параметром времени. А параметр 4 и параметр времени имеют корреляцию в районе -0,4 что свидетельствует о высокой степени линейной корреляции). Также, в данной матрице есть строчки полностью пустые. Хотелось бы объяснить значение данной ситуации. Такое происходит, когда в значении параметра изначально были написаны None (то есть значения пустые) и, соответственно, на этапе предобработки такие значения были заменены на 0.

Ниже представлена таблица исследуемых моделей, значения ошибок и среднее время обучения за одну эпоху.

Таблица 1. Сравнительная таблица метрик моделей нейронных сетей.

Модель MAE MSE Time

RNN, LSTM, 1,014354 (LSTM) 2,338558 (LSTM) 0:02

GRU 0,651236(GRU/RNN) 1,524731 (GRU/RNN)

ARIMA 0,045116 0,002057 -

DLiner 0,170364 0,36932 0:08

PatshTST 0,160411 0,314111 1:04

ARIMA, в отличие от других моделей, может предсказывать только один временной ряд и поэтому время на обучение замерять смысла не имеет.

На этапе выбора моделей были сформулированы следующие выводы:

1. Рекуррентные модели значительно проигрывают по метрикам и нестабильны в обучении (быстро переобучаются).

2. ЛИНЛ не подходит для долгосрочного прогнозирования, а также такого большого объема данных. Также модель не может работать с признаками в виде (0, выброс 1).

3. PatchTST и DLiner по метрикам примерно равны, но первый немного выигрывает. DLiner более нестабильно обучается. Но PatchTST учится дольше всех остальных моделей.

На основании проведенного исследования были определены две модели, с которыми будет продолжена работа: PatchTST и DLiner.

СПИСОК ЛИТЕРАТУРЫ:

1. Ailing Zeng, Muxi Chen, Leu Zhang, Qiang Zu. Are Transformers Effective for Time Series Forecasting. arXiv:2205.13504v3 [cs.AI] 17 Aug 2022;

2. Cory Maklin. ARIMA в Машинном обучении простыми словами (Электронный ресурс). Режим доступа: https://dzen.rU/a/YZEwepOAkzwHBmOi (дата обращения 10.02.2024);

3. RNN, LSTM, GRU и другие рекуррентные нейронные сети. (Электронный ресурс). Режим доступа: http://vbystricky.ru/2021/05/rnn_lstm_gru_etc.html (дата обращения 20.01.2024);

4. Yuqi Nie, Nam H. Nguyen, Phanwadde Sinthong, Jayant Kalagnanam. A time series is worth 64 words: Long-term forecasting with transformers. arXiv:2211.14730v2 [cs.LG] 5 Mar 2023

Soldatova P.D.

Kamchatka State University named after Vitus Bering (Petropavlovsk-Kamchatsky, Russia)

CHOOSING OPTIMAL NEURAL NETWORK MODEL TO PREDICT PARAMETERS AT OIL AND GAS FIELD

Abstract: this article discusses the problem of choosing the optimal neural network model for predictive analytics of an oil and gas field. A comparative analysis of metrics and performance of various models, including recurrent neural networks (RNN, LSTM, GRU), the ARIMA model, DLinear and PatchTST, was carried out. The results of experiments on real data showed that the PatchTST and DLinear models are superior to other models in terms of prediction accuracy, while PatchTST demonstrates more stable learning.

Keywords: predictive analytics, neural networks, oil gas field, time series, PatchTST,

DLinear.

i Надоели баннеры? Вы всегда можете отключить рекламу.