Научная статья на тему 'ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ДЛЯ РЕДУКЦИИ ПРИЗНАКОВОГО ПРОСТРАНСТВА НАГНЕТАТЕЛЬНЫХ СКВАЖИН'

ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ДЛЯ РЕДУКЦИИ ПРИЗНАКОВОГО ПРОСТРАНСТВА НАГНЕТАТЕЛЬНЫХ СКВАЖИН Текст научной статьи по специальности «Энергетика и рациональное природопользование»

CC BY
46
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТОРНЫЙ АНАЛИЗ / НАГНЕТАТЕЛЬНАЯ СКВАЖИНА / НЕФТЯНАЯ СКВАЖИНА / FACTOR ANALYSIS / INJECTION WELL / OIL WELL

Аннотация научной статьи по энергетике и рациональному природопользованию, автор научной работы — Вирстюк А.Ю., Микшина В.С.

В данной статье рассмотрена проблема определения эффективности работы нефтяных скважин. Проведены выбор и краткое описание показателей работы нагнетательных скважин, оказывающих косвенное влияние на основную характеристику нефтяной скважины - дебит. Между выделенными характеристиками нагнетательных скважин установлена взаимозависимость, в связи с чем проведен факторный анализ с целью объединения их в группы (факторы), независимые между собой. Для определения и прогнозирования эффективности работы нефтяных скважин между полученными факторами и дебитом установлена зависимость в виде уравнения регрессии. Для проведения многомерного анализа исходных данных применен программный пакет статистической обработки данных Statistica.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по энергетике и рациональному природопользованию , автор научной работы — Вирстюк А.Ю., Микшина В.С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FACTOR ANALYSIS APPLICATION FOR REDUCTION OF THE ATTRIBUTE SPACE OF INJECTION WELLS

The article considers the problem of determining the efficiency of oil wells. A choice and a brief description of performance indicators of injection wells are presented. These indicators have the indirect effect on the main feature of an oil well - the production rate. The correlation between highlighted characteristics is established; therefore the factor analysis to combine them into the independent groups (factors) is carried out. The regression equation for determining and predicting the efficiency of wells is applied to describe the relation between obtained factors and the production rate. Software package STATISTICA is used for the multivariate analysis of the initial data.

Текст научной работы на тему «ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ДЛЯ РЕДУКЦИИ ПРИЗНАКОВОГО ПРОСТРАНСТВА НАГНЕТАТЕЛЬНЫХ СКВАЖИН»

УДК 622.276.432:004.9

ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ДЛЯ РЕДУКЦИИ ПРИЗНАКОВОГО ПРОСТРАНСТВА

НАГНЕТАТЕЛЬНЫХ СКВАЖИН

А. Ю. Вирстюк 1, В. С. Микшина 2

1 Сургутский государственный университет, Nastua5.1991@mail.ru

2 Сургутский государственный университет, Mikshinavs@gmail.ru

В данной статье рассмотрена проблема определения эффективности работы нефтяных скважин. Проведены выбор и краткое описание показателей работы нагнетательных скважин, оказывающих косвенное влияние на основную характеристику нефтяной скважины

- дебит. Между выделенными характеристиками нагнетательных скважин установлена взаимозависимость, в связи с чем проведен факторный анализ с целью объединения их в группы (факторы), независимые между собой. Для определения и прогнозирования эффективности работы нефтяных скважин между полученными факторами и дебитом установлена зависимость в виде уравнения регрессии. Для проведения многомерного анализа исходных данных применен программный пакет статистической обработки данных Statistica.

Ключевые слова: факторный анализ, нагнетательная скважина, нефтяная скважина.

FACTOR ANALYSIS APPLICATION FOR REDUCTION OF THE ATTRIBUTE SPACE OF INJECTION WELLS

A. Yu. Virstyuk 1, V. S. Mikshina 2

1 Surgut State University, Nastua5.1991@mail.ru

2 Surgut State University, Mikshinavs@gmail.ru

The article considers the problem of determining the efficiency of oil wells. A choice and a brief description of performance indicators of injection wells are presented. These indicators have the indirect effect on the main feature of an oil well - the production rate. The correlation between highlighted characteristics is established; therefore the factor analysis to combine them into the independent groups (factors) is carried out. The regression equation for determining and predicting the efficiency of wells is applied to describe the relation between obtained factors and the production rate. Software package STATISTICA is used for the multivariate analysis of the initial data.

Keywords: factor analysis, injection well, oil well.

Окружающий нас мир многомерен в том смысле, что каждый объект характеризуется множеством параметров. Человеческий мозг не способен одновременно оперировать более чем тремя измерениями пространства, что приводит к сложностям при анализе данных. Для сведения многомерных данных к нескольким измерениям с минимальными потерями информации была разработана специальная группа методов статистического анализа данных

- многомерный анализ данных.

Одним из методов статистического многомерного анализа является факторный анализ. Этот метод применяется при наличии взаимозависимых показателей и преследует две цели: сокращение числа переменных и классификация переменных с целью определения структуры взаимосвязей между ними [6].

В рамках данной работы будет рассмотрено применение факторного анализа для редукции признакового пространства нагнетательных скважин с целью дальнейшего прогнозирования дебита нефтяных скважин и оценки их эффективности.

Эффективность работы нефтяных скважин во многом определяется такими показателями, как: вязкость, нефтенасыщенность, однородность, темпы отбора жидкости и пр., то есть группами геологических и технологических параметров, число которых может измеряться несколькими десятками.

Но, зачастую, большой, хотя и косвенный вклад в объемы добываемой нефти вносят нагнетательные скважины, которые оказывают влияние на зависимые от них нефтяные скважины, осуществляя закачку воды в пласты. В геологии данный процесс носит название интерференции.

Поэтому очень важно при оценке работы нефтяных скважин учитывать и параметры влияющих на них нагнетательных скважин. Для того, чтобы исключить взаимозависимость между показателями работы нагнетательных скважин и объединить наиболее близкие из них в группы (так называемые факторы), требуется применение факторного анализа.

В общем виде, зависимость между дебитом нефтяной скважины и нормированными показателями работы влияющей нагнетательной скважины, объединенными в группы (факторы), можно представить формулой (1):

У= Ь0 + + № + •••+ Ьт,. (1)

где У - дебит нефтяной скважины;

Ь0 - прочие факторы, влияющие на работу нефтяной скважины;

Ь^ - коэффициенты уравнения регрессии;

^ - группы (факторы) показателей работы влияющих нагнетательных скважин.

Наиболее важные показатели работы нагнетательных скважин, к которым и будет применен факторный анализ, представлены ниже:

1. Время работы скважины (час) - Р1

2. Объем закачиваемой жидкости (м3) - Р2

3. Давление закачки или буферное давление (ат) - Р3

4. Приемистость (м /сут) - Р4

5. Коэффициент охвата пласта заводнением (%) - Р5

6. Эффективная мощность пласта (м) - Р6.

Если первые три показателя интуитивно понятны, то остальные следует рассмотреть подробнее.

Приемистость нагнетательной скважины определяется объемом воды (жидкости, реагентов), закачиваемым в пласт в единицу времени. Коэффициент охвата пласта заводнением рассчитывается при анализе профиля приемистости скважины по формуле (2):

/„раб + „раб + ^ + ярабХ ^ 3аВ = ( 1 + ^раб+нераб " ] * 100, (2)

где Ян™ зав - охват пласта заводнением в интервале перфорации, %;

яраб,я2раб,..,яраб - мощность 1, 2......п работающих пропластков в интервале

перфорации, м;

„раб+нераб

- суммарная мощность работающих и неработающих пропластков в интервале перфорации, м [1-2].

Эффективная мощность пласта представляет собой суммарную мощность (толщину) нефтяных (газонасыщенных) прослоев в пласте, способных отдавать нефть (газ).

Для проведения факторного анализа были отобраны данные со 100 нагнетательных скважин. Полученные данные актуальны на декабрь 2017 г. Так как исходные показатели несопоставимы в силу различной размерности, то сначала целесообразно получить нормированные (стандартизированные) данные, которые рассчитываются по формуле (3):

„ _ Рц - ^ (3)

= ^ ,

где Хц - нормированное значение показателя;

Ри - исходное значение показателя;

ДI — математическое ожидание /-ого показателя работы, полученное по 100 нагнетательным скважинам;

07 — среднеквадратическое отклонение [3].

В табл. 1 представлены показатели работы по некоторым нагнетательным скважинам, а также ^ и 07 для каждого показателя, необходимые для стандартизации исходных значений.

Таблица 1

Показатели работы нагнетательных скважин и параметры выборки

№ р1 Р? Р4 Р* п

1 720 27979 137 935 81,82 11

2 720 4316 144 150 100 8

3 720 18943 137 590 100 4

4 720 17574 97 429 17,95 4,6

5 720 1663 137 58 100 2

6 528 55 130 2 100 3,2

7 720 6635 123 130 100 3,8

8 720 3775 129 178 100 4,2

9 96 23 122 10 94,2 13,8

10 720 79 127 3 7,79 15,4

• • •

100 720 3775 127 450 100 4

н 679,92 5529 104,01 184 85,43 9,57

140,82 5337,61 27,57 180 22,58 6,59

Как уже отмечалось ранее, показатели работы нагнетательных скважин характеризуются взаимозависимостью, исключить которую можно путем объединения их в факторы. Для оценки взаимозависимости необходимо построить корреляционную матрицу, которая представляет собой матрицу коэффициентов корреляции. Кроме того, корреляционная матрица позволяет определить возможность сокращения признакового пространства.

Связь между показателями работы скважины можно считать сильной, если коэффициент корреляции составляет от ±0,7 до ±1, ; средней - если коэффициент имеет значения от ±0,3 до ±0,699. В остальных случаях связь можно считать слабой [7].

В табл. 2 представлена корреляционная матрица, полученная на основе нормированных показателей работы нагнетательных скважин. Из нее видно, что сильная и средняя корреляционная связь проявляется между нормированными переменными Х2 и Х4, Х3и Х6, Х5и Х6.

Таблица 2

Корреляционная матрица

хл х2 ** **

ХЛ 1,00 0,17 -0,07 0,13 0,13 0,00

0,17 1,00 0,01 0,89 -0,15 0,10

-0,07 0,01 1,00 0,04 0,03 -0,25

0,13 0,89 0,04 1,00 -0,15 0,15

Хв 0,13 -0,15 0,03 -0,15 1,00 -0,27

х6 0,00 0,10 -0,25 0,15 -0,27 1,00

Соответственно, предварительный анализ данных подтверждает возможность сокращения размерности признакового пространства и выделение факторов, число которых будет меньше числа исходных переменных (т. е. меньше 6). Полученные таким образом факторы будут исключать взаимозависимость исходных показателей и упростят уравнение регрессии (1), позволяющее прогнозировать эффективность работы нефтяной скважины в зависимости от показателей работы влияющих нагнетательных скважин.

Для редукции исходных данных был выбран программный пакет Statistica. В ходе проведения факторного анализа методом главных компонент каждому выделенному фактору ставится в соответствие своя дисперсия, называемая собственным значением [4-5, 8]. Если предположить, что число главных факторов равно числу исходных переменных, т. е. 6, то можно получить следующие значения:

Таблица 3

Некоторые характеристики выделенных факторов

№ Собственные значения % от общей дисперсии

1 2,018785 33,64642

2 1,333924 22,23206

3 1,119885 18,66475

4 0,775039 12,91731

5 0,642738 10,71229

6 0,109629 1,82716

Собственное значение фактора, меньшее единицы, указывает на то, что изменчивость соответствующего главного фактора меньше изменчивости любого из исходных показателей, и тогда такие факторы исключаются из дальнейшего анализа в силу своей малой информативности [3]. Этот метод определения числа главных факторов носит название метода Кайзера. Из табл. 3 видно, что у первых трех выделенных факторов собственные значения больше 1. Это указывает на то, что фактор выделяет дисперсию, эквивалентную, по крайне мере, дисперсии одной переменной.

Далее следует рассмотреть матрицу с факторными нагрузками, которая показывает корреляции между переменными и выделенными факторами.

Таблица 4

Матрица факторных нагрузок

Рз Р4 Рб

-0,237 -0,266 0,727 0,581 -0,087 -0,008

х2 -0,931 -0,224 -0,029 -0,164 -0,042 0,233

0,059 -0,581 -0,592 0,432 0,350 0,014

х4 -0,936 -0,198 -0,069 -0,157 0,040 -0,234

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

** 0,333 -0,551 0,470 -0,423 0,431 0,005

-0,327 0,730 0,122 0,143 0,569 0,020

Из табл. 4 видно, что первым трем факторам соответствуют большие значения коэффициентов корреляции, чем остальным факторам. Причем, с увеличением номера фактора значения коэффициентов корреляции стремительно уменьшаются. Как известно, факторные нагрузки должны объединять переменные в группы, для которых коэффициенты корреляции с факторами принимают большие значения по одной группе и меньшие значения по другой [5, 9]. В данном случае, в первом факторе доминируют первый и третий показатели, второй описывает пятый и шестой, а третий фактор, в свою очередь, первый и третий исходный показатель.

Матрица факторных нагрузок показывает, что остальные факторы являются малоинформативными, поэтому их не стоит интерпретировать.

В основном, процедура поиска главных факторов подобна вращению, максимизирующему дисперсию (варимакс) исходного пространства переменных [3, 10]. Вращение факторов приводит к повороту осей, что, в свою очередь, позволяет получить интерпретируемое решение. К примеру, второй фактор (табл. 4), описывающий пятый и шестой исходные показатели работы скважин, имеет достаточно высокий коэффициент и для третьего параметра, что ставит под сомнение правильность выделения факторов.

После проведения процедуры Varimax row (варимакс исходных) пакета Statistica была получена матрица факторных нагрузок (табл. 5).

Таблица 5

Матрица факторных нагрузок после вращения

Fi f2 F3

0,409 -0,138 -0,638

Х2 0,973 0,068 0,026

Хз 0,235 -0,117 0,777

Х4 0,965 0,045 0,022

Хв -0,183 -0,801 -0,249

хв -0,031 0,797 -0,321

На основе табл. 5 можно сделать вывод, что выполненный поворот осей подтверждает правильность выделения главных факторов, так как первый фактор отвечает за процессы закачки, второй - за профиль приемистости, а третий - за режим нагнетания, так как в течение всего периода работы нагнетательной скважины давление закачки (нагнетания) должно быть оптимальным.

После всех выполненных процедур можно записать линейные уравнения регрессии, которые связывают исходные показатели работы нагнетательных скважин и выделенные

факторы:

^ = 0,21* Х1 + 0,46 *Х2 + 0,11 *Х3 + 0,45 * Х4 — 0,04 * Х5 — 0,05 * Х6, (4)

¥г = —0,15 * Х1 + 0*Х2 — 0,07 *Х3 — 0,02 * Х4 — 0,61 * Х5 + 0,6 * Х6, (5)

^ = —0,55 * Х1 + 0,01 *Х2 + 0,65 *Х3 + 0,01 *Х4 — 0,24 *Х5 — 0,24 * Х6. (6)

Учитывая вклад каждого показателя в фактор на основе матрицы факторных нагрузок, полученной после вращения, можно уравнения (4)-(6) свести к виду (7)—(9):

= 0,46 *Х2 + 0,45 * Х4, (7)

¥г = —0,61 *Х5 + 0,6 * Х6, (8)

^ = —0,55 * Х1 + 0,65 * Х3. (9)

Предварительный графический анализ регрессионных остатков подтвердил адекватность построенных моделей для каждого выделенного фактора, об этом свидетельствует стремление распределения к нормальному виду.

Уравнение регрессии (1), определяющее зависимость дебита интерферирующих нефтяных скважин от эффективности работы нагнетательной скважины, можно представить в следующем виде:

У= Ь0+Ь1Р1+ Ъ2?2+ ^3^3, (10)

где Ь^ - коэффициенты регрессии, которые будут получены экспериментальным

путем;

Ь0 - прочие факторы, влияющие на работу нефтяной скважины; ^ - факторы, объединяющие показатели работы нагнетательных скважин. Таким образом, можно сделать вывод, что факторный анализ применим для исследования нагнетательных скважин с целью снижения признакового пространства. В

работе была подтверждена возможность сокращения 6 исходных признаков до 3 главных факторов. Для этого были получены и проанализированы корреляционная матрица, матрица факторных нагрузок до и после вращения, собственные значения. Выделенный первый фактор отвечает за процессы закачки, второй - за профиль приемистости нагнетательной скважины, а третий - за режим нагнетания. С их помощью составлено уравнение регрессии (10), которое в дальнейшем будет использовано для оценки эффективности работы нефтяных скважин на основе собственных характеристик нефтяных скважин и влияющих показателей работы нагнетательных скважин.

Литература

1. Вирстюк А. Ю. Разработка модуля по контролю нагнетательных скважин с неравномерным профилем приемистости // Север России: стратегии и перспективы развития : материалы II Всерос. науч.-практич. конф. 2016. Сургут, 2016. С. 140.

2. Вирстюк А. Ю., Микшина В. С. Применение математических моделей для оценки эффективности работы добывающих скважин // Информационная безопасность регионов России (ИБРР-2017) : материалы юбилейной X Санкт-Петербургской межрегион. конф. СПб., 1-3 ноября 2017 г. СПб. : СПОИСУ, 2017. С. 373-374.

3. Тихомиров Н. П. Методы эконометрики и многомерного статистического анализа. М. : Экономика, 2011. 647 с.

4. Токарев М. А., Чинаров А. С. Статистические методы прогноза нефтеотдачи и оценки эффективности воздействия на пласт : моногр. Уфа, 2007. 96 с.

5. Халафян А. А. Statistica 6: стат. анализ данных. М. : БиномПресс, 2007. 512 с.

6. Basilevsky A. Statistical factor analysis and related methods: theory and applications. John Wiley & Sons, Inc., 2008. 737 p.

7. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. Data Mining, Inference, and Prediction. Second Edition. Springer, 2009. 764 p.

8. James G.,Hastie T., Tibshirani R., Witten D. An Introduction to Statistical Learning: With Applications in R. Springer, 2013. 426 p.

9. Marques de Sa J. P.. Applied Statistics Using SPSS, Statistica, MATLAB and R. Springer, 2007. 505 p.

10. Kettaneh N., Berglund. A. PCA and PLS with very large data sets // Computational Statistics & Data Analysis. 2005. Vol. 48. P. 69-85.

i Надоели баннеры? Вы всегда можете отключить рекламу.