Расчет рейтинга скважин-кандидатов при уплотняющем бурении с помощью машинного обучения на промысловых данных (метод опорных векторов)

Колесов Валентин Валентинович; Курганов Дмитрий Владимирович

ВЕСТН. САМАР. ГОС. ТЕХН. УН-ТА. СЕР. ТЕХНИЧЕСКИЕ НАУКИ. 2019. № 1 (61)

Информатика, вычислительная техника и управление

УДК 681.518:622.276

РАСЧЕТ РЕЙТИНГА СКВАЖИН-КАНДИДАТОВ ПРИ УПЛОТНЯЮЩЕМ БУРЕНИИ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ НА ПРОМЫСЛОВЫХ ДАННЫХ (МЕТОД ОПОРНЫХ ВЕКТОРОВ)

В.В. Колесов1, Д.В. Курганов2

1 АО «Пангея»

Россия, 127015, г. Москва, ул. Большая Новодмитровская, 12, стр. 1

2 Самарский государственный технический университет Россия, 443100, г. Самара, ул. Молодогвардейская, 244

Аннотация. Применение алгоритмов машинного обучения, в частности метода опорных векторов, является перспективным направлением для прогноза продуктивности скважин при уплотняющем бурении (расчета рейтинга). Существенным условием применения метода является наличие обширной цифровой базы с представительными результатами, позволяющей провести обучение модели. В работе рассмотрено применение метода опорных векторов для крупного месторождения в Западной Сибири, а также предложен алгоритм для формирования списка скважин-кандидатов для бурения с последующим ранжированием по совокупности факторов, определяющих дальнейшую эффективность реализуемой системы разработки. В алгоритме ранжирования также существенным образом применяется диаграмма Вороного, хорошо зарекомендовавшая себя как приближение к зоне дренируемых запасов скважины. Методика позволяет комплексировать такие параметры, как продуктивность и обводненность продукции окружающих скважин, плотность текущих запасов, параметры проведенных гидроразрывов пласта и энергетическое состояние потенциального участка для уплотняющего бурения, не прибегая к фильтрационному моделированию, которое в данном случае не позволяет уточнить и подтвердить параметры пластовой системы. Использована двойная модель: первая модель обучается на фильтрационных параметрах пласта, вторая - на емкостных параметрах. При этом ранг первой модели является одним из обучающих параметров для второй, что и позволяет учесть практически всю геолого-промысловую информацию. Метод будет особенно перспективен в осложненных коллекторах, например в двухпоровой среде, где связь между пластовыми параметрами (проницаемость, пористость, нефтенасыщенность) и промысловыми показателями разработки традиционными методами установить затруднительно, а также при наличии техногенных трещин, в частности от гидроразрыва пластов.

Колесов Валентин Валентинович (к.ф.-м.н.), генеральный директор. Курганов Дмитрий Владимирович (к.ф.-м.н., доц.), доцент кафедры «Разработка и эксплуатация нефтяных и газовых месторождений». 6

Ключевые слова: большие данные, машинное обучение, метод опорных векторов,

классификация, рейтинг, дебит, нефть, скважина, выборка, запасы, гидроразрыв

пласта, продуктивность, диаграмма Вороного, адаптация моделей.

Введение

Машинное обучение (МО) находит все большее применение в анализе и прогнозировании показателей разработки нефтегазовых месторождений как в связи с бурным развитием компьютерной техники и цифровых технологий, так и в связи с накоплением фактического материала по разработке месторождений [1]. Необходимым условием является наличие цифровой базы месторождения (или нескольких сходных месторождений), включающей в себя добычу, технологические режимы работы скважин, даты и объемы ГТМ и т. п. При этом алгоритмы использования МО не задействуют физические модели, традиционно используемые для описания предсказания состояния пластовой системы (материальный баланс, фильтрационное моделирование), ставя во главу статистическую обработку имеющихся данных для предсказания следующих состояний системы. Именно поэтому наличие так называемых больших данных становится столь критичным.

Известные свойства коллекторов - проницаемость, нефтенасыщенность, пористость - существенно влияют на добычу, однако во многих случаях не представляется возможным достоверно оценить их влияние на процессы разработки в силу значительной вариабельности указанных свойств как по разрезу, так и по простиранию. Адаптацию фильтрационных моделей подобных пластовых систем по истории разработки также зачастую не удается провести с удовлетворительной степенью точности, что влечет за собой невозможность восстановить геологию резервуара в межскважинном пространстве и уточнить параметры пласта. Также стоит отметить влияние различных ГТМ, в частности системных ГРП, на структуру порового пространства. Подобные вмешательства зачастую формируют вторую среду в резервуаре, образуя систему трещин, которая не описывается стандартными методами при инициализации моделей; кроме того, ситуация осложняется отсутствием данных о простирании и параметрах таких трещин.

Постановка задачи

Необходимо осуществить прогноз продуктивности и прогноз добычи нефти для уплотняющей скважины, находящейся в окружении действующих скважин с известными геолого-промысловыми данными на месторождении сложного строения, возможно с двойной средой. При решении задачи использовать методы машинного обучения, в частности метод опорных векторов.

В качестве примера работы алгоритма взято одно из месторождений Западной Сибири, пласт БВ13. Залежь пластово-сводовая, строение сложное. Пласт характеризуется невысокой проницаемостью, значительной изменчивостью параметров по площади. На объект пробурено 180 скважин (87 действующих добывающих, 50 действующих нагнетательных), реализована очаговая система заводнения, всего было проведено около 90 ГРП. Текущая степень выработки 67 %, средняя обводненность продукции 88 %. Средний дебит скважин по жидкости составляет 60 т/сут (рис. 1). Нефть маловязкая, с высоким газосодержанием (см. табл.).

Моделирование пласта стандартными методами нельзя признать удовлетворительным. Результаты поскважинной адаптации гидродинамической модели по накопленной добыче нефти приведены на рис. 2. Видно, что расхождение доста-

точно существенно по многим скважинам, в том числе со значительной добычей. Это говорит о том, что с помощью имеющегося математического аппарата в рамках фильтрационной модели невозможно достоверно отразить процессы, происходящие при разработке данной залежи [2-4].

Рис. 1. Фрагмент распределения текущих отборов и закачки на карте текущих удельных запасов пласта БВ13

Рис. 2. Фрагмент кроссплота адаптации фильтрационной модели

Параметр Размерность Значение

Средняя глубина залегания кровли м 2410

Абсолютная отметка ВНК м -2200-2202

Тип залежи - Пластовая сводовая

Тип коллектора - Терригенный поровый

Площадь нефтеносности 2 тыс. м 86 173

Средняя общая толщина м 48,1

Средняя эффективная нефтенасыщенная толщина м 7,1

Коэффициент нефтенасыщенности пласта доли ед. 0,597

Проницаемость мкм2 0,051

Коэффициент песчанистости доли ед. 0,290

Расчлененность ед. 9,5

Начальное пластовое давление МПа 23

Вязкость нефти в пластовых условиях мПахс 0,4

Плотность нефти в поверхностных условиях г/см3 0,810

Объемный коэффициент нефти доли ед. 1,59

Давление насыщения нефти газом МПа 21,7

Газосодержание м3/т 280

Коэффициент вытеснения доли ед. 0,583

Коэффициент продуктивности м3/сут*МПа 25,7

Одной из основных задач, решаемых недропользователем на этом объекте, является уплотняющее бурение скважин, а точнее, поиск оптимальных точек входа в пласт с учетом продуктивности и наличия остаточных запасов. Далее предлагается алгоритм для получения такого списка точек, а также их способ их ранжирования по совокупности признаков. Перед этим приводится краткое описание используемых понятий и алгоритмов.

Используемые понятия

Диаграмма Вороного Ръ построенная для точки измерений х;, характеризуется тем, что содержит те и только те точки, расстояние от которых до точки х; меньше или равно расстоянию до любой другой точки измерений х^ При построении диаграмм Вороного используется система соседства, полученная в процессе триангуляции Делоне [5]. Границы диаграмм Вороного Р; состоят из отрезков серединных перпендикуляров, проведенных к сторонам треугольников Делоне.

Применительно к разработке месторождений границы диаграммы Вороного могут рассматриваться как границы зон дренирования (рис. 3).

Рис. 3. Условие непроводящей границы:

в силу того, что границы диаграммы Вороного находятся на одинаковом расстоянии от двух добывающих скважин, эти границы можно считать непроводящими (зоны дренирования); справа - площадное распределение диаграмм Вороного на месторождении

Рис. 4. Процедура добавления скважин и соответствующее изменение диаграмм Вороного (слева - до, справа - после добавления)

Уплотняющие скважины логично размещать вдоль границ диаграмм Вороного (рис. 4).

Метод опорных векторов является методом контролируемого МО, в котором создаваемой модели нужно сопоставить определенные значения других па-

раметров (обучить модель). Данный метод имеет два главных приложения -классификация и регрессия. В данной работе он используется для классификации и последующего ранжирования. Основы метода были заложены в начале 2000-х годов в работах Вапника [6], а более широкое применение и развитие получили в 2001 г. в работах Chang, Lin и далее в работах Статникова в 2009 г. [7].

Далее приводится упрощенное описание модели классификатора опорных векторов. Модель в общем случае пытается построить разделяющую гиперплоскость, которая делит пространство данных на два подкласса. Рис. 5 иллюстрирует описываемую идею в двумерном пространстве. Красная линия - это гиперплоскость, которая проводится таким образом, чтобы максимизировать расстояние между двумя классами данных в многомерном пространстве. Обведенные кружками векторы, являясь граничными, называются опорными векторами. Подобное разделение не всегда возможно, точнее, возможно лишь в том случае, когда исходные данные являются линейно сепарабельными.

Рис. 5. Метод опорных векторов:

алгоритм разделяет данные на две группы гиперплоскостью (красная линия) таким образом, что зазор между ними максимизируется; векторы, обведенные кружками, являются опорными

Формальное описание проблемы классификации методом опорных векторов выглядит следующим образом [8, 9]. Предполагается, что элементы множества, которое следует упорядочить, имеют вид {(х1з С}),(х2, С2),...,(хп, сп)}, где с принимает значение 1 или (-1) в зависимости от того, какому классу принадлежит вектор XI.

Каждое xi - это р-мерный вещественный вектор, нормализованный значениями [0, 1]. Если точки не будут нормализованы, то точка с большими отклонениями от средних значений координат точек слишком сильно повлияет на классификатор. Эти векторы рассматриваются как учебная коллекция, в которой для каждого элемента уже задан класс, к которому он принадлежит. Требуется, чтобы алгоритм классифицировал их таким же образом. Для этого строится разделяющая гиперплоскость, которая имеет вид

Вектор w - перпендикуляр к разделяющей гиперплоскости. Параметр Ь /|| -^Ц

равен по модулю расстоянию от гиперплоскости до начала координат.

Для поиска оптимального разделения используются опорные векторы и гиперплоскости, параллельные оптимальной и ближайшие к опорным векторам

w • x — b = 0.

двух классов. Можно показать, что эти параллельные гиперплоскости могут быть описаны следующими уравнениям (с точностью до нормировки):

w • x — b = 1;

w • x — b = —1.

Если обучающая выборка линейно сепарабельна, то мы можем выбрать гиперплоскости таким образом, чтобы между ними не лежала ни одна точка обучающей выборки, и затем максимизировать расстояние между гиперплоскостями. Ширина полосы между ними равна 2 /||w||; таким образом, требуется минимизировать ||w||. Чтобы исключить все точки из полосы, необходимо условие для всех i:

w • xi — b > 1, ci = 1

w • xj — b < 1, ci =—1 (1)

Таким образом, проблема построения оптимальной разделяющей гиперплоскости сводится к минимизации ||w|| при условии (1). Это задача квадратичной оптимизации, которая имеет вид

llwll2 ^ min

11 11 (2)

ci (w • xi — b) > 1, 1 < i < n

Можно показать, что решение задачи (2) имеет вид

n

w = ^Xicixi , b = w• xi — ct, i=1

где X i > 0 - вектор двойственных переменных [10].

Если строго зафиксировать требование, что все образцы находятся вне полосы, то имеет место так называемая классификация с жестким зазором. Классификации с жестким зазором присущи две главные проблемы. Во-первых, она работает, только если данные являются линейно сепарабельными. Во-вторых, она довольно чувствительна к выбросам - нехарактерным элементам, которые в силу определенных причин оказались в чужом классе данных (например, из-за погрешности замеров). Чтобы избежать таких проблем, предпочтительнее применять более гибкую модель. Цель заключается в том, чтобы отыскать хороший баланс между удержанием полосы как можно более широкой и ограничением количества нарушений зазора (т. е. появлений экземпляров-выбросов, которые оказываются посредине полосы или даже на неправильной стороне). Это называется классификацией с мягким зазором. За это отвечает специальный регуляри-зующий параметр модели. Его меньшее значение ведет к более широкой полосе, но и большему числу нарушений зазора. Подбор данного параметра является важным шагом при обучении модели на фактических данных [11].

Ранжирование элементов методом опорных векторов в общем случае осуществляется итерационно по следующей схеме. Выбирается какой-либо элемент из множества, которое следует упорядочить. Затем составляются попарные разности этого элемента и сравниваемых с ним элементов известного ранга, в результате чего образуются положительные и отрицательные величины (в смысле ранга), далее применяется стандартная схема по разделению исходного множества на два подмножества (классификация). В результате элемент оказывается

определенным по отношению ко всем остальным элементам известного множества. Та же самая процедура повторяется для всех элементов множества, которое следует упорядочить. В результате множество оказывается упорядоченным в смысле заранее определенного ранга. Таким образом, задача ранжирования сводится к серии задач классификации.

Отметим, что при ранжировании на каждом этапе может возникать проблема выбросов, которая решается методом регуляризации. Реализация алгоритма ранжирования проводится в пакете SVM-rank [8]. Подготовка базы данных для нее проводится с помощью авторских методик. Следует также отметить, что все данные должны быть первоначально нормированы, так как алгоритм чувствителен к ненормированным данным [12, 13].

Далее рассматриваются две различные задачи - прогноза продуктивности и прогноза добычи уплотняющей скважины. Назовем их соответственно модель I и модель II.

Для модели I рангом будет служить средний стартовый дебит жидкости. Для модели II - добыча нефти первого года.

Методы решения

Для обучения модели I используются следующие параметры-наблюдения (среднее по соседним скважинам): использованное количество проппанта, использованное количество жидкости разрыва, дебит жидкости. Каждому вектору описанных параметров-наблюдений сопоставлен ранг (рейтинг) - средний стартовый дебит жидкости уплотняющей (центральной) скважины.

Для модели II обучающими параметрами будут служить энергетическое состояние участка (пластовое давление), текущая плотность запасов диаграммы Вороного, средняя обводненность по соседним скважинам, а также рассчитанный ранг по модели I. Для ранжирования использована годовая добыча нефти уплотняющей (центральной) скважины с участка.

Рис. 6 иллюстрируют наличие некой связи между входными и выходными параметрами моделей, однако линейная корреляция невысока и не может служить надежным инструментом прогнозирования. Именно поэтому и используются более сложные модели, в частности опорных векторов, для идентификации многомерных зависимостей, зачастую нелинейных.

♦

> 4 ♦

> * ♦ ♦ А

& ♦ ♦ » т

♦ • £ * ♦ * *

* ♦ 1

Ж » 0.42

♦

г

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 уд. промысл.прод. сосед.скв. (норм.)

*

1 > ♦ 4 г к

% кл

у 1 « 4 *Л «

Г ♦ ♦

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

•-1 к ♦ ♦ у

о « ♦ 1

А Л » и'-о 38

& ♦ Л

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 ср.кол-во проппанта по сосед, скв. (норм.)

б

1

I. 0.9

0

- 0.8 5

£ 0.7

г о.б

т

5" 0.5 ™ 0.4 §. 03

Ш

1 0,2 га

= 0.1

\о о

о

К7 - О. >7 « • • • »

1 А а а

щ а *

• * * « •

а* 9 •

• •

• « •

л* » • •

• -< *

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 тек.пласт.давл.на участке (норм.)

в

9 * « 1 г 1

О К2 0.34

л а *

*

1 П 5 ' и 4 1 ы »

Г #

Ф • •

у-

га * п 1 щ 4 9 9

* оЩ КГ * 1 *

0.0 0 1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 сред.обводн. по сосед.скв. (норм.)

г

Рис. 6. Зависимости некоторых ключевых параметров моделей (а-г)

а

б

Рис. 7. Распределение ранга обучающей выборки по модели I (а) и по модели II (б)

Текущие запасы нефти на участке возможно рассчитать двумя способами: по результатам проведения промысловых геофизических исследований (ПГИ), при наличии, и по методике построения карты плотности линейных запасов, в обоих случаях не прибегая к гидродинамическому моделированию. На рассматривае-

мом месторождении имеются многочисленные ПГИ, поэтому в основном выбирался первый способ.

Результаты

Стандартной практикой является тестирование моделей после обучения на фактических данных, а именно сопоставление полученных дебитов по модели I с фактическими, а также сопоставление добычи нефти по модели II за первый год с фактической. При этом из всего множества фактических результатов (90 скважин, являвшихся уплотняющими) выбирается случайным образом 80 % скважин, на них и проходит обучение (рис. 7), а на оставшихся 20 % проходит тестирование (валидация). Сопоставление фактических и полученных при тестировании модели данных приведено на рис. 8. Сходимость по обеим моделям следует признать удовлетворительной.

| 0.9 о £ | 0.8 Ё. 0.7 о X 3 0.6 о а 4 0.5 * з 0.4 в 0 СП >5 0.3 3 X л га 02 т та х 1 0.1 ✓

✓ / ✓

/ Ь ✓

✓ г V

* г

/ /

» / Л

/ /

*

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 начальный дебит жидкости (норм.), факт

а

добыча нефти за первый год (норм.), модель ооооооооо о^Ьоы^слЬ^отсо- у 4 и/

/

С Л * -- > о

/ / • У

/ о

9 / / /ш

/ •/ у •

/ /

/л У / ✓

/А о ^^

0 1 0 2 0 добь 3 0 1ча нефт 4 0 и за пер 5 0 вый год в 0 [норм.). 7 0 факт 8 0 0

б

Рис. 8. Результаты обучения моделей на тестируемой выборке: по модели I (а) и по модели II (б)

Таким образом, алгоритм формирования списка скважин для уплотняющего бурения выглядит следующим образом:

- обосновывается экономически рентабельная минимальная величина извлекаемых запасов, приходящихся на одну скважину;

- строятся диаграммы Вороного для всех действующих скважин;

- в каждой из диаграмм подсчитываются текущие запасы;

- новые скважины размещаются вблизи границ диаграмм Вороного, имеющих максимальные запасы, но в то же время как можно дальше от остановленных/ликвидированных/нагнетательных скважин;

- в каждой из диаграмм вновь подсчитываются текущие запасы;

- в окончательный список попадают лишь скважины, дренируемые запасы которых превышают обоснованное значение;

- список ранжируется по модели I;

- список ранжируется по модели II; при этом скважины для первоочередного бурения будут иметь наивысший рейтинг.

Следует отметить, что использование модели II опционально, для промысловых нужд зачастую достаточно применение более простой модели I. При этом может осуществляться и дополнительное ранжирование с помощью других методик, в том числе геолого-статистических. Затем, комплексируя все рейтинги (например, простым суммированием с весами), можно сформировать единый рейтинг бурения.

Заключение

Таким образом, в работе предложен алгоритм, позволяющий более строго подойти как к формированию списка скважин-кандидатов для уплотняющего бурения, так и к ранжированию этого списка с целью определения наиболее перспективных участков с помощью промысловых данных.

Следует отметить, что в сравнении со стандартными способами обоснования дебитов скважин - с помощью картирования свойств и закона Дарси - данный способ позволяет учесть как особенности данного конкретного месторождения, так и свойства, не описываемые стандартными законами фильтрации, в частности техногенную трещиноватость породы [14, 15].

Применение метода позволяет увеличить надежность прогноза там, где традиционные методики обоснования свойств коллектора не показывают значимых результатов. Принимая во внимание значительную стоимость строительства скважин и боковых стволов, следует отметить, что по экспертной оценке комплексное применение описанного алгоритма позволит отбраковать 15-20 % потенциальных скважин-кандидатов, соразмерно снизив совокупные затраты недропользователя на бурение.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Zangl G., Hannerer J. Data Mining: Applications in the Petroleum Industry. Katy, TX, Round Oak Publishing, 2003. 222 p.

2. Курганов Д.В., Попков В.И., Хмелевских Е.И. Оценка влияния низкопроницаемых прослоев коллектора на эффективность выработки запасов нефти с использованием трехмерных гидродинамических моделей // Известия Самарского научного центра РАН. Спец. выпуск - проблемы нефти и газа. - 2002. - С. 121-126.

3. Курганов Д.В. Идентификация параметров математических моделей многофазной фильтрации в нефтяных пластах: Дисс. ... канд. физ.-мат. наук. - Самара: Самар. гос. ун-т, 2003. - 134 с.

4. Курганов Д.В. О численном решении одной задачи минимизации в моделировании пластовых систем // Сибирский журнал индустриальной математики. - 2003. - Т. 6. - № 1. - С. 51-59.

5. ДемьяновВ.В., Савельева Е.А. Геостатистика: теория и практика. - М.: Наука, 2010. - 327 с.

6. Vapnik V. The Nature of Statistical Learning Theory, second edition. New York, USA, SpringerVerlag, 2000. 425 p.

7. Statnikov V. et al. A Gentle Introduction to Support Vector Machines in Biomedicine // AMIA Annual Symposium, San Francisco, CA, USA, 2009. P. 118-129.

8. Joachim T., Scholkop B., Burges C., Smola A. (ed.) Making large-Scale SVM Learning Practical. Advances in Kernel Methods - Support Vector Learning, USA, MIT-Press, 1999. 521 p.

9. Hand D.J., Manilla H., Smyth P. Principles of Data Mining, USA, MIT-Press, 2001, 546 p.

10. Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques, USA, Elsevier, 2012. 703 p.

11. Wu X., Kumar V. The Top Ten Algorithms in Data Mining, USA, Taylor & Francis Group, 2009. 201 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Busby D., Pivot F., Tadjer A. Use of data analytics to improve well placement optimization under uncertainty // SPE International Petroleum Exibition & Conference, Abu-Dhabi, UAE, 2017. P. 324329.

13. Kim T.H., Crane D.J., Grijalva E.F. Infill Well Location Selection Procedures in Lost Hills Using Machine Learning // SPE Western Regional Meeting, California, USA, 2018. P. 122-128.

14. Смехов E.M., Дорофеева Т.В. Вторичная пористость горных пород-коллекторов нефти и газа. - Л.: Недра, 1987. - 96 с.

15. Колесов В.В., Курганов Д.В. Интегрированное моделирование неоднородности и связности гигантского карбонатного резервуара по геофизическим и промысловым данным на поздней стадии разработки с целью локализации остаточных запасов нефти // Материалы технической конференции SPE «Разработка зрелых месторождений». - М., 2017. - P. 121-129.

Статья поступила в редакцию 23 января 2019 г.

WELL RANKING FOR IN-FILL DRILLING USING MACHINE LEARNING WITH PRODUCTION AND GEOLOGICAL DATA

V. V. Kolesov1, D.V. Kurganov2

1 AO «Pangeya»

1 str., 12, Bolshaya Novodmitrovskaya st., Moscow, 127015, Russian Federation

2 Samara State Technical University

244, Molodogvardeyskaya st., Samara, 443100, Russian Federation

Abstract. In machine learning, support-vector machines (SVM) are supervised learning models with associated learning algorithms that analyze data used for classification analysis. In this paper SVM-rank model is applied for productivity prediction of infill wells for giant Western Siberian oilfield. An essential condition for method's application is availability of digital databases with representative results which allows adequate model training. Ranking algorithm also uses Voronoi diagram, proven as an approximation to the well drainage area. Complex method allows combine different reservoir and production parameters: productivity and water cut of surrounding wells, frac parameters etc without common reservoir dynamics model, which in this particular case is not able to clarify and confirm the parameters of the reservoir system. There is double model used: the first model utilizes productivity reservoir parameters, the second one uses capacity parameters. The rank of the first model is one of the training options for the second model, and both of them take into account all the geological and production information. The method can be particularly useful in complicated reservoirs, e.g. in dual porosity ones, where the relationship between formation parameters (permeability, porosity, saturation) and production rates is unclear and cannot be set by traditional development analysis, particularly in frac environment.

Valentin V. Kolesov (Ph.D. (Phys.& Math.)), General Direktor. Dmitry V. Kurganov (Ph.D. (Phys.& Math.)), Associate Professor.

Keywords: Big data, Machine Learning, Support Vector Machines, Classification, Rank, Oil Rate, Well, Sample, Fluid-in-Place, Frac, Productivity Index, Voronoi Diagram, History Matching.

REFERENCES

1. Zangl G., Hannerer J. Data Mining: Applications in the Petroleum Industry. Katy, TX, Round Oak Publishing, 2003. 222 p.

2. Kurganov D.V., Popkov V.I., Khmelevskikh Ye.I. Estimation of low permeability layers on field development process using reservoir simulation // Izvestiya Samarskogo Nauchnigo tsentra RAN. Spets. vypusk - problemy nefti I gaza, 2002. P. 121-126.

3. Kurganov D.V. Identifikatsiya parametrov matematicheskikh modeley mnogofaznoy fil"tratsii v neftyanykh plastakh: Diss. ... kand. fiz.-mat. nauk, Samara: Samar. gos. un-t, 2003. 134 pp.

4. Kurganov D. V. Numerical solution of one minimization problem in reservoir simulation // Sibirskiy zhumal industriaF'noy matematiki, 2003, t. 6, № 1, P. 51-59.

5. Dem"yanov V.V., Savel"yevaE.A. Geostatistika: teoriya i praktika. M.: Nauka, 2010. 327 pp.

6. Vapnik V. The Nature of Statistical Learning Theory, second edition. New York, USA, SpringerVerlag, 2000. 425 p.

7. Statnikov V. et al. A Gentle Introduction to Support Vector Machines in Biomedicine // AMIA Annual Symposium, San Francisco, CA, USA, 2009. P. 118-129.

8. Joachim T., Scholkop B., Burges C., Smola A. (ed.) Making large-Scale SVM Learning Practical. Advances in Kernel Methods - Support Vector Learning, USA, MIT-Press, 1999. 521 p.

9. HandD.J., Manilla H., Smyth P. Principles of Data Mining, USA, MIT-Press, 2001, 546 p.

10. Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques, USA, Elsevier, 2012. 703 p.

11. Wu X., Kumar V. The Top Ten Algorithms in Data Mining, USA, Taylor & Francis Group, 2009. 201 p.

12. Busby D., Pivot F., Tadjer A. Use of data analytics to improve well placement optimization under uncertainty // SPE International Petroleum Exibition & Conference, Abu-Dhabi, UAE, 2017. P. 324329.

13. Kim T.H., Crane D.J., Grijalva E.F. Infill Well Location Selection Procedures in Lost Hills Using Machine Learning // SPE Western Regional Meeting, California, USA, 2018. P. 122-128.

14. Smekhov Ye.M., Dorofeeva T. V. Dual porosity oil and gas reservoirs, Leningrad: Nedra, 1987. 96 pp.

15. Kolesov V. V., Kurganov D. V. Integrated modeling of heterogeneity and conductivity of giant mature carbonate reservoir using complex geophysic and production data // Proceedings of SPE Conference «Razrabotka zrelykh mestorozhdeniy», M., 2017. P. 121-129.

Аннотация научной статьи по математике, автор научной работы — Колесов Валентин Валентинович, Курганов Дмитрий Владимирович

Похожие темы научных работ по математике , автор научной работы — Колесов Валентин Валентинович, Курганов Дмитрий Владимирович

WELL RANKING FOR IN-FILL DRILLING USING MACHINE LEARNING WITH PRODUCTION AND GEOLOGICAL DATA