Вестник АГТУ. Серия: Управление, вычислительная техника и информатика. 2023. M1
ISSN2072-9502 (Print), ISSN2224-9761 (Online) Vestnik ASTU. Series: Management, computer science and informatics. 2023. N. 1
ISSN2072-9502 (Print), ISSN2224-9761 (Online)
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
MATHEMATICAL MODELING
Научная статья УДК 681.5
https://doi.org/10.24143/2072-9502-2023-1-98-104 EDN BRETST
Математическая модель расчета источников информации
при построении функции принадлежности в задачах оценки достоверности запасов углеводородов
Полина Валерьевна КожевниковаВиталий Евгеньевич Кунцев, Артур Александрович Чувашов
Ухтинский государственный технический университет, Ухта, Россия, aiш[email protected]ш
Аннотация. При решении задач оценки достоверности запасов углеводородов предлагается представлять исходные данные в форме нечетких отношений, что возможно с помощью построения поля рассеяния, являющегося одним из методов нечеткого моделирования и основанного на алгоритме сжатия информации. Данный алгоритм позволяет снизить размерность величин и избавиться от случайной информации, присутствующей в наборе исходных данных и являющейся возможной причиной неверной интерпретации результатов. Алгоритм сжатия информации включает в себя два этапа. Первый этап основан на алгоритме кластеризации, позволяющем определить местоположение источников информации. Второй этап основан на методе Хука -Дживса, с помощью которого рассчитываются веса источников. Эксперименты проводились с целью изучения влияния количества источников на результат построения поля рассеяния. В качестве исходных данных использовался набор одновременно измеренных петрофизических параметров «пористость по ГИС» и «пористость по керну», характеризующих емкостные свойства породы. По каждому эксперименту представлены карты источников, поля рассеяния и относительные погрешности. Установлено, что при уменьшении количества источников поля рассеяния сохраняли свою структуру, но возрастала относительная погрешность поля рассеяния и карты плотности исходных данных.
Ключевые слова: нечеткие отношения, оценка достоверности, запасы углеводородов, количество источников информации, поле рассеяния, карта плотности
Для цитирования: Кожевникова П. В., Кунцев В. Е., Чувашов А. А. Математическая модель расчета источников информации при построении функции принадлежности в задачах оценки достоверности запасов углеводородов // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2023. № 1. С. 98-104. https://doi.org/10.24143/2072-9502-2023-1-98-104. EDN BRETST.
© Кожевникова П. В., Кунцев В. Е., Чувашов А. А., 2023
Original article
я-
v
s
e <
E
>
Mathematical model for calculation of data sources in building membership function in problems of estimating reliable hydrocarbon reserves
Polina V. KozhevnikovaM, Vitaly E. Kuntsev, Artur A. Chuvashov
Ukhta State Technical University ,
Ukhta, Russia, [email protected] Uu _ a
-
o
Abstract. In solving the problems of assessing the reliable hydrocarbon deposits the initial data are considered in the v
form of fuzzy relationships, which is possible by constructing a stray field that is a fuzzy modeling method based on .
the data compression algorithm. This algorithm allows reducing the quantity dimension and taking away the random information from the initial data, which is a possible cause of an erroneous estimate. The data compression algorithm has two stages. The first stage is based on a clustering algorithm that helps locate the data sources. The second stage is based on the Hooke-Jeeves method of calculating the source weight. Experiments were carried out to study the influence of the number of sources on the result of building the stray field. A set of petrophysical parameters (porosity by GWL, pore sizes in cores) measured at one time was used as initial data, which characterized the capacitive properties of the rock. Each experiment is supplied with the maps of sources, stray fields and relative errors. It has been inferred that with a decreasing the source number the stray fields saved their structure, though there increased the relative error of a stray field and of the map of initial data density.
Keywords: fuzzy relations, reliability assessment, hydrocarbon reserves, number of data sources, stray field, density map
For citation: Kozhevnikova P. V., Kuntsev V. E., Chuvashov A. A. Mathematical model for calculation of data sources in building membership function in problems of estimating reliable hydrocarbon reserves. Vestnik of Astrakhan State Technical University. Series: Management, Computer Science and Informatics. 2023;1:98-104. (In Russ.). https://doi.org/10.24143/2073-5529-2023-1-98-104. EDN BRETST.
в b
Введение ников информации (физический смысл источников Оценка достоверности измеренных параметров основан на представлении о том, что рассчитанное П играет важную роль при подсчете запасов углево- значение поля рассеяния, следующее из экспери- д дородов, т. к. данный подсчет выполняется в усло- ментальных данных, - это результат диффузии от д виях неопределенности. Достоверность в дальней- источников информации) и являются откликом от | шем позволяет рассчитывать экономические риски данных источников, который фиксируется при р разработки месторождений [1, 2]. проведении экспериментов. П В процессе подсчета запасов выполняется од- Целью применения алгоритма является поиск Одновременное измерение на одном образце породы наименьшего количества источников, при которых П значений петрофизических параметров, которое невязка между картой плотности исходных данных О содержит случайную («ошибочную») информацию и рассчитанным полем рассеяния удовлетворяет е и ошибки при измерении. При проведении экспе- заданному условию. I риментов часто появляется «ошибочная» инфор- Цель исследования заключается в повышении е мация. Данные ошибки могут искажать результаты качества оценки достоверности петрофизических д интерпретации геофизических данных и служить моделей, используемых при подсчете запасов уг-основой неверных заключений. Чтобы избавиться леводородов. Г от случайной информации, исходные данные необ- а ходимо рассматривать как нечеткие отношения. Постановка задачи е Основанием для представления данных в форме Пусть Щ - исходные данные, представляющие ^ нечетких отношений служит понятие поля рассея- собой матрицу размерностью М х L, где М - коли- а
ч т Г
ния, которое предлагается строить на основе алго- чество измерений, а L - количество параметров. о
ритма сжатия информации. Алгоритм сжатия ин- Строка матрицы есть вектор одновременно изме- е
формации позволяет снизить размерность величин ренных параметров. Матрица исходных данных |
и избавиться от случайной информации, присут- имеет следующий вид. 1 ствующей в наборе исходных данных, подразумевается, что исходные данные получены от источ-
о и
к ^ & ^
я
о
и
5
6
с к к
IB
-е-
S S и
с
к &
с к к я
-е-и S
< <
ш о S3 rt
ш ^
f
и ш
ш
и
я £
ш
у
A =
Исходные данные покрываются сеткой размерностью N1, I = 1 ^ L, где N - количество ячеек в измерении [3], и рассчитывается карта плотности данных где « - набор ячеек сетки.
Размер ячейки г = г1 х г2 х ... х гь вычисляется по формуле
maX (Oil }- min Kl }
. m ^_m J
' N '
m = 1 + M,
где т - порядковый номер измерения; I - порядковый номер параметра; N - количество ячеек в измерении. Карта плотности Щ(«) характеризует относительную частоту данных в каждой ячейке сетки (количество одновременно измеренных значений параметров в ячейке сетки относительно общего числа измерений внутри эксперимента).
Поле рассеяния представляет собой линейную комбинацию функций экспоненциальной модели [4]:
AЕ (s ) = £ю (/ )-i-exp
л/Пс
|Л
s - s
где е - погрешность, с которой выполняется расчет поля рассеяния; « - набор ячеек сетки, для которой выполняется расчет; К - количество источников информации; зк - ячейка, в которой расположен к-й источник; - вес к-го источника; £ - эффективный параметр, влияющий на рассеяние данных.
Предложенная модель имеет принцип максимальной энтропии, т. е. информация, полученная от источников - это итог диффузии, которая длилась определенное время.
Решение задачи заключается в распределении источников 8к и нахождении их веса ю(5к). Решение задачи основано на представлении о том, что рассчитанное значение поля рассеяния, следующее из экспериментальных данных, - это результат диффузии, который привел к сглаживанию более точной зависимости ю(5к):
.A [ю (s)] = AE (s); .Ae (s)- A (smin,
(1)
где А - оператор для расчета поля рассеяния.
Алгоритм решения задачи состоит из двух этапов: на первом этапе решается задача расположения источников, на втором - подбор веса источников.
Решение задачи
Первый этап. Для определения местоположения источников на сетке воспользуемся алгоритмом кластеризации. Кластеризация - разбиение исходных данных на кластеры. Кластеры представляют собой группы со схожими характеристиками, которыми, в нашем случае, являются значения одновременно измеренных параметров.
В основе алгоритмов кластеризации лежит критерий сравнения объектов, которым, как правило, является расстояние. Для расчета расстояния была выбрана метрика квадрата евклидова расстояния р между объектами х и х':
n
р (X, X') = S(X - X)
где п - количество характеристик объекта; 1 - порядковый номер характеристики объекта.
В качестве алгоритма кластеризации для решения поставленной задачи был выбран метод к-средних, позволяющий построить оптимальное решение (выбор координат источников) на основе минимизации суммарного квадратичного отклонения объектов кластера от центров данных кластеров:
min
C
K M
SS р (a, sk),
где С = {«к; к = 1 ^ К } - набор кластеров.
Входными данными для решения задачи кластеризации являются вектор значений параметров и количество источников. Выбранный метод удобен тем, что рассчитанные центры кластеров будут использованы в качестве координат источников данных.
Второй этап. Для решения задачи (1) в рамках второго этапа с целью расчета весов источников в точках (центров кластеров), полученных на первом этапе, можно воспользоваться алгоритмом Хука -Дживса. Данный метод относится к методам прямого поиска экстремума функции и состоит из исследующего поиска и поиска по образцу. Исследующий поиск предназначен для определения направления минимизации. Поиск по образцу заключается в изменении параметров функции вдоль выбранного направления. Метод Хука - Дживса широко применяется при решении инженерных задач [5].
Эксперименты
В качестве исходных данных для расчетов использовался набор одновременно измеренных значений между параметрами карбонатных пород Са-люкинского месторождения Тимано-Печорской нефтегазовой провинции (рис. 1, а).
а
а
11
V а M1
а
2
2
Z
k =1
k=1 ,=1
18 £ 16
14
X СЦ
U 12 g 10
S 8
О
g 6 о
s
а 4 о
С 2
.'•I*
0 2 4 6 8 10 12 14 16
Пористость по ГИС, %
a.12 о10 б -H 8 о о Ö в s CL О 4 С ! MO.04 ¡7Ñ B- ■0035 ^ 1 Hm Q
с p 0.025 < 0 02 $
J : □
-Ü
1
£ СЛ
ri H « 015 < 001 F о 0005 § P СЛ n r>
_ J
s l Г
: d
M L J
L Г1 F L
I
4 6 8 10
Пористость по ГИС,
12 14
%
Рис. 1. Исходные данные: набор одновременно измеренных значений между параметрами «Пористость по ГИС» и «Пористость по керну» (а); карта плотности исходных данных (б)
Fig. 1. Initial data: a set of simultaneously measured values between the parameters "Porosity by logging" and "Core porosity" (a); a map of source data density (б)
Характеристики исходных данных:
1) параметры:
- пористость по ГИС (объем пор относительно общего объема горной породы, рассчитанный на основе интерпретации результатов геофизических исследований скважин);
- пористость по керну (рассчитывается на основе анализа кернового материала);
2) количество измеренных значений - 75.
Для вычислений частоты данных, карты источников и поля рассеяния была выбрана расчетная сетка £ размером 25 х 25. Полученная карта плот-
ности данных Щ(^) представлена на рис. 1, б. Большинство ячеек с данными принимают значение 0,1, а максимум составляет 0,04.
Было проведено 3 эксперимента. По каждому эксперименту были построены карты источников данных и поля рассеяния:
1) для первого эксперимента при решении задачи кластеризации было выбрано 52 источника (рис. 2);
2) для второго - 37 источников (рис. 3);
3) для третьего - 22 источника (рис. 4).
M t h
3
о
qN 14
S»
<U
О10
с
л р
H 8 о
ев
s CL О 4
I
X 10
2 4 6 8 10 12
Пористость по ГИС, %
б
Пористость по ГИС, %
Рис. 2. Первый эксперимент (52 источника): карта источников (а) и поле рассеяния (б) Fig. 2. First experiment (52 sources): a source map (a) and a stray field (б)
а
а
s о
H M О <D
n x
X X л с s s
X «
X
с s s
X
о -©ф
я s
Cû
о «
s я
CT
^14
— О
Е- 8
О 4
й
Во 00' Но 008
-0.006
Ш 0.005 J 004 jo 003
Ш 0.002
■0.001
^14
О 4
Пористость по ГЙС, %
Пористость по ГЙС, %
Рис. 3. Второй эксперимент (37 источников): карта источников (а) и поле рассеяния (б) Fig. 3. Second experiment (37 sources): a source map (a) and a stray field (б)
•к
Пористость по ГЙС, %
Пористость по ГЙС, %
<
"¿у
tr
X X
о «
s
X
M
g
о
Рис. 4. Третий эксперимент (22 источника): карта источников (а) и поле рассеяния (б) Fig. 4. Third experiment (22 sources): a source map (a) and a stray field (б)
Карта источников отображает местоположение источников, полученное на первом этапе, и веса источников, полученные на втором этапе. Поле рассеяния является основой для представления данных в форме нечетких отношений и используется для оценки алгоритма сжатия информации путем сравнения данного поля с картой плотности. Вертикальная цветовая шкала справа на рис. 2-4 отображает числовые значения источников и поля рассеяния в палитру.
Измеренные значения данных параметров имеют высокую степень локализации, но наблюдается различная плотность данных на разных участках. Поле рассеяния сохраняет структуру данных, позволяя использовать все исходные данные, не искажая их, но при этом ранжируя данные по достоверности. В дальнейшем подобные нечеткие петрофизические модели используются совместно с геологическими
ЭБ-моделями, отображая достоверность подсчетов запасов углеводородов.
Карта источников, полученная в результате проведения первого эксперимента, принимает значения в диапазоне от 0 до 0,008. Поле рассеяния принимает значения в диапазоне от 0 до 0,0114. Относительная погрешность поля рассеяния и карты плотности исходных данных составляет 4,7 %:
5 =
|A s ( s )-A ( s )|
A(7)
• 100 %.
Карта источников, полученная в результате проведения второго эксперимента, принимает значения в диапазоне от 0 до 0,01. Поле рассеяния принимает значения в диапазоне от 0 до 0,0106 с относительной погрешностью 4,7Э %.
а
б
а
б
Максимальное значение на карте источников, полученной в результате проведения третьего эксперимента, составляет 0,015. В свою очередь, максимальное значение поля рассеяния составляет 0,0124 с относительной погрешностью 4,76 %.
В рамках экспериментов были рассчитаны поля рассеяния, где количество источников постепенно
уменьшалось от 67 до 2. В качестве демонстрации выше были представлены результаты трех экспериментов для 52, 37 и 22 источников соответственно, а на рис. 5 представлена динамика изменения погрешности вычислений относительно всего возможного набора количества источников данных.
Рис. 5. Динамика изменения погрешности вычислений относительно количества источников данных Fig. 5. Dynamics of changes in calculation errors relative to the number of data sources
Проведенные эксперименты демонстрируют, что поле рассеяния, вне зависимости от количества источников, сохраняет свою структуру, однако относительные погрешности поля рассеяния и карты плотности при выборе количества источников из диапазона от 67 (90 % от исходных данных) до 17 изменяются незначительно, а с 17 значение погрешности начинает увеличиваться.
Выводы
1. Для распределения источников информации при представлении набора одновременно измеренных значений параметров можно использовать алгоритм кластеризации, в частности, основанный на метрике квадрата евклидова расстояния.
2. Для расчета весов источников допустимо использовать метод Хука - Дживса.
3. Уменьшение количества источников с определенного момента приводит к увеличению погрешности между полем рассеяния и картой плотности данных. Рост погрешности указывает на то, что поле рассеяния начинает существенно отличаться от исходных данных, теряя тем самым неоднородную структуру данных, учет которой важен при подсчете запасов углеводородов.
4. Следующим этапом является определение критерия уменьшения количества источников. Цель данного критерия заключается в определении минимально допустимого количества источников, которое позволит избавиться от случайной информации, присутствующей в наборе исходных данных.
Список источников
1. Алтунин А. Е., Семухин М. В. Сравнительный анализ использования вероятностных и нечетких методов оценки неопределенности и рисков при подсчете запасов и ресурсов углеводородов // Нефтяное хозяйство. 2011. № 9. С. 44-49.
2. Алтунин А. Е., Семухин М. В., Ядрышникова О. А. Методы анализа неопределенностей геолого-промысловых систем и нечеткие имитационные модели // Автоматизация, телемеханизация и связь в нефтяной промышленности. 2015. № 5. С. 33-43.
3. Кожевникова П. В., Кунцев В. Е., Чувашов А. А. Влияние шага расчетной сетки при построении функций
принадлежности отношений между петрофизическими параметрами // Современная наука: актуальные проблемы теории и практики. Сер.: Естественные и технические науки. 2021. № 7. С. 65-70.
4. Кобрунов А. И., Дорогобед А. Н., Кожевникова П. В. Математическое моделирование нечетких петрофизиче-ских зависимостей // Современные наукоемкие технологии. 2018. № 10. С. 50-55.
5. Хук Р., Дживс Т. А. Прямой поиск решения для числовых и статических проблем. М.: Мир, 1961. С. 212-219.
References
1. Altunin A. E., Semukhin M. V. Sravnitel'nyi analiz ispol'zovaniia veroiatnostnykh i nechetkikh metodov otsenki neopredelennosti i riskov pri podschete zapasov i resursov uglevodorodov [Comparative analysis of using probabilistic and fuzzy methods for assessing uncertainty and risks in calculating reserves and resources of hydrocarbons]. Nefti-anoe khoziaistvo, 2011, no. 9, pp. 44-49.
2. Altunin A. E., Semukhin M. V., Iadryshnikova O. A. Metody analiza neopredelennostei geologo-promyslovykh sistem i nechetkie imitatsionnye modeli [Methods for analyzing uncertainties of geological and field systems and fuzzy simulation models]. Avtomatizatsiia, telemekhanizatsiia i sviaz' v neftianoipromyshlennosti, 2015, no. 5, pp. 33-43.
3. Kozhevnikova P. V., Kuntsev V. E., Chuvashov A. A. Vliianie shaga raschetnoi setki pri postroenii funktsii
prinadlezhnosti otnoshenii mezhdu petrofizicheskimi par-ametrami [Influence of calculation grid step in construction of membership functions of relations between petrophysical parameters]. Sovremennaia nauka: aktual'nye problemy teorii i praktiki. Seriia: Estestvennye i tekhnicheskie nauki, 2021, no. 7, pp. 65-70.
4. Kobrunov A. I., Dorogobed A. N., Kozhevnikova P. V. Matematicheskoe modelirovanie nechetkikh petrofizi-cheskikh zavisimostei [Mathematical modeling of fuzzy petrophysical dependencies]. Sovremennye naukoemkie tekhnologii, 2018, no. 10, pp. 50-55.
5. Khuk R., Dzhivs T. A. Priamoi poisk resheniia dlia chislovykh i staticheskikh problem [Direct search for solution for numerical and static problems]. Moscow, Mir Publ., 1961. Pp. 212-219.
Статья поступила в редакцию 05.09.2022; одобрена после рецензирования 07.11.2022; принята к публикации 16.12.2022 The article is submitted 05.09.2022; approved after reviewing 07.11.2022; accepted for publication 16.12.2022
Информация об авторах / Information about the authors
Полина Валерьевна Кожевникова - кандидат технических наук; доцент кафедры вычислительной техники, информационных систем и технологий; Ухтинский государственный технический университет; [email protected]
Виталий Евгеньевич Кунцев - кандидат технических наук; доцент кафедры вычислительной техники, информационных систем и технологий; Ухтинский государственный технический университет; [email protected]
Артур Александрович Чувашов - ассистент кафедры вычислительной техники, информационных систем и технологий; Ухтинский государственный технический университет; [email protected]
Polina V. Kozhevnikova - Candidate of Sciences in Technology; Assistant Professor of the Department of Computer Engineering, Information Systems and Technologies; Ukhta State Technical University; [email protected]
Vitaly E. Kuntsev - Candidate of Sciences in Technology; Assistant Professor of the Department of Computer Engineering, Information Systems and Technologies; Ukhta State Technical University; [email protected]
Artur A. Chuvashov - Lecturer of the Department of Computer Engineering, Information Systems and Technologies; Ukhta State Technical University; [email protected]