Научная статья на тему 'Методы интеллектуальной оцифровки данных геофизических исследований скважин'

Методы интеллектуальной оцифровки данных геофизических исследований скважин Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
952
125
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕОФИЗИЧЕСКИЕ ИССЛЕДОВАНИЯ СКВАЖИН / ОЦИФРОВКА КАРОТАЖНЫХ ДИАГРАММ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / РАСТРОВЫЕ ИЗОБРАЖЕНИЯ / WELL SURVEY / DIGITIZATION OF WELL-LOGGING DATA / INTERPOLATION / NORMALIZATION / ARTIFICIAL NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хашпер А. Л., Линд Ю. Б., Галеев С. Р.

В работе рассматривается возможность применения методов искусственного интеллекта, таких как искусственные нейронные сети, к решению задачи автоматической оцифровки данных геофизических исследований скважин (каротажных диаграмм). Предлагаемый математический аппарат обладает способностью предсказания ситуаций с неизвестным видом связей между входными и выходными параметрами, за счет чего позволяет найти наилучшие значения свойств модели, при которых будет минимизироваться ошибка. Т.о., искусственные нейронные сети являются эффективным инструментом решения задач распознавания образов, к которым относится рассматриваемая задача оцифровки каротажных диаграмм, а их программная реализация позволяет уменьшить влияние человеческого фактора при создании проектной документации и улучшить параметры подсчета запасов и бурения скважин.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Хашпер А. Л., Линд Ю. Б., Галеев С. Р.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS OF INTELLECTUAL DIGITIZATION FOR WELL SURVEY DATA

Nowadays well survey data are presented in the digital form which is suitable for computer analysis and interpretation. However, there is a lot of paper well-logging diagrams in different oil companies on wells drilled in the earlier years having no digital analogs. So digitization of such data with the purpose of their further analysis becomes a very important problem. In this paper solving of this problem has been proposed. There are two types of well-logging diagrams in LLC “BashNIPIneft”: diagrams obtained by means of computer programs and diagrams drawn by analog recorders on paper. By now the problem of programmatically constructed well-logging diagrams digitization has been solved. Features of computer-obtained well-logging diagrams include different drawing of log curves (for example, boldface and dotted lines, etc), color coincidence for different curves (doubling of color), superfluous colors and letterings, lack of uniqueness (frequently some depth is associated not with the only value of some well-logging). Developed software digitizes them taking into account the above features and using mathematical methods of averaging, interpolation and normalization. This allows raising accuracy of well survey data interpretation and thus increasing efficiency of geological models construction.

Текст научной работы на тему «Методы интеллектуальной оцифровки данных геофизических исследований скважин»

УДК 004.93

МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОЙ ОЦИФРОВКИ ДАННЫХ ГЕОФИЗИЧЕСКИХ ИССЛЕДОВАНИЙ СКВАЖИН

© А. Л. Хашпер1*, Ю. Б. Линд2, С. Р. Галеев1

1 Башкирский государственный университет Россия, Республика Башкортостан, 450076 г. Уфа, ул. Заки Валиди, 32.

Тел.: +7 (347) 272 63 70.

E-mail: rector@bsu.bashedu.ru 2ООО «БашНИПИНефть» Россия, Республика Башкортостан, 450006 г. Уфа, ул. Ленина, 86/1.

Тел.: +7 (347) 262 43 40.

E-mail: bashnipineft@bashneft.ru

В работе рассматривается возможность применения методов искусственного интеллекта, таких как искусственные нейронные сети, к решению задачи автоматической оцифровки данных геофизических исследований скважин (каротажных диаграмм). Предлагаемый математический аппарат обладает способностью предсказания ситуаций с неизвестным видом связей между входными и выходными параметрами, за счет чего позволяет найти наилучшие значения свойств модели, при которых будет минимизироваться ошибка. Т.о., искусственные нейронные сети являются эффективным инструментом решения задач распознавания образов, к которым относится рассматриваемая задача оцифровки каротажных диаграмм, а их программная реализация позволяет уменьшить влияние человеческого фактора при создании проектной документации и улучшить параметры подсчета запасов и бурения скважин.

Ключевые слова: геофизические исследования скважин, оцифровка каротажных диаграмм, искусственные нейронные сети, растровые изображения.

Современные технологии разработки нефтяных месторождений предполагают компьютеризированную обработку и интерпретацию данных геофизических исследований скважин, в частности, каротажа. В настоящее время данные ГИС представляются в электронном виде, удобном для анализа и интерпретации. Однако во многих нефтяных организациях, в частности, в ООО «БашНИПИнефть» накоплен большой объем каротажных диаграмм по ранее пробуренным скважинам на бумажных носителях, для которых нет количественных аналогов. Поэтому актуальной задачей является оцифровка таких данных с целью их последующего анализа, т.е. разработка программного продукта, реализующего считывание и распознание файлов, представляющих собой скан-копии каротажных диаграмм. При этом задача разбивается на две:

1) непосредственное считывание пикселей растрового изображения;

2) оцифровка получаемых изображений, т.е. превращение картинки в массив чисел. В результате работы программы получается векторное представление каротажной диаграммы, которое имеет цифровой вид, пригодный для печати или записи на электронные носители.

Существующие программные продукты обработки данных ГИС позволяют осуществлять оцифровку данных, представленных в графическом виде, в полуавтоматическом режиме, что является неэффективным из-за влияния человеческого фак-

тора и необходимости обработки большого объема информации, поэтому поставлена задача разработки и программной реализации методов, позволяющих в автоматическом режиме осуществлять корректную оцифровку каротажных диаграмм с целью их последующего анализа.

В ООО «БашНИПИнефть» существует два вида архивных каротажных диаграмм: изображения, полученные программно, но для которых утеряны исходные данные, и диаграммы, построенные аналоговым способом на бумажных носителях. Задача распознания файлов с каротажными диаграммами, полученными на компьютере, характеризуется следующими проблемами:

— различное начертание кривых (пунктир, толстые линии и т. п.),

— совпадение цветов для различных кривых (дублирование цвета),

— наличие надписей и лишних цветов,

— неоднозначность кривых (одной точке по глубине сопоставляется не всегда единственное значение каждого параметра).

Указанные проблемы решаются с использованием математических методов усреднения, интерполяции и нормировки получаемых изображений.

Усреднение требуется, если на кривой ГИС некоторым значениям глубины сопоставляется более одного значения каротажа. Это может быть вызвано начертанием кривой (толстая линия) либо некорректной увязкой нескольких кривых (рис. 1).

* автор, ответственный за переписку

Рис. 1. Пример некорректной увязки кривых ГИС.

В программе усреднение реализуется следующим образом. Пусть глубине х соответствует п значений каротажау1, у2, ..., уп, где у1 < у2 < ... <уп. Тогда в качестве значения каротажа, соответствующего глубине х, выбирается уп/2.

Кривые ГИС требуется интерполировать, если они разрывны (в данном случае это означает, что для некоторых значений глубины нет соответствующего значения кривой ГИС), что может наблюдаться по следующим причинам:

1) пунктирное начертание кривой;

2) две кривые пересекаются, вследствие чего точки одной кривой перекрываются точками другой;

3) некоторые точки кривой были утеряны в процессе оцифровки.

Устранить разрывность кривой можно путем интерполяции. В общем виде задача интерполяции заключается в следующем. На отрезке [а, Ь] заданы п + 1 точек х = х0, хр..., хп, которые называются

узлами интерполяции, и значения некоторой функции Дх) в этих точках

/ (х0 ) = Уо, / (х1) = УЪ--; / (хп ) = Уп ■ (1)

Требуется построить функцию Ф(х) (интерполяционная функция), принадлежащую известному классу и принимающую в узлах интерполяции те же значения, что и Дх), т. е. такую, что

Ф( *о) = Уо, Ф( х\) = У1,-, Ф( хп ) = уп (2)

В такой общей постановке задача может иметь бесконечное множество решений или совсем не иметь решений.

Однако эта задача становится однозначной, если вместо произвольной функции Ф(х) искать полином р(х) (интерполяционный полином) степени не выше п, удовлетворяющий условиям (2), т.е. такой, что

9 (хо) = Уо >9 (х1) = У1,к,р(хп ) = у„. (3)

Полученную интерполяционную формулу ^ (х) = ап хп + ап-1хп-1 + ... + ахх + а0 (4)

обычно используют для приближенного вычисления значений данной функции Дх) для значений аргумента х, отличных от узлов интерполяции. Такая операция называется интерполяцией функций.

Различают два вида интерполяции:

1) глобальная — соединение всех точек Дх) единым интерполяционным полиномом;

2) локальная — соединение точек отрезками прямой (по двум точкам), отрезками параболы (по трем точкам) [1].

В данной работе применяется простейший вид локальной интерполяции — линейная интерполяция: заданные точки соединяются прямолинейными отрезками. Для каждого из интервалов в качестве уравнения интерполяционного полинома используется уравнение прямой, проходящей через две точки. В частности, для г-го интервала уравнение прямой, проходящей через две точки (х,, у, ),(х,+1, у1+1) принимает вид:

У - У, _ х - X

У,+1- У, X+1- X Следовательно, у = агх + Ьг, хг- < х < хг-+1, где

а = Ум ~ у', Ь = у1 - а х1

(5)

_ (6)

х1+1 Х1

В дальнейшем планируется применять более совершенные методы интерполирования.

Нормировка - это корректировка ряда (вектора) значений в соответствии с некоторыми функциями преобразования, приведение кривых к стандартным условиям измерений.

В заголовке каротажной диаграммы указываются границы изменения каждого из приведенных видов ГИС (рис. 2).

P — Pmin

X = (Xmax - Xmin ) ~ —p + Xmin (7) pmax — pmin

где Xmia и Xmax —минимальное и максимальное значения каротажа (в соответствующих единицах измерения), Pmia и Pmax — минимальное и максимальное значения соответствующей кривой в ширину (в пикселях), Хи P — текущее значение каротажа (в соответствующих единицах измерения) и абсциссf рассматриваемой точки кривой (в пикселях);

I -1

Y = (у — у ч min | у (8)

1 (1 max 1 min ч j j + 1 min (8)

1 max — 1 min

где Ym¡л и Ymax — минимальное и максимальное значения глубины (в метрах), /^ и /max — минимальное и максимальное значения соответствующей кривой в длину (в пикселях), Y и / — текущее значение глубины (в метрах) и ордината соответствующей точки кривой (в пикселях).

Значения кривых ГИС, полученные по формулам (7—8), можно использовать для дальнейшей интерпретации.

Программа, реализующая указанные алгоритмы, производит попиксельное считывание графического файла, используя функции обработки растровых изображений программной среды Borland C++ Builder, распознает цветные пиксели с помощью RGB-модели, создает массивы данных по числу цветов и оцифровывает изображение с учетом названных особенностей (рис. 3-4, табл.).

Рис. 3. Исходная каротажная диаграмма (фрагмент).

Рис. 4. Изображение, полученное в результате работы программы.

Рис. 2. Заголовок каротажной диаграммы.

При считывании кривой ей сопоставляются координаты в пикселях. Необходимо привести эти значения к реальным (т.е. по ширине значения должны изменяться в соответствии с границами для данного каротажа, а по длине — в соответствии с заданной глубиной). Следовательно, необходимо выполнить преобразование координат по следующим формулам:

Таблица

Цифровое представление каротажной диаграммы (фрагмент)

Глубина, м ПЗ, Ом-м ДС, м ГК, мкР/ч ПС, мВ НГК, мкР/ч

979.2 108.8

979.3 123.4

979.4 130.6

979.5 130.6

979.6 130.6

979.7 130.6

979.8 130.6

979.9 137.9

980.0 137.9

980.1 137.9

980.2 137.9

980.3 145.2

980.4 145.2

980.5 145.2

980.6 145.2

0.1622 1.267

0.1622 1.267

0.1662 1.267

0.1662 1.267

0.1662 1.267

0.1662 1.423

0.1703 1.423

0.1703 1.578

0.1703 1.578

0.1703 1.423

0.1703 1.267

0.1703 1.267

0.1703 1.111

0.1662 1.111

0.1662 1.111

2.818 2.000

2.834 2.043

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2.864 2.086

2.864 2.129

3.026 2.172

3.056 2.237

3.101 2.281

3.175 2.346

3.234 2.389

3.294 2.389

3.323 2.346

3.368 2.303

3.383 2.259

3.546 2.216

3.576 2.195

Характерными проблемами при оцифровке каротажных диаграмм второго типа (построенных аналоговым способом) являются необходимость считывания рукописного текста, которым подписаны глубины и «шапка» диаграммы, и неоднородность масштаба по глубине, возникающая при сканировании с бумажных носителей. В настоящее время производится отладка программы решения упрощенной задачи распознания символов на каротажных кривых, полученных программно (рис. 2). При этом необходимо распознавать цифры и буквы русского алфавита (рис. 5).

В первую очередь поставлена задача распознавания чисел. Цифровые символы, которые необходимо распознать, относятся к трем категориям (рис. 5): глубина по стволу скважины (курсив), глубина по вертикали (полужирный курсив) и границы значений каротажей (цветной шрифт). Каждая из этих категорий распознается по отдельности, переходя от простого к сложному (сначала параметрами выступают цвет и размер шрифта, затем добавляется курсив и полужирный шрифт).

Математически данная задача сводится к задаче распознавания объектов: требуется построить алгоритм, который по любому входному объекту, не обязательно принадлежащему обучающему множеству, решает, какому классу этот объект принадлежит [2]. Для решения этой задачи применяются различные методы искусственного интеллекта: дискриминантные функции, нейронные сети, метод опорных векторов, векторное квантование. В данной работе решение этой задачи осуществляется с использованием искусственной нейронной сети — многослойного персептрона.

Многослойный персептрон представляет собой нейронную сеть, состоящую из нескольких

слоев. Каждый слой персептрона образован нейронами, и нейроны последующего слоя соединены с нейронами предыдущего слоя при помощи системы весов. Обучение персептрона реализуется посредством настройки весов с целью уменьшения разности между целевыми и получаемыми векторами на выходе по алгоритму обратного распространения ошибки (рис. 6) [3].

Рис. 5. Символы, которые необходимо распознавать на диаграмме.

Сопоставление распознанных значений глубины и границ каротажа с координатами соответствующих точек позволяет нормировать значения каротажей и привязать их к полученным глубинам, что является необходимым условием их корректной интерпретации.

Далее планируется решить задачу в более сложной постановке распознавания надписей от руки, для чего необходим учет почерка, наклона, высоты и других характеристик, присущих рукописному тексту. Полученные результаты позволят учитывать возможное больше скважин месторож-

дения, по которым предоставлены данные ГИС, при построении геологической модели месторождения и подсчете запасов углеводородов, снижая влияние человеческого фактора и повышая эффективность проектировании разработки месторождений. В целом, методы искусственного интеллекта позволяют создавать прикладные нейросистемы, реализующие структурную и параметрическую идентификацию объектов и позволяющие эффек-

тивно решать задачи распознавания образов в нефтегазовой отрасли.

ЛИТЕРАТУРА

1. Ханова А. А. Интерполяция функций. Методическое пособие для студентов Института информационных технологий и коммуникаций. Астрахань: изд-во АГТУ, 2001. 22 с.

2. Лепский А. Е., Броневич А. Г. Математические методы распознавания образов. Таганрог: ТТИ ЮФУ, 2009. 155 с.

3. Haykin S. Neural Networks - a Comprehensive Foundation. Pearson Education, 2005. 823 p.

Рис. 6. Блок-схема обучения персептрона.

Поступила в редакцию 13.07.2013 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.