Научная статья на тему 'Интеграция алгоритмов распознавания литологических типов'

Интеграция алгоритмов распознавания литологических типов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
183
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / ГЕОФИЗИЧЕСКОЕ ИССЛЕДОВАНИЕ СКВАЖИН / МА­ШИННОЕ ОБУЧЕНИЕ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / АЛГОРИТМ K-NN / МЕСТОРОЖДЕНИЯ УРАНА / ПРЕ­ДОБРАБОТКА ДАННЫХ / ПОСТОБРАБОТКА ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Амиргалиев Едилхан Несипханович, Искаков Сырымбет Хасанович, Кучин Ян Игоревич, Мухамедиев Равиль Ильгизович

Описаны результаты исследования применения искусственных нейронных сетей (ИНС) в за­даче распознавания литологических типов на месторождениях урана в Казахстане, приведено сравнение метрических и статистических алгоритмов классификации с ИНС. Предваритель­ные исследования показали, что использование только ИНС позволяет достигать на отдельных выборках от 66 до 73 % совпадения интерпретированных данных с экспериментальными ре­зультатами, полученными в том числе в результате кернового апробирования. Показано, что применение других алгоритмов способно улучшить качество распознавания отдельных пород. Сформулирована задача построения интегрированного классификатора на основе использо­вания множества алгоритмов. Предложен простой алгоритм обучения и распознавания для классификатора этапа постобработки, который обеспечивает улучшение качества распознава­ния на 2–3 %. Обсуждаются возможности улучшения интегрированного классификатора.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Амиргалиев Едилхан Несипханович, Искаков Сырымбет Хасанович, Кучин Ян Игоревич, Мухамедиев Равиль Ильгизович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интеграция алгоритмов распознавания литологических типов»

ИНТЕГРАЦИЯ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИТОЛОГИЧЕСКИХ ТИПОВ

Е. Н. Амиргалиев, С. Х. Искаков*, Я. И. Кучин**, Р. И. Мухамедиев* ***

Институт проблем информатики и управления Министерства образования и науки Республики Казахстан, 050010, Алма-Ата, Казахстан * Международный университет информационных технологий, 050010, Алма-Ата, Казахстан ** ТОО “Геотехносервис”, 050012, Алма-Ата, Казахстан ***Высшая школа менеджмента информационных систем (ТБМЛ), 1У-10(01-84), Рига, Латвия

УДК 519.7

Описаны результаты исследования применения искусственных нейронных сетей (ИНС) в задаче распознавания литологических типов на месторождениях урана в Казахстане, приведено сравнение метрических и статистических алгоритмов классификации с ИНС. Предварительные исследования показали, что использование только ИНС позволяет достигать на отдельных выборках от 66 до 73 % совпадения интерпретированных данных с экспериментальными результатами, полученными в том числе в результате кернового апробирования. Показано, что применение других алгоритмов способно улучшить качество распознавания отдельных пород. Сформулирована задача построения интегрированного классификатора на основе использования множества алгоритмов. Предложен простой алгоритм обучения и распознавания для классификатора этапа постобработки, который обеспечивает улучшение качества распознавания на 2-3 %. Обсуждаются возможности улучшения интегрированного классификатора.

Ключевые слова. Интеллектуальные системы, геофизическое исследование скважин, машинное обучение, искусственные нейронные сети, алгоритм k-NN, месторождения урана, предобработка данных, постобработка данных.

The paper describes the results of research on the use of ANN in the problem of recognition of lithological types and a comparison of metric and statistical classification algorithms with the ANN. Preliminary research has shown that using the ANN alone can achieve an average from 66 % to 73 % degree of successful interpretations, using experimental data obtained during geological researches, including core testing. It is shown that the usage of other algorithms might improve the quality of recognition of individual species. The problem of building integrate classifier that combines a number of classification algorithms was formulated. A simple algorithm of learning and recognition of classifier for post-processing stage was developed, which provides a precise recognition quality increase of 2-3 %. Possibilities of improvement integrate classifier are discussed.

Key words: intellectual systems, geophysical research of boreholes, machine learning, artificial neural network, uranium deposit, k-NN algorithm, post-processing data.

Введение. Подготовка и интерпретация данных в задачах распознавания литологических типов является одной из важнейших в процессе добычи урана на месторождениях Казахстана.

По сути данная задача является слабо формализуемой, ее решение можно искать в рамках научного направления, именуемого “машинное обучение”. Существует большое количество задач и успешных приложений машинного обучения.

Работа выполнена при финансовой поддержке Министерства образования и науки Республики Казахстан (код проекта № 2318/ГФ3).

К методам машинного обучения относится широкий класс алгоритмов, начиная от деревьев принятия решений, генетических алгоритмов, байесовских сетей и заканчивая искусственными нейронными сетями (ИНС).

ИНС широко используются в задачах классификации и распознавания образов [1, 2]. Отдельный класс сетей (сети Хопфилда, Хемминга и Кохонена [3]) используется как средство ассоциативной памяти. Со времени возникновения в конце 1950-х годов (персептрон Розенблата) ИНС устойчиво ассоциируются с искусственным интеллектом, поскольку имитируют важные особенности естественного интеллекта — способность к обучению и ассоциативность. Обширная библиография, посвященная нейронным сетям и их приложениям, отражает неослабевающий интерес исследователей к данному направлению (например, библиография в классических изданиях [1,2] включает более 2000 источников).

Наряду с ИНС существует широкий класс алгоритмов, способных “обучаться”, к ним относятся деревья решений, метрические алгоритмы, например к-ММ, БУМ, статистические алгоритмы и другие.

Начиная с 70-х годов прошлого столетия искусственные нейронные сети стали применяться в задачах петрографии как средство анализа каротажных данных, в литологии, оценке минерально-сырьевой базы и т. п. [4-18]. Применению нейронных сетей для решения практических задач интерпретации каротажных данных в области нефтедобычи посвящена работа [18]. В работе [19] предложено, а в работах [20, 21] описаны некоторые результаты применения нейронных сетей прямого распространения для интерпретации данных геофизического исследования скважин при добыче урана.

В данной работе выполнен сравнительный анализ различных алгоритмов распознавания, примененных к данным электрического каротажа урановых месторождений Казахстана, формализована задача распознавания множеством классификационных алгоритмов, поставлена задача создания системы распознавания, базирующейся на использовании (“интеграции”) нескольких алгоритмов.

Работа состоит из шести частей. В первой части рассматривается применение ИНС для анализа данных электрического каротажа. Во второй части сравниваются результаты, полученные с использованием различных алгоритмов классификации. В третьей части формализуется задача построения системы распознавания с использованием множества классификационных алгоритмов. В четвертой части предложен простой в вычислительном смысле метод построения интегрированного классификатора, который можно применить на этапе постобработки данных, и показаны полученные результаты. В пятой части обсуждаются способы усовершенствования интегрированного классификатора. В заключении кратко описаны результаты и сформулированы задачи дальнейших исследований.

1. Применение ИНС для интерпретации данных электрического каротажа. Добыча урана на месторождениях Казахстана ведется методом подземного скважинного выщелачивания, который относится к числу малозатратных, экологически безвредных способов добычи [22]. При этом экономические показатели процесса добычи зависят от скорости и точности интерпретации геофизических данных, для получения которых часто применяются электрические методы: индукционный каротаж (ИК), каротаж методом кажущихся сопротивлений (КС) и методом естественной поляризации (ПС). Широкое применение кер-нового апробирования при анализе пород невозможно в силу медленности и трудоемкости процесса получения данных.

Ошибочный или неточный анализ геофизических данных приводит к потерям скважин, неоправданным трудозатратам и в конечном счете снижает экономические показатели добы-

чи. Поскольку интерпретация данных каротажа носит во многом эмпирический характер, а точные закономерности отсутствуют, становится очевидной необходимость применения обучаемых систем, в частности, нейронных сетей. Однако, несмотря на достоинства ИНС, главная из которых — это способность ИНС решать слабо формализованные задачи [23], в процессе их применения имеются существенные затруднения:

— неоднозначность мнений экспертов;

— необходимость большого и равного количества примеров из разных классов;

— невозможность нейронной сети объяснить полученный результат;

— необходимость тщательной предварительной подготовки данных (очистка от аномальных значений, нормирование, сглаживание).

Перечисленные проблемы проявились на первом этапе исследования по созданию ней-росетевой системы интерпретации данных каротажа на пластово-инфильтрационных месторождениях Казахстана.

В процессе исследования выполнялась настройка нейронной сети на решаемую задачу и анализировалось влияние следующих факторов:

— алгоритма обучения нейронной сети;

— архитектуры нейронной сети;

— вида нормировки;

— методов сглаживания;

— методов формирования обучающей выборки;

— исключения сдвига каротажных данных относительно друг друга, обусловленных техническими особенностями снятия показаний.

В общей сложности было проведено около 2 тыс. вычислительных экспериментов. В процессе экспериментов на вход сети подавалось “плавающее окно данных” с параметрами “5+1+5” (по пять точек выше и ниже текущей плюс текущая точка) или “3+1+3” трех видов каротажа.

Сложность распознавания связана с тем, что объекты разных классов существенно перемешаны в пространстве признаков, а количество объектов различных классов отличается в десятки раз. На рис. 1 показаны точки, соответствующие породам (по экспертным оценкам) в пространстве трех видов каротажа для месторождения “Буденовское”.

В целом результаты предварительного исследования показали, что применение исключительно ИНС на имеющемся в распоряжении исследователей массиве данных (около 12000 отсчетов) позволяет достичь в некоторых случаях 73 % степени совпадения интерпретируемых данных по сравнению с керновым апробированием (данные, полученные опытным путем). При этом сохраняется разброс качественных показателей в районе 5 % (худший результат распознавания составил 68,3 %, лучший — 76,7 %). Для повышения качества интерпретации необходимо применение качественных обучающих выборок и дополнительных методов классификации.

2. Применение метрических и статистических алгоритмов классификации.

В настоящее время разработаны и применяются метрические, логические (в том числе нечеткие), байесовские, статистические и т. п. методы классификации. Их применение позволяет в общем случае улучшить качество обучающего множества и повысить качество

Рис. 1. Ответы экспертов в трехмерном (ИК, КС и ПС) пространстве признаков. Коды литотипов: 123 — песок разнозернистый; 3 — песок среднезернистый; 4 — песок мелкозернистый; 12 — песок разнозернистый с гравием; 7 — глина; 74 — глина песчаная; 47 — песок мелкозернистый с глиной

распознавания данных. В работе [24] описано применение метрических и статистических алгоритмов (Linear Discriminant Analysis Classifier (LDAC), Support Vector Classification (SVM) (Linear SVM и Non-linear SVM), Diagonal Linear Discriminant Analysis (DLDA), k-Nearest-Neighbor (k-NN)) и показано, что они обеспечивают в среднем несколько меньшую точность распознавания по сравнению с искусственными нейронными сетями.

Тем не менее, можно предположить, что объединение перечисленных алгоритмов тем или иным способом может повысить качество распознавания.

Для дальнейшего анализа были выбраны три алгоритма: ИНС, k-NN и алгоритм распознавания на основе анализа графика КС, который показывает в среднем более низкий результат, однако корректно определяет непроницаемые породы, распознавание которых критично в технологии добычи урана методом выщелачивания. Сравнительные результаты применения алгоритмов показаны в табл. 1.

3. Формализация задачи распознавания множеством классификационных алгоритмов. Применение алгоритмов по отдельности не позволяет достичь высоких показателей распознавания.

Наша задача: используя совокупность распознающих, эвристических в общем смысле алгоритмов, распознавать имеющиеся объекты, образующие пересекающиеся множества в пространстве признаков.

Положим, D — массив данных; R = {г\— множество распознаваемых классов; A = [ai(pi), a2(p2), ■■■,an(Pn)} — коллекция алгоритмов или эвристик; P = [pi, р2,...,pn} — множество параметров, где pг — вектор параметров алгоритма аг; C = [Cp, Cr} — множество ограничений, состоящее из двух подмножеств: ограничений параметров Cp и результатов Cr = [c(ri), ...,c(rm)}, где c(ri) — ограничение качества распознавания класса г.

Нужно найти a* Е A,p* Е P при заданных ограничениях c Е C, такие, что f (a*,p*,D) = max(a’p’D), где f — функция качества.

Таблица 1

Сравнительные результаты применения алгоритмов

Код скважины КС НС k-NN

Среднее 0,6367342 0,734608763 0,675538348

10172 0,615741 0,683333 0,650926

10174 0,613426 0,713735 0,546296

10175 0,646487 0,748132 0,720478

10176 0,741353 0,748132 0,720478

10177 0,533541 0,766771 0,636505

10197 0,686813 0,749608 0,77865

10198 0,593298 0,747144 0,617669

10217 0,621541 0,718025 0,679132

10229 0,678407 0,7366 0,729709

Данная задача относится к классу оптимизационных (поиск экстремума f). Подход к решению заключается в создании системы, условно названной нами “Интегратор”, которая путем изменения вклада алгоритмов из A и, возможно, путем изменения их настроечных параметров, сформирует “правила”, обеспечивающие максимум f при заданных ограничениях.

Название “Интегратор” выбрано в связи с тем, что система объединяет (“интегрирует”) итоговое решение путем изменения использования нескольких алгоритмов.

Следует заметить, что в общем случае функции распознавания не являются гладкими и непрерывными. Изменение параметров алгоритмов и получаемые результаты могут быть дискретными. Решение задачи методом полного перебора затруднительно, поскольку потребуется не только объединить алгоритмы друг с другом, но и изменить их вклад в общий результат для различных пород и, возможно, изменять параметры алгоритмов. Сложность такого “интегратора” будет возрастать пропорционально факториалу от общего числа алгоритмов и их параметров.

4. “Интегратор” на этапе постобработки. Сложность описанной выше оптимизационной задачи затрудняет ее решение методом прямого перебора (грубой силы). Однако, можно предложить некоторые эвристики, которые позволят значительно снизить вычислительные затраты. В первую очередь, можно объединять результаты на этапе постобработки.

Каждый из алгоритмов распознавания (ИНС, k-NN, КС) в среднем дает от 60 % до 65 % совпадения с ответами, полученными опытным путем (с помощью кернового апробирования). Анализ показал, что ответы алгоритмов совпадают следующим образом: КС — k-NN (72,23%); КС — ИНС (76,20%); k-NN — ИНС (77,78%). При этом каждый из алгоритмов показывает различный процент распознавания и ошибок на каждой породе (табл. 2).

Можно видеть, что есть возможность улучшения общего результата путем комбинирования ответов различных алгоритмов (на этапе постобработки) путем выбора наиболее часто встречающегося ответа. Для оценки такой возможности нами предложен и апробирован метод, который мы назвали “простой интегратор на этапе постобработки” (Simple Integrator of post-processing — SIPP).

SIPP работает на основе статистических данных распознавания в два этапа:

— обучение путем заполнения матрицы смежности;

— анализ результатов распознавания и выбор итогового литотипа путем использования матрицы смежности.

4.1. Обучение SIPP путем заполнения матрицы смежности. Обучение SIPP проходит на основе данных, полученных в ходе работы N алгоритмов интерпретации (в нашем случае N = 3).

Первый этап заключается в заполнении N-мерного куба смежности. При этом количество сторон равно количеству алгоритмов, а каждая сторона куба состоит из множества литотипов, которые выдаются в ответах алгоритмов.

На рис. 2 показан куб, у которого ось X — измерение алгоритма КС (AR), ось Y — алгоритм k-NN, ось Z — алгоритм ИНС (ANN). Рассмотрим ячейку с координатами (3,7,1), причем 3 соответствует 3-й породе по оси КС (ось X), 7 — по оси k-NN (Y) и 1 — первой породе по оси ИНС (Z). При этом возможно, некоторые алгоритмы не могут распознавать отдельные породы. Например, алгоритм КС не распознает литотип 47.

Заполнение куба смежности выполняется следующим образом:

Шаг 1. Выбираем любую ячейку, например (3,7,1).

Шаг 2. Проходим по всей обучающей выборке и везде, где встречается случай 3,7,1 (алгоритм КС дал ответ 3, k-NN — 7, ИНС — 1), определяем количество правильных ответов по каждому литотипу (3,7,1), другими словами, количество совпадений ответов алгоритмов с экспертными оценками или экспериментальными исследованиями.

Шаг 3. Среди трех возможных ответов определяем номер литотипа с максимальным количеством правильных ответов и подставляем его в ячейку куба.

Шаг 4. Переходим к следующей незаполненной ячейке куба. Можно предположить, что применение SIPP при “интеграции” результатов нескольких алгоритмов в любом случае даст результат в среднем не худший, чем наилучший результат каждого из алгоритмов по отдельности.

Нестрогая оценка временной сложности алгоритма заполнения матрицы смежности S для шага 1 пропорциональна константе (0(1)), для шага 2 — числу объектов в выборке (0(n)); для шага 3 константе 0(1). Количество шагов алгоритма — константа, равная количеству ячеек куба (K). Таким образом, временная сложность алгоритма определяется выражением S = K(0(1) + 0(n) + 0(1)), упрощая которое, получаем приближенную оценку S = 0(n).

4.2. Анализ результатов распознавания и выбор итогового литотипа. Выбор итогового литотипа из трех предлагаемых происходит с помощью ячеек куба, заполненного на первом шаге.

В результате проведенных опытов было достигнуто улучшение результатов распознавания на 2-3% в зависимости от тестируемых скважин (табл. 3). Как видно из таблицы, в данном случае на каждой скважине SIPP дает лучший результат, чем каждый из алгоритмов по отдельности. При этом средний результат выше лучшего среднего (ИНС) на 3,2 %, а среднеквадратическое отклонение близко к минимальному среди трех алгоритмов. Таким образом, применение данного алгоритма повышает качество распознавания при сравнительно небольшой дисперсии. Очевидно, что временная сложность алгоритма принятия решения постоянна (0(1)).

5. Обсуждение. Рассмотренный подход предполагает формирование или использование некоторого множества эвристик, обеспечивающих решение сложной оптимизационной

' Z (ANN)

Y (к* 4N)

/ y

/' Г 7" 7 7 "7 ~7 -Г -/ /

///////// /

Г ' К >' / X >' к У/ Г' г X (AR

~ J

Рис. 2. Куб смежности

Таблица 2

Сравнительные результаты качества распознавания отдельных пород

Алгоритм Качество распознавания 1 3 4 т 59

КС Правильное 0,919 0,663 0,043 0,000 0,743

распознавание Ошибка 0,216 0,379 0,878 0,000 0,435

k-NN Правильное 0,788 0,689 0,214 0,055 0,200

распознавание Ошибка 0,182 0,439 0,734 0,822 0,767

ИНС Правильное 0,857 0,724 0,306 0,243 0,486

распознавание Ошибка 0,122 0,366 0,714 0,662 0,541

Таблица 3

Результаты работы алгоритмов распознавания и SIPP

Код скважины КС ИНС k-NN SIPP

10172 0,6157410 0,683333 0,650926000 0,715741

10174 0,6134260 0,713735 0,546296000 0,731481

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10175 0,6464870 0,748132 0,720478000 0,764574

10176 0,7413530 0,748132 0,720478000 0,764574

10177 0,5335410 0,766771 0,636505000 0,832293

10197 0,6868130 0,749608 0,77865000 0,797488

10198 0,5932980 0,747144 0,617669000 0,753998

10217 0,6215410 0,718025 0,679132000 0,769634

10229 0,6784070 0,736600 0,729709000 0,771822

Среднее 0,6367342 0,734608763 0,675538348 0,766845

Среднеквадратическое отклонение 0,06000000 0,0250000 0,070000000 0,034000

задачи за практически приемлемое время. Описанный метод оптимизирует решение только по одному параметру — среднему значению качества распознавания. Кроме того, данный метод обладает сравнительно малыми возможностями для обучения вследствие малого объема памяти куба смежности (ниже). Полезно также наряду с увеличением числа правильных ответов учесть количество ошибок распознавания, получаемых при использовании того или иного алгоритма, то есть минимизировать ошибки первого и второго рода. Можно предложить ряд простых решений:

1) Исключать из “куба” правильных ответов ответы алгоритма, который имеет максимальное количество ошибок по конкретной породе.

2) Повысить чувствительности метода путем ввода дополнительного параметра, реагирующего на сочетание алгоритмов. Например, если сочетание алгоритмов для определенной ячейки дает максимум совпадения с породой х1, а экспертная оценка дает чаще всего породу х2, то последнюю и будем считать решением и запишем в ячейку куба породу х2.

3) Увеличить память решателя различными способами. Отметим, что объем памяти текущего решателя можно оценить как произведение числа распознающих алгоритмов на мно-

жество распознаваемых пород. Эта величина приблизительно равна М = NА (Ж — число распознаваемых литотипов, А — число алгоритмов). Очевидно, что для рассмотренного выше случая М = 512. Увеличение объема памяти может способствовать повышению точности. Возможно несколько решений. Простое решение по увеличению памяти: увеличение числа “кубов”, например, создание “кубов” по глубине, разбивая анализируемые глубины на диапазоны, для каждой из которых существует свой куб смежности.

4) Кроме того, увеличить память можно путем увеличения размерности куба (добавления классификационных алгоритмов и устранения алгоритмов, показавших плохой результат).

5) Еще один способ увеличить память — увеличение числа ступеней иерархии путем добавления кубов смежности по ближайшим скважинам. Можно предположить, что распределение литотипов по глубине для территориально близких скважин может быть весьма похожим. “Куб ближайших скважин” работает таким образом, что ответ дорабатывается с учетом ответов по ближайшим скважинам (как один из возможных вариантов, хранение в ячейках куба смежности не конкретных значений (номеров алгоритма), а распределений вероятности пород по глубине). “Интеграция” ответов может происходить алгебраически, например, умножением вероятности породы для ближайшей скважины для данной глубины на вероятность ответа, полученную другим способом или с использованием нечеткой логики.

6) Более тонким является учет распределения пород по глубине, учитывающий, например, естественные деформации пластов [25]. Фактически необходим дополнительный алгоритм, базирующийся на сведениях о геологическом строении месторождения.

7) Наконец, увеличить память может ввод дополнительных связей между “интеграторами” разного типа. Эти связи можно реализовать на базе агентного подхода, где каждый алгоритм “интегратора” представляет собой эволюционирующего агента в многоагентной среде. В свою очередь, такой подход влечет за собой задачу разработки базы агентов распознавания, задачу выбора или разработки протоколов обмена информации агентами, процедур эволюции агентов. В этом случае для создания комплексного обучаемого алгоритма необходима разработка оболочки, которая позволила бы “сосуществовать” множеству программных агентов, выполняющих задачу распознавания, взаимодействующих между собой (кооперирующихся или конкурирующих) в целях максимизации функционала качества. Использование множества распознающих алгоритмов (агентов) математически близко к методологии алгебраического подхода, теоретическое описание которого приведено в [26]. При этом стоит учесть, что “корректор по результатам”, предусматривающий решение задачи распознавания на основе результатов обработки исходной информации отдельными алгоритмами, не позволяет построить множество “простых операций”, обеспечивающих улучшение качества результата для всех случаев. Более того, ограниченный экспериментальный материал может приводить к существенному изменению функционала ошибки [27]. Поэтому ожидаемым решением является построение адаптивной системы, настраивающейся на получение наилучшего результата после некоторого объема экспериментов.

Заключение. Интерпретация данных геофизического исследования скважин носит характер слабо формализуемой задачи распознавания. Вследствие этого для решения задачи можно использовать обучаемые системы, в частности, ИНС.

Однако предварительное исследование показало, что применение исключительно ИНС позволяет достичь на некоторых выборках в среднем 73 % степени совпадения интерпретированных данных с экспериментальными данными. Применение других алгоритмов распознавания, например, метрических и статистических алгоритмов классификации и их сравнение с ИНС показывает, что указанные алгоритмы обеспечивают в среднем несколько худший ре-

зультат. Однако качество распознавания отдельных литологических типов различается для разных алгоритмов. Это обстоятельство и стало основным в предложенной идее “простого интегратора” на этапе постобработки.

В результате сформулирована задача построения интегрированного классификатора (“Интегратора”) с использованием множества классификационных алгоритмов. Поскольку решение этой задачи методом полного перебора затруднительно, то предложен алгоритм, названный “простым интегратором на этапе постобработки” (SIPP), применение которого способно улучшить результат (количество правильно распознанных литологических типов) на 2-3 % при сохранении дисперсии результатов, близкой к минимальной.

Временная сложность алгоритма формирования SIPP линейно зависит от количества исходных данных (0(n)), а алгоритм выбора результата — константа (0(1)).

Целью дальнейших исследований является поиск и анализ эвристик для “интеграторов” на этапе постобработки и предобработки и разработка методов синтеза более широкого спектра алгоритмов, которые должны обеспечить повышение качественных характеристик системы распознавания литологических типов на урановых месторождениях.

Список литературы

1. Russell S., Norvig P. Artificial intelligence: a modern approach. Upper Saddle River (New Jersey): Pearson edition, Inc., 2010.

2. Jones M. T. Artificial intelligence: a systems approach. Infinity science press LLC. Hingham — Massachusetts — New Delhi, 2008.

3. КОХОНЕН Т. Ассоциативная память. М.: Мир, 1980.

4. Baldwin J. L., Bateman R. M., Wheatley C. L. Application of a neural network to the problem of mineral identification from well logs // The Log Analyst. 1990. N 3. P. 279-293.

5. Benaouda B., Wadge G., Whitmark R. B., Rothwell R. G., MacLeod C. Inferring the lithology of borehole rocks by applying neural network classifiers to downhole logs — an example from the Ocean drilling program // Geophys. J. intern. 1999. N 136. P. 477-491.

6. Saggaf M. M., Nebrija Ed. L. Estimation of missing logs by regularized neural networks // AAPG Bul. 2003. V. 87, N 8. P. 1377-1389.

7. Тененев В. А., Якимович Б. А., Сенилов М. А., Плклин Н. Б. Интеллектуальные системы интерпретации геофизических исследований скважин // Штучний унтелект. 2002. N. 3.

8. Yelbig K., Treitel S. Computational neural networks for geophysical data processing. 2001.

9. Borsaru M., Zhou B., Aizawa T., Karashima H., Hashimoto T. Automated lithology prediction from PGNAA and other geophysical logs // Appl. Radiation And Isotopes. 2006. N 64. P. 272-282.

10. Rogers S. J., Chen H. C., Kopaska-Merkel D. C., Fang J. H. Predicting permeability from porosity using artificial neural networks // AAPG Bulletin. 1995. N 79. P. 786-1797.

11. Kapur L., Lake L., Sepehrnoori K., Herrick D., Kalkomey C. Facies prediction from core and log data using artificial neural network technology // Trans. of 39th soc. of professional well log analysts annual logging symp. 1998.

12. Алешин С. П., Ляхов А. Л. Нейросетевая оценка минерально-сырьевой базы региона по данным геофизического мониторинга // Новi технологи. 2011. № 1 (31). [Режим доступа]: http://www.nbuv.gov.ua/portal/natural/newtech/2011_1/articles/2-3.pdf.

13. Карпенко А. Н., Булмлсов О. В. Применение нейросетевых технологий при интерпретации данных геофизических исследований скважин. [Режим доступа]: http://oil-gas.platinov-s.com/index.php?name=articles&op=view&id=11&pag=3&num=1.

14. Raynal J. C., Serge A., Sagot A. M., et al. Organization of field tests and evaluation of tricone bit performance using statistical analysis and sonic logs // J. Petroleum Technology. 1971.

15. Rogers S. J., Fang J. H., Karr C. L., Stanley D. A. Determination of lithology from well logs using a neural network // AAPG Bul. 1992. N 76 (5). P. 731-739.

16. Bueno E. O. J., Perez I. C., Escamilla G., et al. Applications of artificial neural networks and dipole sonic anisotropy in low-porosity, naturally fractured, complex lithology formations in the southern land region of Mexico // 1st Intern. oil conf. and exhib, Mexico (Cancun), Aug. 31-Sept. 2, 2006.

17. Benaouda D., Wadge G., Whitmarsh R. B., et al. Inferring the lithology of borehole rocks by applying neural network classifiers to downhole logs: an example from the Ocean drilling program // Geophys. J. intern. 1999. N 136 (2). P. 477-491.

18. Костиков Д. В. Инструментальные средства интерпретации геофизических исследований скважин на основе преобразованных каротажных диаграмм с помощью многослойной нейронной сети. Автореф. дис. ... канд. техн. наук. М.: РГБ, 2007.

19. Kuchin Y., Muhamedyev R., Muhamedyeva L. Interpretation of log data of boreholes // The 9th Intern. conf. “Inform. technol. and management”, Riga (Latvia), Apr. 14-15, 2011.

20. Kuchin Y. I., Muhamedyev R. I., Muhamedyeva E. L., Gricenko P., Nurushev Zh., Yakunin K. The analysis of the data of geophysical research of boreholes by means of artificial neural networks // 5th Intern. conf. “Innovative inf. technol. for science, business and education”, Vilnus (Lietuva), May 10-12, 2012.

21. Muhamediyev R. I., Kuchin Y., Muhamedyeva E. Recognition of geological rocks at the bedded-infiltration uranium fields by using neural networks // IEEE conf. on open systems. Kuala Lumpur, 2012. IEEE Xplore database: http://cs.ieeemalaysia.org/IC0S2012/. Digital object identifier: 10.1109/ICOS.2012.6417622.

22. Jashin S. A. Underground acidic in situ leaching of uranium at the Kazakhstan deposits // Gorny Zurnal. 2008. N 3.

23. НЕЙРОКОМПЬЮТЕРЫ: учеб. пособие для вузов. М.: Изд-во МГТУ им. Н. Э. Баумана, 2004.

24. Амиргалиев Е. Н., Кучин Я. В., ИсклковС.Х., Мухамедиев Р. И., Мухамедие-ВА Е. Л. Оценка качества нейросетевого распознавания литологических слоев на урановых месторождениях // Материалы науч.-практ. конф. “Актуальные проблемы информатики и процессов управления”. Алма-Ата (Казахстан): Институт проблем информатики и управления. С. 262-270.

25. Royer J. J. Predicting faults form curvatures of deformed geological layers viewed as thin plates // ECMOR XIII: 13th European conf. on the math. of oil recovery, Biarritz (France), Sept. 10-13, 2012.

26. ЖУРАВЛЕВ Ю. И. Об алгебраических методах в задачах распознавания и классификации. Математические методы и их применение. Распознавание. Классификация. Прогноз // Докл. Акад. наук СССР. 1988. Вып. 1. С. 9-16.

27. ЖУРАВЛЕВ Ю. И., Гуревич И. Б. Распознавание образов и распознавание изображений. Распознавание. Классификация. Прогноз // Докл. Акад. наук СССР. 1989. Вып. 1. С. 5-72.

Амиргалиев Едилхан Несипханович — д-р техн. наук, чл.-кор. НАН, Институт проблем информ,ат,ики и управления НАН РК; e-mail: amir_ed@mail.ru;

Искаков Сырымбет Хасанович — докторант Международного университета информационных технологий, мл. науч. сотр. Института проблем информ,атики и управления НАН РК; e-mail: i.syrymbet@gmail.com;

Кучин Ян Игоревич — ведущий менеджер ТОО “Геотехносервис”; e-mail: ykuchin@mail.ru;

Мухамедиев Равиль Ильгизович — dr. sc. ing., зав. кафедрой Международного университета информационных технологий, проф. ISMA; e-mail: ravil.muhamed@gmail.com

Дата поступления — 02.09.2013

i Надоели баннеры? Вы всегда можете отключить рекламу.