Научная статья на тему 'Использование программного комплекса gia в геологическом прогнозировании'

Использование программного комплекса gia в геологическом прогнозировании Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
64
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕОИНФОРМАЦИОННЫЙ АНАЛИЗ / ГЕОЛОГИЧЕСКОЕ ПРОГНОЗИРОВАНИЕ / СИСТЕМНО-МОДЕЛЬНЫЙ ПОДХОД / КАРТОГРАФИЧЕСКАЯ ИНФОРМАЦИЯ / GIS ANALYSIS / GEOLOGICAL PREDICTION / SYSTEM-MODEL APPROACH / CARTOGRAPHIC INFORMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дударева Оксана Витальевна, Королёва Анжела Владимировн

На основе формализации данных и знаний рассматриваются вопросы, связанные с состоянием геологического прогнозирования, классификацией его методов, идеологией. Анализируются существующие подходы к решению задач геологического прогнозирования: распознавание образов, экспертные системы, системно-модельный подход. Перспективным является направление, предложенное В.В. Марченко, которое основывается на использовании картографической информации и формализации знаний. Предпринята новая попытка показать эффективность этого подхода, но уже на основе применения современного программного комплекса GIA (Геоинформационный анализ), в создании, испытании и внедрении которого авторы принимали активное участие.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дударева Оксана Витальевна, Королёва Анжела Владимировн

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING GIA SOFTWARE IN GEOLOGICAL PREDICTIONS

The issues related to the classification of geographic information forecasting methods, ideology and the state of geological prediction are considered on the basis of data and knowledge formalization. The paper analyzes current approaches to solving the problems of geological prediction including pattern recognition, expert systems, and a system-model approach. It indicates a promising character of the direction proposed by V.V. Marchenko, which is based on using cartographic information and knowledge formalization. This paper is a new attempt to show this approach effectiveness on the basis of the modern software system GIA (geoinformational analysis), which was developed, tested and implemented under the active involvement of authors.

Текст научной работы на тему «Использование программного комплекса gia в геологическом прогнозировании»

УДК 551

ИСПОЛЬЗОВАНИЕ ПРОГРАММНОГО КОМПЛЕКСА GIA В ГЕОЛОГИЧЕСКОМ ПРОГНОЗИРОВАНИИ

и о

© О.В. Дударева1, А.В. Королёва2

Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

На основе формализации данных и знаний рассматриваются вопросы, связанные с состоянием геологического прогнозирования, классификацией его методов, идеологией. Анализируются существующие подходы к решению задач геологического прогнозирования: распознавание образов, экспертные системы, системно-модельный подход. Перспективным является направление, предложенное В.В. Марченко, которое основывается на использовании картографической информации и формализации знаний. Предпринята новая попытка показать эффективность этого подхода, но уже на основе применения современного программного комплекса GIA (Геоинформационный анализ), в создании, испытании и внедрении которого авторы принимали активное участие. Ил. 3. Табл. 1. Библиогр. 5 назв.

Ключевые слова: геоинформационный анализ; геологическое прогнозирование; системно-модельный подход; картографическая информация.

USING GIA SOFTWARE IN GEOLOGICAL PREDICTIONS O.V. Dudareva, A.V. Korolyova

Irkutsk State Technical University, 83 Lermontov St., Irkutsk, Russia, 664074.

The issues related to the classification of geographic information forecasting methods, ideology and the state of geological prediction are considered on the basis of data and knowledge formalization. The paper analyzes current approaches to solving the problems of geological prediction including pattern recognition, expert systems, and a system-model approach. It indicates a promising character of the direction proposed by V.V. Marchenko, which is based on using cartographic information and knowledge formalization. This paper is a new attempt to show this approach effectiveness on the basis of the modern software system GIA (geoinformational analysis), which was developed, tested and implemented under the active involvement of authors. 3 figures. 1 table. 5 sources.

Key words: GIS analysis; geological prediction; system-model approach; cartographic information.

Поиск месторождений полезных ископаемых -многоэтапный процесс, начинающийся с региональных исследований и завершающийся поисково-разведочными работами. Задача каждого из этапов поисков - выбор площадей под более детальные работы следующего этапа. Прогнозирование - особая стадия исследований, завершающая каждый из этапов. Это процесс обоснования указанного выбора на основе имеющейся информации, полученной главным образом на данном этапе. Следовательно, прогнозирование является чрезвычайно ответственной, ключевой стадией, в значительной мере определяющей эффективность всего геолого-разведочного процесса. В то же время это и весьма сложный вид исследований, причем сложность проблемы состоит в том, что районирование территории по степени перспективности обнаружения того или иного полезного ископаемого проводят по косвенным признакам, связь которых с целевым признаком должна иметь теоретическое

обоснование. Но в отличие от математики геология имеет дело не с относительно простыми моделями, сконструированными человеком, а с чрезвычайно сложными природными объектами. Вследствие этого «в геологии мало четких и надежных теорий» [1]. Поэтому в основном используются эмпирические закономерности, основанные на накопленном опыте.

В зависимости от того, какой методологический подход заложен в основу тех или иных способов прогнозирования, их можно, с некоторой долей условности, разделить на три класса:

1) распознавание образов, в основе которого лежит принцип аналогии;

2) кластер-анализ, представляющий собой безэталонную классификацию объектов;

3) прогнозирование на основе формализации знаний.

Принцип аналогии основан на том, что «геологические структуры и заключенные в них полезные иско-

1Дударева Оксана Витальевна, кандидат геолого-минералогических наук, доцент кафедры информатики, тел.: 89027673247, e-mail: odudareva@mail.ru

Dudareva Oksana, Candidate of Geological and Mineralogical sciences, Associate Professor of the Department of Information Science, tel.: 89027673247, e-mail: odudareva@mail.ru

2Королёва Анжела Владимировна, кандидат геолого-минералогических наук, доцент кафедры информатики, тел.: 89027665441, e-mail: k.a.angelik@mail.ru

Korolyova Anzhela, Candidate of Geological and Mineralogical sciences, Associate Professor of the Department of Information Science, tel.: 89027665441, e-mail: k.a.angelik@mail.ru

паемые, сформированные в близких геологических условиях, обладают более или менее ярко выраженными чертами сходства условий залегания, строения и состава, что обеспечивает подобие свойств объекта-эталона и изучаемого объекта» [3]. В настоящее время разработано множество различных автоматизированных систем для ПК, использующих принцип аналогии и направленных на решение задач классификации геологических объектов по степени их перспективности на различные полезные ископаемые.

Классификация заключается в разнесении объектов по определенным классам. Такое прогнозирование проводится по комплексу признаков, характеризующих каждый объект, а совокупность значений признаков называют его образом. Для этого набор признаков представляют как многомерное пространство, где отдельный признак соответствует координатной оси. При таком представлении каждый объект определяется как некоторая точка пространства, и понятие сходства двух точек характеризуется достаточно малым расстоянием между ними. В качестве функции расстояния используют евклидово расстояние, метрику абсолютных значений, расстояние Махаланобиса (его можно интерпретировать как евклидово расстояние между классами, взятое с весами, определяемыми дисперсиями значений признаков) и другие меры. Кроме этого вводится понятие решающего правила (процедуры), с помощью которого осуществляется разбиение всего многомерного признакового пространства на классы. Для построения решающего правила используются эталонные выборки, для которых установлена их принадлежность к определенным классам. Но здесь приходится сталкиваться с проблемой, присущей самому принципу аналогии и заключающейся в том, что степень подобия эталона и изучаемого объекта, как правило, зависит от их размеров и близости на местности. Например, «в сходной геологической обстановке смежные участки рудных залежей часто практически подобны друг другу, в то время как для смежных залежей почти всегда удается установить некоторые черты различия. Еще заметнее черты различия между соседними месторождениями и, тем более, между рудными полями» [3]. Поэтому принцип аналогии и методы, основанные на этом принципе, можно использовать только на детально изученных территориях, где уже обнаружено достаточное число месторождений определенного типа и отыскиваются их аналоги.

При использовании кластер-анализа эталоны отсутствуют, тем не менее предпринимается попытка разбить все объекты на группы (кластеры) по близости в признаковом пространстве. Основная проблема, затрудняющая применение этого подхода, заключается в определении набора признаков для проведения безэталонной классификации. Такая классификация с позиций поиска месторождений полезных ископаемых или других геологических объектов является нецелесообразной, так как отсутствует цель классификации, нет описаний объектов, которые необходимо обнаружить, и нет возможности интерпретировать полученные результаты. Поэтому очевидно, что хотя на прак-

тике эти методы и имеют широкое применение, их использование должно все же ограничиваться достаточно узкой областью приложений, например, когда набор информативных признаков хорошо известен. В противном случае кластеры могут быть выделены по случайным признакам, не имеющим отношения к цели исследования.

К методам прогнозирования на основе формализации знаний можно отнести разнообразные методы, реализованные в экспертных системах (ЭС) и при использовании так называемого системно-модельного подхода. Главной целью при реализации этих методов прогнозирования является наиболее полное и эффективное использование практически всей имеющейся информации по исследуемой территории, а также теоретических знаний и опыта геолога, накопленного им в процессе практической деятельности. Эти методы делают возможным «отчуждение» прогнозных представлений от геолога [1].

В настоящее время в публикациях по ЭС основное внимание уделяется таким проблемам, как разработка способов представления знаний и построение систем-прототипов («пустых» систем). Возникает впечатление, что средства создания ЭС превратились в настоящее время в цели: идет разработка программ ради создания более совершенных программ. В спешке возникают коммерческие экспертные системы стоимостью от нескольких сотен долларов до сотен тысяч долларов, причем в дорогостоящих используются языки высокого уровня. При этом забываются такие жизненно важные для данного направления проблемы, как выявление знаний, приспособленность ЭС к реальным задачам, определение областей их целесообразного применения, оценка качества их работы, корректное сопоставление работы экспертных систем и экспертов и т.д.

Методы, основанные на системно-модельном подходе [2], как и ЭС, ориентированы на формализацию знаний. Системно-модельный подход, в отличие от принципа аналогии, ориентированного на поиск объектов, сходных с заведомо продуктивными, заключается в поиске не копий месторождений, а их образов - моделей, основанных на теоретических или эмпирических знаниях, в том числе на интуиции и опыте специалистов. Особенно перспективным представляется применение системно-модельного подхода в сочетании с использованием картографической информации. При этом важнейшая роль отводится формализации отношений соседства и вложенности. Технология такой формализации была предложена В.В. Марченко [4]. Эта технология основывается на расчете так называемых вторичных картографических признаков. На территорию как бы «набрасывается» квадратная сеть, и для каждого узла сети рассчитывается расстояние до ближайшего картографического объекта каждого класса. Если узел сети находится внутри объекта, например, внутри антиклинальной структуры, то значение вторичного картографического признака ДБ изменит свой знак - так формализуется отношение вложенности. Если узел сети находится поблизости от объекта, например, от зоны разлома первого типа, то

значение вторичного картографического признака ZR1 будет небольшим - так формализуется отношение соседства. Точные значения расстояний от узла до картографических объектов для прогноза не требуются. Поэтому значения вторичных картографических признаков (расстояния) квантуются с учетом принятой модели объектов.

Алгоритмы и технология анализа геолого-геофизических данных и комплексного прогнозирования геологических объектов реализованы в виде программного комплекса GIA (геоинформационный анализ), который предназначен для решения широкого круга задач обработки и анализа геолого-геофизической информации [5]. GIA включает «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс пользователя. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение исходных данных в реляционной базе данных (комплекс ориентирован на применение локальной СУБД Access) позволяют оперативно конфигурировать GIA для решения конкретного круга задач. В настоящее время в GIA входят программные средства для: создания (или выбора ранее созданной) базы данных; ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади: разделения полей, их интерполяции и построения карт с нанесе-

нием на них выбранных картографических объектов; статистического анализа данных (одномерный, факторный, корреляционно-регрессионный) и прогнозирования геологических объектов и явлений (системно-модельный подход и метод аналогий) (рис. 1). Вся информация о работе функциональных модулей (протокол исполнения графов обработки данных) выводится в текстовый файл, который средствами GIA может быть преобразован в документ Word.

Ввиду эффективности применяемых методов интерполяции данных возможно включение запасов некоторых видов полезных ископаемых в комплекс технологий подсчета. После пункта меню "ПО-общее" (общее программное обеспечение) могут быть добавлены новые пункты меню.

Создание базы данных, ввод и формализация картографической информации в геионформационном комплексе GIA заключается в создании рабочего каталога, например, C:\GIA\RAZLOM. В приложении GIA в появившемся окне «Выбор параметров площади работ и базы данных» введены свои значения параметров площади работ. Можно также установить радиус обзора и осреднения, например, R=200. В результате в каталоге C:\GIA\RAZLOM будет создана база данных Razlom.mdb. Кроме того, в каталоге C:\GIA изменится файл Gia.ini, теперь он указывает путь на используемую базу данных (C:\GIA\RAZLOM\Razlom.mdb) и содержит введенные общие параметры площади работ. Затем в созданную новую базу данных вводятся картографические объекты. Перед вводом картографических данных необходимо ввести опорные точки, введенные координаты которых необходимо преобразовать из градусов в километры (рис. 2).

Рис. 1. Выбор параметров площади работ и базы данных. Состав пускового комплекса

Рис. 2. Ввод данных с отсканированных карт

Если задать 2-4 опорные точки, то для последующего пересчета координат находятся коэффициенты выражений: Хкт = ДО + Д1 * Уст; Укт = ВО + В1 * Хст.

Причем, если координаты опорных точек заданы в градусах (установлен флажок), то перед определением коэффициентов координаты все равно пересчиты-ваются в км, только в общих параметрах площади работ должен быть указан осевой меридиан и смещения СХ, CY, на величину которых уменьшаются координаты в км.

Если задать 5-9 опорных точек, то для последующего пересчета координат коэффициенты выражений находятся по формулам: Хкт = ДО + Д1 * Уст + Д2 * Хст; Укт = ВО + В1 * Хст + В2 * Уст.

При наличии искривлений (размер площади превышает по широте 6 градусов) желательно задавать 8-9 опорных точек, равномерно размещая их по площади карты. Во время ввода опорных точек и затем во время ввода данных карту можно перемещать в окне.

Картографические объекты вводятся прямо в таблицу базы данных. В одном сеансе после ввода опорных точек можно чередовать ввод данных и картографических объектов.

Для вывода введенных объектов на карту можно воспользоваться пунктом меню «ПО-общее/Интерполяция и разделение полей, построение карт». В соответствующем диалоговом окне (рис. 3) выбирается контур для построения. Если в соответ-

ствующем окне не выбирать признаки, а выбрать только контур для построения карты и картографические объекты, выносимые на нее, то будет построена карта, содержащая выбранные картографические объекты. В результате будет выполнена интерполяция и построена карта в пределах выбранного контура.

Расчет статистик в скользящем окне выполняется аналогично, только вместо выбора способа интерполяции надо выбрать «Расчет статистик». При этом выборе в диалоговом окне вместо выбора фона предлагается выбрать тот статистический параметр, по которому требуется построить карту. Этим параметром может быть среднее значение поля в окне выбранного радиуса R, стандарт поля в окне, асимметрия или эксцесс.

Следующим этапом нужно получить карту. С помощью программного комплекса GIA карты, отображающие купольные структуры и разломную тектонику, были введены в ПК. Значения картографических признаков квантовались, то есть разделялись на несколько градаций, чтобы оценить информационный вклад каждой градации в прогноз формирования месторождений. Разделение на градации основывается на модельных представлениях о роли каждого фактора прогноза. От того, как будут выбраны эти градации и как будут указаны вероятности попадания в них значений вторичных картографических признаков зависят результаты всех последующих этапов обработки и интерпретации полученных результатов.

# Ге о информационный анализ - [Интерполяция. разделение поле построение карт]

ЕЭ Файл Данные ПО-общее Окна Справка

В0И

Э X

\\i\4 |Контуры ► |Н| П~

Г

¡Признаки ►|н|

N Объект Полн назв ж

► 1 С1 Контур площади

38 СР1 Купола_1 —

39 СР1 Купола_1

40 СР1 Купола_1

41 СР1 Купола_1

42 СР1 Купола_1

43 СР1 Купола_1

44 СР1 Купола_1 w

Выполнить итерационное осреднение поля и построить карты сглаженного и остаточного полей Способ интерполяции (получения рез-тов в узлах сети) (• Точечные источники С учетом анизотропии поля Расчет статистик в скользящем окне

Таблица N Призн

► XTF 1 Z11 "

XTF 2 Z12 —

WF 3 Z13

WF 4 Z14

XTF 5 Z21

XTF 6 Z22

WF 7 Z23

WF 8 Z24

WF Э Z31 T

< I

Выбрать признак

Выбрать целевой признак

Масштаб

Г 1:10000000 Г 1:500000 Г 1:25000

Г 1:5000000 V 1:200000 Г 1:20000

С 1:2000000 С 1:100000 Г 1:10000

С 1:1000000 С 1: 50000 Г 1: 5000

17

Подписывать координаты

на карте

Нанести точки на карту

17 Создать файл PJ--СОNT.3F

Создать, но не выполнять граф обработки данных

Шаг дискретизации, см в масштабе карты 0.25 S" 0.5 1

Фон

Г" Линейный

(• Параболический

M ^ | Картографические объекты, наносимые на карты ► и

N Объект Полн назв Тип об Тип ЛИ Л.

45 СР1 Купола_1 2

46 СР1 Купола_1 2

47 СР1 Купола_1 2

48 СР1 Купола_1 2

49 СР1 Купола_1 2

50 СР1 Купола_1 2

« 1 " ►г

Значение целевого признака в точках объекта (дополн. данные)

Продолжить

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Закрьть

Нанести сетку географических координат (в общих параметрах должны бьть заданы "ключи" к координатам) Примечание: для вынесения на карту одних только картографических объектов не надо выбирать признаки

Рис. 3. Интерполяция, разделение полей, построение карт

Формализация знаний о купольных структурах и разломной тектонике

Объект Градация Значение градации Вероятность

начальное конечное для класса 1 для класса 2

CP1 1 -1000 0 0,3 0,3

CP1 2 0 60 0,5 0,4

CP1 3 60 1000 0,2 0,3

CP2 1 -1000 0 0,3 0,3

CP2 2 0 30 0,4 0,4

CP2 3 30 1000 0,3 0,3

CP3 1 -1000 20 0,7 0,4

CP3 2 20 50 0,2 0,3

CP3 3 50 1000 0,1 0,3

ZR1 1 0 20 0,4 0,5

ZR1 2 20 60 0,3 0,1

ZR1 3 60 1000 0,3 0,4

ZR4 1 0 20 0,4 0,3

ZR4 2 20 40 0,3 0,3

ZR4 3 40 1000 0,3 0,4

В таблице приведены формализованные знания о купольных структурах и разломной тектонике. Например, согласно формализованным экспертным знаниям, 40% площади месторождений должно размещаться в пределах 20-километровой зоны вблизи глубинных разломов ZR1. Еще по 30% нефтегазоносных площадей должно находиться в интервале от 20 до 60 км и на больших расстояниях от глубинных разломов.

Для формализации знаний о приуроченности месторождений углеводородов Сибирской платформы к разломным и купольным структурам задан способ квантования каждого признака и для каждой градации расстояний от узла до картографического объекта указаны вероятности попадания в данную градацию узлов сети, принадлежащих и не принадлежащих месторождениям. В результате строится прогнозная карта изолиний апостериорной вероятности, на которой исследуемая территория ранжирована по степени перспективности. На карту нанесены изолинии 0,5; 0,6 и выше. Попадание месторождений в области повышенной перспективности (вероятность существования

залежи обычно превышает 0,6) является критерием, характеризующим удовлетворительное качество формализации знаний о роли тектонических нарушений и купольных структур как факторов прогноза месторождений нефти и газа. При изменении знаний с учетом мнений геологов прогнозная карта, естественно, изменится.

Таким образом, проанализировав существующие подходы к решению задач геологического прогнозирования (распознавание образов, экспертные системы, системно-модельный подход), показано, что предложенное В.В. Марченко направление, основанное на использовании картографической информации и формализации знаний, является чрезвычайно перспективным. В данной работе рассмотрена эффективность этого подхода, но уже на основе применения современного программного комплекса GIA. Показано, что технология прогнозирования на основе картографической информации и формализации знаний логично вписывается в предложенную идеологию геоинформационного анализа.

Библиографический список

1. Воронин Ю.А. Исследование операций при поисках и разведке месторождений полезных ископаемых. Новосибирск: Наука, 1983. 174 с.

2. Еганов Э.А. Системно-модельный подход к решению поисковых задач // Методология и теория в геологии: сб. науч. тр.: Киев: Наукова думка, 1982.

3. Ларичев О.И., Мечитов А.И., Мошкович Е.М., Фуремс Е.М.

Выявление экспертных знаний (процедуры и реализации). М.: Наука, 1989. 128 с.

4. Марченко В.В. Человеко-машинные методы геологического прогнозирования. М.: Недра, 1988. 232 с.

5. Ломтадзе В.В., Дударева О.В. Геоинформационный анализ: учеб. пособие. Иркутск: Изд-во ИрГТУ. 2004. 60 с.

УДК 519.213

ПРИМЕНЕНИЕ РЯДОВ ЭДЖВОРТА В ИНФОРМАЦИОННЫХ СИСТЕМАХ АНАЛИЗА ПОГРЕШНОСТИ

1 о л

© Б.Ф. Кузнецов1, Д.К. Бородкин2, Л.В. Лебедева3

1Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83. 2,3Ангарская государственная техническая академия, 665835, Россия, г. Ангарск, ул. Чайковского, 60.

Приведен краткий обзор методов приближения вероятностных распределений. Обоснована актуальность получения вероятностных кривых в задачах анализа погрешностей кумулянтным методом. Предложена концепция информационной системы анализа погрешностей; описана модель получения приближенных кривых распределения.

Библиогр. 10 назв.

Ключевые слова: кумулянты; ряд Эджворта; анализ погрешностей; приближение вероятностных распределений; информационная система.

USING EDGEWORTH SERIES IN ERROR ANALYSIS INFORMATION SYSTEMS B.F.Kuznetsov, D.K. Borodkin, L.V. Lebedeva

Irkutsk State Technical University,

1Кузнецов Борис Федорович, доктор технических наук, профессор кафедры автоматизированных систем, e-mail: kuznetsovbf@gmail.com

Kuznetsov Boris, Doctor of technical sciences, Professor of the Department of Automated Systems, e-mail: kuznetsovbf@gmail.com

2Бородкин Дмитрий Константинович, кандидат технических наук, доцент кафедры промышленной электроники и информационно-измерительной техники, e-mail: borodkin_dk@mail.ru

Borodkin Dmitry, Candidate of technical sciences, Associate Professor of the Department of Industrial Electronics and Information

and Measuring Equipment, e-mail: borodkin_dk@mail.ru

3Лебедева Людмила Викторовна, магистрант, e-mail: lyudmila_l_@mail.ru

Lebedeva Lyudmila, Undergraduate, e-mail: lyudmila_l_@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.