Научная статья на тему 'Идеология геоинформационного анализа и программный комплекс gia'

Идеология геоинформационного анализа и программный комплекс gia Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
113
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ломтадзе Валерий Валерьевич

Идеология и методы геоинформационного анализа рассматриваются в рамках классификации геоданных по уровням обобщения информации. Выделены три уровня обобщения: первичные данные результаты измерений; поля -координатно привязанные значения геолого-геофизических признаков; картографические данные геологические объекты, выявленные при анализе полей. Методы анализа полей, а также технология прогнозирования сложных геосистем (нефтяных или рудных полей, месторождений и т.п.) на основе формализации знаний и данных третьего уровня обобщения информации реализованы в программном комплексе «Геоинформационный анализ (

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ломтадзе Валерий Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идеология геоинформационного анализа и программный комплекс gia»

В.В.Ломтадзе

Идеология геоинформационного анализа и программный комплекс Э1А

Идеология и методы геоинформационного анализа рассматриваются в рамках классификации геоданных по уровням обобщения информации. Выделены три уровня обобщения: первичные данные - результаты измерений; поля - координатно привязанные значения геолого-геофизических признаков; картографические данные - геологические объекты, выявленные при анализе полей. Методы анализа полей, а также технология прогнозирования сложных геосистем (нефтяных или рудных полей, месторождений и т.п.) на основе формализации знаний и данных третьего уровня обобщения информации реализованы в программном комплексе «Геоинформационный анализ (б/Д)»

Идеология геоинформационного анализа, Классификация геолого-геофизических данных, приведенная в таблице 1, позволяет для каждого уровня обобщения информации сформулировать цели и основные задачи, решаемые на этом уровне.

На первом уровне обобщения информации геологические задачи еще не решаются, поскольку первичные данные, т.е. результаты геолого-геофизических измерений, отягощены влиянием множества негеологических факторов. К числу таких факторов относятся рельеф местности, геометрия системы наблюдений, а в некоторых случаях (гравиметрия) даже широта местности. Для минимизации влияния этих факторов применяются специфичные для каждого геолого-геофизического метода приемы стандартной обработки первичных данных. Результатом такой обработки являются поля, т.е. координатно привязанные значения различных геологических, геофизических и геохимических признаков.

Данные второго уровня обобщения часто пытаются использовать для решения практически любых геологических задач. Так, по геофизическим полям, которые всегда отражают влияние множества геологических объектов разного масштаба и разной глубинности, пытаются даже прогнозировать месторождения и другие сложные системы геологических объектов,

В подавляющем большинстве случаев такой подход методологически неверен. Геофизическое поле определенного характера (гравиметровое, поля динамических параметров в сейсморазведке и др.) может быть вызвано многочисленными комбинациями геологических факторов, и уж, конечно, по геофизическому (или геохимическому) полю нельзя определить, является ли выявленный объект месторождением или проявлением полезного ископаемого, которое не имеет практиче-

ского значения. Это объясняется хотя бы тем, что наиболее устойчивыми признаками промышленных месторождений являются структурные, а не вещественные [2]. Поэтому в большинстве случаев данные второго уровня обобщения должны использоваться для выделения сравнительно однородных геологических объектов и для оценки их параметров. Результатом интерпретации таких данных обычно являются оконтуренные антиклинальные и синклинальные структуры, зоны выклинивания, разломы различной глубинности, интрузивные массивы, зоны проявления разнообразных вторичных геологических процессов и т.п. Данные об этих объектах в приведенной выше классификации названы данными третьего уровня обобщения информации.

Формализованно данные третьего уровня обобщения представляются в форме картографических геологических объектов, описываемых идентификатором класса (сокращенное обозначение, например, 1К1 -глубинный разлом, А5 - антиклинальная структура), типом (линейный объект, замкнутый контур и т.п.) и координатами. Именно данные этого уровня обобщения наиболее информативны для прогноза сложных систем геологических объектов (например, месторождений) и сложных явлений (например, уровня сейсмичности территорий), При этом возможны два подхода к прогнозированию: метод аналогий и системно-модельный подход.

Метод аналогий оправдан на стадиях довольно детальных поисково-разведочных работ, когда можно выделить эталонные участки, в том числе соответствующие промышленным залежам, и можно ожидать наличия объектов, "похожих" на эталоны. Сущность системно-модельного подхода заключается в поиске не копий месторождений (хотя бы приблизительных), а образов-моделей [2], причем под моделью понимается схема расположения тех факторов прогноза (условия генерации, концентрации и сохранности), которые являются индикаторами промышленных залежей полезного ископаемого,

При таком прогнозе основную роль играют отношения соседства и вложенности и знания, для формализации которых удобно использовать условные вероятности, Технология формализации отношений соседства и вложенности была предложена В.В.Марченко [4]. Эта технология основывается на расчете так называемых вторичных картографических признаков. На территорию как-бы "набрасывается" квадратная сеть, и для каждого узла сети рассчитывается расстояние до

Таблица 1

Классификация геолого-геофизических данных по уровням обобщения информации

Уровень обобщения информации Цели и основные задачи обработки и анализа данных Методы обработки и анализа данных

1. Первичные данные Минимизация влияния негеологических факторов: рельефа местности, геометрии системы наблюдений и др. Стандартная обработка данных конкретного геолого-геофизического метода

2. Поля различных геофизических, геохимических и геологических признаков 1) Формирование «признакового пространства»: интерполяция в узлы квадратной сети, расчет в скользящих окнах характеристик полей для узлов сети; построение карт, 2) Статистический анализ данных с целью выявления связей и других закономерностей. 3) Прогнозирование и выделение локальных геологических объектов (интрузий, структур, тектонических нарушений, зон улучшенных кол-лекторских свойств, проявлений вторичных геологических процессов и т.п.) и оценка их параметров, Методы интерполяции и разделения полей, расчета их статистик и других характеристик в скользящих окнах, построения карт. Одномерный, факторный, корреляционно-регрессионный анализ и пр. Распознавание образов, построение карт вероятностей обнаружения целевых объектов, решение «прямых» и «обратных» задач - переход от априорных оценок параметров объектов к апостериорным оценкам,

3. Выделенные геологические объекты, формализовано описываемые как картографические Прогнозирование геосистем: рудных полей, нефтегазовых провинций и полей, месторождений и залежей, площадей, пригодных для строительства крупных сооружений. Расчет вторичных картографических признаков для узлов квадратной сети. Формализация знаний: выбор способа квантования признаков и для каждой градации оценка вероятностей попадания объектов разных классов. Квантование признаков и расчет апостериорных вероятностей для узлов сети. Построение карт вероятностей обнаружения объектов,

ближайшего картографического объекта каждого типа, Если узел сети находится внутри объекта, например, внутри антиклинальной структуры, то значение вторичного картографического признака А5 изменит свой знак - так формализуется отношение вложенности. Если узел сети находится поблизости от объекта, например, от зоны разлома первого типа, то значение вторичного картографического признака будет небольшим - так формализуется отношение соседства, Точные значения расстояний от узла до картографических объектов для прогноза не требуются, Поэтому значения вторичных картографических признаков (расстояния) квантуются с учетом принятой модели объектов, Например, при поисках скарновых месторождений, важно знать, где находится узел сети: в центральной части интрузии, в зоне эндоконтакта, в зоне экзоконтакта или же на отдалении от интрузии, Значит, в этом примере для квантования вторичного картографического признака целесообразно использовать четыре градации возможных значений расстояния от узла до границы интрузии, Если для каждой градации указать вероятности попадания точек, принадлежащих месторождению и не принадлежащих ему, то тем самым будут формализованы знания о приуроченности

искомого скарнового месторождения к контактам интрузии, Аналогично формализуются и другие знания.

Результаты анализа данных третьего уровня обобщения обычно представляются в виде прогнозных карт, например, карт апостериорной вероятности обнаружения месторождения определенного типа [4], Изменяя набор используемых признаков, граничные значения их градаций и значения условных (интуитивных [1]) вероятностей, можно получать разные карты перспективности, моделируя тем самым разные геологические гипотезы,

Программный комплекс в1А. Общие сведения.

Комплекс предназначается для решения широкого круга задач обработки и анализа геолого-геофизической информации. б/Л включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс пользователя, Набор функциональных модулей в основном соответствует приведенному в таблице 1 пе-

речню методов обработки и анализа данных (см, также рис.1).

Функциональное наполнение GIA отображено в меню ПО-общее.

Для использования GIA необходим персональный компьютер. Карты строятся на любом струйном принтере или плоттере, если он поддерживается в ОС Windows. Программный комплекс ориентирован на применение локальной СУБД Access.

Рассмотренная идеология геоинформационного анализа оказала влияние на проектирование технологии анализа геоданных в GIA, а также на выбор состава общего программного обеспечения (см. рис. 1). В этом контексте отметим следующие особенности GIA:

1. Важная роль отводится картографической информации - ее формализации (рис, 2) и использованию для привязки геолого-геофизических карт, для указания контуров эталонных объектов или участков, а также для геологического прогнозирования (данные третьего уровня обобщения). Для ввода картографических объектов с отсканированных карт применяются алгоритмы, учитывающие кривизну Земли. В частности, опорные точки могут задаваться как в прямоугольных, так и в географических координатах, а связь между прямоугольными координатами местности и координа-

тами курсора мыши на исходной карте в общем случае считается нелинейной.

2. Хранение картографических и массовых геоданных в реляционной базе данных облегчает реализацию импорта-экспорта информации и, следовательно, взаимодействие с другими программными средствами.

3. Чрезвычайно важным в технологии является динамическое создание таблиц массовых геоданных, поскольку заранее (при конструировании модели данных) невозможно предвидеть, каким количеством признаков будет описываться точка, узел сети или геохимическая проба. Для работы с данными предназначено меню Данные. Оно включает пункты Признаки, Карт, объекты, Состав таблиц массовых данных, Массовые данные, Вспомогат.таблицы.

4. Пользователю предоставляется возможность выполнения не отдельных программ (процедур), а автоматически формируемых графов обработки данных.

Программное обеспечение анализа полей. Для анализа данных второго уровня обобщения в программный комплекс Э1А включены некоторые эффективные методы интерполяции и разделения полей, формирования признакового пространства путем расчета статистик в скользящих окнах для узлов сети, а также программные средства статистического анализа данных. Большая часть этих методов основывается на

Файл Данные

Окна

Интерполяция и разделение полей, построение карт Статистич. анализ и прогноз с использованием эталоное Прогнозирование на основе формализации знаний

Выберите рабочий каталог • папку с Вашими базами данных

ЩС:'

ЩЬ 'А

^ыкчзриА базу данных, если она уже существует, или задайте имя новой БД, например, КУК.2001

1С: ЧС1АЧТЕ ЗтСк?ЖлгёЙГ

dbl.mdb KVK.MDB

ХМ IN Рп"

Границы для построения карт ХМАХ Г£о YMIN Гзёо'^'

YMAX pgf

Радиус (В) осреднения (обзора) • обычно в 3-5 раз превышает радиус целевых аномалий |"т5 ■

Ключи к координатам - задаются, когда требуется пересчет прямоугольных координат в географич. и обратно г Центральный меридиан зоны - СМ |*Цд|"..........* Смещение СХ р§щ............Смещение СУ 1.120."

к .......___ __ШШ."12" __ ...__£ _

Запомнить новые параметры

Оставить без изменений j

Создать новую БД

Рис. 1. Выбор базы данных и параметров площади работ.

ф» Геоинформацирнадш анализ - [Картографические объекты

И.-. Файл Данные ПО-о&цее Окна Справка

1Н| •< I Таблица "Картографические объекты'' ► > М

Создание картограф, объектов поданным Р1Т-Файла...... г Удаление картограф, объектов

1.PLT MAPC.PLT МАРК. PL Т MAPP.PLT

MARR.PLT

[j®S По номеру

т

Создать j Удалить PLT-Файл

По идентификатору щ Удалить

Закрыть

- Переименование картографических оС Идентификатор объекта (объектов) Новый идентификатор Новые атрибуты - изменяются, есл! Тип линии f Толщина? lie

Переименовать j

Рис. 2, Формализация картографической информации

интеллектуальных алгоритмах, в которых предусматривается автоматический учет неравномерности сети наблюдений, анизотропии поля и т.п. Так, в одном из алгоритмов интерполяции анизотропия поля и неравномерность размещения исходных точек исследуются в окрестности каждого узла интерполяции. Кроме того, для каждого узла оценивается стандарт интерполированного значения. Для разделения полей применяется другой интеллектуальный алгоритм - итерационное осреднение.

Итерационное весовое сглаживание [4], по-видимому, один из наиболее эффективных способов подавления локальных аномалий, препятствующий их "размазыванию" в региональном поле, Алгоритм заключается в том, что перед первой итерацией весовые коэффициенты всех точек площади принимаются равными 1, т.е. первая итерация - это обычное осреднение поля в скользящем окне. Перед каждой следующей итерацией весовые коэффициенты корректируются, а именно уменьшаются в аномальных точках. Мерой аномальности является величина модуля отклонения исходного поля от осредненного. Максимальное число итераций в программе ограничено.

Описанный алгоритм позволяет уменьшить искажающее влияние, которое оказывают локальные аномалии на результаты вычисления региональной составляющей. Если радиус I? хотя бы в 3 раза превышает

радиус локальной аномалии, то "затягивание" регионального поля в сторону локального пика, даже очень интенсивного, резко уменьшается. Соответственно повышается контрастность локальных аномалий в остаточном поле.

В качестве альтернативного способа формирования набора признаков (признакового пространства) для узлов сети в Э1А предусмотрена возможность расчета статистик поля в скользящем окне. Для каждого узла сети в скользящем окне радиуса I? для выбранного целевого признака PJ могут быть рассчитаны статистики: MPJ (среднее), SPJ (стандарт), АРи (асимметрия), EPJ (эксцесс). Такой подход может быть полезен и при работе с аэроданными. Их специфика в том, что расстояния между профилями могут в десятки раз превышать расстояния между точками. Следовательно, рассчитывая статистики для узлов сети с шагом, равным примерно половине среднего расстояния между профилями, и с радиусом, примерно равным полутора-трем расстояниям между профилями, можно перейти к квадратной сети, резко уменьшив число точек, но увеличив количество признаков, И именно этот подход может дать эффект в тех случаях, когда искомые объекты (например, "окантовка" залежей углеводородов) проявляются не в амплитудных аномалиях, а в тонких изменениях структуры поля. Это явление, вероятно, связано с тем, что за геологическое время существо-

вания залежи полезного ископаемого или другого геологического объекта, отличающегося от вмещающих горных пород по физическим и химическим свойствам, этот объект так или иначе взаимодействует с вмещающими породами. Взаимодействие может выражаться в виде гравитационного или гидропереноса вещества, а также в виде химических превращений благодаря градиентам РН. Обоснованию рассматриваемого подхода к разделению слабоконтрастных сред посвящена докторская диссертация и одноименная книга А.Б.Домакина [3].

В результате применения алгоритмов интерполяции и разделения полей каждый узел сети становится охарактеризованным значениями геолого-геофизических полей или значениями их региональных и локальных составляющих, Тем самым формируется признаковое пространство - каждый объект (например, узел сети) в этом пространстве представляет собой точку, координатами которой являются значения изучаемых признаков, Образное мысленное представление признакового пространства позволяет лучше понять смысл статистического анализа данных, В 61А имеется возможность применения одномерного, факторного, корреляционно-регрессионного анализа и распознавания образов,

В случае одномерного анализа для каждого признака вычисляются основные статистики: минимальное и максимальное значения, среднее, медиана, асимметрия, эксцесс, Для большинства из этих статистик указываются их стандарты, для некоторых - доверительные интервалы. Также даются оценки близости распределения к нормальному.

При выполнении факторного анализа матрица факторных нагрузок позволяет дать геологическое толкование большинству факторов, которые, вообще говоря, являются абстрактными математическими переменными, через значения которых линейно (а значит грубо) могут быть выражены значения исходных признаков. Предположим, например, что в матрице факторных нагрузок фактор Р1 имеет большие по величине (скажем, 0.7-0.9) нагрузки (коэффициенты корреляции) для признаков Б (содержание серы), РВ (свинца), Си (меди), В этом случае фактор Р1 логично назвать фактором сульфидной минерализации, Его карта может оказаться информативнее моноэлементных карт.

При использовании корреляционно-

регрессионного анализа в результатах отображаются основные характеристики признаков, коэффициенты корреляции и их стандарты. Кроме того, указываются коэффициенты уравнения регрессии и коэффициент множественной корреляции (коэффициент детерминации) $2. Этот коэффициент показывает, какая доля общей дисперсии признака описывается уравнением регрессии, Если этот коэффициент невелик, например, меньше 0.7, то от прогнозирования "с точностью до числа" надо отказаться и переходить к прогнозирова-

нию "с точностью до класса", т.е. к использованию распознавания объектов.

Прогнозирование "с точностью до класса" технологически реализуется с помощью алгоритмов распознавания образов. В в!А применяется алгоритм, заключающийся в том, что по эталонной выборке каждого класса, находятся параметры многомерного нормального распределения: вектор средних значений и ковариационная матрица. Затем с использованием этих параметров для каждого распознаваемого объекта по формуле Байеса оценивается апостериорная вероятность принадлежности этого объекта к каждому классу [4].

Методы многомерного статистического анализа применяются для выделения геологических объектов (зоны разлома, антиклинальные структуры, зоны улучшенных коллекторских свойств и т.п.), которые далее, на третьем уровне обобщения геолого-геофизической информации, используются в качестве факторов прогноза месторождений и других сложных геосистем.

Технология прогнозирования на основе формализации знаний и картографической информации. Э.А.Еганов образно сравнил месторождение с яркой звездой в созвездии [2]. Знания о возможной геометрии такого созвездия, т.е. об отношениях соседства-вложенности, которые характеризуют соседство месторождения с глубинными разломами, его вложенность в антиклинальные структуры и т.п., формализуются при организации прогнозирования на третьем уровне обобщения информации.

Эффективным способом формализации знаний об отношениях соседства-вложенности является представление таких знаний в таблице Градации, содержащей способ квантования каждого признака (разбивку на градации расстояния от узла сети до ближайшего картографического объекта рассматриваемого класса), а также вероятности попадания узлов сети, принадлежащих месторождению, в каждую градацию.

Среди используемых признаков могут быть вторичные картографические признаки [5], рассчитываемые для каждого узла сети в формируемом графе обработки, или значения других признаков, заранее полученные (интерполяцией или иначе) для тех же узлов сети, т.е. с одним и тем же шагом дискретизации в пределах одного и того же контура.

После расчета вторичных картографических признаков в графе обработки выполняется квантование значений всех признаков, т.е. их замена номерами градаций в соответствии с таблицей Градации. Последними шагами в автоматически формируемом графе обработки данных являются расчет апостериорных вероятностей отнесения узлов сети к классам 1 и 2 [4] и, наконец, построение карты апостериорных вероятностей для класса 1 с нанесением на нее выбранных картографических объектов, с оцифровкой осей координат, а в случае задания "ключей" к коор-

динатам - с вычерчиванием сетки географических координат.

Разработанная технология позволяет по мере появления новых данных или знаний оперативно изменять их формализацию и немедленно получать новые прогнозные карты. Таким образом, системно-модельный подход направлен на то, чтобы понять явление в принципе, раскрыть закономерности. Этот подход в совокупности с использованием картографической информации должен играть важную роль в следующих аспектах: организационном - возможность объединить усилия исследователей разных специальностей, технологическом -возможность комплексного использования для прогнозирования разнотипной информации, в том числе хранимой только в виде карт, геологическом -возможность имитационного моделирования различных гипотез.

Рассмотренный подход, основывающийся на формализации знаний, до сих пор применялся крайне редко, хотя идеи В.В.Марченко [5] расчета вторичных картографических признаков и созданная под его руководством система "Регион" были предложены уже сравнительно давно. Объясняется этот факт, вероятно,

двумя обстоятельствами. Во-первых, узкой специализацией геолого-геофизических исследований, а во-вторых, тем, что реализация системно-модельного подхода требует высокой геологической квалификации и сопряжена с большими технологическими трудностями - их мы и попытались преодолеть в в!А, автоматизировав построение сложнейших графов обработки данных.

Библиографический список

1, Гольцман Ф.М, Физический эксперимент и статистические выводы: учеб. пособие. -А: Изд-во /УУ, 1982. - 192 с.

2, Еганов Э.А, Системно-модельный подход к решению поисковых задач//Методология и теория в геологии. - Киев: Наукова думка. -1982. - С, 33-40.

3, Лэмакин А.Б, Петрофизическое картирование сла-боконтрастных сред и прогноз месторождений полезных ископаемых. - СПб: Изд-во С,-Петер, ун-та, 1998, -144 с.

4, Лэмтадзе В.В. Программное и информационное обеспечение геофизических исследований, - М,: Недра, -1993,- 268 с,

5, Марченко В,В, Человеко-машинные методы геологического прогнозирования. - М,: Недра. -1988,- 232 с.

В.В.Трипутина, Л.В.Массель, В.И.Щепин

Информационное моделирование производственного предприятия (на примере ИркАЗ СУАЛ)

Введение. Для эффективного управления предприятием необходимо хорошо представлять, как предприятие функционирует, как оно взаимодействует со сторонними организациями, насколько эффективно функционируют его подразделения. Иначе говоря, вести мониторинг выполнения основных бизнес-функций объекта. Этот процесс сам по себе сложен и для небольших организаций, но когда речь идет о таких крупных производственных предприятиях, как Иркутский алюминиевый завод (ИркАЗ СУАЛ), умозрительные методы здесь помочь не могут, Необходимо грамотное применение информационного моделирования жизненно важных бизнес-процессов предприятия.

Кроме того, многие производственные предприятия, в том числе и ИркАЗ, проходят различные виды сертификации на соответствие стандартам ИСО [1]. Сертификация «ИркАЗ СУАЛ» по международному стандарту ИСО 9001:2000 является необходимым условием сотрудничества с крупнейшими производителями и потребителями на мировом рынке алюминия. В 2002 г. Британская сертификационная организация ИОА аккредитовала Систему менеджмента качества отдела технического контроля и центральную заводскую лабо-

раторию ИркАЗ СУМ на соответствие положениям МС ИСО 9001:2000, В 2003 г. ИркАЗ приступил к разработке, внедрению и сертификации Системы менеджмента качества в электролизном и литейном производствах по международному стандарту ИСО 9001:2000. Далее завод готовится к сертификации ИСО 14 000 -системы экологического менеджмента. Все это требует четкого представления перед руководством предприятия структуры производственных и вспомогательных бизнес-процессов, взаимодействия цехов и подразделений, состав и регламентация документированных процедур.

С другой стороны, внедрение современных информационных технологий в деятельность предприятия требует создания информационного пространства, что в свою очередь влечет организацию управляющей и оперативной информации, четкое структурирование форм документов, учет и регламентацию информационных потоков, иначе говоря, применения информационного моделирования.

Информационное моделирование. Термин «информационное моделирование» впервые был введен В.М. Глушковым в 1963 г. [2], где он определял его

i Надоели баннеры? Вы всегда можете отключить рекламу.