Научная статья на тему 'Программные средства формирования региональных и целевых баз данных как составная часть общего программного обеспечения'

Программные средства формирования региональных и целевых баз данных как составная часть общего программного обеспечения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
149
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГИОНАЛЬНЫЕ (АРХИВНЫЕ) БАЗЫ ГЕОФИЗИЧЕСКИХ ДАННЫХ / ЦЕЛЕВЫЕ БАЗЫ ДАННЫХ / ПОИСКОВЫЙ ОБРАЗ ФАЙЛА / ГЕОИНФОРМАЦИОННЫЙ КОМПЛЕКС GIA / REGIONAL (ARCHIVE) BASES OF GEOPHYSICAL DATA / TARGET DATABASE / SEARCH FILE IMAGE / GEOINFORMATIONAL COMPLEX GIA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Королёва Анжела Владимировна, Дударева Оксана Витальевна

Рассмотрен способ организации хранения геофизических данных, реализованный в виде технологии создания региональных (архивных) баз данных. Разработанное программное обеспечение формирования и использования региональных (архивных) баз данных было включено в программный комплекс GIA (Геоинформационный анализ ) и рассматривается как составная часть общего программного обеспечения, которое способствует интеграции данных различных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOFTWARE FOR THE FORMATION OF REGIONAL AND TARGET DATABASES AS A PART OF GENERAL SOFTWARE

The authors consider a method for the storage organization of geophysical data, implemented as a technology for the creation of regional (archive) databases. The developed software for the formation and use of regional (archive) databases were included in the software package GIA (GIS analysis) and is considered as a part of the general software that facilitates the integration of these different methods.

Текст научной работы на тему «Программные средства формирования региональных и целевых баз данных как составная часть общего программного обеспечения»

УДК 550.8:519:681.3

ПРОГРАММНЫЕ СРЕДСТВА ФОРМИРОВАНИЯ РЕГИОНАЛЬНЫХ И ЦЕЛЕВЫХ БАЗ ДАННЫХ КАК СОСТАВНАЯ ЧАСТЬ ОБЩЕГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

А.В.Королёва1, О.В.Дударева2

Национальный исследовательский Иркутский государственный технический университет, 664074, г. Иркутск, ул. Лермонтова, 83.

Рассмотрен способ организации хранения геофизических данных, реализованный в виде технологии создания региональных (архивных) баз данных. Разработанное программное обеспечение формирования и использования региональных (архивных) баз данных было включено в программный комплекс GIA (Геоинформационный анализ ) и рассматривается как составная часть общего программного обеспечения, которое способствует интеграции данных различных методов. Ил. 4. Табл.1. Библиогр. 7 назв.

Ключевые слова: региональные (архивные) базы геофизических данных; целевые базы данных; поисковый образ файла; геоинформационный комплекс GIA.

SOFTWARE FOR THE FORMATION OF REGIONAL AND TARGET DATABASES AS A PART OF GENERAL SOFTWARE

A.V. Koroleva, O.V. Dudareva

National Research Irkutsk State Technical University, 83, Lermontov St., Irkutsk, 664074.

The authors consider a method for the storage organization of geophysical data, implemented as a technology for the creation of regional (archive) databases. The developed software for the formation and use of regional (archive) databases were included in the software package GIA (GIS analysis) and is considered as a part of the general software that facilitates the integration of these different methods. 4 figures. 1 table. 7 sources.

Key words: regional (archive) bases of geophysical data; target database; search file image; geoinformational complex GIA.

Геология оперирует огромными объемами информации, причём ведется регистрация всех известных видов геологических, геофизических и геохимических полей с четырех уровней зондирования земной коры: космического, воздушного, наземного и сква-жинного.

В то же время в связи с естественным сокращением фонда легкооткрываемых месторождений полезных ископаемых эффективность геологических, геофизических и геохимических методов при прогнозно-поисковых исследованиях в значительной мере определяется полнотой извлечения информации. Поэтому одной из актуальных проблем компьютеризации геологоразведочного процесса является хранение больших объемов данных с возможностью многократного обращения к хранимой информации в связи с решением различных геологических задач и с появлением новых математических методов обработки, интерпретации и комплексного анализа геоданных [1].

Для прояснения проблемы хранения геолого-геофизических данных можно использовать классификацию данных по уровням обобщения информации (таблица), ранее данная классификация применялась для обоснования технологии геоинформационного анализа [2]. В ней для каждого уровня информации

определены основные задачи и методы анализа данных, т.е. фактически сформулированы основные аспекты идеологии и технологии обработки и анализа данных при геолого-геофизических исследованиях.

Данные первого уровня обобщения не представляют интереса с точки зрения организации хранения: эти данные еще не пригодны для решения геологических задач и в рамках каждого геолого-геофизического метода обрабатываются стандартно.

Хранение картографической информации (т.е. данных третьего уровня обобщения) успешно осуществляется с помощью геоинформационных систем (ГИС). Применяющиеся на практике ГИС позволяют:

- хранить картографическую информацию;

- использовать ее для построения карт и выявления сравнительно простых пространственных закономерностей;

- хранить семантическую информацию, привязанную к картографическим объектам (их основные характеристики в табличной форме).

Что касается организации хранения наиболее дорогостоящих массовых геолого-геофизических данных, т.е. информации второго уровня обобщения, то приходится признать, что в большинстве случаев эта проблема практически не решается. Соответственно

1Королёва Анжела Владимировна, аспирант, старший преподаватель кафедры информатики, тел.: (3952) 405183, e-mail: k.a.angelik@mail.ru.

Koroleva Angela, Postgraduate student, Senior lecturer of the chair of Information Science, tel.: (3952) 405183, e-mail: k.a.angelik@mail.ru.

2Дударева Оксана Витальевна, кандидат геолого-минералогических наук, доцент кафедры информатики, тел.: (3952) 405183. Dudareva Oksana, Candidate of Geological and Mineralogical sciences, Associate Professor of the chair of Information Science, tel.: (3952) 405183.

Классификация геолого-геофизических данных по уровням обобщения информации

Исходные данные (классификация по уровням обобщения)

Цели и основные задачи обработки и анализа данных

Методы обработки и анализа данных

1. Первичные данные - результаты геолого-геофизических измерений

Минимизация влияния негеологических факторов: рельефа местности, геометрии системы наблюдений и т.д._

Стандартная обработка данных конкретного геолого-геофизического метода

2. Поля различных геохимических, геологических, геофизических признаков, полученные в результате стандартной обработки первичных данных, приводящей к минимизации влияния негеологических факторов

2.1. Формирование «признакового пространства»: интерполяция в узлы квадратной сети, расчет в скользящих окнах характеристик полей для узлов сети; построение карт_

Методы интерполяции и разделения полей, расчета их статистик и других характеристик в скользящих окнах, построение карт

2.2. Статистический анализ данных с целью выявления связей и других закономерностей_

Одномерный, факторный, корреляционно-регрессионный анализ и пр.

2.3. Прогнозирование и выделение локальных геологических объектов (интрузий, структур, тектонических нарушений, зон улучшенных коллекторских свойств, проявлений вторичных геологических процессов и т.п.) и оценка их параметров_

Распознавание образов, построение карт вероятностей обнаружения целевых объектов, решение «прямых» и «обратных» задач - переход от априорных оценок параметров объектов к апостериорным оценкам

3. Выделенные геологические объекты, формализованно описываемые как картографические - картографические и параметрические данные, полученные в результате интерпретации информации предыдущего уровня обобщения

Прогнозирование геосистем: рудных полей, нефтегазовых провинций и полей, месторождений и залежей, площадей, пригодных для строительства крупных сооружений

- Расчет вторичных картографических признаков для узлов квадратной сети

- Формализация знаний: выбор способа квантования признаков и для каждой градации оценка вероятностей попадания объектов разных классов

- Квантование признаков и расчет апостериорных вероятностей для узлов сети; построение карт вероятностей обнаружения целевых объектов_

возникают трудности, подчас непреодолимые, при организации тематических работ с целью обобщения и комплексного анализа данных, накопленных по поисково-разведочным площадям.

Анализируя геоинформационные системы, нужно отметить, что основной их недостаток - отсутствие функционального наполнения для решения даже многих типовых задач обработки и анализа геолого-геофизических данных. Поэтому необходимо либо существенно расширять возможности ГИС, либо ком-плексировать их с другими интерпретационно-обрабатывающими системами. Возможны и решения, основывающиеся на большей автономности (по отношению к ГИС) программных комплексов обработки и анализа геоданных. Например, массовые геоданные (первичные и поля) могут быть привязаны к реляционной СУБД, а данные более высоких уровней обобщения - к ГИС. Тогда платформой для развития программного обеспечения обработки массовых геоданных может быть реляционная СУБД, а платформой для анализа данных более высоких уровней обобщения - ГИС [1].

Разработанное программное обеспечение формирования и использования региональных (архивных) баз данных можно рассматривать как составную часть

общего программного обеспечения геофизических исследований (рис. 1). Общее программное обеспечение способствует интеграции данных различных геофизических методов и содержит программы:

- оперирования данными;

- создания региональных и целевых баз данных;

- анализа полей, их интерполяции;

- построения карт с нанесением на них картографических объектов;

- многомерного (и одномерного) статистического анализа данных и прогнозирования целевых геологических объектов.

Таким образом, общее программное обеспечение включает те комплексы программ, которые используются при обработке и анализе материалов разных геолого-геофизических методов. Следовательно, программное обеспечение конкретного геолого-геофизического метода можно рассматривать как сумму специального программного аппарата этого метода и общего программного обеспечения геолого-геофизических исследований. При этом в конкретный граф обработки данных могут включаться в любой логически оправданной последовательности как про-

граммы из методо-ориентированных систем программ, так и программы общего программного обеспечения.

чения геолого-геофизических исследований (1) и ме-тодо-ориентированных программ (2, 3, 4,...)

Программные модули создания региональных баз данных были включены в программный комплекс GIA («Геоинформационный анализ»). GIA предназначен для решения широкого круга задач обработки и анализа геолого-геофизической информации. Он включает в себя «оболочку» и функциональные программные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных [2]. Оболочка построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс пользователя. Набор функциональных модулей может постоянно расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение исходной информации в реляционной базе данных позволяют оперативно конфигурировать GIA для решения конкретного круга задач.

GIA включает в себя программные средства для создания (или выбора ранее созданной) локальной базы данных, для ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади, для разделения полей, их интерполяции и построения карт с нанесением на них выбранных картографических объектов, для статистического анализа данных (одномерный, факторный, корреляционно-регрессионный) и прогнозирования геологических объектов и явлений (метод аналогий и системно-модельный подход, основывающийся на формализации знаний). Работа с локальной базой данных в программном комплексе GIA основывается на хранении данных в реляционной БД Access. В то же время поддерживаются форматы файловых баз данных, а также импорт (и экспорт) данных из текстовых файлов, в записях которых поля разделены пробелами, и из электронных таблиц MS Excel. Включение в GIA программных модулей для создания и использования региональных баз данных позволило объединить в одном программном комплексе техноло-

гии создания региональных баз и их последующего использования для решения прогнозных задач.

В рамках программного комплекса С!Л реализованы методы анализа информации второго и третьего уровней обобщения, перечисленные в таблице.

Таким образом, единство среды и разветвленное общее программное обеспечение геолого-геофизических исследований позволяет создавать интегрированное программное обеспечение хранения, поиска, обработки и анализа массовых геоданных -информации второго уровня обобщения. В данной работе рассмотрим только программные средства, разработанные для автоматизации создания региональных и целевых баз данных.

Геолого-геофизические данные характеризуются следующими особенностями [3,4,5]:

- это координатно-локализованная информация по определенному геофизическому методу, характеризующаяся определенной детальностью - масштабом работ;

- геоданные характеризуются огромными объемами, которые требуют компактного хранения, т.е. упаковки данных при их записи во внешнюю память, иначе ведение баз данных при их реальных огромных объемах станет непосильно трудоемким;

- при долговременном хранении геолого-геофизические данные не модифицируются, так как они прошли перед включением в базу данных стандартную первичную обработку;

- каждый новый фрагмент данных должен рассматриваться как автономный, и, следовательно, система поиска должна обеспечивать оперативный выбор необходимых фрагментов (по поисковому образу), а также конкретных данных из отбираемых фрагментов;

- технология обработки диктует необходимость доставки геолого-геофизических данных во внутреннем механизме программ не по отдельным записям, а сравнительно большими порциями (сейсмическая трасса, профиль или его часть);

- при многоэтапной и многоцелевой обработке геофизических данных в большинстве случаев также невозможно заранее определить связи между типами геобъектов и соответствующими им типами записей. Даже невозможно заранее указать состав записей, поскольку во время проектирования информационного и программного обеспечения неизвестно, какие отражающие границы будут рассматриваться при сейсмических исследованиях, содержание каких элементов будет измеряться в геохимических пробах и т.п.;

- они подготавливаются разными людьми, поэтому при организации их хранения встает проблема стандартизации данных, совмещения фрагментов карт, приведения координат к единой системе координат.

Исходя из особенностей геофизических данных, для хранения данных в РБД была использована концепция файловых баз данных - ФБД [4]. Приближаясь по организации данных и функциям к реляционной базе данных, ФБД наилучшим образом подходит для хранения геоданных. Файловая база также обладает и некоторыми чертами иерархической организации данных, хотя число иерархических уровней зафикси-

ровано в ней с учетом специфики массовых геофизических данных.

В ФБД используются три структуры данных: файл, массив, запись. Файл обычно соответствует площади работ, т.е. содержит конкретные данные по этой площади. Массив файла представляет собой таблицу с заглавием. Он содержит данные по профилю, маршруту, скважине и т.п. Заглавие содержит общие характеристики профиля, маршрута, скважины..., а запись - данные, относящиеся к одной точке наблюдения. В паспорте файла хранятся метаданные - описание полей заглавий и записей массивов (как в реляционной базе данных).

Файловую базу можно конвертировать в реляционную, создав из каждого набора таблиц одну или две таблицы реляционной базы данных, например, таблицу Профили с общими характеристиками каждого профиля и таблицу Точки с данными для каждой точки профиля. В этом случае каждая запись таблицы Точки должна ссылаться на ключевое поле таблицы Профили. Реляционная СУБД применяется в программном комплексе GIA для хранения данных локальной базы, в том числе для хранения картографической информации. Реляционная модель облегчает обмен данными между ФБД и другими распространёнными системами организации данных.

Включение файлов локальной методной базы данных в РБД (рис. 2) выполняется в следующей последовательности:

1) Импорт файла из форматов локальной базы и его запись на один из томов соответствующей РБД, например, на том P4801, P4802 и т.п. Технически том может быть представлен диском DVD. При включении файла в региональную базу данных ему дается новое имя, например, P4805003 - данные, относящиеся к листу P48, полученные в 2005 году и помеченные номером 003. Назначение такого подхода - сохранить информацию, полученную в течение года в пределах листа масштаба 1:1000000 (или по другой обширной территории). Каждая база данных при таком подходе имеет имя, состоящее из трех символов: P48, BRZ и т.п.

2) Создание поискового образа файла, добавленного в РБД. Поисковый образ файла содержит:

- Имя файла в РБД - NOF;

- Серийный номер тома - VSN;

- Номер редакции файла - NF (зарезервированное поле);

- Обозначение вида сети - GRID (1 - произвольная неупорядоченная, 3 - прямоугольная и т.п.);

- «Ключи» к координатам в записях файла: M, CX,

CY;

- Граничные координаты площади, к которой относятся данные файла: X1, X2, Y1, Y2;

- Признак актуальности данных: А>0, если файл не устарел (если база данных не по миллионному листу, то A = CM, где CM - центральный меридиан зоны);

- Дескрипторы, например, D=200,11100 - данные структурной электроразведки (11100) масштаба 1:200000 (200).

Эти параметры моментально вводятся в соответствующем диалоговом окне.

Быстрота поиска осуществляется не за счет многочисленных индексов и указателей, связывающих записи в базах данных, а за счет резкого уменьшения числа просматриваемых файлов при сопоставлении запроса с поисковыми образами хранимых файлов. Файл поисковых образов в дальнейшем позволяет отобрать из РБД все файлы определенного содержания, имеющие определенную привязку по месту и времени. При создании целевой базы данных в диалоговом окне (рис. 3) выбираются или задаются:

- контур целевой площади;

- ограничения на виды сетей (GRID);

- дескрипторы D, определяющие в основном геолого-геофизические методы и масштабы исследований;

- идентификаторы отбираемых признаков (P);

- новые «ключи» к координатам (CX, CY).

При создании целевой базы данных:

1) «Просматриваются» поисковые образы файлов, относящихся к данной РБД. Отбираются поисковые образы, соответствующие запросу.

2) Выполняется «просмотр» самих файлов региональной базы и каждой записи файла. Координаты в каждой записи файла РБД пересчитываются к единой системе координат с учетом новых «ключей» CX, CY. Затем точка, соответствующая записи, проверяется на попадание в пределы целевой площади. Из отобранных записей берутся координаты и только указанные в запросе элементы данных (признаки-поля).

Так формируется файл целевой базы данных по одному геолого-геофизическому методу. Для формирования файлов целевой базы данных по нескольким геолого-геофизическим методам необходимо несколько раз воспользоваться соответствующим диалоговым окном. При этом координаты в записях, извлеченных из разных файлов РБД, будут приведены к единой системе координат.

Созданная целевая база данных используется для анализа полей (данные второго уровня обобщения в таблице), а затем, после выделения картографических объектов, являющихся факторами прогноза (данные третьего уровня обобщения), для прогнозирования целевых геологических объектов на основе формализации знаний.

Под комплексным анализом геолого-геофизических данных понимается решение комплекса задач по совместной обработке данных различных геолого-геофизических методов с целью выявления основных закономерностей и особенностей, присущих объектам исследования. Конечной целью комплексного анализа геолого-геофизических данных обычно является прогнозирование геологических процессов, объектов или их свойств.

В рамках представленной технологии возможны следующие этапы комплексного анализа геолого-геофизических данных:

1. Извлечение информации из методных файлов и получение файла, который описывает изучаемые объекты информативным набором признаков. Добиться этого нелегко, так как различные геолого-

О.* Файл Даннье ПОюбщее Окна Ставка

Я СоЗЛаннеПОИКОМГООбраЗа Файла

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14 4 Региональные базыданны» ►и

Выбрана база данные

Р48

Г Формирование ЛШЛЬНОЙ Й43Ы ПаНньК

Дискована ля тома

Список региональ^ык_б_а_з_даннь1к [Пояиое_на»ание

РВДли Заярской линяй

ПРЕД по -листуР-1Й

ш

Создать, но не выполнять граф обработки аом! <ыи

Продолжить

Отменить

Закрыть

Поисковый образ Файла МОР

Р4805003

аню|

н

к

СУ

Р4Ш

Е

6100

120

Имя Файла. Пример: РШ3002 ■ база данный, год. номер файла

Серийный помер носителя ■ №0, СО и т.п., например, Р4В01

Номер редакции Файла

У НЦ с ети 0 ■ нет коорд., 1 ■ произв., 2 ■ полосы ОХ, 3' прямоуг.

Мвсщт. иоф для переждан ем; к■!, У :я ' У/'' е «м

"Ключи" к координатам

XI 1[

У2 | А [Л

380

483

11100,200

Граничные координаты площади, данные по кеперой содержатся с Файле ШЁ

Признак активности Файла, устарел, если А-1

Дескригторвк ЩримШ 3100,1001200

Рис. 2. Диалоговое окно для формирования поискового образа файла, включаемого в РБД

• I (^информационный анализ - [Региональны!? базы данных]

Файл Данные ПО общее Окна Справка

& X

с Создате поискового образа Файла

1 4 Региональные базы данных м

Список региональным Йаэданныи

|Полнсе_название

РБД го Эвдрской плошали

| Р6Д го листа Р46

Е

Сомагь, но не выполнять граф обработки данных

Продолжить

Отменить

•Закрыть

Е ы^рана ваиданнын

Создание целевой базы данных

№ Формирование локальной базы данных

Дисковод для тома У5Н

|М| [Контуры ~ УТЙ1

И|Рбьект |Поли_иазё~

1 К1

Кипе иелееой БД1

2 К2 Контур целевой БД 2

16000

ШАТ1

а

Д1 щ мо щ

1921

ВАТ 2

2020

Я [500

А2 | МОИМ

1МЖ111М

Р Е5П,ЕМН,ЕМХ Ш

Иглвмйла р(}-тое [без расширения!

Пояснения. DAT1.DAT2 'ограничения для отбора данных по годам.

СХ СУ ■ новые "кто*! к координатам" (го умолчанию ■ ю поискового образа первого <мйла| Целевая площадь ограничивается ксодоинатами вершин еыгук лого многоугольника (выбранного лонгура). С Я] I? ■ перечисление ¿егдетнмьк вшое сетей |П римев: 1,2). О ■ перечисление дескригггов (Пример: 12000,100,2001). А1, А2 ■ граничные значения признака активности. Р- опираемые признаки (Пример: Р-ЕММ.ЕМЯ.ЕЗИ)

Рис. 3. Диалоговое окно для создания целевой базы данных

геофизические съемки проводят по разным сетям с различной детальностью. Только на некоторых детально изученных участках все данные привязаны к одним и тем же точкам наблюдения, обычно пикетам профилей. В остальных случаях данные приходится сначала интерполировать в узлы некоторой прямоугольной сети, одной и той же для всех признаков. Кроме интерполированных значений, для каждого узла сети могут быть рассчитаны характеристики поля в скользящем окне.

2. Статистический анализ данных подразделяют на одномерный и многомерный. Задача одномерного статистического анализа заключается в получении статистик, характеризующих распределение каждого признака. Просмотр распечаток, полученных на этом этапе, позволяет правильно выбрать направление последующей обработки материалов, в частности, решить, нужна ли нормализация значений каждого признака. Нормализация распределений признаков основывается на гипотезе о нормальности распределений. Например, коэффициент парной корреляции

только тогда характеризует близость корреляционной связи между признаками к линейной, когда статистические распределения обоих признаков близки к нормальному. После одномерного статистического анализа обычно выполняется многомерный. Его целью является исследование закономерностей размещения объектов в многомерном признаковом пространстве. Чаще всего применяются такие методы многомерного анализа, как факторный, корреляционно-регрессионный анализ и распознавание образов (объектов).

Факторный анализ является одним из важных при анализе геолого-геофизических данных. В последние годы факторный анализ с успехом применяется в различных областях науки и техники, в том числе и в геологии. Факторный анализ является ветвью многомерной статистики, которая исследует внутреннюю структуру корреляционных матриц. В число часто применяемых входят: метод главных компонент и метод главных факторов. Вычисление факторов позволяет перейти от обширной исходной совокупности признаков к некоторым формальным математическим переменным - факторам. Количество главных факторов, применяющихся для последующих шагов анализа, намного меньше, чем количество исходных признаков, но значения признаков могут быть достаточно точно вычислены через значения главных факторов. Поэтому переход к факторам приводит к многократному сжатию информации. Важно и то, что факторам удается дать геологическое толкование. Например, фактор, корреляционно связанный с содержанием меди, свинца и серы в геохимических пробах, может быть назван сульфидным, и карта такого фактора будет отображать распространение сульфидной минерализации.

В основе моделей факторного анализа лежит гипотеза: наблюдаемые или измеряемые параметры -это только косвенные характеристики изучаемого объекта или явления, на самом же деле существуют внутренние (скрытые, не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры (факторы) имеют большое значение для районирования территории и оценки перспектив различных участков.

Регрессионный анализ позволяет найти эмпирические выражения, позволяющие количественно прогнозировать значения одного признака по значениям других. При использовании регрессионного анализа очень важно оценить возможность и точность прогноза, т.е. вычислить доверительные интервалы или стандарты прогнозируемых величин. При применении регрессионного анализа всегда встает вопрос: через значения каких признаков можно выразить значения признака, представляющего практический интерес, например содержания полезного ископаемого. Предварительный ответ на этот вопрос дает факторный анализ.

Тренд-анализ по своему математическому аппарату не отличается от регрессионного анализа, но аргументами, с которыми отыскивается связь прогнозируемого признака, являются не другие признаки, а

линейные комбинации степеней координат изучаемых объектов. Тренд-анализ можно рассматривать как способ получения региональной составляющей того или иного поля, выявления его главных тенденций в пределах исследуемой площади. Поэтому тренд-анализ может быть использован и вне системы комплексного анализа материалов - для обработки данных отдельных методов (гравиразведки, электроразведки, геохимии и т.д.).

Алгоритмы распознавания образов применяются (как и регрессионный анализ) при наличии эталонных объектов. Эти алгоритмы используются для получения оценок, характеризующих сходство каждого объекта с эталонными выборками из классов некоторой заданной классификации. Этот этап анализа эффективен, если обоснованно выбраны классы, признаки и эталонные объекты. Алгоритмы распознавания образов можно разделить на два класса: вероятностно-статистические и эвристические. Достоинством вероятностно-статистических алгоритмов является теоретическая обоснованность, вследствие чего, в частности, возможна вероятностная оценка достоверности получаемых практических выводов. Однако использование вероятностно-статистических алгоритмов связано с требованием достаточной статистики и с применением ряда допущений: обычно это допущения о справедливости того или иного закона распределения значений признаков, а иногда и о их независимости. Когда распределение значений признаков для объектов, хотя бы для одного класса, является полимодальным, такие алгоритмы неэффективны. К достоинствам эвристических алгоритмов относится их применимость к более широкому кругу геолого-геофизических задач. Такие алгоритмы позволяют проводить «локальное» распознавание, т.е. правильно классифицировать объекты, «похожие» по значениям своих признаков не «в среднем» на объекты того или иного класса, а на некоторую их часть, наиболее близкую в пространстве признаков. К недостаткам эвристических алгоритмов по сравнению со статистическими следует отнести тот факт, что для них отсутствует теория оценки достоверности получаемых решений.

Кроме этих методов, существуют другие эффективные методы анализа полей, которые помогают выделять те геологические объекты, которые могут быть использованы как факторы прогноза месторождений. Например, в геохимии нашел применение метод иерархического кластерного анализа, в котором в качестве меры геохимического различия проб ("геохимического расстояния" между пробами) используется некоторая функция разностей концентраций элементов в сравниваемых пробах (точках геохимического признакового пространства объекта), а критерием сходства (близости) точек считается минимальное приращение внутригрупповой суммы квадратов расстояний между точками и центрами групп, рассчитываемой на каждом шаге последовательного объединения.

Большой интерес представляют методы анализа полей, предложенные в работах А.А.Никитина, А.В.Петрова, А.Ю.Давыденко, А.Б.Ломакина,

Е.Н.Черемисиной, В.Н.Добрынина, Ю.А.Воронина и других исследователей.

Целью третьего этапа комплексного анализа геолого-геофизических данных является прогнозирование сложных геосистем, например, месторождений полезных ископаемых. Задачи, решаемые на этом

этапе, были уже сформулированы в таблице. Результатом решения этих задач обычно являются прогнозные карты, позволяющие ранжировать территорию по степени перспективности, например, по вероятности обнаружения целевых геологических объектов.

Библиографический список

1. Кузнецов О. Л., Никитин А. А. Геоинформатика. М.: Недра, 1992.

2. Дударева О.В. Геоинформационный анализ. Лабораторный практикум для студентов геолого-геофизических специальностей. Иркутск: Изд-во ИрГТУ, 2008. 57 с.

3. Ломтадзе В.В. Проблема формирования баз геолого-геофизических данных // Геология и разведка. М.: Изв. вузов. 1985. № 6.

4. Ломтадзе В.В., Шишкина Л.П., Бородаченко В.В. Концеп-

ция файловых баз данных (ФБД) и ФОРТРАН-ФБД // Материалы мирового центра данных. М.: АН СССР, 1986. 91 с.

5. Ломтадзе В.В. Программное и информационное обеспечение геофизических исследований. М.: Недра, 1993. 268 с.

6. Марченко В.В. Человеко-машинные методы геологического прогнозирования. М.: Недра, 1988. 232 с.

7. Еганов Э.А. Системно-модельный подход к решению поисковых задач // Методология и теория в геологии. Киев: Наукова думка, 1982. С. 33-40.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

УДК 550.8.(013+056+053:004)

ОЦЕНКА ТОЧНОСТИ И ОДНОЗНАЧНОСТИ РЕШЕНИЯ ОПТИМИЗАЦИОННЫХ ЗАДАЧ НА ПРИМЕРЕ ОБРАТНОЙ ЗАДАЧИ ГРАВИМЕТРИИ

, Л.П.Шишкина1

Национальный исследовательский Иркутский государственный технический университет, 664074, г. Иркутск, ул. Лермонтова, 83.

Предлагается универсальный (независимый от алгоритмов решения обратной задачи) метод оценки качества решения. Метод заключается в том, что задача решается Кг раз, причём в каждой реализации К (К = 1, ... , Кг), кроме первой, к значениям наблюдённого поля добавляются случайные величины, распределённые нормально с нулевым математическим ожиданием и стандартом Е. Значение Е задаётся с учётом предполагаемой точности моделирования, включающей неадекватность модели, неоднородность геологических объектов и т.п. По результатам Кг решений находятся средние значения и стандарты оценок параметров модели, а также коэффициенты парной корреляции между ними. Ил.4. Библиогр. 6 назв.

Ключевые слова: оптимизация; параметры модели; точность решения; однозначность решения; статистическое моделирование.

В.В.Ломтадзе

ESTIMATION OF ACCURACY AND ONE-VALUEDNESS OF THE SOLUTION OF OPTIMIZATION PROBLEMS ON EXAMPLE OF THE GRAVIMETRY INVERSE PROBLEM V.V. Lomtadze, L.P. Shishkina

National Research Irkutsk State Technical University, 83, Lermontov St., Irkutsk, 664074.

The authors propose a universal (independent of algorithms for the inverse problem solution) method to assess the quality of the solution. The method consists in the fact that the problem is solved Kr times, and in each realization of K (K = 1, ..., Kr), except the first, random variables normally distributed with zero mathematical expectation and E standard are added to the values of the observed field. The value of E is given with regard to the alleged modeling accuracy, including the inadequacy of the model, the heterogeneity of geological sites, and etc. According to the results of Kr-solutions the authors find average values and evaluation standards of model parameters, as well as the coefficients of pair correlation between them. 4 figures. 6 sources.

Key words: optimization; model parameters; solution accuracy; solution one-valuedness; statistical modeling.

Для иллюстрации метода на примере решения обратной задачи гравиметрии способом эквивалентных призм [3, 4, 5] в среде VBA разработана программа, встроенная в книгу Excel. На листе 1 книги Excel задаются исходные данные, элементы управления программой и размещаются основные результаты

(рис. 1).

На листе 2 программа графически отображает результаты решения задачи в первой реализации (рис. 2). В данном примере наложены ограничения на эквивалентную плотность каждой призмы: искомые параметры должны принадлежать интервалу [0, sgm]. В

1Шишкина Людмила Павловна, кандидат технических наук, доцент кафедры информатики, тел.: (3952) 405183. Shishkina Lyudmila, Candidate of technical sciences, Associate professor of the chair of Computer Science, tel.: (3952) 405183.

i Надоели баннеры? Вы всегда можете отключить рекламу.