Научная статья на тему 'Программный комплекс gia для организации хранения массовых геофизических данных'

Программный комплекс gia для организации хранения массовых геофизических данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
123
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГИОНАЛЬНЫЕ БАЗЫ ГЕОФИЗИЧЕСКИХ ДАННЫХ / REGIONAL GEOPHYSICAL DATABASES / ГЕОИНФОРМАЦИОННЫЙ АНАЛИЗ / GIS ANALYSIS / ПОИСКОВЫЕ ОБРАЗЫ / SEARCH IMAGES / ЛОКАЛЬНЫЕ БАЗЫ ДАННЫХ / LOCAL DATABASES / ФОРМАЛИЗАЦИЯ КАРТОГРАФИЧЕСКОЙ ИНФОРМАЦИИ / CARTOGRAPHIC INFORMATION FORMALIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дударева Оксана Витальевна, Королёва Анжела Владимировна

Рассмотрена проблема хранения массовых геофизических данных в геоинформационном комплексе GIA («Геоинформационный анализ») в виде технологии создания региональных, целевых и локальных баз. Программный комплекс обеспечивает интеграцию хранения данных, их поиска и обработки. В него включены методы интерполяции и разделения полей, формирования признакового пространства, а также средства статистического анализа геофизической информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GIA SOFTWARE FOR BULK GEOPHYSICAL DATA STORAGE ORGANIZATION

The article treats the problem of bulk geophysical data storage in a GIA complex (“Geoinformation analysis") in the form of a technology to create regional, target and local databases. Software package provides integration of data storage, search and processing. It involves the methods of field interpolation and separation, formation of a feature space and statistical analysis tools for geophysical information.

Текст научной работы на тему «Программный комплекс gia для организации хранения массовых геофизических данных»

УДК 550

ПРОГРАММНЫЙ КОМПЛЕКС GIA ДЛЯ ОРГАНИЗАЦИИ ХРАНЕНИЯ МАССОВЫХ ГЕОФИЗИЧЕСКИХ ДАННЫХ

__ л о

© О.В. Дударева1, А.В. Королёва2

Иркутский государственный технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

Рассмотрена проблема хранения массовых геофизических данных в геоинформационном комплексе GIA («Геоинформационный анализ») в виде технологии создания региональных, целевых и локальных баз. Программный комплекс обеспечивает интеграцию хранения данных, их поиска и обработки. В него включены методы интерполяции и разделения полей, формирования признакового пространства, а также средства статистического анализа геофизической информации. Ил. 4. Библиогр. 3 назв.

Ключевые слова: региональные базы геофизических данных; геоинформационный анализ; поисковые образы; локальные базы данных; формализация картографической информации.

GIA SOFTWARE FOR BULK GEOPHYSICAL DATA STORAGE ORGANIZATION O.V. Dudareva, A.V. Koroleva

Irkutsk State Technical University, 83 Lermontov St., Irkutsk, 664074, Russia.

The article treats the problem of bulk geophysical data storage in a GIA complex ("Geoinformation analysis") in the form of a technology to create regional, target and local databases. Software package provides integration of data storage, search and processing. It involves the methods of field interpolation and separation, formation of a feature space and statistical analysis tools for geophysical information. 4 figures. 3 sources.

Key words: regional geophysical databases; GIS analysis; search images; local databases; cartographic information for-malization.

Наиболее быстро растут объемы данных в таких областях наук о Земле, как метеорология, сейсмология, климатология, дистанционное зондирование планеты, прикладная геофизика и поиск полезных ископаемых. Геофизические предприятия используют массовые данные, на получение которых затрачиваются огромные средства. Это такие, как значения ускорения силы тяжести в редукции Буге (в гравиразведке); аномальные значения магнитного поля (в магниторазведке); значения вертикального времени прохождения волн, отраженных от целевых границ (в сейсморазведке). Ежегодно проводятся геолого-геофизические съемки разных масштабов и другие дорогостоящие полевые работы. Постоянно возрастающие потоки полученной информации регистрируются в цифровом виде или оцифровываются при архивации. Таким образом, проблема организации хранения массовых геофизических данных с целью последующего комплексного анализа совместно с новой информацией является одной из важнейших в геофизике.

Геология стала одной из первых отраслей научно-практической деятельности, в которой начали применяться математические методы и компьютерные тех-

нологии. В 60-70-х годах прошлого века геоинформационные системы (ГИС) использовали как инструмент для графического отображения координатно-привязанных данных и соответственно для печати карт. Дальнейшее развитие ГИС пошло по двум направлениям: первое - эффективный ввод и хранение пространственных данных (построение карт); второе - разработка процедур и функций для анализа. Применяемые в геологии и геофизике современные геоинформационные системы позволяют хранить и выполнять разнообразные преобразования географических координат, дают пользователю удобный механизм выявления закономерностей пространственного размещения геологических объектов. При анализе существующих ГИС можно сделать вывод, что они позволяют организовать хранение картографической информации, а также использовать ее для построения карт и выявления сравнительно простых пространственных закономерностей. В рамках ГИС хранится также семантическая информация, привязанная к картографическим объектам, - их основные характеристики в табличной форме. Однако проблема стандартизованного хранения массовых геолого-

1Дударева Оксана Витальевна, кандидат геолого-минералогических наук, директор Института кибернетики, тел.: 89027673247, e-mail: odudareva@mail.ru

Dudareva Oksana, Candidate of Geological and Mineralogical sciences, Director of the Institute of Cybernetics, tel.: 89027673247, e-mail: odudareva@mail.ru

2Королёва Анжела Владимировна, кандидат геолого-минералогических наук, доцент кафедры информатики, тел.: 89149242479, e-mail: k.a.angelik@mail.ru

Koroleva Anzhela, Candidate of Geological and Mineralogical sciences, Associate Professor of the Department of Computer Science, tel.: 89149242479, e-mail: k.a.angelik@mail.ru

геофизических данных ими не решается. Массовые данные являются основными для выделения различных геологических объектов: структур осадочного чехла, зон улучшенных коллекторских свойств, разнообразных интрузий, тектонических нарушений и др. Соответственно возникают трудности при организации тематических работ с целью обобщения и комплексного анализа информации, накопленной по поисково-разведочным площадям.

Представляемый программный комплекс С!Л включает в себя оболочку и функциональные модули, динамически вызываемые оболочкой для гибкого построения графов обработки данных. Оболочка комплекса построена в соответствии с такими требованиями к современному программному обеспечению, как событийная ориентированность, объектная ориентированность и унифицированный графический интерфейс. Набор функциональных модулей может расширяться с одновременным включением в оболочку новых пунктов меню. Такая структура программного комплекса, а также ориентация на хранение информации по исследуемой площади в реляционной базе данных, позволяют оперативно конфигурировать С!Л для решения конкретного круга задач. В настоящее время GIA включает в себя программные средства для создания (или выбора ранее созданной) локальной базы данных, для ввода в эту базу картографической информации и массовых геофизических данных по конкретной площади, для разделения полей, их интерполяции и построения карт с нанесением на них выбранных картографических объектов, для статистического анализа данных (одномерного, факторного, корреляционно-регрессионного) и прогнозирования гео-

логических объектов и явлений (метод аналогий и системно-модельный подход, основывающийся на формализации знаний) [1, 2]. Таким образом, включение в С!Л программных модулей для создания и использования региональных баз данных (РБД) позволяет объединить в одном программном комплексе технологии создания региональных и целевых баз и их последующего использования для решения прогнозных задач.

Исходные данные (картографические и массовые геоданные) в рамках GIA хранятся в реляционной базе, причем таблицы массовых данных создаются динамически в соответствии с табличным описанием их состава (рис. 1). Хранение данных в реляционной БД облегчает реализацию импорта-экспорта информации и, следовательно, взаимодействие с другими программными средствами. Динамическое создание таблиц массовых геоданных также чрезвычайно важно, поскольку заранее (при конструировании модели данных) невозможно предвидеть, каким количеством признаков будет описываться точка, узел сети или геохимическая проба. Пользователю предоставляется возможность выполнения не отдельных программ (процедур), а гибко формируемых графов обработки данных.

Технология создания региональных и целевых баз данных иллюстрируется рис. 2. Эта технология позволяет создавать РБД по миллионным листам (как на рисунке), геолого-структурным зонам (таким, например, как Байкальская рифтовая зона), либо по территориям, выделенным с учетом прагматических соображений (площади лицензионного отвода и т.п.). Важное методологическое значение имеют понятия локальных методных и целевых баз данных.

Рис. 1. Динамическое создание таблиц массовых геоданных

Локальные методные базы данных всегда существуют при обработке материалов каждого геофизического метода после завершения полевых работ. Эта обработка заключается в цепочке переходов от файлов одних типов к файлам других типов [3]. Типизация данных на этапе их обработки позволяет унифицировать структуры и состав типовых файлов для каждого геолого-геофизического метода, а также выбрать те файлы, которые подлежат долговременному хранению в региональных базах. Например, в гравиразвед-ке долговременному хранению подлежат файлы типа А [3]. В их записях содержатся координаты пунктов X, Y, Н, аномальные значения ускорения силы тяжести GA и значения поправки за рельеф GT при определенной плотности промежуточного слоя. В сейсморазведке обычно хранят для каждой общей глубинной точки ее координаты X, Y и значения вертикального времени прохождения волн, отраженных от целевых границ (например, ТА, ТМ2, TF и т.п.). Кроме временных параметров, могут храниться абсолютные отметки целевых границ, а также кинематические и динамические параметры слоев принятой модели. Подобная унификация позволяет, во-первых, конкретизировать состав записей в файлах, подлежащих долговременному хранению, а во-вторых, при последующем создании локальных целевых баз данных указывать идентификаторы отбираемых признаков.

Локальные целевые базы данных создаются для обобщения и анализа геолого-геофизических материалов, накопленных по тем или иным площадям.

Включение файла локальной методной базы данных в РБД сводится к созданию его поискового образа, а также к передаче самого файла. Такая передача

заключается в импорте файла из форматов локальной базы и его записи на один из томов соответствующей РБД, например, на том P48001, P48002 и т.п. Технически том может быть представлен диском CD или DVD. При включении файла в региональную базу данных ему дается новое имя, например, ZRP05003 - данные, относящиеся к региональной базе ZRP (образно говоря, стеллаж для размещения новой книги), полученные в 2005 году (полка) и помеченные номером 003 (номер книги на полке). Назначение такого подхода -сохранить информацию, полученную в течение года геологическими и геофизическими партиями, работавшими в пределах листа масштаба 1:1000000. Каждая база данных при таком подходе имеет имя, состоящее из трех символов: P48, BRZ, ZRP и т.п.

Одновременно с включением файла в РБД, в файл поисковых образов (в нашем примере в файл ZRP.RBD) добавляется поисковый образ нового файла - по аналогии с карточкой, заполняемой при поступлении новой книги в библиотеку. Диалоговое окно для формирования поискового образа файла показано на рис. 3.

При создании поискового образа файла указываются его основные характеристики: имя файла в РБД; серийный номер тома; номер редакции файла (зарезервированное поле); обозначение вида сети, по которой организованы данные (произвольная, прямоугольная и т.п.); «ключи» к координатам в записях файла; граничные координаты площади, к которой относятся данные файла; признак актуальности данных; дескрипторы, например, D=12000,100 - данные гравиразведки (12000) масштаба 1:100000 (100).

Рис. 2. Принципиальная схема создания и использования региональных баз данных

Рис. 3. Диалоговое окно для формирования поискового образа файла РБД

Файл поисковых образов в дальнейшем позволяет отобрать из РБД все файлы определенного содержания, имеющие определенную привязку по месту и времени. При создании целевой базы данных вид диалогового окна изменится (рис. 3). В этом диалоговом окне выбирается контур целевой площади, ограничения на виды сетей (GRID), дескрипторы D, определяющие в основном геолого-геофизические методы и масштабы исследований, а также идентификаторы отбираемых признаков (P) и новые «ключи» к координатам (CX, CY).

При создании целевой базы данных сначала просматриваются поисковые образы файлов, относящихся к РБД. Поисковые образы, соответствующие запросу, отбираются, и после этого начинается просмотр самих файлов региональной базы. Сначала координаты в каждой записи файла РБД пересчитываются к единой системе координат с учетом новых «ключей» CX, CY. Затем точка, соответствующая записи, проверяется на попадание в пределы целевой площади. Из отобранных записей берутся координаты и указанные в запросе элементы данных (признаки - поля). Так формируется файл целевой базы данных по одному геолого-геофизическому методу. Этот файл может содержать данные многолетних исследований, выполненных на заданной площади. При этом координаты в записях, извлеченных из разных файлов РБД, будут приведены к единой системе. Для формирования файлов целевой базы данных по нескольким геолого-геофизическим методам необходимо несколько

раз воспользоваться диалоговым окном, приведенным на рис. 4.

В этом диалоговом окне выбирается контур целевой площади, ограничения на виды сетей (GRID), дескрипторы D, определяющие в основном геолого-геофизические методы и масштабы исследований, а также идентификаторы отбираемых признаков (P) и новые «ключи» к координатам (CX, CY). При создании целевой базы данных сначала просматриваются поисковые образы файлов, относящихся к данной РБД. Поисковые образы, соответствующие запросу, отбираются, и после этого начинается просмотр самих файлов региональной базы. Сначала координаты в каждой записи файла РБД пересчитываются к единой системе координат с учетом новых «ключей» CX, CY.

Затем точка, соответствующая записи, проверяется на попадание в пределы целевой площади. Из отобранных записей берутся координаты и указанные в запросе элементы данных (признаки - поля). Так формируется файл целевой базы данных по одному геолого-геофизическому методу. Он может содержать данные многолетних исследований, выполненных на заданной площади. При этом координаты в записях, извлеченных из разных файлов РБД, будут приведены к единой системе. Для формирования файлов целевой базы данных по нескольким геолого-геофизическим методам необходимо несколько раз воспользоваться диалоговым окном, приведенным на рис. 4.

Рис. 4. Диалоговое окно для формирования целевой базы данных

Для анализа данных в программный комплекс включены методы интерполяции и разделения полей, формирования признакового пространства путем расчета статистик в скользящих окнах для узлов сети, а также программные средства статистического анализа данных. Методы многомерного статистического анализа используются для выделения геологических объектов (зоны разлома, антиклинальные структуры, зоны улучшенных коллекторских свойств и т.п.). С помощью программного комплекса GIA можно построить прогнозную карту изолиний апостериорной вероятности.

Средством для повышения эффективности прогнозирования на каждой стадии поисково-разведочных работ является комплексное использование геолого-геофизических данных. Таким образом, в программном комплексе GIA технология создания региональных, а из них - целевых баз данных обеспечивает концептуальное единство общего программного обеспечения геолого-геофизических исследований, дает возможность комплексного анализа геолого-геофизических данных для решения прогнозных задач.

Статья поступила 14.03.2014 г.

Библиографический список

1. Ломтадзе В.В. Технология геологического прогнозирования на основе системно-модельного подхода // Вестник Иркутского государственного технического университета. 2001. Вып. 10. С. 11-16.

2. Дударева О.В., Королёва А.В. Организация хранения геофизических данных и прогнозирование геологических

объектов // Современные информационные технологии. 2011. № 13. С. 161-164.

3. Ломтадзе В.В. Программное и информационное обеспечение геофизических исследований. М.: Недра, 1993. 268 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.