УДК 550.34.013.2
DOI: 10.33764/2618-981Х-2019-2-3-191-200
РЕШЕНИЕ ОБРАТНОЙ ЗАДАЧИ МЕТОДА МНОГОКАНАЛЬНОГО АНАЛИЗА ПОВЕРХНОСТНЫХ ВОЛН НА ОСНОВЕ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ
Александр Викторович Яблоков
Институт нефтегазовой геологии и геофизики им. А. А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, младший научный сотрудник; Институт горного дела им. Н. А. Чинакала СО РАН, 630091, Россия, г. Новосибирск, Красный пр., 54, младший научный сотрудник; Новосибирский национальный исследовательский государственный университет, 630090, Россия, г. Новосибирск, ул. Пирогова, 1, аспирант, e-mail: yablokovav@ipgg.sbras.ru
Георгий Николаевич Логинов
Новосибирский национальный исследовательский государственный университет, 630090, Россия, г. Новосибирск, ул. Пирогова, 1, ассистент кафедры геофизики; Институт нефтегазовой геологии и геофизики им. А. А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, научный сотрудник, e-mail: loginovgeorgy@gmail.com
Александр Сергеевич Сердюков
Институт нефтегазовой геологии и геофизики им. А. А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, кандидат физико-математических наук, старший научный сотрудник; Институт горного дела им. Н. А. Чинакала СО РАН, 630091, Россия, г. Новосибирск, Красный пр., 54, младший научный сотрудник, e-mail: serdyukovas@ipgg.sbras.ru
Антон Альбертович Дучков
Новосибирский национальный исследовательский государственный университет, 630090, Россия, г. Новосибирск, ул. Пирогова, 1, доцент кафедры геофизики; Институт нефтегазовой геологии и геофизики им. А. А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, кандидат физико-математических наук, зав. лабораторией, e-mail: duchkovaa@ipgg.sbras.ru
Работа посвящена повышению эффективности метода многоканального анализа поверхностных волн за счет реализации нового алгоритма подбора Ш-моделей скоростей поперечной волны путем обращения дисперсионных кривых на основе машинного обучения. Предлагается использовать многослойную искусственную нейронную сеть (ИНС) с последовательными связями для подбора горизонтально-слоистых моделей, составленных из вектора интерполированных значений скоростей на равномерной сетке с фиксированным шагом.
Преимуществами использования обученной ИНС для задачи обращения дисперсионных кривых являются: возможность восстановления слоистых моделей с достаточной точностью для их использования на последующих этапах обработки сейсмических данных, устойчивость к помехам, не значительные требования к вычислительным ресурсам и отсутствие необходимости дополнительной настройки параметров.
Результаты тестирования обученной ИНС, с предложенной в данном исследовании архитектурой, показывают высокую точность на валидации (порядка 96%), что говорит об успешности обучения и актуальной перспективе применения нейронных сетей для задач инверсии.
Ключевые слова: поверхностные волны, дисперсионная кривая, инверсия, искусственная нейронная сеть.
SOLVING OF THE INVERSION PROBLEM OF THE METHOD MULTICHANNEL ANALYSIS OF SURFACE WAVES BASED ON THE ARTIFICIAL NEURAL NETWORK
Alexandr V. Yablokov
Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Prospect Аkademik Koptyug St., Novosibirsk, 630090, Russia, Junior Researcher; Chinakal Institute of Mining SB RAS, 54, Krasny Prospect St., Novosibirsk, 630091, Russia, Junior Researcher; Novosibirsk National Research State University, 1, Pirogova St., Novosibirsk, 630073, Russia, Ph. D. Student, e-mail: yablokovav@ipgg.sbras.ru
Georgy N. Loginov
Novosibirsk National Research State University, 1, Pirogova St., Novosibirsk, 630073, Russia, Assistant of the Department of Geophysics; Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Prospect Аkademik Koptyug St., Novosibirsk, 630090, Russia, Researcher, e-mail: loginovgn@ipgg.sbras.ru
Aleksander S. Serdyukov
Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Prospect Аkademik Koptyug St., Novosibirsk, 630090, Russia, Ph. D., Senior Researcher; Chinakal Institute of Mining SB RAS, 54, Krasny Prospect St., Novosibirsk, 630091, Russia, Junior Researcher, serdyukovas@ipgg.sbras.ru
Anton A. Duchkov
Novosibirsk National Research State University, 1, Pirogova St., Novosibirsk, 630073, Russia, Associate Professor; Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Prospect Аkademik Koptyug St., Novosibirsk, 630090, Russia, Ph. D., Head of Laboratory, e-mail: duchkovaa@ipgg.sbras.ru
The study is devoted to improving the efficiency of the method of multichannel analysis of surface waves due to the implementation of a new algorithm for the selection of 1D-models of the shear wave velocity by inverse dispersion curves based on machine learning. It is proposed to use a multilayer fully-connected artificial neural network (ANN) for the estimate of horizontally layered models composed of interpolated velocity values on a uniform grid with an arbitrary step. Various types of correlation dependence of the parameters of the velocity model on dispersion curves were investigated. The optimal type of the objective function was determined for ANN learning on the basis of these studies.
The advantages of using a trained ANN for the problem of inversion dispersion curves are: the ability to estimate layered models with sufficient accuracy for their use at subsequent stages of seismic data processing, resistance to noise, no significant requirements for computational resources and the absence of the need for additional adjustment of parameters.
The tests of the trained ANN, with the architecture proposed in this study, show high accuracy in validation (about 96%), which indicates the success of training and the actually perspective of using neural networks for inversion problems.
Key words: surface waves, dispersion curves, inversion, artificial neural network.
Введение
Метод многоканального анализа поверхностных волн (MASW) является неинвазивным методом изучения верхней части геологического разреза (ВЧР).
В течение двух последних десятилетий этот метод получил широкое распространение [1, 2]. MASW используется при решении задач, связанных с инженерно-геологическими изысканиями [3-5]. Благодаря скорости получения и обработки данных MASW рассматривается как экспресс-метод, позволяющий получать достоверные результаты. Другой перспективной областью применения MASW является исследование ВЧР с целью введения статических поправок при обработке данных разведочной сейсмики [6, 7]. Особенность этих задач состоит в необходимости обработки большого количества данных и в повышенных требованиях к точности определения скоростей сейсмических волн (по сравнению с геотехническими работами).
Перспективными направлениями развития метода MASW является повышение точности и помехоустойчивости определения фазовых скоростей поверхностных волн. К таким исследованиям относятся полевые работы по выявлению оптимальных параметров системы наблюдений [8, 9], а также разработка алгоритма спектрального анализа на основе временно-частотного представления сейсмограмм с использованием SFK-преобразования [10]. Применение SFK-преобразования обеспечивает автоматическое извлечение плавных и более точных по сравнению с полученными при помощи стандартных подходов дисперсионных кривых [11].
Ключевым этапом MASW является обращение кривой зависимости фазовой скорости волны Релея (Лява) от частоты в горизонтально-слоистую Ш-модель скорости поперечной волны ). Традиционно, данная задача решается путем минимизации функционала невязки между наблюденной и расчетной дисперсионными кривыми [12]. При наличии высоких контрастов сейсмических скоростей (более в 2-3 раза) и/или уменьшении скоростей с глубиной в исследуемом разрезе стандартный подход дает решения с сильными нефизич-ными осцилляциями [13]. С целью решения данной проблемы, в работах [13, 14] был предложен подбор гладких скоростных моделей с помощью регуляри-зирующего алгоритма Оккама.
Основным недостатком алгоритма Оккама является возможность восстанавливать только гладкие скоростные модели, что не позволяет получить достаточную точность в слоистых средах. Помимо этого, алгоритм требует настройки параметров регуляризации в процессе решения. В [15] было предложено использовать алгоритм на основе искусственной нейронной сети (ИНС) для обращения фундаментальной моды фазовых скоростей волны Релея в предположении об известном количестве слоев среды. Преимуществом использования ИНС является возможность восстановления слоистых моделей с достаточной точностью для их использования на последующих этапах обработки сейсмических данных, например, при восстановлении ВЧР. ИНС обладают высокой устойчивостью к помехам, что показано в [15]. Недостатком подхода в [15] является необходимость обучать ИНС с фиксированным числом слоев среды, что делает невозможным применение обученной ИНС к неизвестным моделям среды. Данное ограничение приводит к необходимости тестировать архитектуру ИНС отдельно для каждого случая.
В нашем исследовании предлагается разработать алгоритм на основе ИНС для восстановления скоростной модели с произвольным числом слоев среды. Отсутствие фиксации числа слоев среды достигается за счет предположения о физических ограничениях глубинного разрешения разрезов, восстанавливаемых по методу МАБ"^ Так, минимальная мощность слоя ограничена минимальной длиной волны, а максимальная глубина половиной максимальной длины волны. Для обучения нейронной сети слоистая скоростная модель представляется в виде вектора интерполированных значений скоростей на равномерной сетке с фиксированным шагом. Такой подход позволит унифицировать архитектуру ИНС и использовать ее для инверсии неизвестных скоростных моделей. В дополнение, применение обученной ИНС не требует значительных вычислительных ресурсов и дополнительной настройки параметров. В ходе исследования решаются следующие задачи: 1) анализ чувствительности дисперсионной кривой к изменениям в скоростной модели; 2) подбор оптимальной архитектуры нейронной сети; 3) обучение и тестирование ИНС для обращения дисперсионных кривых в Ш-модель скоростей поперечной волны.
Методы
В данной работе мы используем фундаментальную моду фазовой скорости волны Релея для определения Ш-модели УБ с помощью ИНС. Предлагаемый подход обучения ИНС состоит из 3 основных этапов. Первым шагом производится расчет теоретических дисперсионных кривых для различных классов моделей. Вторым этапом пластовая модель скорости, используемая для расчета кривых, интерполируется на новую сетку с учетом мощности слоев. На последнем этапе используется многослойная ИНС с последовательными связями для обращения дисперсионных кривых в модель УБ.
Теоретические фазовые скорости Уи поверхностной волны рассчитываются путем аналитического решения дисперсионного уравнения Релея [13]:
Ук = / V, И,Ур, р,а>),
где У3- скорость Б-волны, И - мощность слоев, Ур - скорость Р-волны, р - плотность и ю - частота. Влияние Ур и р в дисперсионном соотношении незначительно по сравнению с У3 и И.
Мы рассматриваем задачу аппроксимации дисперсионного соотношения как задачу регрессии и обучения ИНС для определения Ш-модели У3. По аналогии с классическим решением обратных задач, нейронная сеть является оператором отображения пространства наблюдений в пространство параметров модели.
В рамках данного исследования, мы рассматриваем скоростные модели с 3, 4 и 5 слоями. Суммарная глубина моделей и скорость УБ в нижнем слое фиксированы и составляют 30 м и 2500 м/с соответственно. Для каждого типа модели
было рассчитано 4000 примеров (всего 12000) синтетических данных с фиксированным отношением УР/У5 в каждом слое. Дисперсионные кривые рассчитаны в диапазоне от 0,5 до 100 Гц с шагом 0,5 Гц, что позволяет сохранить чувствительность формы дисперсионных кривых относительно большинства рассматриваемых моделей среды. Скоростные модели были сгенерированы случайным образом из равномерного распределения скоростей в заданном диапазоне для каждого слоя. В табл. 1 приведены диапазоны изменения параметров модели. Мы предполагаем, что наблюденные Уи содержат в себе всю необходимую информацию о модели среды, включая ограничения по глубинному разрешению. Таким образом, при разработке ИНС мы предполагаем, что модель среды может быть представлена вектором значений скоростей, в котором число элементов определяется длинами волн (минимальной и максимальной).
Таблица 1
Параметры скоростных моделей для обучения
№ слоя У5, м/с h (мощность), м
1 100 -400 4-12
2 450-900 4-10
3 1000-1500 4-10
4 1550-2000 10
5 2500 ю
Разработка архитектуры ИНС осуществлялась экспериментально. Были протестированы: число скрытых слоев и нейронов, тип функции активации, размер обучающей выборки, параметры алгоритма оптимизации и вид целевой функции. Производительность ИНС оценивалась на тестовой выборке по ряду критериев: поведение кривой обучения, значение метрик, визуальный анализ, корреляция зависимости ошибок от параметров модели и характера дисперсионных кривых.
Мы предлагаем интерполировать вектора скоростных моделей на равномерную сетку по двум причинам. Во-первых, это позволит восстанавливать произвольное число слоев среды. Во-вторых, поскольку методы машинного обучения, в отличии от «классических» обратных задач, не предполагают наличие инструмента решения прямой задачи, то выбор признакового пространства, подаваемого на вход ИНС, не очевиден. Однако, могут быть протестированы преобразования, которые могли бы повысить репрезентативность входных данных. Для анализа чувствительности отклика такого представления скоростной модели к дисперсионным кривым предлагается оценить, при какой метрике наблюдается наибольшая корреляция между наблюдениями и скоростной моделью. Мы рассчитали коэффициент корреляции Пирсона между метрикой кривых 0(ун) и метрикой скоростных моделей 0(УБ) . В табл. 2 приведены резуль-
таты для некоторых использованных метрик: Канберра (Л1), расстояние кова-риации (Э2), косинусная (£3) и Евклидова (£4).
Таблица 2
Коэффициент Пирсона между метриками
Формула D1(Vr-) D2(Vr) D3(Vr) D\Vr)
Di _V IN _vill ¿-ч N1 + btl D1(Ys) 0.439 0.681 0.663 0.607
(u — u)^(v — v) D2 = 1 llw-wlhlb-vlh D2(VS) 0.089 0.36 0.302 0.346
D3 = 1 INI2IMI2 D3(VS) 0.159 0.539 0.475 0.476
D* = \\u-vh D6(VS) 0.168 0.513 0.451 0.487
Экспериментально была подобрана сетка интерполяции из 40 отсчетов с шагом около 0,5 м. По результатам анализа чувствительности было решено использовать метрику Канберра в качестве целевого функционала невязки при обучении ИНС. Рассмотрим кривую обучения нейронной сети (среднюю абсолютную ошибку на каждой эпохе) для трех разных типов функционала невязки: MAE, MSE, Канберра (рис. 1). При использовании функционала Канберра наблюдается меньшее значение невязки в начале обучения и более плавное изменение формы. Путем экспериментов нами было установлено, что «альтернативные» типы функционала могут быстрее сходиться и быть более устойчивы к начальному приближению.
Рис. 1. Кривые обучения при различных целевых функциях
При тестировании обучающей выборки было установлено, что ключевую роль играет репрезентативность различных типов моделей, тогда как размер выборки может составлять порядка 30% (3600 примеров из 12000). Подбор числа скрытых слоев показал, что вне зависимости прочих гиперпараметров (число нейронов, тип активации и т.д.), число слоев ИНС для достижения удовлетворительной производительности должно быть не менее 3. При этом, большее число слоев не дает существенного прироста точности и повышает требования к вычислительным ресурсам. Тестирование типа активационной функции показало, что предпочтительнее использовать гладкие функции типа «Sigmoid» или «Tanh». Использование популярной функции «ReLU» приводило к большим ошибкам. Число нейронов на скрытых слоях ИНС может быть сравнимо или в несколько раз больше, чем количество отсчетов входного массива. Число отсчетов выходного слоя совпадает с числом элементов в векторе Vs. Для обучения ИНС был выбран алгоритм «Adam», основанный на адаптивных оценках моментов [16]. Нами было выявлено, что адаптивное уменьшение скорости обучения (стартовая скорость 0,1) с затуханием 0,1 позволяет получить наилучшую производительность ИНС. По итогам тестирования была выбрана архитектура, представленная в табл. 3.
Таблица 3
Предложенная архитектура нейронной сети
№ слоя ИНС Выполняемая процедура Входной размер Выходной размер Размер весов
1 Вход (дисперсионная кривая) 1 x 200
2 Полносвязанный слой (400 нейронов) Активация - сигмоидальная 1 x 200 1 x 400 200 х 400 (веса) 1 х 400 (смещение)
3 Полносвязанный слой (200 нейронов) Активация - сигмоидальная 1 x 400 1 x 200 200 х 80 (веса) 1 х 200 (смещение)
4 Полносвязанный слой (80 нейронов) Активации - сигмоидальная 1 x 200 1 x 80 80 х 40 (веса) 1 х 80 (смещение)
5 Выход (гладкая модель Уя) 1 x 80 1 x 40
Результаты
По результатам исследований была предложена архитектура многослойной нейронной сети с прямой связью с целью аппроксимации дисперсионного соотношения и определения Ш-модели скорости поперечной волны. Проведен анализ чувствительности дисперсионной кривой к изменениям в скоростной модели. По результатам анализа, было предложено использовать метрику Кан-
берра в качестве функционала невязки для обучения ИНС. Тестирование показало, что такой вид функционала, по сравнению с классическим, более устойчив к выбору начального приближения весов ИНС и быстрее обучается.
Результаты тестирования показали, что разбивать исходный набор данных (12000 примеров) на обучающую и валидационную выборку достаточно в соотношении 30/70. Такого соотношения достаточно для достижения точности на валидации порядка 96%. Важно отметить, что около 90% валидационной выборки имеют среднюю абсолютную ошибку порядка 16 м/с и дисперсию 24 м/с, тогда как оставшиеся 10% имеют значительные 55 м/с и 70 м/с соответственно. Обученная нейронная сеть была апробирована на всех примерах. На рис. 2 представлены результаты восстановления 1-0 моделей скоростей поперечной волны с наименьшей и наибольшей средней абсолютной ошибкой для всех трех классов моделей (3, 4 и 5-слойные).
Рис. 2. Результаты инверсии дисперсионных кривых для моделей с 3, 4 и 5-ти слоями на основе ИНС с наименьшей (верхний ряд) и наибольшей (нижний ряд) средней абсолютной ошибкой (MAE)
Обучение и тестирование ИНС занимает незначительное время по сравнению со стандартным алгоритмом решения обратной задачи, а также показывает более высокую точность. Так, при выполнении инверсии на основе алгоритма Оккама средняя абсолютная ошибка составляет порядка 250 м/с для тех же примеров, при этом расчет занимает порядка 10 часов. Обучение же ИНС занимает 5 минут, а применение к набору данных не более 10 секунд.
Ценность полученных результатов состоит в повышении эффективности метода определения скоростного строения (ВЧР) путем реализации нового ал-
горитма обращения дисперсионных кривых на основе искусственных нейронных сетей. Дальнейшее исследование направлено на совершенствование архитектуры ИНС, использование стратегии «дообучение» и тестирование на реальных сейсмических данных.
Алгоритмическая часть исследования выполнена при финансовой поддержке РФФИ в рамках научного проекта № 18-35-00412. Методическая часть исследования и формирование обучающей выборки - при поддержке гранта Президента РФ для молодых кандидатов наук № МК-6451.2018.5.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Park C.B., Miller R. D., Xia J. Multichannel analysis of surface waves // Geophysics. -1999. - Т. 64. - №. 3. - P. 800-808.
2. Socco L.V., Foti S., Boiero D. Surface-wave analysis for building near-surface velocity models—Established approaches and new perspectives // Geophysics. - 2010. - Т. 75. - №. 5. -P. 75A83-75A102.
3. The surface waves-based seismic exploration of soil and ground water / A.S. Serdyukov, A.V. Yablokov, G.S. Chernyshov, A.V. Azarov // IOP Conference Series: Earth and Environmental Science. All-Russian Conference on Challenges for Development in Mining Science and Mining Industry devoted to the 85th anniversary of Academician Mikhail Kurlenya (Novosibirsk, Russia, 3-6 October 2016). - 2017. - Т. 53. - № 1. - P. 012010-1 - 012010-5
4. Mahvelati S., Coe J.T. The use of two dimensional (2D) multichannel analysis of surface waves (MASW) testing to evaluate the geometry of an unknown bridge foundation // Geotechnical Frontiers 2017. - 2017. - P. 657-666.
5. Rahman M. Z., Kamal A.S. M. M., Siddiqua S. Near-surface shear wave velocity estimation and V s 30 mapping for Dhaka City, Bangladesh // Natural Hazards. - 2018. - Т. 92. - №. 3. -P. 1687-1715.
6. Roohollah A. et al. Surface wave analysis and its application to the calculation of converted wave static corrections: dis. - University of Calgary, 2013.
7. Socco L.V. et al. Surface wave analysis for S-wave static correction computation // SEG Technical Program Expanded Abstracts 2010. - Society of Exploration Geophysicists, 2010. -P. 1929-1933.
8. Taipodia J., Dey A. Impact of strike energy on the resolution of dispersion image in active MASW survey // GeoShanghai International Conference. - Springer, Singapore, 2018. -P. 419-427.
9. Olafsdottir E. A., Bessason B., Erlingsson S. Combination of dispersion curves from MASW measurements // Soil Dynamics and Earthquake Engineering. - 2018. - Т. 113. -P. 473-487.
10. Slant f-k transform of multichannel seismic surface wave / A.S. Serdyukov, A.V. Yablokov, A.A. Duchkov, A.A. Azarov, V.D. Baranov // Geophysics. - 2019. - Т. 84. -№ 1. - P. A19-A24.
11. Яблоков А.В., Сердюков А.С. Метод автоматизированного извлечения дисперсионных кривых на основе временно-частотного распределения сейсмических данных [Электронный ресурс] // Геофизические технологии. - 2018. - № 3. - С. 48-58
12. Xia J., Miller R.D., Park C. B. Estimation of near-surface shear-wave velocity by inversion of Rayleigh waves // Geophysics. - 1999. - Т. 64. - №. 3. - P. 691-700.
13. Lai, C. G. Surface waves in dissipative media: Forward and inverse model-ling. In: Surface Waves in Geomechanics: Direct and Inverse Modelling for Soil and Rocks (C. G. Lai and K. Wilmanski, eds.). New York: Springer-Verlag, -2005. p. 385.
14. Rubaiyn A., Safani J., Priyono A. Joint Inversion of Rayleigh-wave Dispersion Curve for Near-Surface S-Wave Velocity Estimation // EAGE-HAGI 1st Asia Pacific Meeting on Near Surface Geoscience and Engineering. 9 - 13 April, Yogyakarta, Indonesia. - 2018.
15. £aylak £., Kaftan i. Determination of near-surface structures from multi-channel surface wave data using multi-layer perceptron neural network (MLPNN) algorithm // Acta Geophysica. -2014. - Т. 62. - №. 6. - С. 1310-1327.
16. Kingma D.P., Ba J. Adam: A method for stochastic optimization // arXiv preprint arXiv: 1412.6980. - 2014.
© А. В. Яблоков, Г. Н. Логинов, А. С. Сердюков, А. А. Дучков, 2019