Научная статья на тему 'ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПОДАВЛЕНИЯ ЧИСЛЕННОЙ ДИСПЕРСИИ В ЗАДАЧЕ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ ПОЛНЫХ ВОЛНОВЫХ СЕЙСМИЧЕСКИХ ПОЛЕЙ'

ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПОДАВЛЕНИЯ ЧИСЛЕННОЙ ДИСПЕРСИИ В ЗАДАЧЕ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ ПОЛНЫХ ВОЛНОВЫХ СЕЙСМИЧЕСКИХ ПОЛЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
88
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛНОВОЛНОВОЕ МОДЕЛИРОВАНИЕ / ЧИСЛЕННАЯ ДИСПЕРСИЯ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гадыльшина Ксения Александровна, Гадыльшин Кирилл Геннадьевич, Лисица Вадим Викторович, Вишневский Дмитрий Михайлович

Численное моделирование требует большого объема вычислительных ресурсов. В этом смысле оно является одной из самых тяжелых процедур сейсмической обработки. Обычно создание набора сейсмических данных требует приблизительно 10^8 ядро-часов на типичном вычислительном кластере. Такие высокие требования возникают из-за необходимости использовать в расчетах пространственные сетки с мелким шагом с целью уменьшения численной дисперсии. В этой работе представлен новый подход к сейсмическому моделированию, в котором волновые поля для всех источников моделируются на грубой сетке с относительно большим шагом по пространству. Небольшое количество синтетических сейсмограмм рассчитывается на сетке с шагом по пространству, достаточным для получения корректного результата моделирования. Эти данные используется для обучения искусственной нейронной сети (ИНС). Обученная ИНС используется далее для уменьшения численной дисперсии для волновых полей, рассчитанных на грубой сетке.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гадыльшина Ксения Александровна, Гадыльшин Кирилл Геннадьевич, Лисица Вадим Викторович, Вишневский Дмитрий Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEEP LEARNING-BASED NUMERICAL DISPERSION MITIGIATION IN SEISMIC MODELLING

Seismic modelling is the most computationally intense and time consuming part of seismic processing and imaging algorithms. Indeed, generation of a typical seismic data-set requires approximately 108 core-hours of a standard CPU-based clusters. Such a high demand in the resources is due to the use of fine spatial discretizations to achieve a low level of numerical dispersion (numerical error). This paper presents an original approach to seismic modelling where the wavefields for all sources (right-hand sides) are simulated inaccurately using coarse meshes. A small number of the wavefields are generated with computationally intense fine-meshes and then used as a training dataset for the Deep Learning algorithm - Numerical Dispersion Mitigation network (NDM-net). Being trained, the NDM-net is applied to suppress the numerical dispersion of the entire seismic dataset.

Текст научной работы на тему «ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПОДАВЛЕНИЯ ЧИСЛЕННОЙ ДИСПЕРСИИ В ЗАДАЧЕ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ ПОЛНЫХ ВОЛНОВЫХ СЕЙСМИЧЕСКИХ ПОЛЕЙ»

УДК 550.34.094

DOI: 10.33764/2618-981X-2021-2-2-17-25

ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПОДАВЛЕНИЯ ЧИСЛЕННОЙ ДИСПЕРСИИ В ЗАДАЧЕ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ ПОЛНЫХ ВОЛНОВЫХ СЕЙСМИЧЕСКИХ ПОЛЕЙ

Ксения Александровна Гадыльшина

Институт нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, инженер, тел.: (383)330-27-96, e-mail: gadylshinaka@ipgg.sbras.ru

Кирилл Геннадьевич Гадыльшин

Институт нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, к.ф.-м.н., старший научный сотрудник, тел.: (383)330-27-96, e-mail: gadylshinkg@ipgg.sbras.ru

Лисица Вадим Викторович

Институт математики им. С.Л. Соболева СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 4, доктор физико-математических наук, старший научный сотрудник, e-mail: LisitsaVV@ipgg.sbras.ru

Дмитрий Михайлович Вишневский

Институт нефтегазовой геологии и геофизики им. А.А. Трофимука СО РАН, 630090, Россия, г. Новосибирск, пр. Академика Коптюга, 3, научный сотрудник, тел.: (383)330-00-54, e-mail: VishnevskyDM@ipgg.sbras.ru

Численное моделирование требует большого объема вычислительных ресурсов. В этом смысле оно является одной из самых тяжелых процедур сейсмической обработки. Обычно создание набора сейсмических данных требует приблизительно 10Л8 ядро-часов на типичном вычислительном кластере. Такие высокие требования возникают из-за необходимости использовать в расчетах пространственные сетки с мелким шагом с целью уменьшения численной дисперсии. В этой работе представлен новый подход к сейсмическому моделированию, в котором волновые поля для всех источников моделируются на грубой сетке с относительно большим шагом по пространству. Небольшое количество синтетических сейсмограмм рассчитывается на сетке с шагом по пространству, достаточным для получения корректного результата моделирования. Эти данные используется для обучения искусственной нейронной сети (ИНС). Обученная ИНС используется далее для уменьшения численной дисперсии для волновых полей, рассчитанных на грубой сетке.

Ключевые слова: полноволновое моделирование, численная дисперсия, машинное обучение

DEEP LEARNING-BASED NUMERICAL DISPERSION MITIGIATION IN SEISMIC MODELLING

Kseniia A. Gadylshina

Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Akademika Koptyuga Ave., Novosibirsk, 630090, Russia Engineer, tel.: 8 (383) 330-27-96, e-mail: gadylshinaka@ipgg.sbras.ru

Kirill G. Gadylshin

Trofimuk Institute of Petroleum Geology and Geophysics SB RAS, 3, Akademika Koptyuga Ave., Novosibirsk, 630090, Russia, PhD, Senior Researcher, tel.: 8 (383) 330-27-96, e-mail: gadylshin@gmail.com

Vadim V. Lisitsa

Sobolev Institute of Mathematics SB RAS, 630090, Novosibirsk, Russia, 4, Akademika Koptyuga Ave, PhD, Senior Researcher, e-mail: LisitsaVV@ipgg.sbras.ru

Dmitry M. Vishnevsky

Akademika Koptyuga Ave, Researcher, tel.: 8 (383) 330-00-54, e-mail: VishevskyDM@ipgg.sbras.ru

Seismic modelling is the most computationally intense and time consuming part of seismic processing and imaging algorithms. Indeed, generation of a typical seismic data-set requires approximately 108 core-hours of a standard CPU-based clusters. Such a high demand in the resources is due to the use of fine spatial discretizations to achieve a low level of numerical dispersion (numerical error). This paper presents an original approach to seismic modelling where the wavefields for all sources (right-hand sides) are simulated inaccurately using coarse meshes. A small number of the wavefields are generated with computationally intense fine-meshes and then used as a training dataset for the Deep Learning algorithm - Numerical Dispersion Mitigation network (NDM-net). Being trained, the NDM-net is applied to suppress the numerical dispersion of the entire seismic dataset.

Keywords: seismic modelling, numerical dispersion, machine learning

Введение

Сейсмическое моделирование является инструментом исследования особенностей распространения сейсмических волн в реалистичных моделях земных недр [1], [2], [3], верификации алгоритмов обработки и инверсии сейсмических данных, а также как составляющая методов инверсии [4]. В то же время, моделирование распространения сейсмических волн в сложных средах - это одна из задач, требующих наиболее интенсивного использования высокопроизводительных вычислений. Например, если рассматривать типичную систему наблюдений, необходимо рассчитывать волновые поля для сотен тысяч сейсмических источников. Каждое моделирование сейсмограммы общего пункта возбуждения (ОПВ) выполняется в области размером около 10А3 км, что соответствует 100А3 длинам волн. Таким образом, для получения достаточно точных численных результатов необходимо до 8 ■ 10А9 узлов сетки. Уменьшение размерности задачи за счет увеличения шага сетки приводит к росту численной ошибки, что может полностью разрушить решение. Есть разные способы уменьшения численной дисперсии, например, использование разностных схем высокого порядка [5], схемы подавления дисперсии [6], методы конечных элементов высокого порядка и разрывные методы Галер-кина [7], [8], [9]. Однако, повышение точности решения не только требует больших затрат вычислительных ресурсов, но и может повлечь ошибки из-за частого обращения к ОЗУ и увеличение количества операций с плавающей точкой.

Другой способ уменьшить численную дисперсию в смоделированных волновых полях - это постобработка [10], [11]. Но необходимо отметить, что

стандартные процедуры коррекции формы волны, используемые при обработке сейсмических данных, неэффективны для уменьшения численной дисперсии. Ошибка, связанная с численной дисперсией, зависит от пути распространения волны, модели скорости и т.д. Таким образом, она не может быть компенсирована только однофазным сдвигом. В этой статье мы предлагаем подход к постобработке, основанный на методе глубокого обучения.

Метод глубокого обучения широко применяется в различных областях науки. Обучившись на большом репрезентативном наборе данных, глубокие искусственные нейронные сети могут аппроксимировать сложные нелинейные операторы в рамках контролируемого процесса обучения с учителем. Эти ИНС способны изучать нелинейную физику процесса и обычно обеспечивают гораздо более быстрые вычисления, чем традиционное моделирование [12], [13].

Для разработки эффективного алгоритма уменьшения численной дисперсии мы используем следующую особенность сейсмического моделирования. Полный набор сейсмических данных включает сейсмограммы, соответствующие различным положениям источников. Эти позиции относительно близки друг к другу (от 10 до 100 м друг от друга). Таким образом, скоростные модели и смоделированные волновые поля подобны, если источник расположен поблизости. Это позволяет использовать небольшое количество источников для моделирования точного решения, которое будет использоваться в качестве обучающего набора данных. В то же время мы можем смоделировать весь набор данных, используя достаточно грубую сетку, обучить глубокую нейронную сеть, а затем обработать данные (провести над данными постобработку).

1. Искусственная нейронная сеть для уменьшения численной дисперсии.

Сверточные ИНС обычно применяются для анализа визуальных образов. Особым случаем сверточных ИНС является сеть U-Net [14], которая изначально была изобретена для сегментации биомедицинских изображений. В настоящее время U-Net и ее модификации имеют широкое применение в сейсмической инверсии, обработке и интерпретации сейсмических данных до суммирования. В этой работе мы предлагаем использовать глубокую нейронную сеть N umerical Dispersion Mitigation (NDM-net) для изучения сопоставления синтетических сейсмических данных, смоделированных на грубой сетке, и данных, смоделированных на мелкой сетке. Другими словами, мы планируем устранить численную дисперсию с помощью ИИ. Архитектура сети аналогична представленной в [15]. Различия заключаются в использовании обычного сверточного слоя вместо частичных сверток и разных размерностей ввода/вывода, см. рис. 1. Эта ИНС содержит 16 сверточных слоев, восемь слоев повышающей дискретизации и восемь слоев конкатенации. Размеры входного и выходного тензоров 1250x512x2. Функция активации для первых восьми сверточных слоев (на которых происходит кодирование или извлечение признаков) - это ReLU. Последние восемь сверточных слоев (часть декодирования) имеют активацию LeakyReLu с отрицательным коэффициентом наклона, равным 0,2. Мы реализовали NDM-сеть в TensorFlow. Веса ИНС инициализированы случайным образом. В обучении использовался алгоритм стохастической оптимизации Адама.

В текущей реализации мы рассматриваем ввод/вывод как регулярные дис-кретизированные сейсмические данные до суммирования. Для обучения мы использовали каждую 10ю сейсмограмму ОПВ, рассчитанную на мелкой сетке, и ее искаженную версию, смоделированную на крупной сетке. Каждая сейсмограмма преобразуется в тензор размером 1250x512x2. Здесь 1250 - количество временных отсчетов в данных (дискретизация по времени 4 мс и время записи 5 с), 512 - количество приемников 2C, а 2 - количество записанных компонентов (вертикальная и горизонтальная составляющие скорости). Затем мы разбиваем этот набор данных на обучающий и проверочный наборы данных.

2. Численный эксперимент.

В нашем эксперименте мы рассматриваем модель с вертикальными высококонтрастными интрузиями, вызывающими латеральную неоднородность, как показано на рис. 2. Размер всей модели составлял 220 км на 2,6 км. В набор вошел 1901 источник с дистанцией между источниками 100 м. Волновое поле регистрировалось 512 приемниками для каждого источника с максимальным удалением от источника до приемника равным 6,4 км. Расстояние между приемниками - 25 м. В этом исследовании мы моделировали волновое поле без поверхностных волн, используя идеально согласованный слой для x<0. Источником вейвлета был импульс Рикера с центральной частотой 30 Гц.

Модель представлена на сетке с шагом 50 м по горизонтали и 5 м по вертикали. Мы вычислили три набора данных, используя схему на сдвинутых сетках четвертого порядка [5]. Решение, полученное на сетке с шагом 2,5 м, рассматривается как точное, в то время как два других, полученные с использованием сеток с пространственным шагом 5 м и 10 м, как неточные. Примеры данных сейсмограмм на рис. 3. Две NDM-сети обучались на двух синтетических наборах данных. Один был разработан для сопоставления данных, смоделированных для сетки с шагом 5 м, с точным решением (данные, полученные на сетке с шагом 2,5 м). Другая сеть NDM была обучена отображать 10м-данные на 2,5м-данные. Обучение проводилось на графическом процессоре Nvidia V100.

В качестве регуляризации использовалась техника ранней остановки, и обучение прерывалось, когда ошибка на проверочном наборе начинала расти. В обоих случаях (от 5 до 2,5 м и от 10 до 2,5 м) тренировочный процесс занял около 40 минут. Время прогнозирования составляет около 0,7 секунды для одной полной сейсмограммы ОПВ, в то время как одно прямое моделирование с использованием конечно-разностного подхода на графическом процессоре заняло около 40 секунд на сетке 2,5 м, и около 5 секунд на сетке 5 метров.

Чтобы оценить качество предсказания ИНС, мы используем нормализованное RMS (NRMS) в качестве меры сходства наборов данных. NRMS - это строгая метрика для каждой выборки, используемая для оценки повторяемости между двумя наборами данных в 4D сейсмике [16].

Приемлемый уровень NRMS в 4D сейсмике составляет около 20-40 процентов. Поскольку основная ошибка накапливается в позднем периоде, мы вычисляем NRMS для временного диапазона от 3 до 5 секунд (красный прямоугольник на рис. 4). Соответствующий график NRMS представлен на рис. 4. В среднем

NRMS между данными 2,5 м и 5 м составляет 65%. Применение NDM -net снизило NRSM до 30%. Среднее значение NRMS между 10-метровыми данными и 2,5-метровыми данными было около 120%, что означает, что 10-метровые данные чрезвычайно далеки от истинного решения. В результате ИНС удалось снизить NRMS до уровня 90%. Результат постобработки данных при помощи NDM -net проиллюстрирован на рис. 5.

3. Обсуждение и выводы.

В статье описан оригинальный метод уменьшения численной дисперсии синтетических сейсмограмм. Он включает в себя обычное конечно -разностное сейсмическое моделирование с последующей коррекцией данных на основе ИИ.

На первом этапе мы генерируем обучающий набор данных, моделирующий волновые поля, соответствующие не более чем 10% положений источников, с использованием достаточно точной пространственной дискретизации (до 20 точек на минимальную длину волны - ppw). Затем создается полный набор данных с использованием грубой сетки не более 3-5 ppw. И, в конце концов, NDM-сеть обучается уменьшать численную дисперсию в решении на крупной сетке. После этого NDM-net применяется для исправления всего набора данных. Представленные результаты демонстрируют способность NDM-net делать качественный прогноз сейсмических данных с использованием синтетики, сгенерированной на грубой сетке.

Рис. 1. Архитектура КОМ-пе!. Черные стрелки вправо изображают оператор свертки, красные стрелки - конкатенация. Стрелки вверх и вниз изображают операторы повышающей дискретизации и пакетной нормализации соответственно

Рис. 2. Изотропная упругая модель, используемая для расчёта синтетических сейсмограмм. Красным изображено положение источника для x= 120км

12.8 кт

Рис. 3. Сейсмограмма, рассчитанная для источника, расположенного в точке x=120км: вертикальная компонента скорости, рассчитанная на сетке с шагами

2.5м (А), 5м (Б) и 10м (С)

Рис. 4. NRMS рассчитанный между сейсмограммами для сеток 2.5м и 5м (А), 2.5м и ИНС прогнозом 5м (B) , между данными 2.5м и 10м (D), 2.5м и ИНС прогнозом 10м (E) и соответствующие гистограммы (C,F). NRMS рассчитан в окне, изображенном красным на рис. 3 (поздние вступления)

Рис. 5. Сейсмические трассы для разных положений приемников и соответствующий ИНС прогноз для случая 5м-данных (А, B) и 10м-данных (С, Б). Черным изображены трассы на сетке 2.5м, красным - входные данные для ИНС и синим - ИНС прогноз

Благодарности

Д.М. Вишневский выполнил все эксперименты по численному моделированию волновых полей. В.В. Лисица подготовил обучающий набор для ИНС при поддержке Российского Научного Фонда грант №2 21-71 -20003. К.А. Гадыльшина выполнила обучение NDM-net при финансовой поддержке РФФИ и ЧНФ в рамках научного проекта №20-55-26003. К.Г. Гадыльшин разработал архитектуру NDM-net при поддержке Российского Научного Фонда грант № 21-71-20002. Численные расчёты были получены с использованием вычислительных ресурсов суперкомпьютерного центра Санкт-Петербургского политехнического университета Петра Великого (scc.spbstu.ru). Acknowledgments: The reported study was funded by RFBR and GACR, project number 20-55-26003.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Zhu, J., Ren, M., Liao, Z.: Wave propagation and diffraction through non-persistent rock joints: An analytical and numerical study. International Journal of Rock Mechanics and Mining Sciences 132, 104362 (2020)

2. Chen, G., Song, L., Liu, L.: 3d numerical simulation of elastic wave propagation in discrete fracture network rocks. Pure and Applied Geophysics 176(12), 5377-5390 (2019)

3. Lisitsa, V., Kolyukhin, D., Tcheverda, V.: Statistical analysis of free-surface variability's impact on seismic wavefield. Soil Dynamics and Earthquake Engineering 116, 86-95 (2019)

4. Virieux, J., Calandra, H., Plessix, R.E.: A review of the spectral, pseudo-spectral, finite-difference and finite-element modelling techniques for geophysical imaging. Geophysical Prospecting 59(5), 794-813 (2011). https://doi.org/10.1111/j.1365-2478.2011.00967.x

5. Levander, A.R.: Fourth-order finite-difference p-sv seismograms. Geophysics 53(11), 14251436 (1988)

6. Liu, Y.: Optimal staggered-grid finite-difference schemes based on least-squares for wave equation modelling. Geophysical Journal International 197(2), 1033-1047 (2014)

7. Kaser, M., Dumbser, M.: An arbitrary high-order discontinuous galerkin method for elastic waves on unstructured meshes - i. the two-dimensional isotropic case with external source terms. Geophysical Journal International 166(2), 855-877 (2006)

8. Baldassari, C., Barucq, H., Calandra, H., Diaz, J.: Numerical performances of a hybrid local-time stepping strategy applied to the reverse time migration. Geophysical Prospecting 59(5), 907919 (2011). https://doi.org/10.1111/j.1365-2478.2011.00975.x

9. Lisitsa, V., Tcheverda, V., Botter, C.: Combination of the discontinuous galerkin method with finite differences for simulation of seismic wave propagation. Journal of Computational Physics 311, 142-157 (2016)

10. Xu, Z., Jiao, K., Cheng, X., Sun, D., King, R., Nichols, D., Vigh, D.: Time-dispersion filter for finite-difference modeling and reverse time migration, pp. 4448-4452 (2017)

11. Koene, E., Robertsson, J.: Removing numerical dispersion artifacts from reverse time migration and full-waveform inversion, pp. 4143-4147 (2017)

12. Guo, X., Li, W., Iorio, F.: Convolutional neural networks for steady flow approximation. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD '16, San Francisco, CA, USA. pp. 481-490 (2016). https://doi. org/https://doi.org/10.1145/2939672.2939738

13. Moseley, B., Nissen-Meyer, T., Markham, A.: Deep learning for fast simulation of seismic waves in complex media. Solid Earth 11, 1527-1549 (2020)

14. Ronneberger, O., Fischer, P., Brox, T.: U-net: Convolutional networks for biomedical image segmentation. In: Medical Image Computing and Computer-Assisted Intervention (MICCAI).

LNCS, vol. 9351, pp. 234-241. Springer (2015), http://lmb.informatik.uni-freiburg.de/Publica-tions/2015/RFB15a

15. Gadylshin, K., Silvestrov, I., Bakulin, A.: Inpainting of local wavefront attributes using artificial intelligence for enhancement of massive 3-d prestack seismic data. Geophysical Journal International 223, 1888-1898 (2020)

16. Kragh, E., Christie, P.: Seismic repeatability, normalized rms, and predictability. The Leading Edge 21(7), 640-647 (2002)

© К. А. Гадыльшина, К. Г. Гадыльшин, В. В. Лисица, Д. М. Вишневский, 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.