Электронный научный журнал "Математическое моделирование, компьютерный и натурный эксперимент в естественных науках" http://mathmod.esrae.ru/ URL статьи: mathmod.esrae.ru/45-181 Ссылка для цитирования этой статьи:
Иванов Д.А. Виды нейронных сетей для анализа данных ультразвукового неразрушающего контроля // Математическое моделирование, компьютерный и натурный эксперимент в естественных науках. 2024. №1_
ВИДЫ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АНАЛИЗА ДАННЫХ УЛЬТРАЗВУКОВОГО НЕРАЗРУШАЮЩЕГО КОНТРОЛЯ
Иванов Д.А.
Саратовский государственный технический университет имени Гагарина Ю.А.,
Россия, Саратов, [email protected]
TYPES OF NEURAL NETWORKS FOR ANALYSIS OF ULTRASONIC NON-DESTRUCTIVE TESTING DATA
Аннотация. В настоящее время большую значимость для промышленных объектов имеет проведение ультразвукового неразрушающего контроля, так как данная процедура помогает идентифицировать дефекты и предотвратить появление новых в будущем без остановки производственных процессов. При этом существует необходимость в расшифровке результатов, которые способны дать нейросетевые технологии. В данной статье рассмотрены основные методы нейронных сетей, которые способны обрабатывать данные ультразвукового неразрушающего контроля.
Ключевые слова: ультразвуковой неразрушающий контроль, нейронные сети, машинное обучение.
Abstract. Currently, ultrasonic non-destructive testing is of great importance for industrial facilities, since this procedure helps to identify defects and prevent the appearance of new ones in the future without stopping production processes. At the same time, there is a need to decipher the results that neural network technologies can produce. This article discusses the main methods of neural networks that are capable of processing ultrasonic non-destructive testing data.
Keywords: ultrasonic non-destructive testing, neural networks, machine learning.
На сегодняшний день зачастую возникает потребность в проведении проверки различных промышленных объектов, как в процессе рабочего цикла объекта, так и перед вводом его в эксплуатацию на наличие дефектов и неисправностей. При этом важно сохранять работоспособность объекта во
УДК 532.517.2:539.3
DOI: 10.24412/2541 -9269-2024-1-18-25
Ivanov D.A.
Yuri Gagarin State Technical University of Saratov, Russia, Saratov, [email protected]
время выполнения проверки. Для этих целей существует ультразвуковой неразрушающий контроль, который позволяет исследовать объект, не останавливая производственные процессы. Однако существует проблема грамотной и достоверной расшифровки результатов проведения контроля. В этом случае имеется возможность использовать методы машинного обучения для получения результатов, которые обладают высокой точностью. На данный момент существует достаточное количество видов нейронных сетей, многие из которых способны выполнять задачу по обработке результатов ультразвуковых сигналов. В то же время важным вопросом остаётся выбор конкретной нейросети, которая будет отвечать поставленным требованиям в зависимости от конечной цели проведения контроля.
Для обработки результатов ультразвукового неразрушающего контроля могут применяться следующие виды нейронных сетей: сверточная, перцептрон, рекуррентная и сеть долгой краткосрочной памяти. Рассмотрим характеристики каждого вида нейросетей.
Сверточные нейронные сети.
Сверточная нейронная сеть хорошо подходит для обработки изображений, а также распознавания и классификации образов на изображениях и видеоматериалах. Классическая сверточная нейронная сеть состоит из операций свёртки и пулинга. Структура нейросети изображена на Рис. 1.
Рис. 1. Структура свёрточной нейронной сети
На этапе свертки ядро фильтра (матрица ограниченного размера) перемещается на определённый заданный шаг по изображению и производит умножение каждого элемента матрицы ядра на элемент входного изображения после чего получившиеся элементы суммируются. Данная операция повторяется для всех заданных ядер и на выходе формируются различные матрицы для каждого ядра. После операции свёртки следует операция пулинга, главной задачей которой является уменьшение размерности получившихся
матриц за счёт операций отбора наивысших, наименьших или средних значений для окна определенного размера. В результате этой операции из исходных матриц для каждого ядра будут получены матрицы меньшего размера с значениями, зависящими от выбранной операции и размера окна. Данный процесс повторяется до тех пор, пока каждый выходной элемент не станет размерностью в одно или заданное число значений. В итоге возможно определить вероятность принадлежности изображения к какому-либо классу [1]. В области неразрушающего контроля сверточные нейронные сети получили широкое распространение благодаря тому, что с их помощью можно идентифицировать и визуализировать повреждения и дефекты. На данный момент имеется достаточно работ по идентификации дефектов с помощью данного вида нейросетей. Зачастую идентификация дефектов фиксируется на основе полученных спектрограмм сигналов и последующих слоев свертки, пулинга и полносвязного слоя. В результате применения этих операций удается определить наличие дефекта и его геометрические размеры. Также сверточные нейронные сети способны и визуализировать дефекты, в этом случае на вход нейросети подается ультразвуковой сигнал, который проходит операции свертки и пулинга. Затем данные попадают на полносвязный слой, а после прохождения ряда обучаемых слоев происходит генерация выходного изображения [2]. Однако стоит учесть, что для высокой точности работы сверточной нейронной сети необходимо довольно большое количество входных данных и потребляемых ресурсов.
Перцептрон.
Перцептрон состоит из входного, скрытого и выходного слоёв. Структура нейросети изображена на Рис. 2.
Б
Рис. 2. Структура перцептрона, где Б - входной слой, А - скрытый слой, Я - выходной слой, у(1, ]) - веса связей
Входной слой ^-элементы) представляет собой набор нейронов, которые принимают значения 0 или 1, данные элементы также называют сенсорами или рецепторами. Скрытый слой (А -элементы) представляет собой набор элементов, которые связаны с входными элементами. Один элемент скрытого слоя может быть связан сразу с несколькими элементами входного слоя. Скрытый слой может быть один и более одного, архитектуры таких нейронных сетей будут называться однослойными и многослойными соотвественно. Выходной слой представляет собой набор элементов, которые называют сумматорами ^-элементы). Данные элементы связаны с элементами скрытого слоя, причём веса связей этих элементов могут быть любыми. R-элементы необходимы для того, чтобы просуммировать и вычислить выходное значение, которое может определять, например принадлежность исследуемых элементов к каким-либо классам или наличие того или иного признака в исследуемом объекте [3]. В области неразрушающего контроля с помощью перцептрона имеется возможность проводить исследование на обнаружение дефектов в различных материалах. В этом случае входными данными для обучения моделей могут быть как данные ультразвукового сигнала, прошедшего через исследуемый объект, так и изображения. Построенная модель должна пройти определенное число этапов обучения, после чего при прохождении проверки точности определения дефектов её можно использовать в последующих материалах и объектах. Перцептрон довольно прост в реализации, но не всегда способен правильно определять сложные виды дефектов.
Рекуррентные нейронные сети.
Рекуррентная нейронная сеть также состоит из входного, скрытого и выходного слоёв за тем исключением, что в данном случае скрытый слой представляет собой набор обратных связей, которые обеспечивают рекуррентность. Общая структура нейросетн изображена на Рис. 3.
Рис. 3. Общая структура рекуррентной нейронной сети, где х - входные
данные, RNN - слой обработки, у - выходные данные Данную схему можно развернуть в вид, который изображен на Рис. 4.
Рис. 4. Развёрнутая структура рекуррентной нейронной сети, где х^) -входные значения, у^) - выходные значения, А - обработка данных в скрытом слое, Ь^) - выходные значения скрытого слоя
Здесь можно увидеть каждый этап работы нейросети. Входные данные представляют собой величины, которые содержат информацию на конкретный временной этап. На каждом этапе работы нейросети вычисляется выходное значение для скрытого слоя, на которое влияют входные данные, а также выходные данные с предыдущей итерации сети данного слоя. В конечном счёте с помощью выходных значений для каждой итерации скрытого слоя вычисляется итоговое выходное значение [4]. Благодаря такой работе с данными рекуррентные нейронные сети хорошо подходят для работы с последовательными событиями. Существуют несколько подходов для построения архитектуры сети: «многие ко многим», «многие к одному», «один ко многим», «один к одному». Для каждого подхода учитываются количество входных и выходных значений. На Рис. 4 изображена архитектура «многие ко многим» [5]. Выбор определенной архитектуры зависит от типа решаемой задачи. Для обработки данных неразрушающего контроля входными значениями могут служить ультразвуковые сигналы. Данные сигналы можно разбить на разные промежутки времени и обрабатывать последовательно, при этом учитываться будут не только новые значения, но и уже обработанные. Так как предыдущие результаты не отбрасываются подобная обработка может дать более высокий процент точности при определении наличия и размеров дефектов. Выходными значениями будут являться наличие или отсутствие дефекта и размеры дефекта при его наличии. При этом также необходимо пройти валидацию и период обучения.
Долгая краткосрочная память (LSTM).
LSTM является разновидностью рекуррентной нейронной сети.
Важнейшей отличительной особенностью данного подвида нейронных сетей является способность сохранять в долгосрочной памяти важную для работы информацию и удалять второстепенную, что значительно повышает точность прогноза необходимого значения. Схема работы LSTM сети изображена на Рис. 5.
Рис. 5. Структура долгой краткосрочной памяти, где А - предыдущая итерация обработки, х^) - входные значения, Ь^) - выходные значения, а -сигмоидальная функция, tanh - гиперболический тангенс, + - поэлементное сложение, х - поэлементное умножение
В отличие от простейшей рекуррентной нейронной сети часть обработки данных состоит сразу из четырёх компонентов:
• состояние ячейки - запоминает и передаёт долгосрочную информацию по всей цепочке обрабатывающих модулей;
• входной фильтр - отвечает за количество вхождения новой информации в память сети;
• фильтр забывания - отвечает за выбор необходимой для сохранения в памяти информации;
• выходной фильтр - отвечает за соответствие значения в памяти для расчёта выходного значения.
Изначально новая информация вместе с информацией предыдущей итерации поступает на фильтр забывания, в котором решается какие значения необходимо оставить, а какие отбросить (первый сигмоидальный слой). На следующем этапе происходит обновление необходимой информации, а также добавление подходящих новых значений в состояние ячейки (второй сигмоидальный слой, tanh слой, поэлементные сложение и умножение). На последнем шаге формируются выходные данные, которые проходят через несколько фильтров и затем передаются дальше по цепочке (последний
сигмоидальный слой, вычисление tanh и их поэлементное умножение) [6]. Как и в случае с простейшими рекуррентными сетями входными значениями для LSTM сети могут служить данные ультразвуковой дефектоскопии. Помимо обнаружения наличия дефектов и их размеров данный вид нейронных сетей хорошо подходит для прогнозирования появления дефектов в будущем, а также прогнозирования срока службы того или иного материала в зависимости от его состояния. Стоит отметить, что для высокой точности результатов необходимо довольно большое количество данных и тщательная настройка всех компонентов обработки, что может быть непростой задачей.
В результате были рассмотрены 4 метода нейронных сетей, которые способны работать над расшифровкой результатов данных ультразвукового неразрушающего контроля. Каждый из методов имеет свои достоинства и недостатки, при этом они подходят для различного типа обработки полученной информации:
• свёрточная нейронная сеть хорошо подходит для обработки изображений, а также позволяет визуализировать дефекты, полученные в ходе проведения контроля;
• перцептрон является довольно простым и не требовательным в реализации, но не всегда способен определять дефекты с необходимой точностью;
• рекуррентная нейронная сеть и LSTM являются сравнительно непростыми в реализации, а также требуют большого количества данных для анализа, но способны достаточно точно определять наличие дефектов и его размеры. Сеть долгой краткосрочной памяти в дополнение к этому справляется с прогнозированием появления новых дефектов и определения срока службы материала с учётом уже имеющихся повреждений.
Выбор определённой нейронной сети должен проводиться в зависимости от конечной цели проведения проверки материала и количества ресурсов, которые могут быть использованы при обработке информации.
Литература
1. Гудфеллоу, Я. Глубокое обучение / Я. Гудфеллоу, И. Бенджио, А. Курвилль ; перевод с английского А. А. Слинкина. — 2-е изд. — Москва : ДМК Пресс, 2018. — 652 с. — ISBN 978-5-97060-618-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/107901 (дата обращения: 19.01.2024). — Режим доступа: для авториз. пользователей.
2. Васильев, П. В. Визуализация внутренних дефектов с применением глубокой генеративной нейросетевой модели и ультразвукового неразрушающего контроля / П. В. Васильев, А. В. Сеничев, И. Джорджо // Advanced Engineering Research. — 2021. — Т. 21, № 2. — С. 143-153
3. Паттерсон, Д. Глубокое обучение с точки зрения практика / Д. Паттерсон, А. Гибсон. — Москва : ДМК Пресс, 2018. — 418 с. — ISBN 978-5-97060-481-6.
— Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/116122 (дата обращения: 19.01.2024). — Режим доступа: для авториз. пользователей
4. Гольдберг, Й. Нейросетевые методы в обработке естественного языка : руководство / Й. Гольдберг ; перевод с английского А. А. Слинкина. — Москва : ДМК Пресс, 2019. — 282 с. — ISBN 978-5-97060-754-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131704 (дата обращения: 19.01.2024). — Режим доступа: для авториз. пользователей
5. URL: https://neerc.ifmo.ru/wiki/mdex.php?titie= Рекуррентные_нейронные_сети (Дата обращения 19.01.2024);
6. Антонио, Д. Библиотека Kerns - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / Д. Антонио, П. Суджит ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2018. — 294 с. — ISBN 978-5-97060-573-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/111438 (дата обращения: 19.01.2024). — Режим доступа: для авториз. пользователей.