Научная статья на тему 'ВЫБОР ДЕСКРИПТОРОВ АКУСТИЧЕСКОГО СИГНАЛА ДЛЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ ВЫБРОСА МЕТАЛЛА В АГРЕГАТЕ «КОВШ-ПЕЧЬ»'

ВЫБОР ДЕСКРИПТОРОВ АКУСТИЧЕСКОГО СИГНАЛА ДЛЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ ВЫБРОСА МЕТАЛЛА В АГРЕГАТЕ «КОВШ-ПЕЧЬ» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
26
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АКУСТИЧЕСКИЙ КОНТРОЛЬ / ДЕСКРИПТОРЫ ЗВУКОВОГО СИГНАЛА / MFCC / ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мартюгов А. С., Ершов Е. В., Виноградова Л. Н., Варфоломеев И. А.

В данной статье рассмотрен процесс выбора дескрипторов акустического сигнала для задачи прогнозирования выбросов металла в агрегате «ковш-печь». Проведён анализ методов выделения значащих признаков аудиосигнала, сформированы критерии оптимального дескриптора для задачи прогнозирования выброса. Описан алгоритм распознавания с применением выбранного дескриптора звукового сигнала.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мартюгов А. С., Ершов Е. В., Виноградова Л. Н., Варфоломеев И. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SELECTION OF ACOUSTIC SIGNAL DESCRIPTORS FOR THE PROBLEM OF FORECASTING METAL EJECTION IN A LADLE-FURNACE UNIT

This article discusses the process of selecting acoustic signal descriptors for the problem of predicting metal ejection in a ladle-furnace unit. The analysis of methods for extracting significant features of an audio signal is carried out; criteria for the optimal descriptor for the problem of ejection prediction are set up. The authors describe the recognition algorithm applying the selected audio signal descriptor.

Текст научной работы на тему «ВЫБОР ДЕСКРИПТОРОВ АКУСТИЧЕСКОГО СИГНАЛА ДЛЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ ВЫБРОСА МЕТАЛЛА В АГРЕГАТЕ «КОВШ-ПЕЧЬ»»

Вестник Череповецкого государственного университета. 2023. № 3 (114). С. 19-30. Cherepovets State University Bulletin, 2023, no. 3 (114), pp. 19-30.

Научная статья УДК 004.93

https://doi.org/10.23859/1994-0637-2023-3-114-2

Выбор дескрипторов акустического сигнала для задачи прогнозирования выброса металла в агрегате «ковш-печь»

Артём Сергеевич Мартюгов10, Евгений Валентинович Ершов20, Людмила Николаевна Виноградова3, Игорь Андреевич Варфоломеев4

1,2,3,4 Череповецкий государственный университет,

Череповец, Россия

1Hmartyugov@bk.ru, https://orcid.org/0000-0002-4675-3679 2Heve@chsu.ru, https://orcid.org/0000-0003-2888-4242 3lnvinogradova@bk.ru, https://orcid.org/0000-0001-9395-998X

4igor.varf@gmail.com

Аннотация. В данной статье рассмотрен процесс выбора дескрипторов акустического сигнала для задачи прогнозирования выбросов металла в агрегате «ковш-печь». Проведён анализ методов выделения значащих признаков аудиосигнала, сформированы критерии оптимального дескриптора для задачи прогнозирования выброса. Описан алгоритм распознавания с применением выбранного дескриптора звукового сигнала.

Ключевые слова: акустический контроль, дескрипторы звукового сигнала, MFCC, программно-аппаратный комплекс

Для цитирования: Мартюгов А. С., Ершов Е. В., Виноградова Л. Н., Варфоломеев И. А. Выбор дескрипторов акустического сигнала для задачи прогнозирования выброса металла в агрегате «ковш-печь» // Вестник Череповецкого государственного университета. 2023. № 3 (114). С. 19-30. https://doi.org/10.23859/1994-0637-2023-3-114-2.

Selection of acoustic signal descriptors for the problem of forecasting metal ejection in a ladle-

furnace unit

Artyom S. Martyugov10, Evgeny V. Ershov20, Ludmila N. Vinogradova3, Igor A. Varfolomeev4

1,2,3,4 Cherepovets State University, Cherepovets, Russia

10martyugov@bk.ru, https://orcid.org/0000-0002-4675-3679 20eve@chsu.ru, https://orcid.org/0000-0003-2888-4242 3lnvinogradova@bk.ru, https://orcid.org/0000-0001-9395-998X

4igor.varf@gmail.com

Abstract. This article discusses the process of selecting acoustic signal descriptors for the problem of predicting metal ejection in a ladle-furnace unit. The analysis of methods for extracting significant

Мартюгов А. С., Ершов Е. В., Виноградова Л. Н., Варфоломеев И. А., 2023

©

features of an audio signal is carried out; criteria for the optimal descriptor for the problem of ejection prediction are set up. The authors describe the recognition algorithm applying the selected audio signal descriptor.

Keywords: acoustic control, audio signal descriptors, MFCC, software and hardware complex For citation: Martyugov A. S., Ershov E. V., Vinogradova L. N., Varfolomeev I. A. Selection of acoustic signal descriptors for the problem of forecasting metal ejection in a ladle-furnace unit. Cherepovets State University Bulletin, 2023, no. 3 (114), pp. 19-30. https://doi.org/10.23859/1994-0637-2023-3-114-2.

Введение

Черная металлургия представляет собой одну из наиболее важных отраслей промышленного производства, успешное развитие которой определяет развитие индустриального потенциала любого государства. Это комплексная отрасль, включающая в себя добычу, обогащение, выплавку металлов и производство металлопроката. Основным сырьем для чёрной металлургии является железная руда, из которой изготавливаются чугун и сталь.

Продукция предприятий черной металлургии особенно активно используется в машиностроении и строительстве. В этой связи данная отрасль становится системообразующей, а от степени ее развития во многом зависит и состояние промышленного производства в целом.

Важнейшим этапом производственной цепочки по изготовлению стальной продукции является выплавка стали. Один из ключевых агрегатов обработки стали -агрегат «ковш-печь». Агрегат «ковш-печь» оказывается частью единой технологической схемы, которая включает дуговые печи, конвертеры и мартены. Его задача: довести металл в ковше, полученный из плавильного агрегата, до нужной температуры и химического состава.

На этапе доводки металла на специальной установке его сначала продувают в течение короткого времени. Затем измеряют температуру и окисленность металла. Исходя из содержания кислорода в металле, вводят определенное количество проволоки из алюминия. Далее добавляют восстановительный шлак с известью и плавиковым шпатом. После получения жидкого шлака его раскисляют алюминием. Весь процесс занимает около 5 минут.

Когда закончена наводка шлака, через 3 минуты берут пробы металла и шлака, а затем измеряют их температуру. По результатам анализа производят основную корректировку химического состава и добавляют необходимое количество раскисляющих и легирующих присадок, чтобы получить определенное содержание элементов. Затем металл перемешивают не менее 5 минут. После этого берется новая проба металла и, при необходимости, проводят дополнительную корректировку химического состава и температуры стали. Высокоактивные элементы в виде порошковой проволоки добавляют только после завершения последнего цикла нагрева.

Выброс - это явление, когда нестабильность в процессе производства стали может привести к выплескиванию расплавленного металла из агрегата. Это негативно сказывается на качестве металла, приводит к потерям производительности и угрозе жизни, здоровью персонала, а также к повреждениям оборудования. Кроме того, вы-

брос может привести к потере ценного металла, что повлияет на экономический результат производства. Поэтому необходимо следить за стабильностью процесса продувки металла, чтобы предотвратить выбросы.

Для предотвращения выброса используют алюминиевую смесь, которую добавляют заблаговременно в процесс плавки. Опытный оператор установки может, основываясь на звуке, определить предстоящий выброс металла и принять меры по его предотвращению. Однако использование органолептического метода не всегда достоверно, так как зависит от личного опыта оператора и высокой напряженности его работы.

В таких условиях разработка метода и алгоритмов обработки акустической информации для прогнозирования выбросов металла является актуальной научно-технической задачей.

Основная часть

Предлагаемый к рассмотрению метод контроля основан на отличиях в акустических сигнатурах агрегата «ковш-печь» в стабильном режиме работы и в момент перед выбросом.

В основе метода диагностики лежит многошаговая обработка акустической информации, состоящая из следующих этапов:

1. Сбор сигнала и его буферизация.

2. Предобработка - удаление шумов.

3. Извлечение признаков.

4. Классификация на основе алгоритмов машинного обучения.

Первый этап - сбор сигнала и его буферизация. Сбор аудиосигнала осуществляется при помощи портативного микрофона, буферизация происходит путём сохранения записанных аудиофайлов на внешний носитель.

Второй этап - удаление шумов. Для этого используют фильтры pre-emphasis и оконное взвешивание. Pre-emphasis фильтры помогают сгладить спектр сигнала, усиливая слабые и высокие частоты. Это делает сигнал менее чувствительным к шумам окружающей среды. Таким образом, после этого этапа сигнал становится более чистым и легче поддается анализу.

Оконное взвешивание применяется для предотвращения просачивания спектра боковых лепестков, связанного с формой спектра функции прямоугольного окна, которое может возникнуть при разбиении сигнала на участки и его переходе в частотную область. Чтобы сократить влияние этого эффекта, используют взвешивание исходного сигнала различными окнами с формами, отличными от прямоугольной. Это влечет за собой обнуление значений сигнала на краях выборки. Окна Хэмминга, Блэкмэна, прямоугольное или плоское окно, являются часто используемыми взвешенными функциями. В предложенной модели используется окно Хэмминга.

Третий этап - выделение дескрипторов, наиболее информативных параметров звукового сигнала. В качестве дескриптора могут применяться различные параметры аудиосигнала, и выбор наиболее подходящего параметра влияет на весь дальнейший процесс распознавания.

Как правило, для распознавания звука применяются четыре способа получения дескрипторов, каждый из них имеет как преимущества, так и недостатки. При разработке системы прогнозирования, определяющими факторами для выбора дескриптора стали точность и полнота прогноза.

Статистика во временной области

ZCR (Zero crossing rate) - это количество раз, когда сигнал пересекает нулевую линию за единицу времени. Этот показатель используется для анализа акустических сигналов при обработке речи и в музыкальных приложениях. Колебание волны аудиосигнала можно представить в виде графика, который пересекает нулевую линию при прохождении кратеров и холмов. Как правило, более насыщенные и сложные аудиофайлы имеют и более высокий уровень пересечения нулевой линии из-за частотных биений и интермодуляционных явлений.

Zero crossing rate может быть рассчитан путем подсчета пересечений нулевой линии волновой формы аудиосигнала за единицу времени. Для расчета этого показателя необходимо выполнить следующие шаги:

1. Преобразовать аудиосигнал в последовательность чисел, представляющих значения амплитуды волны.

2. Разбить сигнал на фиксированные временные интервалы.

3. Для каждого интервала вычислить количество пересечений нулевой линии через сравнение значений амплитуды с предыдущим интервалом.

4. Рассчитать среднее значение количества пересечений нулевой линии за единицу времени для всего аудиофайла.

Из всех рассматриваемых способов вычисления дескрипторов статистика во временной области является наиболее простой. Однако результаты прогнозирования при использовании этого дескриптора оказываются не очень высокими. В ходе проведённых проверок выяснилось, что ZCR дескрипторы могут гарантировать точность не более 58 %, при этом полнота прогноза составляет всего 63 %. Такие параметры модели были признаны неудовлетворительными, от применения ZCR в разрабатываемой системе прогноза решено было отказаться.

Статистика в частотной области

Статистика в частотной области - это анализ спектрального содержания сигнала, который представляет собой распределение амплитуд по частотам. В частотной области анализируются спектрограммы или спектры сигналов, которые позволяют оценить частотные характеристики сигнала.

На основе статистики в частотной области можно выделить следующие характеристики сигнала:

1. Средняя частота - это частота, которая получается путем усреднения частот, взвешенных их амплитудами.

2. Ширина спектра - это разница между минимальной и максимальной частотой, на которых находятся значительные компоненты спектра.

3. Спектральный динамический диапазон - это отношение максимальной амплитуды спектра к минимальной амплитуде спектра.

4. Спектральная плотность мощности - это показатель, который позволяет определить, какая часть энергии сосредоточена в определенном диапазоне частот.

Статистика в частотной области вычисляется на основе спектра. Чтобы получить спектр, необходимо выполнить преобразование Фурье от исходного сигнала, которое позволяет перевести сигнал из временной области в частотную.

После получения спектра происходит вычисление различных статистических характеристик, таких как средняя частота и ширина спектра.

Среднюю частоту можно вычислить, умножив каждую частоту из спектра на ее амплитуду и разделив сумму на общую сумму амплитуд.

Ширина спектра определяется как разница между максимальной и минимальной частотами характерных компонент спектра.

Спектральный динамический диапазон можно определить как отношение максимальной амплитуды спектра к минимальной амплитуде спектра.

Спектральную плотность мощности можно определить как квадрат модуля значения спектра, разделенного на ширину полосы частот.

Дескрипторы, полученные при помощи статистики в частотной области, показали лучший результат по сравнению с ZCR. В ходе проверки этих дескрипторов удалось повысить точность модели до 79 %, однако полнота прогноза при этом не превышала 71 % для отдельных выборок, а в большинстве случаев 67 %. Аналогично предыдущему типу дескрипторов такие результаты работы модели были признаны неудовлетворительными, и было принято решение о рассмотрении других типов дескрипторов.

LPC

Linear prediction coefficient (LPC) - это метод анализа сигналов, который позволяет аппроксимировать входной сигнал линейной комбинацией его предыдущих значений. Эти значения называются коэффициентами прогнозирования и соответствуют весам предыдущих значений, используемых при аппроксимации сигнала.

Математические алгоритмы LPC основаны на минимизации ошибки при аппроксимации сигнала. Один из наиболее широко используемых алгоритмов для определения коэффициентов прогнозирования - это метод Бурга (Burg's method), который основан на моделировании авторегрессии (AR).

Linear prediction coefficient (LPC) широко используется в задачах распознавания звука и речи. Это объясняется тем, что процесс распознавания звука связан с анализом спектральных характеристик сигнала, а именно с определением частотных составляющих и их амплитуд. Используя метод LPC, мы можем построить модель сигнала, на основе которой можно оценить его спектральные характеристики.

В таких системах, как автоматическое распознавание речи (Automatic Speech Recognition, ASR), используются несколько методов, основанных на LPC:

1. Методы спектрального анализа: эти методы основаны на анализе спектральных характеристик речи, таких как фонемные форманты и другие огибающие спектра. Используя модель LPC, мы можем выделить эти характеристики и использовать их для распознавания фонем и слов.

2. Методы векторного квантования связаны с применением LPC для определения оптимального кода, который используется для представления речевого сигнала в компактном виде. Это позволяет снизить объем информации, сохраняя при этом достаточно высокую точность распознавания.

3. Методы глобальной оптимизации основаны на определении оптимальной модели LPC, которая минимизирует ошибку распознавания. Это обычно достигается с помощью вариационных методов или алгоритмов на основе градиентного спуска.

В целом, метод LPC отлично показал себя для всех проверяемых классификаторов, особенно удачными были результаты в комбинации LCP дескрипторов и SVM классификатора. В этом случае полнота достигала 95 %, а точность 84 %. Данные результаты уже позволяли использовать систему прогнозирования на практике, однако было принято решение проверить ещё один перспективный тип дескрипторов сигнала, а именно мел-частотные кепстральные коэффициенты.

MFCC - Mel-frequency cepstral coefficients

MFCC, или Mel-frequency cepstral coefficients, - это коэффициенты, обычно получаемые при анализе речевых или звуковых сигналов. Они используются для представления спектрограммы звуковой волны в виде векторов функций. Основная идея MFCC заключается в том, чтобы максимально близко приблизить то, как воспринимается звук человеческим ухом.

MFCC начинаются с разбиения входного звукового сигнала на кадры, которые затем проходят через преобразование Фурье для получения спектрограммы. Далее используется фильтр Мела, который дает более точное представление того, как звук воспринимается человеческим ухом. Наконец, для получения коэффициентов MFCC используется кепстральное преобразование, которое распределяет энергии по частотам в звуковой волне.

Зависимость высоты воспринимаемого звукового сигнала от его частоты описывается формулой (1):

где т - высота звука в Мелах; / - частота в герцах.

В ходе вычисления МБСС используется машинное вычисление преобразования Фурье. При таком способе возникают сложности, связанные с необходимостью суммировать бесконечный ряд чисел. Поэтому в реальных вычислениях был использован дискретный и быстрый тип вычисления. Быстрое вычисление является оптимизированной версией дискретного. Его рассчитывают по формуле (2):

(1)

, k = 0, N -1,

(2)

где N - размерность дискретного отрезка сигнала; Xk - амплитуда синусоидальных сигналов, которые составляют основной сигнал.

Для анализа данных недостаточно просто рассмотреть спектр сигнала. В связи с этим используется метод Кепстра - это спектр спектра исходного сигнала. Он позволяет обнаружить скрытые периодические изменения в данных, которые не выявляются на спектрограмме.

Суть Кепстра - представить уже имеющийся спектр как отдельный сигнал, а не как распределение каждого значения входных данных. Для расчета коэффициентов Кепстра сигнал разбивается на кадры (фреймы), которые накладываются друг на друга. Длина фреймов влияет на точность и скорость работы алгоритма: увеличение длины фреймов повышает точность, но замедляет алгоритм. Обычно выбирают длину фреймов от 20 до 40 миллисекунд.

Для каждого кадра вычисляется спектр, а затем эти спектры накладываются на мел-частотные окна, что помогает выделить низкие частоты, близкие к механизму восприятия звука.

MFCC дескрипторы обнаружили высокие показатели при работе со всеми типами классификаторов, однако наиболее высоких результатов удалось достичь при использовании метода Random forest. В этом случае точность прогнозирования выброса достигает 96 %, при этом полнота несколько уступает комбинации LCP дескрипторов и SVM классификатора (93 % процента против 95 %). Однако в целом на практике более важно повысить точность прогноза, незначительно пожертвовав его полнотой. По итогам рассмотрения самых распространённых типов дескрипторов было принято решение остановиться на MFCC как на наиболее подходящем для прогнозирования выбросов на агрегате «ковш-печь».

Четвёртый этап - классификация. Для этого используются алгоритмы машинного обучения, которые помогают решить задачу бинарной классификации. Для разработки алгоритмов была использована уже описанная информация. При выборе алгоритма было проведено сравнение трёх методов: метод опорных векторов, случайный лес и логистическая регрессия. Сравнение предложенных алгоритмов для различных типов дескрипторов на полученном наборе данных представлено в таблице.

Таблица

Сравнение различных комбинаций дескрипторов и методов классификации

Метод Точность Полнота F-мера

1 2 3 4

SVM

ZCR 0,58 0,63 0,60

Статистика в частотной области 0,76 0,71 0,73

Продолжение таблицы

1 2 3 4

LPC 0,84 0,95 0,89

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

MFCC 0,83 0.91 0,87

Random forest

ZCR 0,55 0,59 0,57

Статистика в частотной области 0,79 0,67 0,73

LPC 0,82 0,92 0,87

MFCC 0,96 0,93 0,94

Logit model

ZCR 0,48 0,59 0,53

Статистика в частотной области 0,52 0,62 0,57

LPC 0,58 0,76 0,66

MFCC 0,60 0,74 0,66

Приведённые значения показывают, что для предложенной предметной области наиболее перспективной является комбинация Random forest классификатора и MFCC дескрипторов.

Практическая реализация

Для создания программы, которая бы реализовала предложенную модель, был использован язык программирования Python. Выбор этого языка обусловлен наличием в нем множества математических инструментов и сравнительной простотой написания кода, что позволило быстрее тестировать предлагаемые решения и создавать прототипы.

Система акустической диагностики создавалась на базе микрокомпьютера Raspberry Pi, к которому подключен микрофон (см. рис. 1). Чтобы иметь возможность сохранять большое количество данных, получаемых в процессе функционирования системы, использовали внешний носитель, что значительно расширило возможности микрокомпьютера в хранении данных.

Установка размещается компактно в непосредственной близости от контролируемого оборудования и передаёт информацию о сбоях на компьютер оператора с предустановленным ПО «Прогнозирование выброса» (рис. 2-3). Установка в удобном для оператора виде отображает информацию о текущем состоянии оборудования.

Созданный прототип прошёл испытания на агрегате «ковш-печь» сталеплавильного производства компании «Северсталь».

Рис. 1. Прототип устройства акустического контроля

Изначально был разработан вариант размещения устройства на посту оператора установки «ковш-печь», с размещением микрофона в металлической трубе для предотвращения его поломки под воздействием высоких температур.

Рис. 2. Первоначальный и штатный вариант размещения оборудования на установке

«ковш-печь»

В течение года промышленной эксплуатации предложенная система показала высокую эффективность, её применение позволило спрогнозировать 93 % выбросов, при этом число ложноположительных срабатываний не превышало 3,7 %.

Кроме того, аппаратная составляющая проекта значительно дешевле и проще в монтаже по сравнению с применявшимся ранее оборудованием.

НАУКИ Выбор дескрипторов акустического сигнала для задачи прогнозирования

выброса металла в агрегате «ковш-печь»

ВНИМАНИЕ! ПРИБЛИЖАЕТСЯ ВЫБРОС!

Рис. 3. Интерфейс программы прогнозирования выбросов металла

Дальнейшее усовершенствование модели подразумевает увеличение точности прогнозирования, произошедшего сбоя, устранение ложноположительных срабатываний алгоритма, а также разработки собственной аппаратной платформы в качестве замены Raspberry Pi для удешевления установки.

Выводы

В результате проведённого анализа в качестве оптимального дескриптора акустического сигнала для задачи прогнозирования выброса металла на агрегате «ковш-печь» были выбраны мел-частотные кепстральных коэффициентов (MFCC, от англ. mel-frequency cepstral coefficients). Применение MFCC позволяет наиболее точно определить моменты выброса металла, а также облегчает обучение компьютерной модели, так как из всех рассматриваемых признаков MFCC наиболее близки к восприятию звука человеком, что позволяет в значительной степени опираться на орга-нолептический метод при обучении модели.

Применение мел-частотных кепстральных коэффициентов позволило построить наиболее точный вариант модели для контроля технологического процесса продувки металла в агрегате «ковш-печь» с целью купирования выбросов металла. Предложенный подход позволит сократить текущие затраты на каждую плавку за счёт предотвращения потерь металла в процессе плавки.

Список источников

Дюдкин Д. А., Бать С. Ю., Гринберг С. Е., Маринцев С. Н. Производство стали на агрегате «ковш-печь» / под научной редакцией Д. А. Дюдкина. Донецк: ООО «Юго-Восток, Лтд», 2003. 300 с.

Мартюгов А. С. и др. Метод обработки акустической информации для контроля состояния клапанов газоочистного оборудования // Дефектоскопия. 2021. № 10. С. 16-24.

Мартюгов А. С. и др. Применение акустического анализа для диагностики клапанов газоочистного оборудования // Интеллектуально-информационные технологии и интеллектуальный бизнес (ИНФ0С-2021): материалы двенадцатой международной научно-технической конференции (Вологда, 29-30 июня 2021 года). Вологда: Вологодский государственный университет, 2021. С. 131-133.

Мошкарова Л. А., Тельминов О. А. Методы извлечения акустических признаков в задаче распознавания речи рекуррентными нейронными сетями с долгой краткосрочной памятью // Наноиндустрия. 2020. Т. 13, № S5-3(102). С. 838-841.

Судьенкова А. В. Обзор методов извлечения акустических признаков речи в задаче распознавания диктора // Сборник научных трудов Новосибирского государственного технического университета. 2019. № 3-4 (96). С. 139-164.

Akpudo U. E., Hur J. W. A cost-efficient mfcc-based fault detection and isolation technology for electromagnetic pumps // Electronics. 2021. Vol. 10, no. 4. P. 1-21. DOI: 10.3390/electronics10040439.

Guido R. C. [et al.] Introducing the Discrete Path Transform (DPT) and its applications in signal analysis, artefact removal, and spoken word recognition // Digital Signal Processing. 2021. Vol. 117, no. 11. P. 103-158. DOI: 10.1016/j.dsp.2021.103158.

Uchida T. Reversal of relationship between impression of voice pitch and height of fundamental frequency: Its appearance and disappearance // Acoustical Science and Technology. 2019. Vol. 40, no. 3. P. 198-208.

References

Akpudo U. E. A cost-efficient mfcc-based fault detection and isolation technology for electromagnetic pumps. Electronics, 2021, vol. 10, no. 4, pp. 1-21. D0I:10.3390/electronics10040439.

Diudkin D. A., Bat' S. Iu., Grinberg S. E., Marintsev S. N. Proizvodstvo stali na agregate «kovsh-pech'» [Ladle-furnace steel production; ed. by D. A. Diudkin]. Donetsk: OOO "Iugo-Vostok, Ltd", 2003. 300 p.

Guido R. C. [et al.] Introducing the Discrete Path Transform (DPT) and its applications in signal analysis, artefact removal, and spoken word recognition. Digital Signal Processing, 2021, vol. 117, no. 11, pp. 103-158. DOI: 10.1016/j.dsp.2021.103158.

Martiugov A. S. i dr. Metod obrabotki akusticheskoi informatsii dlia kontrolia sostoianiia klapanov gazoochistnogo oborudovaniia [Method of processing acoustic information for purposes of monitoring state of valves of gas cleaning equipment]. Defektoskopiia [Russian Journal of Nondestructive Testing], 2021, no. 10, pp. 16-24.

Martiugov A. S. i dr. Primenenie akusticheskogo analiza dlia diagnostiki klapanov gazoochist-nogo oborudovaniia [Application of acoustic analysis for diagnosing valves of gas cleaning equipment]. Intellektual'no-informatsionnye tekhnologii i intellektual'nyi biznes (INFOS-2021): materialy dvenadtsatoi mezhdunarodnoi nauchno-tekhnicheskoi konferentsii [Intelligent Information Technologies and Intelligent Business (INFOS-2021): Proceedings of the twelfth International scientific and technical conference. Vologda, June 29-30, 2021]. Vologda: Vologodskii gosudarstvennyi universi-tet, 2021, pp. 131-133.

Moshkarova L. A., Tel'minov O. A. Metody izvlecheniia akusticheskikh priznakov v zadache raspoznavaniia rechi rekurrentnymi neironnymi setiami s dolgoi kratkosrochnoi pamiat'iu [Methods for extracting acoustic features in speech recognition by recurrent neural networks with long short-term memory]. Nanoindustriia [Nanoindustry], 2020, vol. 13, no. S5-3 (102), pp. 838-841.

Sud'enkova A. V. Obzor metodov izvlecheniia akusticheskikh priznakov rechi v zadache raspoz-navaniia diktora [Overview of methods for extracting acoustic speech features in speaker recognition]. Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta [Collection of scientific papers of Novosibirsk State Technical University], 2019, no. 3-4 (96), pp. 139-164.

Uchida T. Reversal of relationship between impression of voice pitch and height of fundamental frequency: Its appearance and disappearance. Acoustical Science and Technology, 2019, vol. 40, no. 3, pp. 198-208.

Сведения об авторах

Артём Сергеевич Мартюгов - аспирант; https://orcid.org/0000-0002-4675-3679, martyugov@bk.ru, Череповецкий государственный университет (д. 5, пр-т Луначарского, 162600 г. Череповец, Российская Федерация); Artyom S. Martyugov - Postgraduate Student; https://orcid.org/0000-0002-4675-3679, martyugov@bk.ru, Cherepovets State University (5, pr. Lu-nacharskogo, 162600 Cherepovets, Russia).

Евгений Валентинович Ершов - доктор технических наук, профессор; https://orcid.org/0000-0003-2888-4242, eve@chsu.ru, Череповецкий государственный университет (д. 5, пр-т Луначарского, 162600 г. Череповец, Российская Федерация); Evgeny V. Ershov -Doctor of Technical Sciences, Professor; https://orcid.org/0000-0003-2888-4242, eve@chsu.ru, Cherepovets State University (5, pr. Lunacharskogo, 162600 Cherepovets, Russia).

Людмила Николаевна Виноградова - кандидат технических наук, доцент; https://orcid.org/0000-0001-9395-998X, lnvinogradova@bk.ru, Череповецкий государственный университет (д. 5, пр-т Луначарского, 162600 г. Череповец, Российская Федерация); Ludmila N. Vinogradova - Candidate of Technical Sciences, Associate Professor; https://orcid.org/0000-0001-9395-998X, lnvinogradova@bk.ru, Cherepovets State University (5, pr. Lunacharskogo, 162600 Cherepovets, Russia).

Игорь Андреевич Варфоломеев - кандидат технических наук, доцент; https://orcid.org/0000-0003-2888-4242, igor.varf@gmail.com, Череповецкий государственный университет (д. 5, пр-т Луначарского, 162600 г. Череповец, Российская Федерация); Igor A. Varfolomeev - Candidate of Technical Sciences, Associate Professor; https://orcid.org/0000-0003-2888-4242, igor.varf@gmail.com, Cherepovets State University (5, pr. Lunacharskogo, 162600 Cherepovets, Russia).

Заявленный вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

Contribution of the authors: the authors contributed equally to this article. The authors declare no conflicts of interests.

Статья поступила в редакцию 13.02.2023; одобрена после рецензирования 14.03.2023; принята к публикации 22.03.2023.

The article was submitted 13.02.2023; Approved after reviewing 14.03.2023; Accepted for publication 22.03.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.