Научная статья на тему 'Сравнительный анализ моделей машинного обучения при решении задачи классификации гидроакустических шумов морских судов'

Сравнительный анализ моделей машинного обучения при решении задачи классификации гидроакустических шумов морских судов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
113
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / признаки гидроакустических шумов / классификация морских объектов / обработка звукового сигнала / machine learning / hydroacoustic noise features / marine objects classification / audio signal processing

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузин Денис Александрович, Стаценко Любовь Григорьевна

Автоматизированная идентификация и классификация морских объектов по гидроакустическим шумам – важная задача в области мониторинга акваторий и освоения Мирового океана. Важными этапами разработки автоматизированной системы распознавания объектов являются выбор классификатора, используемого для принятия решения, а также выбор признаков, на основании которых будет производиться классификация. В статье приводится сравнительный анализ точности предсказания класса судна по его гидроакустическому шуму тремя различными моделями машинного обучения и искусственной нейронной сети в зависимости от используемых признаков

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кузин Денис Александрович, Стаценко Любовь Григорьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Comparative analysis of machine learning models in classifying hydroacoustic noises of sea vessels

The automated identification and classification of marine objects by hydroacoustic noise is an important task in water areas monitoring and World Ocean exploration. The important stages in the development of an automated object recognition system are the choice of a classifier and choice of features. The article provides a comparative analysis of the accuracy of determining the ship class based on its hydroacoustic noise by three different models of machine learning and an artificial neural network.

Текст научной работы на тему «Сравнительный анализ моделей машинного обучения при решении задачи классификации гидроакустических шумов морских судов»

Физические поля корабля, океана и атмосферы

Научная статья УДК 004.93

http://doi.org/10.24866/2227-6858/2022-2/62-68 Д.А. Кузин, Л.Г. Стаценко

КУЗИН ДЕНИС АЛЕКСАНДРОВИЧ - старший преподаватель, kuzindeal@gmail.comH СТАЦЕНКО ЛЮБОВЬ ГРИГОРЬЕВНА - д.ф.-м.-н., профессор, lu-sta@mail.ru Департамент электроники, телекоммуникации и приборостроения Политехнический институт Дальневосточный федеральный университет Владивосток, Россия

Сравнительный анализ моделей машинного обучения

при решении задачи классификации гидроакустических шумов

морских судов

Аннотация. Автоматизированная идентификация и классификация морских объектов по гидроакустическим шумам - важная задача в области мониторинга акваторий и освоения Мирового океана. Важными этапами разработки автоматизированной системы распознавания объектов являются выбор классификатора, используемого для принятия решения, а также выбор признаков, на основании которых будет производиться классификация. В статье приводится сравнительный анализ точности предсказания класса судна по его гидроакустическому шуму тремя различными моделями машинного обучения и искусственной нейронной сети в зависимости от используемых признаков

Ключевые слова: машинное обучение, признаки гидроакустических шумов, классификация морских объектов, обработка звукового сигнала

Для цитирования: Кузин Д.А., Стаценко Л.Г. Сравнительный анализ моделей машинного обучения при решении задачи классификации гидроакустических шумов морских судов // Вестник Инженерной школы Дальневосточного федерального университета. 2022. № 2(51). С. 62-68.

Введение

Морские суда представлены широким спектром классов - от катеров и моторных лодок, которые в основном используются в прибрежных районах, до грузовых кораблей и пассажирских лайнеров. В связи с этим регистрируется увеличение подводного шума (особенно в диапазоне низких частот 10-100 Гц) по всему Мировому океану [2]. Классификация гидроакустических сигналов и шумов представляет интерес из-за широкого спектра возможностей ее применения: обнаружение и определение типа морских судов в акватории [5], подлежащей охране; оценка влияния шумов прибрежных городов и портов на окружающую среду [4]; предсказание возможных природных катаклизмов [3,7]; классификация подводной флоры и фауны при изучении Мирового океана [12].

Цель работы - сравнительный анализ моделей машинного обучения и признаков для решения задачи определения класса судна по излучаемому гидроакустическому шуму. В статье представлены результаты точности предсказания трех моделей машинного обучения и искусственной нейронной сети, оцененные по четырем метрикам точности, в зависимости от используемого признака шума. Результаты были получены на основе экспериментальной обработки базы данных, состоящей из шумов судов четырех классов с использованием реализованных алгоритмов на языке программирования Python.

© Кузин Д.А., Стаценко Л.Г., 2022

Статья поступила: 13.05.2022; рецензия: 19.05.2022; финансирование: исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-37-90084\19.

Модели машинного обучения

В работе на языке программирования Python были реализованы метод логистической регрессии, метод k-ближайших соседей, метод опорных векторов, искусственная нейронная сеть. Нами представлен пример реализованной модели логистической регрессии, которая на основании обучающей выборки (строит прямую линию, разграничивающую два класса объектов (рис. 1). На оси ординат отмечены значения первого гамматон-частотного кепстрального коэффициента, на оси абсцисс отмечены значения двенадцатого гамматон-частотного кепстрального коэффициента. Значения рассчитываются с помощью реализованного алгоритма из записи шума, представленного в формате «.wav».

Рис. 1. Модель логистической регрессии: оранжевые точки - примеры шумов класса «корабль»; синие точки - примеры других шумов

В данном примере в качестве признаков используются два гамматон-частотных кеп-стральных коэффициента в качестве признаков. Анализируя данные, представленные на рис. 1, можно отметить следующее: если у тестовой точки данных ОБСС1 = 5 и ОБСС12 = -0,25, то модель классифицирует эту точку данных как объект класса «другой шум»; если у тестовой точки данных ОБСС1 = 5 и ОБСС12 = 0,5, то модель классифицирует эту точку данных как объект класса «корабль». Из рисунка видно, что модель не может точно поделить два класса объектов прямой линией.

Рассмотрим пример модели опорных векторов (рис. 2). Модель строит разделяющую гиперплоскость таким образом, чтобы максимизировать расстояние между разделяющей гиперплоскостью и точками объектов классов из обучающей выборки.

Рис. 2. Модель опорных векторов: красные точки - объекты класса «корабль»; желтые - объекты класса «другой шум»

В отличие от модели логистической регрессии (см. рис. 2) модель опорных векторов достаточно точно строит гиперплоскость, разделяющую два класса (см. рис. 1).

Пример модели ^ближайших соседей (рис. 3) показывает следующее: точки на графике, как и в предыдущих примерах, отображают обучающую выборку: оранжевые точки данных представляют объекты класса «другой шум», голубые точки - объекты класса «корабль». Оранжевая и голубая части - области, попадая в которые, объект будет отнесен к одному или другому классу. Для примера, объект с признаками GFCC 1=7,5 и GFCC 12=0,2 будет отнесен к классу «корабль». Модель ^ближайших соседей определяет класс тестового объекта по вектору входных признаков как доминирующий класс среди объектов из обучающей выборки, которые больше всего на него похожи.

Рис. 3. Модель к-ближайших соседей: оранжевые точки - данные объектов класса «другой шум»; голубые - объектов класса «корабль»

Кроме классических моделей машинного обучения была реализована искусственная нейронная сеть, состоящая из входного слоя, двух скрытых и выходного слоя (рис. 4). Функция активации нейронов во входном и скрытых слоях - ReLU, функция активации выходного слоя - Softmax.

Рис. 4. Структура искусственной нейронной сети Сравнительный анализ

Произведем сравнение описанных моделей на основе результатов по решению задачи классификации судна класса «танкер» среди шумов, производимых судами других классов. Для эксперимента использовалась база данных с записями гидроакустических шумов, состоящая из 593 файлов с шумами четырех классов судов: танкер, пассажирское судно, грузовое судно, портовый буксир. Обучающая выборка состоит из 475 записей шумов, тестовая выборка состоит из 118 записей шумов для каждой из исследуемых моделей. Из записей с помощью алгоритма, реализованного на языке программирования Python, вычисляются признаки гидроакустических шумов.

Представлены примеры признаков в графическом виде для шумов судна класса «портовый буксир» (рис. 5). В качестве признаков использовались мел-частотные кепстральные коэффициенты (MFCC - Mel Frequency Cepstral Coefficients) [8], гамматон-частотные кепстральные коэффициенты (GFCC - Gammatone Frequency Cepstral Coefficients) [11]; хрома-грамма (Chroma) [9], спектральный центроид [10]; ширина полосы частот (ШПЧ) [13], коэффициенты постоянного Q преобразования (CQT - Constant Q Transform) [6].

Время

д е

Рис. 5. Признаки для шумов судна класса «портовый буксир»: а) мел-частотные кепстральные коэффициенты; б) гамматон-частотные кепстральные коэффициенты; в) хромаграмма; г) спектральный центроид; д) ширина полосы частот;

е)постоянное Q преобразование

Для оценки точности классификации шумов моделями в качестве метрик использовались accuracy, precision, recall, F1 score [1]. Метод оценки результатов по четырем метрикам позволяет получить достоверные данные о точности предсказания моделей. На рисунке 6 представлены результаты метрик, полученные при классификации шумов всеми четырьмя моделями, в зависимости от используемого признака.

LR SVM KNN ANN LR SVM KNN ANN

Рис. 6. Результаты метрик, полученные при классификации шумов

Из рисунка следует, что при использовании гамматон-частотных кепстральных коэффициентов удается добиться большей точности классификации шума танкера среди шумов кораблей других классов. Кроме того, графики демонстрируют преимущество искусственной нейронной сети перед другими моделями машинного обучения. При использовании признака хромаграмма и модели логистической регрессии можно обнаружить увеличение точности по сравнению с гамматон-частотными кепстральными коэффициентами по метрике Precision. Но при этом метрики Recall и F1 находятся на уровне 0,1. Это объясняется тем, что модель точно классифицировала большее количество объектов данных одного класса, но при этом неверно классифицировала практически все объекты данных другого класса. Это еще раз подтверждает, что оценка точности предсказания моделей F1 более достоверна по совокупности метрик.

Выводы

Применение искусственных нейронных сетей и моделей машинного обучения позволяет автоматизировать решение задачи классификации морских объектов по их гидроакустическим шумам. С этой целью необходимо правильно подобрать модель и определить используемые признаки. На примере решения задачи классификации судов класса «танкер» по их гидроакустическим шумам среди судов других классов были получены следующие результаты: из числа исследуемых признаков большей точности предсказания удалось добиться с помощью гамматон-частотных кепстральных коэффициентов; из ряда исследуемых моделей большую точность продемонстрировала искусственная нейронная сеть.

Заявленный вклад авторов: все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

СПИСОК ИСТОЧНИКОВ

1. Кузин Д.А., Стаценко Л.Г., Анисимов П.Н., Смирнова М.М. Применение методов машинного обучения для классификации акустических сигналов по спектральным характеристикам // Известия СПбГЭТУ ЛЭТИ. 2021. № 3. С. 48-54.

2. Никитин В.С., Половинкин В.Н., Симонов Ю.А., Иванов Ю.М. Развитие морской деятельности в российской Арктике // Арктика: экология и экономика. 2015. № 2(18). С. 78-87

3. Полунина П.А., Шапиро Н.М. Детектирование и классификация вулканических землетрясении при помощи методов машинного обучения // Научная конференция молодых ученых и аспирантов ИФЗ РАН, Москва, 22-23 апреля 2019 г. Москва: ИФЗ РАН, 2019. С. 68-68.

4. Проскуряков А.Ю., Белов А.А., Кропотов Ю.А. Алгоритмы автоматизированных систем экологического мониторинга промышленных производств. Москва; Берлин: Директ-Медиа, 2015. 123 с. URL: https://biblioclub.ru/index.php?page=book&id=429423 (дата обращения: 04.05.2022).

5. Karakos D., Silovsky J., Schwartz R., Hartmann W., Makhoul J. Individual Ship Detection Using Underwater Acoustics. 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018. Р. 2121-2125.

6. Brown J.C. Calculation of a constant Q spectral transform. J. of the Acoustical Society of America. 1991;89(1):425-434.

7. Ekpezu A. O., Wiafe I., Katsriku, F., Yaokumah W. Using deep learning for acoustic event classification: The case of natural disasters. J. of the Acoustical Society of America. 2021 ;149(4):2926-2935.

8. Garg U., Agarwal S., Gupta S., Dutt R., Singh D. Prediction of Emotions from the Audio Speech Signals using MFCC, MEL and Chroma. 12th International Conference on Computational Intelligence and Communication Networks (CICN). IEEE, 2020:87-91.

9. Kattel M., Nepal A., Shah A.K., Shrestha D. Chroma feature extraction. Conference: Chroma Feature Extraction using Fourier Transform. 2019:1 -9.

10. Le P.N., Ambikairajah E., Epps J., Sethu V., Choi E.H. Investigation of spectral centroid features for cognitive load classification. Speech Communication. 2011 ;53(4):540-551.

11. Liu G.K. Evaluating gammatone frequency cepstral coefficients with neural networks for emotion recognition from speech. 2018. URL: https://arxiv.org/pdf/1806.09010.pdf - 04.05.2022.

12. Malfante M., Mohammed O., Gervaise C., Dalla Mura M., Mars J. I. Use of deep features for the automatic classification of fish sounds. OCEANS-MTS/IEEE Kobe Techno-Oceans (OTO). IEEE, 2018:1-5.

13. Yang W., Krishnan S. Combining temporal features by local binary pattern for acoustic scene classification. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2017;25(6): 1315-1321.

FEFU: SCHOOL of ENGINEERING BULLETIN. 2022. N 2/51

Physical Fields of Ship, Ocean and Atmosphere ww.dvfu.ru/en/vestnikis

Original article

http://doi.org/10.24866/2227-6858/2022-2/62-68 Kuzin D., Statsenko L.

DENIS А. KUZIN, Senior Lecturer, kuzindeal@gmail.comH

LUBOV G. STATSENKO, Doctor of Physico-Mathematical Sciences, Professor, lu-sta@mail.ru

Department of Electronics, Telecommunications and Instrumental Engineering

Polytechnic Institute

Far Eastern Federal University

Vladivostok, Russia

Comparative analysis of machine learning models in classifying hydroacoustic noises of sea vessels

Abstract. The automated identification and classification of marine objects by hydroacoustic noise is an important task in water areas monitoring and World Ocean exploration. The important stages in the development of an automated object recognition system are the choice of a classifier and choice of features. The article provides a comparative analysis of the accuracy of determining the ship class based on its hydroacoustic noise by three different models of machine learning and an artificial neural network.

Keywords: machine learning, hydroacoustic noise features, marine objects classification, audio signal processing

For citation: Kuzin D., Statsenko L. Comparative analysis of machine learning models in classifying hydroacoustic noises

of sea vessels. FEFU: School of Engineering Bulletin. 2022;(2):62-68. (In Russ.).

Contribution of the authors: the authors contributed equally to this article.

The authors declare no conflicts of interests.

REFERENCES

1. Kuzin D.A., Statsenko L.G., Anisimov P.N., Smimova M.M. Application of machine learning methods for the classification of acoustic signals according to spectral characteristics. 2021;(3):48-54.

2. Nikitin V.S., Polovinkin V.N., Simonov Yu.A., Ivanov Yu.M. Development of maritime activities in the Russian Arctic. Arktika: ecology and economy. 2015;(2):78-87.

3. Polunina P.A., Shapiro N.M. Detection and classification of volcanic earthquakes using machine learning methods. Scientific conference of young scientists and postgraduate students of IPE RAS, Moscow, April 22-23, 2019. Moscow, IPE RAS, 2019. P. 68-68.

4. Proskuryakov A.Yu., Belov A.A., Kropotov Yu.A. Algorithms for automated systems of environmental monitoring of industrial production. Moscow, Berlin: Direct-Media, 2015:23. URL: https://biblio-club.ru/index.php?page=book&id=429423 - 05.04.2022.

5. Karakos D., Silovsky J., Schwartz R., Hartmann W., Makhoul J. Individual Ship Detection Using Underwater Acoustics. 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018:2121-2125.

6. Brown J.C. Calculation of a constant Q spectral transform. J. of the Acoustical Society of America. 1991;89(1):625-434.

7. Ekpezu A. O., Wiafe I., Katsriku, F., Yaokumah W. Using deep learning for acoustic event classification: The case of natural disasters. J. of the Acoustical Society of America. 2021 ;149(4):2926-2935.

8. Garg U., Agarwal S., Gupta S., Dutt R., Singh D. Prediction of Emotions from the Audio Speech Signals using MFCC, MEL and Chroma. 12th International Conference on Computational Intelligence and Communication Networks (CICN). IEEE, 2020:87-91.

9. Kattel M., Nepal A., Shah A.K., Shrestha D. Chroma feature extraction. Conference: Chroma Feature Extraction using Fourier Transform. 2019:1-9.

10. Le P.N., Ambikairajah E., Epps J., Sethu V., Choi E.H. Investigation of spectral centroid features for cognitive load classification. Speech Communication. 2011:53(4)540-551.

11. Liu G.K. Evaluating gammatone frequency cepstral coefficients with neural networks for emotion recognition from speech. 2018. URL: https://arxiv.org/pdf/1806.09010.pdf - 05.04.2022.

12. Malfante M., Mohammed O., Gervaise C., Dalla Mura M., Mars J. I. Use of deep features for the automatic classification of fish sounds. OCEANS-MTS/IEEE Kobe Techno-Oceans (OTO). IEEE, 2018:1-5.

13. Yang W., Krishnan S. Combining temporal features by local binary pattern for acoustic scene classification. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2017;25(6): 13151321.

i Надоели баннеры? Вы всегда можете отключить рекламу.