Классификация звуков астматического дыхания с использованием нейронных сетей

Бердибаева Гульмира Куанышевна; Бодин Олег Николаевич; Фирсов Дмитрий Сергеевич

КЛАССИФИКАЦИЯ ЗВУКОВ АСТМАТИЧЕСКОГО ДЫХАНИЯ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ

G. К. Berdibaeva, O. N. Bodin, D. S. Firsov

CLASSIFICATION OF SOUNDS OF ASTHMATIC BREATHING USING NEURAL NETWORKS

Аннотация. Актуальность и цели. Объектом исследования являются респираторные звуки астматических пациентов и здоровых лиц. Предметом исследования является анализ звуковых сегментов респираторных звуков с использованием дискретного вейвлет-преобразования (DWT) и вейвлет-пакетного преобразования (WPT). Целью работы является классификация звуковых сигналов дыхания нормального и астматического состояний с помощью использования искусственной нейронной сети (ANN). Материалы и методы. Изложены алгоритм последовательной обработки сигнала через банк фильтров с учетом психоакустической природы слуха и результаты классификации полученных векторов-признаков с помощью аппарата искусственных нейронных сетей. Результаты. Нормальные и астматические звуковые сигналы дыхания делятся на сегменты, которые включают в себя один цикл дыхания как вдох и выдох. Анализ этих звуковых сегментов осуществляется с использованием как дискретного вейвлет-преобразования (DWT), так и вейвлет-пакетного преобразования (WPT). Каждый сегмент звука разбивается на частотные поддиапазоны с использованием DWT и WPT. Функциональные векторы создаются путем извлечения статистических признаков из поддиапазонов. Результаты классификации DWT и WPT сравниваются друг с другом с точки зрения точности классификации. Выводы. Дыхательный анализ звука с использованием методов обработки сигналов имеет важное значение для диагностики заболеваний легких, таких как астма. Существует много исследований по анализу дыхательных звуков. В этих исследованиях показано, что нейронные сети дают высокий коэффициент успеха. Таким образом, мы используем методы анализа DWT, WPT и классификатор ANN для анализа наших звуков дыхания. Мы сравниваем эти методы анализа с точки зрения точности классификации. Как видно из итогов, DWT немного лучше, чем WPT в нашем исследовании. Полученные результаты весьма перспективны для выявления болезни астмы.

Abstract. Background. The subject of the study are the respiratory sounds of asthmatic patients and healthy individuals. The subject of the study is the analysis of sound segments of respiratory sounds using discrete wavelet transform (DWT) and wavelet-packet transformation (WPT). The aim of the work is to classify the sound signals of normal breathing and, correspondingly, to the level of asthmatic diseases (mild asthma, moderate asthma and severe asthma) using an artificial neural network (ANN). Materials and methods. The algorithm of sequential processing of a signal through a filter bank is described, taking into account the psy-choacoustic nature of the hearing and the results of classification of the derived attribute vectors using the apparatus of artificial neural networks. Results. Normal and asthmatic sound signals of respiration are divided into segments, which include one cycle of breathing as inhalation and exhalation. Analysis of these sound segments is carried out using both a discrete wavelet transform (DWT) and wavelet-packet transformation (WPT). Each audio segment is divided into frequency subbands using DWT and WPT. Functional vectors are created by extracting statistical characteristics from subbands. The results of the classification of DWT and WPT are

УДК 004.616

DOI 10.21685/2307-5538-2018-2-11

Г. К. Бердибаева, О. Н. Бодин, Д. С. Фирсов

2018, № 2 (24)

87

compared with each other in terms of classification accuracy. Conclusions. Respiratory sound analysis using signal processing techniques is important for the diagnosis of lung diseases such as asthma. There are many studies on the analysis of respiratory sounds. In these studies, it is shown that neural networks give a high success rate. Thus, we use DWT analysis methods, WPT and ANN classifier to analyze our breathing sounds. We compare these methods of analysis in terms of the accuracy of classification. As a result, as can be seen from the results, the DWT is slightly better than the WPT in our study. The results obtained are very promising for the detection of asthma.

Ключевые слова: респираторные звуки, сегменты, дискретное вейвлет-преобразование, вейвлет-пакетное преобразование, искусственная нейронная сеть.

Key words: terms-respiratory sounds, discrete wavelet transform, wavelet packet transform, artificial neural network.

Введение

При рассмотрении классической схемы «наука-технологии-практические системы» [1] важно определить условия работы практической системы автоматического распознавания звуков. На данный момент время в среде «речевиков» (и «неречевиков» также) сложилось четкое мнение, что конечной целью является создание именно «фонетической печатающей машинки», а глобально-универсальные методы решения всех речевых проблем есть скрытые Марковские модели (НММ), практически решаемые методами нейронных сетей.

Нелинейные свойства слуха

Человеческая слуховая система не интерпретирует звук линейным образом. Человеческая интерпретация высоты тона с частотой в некоторых случаях может быть нежелательной особенностью. Чтобы это компенсировать, была создана меловая шкала в процессе экспериментов с интерпретацией звука для ушей человека в 1940-х гг. Единственная цель экспериментов заключалась в том, чтобы описать человеческую слуховую систему в линейном масштабе. Эксперимент показал, что высота тона линейно воспринимается в диапазоне частот 0-1000 Гц. Выше 1000 Гц масштаб становится логарифмическим. Примерная формула, широко используемая для мел-масштаба, показано ниже:

Fmel

1000

log 2

F 1 + -Fhz

1000

(1)

где Ете1 - результирующая частота на мельной шкале, измеренной в мелах, а - нормальная частота, измеренная в Гц. Это показано на рис. 1.

4500

4000

3500

3000

„ 2500 1

2000 1500 1000 500

/ /- -

/ /

/

О 2000 4000 6000 8000 10000 12000 14000 16000 Fu

Рис. 1. Связь между шкалой частоты и мелом

Значения высоты отложены в специальных единицах - мелах. Один мел равен ощущаемой высоте звука частотой 1000 Гц при уровне 40 дБ (иногда для оценки высоты тона используется другая единица, барк = 100 мел). Как видно из рис. 1, эта связь нелинейна - при увеличении частоты, например в три раза (от 1000 до 3000 Гц), высота повышается только в два раза (от 1000 до 2000 мел) [2]. Если высоту тона в мелах обозначить т, то на основе многих экспериментов зависимость тона от частоты / в герцах можно представить в виде [3]

При применении меловой шкалы коэффициенты сосредоточены на более низких частотах.

Аппарат искусственных нейронных сетей есть очень удобный инструмент для создания модели рецепторов распознавания акустических волн нейронами-рецепторами, располагающимися в слуховом органе [4]. Резко возросшие возможности компьютерной вычислительной техники дают расширенные возможности для таких моделирований [5].

Исходная модель слуховой системы представлена из линейки 24 критических полосок (частотных групп) и нейронной сети для классифицирования отдельных сегментов человеческой речи. Для реализации способности нейронной сети к классифицированию нужно дать формулировку классификации языка речи, другими словами, сформировать то, что нужно классифицировать. Важно также создание обучающего словаря в виде набора образцов классификации для первичного обучения нейронной сети.

В последнее десятилетие с появлением компьютерных методов обработки данных исследователи попытались параметризовать легочные звуки с целью сделать аускультацию более объективным и ценным диагностическим инструментом [3]. В течение последних двух десятилетий многие исследования проводились в режиме компьютерного анализа дыхательного звука [6]. Большая часть этих исследований включают в себя сбор, фильтрацию, извлечение признаков, спектральный анализ и классификацию дыхательных звуков.

В литературе часто используются для исследования дыхательных звуков методы частотного анализа (Фурье-методы, параметрические методы, вейвлет-преобразования) [7, 8]. Для классификации этих звуков используются алгоритмы машинного обучения, такие как искусственные нейронные сети, метод ближайшего соседа и некоторые другие [9, 10].

В этом исследовании астматический и нормальный респираторный звуковой сигнал регистрируется у пациентов с астмой в разной степени. Позже сигналы разделяются как звуковые сигналы при вдохе и выдохе. Таким образом, каждый сегмент содержит равное количество дыхательных циклов как одна фаза вдоха или выдоха. Каждый звуковой сегмент оценивается и обрабатывается как отдельный шаблон.

Далее сегменты звука разбиваются на поддиапазоны с использованием дискретного вейвлет-преобразования (ДВП) и пакетного вейвлет-преобразования (ПВП) [7] для создания векторной характеристики звуков.

Искусственные нейронные сети (ИНС) используются для классификации нормального и болезненного уровня астмы. Процесс классификации проводится отдельно для правого легкого и левого легкого, а также для вдыхательных и выдыхательных сегментов звукового сигнала.

В этом исследовании векторы признаков создаются с использованием ДВП, ПВП и последующих статистических обработок. Процесс определения выполняется с помощью этих векторных признаков. Производительность как ДВП, так и ПВП в качестве методов извлечения признаков сравнивается с точки зрения точности определения. В табл. 1 показано, что для определения используются проценты точности определения для нормального и трех различных астматических классов (мягкая астма, умеренная астма, тяжелая астма), когда DWT используется для извлечения признаков и ИНС. Процентное соотношение представлено в табл. 2 с использованием ПВП и ИНС.

(2)

Нейронные сети как слуховые рецепторы

Эксперимент и результаты

2018, № 2 (24)

Таблица 1

Точности определения нормальных и трех различных астматических классов с использованием ДВП и ИНС

89

Легкие Точность определения, %

ДВП

Вдох Выдох

Правое легкое 91,67 76,67

Левое легкое 90,00 86,67

Таблица 2

Точности определения нормальных и трех различных астматических классов с использованием ИНС

Легкие Точность определения, %

ПВП

Вдох Выдох

Правое легкое 90,00 80,00

Левое легкое 88,33 81,90

Результаты (см. табл. 1, 2) показывают, что методы ДВП, ПВП и классификатор ИНС дают многообещающие результаты для выявления болезни астмы. Точность правильного определения для методов ДВП и ПВП довольно высока при анализе ингаляционных звуков. Как видно из табл. 1, 2, по сравнению с ПВП, ДВП имеет несколько более высокую производительность, за исключением фазы основного базального выдоха. Однако если из дерева ПВП получены разные поддиапазоны, тогда точность определения может быть выше при анализе звуков дыхания с использованием ПВП. Даже в этом случае ДВП более эффективный, чем ПВП, с точки зрения обработки нагрузки и вычислительного времени. Поэтому ДВП используется чаще для анализа дыхательных звуков.

Заключение

Дыхательный анализ звука с использованием методов обработки сигналов имеет важное значение для диагностики заболеваний легких, таких как астма. Существует много исследований по анализу дыхательных звуков. В этих исследованиях показано, что нейронные сети дают высокий коэффициент успеха. Таким образом, мы используем методы анализа ДВП, WPT и классификатор ИНС для анализа наших звуков дыхания. Мы сравниваем эти методы анализа с точки зрения точности классификации. В результате, как видно из итогов, ДВП немного лучше, чем ПВП в нашем исследовании. Полученные результаты очень перспективны для выявления болезни астмы.

Библиографический список

1. Барский, А. Б. Нейронные сети: Распознавание, управление, принятие решений / А. Б. Барский. - М. : Финансы и статистика, 2004. - 354 с.

2. Титов, Ю. Н. Математическая модель органа слуха для автоматического распознавания речи / Ю. Н. Титов // Научно-технический вестник информационных технологий, механики и оптики. - 2007. - № 37. - С. 307-310.

3. Guler, i. Combining neural network and genetic algorithm for Prediction of Lung Sounds / i. Guler, H. Polat, U. Ergun // Journal of Medical Systems. - 2005. - Vol. 29. - P. 217-231.

4. Салюшин, С. А. Методика экспериментального определения структурных параметров нейросети для распознавания звуковых сигналов / С. А. Салюшин // Научная сессия МИФИ-2004 : сб. науч. тр. МИФИ. - М., 2004. - С. 34-39.

5. Алдошина, И. А. Основы психоакустики / И. А. Алдошина // Звукорежиссер. - 2002. -№ 3. - С. 86-92.

6. Spieth, P. M. Analyzing lung crackle sounds: Stethoscopes and beyond / P. M. Spieth, H. Zhang // Intensive Care Med. - 2011. - Vol. 37. - P. 1238-1239.

7. Новиков, Л. В. Основы вейвлет-анализа сигналов / Л. В. Новиков. - СПб. : Модус, 1999. -152 с.

8. Neural classification of lung sounds using wavelet coefficients / A. Kandaswamy, C. S. Kumar, Rm. Pl. Ramanathan, S. Jayaraman, N. Malmurugan // Computers in Biology and Medicine. - 2004. - Vol. 34. - P. 523-537.

9. Kizilaslan, R. Combination neural networks forecasters for monthly natural gas consumption prediction / R. Kizilaslan, B. Karlik // Neural Network World. - 2009. - Vol. 19, № 2. -P. 191-199.

10. Yeginer, M. Feature extraction for pulmonary crackle representation via wavelet networks / M. Yeginer, Y. P. Kahya // Applied Signal Processing. - 2009. - Vol. 39. - P. 713-721.

Бердибаева Гульмира Куанышевна

докторант,

Казахский национальный исследовательский технический университет имени К. И. Сатпаева (Республика Казахстан, Алматы, ул. Сатпаева, 22а) E-mail: horli@mail.ru

Бодин Олег Николаевич

доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40) E-mail: bodin_o@inbox.ru

Фирсов Дмитрий Сергеевич

магистрант,

Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40) E-mail: firsov.d.7.58@gmail.com

Berdibaeva Gul'mira Kuanyshevna

doctorate degree student,

Kazakh National Research Technical University

named after K. I. Satpayev

(22a Satpayev street, Almaty, Republic of Kazakhstan)

Bodin OlegNikolaevich

doctor of technical sciences, professor, sub-department of information-measuring equipment and metrology, Penza State University (40 Krasnaya street, Penza, Russia)

Firsov Dmitriy Sergeevich

master degree student, Penza State University (40 Krasnaya street, Penza, Russia)

УДК 004.616 Бердибаева, Г. К.

Классификация звуков астматического дыхания с использованием нейронных сетей /

Г. К. Бердибаева, О. Н. Бодин, Д. С. Фирсов / / Измерение. Мониторинг. Управление. Контроль. -2018. - № 2 (24). - С. 86-90. - БО! 10.21685/2307-5538-2018-2-11.

í.........................................................................................

Measuring. Monitoring. Management. Control

Классификация звуков астматического дыхания с использованием нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CLASSIFICATION OF SOUNDS OF ASTHMATIC BREATHING USING NEURAL NETWORKS

Текст научной работы на тему «Классификация звуков астматического дыхания с использованием нейронных сетей»