Научная статья на тему 'Разработка математической модели для распознавания звуковых сигналов'

Разработка математической модели для распознавания звуковых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
191
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ЗВУКОВЫХ СИГНАЛОВ / АНАЛИЗ ЗВУКОВЫХ ФРАГМЕНТОВ / КАШЛИ / КЛАССИФИКАЦИЯ КАШЛЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Абрамов Геннадий Владимирович, Коробова Людмила Анатольевна, Матыцина Ирина Александровна, Карпович Дмитрий Семенович, Шуленков Роман Александрович

В статье рассматривается применение нечеткой логики для распознавания звуковых сигналов. Источником звукового сигнала является астматический, туберкулезный кашли. Производится математический и программный анализ выборок кашлевых звуковых фрагментов. Формируются лингвистические переменные и формулируются функции принадлежности для математических переменных анализа фрагментов данных. В статье детально описывается алгоритм формирования нечетких выводов, а также применение различных алгоритмов нечетких регуляторов (Мамдани). Разработано программное и аппаратное решение для диагностирования и анализа звуковой дорожки кашля пациента с формированием заключения о классификации кашля и дальнейшем (амбулаторном) лечении.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Абрамов Геннадий Владимирович, Коробова Людмила Анатольевна, Матыцина Ирина Александровна, Карпович Дмитрий Семенович, Шуленков Роман Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка математической модели для распознавания звуковых сигналов»

100 ТРУДЫ БГТУ. 2014. № 6. Физико-математические науки и информатика. С. 100-103

УДК 65.011.56

Г. В. Абрамов, доктор технических наук, профессор (ВГУИТ, Россия); Л. А. Коробова, кандидат технических наук, доцент (ВГУИТ, Россия); И. А. Матыцина, аспирант (ВГУИТ, Россия);

Д. С. Карпович, кандидат технических наук, доцент, заведующий кафедрой (БГТУ);

Р. А. Шуленков, ассистент-стажер (БГТУ)

РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ ДЛЯ РАСПОЗНАВАНИЯ

ЗВУКОВЫХ СИГНАЛОВ

В статье рассматривается применение нечеткой логики для распознавания звуковых сигналов. Источником звукового сигнала является астматический, туберкулезный кашли. Производится математический и программный анализ выборок кашлевых звуковых фрагментов. Формируются лингвистические переменные и формулируются функции принадлежности для математических переменных анализа фрагментов данных. В статье детально описывается алгоритм формирования нечетких выводов, а также применение различных алгоритмов нечетких регуляторов (Мамдани). Разработано программное и аппаратное решение для диагностирования и анализа звуковой дорожки кашля пациента с формированием заключения о классификации кашля и дальнейшем (амбулаторном) лечении.

The article discusses the use of fuzzy logic to detect sounds. Sound source is asthmatic, tuberculosis coughs. Made math and analysis software samples cough sound fragments. Formed linguistic variables and the membership functions are formulated for mathematical variables fragment analysis data. The article describes in detail the algorithm for forming fuzzy conclusions as well as the use of various algorithms of fuzzy controllers (Mamdani). Developed software and hardware solution for the diagnosis and analysis track coughing patient with forming an opinion on the classification of cough and further (outpatient) treatment.

Введение. В настоящее время интенсивно развивается автоматизация и информатизация различных процессов. Медицина не является исключением. Наблюдение за астматиками, людьми, болеющими туберкулезом, - длительный и ответственный процесс. В медицине существует необходимость наблюдения за пациентом в течение длительного срока (час, сутки и т. д.). Для этого следует собрать звуковую запись пациента необходимой длины. Затем необходима обработка этой записи [1]. Она длинна и разнопланова. Поэтому медикам для обработки записи необходима помощь математиков и программистов с применением информационных технологий. В результате появилась необходимость разработать систему диагностики состояния больных бронхиальной астмой и туберкулезом по звуковым записям кашлей [2].

Каждый человек имеет индивидуальные особенности голоса (тембр, громкость, различия в зависимости от пола, возраста и т. д.). Все кашли подразделяются на типы - сухой, влажный и продуктивный, которые зависят от вида и тяжести заболевания. Кашли разных людей различны. Кроме того, даже кашли одного человека сильно отличаются друг от друга в зависимости от ситуации. Если говорить о собранной звуковой записи в течение определенного времени, то на нее попадают не только кашель пациента, но и другие шумы. Звук некоторых шумом однозначно отличается от кашля, но есть и похожие на кашель. Поэтому задача отсеивания звуковых сигналов шума и кашлей является актуальной.

Основная часть. При обработке звуковой записи для выделения кашлевых фрагментов были

рассмотрены и проанализированы следующие показатели: коэффициент корреляции Пирсона; коэффициент корреляции Спирмена; среднеквадра-тическое отклонение; дисперсия; Байесовская оценка; интервальная оценка; преобразование Фурье; вейвлет преобразование; интегральная оценка.

Для получения результата по этим показателям нам необходимо использовать нечеткую логику и сформулировать правила вывода.

Лингвистическая переменная является переменной более высокого порядка, чем нечеткая переменная, в том смысле, что значениями лингвистической переменной являются нечеткие переменные. Лингвистические переменные предназначены в основном для анализа сложных или плохо определенных явлений. Использование словесных описаний типа тех, которыми оперирует человек, делает возможным анализ таких сложных систем, которые недоступны обычному математическому анализу.

Более точно структура лингвистической переменной описывается набором (Ы, Т, X, G, М), в котором N - название этой переменной; Т -термы множества Ы, т. е. совокупность ее лингвистических значений; X - универсальное множество с базовой переменной х; G - синтаксическое правило, которое может быть задано в форме бесконтекстной грамматики, порождающей термы множества Т; М - семантическое правило, которое каждому лингвистическому значению ^ ставит в соответствие его смысл М(0, причем М(0 обозначает нечеткое подмножество множества X [3].

Значениями лингвистической переменной являются нечеткие множества, символами ко-

торых выступают слова и предложения в естественном или формальном языке, служащие, как правило, некоторой элементарной характеристикой явления.

В качестве рассматриваемых функций принадлежностей можно использовать Л-функции и трапецеидальные функции. Данный выбор обусловлен широким распространением именно этих зависимостей из-за их универсальности и простоты реализации в случае применения аппаратного способа решения поставленной задачи [4-7].

Термы функции принадлежности для лингвистической переменной «Коэффициент корреляции» формируются в виде аналитических зависимостей, представленных в табл. 2. Графическая интерпретация функции принадлежности представлена на рис. 1.

Таблица 2

Функции принадлежности для переменной «Коэффициент корреляции»

Рис. 1. График функций принадлежности переменной «Коэффициент корреляции»

Расчет функций принадлежности для лингвистической переменной «Отклонение амплитуд» приведен в табл. 3 и на рис. 2.

Таблица 3

Функции принадлежности для переменной «Отклонение амплитуд»

Уровень Математическое описание термы множества

Высокий Т (х) = ■ 1 0,8 Х; 0,6 < х< 0,8, 0,2 1; 0,8 < х < 1, 1; с = а = 1, 0, во всех остальных случаях

Средний Т (х) = ■ [1 0,6-х; 0,4 < х< 0,6, 0,2 1 х-0,6; 0,6 < х< 0,8, 0, 2 0, во всех остальных случаях

Низкий Т (х) = ■ '1; а = Ь = 0, 1; 0 < х < 0,4, х - 0 4 1 х 0,4; 0,4 < х < 0,5, 0,1 0, во всех остальных случаях

Уровень Математическое описание термы множества

Высокий Т (х) = ■ '1 0,8 х; 0,6 < х < 0,8, 0, 2 1; 0,8 < х < 1, 1; с = а = 1, 0, во всех остальных случаях

Средний Т (х) = ■ [1 0,5-х; 0,2 < х< 0,5, 0,3 х - 0 5 1 х 0,5 ; 0,5 < х < 0,8, 0,3 0, во всех остальных случаях

Низкий Т (х) = ■ '1; а = Ь = 0, 1; 0 < х < 0,2, 1 х - 0,2; 0,2 < х < 0,4, 0,2 0, во всех остальных случаях

Таблица 1

Описание лингвистических переменных

Переменная из набора Коэффициент корреляции Отклонение амплитуд Среднее значение отрицательной амплитуды Среднее значение положительной амплитуды

N Коэффициент корреляции Отклонение амплитуд Среднее значение отрицательной амплитуды Среднее значение положительной амплитуды

Т Высокий, средний, низкий Высокое, среднее, низкое Высокое, среднее, низкое Высокое, среднее, низкое

X [0; 1] [0; 1] [0; 1] [0; 1]

о Не, очень, не очень Не, очень, не очень Не, очень, не очень Не, очень, не очень

102

Г. В. Абрамов, Л. А. Коробова, И. А. Матышина, А. С. Карпович, Р. А. Шуленков

Т(х) 1,0

0

0,2 0,4 0,6 0,8

1,0

Рис. 2. График функций принадлежности переменной «Отклонение амплитуд»

Расчет функций принадлежности для лингвистической переменной «Среднее значение отрицательной амплитуды» приведен в табл. 4 и на рис. 3.

Таблица 4

Функции принадлежности для переменной «Среднее значение отрицательной амплитуды»

Уровень Математическое описание термы множества

Высокий Т (х) = ■ [1 0,6 х; 0,55 < х < 0,6, 0,05 1; 0,6 < х < 1, 1; с = й = 1, 0, во всех остальных случаях

Средний Т (х) = ■ 1 0,5 - х; 0,4 < х < 0,5, 0,1 1 х-0,5; 0,5 < х < 0,6, 0,1 0, во всех остальных случаях

Низкий Т (х) = ■ '1; а = Ь = 0, 1; 0 < х < 0,4, х - 0 4 1 0,4; 0,4 < х < 0,45, 0,05 0, во всех остальных случаях

Т(х)

1,0

0

0,40 0,45 0,55 0,60

1,00 х

Рис. 3. График функций принадлежности переменной «Среднее значение отрицательной амплитуды»

Расчет функций принадлежности для лингвистической переменной «Среднее значение положительной амплитуды» приведен в табл. 5 и на рис. 4.

Таблица 5

Функции принадлежности для переменной «Среднее значение положительной амплитуды»

Уровень Математическое описание термы множества

Высокий Т (х) = ■ 1 0,6 х; 0,55 < х< 0,6, 0,05 1; 0,6 < х < 1, 1; с = й = 1, 0, во всех остальных случаях

Средний Т (х) = ■ [1 0,5-х; 0,4 < х< 0,5, 0,1 1 х-0,5 ; 0,5 < х < 0,6, 0,1 0, во всех остальных случаях

Низкий Т (х) = ■ '1; а = Ь = 0, 1; 0 < х < 0,4, х - 0 4 1 ' ; 0,4 < х < 0,45, 0,05 0, во всех остальных случаях

Т(х)

1,0

0

0,40 0,45 0,55 0,60

1,00 х

Рис. 4. График функций принадлежности переменной «Среднее значение положительной амплитуды»

В результате сформируем следующие правила нечеткого вывода:

ЕСЛИ все показатели низкие, ТО Шум ЕСЛИ один из показателей средний, остальные низкие, ТО Шум;

ЕСЛИ один из показателей высокий, остальные низкие, ТО Шум;

ЕСЛИ все показатели средние, ТО возможно Кашель;

ЕСЛИ один из показателей низкий, остальные высокие, ТО возможно Кашель;

х

ЕСЛИ один из показателей высокий, остальные средние, ТО возможно Кашель;

ЕСЛИ одна половина показателей высокие, а другая низкие, ТО возможно Кашель;

ЕСЛИ один показатель средний, остальные высокие, ТО Кашель;

ЕСЛИ все показатели высокие, ТО Кашель.

По полученным данным была написана программа распознавания и обработки звуковых сигналов.

™ V w w WW w

Файп fe 2П Посиивль :-ур. о |F) га-~

■MJL/'" Б " ~ ом.« ю: S ™ а их 0,10 i ts Ь» ОЛ 0» 0.35 0« MS л с.ce D.1D i.« ojo ол ам о.г. а« к [ ,-1-T^-l интйг[1»пь"ыя по»«ИГ«1Ь Hi

•а 8 i 1г< » Ш оЛв 0 01 Jj-JÍÍ М IOS (1.UÜ 1 15 ел 0.» 0» 0.3S 0« К Пасииаль средний лн1лтуди |А) б

257w JL 0,014 a 01:11 №.í -О-—i т им o,w i is ел ол в» ал ел i* Ч)№виГСЛш0С>ь пики

г íj«г Í-J^f? и ЮЗН U во» и as i и и limit*

Л IjH 0.Ш 1.15 OJO ОйЯ 0» О-В а« 1С

а <05 0.10 1,15 «.» 0.К 0» 0.Э5 01« > *

В W Jb

i Ь,Ш- am í Л IjH 0.10 l.u OJO 01 OJO 0 3! в« 1Л

411wmw 9 иипиА и Л поа подираимм

Рис. 5. Графический интерфейс программы распознавания звуковых сигналов

В результате обработки выбранной записи происходит сортировка фрагментов на кашли, близкие к кашлям и шумы по определенному алгоритму. Итогом работы программы являются выделенные по цветам дорожки:

- светло-зеленым цветом выделены звуковые дорожки, которые являются кашлями;

- темно-зеленым цветом - возможно кашли;

- серым - шумы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выводы. В итоге получили следующие результаты:

1) разработанная программа дает врачу дополнительную информацию, основанную на статистической обработке звукового сигнала;

2) программное обеспечение (ПО) позволяет выделять кашли из звуковой записи, что дает больше информации лечащему врачу при принятии решения;

3) ПО позволяет проводить анализ записи с целью выделения кашлей разных видов;

4) ПО производит выделение шумов, близких к кашлю, с целью их исключения;

5) в настоящее время ведется уточнение логики построения алгоритмов и доработка программного продукта с целью повышения достоверности результата.

Литература

1. Исаев Ю., Мойсюк Л. Бронхиальная астма. Конвенциональные и неконвенциональные методы лечения. М.: КУДИЦ-ПРЕСС, 2008. 168 с.

2. McLuckie A. Respiratory disease and its management. New York: Springer, 2009. 51 р.

3. Заде Л. А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. 165 с.

4. Kevin M. Passino, Stephen Yurkovich. Fuzzy Control. Menlo Park, CA: Addison Wesley Longman, 1998. 522 р.

5. Kazuo Tanaka, Hua O. Wang. Fuzzy control systems design and analysis: a linear matrix inequality approach. Menlo Park, CA: John Wiley and Sons, 2001. 101 р.

6. Cox E. Fuzzy fundamentals // IEEE. Vol. 29, No. 10. P. 58-61.

7. Cox E. (Feb. 1993) Adaptive fuzzy systems // IEEE. Vol. 30, No. 2. P. 7-31.

Поступила 01.03.2014

i Надоели баннеры? Вы всегда можете отключить рекламу.