Научная статья на тему 'Программная реализация нечеткой модели распознавания звуковых сигналов'

Программная реализация нечеткой модели распознавания звуковых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
226
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗВУКОВОЙ СИГНАЛ / КАШЛЕВОЙ ТОЛЧОК / КОРРЕЛЯЦИОННЫЙ АНАЛИЗ / ИНФОРМАЦИОННАЯ СИСТЕМА / ПРЕОБРАЗОВАНИЕ ФУРЬЕ / ВЕЙВЛЕТ ПРЕОБРАЗОВАНИЕ / BEEP / COUGH PUSH / CORRELATION ANALYSIS / INFORMATION SYSTEMS / FOURIER TRANSFORM / WAVELET TRANSFORM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коробова Л. А., Курченкова Т. В., Матыцина И. А.

Статья продолжает тему публикации, посвященная распознаванию звуковых сигналов, в том числе и кашлевых толчков, с использованием различных математических методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коробова Л. А., Курченкова Т. В., Матыцина И. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article continues the theme of the publication dedicated to the recognition of sounds, including cough shocks, using various mathematical methods.

Текст научной работы на тему «Программная реализация нечеткой модели распознавания звуковых сигналов»

УДК 519-2

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ НЕЧЕТКОЙ МОДЕЛИ РАСПОЗНАВАНИЯ

ЗВУКОВЫХ СИГНАЛОВ

SOFTWARE IMPLEMENTATION FUZZY RECOGNITION MODEL BEEPS

Л.А. Коробова 1, Т.В. Курченкова 2, И.А. Матыцина 1 L.A. Korobova 1, T.V. Kurchenkova 2, I.A. Matycina 1

1) Воронежский государственный университет инженерных технологий, Россия, 394036, г. Воронеж, пр. Революции, 19 Voronezh State University of Engineering Technologies, 19 Revolution avenue, Voronezh, 394036, Russia

E-mail: [email protected];

2 Воронежский институт высоких технологий, Россия, 394043, г. Воронеж, ул. Ленина, 73 а Voronezh Institute of High Technologies, 73 а Lenin St, Voronezh, 394043, Russia

E-mail: [email protected]

Аннотация. Статья продолжает тему публикации, посвященная распознаванию звуковых сигналов, в том числе и кашлевых толчков, с использованием различных математических методов.

Resume. The article continues the theme of the publication dedicated to the recognition of sounds, including cough shocks, using various mathematical methods.

Ключевые слова: звуковой сигнал, кашлевой толчок, корреляционный анализ, информационная система, преобразование Фурье, Вейвлет преобразование.

Key words: beep, cough push, correlation analysis, information systems, Fourier transform, wavelet transform.

Проблема распознавания имеет огромное значение в условиях информационных перегрузок, когда человек не может справиться с линейно-последовательным осознанием поступающей информацией, вследствие чего его разум переходит в режим одновременности восприятия и мышления, для которого такая работа характерна.

Именно поэтому проблема распознавания оказалась в поле междисциплинарных исследований. Т.к. с распознаванием в жизни мы встречаемся повсюду, от военного дела и систем безопасности до оцифровки аналогового сигнала.

Область распознавания звуковых сигналов охватывает широкий круг задач, начиная от акустической диагностики в технике и в медицине и заканчивая распознаванием слитной речи. Распознавание речи - широко изучаемая тема. Чаще всего оно происходит в три этапа: получение голосового сигнала и предварительная обработка речи, распознавание фонем и слов, понимание речи. Распознавание звука - менее изученная тема, но не менее важная в научной сфере.

Первоначально, при распознавании необходимо определить качество звуковой записи,

определить уровень помех и искажений. После определения, производим фильтрацию звуковой записи от высоких и низких частот.

Затем, благодаря накопленным специализированным знаниям и опыту, используем математическое моделирование, которое стало мощным инструментом анализа процессов для распознавания звуковых сигналов, а в частности - кашлевых моментов в звуковых записях. В особой мере это касается рассмотрения, и создания комплекса правил вывода для воздействия на разнообразные факторы и характеристики аудиозаписи. Возможности прямой обработки записи при этом, как правило, ограничены, в то время как созданная с использованием доступных экспериментал ь-ных данных математическая модель позволяет обеспечить подробную детализацию и оценить вза-

имное влияние различных параметров друг на друга, а также на распознавание звуковых сигналов в целом. Одним из главных условий эффективности вычислительного эксперимента является адекватность математической модели протекающим при распознавании кашлевых толчков.

Математическая модель, представленная в данной статье, представляет собой комплекс правил, основанных на нечеткой логике. В качестве лингвистических переменных для нечеткой логики приняты реальные математические понятия, такие как коэффициент корреляции Пирсона, среднеквадратическое отклонение, дисперсия, Байесовская оценка, быстрое преобразование Фурье, интегральная оценка.

Первоначально выбран корреляционный анализ, который и стал первой лингвистической переменной в разработанных правилах. Он позволяет сделать выводы о количестве кашлевых толчков для выбранного эталона. Применялся коэффициент корреляции Пирсона

rP =

xy

Проверялась статистическая гипотеза значимости силы корреляционной связи: сильная: ±0,7 до ±1; средняя: ±0,3 до ±0,699; слабая: 0 до ±0,299 [1].

Следующей используемой лингвистической переменной было быстрое преобразование Фурье, которые дало возможность выделить такие частотные диапазоны, в которые попадают только звуки кашлей и не попадают звуки шумов. Эмпирическим путем было выявлено 6 таких диапазонов. Так, на рисунке 1 показано, что спектры кашля и шума, преобразованные быстрым преобразованием Фурье, в большинстве случаев различаются [2]. Преобразованный звуковой сигнал кашля близок к прямой линии относительно оси ординат или под углом к ней. Так же, есть шумы очень похожие на кашель (рис. 2).

Рис. 1. Изображение кашля и шума: 0 - кашель; * -шум.

Fig. 1 Picture of coughing and noise: 0 - cough; * -noise.

Рис. 2. Изображение кашля и шума, близкого к кашлю: $ - кашель; * - шум. Fig. 2. Picture of coughing and noise, close to the cough: $ - cough; * -noise.

Применение нечеткой логики улучшило анализ звуковой записи и позволило производить выбор кашлевых моментов с большей степенью уверенности, но однозначности результатов выбора достичь так и не удалось.

Как описывалось выше, для использования нечеткой логики в качестве лингвистических переменных были взяты математические понятия. Описание лингвистических переменных представлено в таблице 1.

Таблица 1

Переменная из набора Коэффициент корреляции Отклонение амплитуд Среднее значение отрицательной амплитуды Среднее значение положительной амплитуды

N Коэффициент корреляции Отклонение амплитуд Среднее значение отрицательной амплитуды Среднее значение положительной амплитуды

T Высокий, средний, низкий Высокое, среднее, низкое Высокое, среднее, низкое Высокое, среднее, низкое

X [0;1] [0;1] [0;1] [0;1]

G Не, очень, не очень Не, очень, не очень Не, очень, не очень Не, очень, не очень

В результате использования лингвистических переменных сформулируем следующие правила вывода:

ЕСЛИ все показатели низкие, ТО Шум;

ЕСЛИ один из показателей средний остальные низкие, ТО Шум;

ЕСЛИ один из показателей высокий остальные низкие, ТО Шум;

ЕСЛИ все показатели средний, ТО возможно кашель;

ЕСЛИ один из показателей низкий остальные высокие, ТО возможно кашель;

ЕСЛИ один из показателей высокий остальные средние, ТО возможно кашель;

ЕСЛИ одна половина показателей высокие, а другая низкие, ТО возможно кашель;

ЕСЛИ один показатель средний остальные высокие, ТО кашель;

ЕСЛИ все показатели высокие, ТО кашель [1,6].

Применение нечеткой логики повысило результативность анализа звуковой записи и позволило производить выбор кашлевых толчков с наибольшей степенью уверенности, но точности результатов на данном этапе разработки не удалось достичь. К имеющимся математическим параметрам анализа добавили дополнительные, такие как интегральная ошибка, средняя амплитуда и чувствительность настройки выборки.

В результате обработки звуковой записи происходит градация на три пункта: кашель, возможно кашель и шум. Так как необходима четкая градация на кашель и шум, возникает необходимость модифицировать (расширить, дополнить и качественно изменить) алгоритм анализа звуковой записи и выбора кашлевых толчков. Следующим шагом работы является добавление в алгоритм не используемого ранее Вейвлет преобразования, рассмотрев которое, выделен диапазон, в котором кашлевые толчки имеют большее количество пиков, чем шумы (рисунок 3).

DWT. Мощность спектра аудиосигнал!

200 400 600 800 1000 1200 1400 1600 1800 2000

Частота (Гц)

Рис. 3. Вейвлет преобразование кашлевого толчка Fig. 3. The wavelet transform of cough shock

На рисунке 4 представлено Вейвлет преобразование шума.

Рис. 4. Вейвлет преобразование звукового сигнала шума Fig. 4. The wavelet transform of sound signal in noise

Рассмотрев и проанализировав математические параметры и составив из них правила вывода, провели доработку информационной системы и получили программный продукт распознавания кашлевых толчков в записи пациента (рисунок 5).

После запуска программа разбивает всю запись на отрезки равной длины, затем происходит выбор эталона. На следующем этапе, используя правила вывода, производятся расчеты относительно выбранного эталона. Результатом работы является качественное разделение фрагментов на «кашель» и «шум». Если фрагмент - «шум», то он становится красного цвета, если «кашель» -цвет остается прежним.

Рис. 5. Рабочее окно программного продукта Fig. 5. Working window of the software product

Таким образом, в данной статье приведены результаты исследования звуковой записи на возможность разделения ее на фрагменты «кашель» - «шум». Был применен комплексный метод, среди компонентов которого можно выделить следующие:

- частотные преобразования звуковых записей (или звуковых фрагментов), к ним относятся быстрое преобразование Фурье и Вейвлет преобразование;

- использование четких математических параметров, которые применяют для оценки тесноты связи элементов - корреляционный анализ, интегральная ошибка, средняя амплитуда и чувствительность настройки выборки;

- применение элементов нечеткой логики (лингвистических переменных) для разработки правил вывода на основе нечетких параметров. В качестве лингвистических переменных использовались различные математические параметры с реальными численными значениями.

Каждый из компонентов комплексного метода вводился в алгоритм определения кашле-вых моментов поэтапно, что делало результат в определении кашлевых моментов более достоверным и точным. Итогом проведенного анализа является разработанный программный продукт, рабочее окно которого представлено на рисунке 5. Результаты, представленные в данной статье, не являются конечными, проблема распознавания кашлевых моментов требует дальнейших исследований, и еще большей проработки.

Список литературы References

1. McLuckie A. 2009. Respiratory disease and its management. New York, Springer, 5l.

2. Заде Л.А. l976. Понятие лингвистической переменной и его применение к принятию приближенных решений. М., Мир, l65.

Zade L.A. l976. Ponjatie lingvisticheskoj peremennoj i ego primenenie k prinjatiju priblizhennyh reshenij. M., Mir, l65.

3. Абрамов Г.В., Овсянников Е.С., Коробова Л.А., Матыцина И.А. 20l3. Разработка информационной системы для диагностики состояния больных легочными заболеваниями. Сборник трудов II международной научной интернет-конференции «Математическое и компьютерное моделирование в биологии и химии» в 2 томах. Казань: ИП Синяев Д.Н., 2: 4-l0.

Abramov G.V., Ovsjannikov E.S., Korobova L.A., Matycina I.A. 20l3. Razrabotka in-formacionnoj sistemy dlja di-agnostiki sostojanija bol'nyh legochnymi zabolevanijami. Sbornik trudov II mezhdunarodnoj nauchnoj internet-konferencii «Matematicheskoe i komp'juternoe modelirovanie v biologii i himii» v 2 tomah. Kazan': IP Sinjaev D.N., 2: 4-l0.

4. Абрамов Г.В., Коробова Л.А., Матыцина И.А. 20l4. Разработка правил вывода при распознавании звуковых сигналов. IV международная научно-практическая конференция "Фундаментальная наука и технологии - перспективные разработки", USA. North Charleston, 3: l45-l48.

Abramov G.V., Korobova L.A., Matycina I.A. 20l4. Razrabotka pravil vyvoda pri ras-poznavanii zvukovyh signalov. IV mezhdunarodnaja nauchno-prakticheskaja konferencija "Fundamental'naja nauka i tehnologii - perspek-tivnye razrabotki", USA. North Charleston, 3: l45-l48.

5. Шилдт Г. 2007. Полный справочник по Java. Java SE™ 6 Edition (7-e издание). М., Вильяму l040.

SHildt G. 2007. Polnyj spravochnik po Java. Java SE™ 6 Edition (7-e izdanie). M., Vil'jamc, l040.

i Надоели баннеры? Вы всегда можете отключить рекламу.