Научная статья на тему 'Распознавание коротких речевых команд с использованием аппарата искусственных нейронных сетей'

Распознавание коротких речевых команд с использованием аппарата искусственных нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
131
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дроков И. Н., Хусаинов Н. Ш.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Распознавание коротких речевых команд с использованием аппарата искусственных нейронных сетей»

Секция математического обеспечения и применения ЭВМ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Глобальная спутниковая радионавигационная система ГЛОНАСС / Под ред. В.Н. Харисова, А.И. Перова, В.А. Болдина. - М.:ИПРЖР, 1999.

УДК 681.51

И.Н. Дроков, Н.Ш. Хусаинов

РАСПОЗНАВАНИЕ КОРОТКИХ РЕЧЕВЫХ КОМАНД С ИСПОЛЬЗОВАНИЕМ АППАРАТА ИСКУССТВЕННЫХ НЕЙРОННЫХ

СЕТЕЙ

Распознавание коротких речевых команд (длительностью 0,5-1 с) является актуальной проблемой в области управления робототехническими и информационными системами, а также ограничения несанкционированного доступа.

Одним из наиболее распространенных подходов к решению задачи классификации и распознавания образов (в данном случае - в виде речевых команд) является использование искусственных нейронных сетей (ИНС), которые обладают свойствами обобщения информации и способны внутри себя классифицировать данные с определенными признаками.

Использование амплитуд аудиосигнала непосредственно в качестве входов для ИНС нерационально, поскольку речевой сигнал представляет собой динамический процесс с большим объемом входных данных и изменяющимися частотными характеристиками. Для получения оценок средних амплитудно-частотных свойств сигнала на коротком временном интервале в работе используется преобразование Фурье.

Т аким образом, разрабатываемую систему распознавания можно представить в виде двухуровневой схемы обработки и анализа речевых сообщений. Т акой подход позволяет выделить на первом уровне с помощью преобразования Фурье основные свойства сигнала, а на втором уровне нейросеть будет производить анализ этих свойств и классифицировать их по типам команд.

Выполнена программная реализация модулей обучения нейронной сети и распознавания (определения номера команды на выходе) с ее использованием. Проведенные экспериментальные исследования показали, что точность распознавания речевых команд составляет более 70 %, после обучения нейросети на несколько дикторов система также будет обладать свойством дикторонезависимости.

Дальнейшее развитие системы заключается в повышении точностных характеристик системы распознавания речевых команд и исключении распознавания неизвестных системе команд.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Хайкин, Саймон. Нейронные сети: полный курс. - 20-е изд., испр.: Пер. с англ. - М.: ООО «Вильямс», 2006.

i Надоели баннеры? Вы всегда можете отключить рекламу.