Научная статья на тему 'СТРУКТУРНАЯ СХЕМА БЛОКА РАСПОЗНАВАНИЯ РЕЧИ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ'

СТРУКТУРНАЯ СХЕМА БЛОКА РАСПОЗНАВАНИЯ РЕЧИ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
66
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА РЕЧЕВЫХ СИГНАЛОВ / РАСПОЗНАВАНИЕ РЕЧИ / ГОЛОСОВОЕ УПРАВЛЕНИЕ / SPEECH SIGNAL PROCESSING / SPEECH RECOGNITION / VOICE CONTROL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тохиров Р., Тургунов Б., Мухаммаджонов Х.

Работа в области обработки речевых сигналов ведется достаточно активно. Представлены аналитический обзор и классификация существующих методов обработки, применяемых в системах распознавания речи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STRUCTURAL SCHEME OF THE SPEECH RECOGNITION BLOCK IN THE AUTOMATED CONTROL SYSTEM

Work in the field of speech signals processing is quite active. The article presents an analytical review and classification of the existing processing methods applied in speech recognition systems.

Текст научной работы на тему «СТРУКТУРНАЯ СХЕМА БЛОКА РАСПОЗНАВАНИЯ РЕЧИ В АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ»

УДК 004.934.5

Тохиров Р. старший преподаватель Тургунов Б. студент Мухаммаджонов Х.

студент ТУИТ Ферганский филиал Toxirov Rustam senior teacher Turgunov Bahodir student

Muxammadjonov Hojiakbar

student TUIT Fergana branch Fergana city, Uzbekistan СТРУКТУРНАЯ СХЕМА БЛОКА РАСПОЗНАВАНИЯ РЕЧИ В

АВТОМАТИЗИРОВАННОЙ СИСТЕМЕ УПРАВЛЕНИЯ Аннотация. Работа в области обработки речевых сигналов ведется достаточно активно. Представлены аналитический обзор и классификация существующих методов обработки, применяемых в системах распознавания речи.

Ключевые слова: обработка речевых сигналов, распознавание речи, голосовое управление.

STRUCTURAL SCHEME OF THE SPEECH RECOGNITION BLOCK IN THE AUTOMATED CONTROL SYSTEM Abstract. Work in the field of speech signals processing is quite active. The article presents an analytical review and classification of the existing processing methods applied in speech recognition systems.

Key words: speech signal processing, speech recognition, voice control.

Конец ХХ и начало XXI в. ознаменовались началом истории развития речевых технологий, важную роль в которых получили системы распознавания речи. Наиболее известными в этой области являются работы следующих авторов: Б. М. Лобанов, Т. К. Винцюк, А. В. Фролов, Л. Р. Рабинер, Р. В. Шафер, У. А. Ли, Д. Х. Клетт, Xuedong D. Huang, Hsiao -Wuen Hon, Alex Acero. Тот период стал знаменательным для решения множества фундаментальных и прикладных задач в области обработки речевых сигналов - достаточно сослаться на далеко не полный перечень трудов зарубежных и российских ученых. Однако это не стало причиной притупления интереса, и работа в области обработки речевых сигналов ведется достаточно активно и в настоящее время.

Обработка речевых сигналов - это область науки, в которой осуществляются фильтрация, усиление и извлечение информации,

кодирование, сжатие и восстановление речи. Обработка в системах распознавания речи включает следующие задачи:

• Фильтрация и подавление шума;

• Сегментация на информативные участки;

• Определение информативных параметров;

• Распознавание.

Каждая задача обработки речевых сигналов может быть реализована только с помощью определенных методов. В зависимости от области обработки методы следует разделить на три области: частотная, временная и частотно-временная. [1]

Методы обработки в частотной области заключаются в использовании всех отсчетов данных, зарегистрированных в речевом сигнале. Многие речевые сигналы имеют специфический частотный состав и занимают характерные спектральные области. Методы обработки в частотно-временной области представляют собой методы, включающие все преимущества временного и частотного анализов с минимальными проявлениями их недостатков.

Проведенный обзор известных методов обработки речевых сигналов и собственные исследования выявили, что в зависимости от обработки методы следует разделить на группы, реализованные различными видами анализа:

• с использованием преобразования Фурье (ПФ);

• с использованием вейвлет -преобразования (ВП);

• с использованием декомпозиции на эмпирические моды (ДЭМ) и преобразования Гильберта - Хуанга (ПГХ);

• с использованием нейронных сетей (НС);

• с использованием скрытых марковских моделей (СММ);

• с использованием динамического трансформирования времени (ДТВ).

Приведенные в классификации методы нашли широкое применение в системах распознавания речи. [2]

Построение устройств распознавания речи для современных АСУ состоит из следующих основных задач:

• Выбор объектов или типов речевых единиц (фонемы, слоги, слова, морфемы, фразы);

• Выбор параметров описания речевых единиц и соответствующих методов интерпретации описаний;

• Проектирование программных средств реализации описаний выбранных объектов и распознавания.

Высокий уровень развития вычислительных средств позволяет решать задачи построения систем распознавания речи (СРР), с использованием большого числа параметров и методов, которые ориентированы на детальное изучение структуры речевого сигнала. [3]

Структурная схема блока анализа и обработки РС в существующих

системах распознавания содержит следующие дополнительные этапы обработки параметров РС, которые повышают надежность распознавания: блоки выделения полезного сигнала, блоки фильтрации сигнала и его спектра, блоки сегментации РС. На вход блока распознавания поступает сегментированная последовательность параметров РС или спектральный образ (СО). В сегментированной последовательности спектрально -временных параметров (траектории параметров) предъявленного РС сегменты находятся в некоторой зависимости от параметров предшествующих и последующих сегментов, поэтому необходимо рассматривать непрерывные траектории в терминах параметров и в терминах сегментов для решения задачи на этапе распознавания.

Наибольшей надежностью обладает пословное распознавание. Для РЕ, поступающих на блок аппроксимации, необходимым условием является следующий факт: РЕ должны иметь такую длину и быть подобраны в таком количестве, чтобы из них можно было бы построить любые другие слова или предложения. [1,4]

На основе аналитического обзора представлена классификация существующих методов обработки речевых сигналов, применяемых в системах распознавания речи. Данная классификация позволяет объективно оценить возможности существующих методов обработки речевых сигналов и предварительно дать оценку возможности применения новых математических аппаратов в задачах обработки речевых сигналов в системах распознавания речи.

Использованные источники:

1. Мещеряков Р.В., Бондаренко В.П., Организация баз знаний в системе синтеза речи // Теория и практика речевых исследований (АРСО-99). Матер. конф. - М.: МГУ им. М.В. Ломоносова, 1999. - С. 37-38.

2. Потапова Р.К. Речь: коммуникация, информация, кибернетика. - М.: Радио и связь, 1997. - 528 с.

3. Трунин-Донской В.Н. Автоматический синтез звучащего текста // Звучащий текст. - М.: Институт научной информации по общественным наукам, 1983. - С. 218-250.

4. Потапова Р.К. Речевое управление роботом. - М.: Радио и связь, 1989. - 246 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.