Научная статья на тему 'ПУТЬ ОТ АКУСТИЧЕСКОГО СИГНАЛА К РАСПОЗНАННОМУ ТЕКСТУ: МЕХАНИЗМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ РЕЧИ'

ПУТЬ ОТ АКУСТИЧЕСКОГО СИГНАЛА К РАСПОЗНАННОМУ ТЕКСТУ: МЕХАНИЗМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ РЕЧИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
47
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПУТЬ ОТ АКУСТИЧЕСКОГО СИГНАЛА К РАСПОЗНАННОМУ ТЕКСТУ: МЕХАНИЗМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ РЕЧИ»

T. G. Meshcheryakova, A. V. Ryzhkov, V. V. Chekryzhov

Мещерякова Татьяна Геннадиевна Рыжков Александр Васильевич Чекрыжов Вячеслав Витальевич

nauka@noctula.ru Тульский государственный педагогический университет им.

Л. Н. Толстого факультет математики, физики и информатики (магистратура, 2 год обучения) Научный руководитель: Д. М. Федорович, начальник научно-исследовательского отдела ПУТЬ ОТ АКУСТИЧЕСКОГО СИГНАЛА К РАСПОЗНАННОМУ ТЕКСТУ: МЕХАНИЗМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ РЕЧИ

научно-популярное эссе

Meshcheryakova Tatyana G.

Ryzhkov Aleksandr V. Chekryzhov Vyacheslav V.

Tula State Lev Tolstoy Pedagogical University The Faculty of Mathematics, Physics and Informatics (2nd year of master's degree) Scientific Advisor - D. M. Fedorovich, the head of research department THE PATH FROM AN ACOUSTIC SIGNAL TO RECOGNIZED TEXT: THE AUTOMATIC SPEECH PROCESSING MECHANISM

Popular science essay

XXI в. можно смело назвать веком искусственного интеллекта. Открытия в данной научной области совершаются чуть ли не каждый день и быстро находят применение на практике. Одним из них является автоматическое распознавание речи.

Системы автоматического распознавания речи имеют широкое применение (Рис. 1). Почти каждый человек в повседневной жизни использует их, отправляя голосовое сообщение в социальной сети, включая музыку, активируя умную колонку с голосовым помощником и т.д. Но каждый ли задумывается о том, какой пусть проходит голос, чтобы искусственный интеллект распознал текст?

Мещерякова Т. Г., Рыжков А. В., Чекрыжов В. В.

Время науки

The Times of science

Рис. 1. Применение распознавания голоса

Процесс идентификации речи представляет сложную многоуровневую систему, в которой происходит анализ и структурирование полученных данных для преобразования в текст. Однако при речевом вводе можно столкнуться с рядом трудностей: от психофизического состояния человека и индивидуальных особенностей речи диктора до высокого уровня шума, помех, эха и качества звукозаписывающей аппаратуры (Рис. 2).

Рис. 2. Сложности при распознавании речи

Программа автоматического распознавания речи не может содержать шаблон для каждого потенциального пользователя, поэтому сначала её учат «понимать», что говорит конкретный человек. Для этого он несколько раз произносит определенное слово или фразу в микрофон. Программа сохраняет этот пример в виде шаблона, а затем формирует словарь из нескольких сотен слов и коротких фраз.

Рассмотрим механизм автоматического распознавания речи подробнее (Рис. 3).

10

№з

Мещерякова Т. Г., Рыжков А. В., Чекрыжов В. В.

Т. О. МезИсИегуакоуа, А. V. ЯугИкоу, V. V. СИекгугИоу

Рис. 3. Схема системы автоматического распознавания речи

Все начинается с получения речевого сигнала и преобразования его в цифровой ряд. Далее он разбивается на множество частей определенного размера для облегчения последующей обработки. К каждой части подбирается наиболее точное слово. В этом процессе должны учитываться ограничения, которые накладываются акустической, лексической и языковой моделями. Например, в качестве акустической модели может выступать сохраненный пример слова. В процессе распознавания нужно использовать обучающие данные, чтобы определить значения параметров для преобразованных частей речевого сигнала. После прохождения всех этапов речь человека превращается в распознанный текст.

И пусть в результате автоматической обработки речевого сигнала нередко возникают ошибки, можно с уверенностью сказать, что эта область ещё удивит нас открытиями.

i Надоели баннеры? Вы всегда можете отключить рекламу.