Научная статья на тему 'Частотно-импульсное кодирование звуковых сигналов'

Частотно-импульсное кодирование звуковых сигналов Текст научной статьи по специальности «Физика»

CC BY
578
54
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по физике, автор научной работы — Варданов Евгений Борисович, Коряк Сергей Федорович, Маленченко Зоя Юрьевна, Шабанов-Кушнаренко Юрий Петрович

Изложена теория частотно-импульсного кодирования звуковых сигналов, обеспечивающего идентичность слухового восприятия натуральногго и кодированного звуков. Усилен обощенный закон Талбота, экспериментально определены численные значения параметров кода звука, обеспечивающие натуральность звучания. Установлена линейность зависимости критического тактового интервала от минимального интервала между соседними импульсами синхронизированного частотно-импульсного кода звука.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по физике , автор научной работы — Варданов Евгений Борисович, Коряк Сергей Федорович, Маленченко Зоя Юрьевна, Шабанов-Кушнаренко Юрий Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Частотно-импульсное кодирование звуковых сигналов»

8. J. Gordon Strong primes are easy to find. — In LNCS 200. Eurocrypt 84, 1984. Р.Ш-115. 9. J.M. Pollard. A monte-carlo method for factorization. BIT, 15. 1975. Р. 331-334. 10. Lenstra H.W., Jr. Primality testing algorithms (after Adleman, Rumely and Williams), Sem. Bourbaki, 1980/ 1981. Vol. 33. P. 67-73. 11. Smith P. LUC public key encryption. Dr. Dobb‘s Journal (January 1993). P. 100-108. 12. Smith P. Cryptography without exponentation. Dr. DOB’s Journal (April 1996). P. 120-123. 13. Виноградов И. М. Основы теории чисел. М.: Наука, 1981. 300 c. 14. J. BrillHard, D. H. Lehmer, and J. L. Selfridge. New primality criteria and factorizations of 2m±1. Math. Comp., 1975. 29. P. 50-58. 15. D. H. Lehmer. An extended theory of Lucas functions. Annals of Math., 31. 1930. P. 419-448. 16. Y. V. Linnik. On

the least prime in the aritjmetic progression i. The basic theorem. Mat. Sbornik 15(57) 1944. P. 111-117.

Поступила в редколлегию 12.06.98 Рецензент: д-р техн. наук, проф. Долгов В.И. Горбенко Иван Дмитриевич, д-р техн. наук., профессор, проректор по научной работе ХТУРЭ. Научные интересы: защита информации в компьютерных системах и сетях. Адрес: 310726, Украина, Харьков, пр. Ленина, 14, тел. 30-24-50, 37-56-39.

Жилин Олег Витальевич, студент ХТУРЭ. Научные интересы: защита информации в компьютерных системах и сетях. Адрес: 310064, Украина, Харьков-64, Комсомольское шоссе, 49 а, кв.33.

УДК 519.7

ЧАСТОТНО-ИМПУЛЬСНОЕ КОДИРОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ

БАРДАНОВ Е.Б, КОРЯКС. Ф, МАЛЕНЧЕНКО З.Ю, ШАБАНОВ-КУШНАРЕНКО Ю.П.

Изложена теория частотно-импульсного кодирования звуковых сигналов, обеспечивающего идентичность слухового восприятия натуральногго и кодированного звуков. Усилен обощенный закон Талбота, экспериментально определены численные значения параметров кода звука, обеспечивающие натуральность звучания. Установлена линейность зависимости критического тактового интервала от минимального интервала между соседними импульсами синхронизированного частотно-импульсного кода звука.

Введение

Неоценимым подспорьем при решении задач автоматической обработки акустических сигналов может служить изучение механизмов слухового восприятия этих же сигналов человеком. Ведь сами-то люди отлично справляются со всеми задачами обработки акустических сигналов, которые желательно решать с помощью акустической аппаратуры. Если такое изучение удастся выполнить в достаточно полном объеме, то будет открыт путь к созданию автоматически действующих приборов и систем, эффективно обрабатывающих разнообразные акустические сигналы. Одна из первоочередных задач в этой области заключается в том, чтобы выяснить те принципы и математически описать закономерности, на основе которых ухо воспринимает непрерывные колебания воздуха и превращает их в дискретную форму.

В большинстве современных приборов и систем приема, хранения и переработки акустических сигналов первым преобразованием электрического сигнала, поступающего с выхода микрофона, является его дискретизация. В этом случае принято использовать аналого-цифровой преобразователь [1]. Обычно формируется 8-12 — разрядный двоичный код ординаты решетчатой функции акустического колебания, что соответствует ее измерению примерно с двумя-тремя знаками точности. Интервал между соседними точками принимается, как правило, в пределах от 100 мкс до 1 мс. Акустическое воспроизведение подобного кода не обеспечивает иден-

РИ, 1998, № 2

тичности его восприятия с исходным звуком. В ряде случаев используют гораздо более точные коды. Например, в работе [2] описано применение 16разрядных двоичных кодов при частоте дискретизации 68 кГц. Синтезированный по такому коду звук мало отличается на слух от исходного. Широкое практическое использование дискретизации акустических сигналов выдвигает для научной проработки ряд актуальных вопросов: 1) можно ли строго обосновать правомерность дискретизации звука; 2) является ли использование аналого-цифрового преобразователя стандартного типа наилучшим способом дискретизации звукового сигнала; 3) с какой точностью и частотой следует проводить дискретизацию и на чем основывать выбор численных значений параметров дискретизации. Анализ литературных данных показывает, что ни на один из этих вопросов пока нет исчерпывающих ответов.

Обычно для обоснования правомерности дискретизации речевого сигнала ссылаются на теорему дискретизации [3], которая утверждает, что когда спектр J(ffl) функции f(t), заданной на всей вещественной оси, тождественно равен нулю при частотах ю>ю0, то по точным значениям функции f(t), найденным в точках t=0, ±2л/ю0, ±(2л/ю0)2, ..., можно полностью восстановить вид функции f(t). Основываясь на этой теореме, часто делают следующий вывод: поскольку ухо не слышит звуков при частотах выше 20 кГц, то для получения полноценного кода звука можно воспользоваться его цифровым кодом, полученным при удвоенной частоте дискретизации, равной 40 кГц [5].

Этот вывод представляется не вполне обоснованным. Во-первых, в теореме дискретизации говорится о вещественных, т.е. об идеально точных значениях функции f(t). На вопрос о том, можно ли заменить эти значения их конечными цифровыми кодами и сколько знаков надо взять в этих кодах, она вообще не дает какого-либо ответа. Между тем ясно, что идеально точно измерить значения функции f(t) при ее дискретизации практически невозможно. Во-вторых, из того факта, что ухо не слышит звуков на частотах выше 20 кГц, вовсе не следует, что в звуках, воспринимаемых слуховым анализатором, нет частот выше 20 кГц. Напротив, точно известно, что они там имеются. Более того, установлено, что часть из этих частот существенно влияет на слуховое восприятие звука. Так, известно, что исключение из акустического колебания музыкального произведения частот в диапазоне 20-40 кГц заметно обедняет звучание этого произведения. В-третьих, и это главное,

97

ухо не передает сознанию информацию об осциллограмме звука, а лишь весьма обобщенный ее образ, о чем свидетельствует, например, независимость ощущения звука от фазы отдельных его гармоник.

Ссылаются также на то, что ухо, как и любой другой измерительный прибор, обладает конечной чувствительностью и конечной полосой пропускания частот, и поэтому для него должен существовать какой-то конечный порог как по уровню сигнала, так и по времени. Следовательно, при выборе достаточно большой частоты дискретизации и достаточно высокой точности при измерении значений акустической диаграммы будет получен код речевого сообщения, содержащий в себе всю информацию, воспринимаемую человеческим ухом. В принципе, это, правильное утверждение [6], однако оно носит слишком общий характер и не может служить достаточным практическим руководством при выборе оптимального способа дискретизации речевого сигнала и установлении ее рациональных параметров. Выше говорилось, что использование 16-разрядных двоичных кодов при частоте дискретизации 68 кГц обеспечивает качество восприятия закодированного звука, близкое к натуральному. Такое кодирование требует ежесекундной передачи более миллиона бит информации. Нам не удалось обнаружить литературных данных о том минимальном ежесекундном объеме дискретной информации, который бы обеспечил идеальное по слуховому восприятию воспроизведение кода звука. Можно ли изменять этот объем информации без существенного ущерба для качественного звучания и если да, то на сколько и какими методами? Влияет ли способ кодирования звука на минимально допустимый объем передаваемой информации? На эти и многие другие подобные вопросы наука пока не дает исчерпывающих ответов [7]. Их разрешение создало бы научную основу для существенного улучшения технических характеристик акустической аппаратуры.

Очевидно, что ответ на все эти вопросы может быть получен лишь на пути психофизического изучения свойств слухового восприятия. Анализ литературных данных показывает, что до последнего времени разработки в этой области не были вполне успешными. В теории зрения, однако, удалось сделать гораздо больше, чем в теории слуха. Еще в 1834 г. англичанин Талбот [8] сформулировал закон, носящий его имя, который впоследствии был применен для разработки и обоснования практических процедур дискретизации зрительных сигналов. Согласно закону Талбота любой сигнал с неменяющейся яркостью B0 можно заменить таким специальным (в том числе и дискретным) периодически изменяющимся во времени (т.е. мелькающим) сигналом B(t), что наблюдатель не заметит каких-либо временных изменений в своем ощущении этого сигнала и воспримет его таким же, как сигнал B0.

Для визуального равенства сигналов B(t) и В0 необходимо, чтобы средняя яркость сигнала B(t) совпала с яркостью B0, т.е. чтобы имело место равенство [9]:

B

о _

T

J B(t )dt

о

T

(1)

Требуется, чтобы период T сигнала B(t) был достаточно мал. Аналогичный закон был сформулирован также и для зрительных картин, развернутых в поле зрения [10]. Насколько быстрыми должны быть световые мелькания, чтобы их не замечал глаз человека? На этот вопрос дают ответ многочисленные и тщательно выполненные опыты по определению критической частоты мельканий [11]. Аналогичные исследования были проведены и по определению критического размера мелких элементов зрительной картины для случая пространственного восприятия [10]. Эти результаты оказались весьма полезными для выбора и обоснования конкретных режимов дискретизации зрительных картин. Теория зрения, основанная на законе Талбота, в настоящее время широко применяется во всех случаях, где требуется частичная или полная дискретизация зрительного сигнала (например, в технике кино при выборе количества смены кадров в секунду, в технике телевидения при назначении густоты строк в изображении, в полиграфии при формировании точечного растра полутонового изображения).

В работе [12] было получено обобщение закона Талбота на случай зрительных картин, произвольно меняющихся в пространстве и во времени. Здесь нас будет интересовать обобщение закона Талбота лишь для зрительных картин, произвольно меняющихся во времени [12]. Пусть выбран зрительный стимул B0(t) и задана бесконечная последователь-

ность зрительных стимулов {BN (t)} N=i, удовлетво-

ряющая условию

t2 t2

lim J BN (t)dt = J B(t)dt. (2)

N ^x t1 t1

Здесь ti и t2 — произвольные фиксированные моменты времени. Обобщенный закон Талбота гласит, что ощущение, вызываемое зрительной картиной BN (t), в пределе при N^x будет неотличимо от зрительного ощущения, вызываемого картиной B(t). Условие (2) означает, что последовательность функций B1(t), B2(t), ... сходится к функции B(t) в среднем. Таким образом, согласно обобщенному закону Талбота, зрительный анализатор как бы осуществляет линейное сглаживание быстрых колебаний в диаграмме зрительного сигнала.

В психоакустике в течение многих десятилетий предпринимались настойчивые, но безуспешные попытки отыскать слуховой аналог закона Талбота [13]. При этом выяснилось, что если по аналогии со зрением под сигналом B(t) понимать меняющийся во времени энергетический уровень звукового сигнала, то в применении к слуху закон Талбота оказывается неверным. Если же под сигналом B(t) понимать диаграмму звукового давления, то закон Талбота в форме (1), будучи применен к слуху, хотя и подтверждается в опыте, однако представляет собой совершенно бессодержательное утверждение. Дело в том, что диаграмма звука B0 с постоянным уровнем звукового давления не воспринимается ухом, она попросту неслышима. Не-

98

РИ, 1998, № 2

слышимым оказывается также и любой периодический звуковой сигнал B(t), удовлетворяющий условию (1), если сделать достаточно малым его период (при T<50 мкс).

В 1977 г. в работе [14] была впервые продемонстрирована применимость к слуху обобщенного закона Талбота в форме (2). Сигналы B0(t) и BN (t) интерпретируются как функции зависимости звукового давления от времени. В экспериментах произвольно выбираемые звуки B0(t) (шумы, дикторская речь, музыкальные произведения) периодически прерывались с различной скважностью X и с периодом Т. Одновременно с этим для удовлетворения условия (2) прерывистый сигнал усиливался в 1/X раз. Сформированный описанным способом прерывистый сигнал принимался в качестве слухового стимула BN (t), где под N подразумевается частота прерывания сигнала N=1/T. Опыты показали, что при N>30 кГц любой звук B0(t) неотличим от соответствующего ему прерывистого звука BN (t).

Важно отметить, что в формулировке обобщенного закона Талбота имеется существенный недостаток: в ней никак не участвует понятие критической частоты слуха. Это — закон предельный, идеализированный, не пороговый. Поэтому обобщенный закон Талбота не дает ответа на вопрос о том, каким параметром оценивать степень близости звука BN (t) к звуку B0(t) и при каком значении этого параметра ощущения звуков BN (t) и B0(t) совпадут. Представляется интересным, как в теоретическом плане, так и с практической точки зрения, попытаться так усилить формулировку обобщенного закона Талбота, чтобы в ней непосредственно появился слуховой порог. Это позволило бы разработать научные основы расчета рациональных параметров дискретизации акустического сигнала и выбрать метод дискретизации. Это также позволило бы изучить экспериментальными методами конкретные значения величин порогов в слухе при различных условиях слухового восприятия.

В настоящей статье была поставлена задача изучить и математически описать закономерности преобразования непрерывного слухового стимула (акустической диаграммы) в дискретный образ. Для этого необходимо выяснить, при каких параметрах преобразования “аналог-код” достигается идентичность слухового восприятия исходного звука и его дискретного образа. Отправным пунктом этого исследования явилось использование эффекта сглаживания в слухе. Оно привело к выводу о том, что естественной формой представления дискретного слухового образа звука может служить частотноимпульсный код акустической диаграммы. К разработке выдвинуты следующие два вопроса: 1) при каких условиях обеспечивается идентичность ощущений натурального слухового стимула и его асинхронного частотно-импульсного кода; 2) как сказывается на слуховом равенстве синхронизация частотно-импульсного кода звука. Чтобы решить поставленные вопросы, пришлось разработать теоретические основы построения асинхронных и синхронизированных частотно-импульсных кодов, совпадающих по слуховому ощущению с исходным звуком; разработать специальную аппаратуру для преобразования диаграммы звука в коды требуемо-

го вида, допускающую регулирование в широких пределах режимов преобразования; выполнить специальные опыты по установлению равенства или неравенства слуховых ощущений, возбуждаемых натуральными звуками и их дискретными эквивалентами.

1. Усиленный обобщенный закон Талбота

Изучим некоторые свойства слуха, и на этой основе разработаем способ достаточно экономного дискретного представления звуков речи. В качестве отправного пункта исследования используем обобщенный закон Талбота, о котором говорилось выше. Обобщенный закон Талбота устанавливает достаточное условие слухового равенства произвольных звуков. Испытуемый сравнивает свои ощущения звука A(t) и одного из звуков бесконечного ряда Bx(t), B2(t), ... Закон гласит, что при выполнении условия (2) по мере продвижения вправо вдоль

ряда {B,} “j ощущение звука B,(t) будет приближаться к ощущению звука A(t), и в пределе при i^-x сравниваемые звуки будут восприниматься на слух как совершенно идентичные.

Любой звук будем формально характеризовать его акустической диаграммой, т.е. зависимостью давления воздуха (звукового давления) от времени, заданной на интервале [0, То]. Будем рассматривать звуки, диаграммы которых плавно (непрерывно) меняются во времени. Такие звуки будем обозначать символом A(t). К их числу относится большинство звуков естественного происхождения, в том числе и звуки речи. Кроме непрерывных, будем использовать некоторые искусственно формируемые звуки, диаграммы которых имеют разрывы (скачки) и бесконечные выбросы (импульсы). Такие звуки будем обозначать символами B1(t), B2(t), ... . К диаграммам этого вида будем предъявлять единственное требование: они должны быть локально суммируемыми. Это означает, что при любых пределах й и t2, принадлежащих интервалу времени [0, Т0], интеграл от акустической диаграммы B(t) должен быть конечным. Иными словами,

h

I Bi(t)dt <X (i=1, 2, ...). (3)

t1

Ясно, что требование (3) для любых звуков, которые можно практически сформировать, выполняется.

Приведем видоизмененную (несущественно) формулировку обобщенного закона Талбота, которая более удобна для наших целей. Пусть A(t) — диаграмма некоторого звука и {Bro(t)}roe(0jx) — бесконечное множество акустических диаграмм, где ю — вещественное положительное число. Тогда обобщенный закон Талбота запишем в следующей форме: Если при любых t\ и t2

h h

lim |Вю (t)dt = | A(t)dt, (4)

®^x t1 t1 v

то в пределе при неограниченном увеличении числа ю ощущение звука Bro(t) совпадет с ощущением звука A(t). Записанная формулировка обобщенного закона Талбота отличается от исходной лишь тем, что в ней натуральное число Заменено положительным вещественным числом ю.

РИ, 1998, № 2

99

Экспериментальная проверка обобщенного закона Талбота показывает [14], что при выполнении условия (4) ощущение звука A(t) действительно приближается к ощущению звука Bro(t), если неограниченно увеличивать число ю. Обнаруживается даже нечто большее: ощущения звуков A(t) и Bro(t) становятся неотличимыми не только в пределе, но уже при подходе к нему. Это означает, что, увеличивая в эксперименте число ю, мы рано или поздно приходим к такому его значению ю0, когда при любом ю>ю0 будет наблюдаться слуховое равенство звуков A(t) и Bro(t). Таким образом, факты показывают, что имеется возможность несколько усилить обобщенный закон Талбота, превратив его из предельного утверждения о звуке A(t) и бесконечной последовательности звуков |Bro(t)| ює (0,х) в высказывание о слуховом равенстве двух звуков A(t) и Bю(t), где ю>юо.

Изложенные соображения приводят к следующей формулировке усиленного обобщенного закона Талбота. Если звук A(t) и множество звуков {Вю(^}ює(0,о>) удовлетворяют условию (4), то найдется такое число юо>0, что для любого ю>юо ощущение звука Bx(t) совпадет с ощущением звука A(t). В защиту сформулированного закона слуха скажем следующее. Предположим, что усиленный обобщенный закон Талбота неверен. Тогда, какое бы большое число ю0 мы ни взяли, всегда найдется такое число ю>ю0, для которого звуки Ba>(t) и A(t) будут восприниматься как различные. В этом случае, чтобы убедиться в истинности исходного обобщенного закона Талбота, пришлось бы увеличить число ю до бесконечности, что практически невозможно сделать. Таким образом, при невыполнении усиленного обобщенного закона Талбота истинность исходного закона было бы невозможно проверить в эксперименте. В результате приходим к выводу: если обобщенный закон Талбота подтверждается на практике, то должен быть верен также и усиленный обобщенный закон Талбота.

Новая формулировка закона слуха является в логическом смысле более сильным утверждением, чем исходная. Для доказательства этого положения достаточно формально вывести прежнюю формулировку закона из новой и показать, что обратный вывод, вообще говоря, невозможен. Сделаем это. Предположим, что выполняется усиленный обобщенный закон Талбота.

Тогда из условия (4) вытекает существование числа ю0>0 такого, что для любого ю>ю0 ощущение звука Ba>(t) совпадет с ощущением звука B(t). Отсюда непосредственно следует, что и в пределе при ю^-х ощущение звука Bo(t) совпадет с ощущением звука A(t).

Вместе с тем ясно, что если из условия (4) вытекает равенство ощущений звуков Ba>(t) и A(t) в пределе при ю^х, то отсюда, вообще говоря, вовсе не следует логически, что найдется такое число ю0, что при любом ю>ю0 будет иметь место равенство ощущений звуков Ba>(t) и A(t). Этим обстоятельством оправдывается использование слова “усиленный” в названии новой формулировки закона слуха.

В усиленном обобщенном законе Талбота речь идет о существовании некоторого числа ю0>0. Выбор его не единственен. В самом деле, если в качестве ю0 подходит некоторое число а, то в этой

же роли подойдет также и любое другое число р>а. Очевидно, однако, что множество M всех чисел, каждое из которых можно использовать в роли числа ю0, ограничено снизу.

Нижнюю границу множества M обозначим символом юкр и назовем критическим значением параметра ю. Важно обратить внимание на то, что величину юкр было бы неправильно априори считать ни от чего не зависящей (т.е. абсолютной) константой. Логически возможно, чтобы число юкр зависело от звука A(t) и от множества звуков {Bra(t)}a^ (0х). Важно экспериментально определить величину юкр для различных типичных видов звуков, например, когда A(t) есть звук речи или музыка, и различных способов кодирования звука (например, различные варианты частотно-импульсной модуляции).

2. Асинхронный частотно-импульсный код звука

Для звука A(t) построим семейство {Ba>(t)}a^ (0,х) частотно-импульсных кодов, удовлетворяющее условию (4). Пусть A(t) — диаграмма произвольно выбранного звука речи, ординаты которой на всем интервале задания [0, T0] ограничены по абсолютному значению фиксированным положительным числом а:

-а<Л(і)<а, (0<t<T0). (5)

Для любых реальных звуков речи условие (5) может быть практически выполнено при подходящем выборе числа а, которое принимаем равным

а = max| A(t )| (6)

Выберем некоторое вещественное число а0, удовлетворяющее условию

а0 >а. (7)

Введем положительный вещественный параметр є и связанный с ним параметр ю, изменяющийся на интервале (0,х) и определяемый формулой

ю =—-----. (8)

є

Построим последовательность моментов времени 91, 02, ..., 9m, задавая последние равенствами:

91 02

J(A(t) + a0)dt = є, J(A(t) + a0)dt = є,...,

0 01

9m (9)

J (A(t) + a0)dt = є.

9m-1

В качестве числа m принимаем наибольшее из натуральных чисел, удовлетворяющее условию

9m <T0. (10)

В моменты времени 91, 92, ..., 9m формируем короткие стандартные импульсы, каждый из которых охватывает площадь є. Полученную последовательность импульсов, после ее смещения вниз на величину а0, принимаем в качестве диаграммы звука Bo>(t), которую можно с достаточной точностью представить аналитически в следующем виде:

вю(t) = -ао +є£8(t-9г). (11)

І = 1

Здесь 8(t-9j) — функция Дирака. Она задает импульс пренебрежимо малой длительности, возникающий в момент времени 9,, который охватывает

100

РИ, 1998, № 2

единичную площадь. Акустическую диаграмму Ba(f) назовем асинхронным частотно-импульсным кодом звука A(t).

Описанный способ формирования асинхронного частотно-импульсного кода Brn(t) звука A(t) проиллюстрируем с помощью рис. 1, где изображен пример диаграммы звука A(t) (а) и асинхронный частотно-импульсный код Bro(t) звука A(t) (б). Очередной импульс вырабатывается в тот момент, когда под кривой A(t)+а0 накапливается площадь величины s. После появления импульса процесс накопления площади начинается снова.

Согласно формуле (4) уменьшение s ведет к увеличению частоты ю.

Докажем, что построенное описанным выше способом множество {Bro(t)}roe(o,«) асинхронных частотно-импульсных кодов звука A(t) удовлетворяет условию (4). Выберем на интервале [0, 70] произвольным образом моменты времени t1 и t2, полагая, что t1<t2. Когда t1=t2, то условие (4), очевидно, выполняется. Обозначим через p такое наименьшее натуральное число и через q такое наибольшее натуральное число, для которых выполняются соотношения

ti<0p, 0q<t2, (1<p<q<m). (16)

Легко видеть, что при достаточно большом ю числа p и q всегда существуют. Согласно (11) имеем:

h2 ?2 h2 m

J Вю (t)dt = - J a0dt + J s 2 S(t -0j)dt =

h h h j=1

q h2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= a0(t1 -t2) + s^ JS(t - dj)dt = a0(t1 -t2) + s(q - p +1).

j=it1

С использованием зависимости (9) находим:

t2 12 t2

J A(t)dt = J(A(t) + a0)dt - J a0dt =

t1 t1 t1

0 p-1 0q

= J (A(t) + a0)dt + J(A(t) + a0)dt +

ti 0 p-i

t2

+ J(A(t) + a0)dt + a0(t1 -12) =

0 q

t1

= - J (A(t) + a-)dt + s(q - p +1) +

0 p-i t2

+ J (A(t) + a0)dt + a0(t1 -12).

Qq

Далее получаем:

Если бы A(t)=-a, т.е. если бы уровень звукового давления на всем интервале задания акустической диаграммы A(t) был равен своему наименьшему возможному значению, то все интервалы между соседними импульсами асинхронного частотно-импульсного кода Bro(t) звука A(t) были бы одинаковыми и достигали своей максимально возможной величины

T = -

- а. (12)

Последнее равенство непосредственно вытекает из уравнений (9) при подстановке в них A(t)=-a и учете того факта, что

7=0г-0г-1, (1<i<m). (13)

Здесь имеется в виду, что

00=0. (14)

Используя (4), получаем

ю=1/7. (15)

Таким образом, физический смысл параметра ю следующий. Это есть минимальная частота следования импульсов в асинхронном частотно-импульсном коде Bo(t) звука A(t). Частоту ю можно регулировать практически, изменяя величину площади s, охватываемой каждым стандартным импульсом.

в

t2 12

J Вю (t)dt - J A(t)dt

t1

t1

ti h

J (A(t) + a0)dt - J (A(t) + a0)dt

0 p-i 0q

<

< J (A(t) + a0)dt +J(A(t) + a0)dt <

0p-i 0 q

h1 h2

< J (а + a0)dt +J(а + a0)dt <

0 p -1 0 q

< (ti - qp-i)(a + a0) + (t2 - qq)(a + a0) < T(a + a0) +

а + ап

+ T (a + a0) = 2--.

ю

Выполненные выкладки приводят к следующему результату:

lim

h2 h2

J Вю (t)dt - J A(t)dt

h1

h1

= 0.

(17)

Это означает, что построенное множество {B(B(t)}iBe (0,a>) асинхронных частотно-импульсных кодов звука A(t) удовлетворяет условию (4).

РИ, 1998, № 2

101

3. Критическая частота

Выше был рассмотрен способ формирования семейства {5ю(/)}ює(оГО) асинхронных частотно-импульсных кодов звука A(t), удовлетворяющего условию (4). Согласно усиленному обобщенному закону Талбота, для этого семейства должно существовать критическое значение юкр параметра ю. Величину юкр назовем критической частотой следования импульсов в асинхронном частотно-импульсном коде Bro(t) звука A(t). В соответствии с определением критической частоты, если на всем интервале [0, Т0] задания звуков частота следования импульсов в звуке Bro(t) превышает критическую, т.е. ю>юкр, звуки Bro(t) и A(t) должны звучать одинаково. Вместе с тем, их слуховые ощущения при ю=юкр должны различаться.

Опишем эксперименты по определению критической частоты юкр для различных звуков A(t) и их асинхронных частотно-импульсных кодов Bb(t). Для проведения опытов была сконструирована и изготовлена специальная экспериментальная установка, названная квантователем звукового сигнала. Блочная схема квантователя представлена на рис. 2.

Рис. 2

Непрерывный звук A(t) воспринимается микрофоном 1, который превращает его в колебания электрического напряжения U(t). Микрофон имеет передаточный коэффициент k1. Напряжение U(t), после усиления в р раз и смещения вверх на величину b блоком 2, поступает в виде напряжения V(t) на пороговый элемент 3. Он вырабатывает некоторую последовательность стандартных импульсов, каждый из которых охватывает площадь g. Полученная последовательность импульсов P(t.) усиливается в q раз и смещается вниз на величину с блоком 4. В результате формируется сигнал Q(t), который поступает через переключатель 5 на телефон 6 и прослушивается испытуемым как звук Bro(t). Через тот же переключатель на телефон поступает сигнал W(t), представляющий собой усиленный в r раз блоком 7 сигнал U(t). Сигнал 417) после прохождения через телефон, имеющий передаточный коэффициент k2, прослушивается испытуемым в роли звука A(t).

Опишем математически функционирование отдельных блоков квантователя звука. Преобразованиям сигналов в блоках 1 и 7 соответствуют уравнения

U(t)=ki A(t); (18)

W(t)=rU(t). (19)

Работа блока 6 при верхнем и нижнем положении ключа 5 описывается уравнениями

Bto(/)=k2 Q(t); (20)

A(t)=k2 W(t). (21)

Для совпадения входного и выходного сигналов тракта 1-7-6 необходимо принять

r=1/kxk2. (22)

Преобразования сигналов блоками 2 и 4 описываются следующими равенствами:

V(t)=pU(t)+b; (23)

Q(t)=qP(t)-c. (24)

Последовательность импульсов, вырабатываемую блоком 3, математически описываем выражением

т

P(t) = g Х8(/-0г). (25)

І=1

Моменты времени 0x, 02, ..., 0m, в которые вырабатываются импульсы, определяются уравнениями

01 02 0т

\V(t)dt = g, \V(t)dt =g, ..., \V(t)dt =g. (26)

0 01 0m-1

Рассмотрим теперь вопрос о том, как правильно настроить квантователь звукового сигнала. Эта задача сводится к такому выбору параметров настройки b, c, p и q квантователя, при котором звуки Bro(t) и A(t) будут удовлетворять условию (4). Выбор величины параметра r квантователя нами уже осуществлен: он определяется формулой (22). Регулирование параметров ki, k2 и g, в отличие от только что упомянутых, в квантователе не предусмотрено.

Выведем формулы для определения параметров настройки р и b блока 2. С этой целью по формулам (18) и (23) находим:

V(t)=pk1 A(t)+b. (27)

Подставляя полученный результат в i-е из равенств (26), получаем

0 РкіA(t) + b„ ,

J ------------dt = 1.

0ц g

Используя i-е из равенств (9), имеем

(28)

0 А(> + a° Л = 1.

0 S 0І-1

(29)

Приравнивая коэффициенты при A(t) и свободные члены в подынтегральных выражениях равенств (28) и (29), находим искомые формулы для р и b:

p=g/K1e, (30)

b=ao g/e. (31)

Далее выведем формулы для определения параметров настройки q и c блока 4. С этой целью по формулам (20), (21) и (25) находим выражение для сигнала Bro(t):

m

вю(t) = k2 qg ZS(t - 0i) -k2c. (32)

i = 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кроме того, согласно (11) имеем:

m

Вю(t) =є£8(t-0i) - a°. (33)

І = 1

Приравнивая коэффициенты при сумме и свободные члены в правых частях равенств (32) и (33), находим искомые формулы для q и р:

q=e/k2 g; (34)

c=a0/k2. (35)

В схеме квантователя использован микрофон МД-200А (k1»0,5 Вм2/Н) и телефон ТД-6 (k2«0,02 Н/В-м2). В качестве блоков 2, 4 и 7 использованы

102

РИ, 1998, № 2

стандартные усилительные схемы. Пороговый элемент представляет собой последовательное соединение компаратора и одновибратора [15]. Экспериментально была найдена характеристика порогового элемента. В качестве его входного сигнала принималось не меняющееся во времени напряжение V, выходным сигналом служила частота следо-

вания импульсов, вырабатываемых пороговым элементом в ответ на напряжение V. Зависимость roV от Vпредставлена в таблице.

V, В 0,12 0,15 0,2 0,26 0,33 0,43

ю V, кГц 2,1 2,7 3,5 4,5 5,7 7,5

V, В 0,56 0,72 0,93 1,2 1,6 2,0

ю V, кГц 9,7 12,5 16,0 20,8 27,7 34,6

V, В 2,6 3,4 4,3 5,6 7,2

oV, кГц 45,0 59,0 74,4 97,0 125

Пороговый элемент способен достаточно точно реагировать на напряжение в пределах

V=0,12^7,2 В. (36)

При этом частота импульсов, формируемых пороговым элементом в ответ на напряжение V, колеблется соответственно в пределах o>v=2,H125 кГц. Во всем допустимом диапазоне сохраняется линейная зависимость между V и roV. Максимальное относительное отклонение от линейности составляет величину порядка 1%. Из i-й зависимости (36) следует, что V(9i-9i_1)=g. Поскольку 9i-9i-1=1/roV при любом i (1<i<m), то

^ = g V ■ (37)

По таблице находим:

g=A = 7’2/ 3 = 5,8 • 10-5 B • c (38)

/wv /125 • 103 . ( )

Опыты на квантователе выполнялись для звуков A(t), средних по громкости, которая назначалась в пределах от 40 до 60 дБ. Использовались синусоидальные сигналы разной амплитуды и частоты, дикторская речь и музыкальные произведения. Параметр r регулировался таким образом, чтобы звучание в телефоне совпало по громкости с непосредственным восприятием звука A(t) вблизи микрофона. Значения параметров b и p регулировались с таким расчетом, чтобы, во-первых, колебание сигнала V(t) укладывалось в пределы (36) и, во-вторых, достигалось желаемое значение минимальной частоты ю. По формулам (27), (30) и (31) находим:

V (t) = g (A(t) + ао). (39)

Минимальное значение VM сигнала V(t) достигается в случае, когда A(t)=-a:

VM = g (ао - а)■ (40)

є

Сравнивая формулы (8) и (40), получаем:

1

---1

g

ю = vm ■

(41)

Таким образом, параметр ю можно регулировать к желаемой величине в соответствии с формулой (40), изменяя напряжение VM. При этом значение параметра є, согласно (39), должно быть принято равным

g

є = — (ао - а)■ (42)

Усиление q регулировалось к величине, обеспечивающей равенство громкости сигналов Bs>(t) и A(t) при поочередном их прослушивании с помощью головных телефонов. Значение смещения с фактически не регулировалось, поскольку его изменение вызывает лишь статический прогиб мембраны телефона, не влияющий на качество звука. Оно было одинаковым во всех опытах и выбиралось с таким расчетом, чтобы статический прогиб мембраны телефона находился в допустимых пределах и качество звука не ухудшалось.

В опытах участвовало 8 испытуемых ( мужчины и женщины в возрасте от 22 до 50 лет). В каждом опыте цифровым вольтметром измеряли наибольший нижний уровень напряжения 1^р для звука A(t), при котором ощущения звуков B“(t) и A(t) еще различаются. Этот уровень определяется с помощью электронного осциллографа, на экране которого визуально наблюдалось колебание во времени напряжения V(t). Критическую частоту находим в соответствии с формулой (41):

ю

к р

= — V

к р

g

(43)

Определение величины юкр повторялось десятикратно для каждого звука A(t) и каждого аудитора. Были вычислены средние значения юкр и оценен разброс значений юкр. Во всех сериях из десяти измерений среднеквадратичное отклонение для юкр составило величину порядка 5%.

Результаты опытов оказались следующими. Критическая частота юкр практически не зависит от вида звука A(t), на нее незначительно влияет выбор аудитора. Она почти в точности совпадает с максимальной частотой синусоидального сигнала, слышимого ухом, и составляет в опытах 16-20 кГц. Критическая частота у разных испытуемых строго коррелируется с верхним пределом слышимой частоты. Возможно следующее объяснение этого факта: как только частота следования импульсов в сигнале B“(t) снижается настолько, что попадает в слышимый диапазон, она начинает восприниматься ухом. Подтверждением этому объяснению может служить следующее наблюдение.

Когда минимальная частота следования импульса в сигнале B“(t) хотя бы на небольших интервалах времени снижается до величины юкр и звуки A(t) и B“(t) становятся различными на слух, это различие проявляется лишь в том, что в ощущении звука B“(t) на фоне звука A(t) появляется высокочастотный писк.

4. Синхронизация кода звука

Переход к асинхронным частотно-импульсным кодам звука, осуществленный выше, представляет собой определенный шаг в направлении к дискре-

РИ, 1998, № 2

103

тизации акустического колебания. Однако процесс дискретизации еще не окончен. Это лишь половина пути. Мы избавились от вещественных значений ординат акустического колебания, но вместо них появились вещественные значения моментов времени 01, 02,..., 0m, в которые возникают импульсы асинхронного кода звука. Точные коды вещественных чисел имеют бесконечное число знаков, их невозможно ввести в память цифровой вычислительной машины, следовательно, они не поддаются обработке на ЭВМ. Чтобы завершить дискретизацию звука, нужно импульсы кода звука синхронизировать. Для этого необходимо ввести дискретное время и так задержать каждый из импульсов кода, чтобы его передний фронт совпал с ближайшим дискретным моментом времени.

Процесс синхронизации кода звука проиллюстрируем с помощью рис. 3.

-В(Г)

і і і і і і і То \ 1 к.

• Г

t

0

а

«Су(0

к Тт А То \ 1 - к

г %

• Г

б

Рис.3

t

0

На диаграмме а показан асинхронный код B(t) звука A(t). Черточками на оси абсцисс отмечены дискретные моменты времени. Длительность ти каждого импульса может быть меньше или больше тактового интервала ТТ. В задачах, решаемых в этой работе, используются обе возможности. На рис. 3 изображен вариант, когда ТИ>ТТ. На диаграмме б представлен синхронный код Су(^, полученный в результате синхронизации кода B(t). Индекс у означает частоту синхронизации, равную

1

у= т . (44)

1 т

В процессе синхронизации i-й импульс смещается во времени в сторону запаздывания на интервал Д0г. Для различных импульсов кода эти запаздывания, вообще говоря, неодинаковы, однако их величина ограничена сверху тактовым интервалом, так что

Д0і < Тт. (45)

Естественно ожидать, что неодинаковое смещение во времени импульсов кода B(t) в процессе его синхронизации может отразиться на характере звучания синхронного кода Cty(t). Поэтому представляется возможным случай, когда, несмотря на одинаковое восприятие звуков A(t) и B(t), звуки A(t) и Cty(t) будут вызывать различные слуховые ощущения. Кроме того, ясно, что при увеличении частоты синхронизации у положение во времени синхронных импульсов кода Cy(t) будет все более прибли-

жаться к положению асинхронных импульсов кода синхронизации B(t). Следовательно, в пределе при устремлении частоты синхронизации к бесконечности оба кода совпадут:

у1—, Cy(t)=B(t). (46)

Сформулируем одно общее утверждение, которое может служить в роли полезного свойства слуха. Пусть B(t) — диаграмма произвольного звука и {Cy(t)}y є (о, х) — однопараметрическое семейство диаграмм произвольных звуков. О функциях B(t) и Cy(t) предполагается лишь то, что они локально суммируемы на интервале задания [0, 70]. Если звук B(t) и множество звуков {Су(^}ує(0, х) удовлетворяют условию

lim f

у—— х J

Су (t) - B(t) dt = 0,

Т

(47)

то существует такое число у0>0, что для любого у>у0 ощущение звука Су(і) совпадет с ощущением звука B(t). Заметим, что условие (47) — это всего лишь более корректная запись условия (46), в которой, кроме того, теперь вместо акустических диаграмм специального вида (последовательностей стандартных импульсов) фигурируют произвольные диаграммы звуков.

Смысл сформулированного свойства слуха (назовем его законом существования порога) состоит в том, что любые два звука, диаграммы которых достаточно мало отличаются друг от друга по форме, будут неотличимы на слух. Важным обстоятельством является то, что закон существования порога нельзя логически вывести из усиленного обобщенного закона Талбота, поскольку там в роли одного из сравниваемых звуков (а именно — звука A(t)) фигурирует непрерывный звук, а ведь далеко не каждая локально суммируемая функция является непрерывной. Распространить же закон Талбота на тот случай, когда в роли звука A(t) выступает локально суммируемая функция, пока еще никому не удалось. Вместе с тем усиленный закон Талбота невозможно вывести из закона существования порога. Это обусловлено тем, что многие из последовательностей, сходящихся в среднем, не сходятся по норме. Поэтому при выполнении (4) условие (47) может оказаться ложным для тех же звуков. Таким образом, оказывается, что оба рассматриваемых закона логически независимы друг от друга: каждый из них содержит в себе такую информацию о функционировании слухового анализатора, которой нет в другом законе.

Что можно сказать в пользу истинности закона существования порога? На первый взгляд, он кажется вполне очевидным и даже тривиальным утверждением. Однако это впечатление обманчиво. Закон существования порога, как показывают приведенные ниже результаты основанных на нем экспериментов, приводит к весьма неожиданным выводам. Нам представляется, что закон существования порога является мощным инструментом изучения функционирования слухового анализатора и эффективным средством решения задач технической акустики, поэтому он заслуживает солидной экспериментальной проверки. Однако такая задача очень сложна и обширна и выходит далеко за рамки настоящей работы. Мы ограничились лишь

104

РИ, 1998, № 2

тем, что использовали закон существования порога в одном весьма специальном случае и на этом частном примере убедились в его справедливости и эффективности.

5. Частота синхронизации

Основываясь на зависимости (46) и применяя к ней закон существования порога, выводим отсюда существование такой частоты синхронизации у0, что при ее превышении (т.е. при выборе у>у0) звуки B(t) и Cy(t) будут неотличимы на слух. Очевидно, что выбор числа у0 не единственен. Нижнюю границу множества всех чисел, которые могут быть использованы в роли числа у0, обозначим символом укр и назовем критической частотой синхронизации. В соответствии с этим определением, если на всем интервале [0, Т0] задания звуков частота синхронизации в звуке Cy(t) превышает критическую, т.е. ю>юкр, то звуки Cy(t) и B(t) должны восприниматься на слух одинаково. Вместе с тем, слуховые ощущения звуков Cy(t) и B(t) при У=Укр должны различаться. Логически возможно, чтобы число укр зависело от формы всей функции B(t), которая определяется последовательностью чисел 01, 02,..., 0п. Если бы это оказалось действительно так, то, ввиду необозримо большого количества вариантов, полное опытное изучение величины критической частоты синхронизации стало бы весьма проблематичным. К счастью, это не так: в действительности значение укр существенно зависит лишь от одного числового параметра функции B(t). Об этом свидетельствуют приведенные ниже экспериментальные исследования.

Для проведения опытов был разработан специальный прибор — дискретизатор непрерывного звука, блочная схема которого представлена на рис. 4.

b

С

Рис. 4

В нем были использованы блоки П6 из квантователя, описанного выше (рис. 2). Кроме того, использован переключатель 5', с помощью которого можно по желанию вместо микрофона подключать генератор звуковых сигналов, формирующих синусоидальные электрические сигналы U’(t) различной амплитуды и частоты. В прибор включен синхронизатор импульсов 8, в качестве которого применена стандартная схема. Частота синхронизации у регулировалась в пределах 0,5^10 мГц. Синхронизированный сигнал P’(t) подстраивался на слуховое равенство с помощью блока 4' путем регулирования усиления q и смещения с’. Ключ 5 дает возможность поочередно прослушивать асинхронные Q(t) и синхронизированные Q’(t) последовательности импульсов.

Вначале были проведены опыты на синусоидальных сигналах U’(t), которые соответствуют непрерывному звуку

A(t)=asin2nnt+a0 (48)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с частотой 1 кГц. Параметры а и а0 звука регулировались. Максимальный интервал Ттах между соседними импульсами у асинхронного сигнала для звука (48) определялся так:

є

Ттах= а0 - а , (49)

минимальный интервал Ттп был найден по формуле

є

Tmin= а0 + а , (50)

получаемой из (49) заменой -а на +а.

После того, как назначена величина є (а она во всех опытах оставалась неизменной), выбор параметров а и а0 синусоидального сигнала однозначно определялся значениями Ттах и Tmin с помощью формул

є Т - T

а — _ max mm

~ 2 Т ■ T

max mm

є Т + T

~ _ _ max mm

wfi _ ______

U rp rp

^ 1 max 1 min

(51)

вытекающих из (49) и (50). Цель экспериментов состояла в том, чтобы проследить, как меняется критическая частота синхронизации укр в зависимости от параметров Ттах и Tmin синусоидального сигнала. В экспериментах вместо укр фигурировала обратная ей величина Ткр — критический тактовый интервал, вычисляемый по формуле

1

Ткр= У кр

(52)

Как покажет дальнейшее изложение, именно в этой системе отсчета результаты экспериментов выглядели наиболее выразительно. Таким образом, задача состояла в том, чтобы опытным путем найти вид функции

Ткр=Л.Ттах, Ттіп). (53)

В опытах параметры Ттах и Ттіп варьировались в пределах от 5 до 50 мкс с соблюдением условия Ттах^Ттіп. При значениях, меньших 5 мкс, критический тактовый интервал Ткр оказался меньшим 0,1 мкс, что вышло за пределы возможностей дискретизатора. При значениях, больше 50 мкс, делать опыты не имело смысла, поскольку при этом минимальная частота следования импульсов в сигнале B(t) становилась меньше критической. Опыты проводили в такой последовательности. Назначали величины Ттах и Ткр и отыскивали значение Ттіп, при котором ухо еле улавливает различие между звуками B(t) и Cy(t). Естественно предположить, что слуховое равенство должно нарушаться при увеличении Ттп сверх найденного значения. В действительности все происходило наоборот.

Различие между ощущениями звуков увеличивалось при снижении Ткр, а при его росте — уменьшалось. Различие в звучании проявлялось наличием в звуке Cy(t) шумов того или иного вида: визга, шороха, потрескиваний, постукиваний. Высота и громкость шума, а также его тембр менялись при изменении значений параметров Ттах, Ттіп и Ткр. Приближаясь к критической точке, шум в звуке Cy(t) постепенно слабел, а при переходе через нее исчезал вовсе. При неравенстве ощущений звук Cy(t) воспринимался по громкости, высоте и тембру точно таким же, как и звук B(t). Различие восприятий состояло лишь в том, что звук B(t)

105

РИ, 1998, № 2

ощущался как мелодичный, а звук C\\t(t), будучи по существу тем же самым, загрязнен шумом. При большом уровне шума звук B(t), как компонент ощущения звука Cy(t), тонул в шуме.

На рис. 5 показаны диаграммы,

Tmini мкс

50 Г 1.4*

Аудитор Ш 1 і-У

40

30

20

10

0

Рис. 5

Ткр, мкс 1.1с

10 20 30 40 50

Tmax, мкс

б

Tmim мкс

а

полученные в опытах на аудиторах Д и Ш. В экспериментах участвовало 8 испытуемых — те же, что и в опытах, описанных выше. Для испытуемых Д и Ш получены крайние численные значения, именно поэтому они здесь приводятся. Тем не менее различия между диаграммами а и б весьма невелики. Вследствие этого остальные диаграммы мы сочли возможным здесь не приводить. Аудитор Д — молодой человек 22 лет с отличным слухом, для него юкр=20 кГц. Испытуемый Ш — мужчина 50 лет с несколько сниженным слухом. Найденная для него критическая частота следования импульсов в сигнале B(t) составила величину юкр=16 кГц. Как видим, крайние по результатам диаграммы весьма близки как по общему характеру картины, так и по числовым значениям фигурирующих в них величин. Каждая точка диаграмм строилась по средним значениям, найденным по 10 замерам. Среднеквадратичное отклонение для измеряемой величины Tmin составило 5%. ТтаХ, Tmin и ТКр измерялись непосредственно по изображению последовательностей импульсов на экране электронного осциллографа, точность измерения этих величин составила П2%.

Во время испытаний был обнаружен следующий любопытный факт: даже при нулевой амплитуде сигнала A(t) (т.е. в случае, когда Tmax=Tmin) результаты опытов не теряют смысла, напротив, они несут в себе весьма ценную информацию. В этом случае ощущение звука B(t), как и следовало ожидать, отсутствует (в телефоне — полная тишина). Однако звук Cy(t) слышен: он воспринимается как точно такой же шум, который ранее добавлялся в звуке Cy(t) к ощущению звука B(t) ненулевой амплитуды. При Tmax=Tmin результаты измерения величины T^ получаются даже более четкими и точными. Внимание аудитора не отвлекается звуком B(t), и он просто отыскивает такую величину тактового периода, при которой шум в телефоне полностью исчезает.

На диагональной линии графиков а и б рис. 5 показаны точки, заснятые этим методом. Точнее, экспериментатор задавался желаемой величиной 7^,

и находил граничное между шумом и его отсутствием значение параметров Tmax=Tmin. Изучение всех заснятых диаграмм показывало (и это иллюстрирует рис. 5), что 7кр определяется лишь величиной минимального интервала Tmin между соседними импульсами в сигнале B(t). Критический тактовый интервал T^ совершенно не зависит от Tmax. Небольшие отклонения линий графиков от горизонтали лежат в пределах точности измерений. Выявился еще более замечательный факт: значения критического тактового периода с высокой точностью укладываются в линейную зависимость от параметра Tmin. Об этом свидетельствует рис. 6,

Ткр, мкс

Tmins мкс

на котором нанесены точки зависимости T^ от Tmin для испытуемых Д и Ш в случае, когда Tmax= Tmin. Для всех остальных шести испытуемых получены аналогичные (и притом — промежуточные) резуль-таты.Таким образом, мы приходим к следующей закономерности слуха:

T^aTmin. (54)

Пределы колебания значений коэффициента пропорциональности a для различных испытуемых находим по рис. 6, где наклонными прямыми представлена линейная аппроксимация зависимости T^ от Tmin для испытуемых Д и Ш. По наклону этих прямых находим

a=(2,1*2,8) 10-2. (55)

Итак, заключаем, что отношение величины T^ к Tmin есть константа слуха. Она равна:

Т

к р

a= «0,02^0,03. (56)

Константу a назовем постоянной дискретности слухового анализатора.

Обсуждение результатов

Полученные результаты выглядят весьма неожиданными и даже несколько парадоксальными. Выходит, что при увеличении амплитуды колебаний дискретизированного синусоидального сигнала чистота его звучания не улучшается, как, казалось, можно было бы ожидать, а ухудшается. При повышении средней частоты следования импульсов в сигнале B(t) качество звука не улучшается, а ухудшается. Таким образом, получается, что чем реже следуют импульсы в коде звука, тем лучше качество его звучания. За увеличение амплитуды

106

РИ, 1998, № 2

колебаний звукового сигнала на входе порогового элемента приходится расплачиваться дорогой ценой: во столько же раз нужно повысить частоту синхронизации, если требуется получить незашумленное звучание сигнала A(t). Как объяснить столь странные свойства слухового анализатора? Можно предположить, что орган слуха каким-то образом производит временной анализ звукового сигнала. В данном случае этот анализ сводится к измерению интервалов между соседними импульсами в звуке B(t). Эти измерения орган слуха выполняет с определенной точностью. Когда производится дискретизация сигнала B(t) и переход к сигналу C\(t), при этом несколько изменяется величина интервалов между соседними импульсами. Отклонения интервалов от первоначальных значений ухо улавливает и передает эту информацию нашему сознанию в виде шума. Зависимость (56) в свете этого предположения означает то, что ухо меряет временные интервалы с постоянной относительной точностью, равной 2-3%.

Зависимость (56) есть не что иное, как проявление общего для всех органов чувств закона, установленного еще в 1846 г. Вебером [16]. Закон Вебера гласит: едва ощутимые органом чувств отличия стимула пропорциональны величине этого стимула. Тот факт, что величина Ткр определяется именно минимальным (а не максимальным, средним или еще каким-нибудь другим) интервалом между импульсами, также допускает простое объяснение. Дело в том, что абсолютная чувствительность уха наиболее высока как раз на самом коротком интервале. Поэтому совершенно естественно, что ухо раньше всего обнаруживает искажения звука именно здесь. Иными словами, раньше других начинают “шуметь” интервалы между импульсами, равные Tmin. Это происходит потому, что именно здесь наиболее велико отношение отклонения измеряемой величины к ней самой.

Чтобы убедиться в общности найденных закономерностей, мы провели выборочные опыты, в которых в роли звука A(t) использовались синусоидальные сигналы различной частоты, дикторская речь и музыкальные произведения. Результат опытов был везде один и тот же: при недостаточно высокой частоте синхронизации сигнал C\(t) воспринимается как сигнал A(t), звучащий на фоне шума. Увеличение частоты синхронизации приводит к исчезновению шума, после чего звук C\(t) становится неотличимым на слух от звука A(t). Критическая частота синхронизации всецело определяется минимальным интервалом между импульсами в сигнале B(t), при этом сохраняет силу зависимость (56). В процессе проведения опытов варьировалась, кроме того, ширина импульсов, составляющих звуки B(t) и C\(t), в пределах от 0,9 (при этой ширине была выполнена основная масса опы-

тов) до 6 мкс. Установлено, что заметного влияния на величину критической частоты синхронизации изменение ширины импульсов не оказывает.

Литература: 1. Паламарюк Г.О. Основы теории и проектирования частотно-импульсных вычислительных устройств. Докт. дисс. Рязань. 1974. 436 с. 2. Шафер P.B., Рабинер Л.Р. Цифровое представление речевых сигналов. ТИИЭР. 1975. Т.63, № 4. C.141-160. 3. Nyquist H Certain Topics in Telegraph Transmission Theory. Trans. AJEE. 1928. Vol. 47. P. 617-644. 4. Котельников B.A. О пропускной способности “эфира” и проволоки в электросвязи // Материалы к первому всесоюзному съезду по вопросам реконструкции дела связи и развития слаботочной промышленности. Изд. Ред. Упр. Связи РККА, 1933, с. 111-124. 5. Рабинер Л.Р., Шафер P.B. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. 495 с. 6. Глушков B.M. Введение в кибернетику. К.: Изд-во АН УССР, 1964. 324 с. 7. Рабинер Л.Р., Шафер P.B. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. 495 с. 8. Talbot H.F. Experiments on light. Phil. Mag., (third series), № 9, 1834. 9. Луизов A.B. Инерция зрения. М.: Оборонгиз, 1961. 248 с. 10. Теплов Б.М., Яковлева С.П. О законах пространственного и временного смешения цветов // В сб. “Зрительные ощущения и восприятия”, т.2, М.: Соцэкгиз, 1935. 11. Jves H.E. Critical Frequency relations in scotopic vision. Journ. Opt. Soc. Am., 1922. № 6. 12. Шабанов-Кушнаренко Ю.П. Математическое моделирование некоторых функций человеческого зрения. Докт. дисс. X., 1968. 275 с. 13. Ржевкин С.Н. Слух и речь в свете современных физических исследований. М.-Л.: 1936. 311 с. 14. Абрамов О.М., Дрюченко А.Я., Усенко С.А., Шабанов-Кушнаренко Ю.П. Эффект сглаживания в слухе // Проблемы бионики. X: Вища шк., 1977. Вып. 19. C.31-37. 15. Усенко С.А. К вопросу о дискретности слуховой информации // Проблемы бионики, X.: Вища шк., 1979. Вып. 23. С. 27-32. 16. WeberE.H. Tastsinn und Gemeingefehl. Wagners Handb. D. Phys., № 3, 1846.

Поступила в редколлегию 12.04.98

Рецензент: д-р техн. наук, проф. Петров Э.Г.

Варданов Евгений Борисович, аспирант кафедры ПО ЭВМ ХТУРЭ, зав. лабораторией компьютерных технологий в образовании при отделе образования Московского района г. Харькова. Научные интересы: искусственный интеллект, теория сглаживания. Адрес: 310135, Украина, Харьков, ул. Гвардейцев Широнинцев, 61а, кв. 193, тел. 67-77-78.

Коряк Сергей Федорович, канд. техн. наук, доцент кафедры ПО ЭВМ, зам. проректора по научной работе ХТУРЭ. Научные интересы: информатика, теория распознавания речи. Адрес: 310000, Украина, Харьков, пр. Гагарина, 48, кв. 24, тел. 27-18-80, 40-93-39.

Маленченко Зоя Юрьевна, канд. техн. наук. Научные интересы: информатика, математическое моделирование информационных процессов. Адрес: 310000, Украина, Харьков, ул. Котлова, 10, кв 21.

Шабанов-Кушнаренко Юрий Петрович, д-р техн. наук, профессор кафедры ПО ЭВМ ХТУРЭ. Научные интересы: идентификация механизмов интеллекта человека, информатика. Адрес: 310058, Украина, Харьков, ул. Культуры, 11, кв. 31, тел. 40-94-46.

РИ, 1998, № 2

107

i Надоели баннеры? Вы всегда можете отключить рекламу.