Научная статья на тему 'ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ НЕКОТОРЫХ ЗАКОНОВ КОМПАНДИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ КВАНТОВАНИЯ АНАЛОГОВЫХ СИГНАЛОВ'

ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ НЕКОТОРЫХ ЗАКОНОВ КОМПАНДИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ КВАНТОВАНИЯ АНАЛОГОВЫХ СИГНАЛОВ Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
86
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КВАНТОВАНИЕ АНАЛОГОВЫХ СИГНАЛОВ ПО УРОВНЮ / ОПТИМАЛЬНОЕ КВАНТОВАНИЕ / ЗАКОН КОМПАНДИРОВАНИЯ / А И µ-ЗАКОН

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Мацканюк Алексей Алексеевич

В статье описываются результаты исследования эффективности применения оптимальной в смысле минимума дисперсии ошибки воспроизведения шкалы квантования аналоговых сигналов (алгоритм Ллойда-Макса), а также шкал на основе А и µ-законов компандирования. В качестве исходных сигналов использованы 6 фрагментов речевых и музыкальных аудиосигналов суммарной длительностью 370 минут с 450 млн. отсчетов, взятых с частотой 44 кгц. В ходе эксперимента для каждого из фрагментов находились оптимальная неравномерная шкала квантования по А и μ-законам. Исходные сигналы квантовались по уровню с использованием этих неравномерных шкал, а также равномерной шкалы, и во всех случаях оценивались дисперсии ошибок квантования. Таблица результатов расчетов показывает, что в случае применения алгоритма Ллойда-Макса дисперсия ошибки уменьшается до 70% по сравнению со случаем квантования равномерной шкалы. В то же время использование A и μ-законов компандирования наоборот приводит к увеличению дисперсии ошибки приблизительно в 2 - 4 раза.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Мацканюк Алексей Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPERIMENTAL RESEARCH OF SOME COMPANDING LAWS FOR OPTIMIZING ANALOG SIGNAL QUANTIZATION

Results of comparative experimental research of application efficiency of optimum (in sense of minimum) dispersion error in reproduction quantization scales according to analog signal level of (Lloyd-Max algorithm), as well as scales based on A and µ companding laws are described. Speech and musical fragments of audio signals with total duration 370 minutes from 450 million sample units with 44 kHz frequency were used as reference signals. During the experiment each of fragments was quantized in 2 options of value intervals (99% and 90%) and in 2 options of quantizing intervals (10 and 100 steps) - all in all 4 options or 24 options, considering total fragments number. Each option had three uneven quantization scales - an optimum quantization scale according to Lloyd-Max algorithm, quantization scales based on A and μ laws, and one uniform scale. Reference signals were quantized according to level using all these scales and quantizing error dispersions were estimated in all the cases. Results of all 24 options of applying four different quantization scales are summarized in the final table. It follows from it that using optimum (in the sense of minimum error dispersion) quantization scale of analog signal according to level based on Lloyd-Max algorithm gives about 70% error dispersion reduction compared to applying uniform quantization scale. At the same time using A and μ companding laws leads on the contrary to increase in error dispersion approximately by 2 - 4 times. As for the result quality estimation it is possible to note that these results for the selected reference analog signals are little sensitive to the interval range of quantized values, quantizing level number and audio signal type.

Текст научной работы на тему «ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ НЕКОТОРЫХ ЗАКОНОВ КОМПАНДИРОВАНИЯ ДЛЯ ОПТИМИЗАЦИИ КВАНТОВАНИЯ АНАЛОГОВЫХ СИГНАЛОВ»

УДК 519.72

ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ НЕКОТОРЫХ ЗАКОНОВ КОМПАНДИРОВАНИЯ

ДЛЯ ОПТИМИЗАЦИИ КВАНТОВАНИЯ АНАЛОГОВЫХ СИГНАЛОВ

Мацканюк Алексей Алексеевич

кандидат технических наук, доцент Сочинского государственного университета.

E-mail: alexmatsk@gmail.com. Адрес: 354000, г. Сочи, ул. Советская, 26 а.

Аннотация: В статье описываются результаты исследования эффективности применения оптимальной в смысле минимума дисперсии ошибки воспроизведения шкалы квантования аналоговых сигналов (алгоритм Ллойда-Макса), а также шкал на основе А и ц-законов компандирования.В качестве исходных сигналов использованы 6 фрагментов речевых и музыкальных аудиосигналов суммарной длительностью 370 минут с 450 млн. отсчетами, взятых с частотой 44 кгц. В ходе эксперимента для каждого из фрагментов находились оптимальная неравномерная шкала квантования шкалы квантования по А и ц-законам. Исходные сигналы квантовались по уровню с использованием этих неравномерных шкал, а также равномерной шкалы и во всех случаях оценивались дисперсии ошибок квантования. Таблица результатов расчетов показывают на приблизительно 70% уменьшение дисперсии ошибки при использовании алгоритма Ллойда-Макса по сравнению со случаем применения для квантования равномерной шкалы. В то же время использование A и ц-законов компандирования наоборот приводит к увеличению дисперсии ошибки приблизительно в 2 - 4 раза.

Ключевые слова: квантование аналоговых сигналовпо уровню, оптимальное квантование, закон компандирования, А и ц-закон.

Известны методы сжатия аналоговых сигналов путем использования неравномерной шкалы квантования по уровню. Если при этом задаться целью минимизировать дисперсию шума квантования, то получается оптимальная шкала квантования, описываемая, например, в [1]. Дисперсия шума квантования минимизируется путем подбора положения границ шагов квантования при фиксации их количества и диапазона покрываемых шкалой значений квантуемого сигнала. Оптимальное квантование можно реализовать, например, при помощи алгоритма Ллойда-Макса [2, 3]. Теория оптимального и нелинейного квантования изложена также в [4- 9, 11]. Ниже используются варианты соотношений и обозначений, использованные в работе [9].

В процессе сжатия сигнала удобно применять комбинацию нелинейного преобразователя (компрессора) исходного сигнала х во вспомогательный сигнал у(х) и квантователя сигнала у с использованием обычной равномерной (с постоянным шагом квантования) шкалой квантования. В качестве такого квантователя

подходит стандартный аналого-цифровой преобразователь (АЦП). Для восстановления исходного сигнала в этом случае используется стандартный (с постоянным шагом) цифро-аналоговый преобразователь и экспандер, осуществляющий обратное преобразование х(у). Известно (см. [9], [1] и др.), что функция у(х), называемая «законом компандирования», зависит от функции плотности вероятности Дх) квантуемого сигнала х (1):

уО) = Хтах ^ Хт1П I \ffQxjdx + хтЫ, (1) где 5 = ГХтах 1Г^(х)йх - функционал плотно-

хтт у

сти распределения вероятности Дх) квантуемого сигнала х; хтп, хтах - нижняя и верхняя границы диапазона значений, которые принимает квантуемый аналоговый сигнал х.

Границы шагов в общем случае неравномерной оптимальной шкалы находились в процессе вычисления интеграла (1) путем постепенного увеличения верхнего предела х и сравнения полученного результата со значениями границ шагов равномерной шкалы у. После вычисления границ шагов уровни опти-

Радиотехнические и телекоммуникационные системы, 2016, №4

ISSN 2221-2574

мальнои шкалы размещаются в центре шагов [1 - 9].

Достигаемая при использовании закона компандирования (1) минимальная дисперсия D£min ошибки £ описывается формулой (2):

53

тт = 12п2' где п - количество шагов квантования.

Дисперсия D£ равн ошибки £ при использовании равномерной шкалы от функции Дх) плотности распределения вероятности квантуемого сигнала х не зависит и описывается формулой (3):

^е равн 12'

где 3 - размер шага квантования по уровню.

Дисперсия D£ ошибки £ квантования для произвольной шкалы квантования находится по формуле (4):

(4)

i=l

(4)

где S, - размер i-го шага квантования по уровню; Pi - вероятность попадания значения квантуемого сигнала в пределы i-го шага.

Практическое использование закона компандирования (1) требует проведения достаточно сложных вычислений и потому затруднительно. Телекоммуникационными стандартами для передачи телефонных разговоров в качестве законов компандирования предусмотрены логарифмические законы - А-закон, предложенный Smith B.D. в работе [6], и ц-закон, предложенный Kaneko H. И Sekimoto T. в работе [10]. Эти законы описываются формулами (4) и (5):

V =< 1 + ЫА

УА )siqn(x) 1

1 „ , (1 + ЫА + ln\x\) -<|х|<1

+ 1пАк А

где А = 876

sign(x)

y" = RTT^/n(1 + ^|x|)' (5)

где ц=100 или 255.

Здесь-1 < х < 1 - нормированный аргумент х.

А-закон используется в Европе, а ц-закон -в Северной Америке и Японии.

Представляет интерес оценка влияния на дисперсию ошибки класса квантуемого аудиосигнала и некоторых параметров шкалы - закона компандирования, размера и количества шагов квантования и диапазона квантуемых значений.

С этой целью был проведен численный эксперимент, в ходе которого в качестве квантуемых сигналов были взяты 6 аудиозаписей двух классов (речь и музыка) - 4 речевые записи с одной из интернет-радиостанций общей длительностью 126 мин. и 2 музыкальные композиции (песни Mylene Farmer и Whitney Houston) общей длительностью 22 мин. Параметры этих записей представлены в таблице 1.

Все исходные аудиофайлы при помощи программы Wavosaur (www.wavosaur.com) были преобразованы в файлы формата rawbinary и обработаны VB-программой (VB - VisualBasic 6) с целью извлечения отсчетов и подсчета частот появления каждого из возможных значений отсчетов 2-байтовыми числами, т.е. числами в интервале от 0 до 216-1=65535. На выходе эта программа выдавала текстовый файл с 65536 числами - частотами появления

Таблица 1.Параметры исходных аудиофайлов

Тип Имя файла Длительность (мин:сек) Точность (бит) Частота дискретизации Количество. отсчетов

0 2:23 6310 807

Речь 1 33:12 16 mono 85 670 935

2 47:30 44,1 кгц 125 508 887

3 43:42 115 508 887

Музыка Mylene Farmer 12:45 16 stereo 68 218 905

Whitney Houston 8:44 46 345 505

каждого из 65536 возможных значений отсчетов в исходном аудиофайле.

Далее эти текстовые файлы импортировались в среду Excel 2010.Частоты отсчетов использовались для вычисления оценки плотности распределения вероятностей соответствующей аудиозаписи и вычисления на ее основе по формулам (2-7) оценок дисперсий ошибок воспроизведения исходного аудиопроцесса, которые образовывались в результате их квантования по уровню с применением различных законов компандирования (1), (4), (5).

В формулах (4) и(5) используется нормированный аргумент х (-1 < х < 1) и получаются соответствующие нормированные значения А и ^-законов компандирования уА и ун. В реальности же значения исходного аудиопроцесса xr в данной работе менялись в пределах от 0 до 65535. Помимо этого, для настройки законов компандирования были введены «уровни отсекания» редких малых и больших значений отсчетов. По ним находился интервал (xmin, xmax), в пределах которого и строилась шкала квантования.

Поэтому для использования формул (4) и (5) пришлось перейти от реального аргумента xr, принимающего значения от xmin до xmax, к нормированному х (6), а затем пересчитать yA и Ун в реальныйyr (7):

Xr — Xmin

X = 2 *■

Yr =

Xmax — Xmin (Yß или Ya) + 1

— 1,

(6)

(Xmax — Xmin) + Xmin. (7)

Кроме того, параметр ^ в ^-законе в данной работе был принят равным 100, так как дисперсия ошибки в этом случае получается меньше, чем в случае, если принять ^=255.

В ходе эксперимента каждый из фрагментов квантовался в 2 вариантах интервалов значений (99% при отсечении 0,5% наибольших и 0,5% наименьших значений, а также 90% при отсечении 5% наибольших и 5% наименьших значений) и в 2 вариантах шагов квантования (10 и 100 шагов) - всего 4 варианта или 24 варианта, учитывая общее число фрагментов 6. Для каждого варианта находились три нерав-

номерные шкалы квантования - оптимальная шкала квантования в соответствии с алгоритмом Ллойда-Макса (формула (1)), шкалы квантования по А и ц-законам (формулы (4) и (5)) -и одна равномерная шкала. Исходные сигналы квантовались по уровню с использованием всех четырех шкал и во всех случаях оценивались дисперсии ошибки квантования. Результаты всех 24 вариантов применения четырёх различных шкал квантования сведены в итоговую таблицу (см. таблицу 2)

Файлы аудиозаписей и Excel-таблиц, использованных при расчете результатов численного эксперимента можно запросить по e-mailalexmatsk@gmail. com.

Выводы

По данным, представленным в таблице 2, можно сделать следующие выводы:

• Применение оптимальной шкалы с законом компандирования (1) дает в среднем приблизительно 70% уменьшение дисперсии ошибки по сравнению с простейшей равномерной шкалой.

• Использование A и ц-законов компанди-рования наоборот приводит к увеличению дисперсии ошибки приблизительно в 2 - 4 раза.

• Изменение уровней отсекания редких больших и малых отсчетов, размера и количества шагов квантования, а также типа аудиофайла незначительно сказываются на дисперсии ошибки квантования.

• Можно предположить, что целью введения A и ц-законов компандирования в практику передачи телефонного трафика была не максимальная точность (в смысле минимума дисперсии ошибки воспроизведения исходного сигнала) воспроизведения исходного сигнала, а максимальное сжатие аудиоданных с широким диапазоном параметров при сохранении удовлетворительной разборчивости передаваемой речи.

Таблица 2. Результаты расчетов оценок дисперсии ошибок воспроизведения аудиосигналов

Файл Количество отсчетов Уровни отсекания отсчетов (%) Размер шага равн. шкалы Кол. шагов Дисперсия ошибки

Оптимальная шкала Равномерная шкала U-закон компандирования А-закон компандирования

Теория Эксперимент

тип Имя Xm¡n% Xmax% Абс. знач. Откл. от опт.теор. Абс. знач. Откл. от опт.теор. Абс. знач. Откл. от опт.теор. Абс. знач. Откл. от опт.теор.

Голос 0 6 310 807 0,50 99,50 100 367 557,10 562,49 0,97% 833,33 49,58% 1973,27 254,20% 3505,50 529,24%

5,00 95,00 100 207 708,49 713,81 0,75% 2546,54 259,43% 4552,57 542,57%

0,50 99,50 10 3662 5,60 5,56 •0,71% 19,33 245,18% 34,31 512,68%

5,00 95,00 10 2057 7,15 6,00 ■16,08% 19,20 168,53% 34,24 378,88%

1 85 670 935 0,50 99,50 100 115 509,35 513,10 0,74% 833,33 63,61% 1279,42 151,19% 2237,22 339,23%

5,00 95,00 100 62 639,55 629,06 -1,64% 1713,58 167,94% 2978,34 365,69%

0,50 99,50 10 1137 5,17 5,21 0,77% 13,05 152,42% 22,93 343,52%

5,00 95,00 10 615 6,58 6,04 -8,21% 16,27 147,26% 28,68 335,87%

2 125 785 879 0,50 99,50 100 126 491,12 483,23 -1,61% 833,33 69,68% 1194,20 143,16% 2088,10 325,17%

5,00 95,00 100 677 6,23 6,25 0,32% 18,75 200,96% 33,73 441,41%

0,50 99,50 10 1248 4,98 5,03 1,00% 12,60 153,01% 22,13 344,38%

5,00 95,00 10 69 606,85 621,60 2,43% 1841,98 203,53% 3261,42 437,43%

3 115 508 887 0,50 99,50 100 178 445,64 450,01 0,98% 833,33 87,00% 1200,91 169,48% 2090,99 369,21%

5,00 95,00 100 80 649,44 614,68 -5,35% 1644,32 153,19% 2890,41 345,06%

0,50 99,50 10 1725 4,50 4,46 -0,89% 11,73 160,67% 20,39 353,11%

5,00 95,00 10 791 6,64 6,54 -1,51% 19,53 194,13% 35,17 429,67%

Музыка Mylene Farmer 68 218 905 0,50 99,50 100 283 446,65 567,46 27,05% 833,33 86,57% 1330,32 197,84% 2337,04 423,24%

5,00 95,00 100 155 547,46 727,90 32,96% 2289,79 318,26% 4062,11 641,99%

0,50 99,50 10 2819 4,50 5,54 23,11% 12,70 182,22% 22,28 395,11%

5,00 95,00 10 1541 5,54 7,49 35,20% 24,59 343,86% 44,23 698,38%

Whitney Houston 46 356 505 0,50 99,50 100 240 531,79 532,78 0,19% 833,33 56,70% 1235,04 132,24% 2162,15 306,58%

5,00 95,00 100 128 698,93 683,81 -2,16% 2037,83 191,56% 3596,37 414,55%

0,50 99,50 10 2390 5,36 5,50 2,61% 12,81 138,99% 22,46 319,03%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5,00 95,00 10 1274 7,09 6,74 -4,94% 19,62 176,73% 35,29 397,74%

Средние значения = 3,58% 68,86% 191,92% 416,24%

Я

Литература

1. Прэтт У. Цифровая обработка изображений: Пер. с англ.-М.: мИр, 1982. - Кн. 1. - 312 с., илл. (стр. 145-151).

2. Lloyd S.P. Least squares quantization in pcm. IEEE Transaction on Information Theory, 38(1): 129137, Mar. 1982.

3. Max J. Quantizing for minimum distortion. IRE Transactions on Information Theory< 6(1):7-12, Mar. 1960.

4. Кэтермоул, К. В. Принципы импульсно-кодовой модуляции / Пер. с англ. В. В. Липьяйнена; Под ред. В. В. Маркова. - Москва: Связь, 1974. - 408 с. (стр. 157-159)

5. Panter P.F. Modulation, noise and spectral analysis/ McGraw-Hill, New York, 1965.

6. Smith B.D. Coding by feedback methods/ — «Proc. IRE», 41 Aug. 1953, 1053-1958.

7. Гашников М. В. Оптимальное квантование в задаче компрессии цифровых сигналов // КО. 2001. №21. URL: http://cyberleninka.ru/article/n/optimalnoe-kvantovanie-v-zadache-kompressii-tsifrovyh-signalov (дата обращения: 09.07.2016).

Поступила 08 июля 2016 г.

8. Советов Б.Я. Теория информации. Л., Изд-во Ленингр. ун-та, 1977. 184 с. (стр.121-123)

9. Мацканюк А.А. Теория информации и кодирования [Электронный ресурс]: учебное пособие для студентов специальности 080801 "Прикладная информатика" (по областям применения): электронное издание / А.А. Мацканюк; М-во образования и науки Российской Федерации, Федеральное гос. бюджетное образовательное учреждение высш. проф. образования "Сочинский гос. ун-т". - Сочи: СГУ, 2014. (стр. 66-74).

10. Kaneko H., Sekimoto T. Logarithmic PCMEn-coding without diodecompandor. - "IEEE Int/ Conven-rion Rec/" Part 8, 1963, 266-281.

11. Горелов Г.В., Осницкий В.И., Трусов К.С., Ромашкова О.Н. Компандирование речевого сообщения по рекомендации МСЭ-Т G.711 международного союза электросвязи // Современные проблемы науки и образования. - 2015. - № 1-1.; URL: http://www.science-education.ru/ru/article/ view?id=17291 (дата обращения: 12.07.2016).

English

Experimental research of some companding laws for optimizing analog signal quantization

Alexey Alekseevich Matskanyuk - Candidate of Technical Sciences, Associate professor Sochi State Universitety.

E-mail: buyanaa1010@mail.ru.

Address: 354000 RF, Sochi, Sovetskaya St., 26.

Abstract: Results of comparative experimental research of application efficiency of optimum (in sense of minimum) dispersion error in reproduction quantization scales according to analog signal level of (Lloyd-Max algorithm), as well as scales based on A and n companding laws are described. Speech and musical fragments of audio signals with total duration 370 minutes from 450 million sample units with 44 kHz frequency were used as reference signals. During the experiment each of fragments was quantized in 2 options of value intervals (99% and 90%) and in 2 options of quantizing intervals (10 and 100 steps) - all in all 4 options or 24 options, considering total fragments number. Each option had three uneven quantization scales - an optimum quantization scale according to Lloyd-Max algorithm, quantization scales based on A and n laws, and one uniform scale. Reference signals were quantized according to level using all these scales and quantizing error dispersions were estimated in all the cases. Results of all 24 options of applying four different quantization scales are summarized in the final table. It follows from it that using optimum (in the sense of minimum error dispersion) quantization scale of analog signal according to level based on Lloyd-Max algorithm gives about 70% error dispersion reduction compared to applying uniform quantization scale. At the same time using A and n companding laws leads on the contrary to increase in error dispersion approximately by 2 - 4 times. As for the result quality estimation it is possible to note that these results for the selected reference analog signals are little sensitive to the interval range of quantized values, quantizing level number and audio signal type.

Key words: analog signal quantization according to level, optimum quantization, companding law, A and n law.

References

1. Pratt W. Digital image processing: Transl. from Eng.-M.: Mir, 1982.-Book 1. - 312 p.

2. Lloyd S.P. Least squares quantization in pcm. IEEE Transaction on Information Theory, 38(1): 129-137, Mar. 1982.

3. Max J. Quantizing for minimum distortion. IRE Transactions on Information Theory <6(1):7-12, Mar. 1960.

Радиотехнические и телекоммуникационные системы, 2016, №4

ISSN 2221-2574

4. Cattermole K. W. Principles of pulse code modulation. - Transl. from Engl. by V.V. Lipyaynen; Ed. by V. V. Markov. - Moscow: Svyaz 1974. - 408 p. (p. 157-159)

5. Panter P.F. Modulation, noise and spectral analysis. - McGraw-Hill, New York, 1965.

6. Smith B.D. Coding by feedback methods. — "Proc. IRE", 41 Aug. 1953, 1053-1958.

7. Gashnikov M.V. Optimum quantization for digital signal compression. - KO. 2001. No. 21. URL: http://cyberleninka.ru/article/n/optimalnoe-kvantovanie-v-zadache-kompressii-tsifrovyh-signalov (date of the address: 09.07.2016).

8. Sovetov B.Ya. Information theory. L., Publishing house of Leningr. un-ty, 1977. 184 p.

9. Matskanyuk A.A. Information and coding theory [Electronic resource]: the manual for students of major 080801 "Applied information science" (according to fields of application): electronic edition. - A. A. Matskanyuk; Ministry of Education and Science of the Russian Federation, Federal the state. Federal state budgetary Educatioal Institution of Higher Vocational Education "Sochi State Un-ty". - Sochi: SGU, 2014. (p. 66-74).

10. Kaneko H., Sekimoto T. Logarithmic PCMEncoding without diodecompandor. - "IEEE Int. - Convenrion Rec" Part 8, 1963, 266-281.

11. Gorelov G.V., Osnitsky V.I., Trusov K.S., Romashkova of O.N. Voice information companding according to ITU-T G.711 recommendation of the International Telecommunications Union. - Modern problems of science and education. - 2015. - No. 1-1.; URL: http://www.science-education.ru/ru/article/view?id=17291 (date of the address: 12.07.2016).

i Надоели баннеры? Вы всегда можете отключить рекламу.