Научная статья на тему 'Разработка методов компрессии аудио и видеоинформации для использования в системах видеоконференцсвязи'

Разработка методов компрессии аудио и видеоинформации для использования в системах видеоконференцсвязи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
174
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка методов компрессии аудио и видеоинформации для использования в системах видеоконференцсвязи»

УДК 681.3.01

ПЛ. Кравченко, Н.Ш. Хусаинов РАЗРАБОТКА МЕТОДОВ КОМПРЕССИИ АУДИО И ВИДЕОИНФОРМАЦИИ ДЛЯ ИСПОЛЬЗОВАНИЯ В СИСТЕМАХ ВИДЕОКОНФЕРЕНЦСВЯЗИ

1. Современные тенденции в области цифровой компрессии аудиовизу-

.

видеокодеков объясняется тем, что они изначально разрабатывались под конкретное приложение, что и определяло требования к алгоритмам сжатия как по их эф, . -годняшний день стандартизованных алгоритмов аудио и, особенно, видеокомпрессии были нацелены на достижение максимальной эффективности кодирования, отличались высокой трудоемкостью и разрабатывались с ориентацией на их аппа-.

С одной стороны, такой подход вполне оправдан: постоянно растущие возможности вычислительной техники приводят к тому, что уже через 2-5 лет алгоритм может быть частично или полностью реализован программным способом. Примером могут служить алгоритмы МРБв, в которых значительная часть алгоритмов декодирования аудио и видеопотоков выполняется программно в реальном времени, а кодирование выполняется либо аппаратно, либо программно не в ре.

Но, с другой стороны, существует широкий спектр задач, требующих компрессии аудио и видеосигналов "на лету", их передачи и воспроизведения "вживую", одновременной обработки (например, микширования) или воспроизведения . , -мерам изображения и частоте кадров приводит и к существенному повышению требований к производительности кодеков.

Вместе с тем, требования к степени сжатия аудио и видеоинформации, на, ,

зачастую оказываются существенно ниже требований к методам сжатия для вещательных или глобальных сетей. Примерами таких систем могут служить системы аудио и видеоконференцсвязи, системы оперативного видеонаблюдения и охраны, специализированные системы обработки аудио и видеоинформации и т.п.

2. Алгоритмы оптимизированных дельта-преобразований второго по. -

ны на две категории: алгоритмы, нацеленные на сохранение частотных характери, , .

группе относятся алгоритмы, использующие перевод и последующую обработку сигнала в частотной области, в частности алгоритмы Фурье- или вейвлет-подобных преобразований. Данные методы обычно отличаются достаточно высокой эффек-( ),

но в то же время и большой трудоемкостью, которая ограничивает область их практического применения в приложениях, где необходима программная обработ-

ка сигналов в реальном или близком к реальному масштабу времени. Ко второй группе относятся алгоритмы импульсно-кодовой, дифференциальной импульснокодовой и дельта-модуляции, характеризующиеся относительно высоким быстродействием и простотой реализации. Недостатком известных алгоритмов данной группы в большинстве случаев является их недостаточно высокая эффективность для большинства современных приложений.

Низкая эффективность цифрового кодирования интенсивно изменяющихся сигналов на основе известных методов дифференциальной импульсно-кодовой модуляции объясняется необходимостью использования нескольких разрядов (обычно 2-4) для хранения/передачи каждого отсчета аудио и видеосигнала. В ал-

- ( используемых в данной проблемной области) для хранения или передачи каждого отсчета используется один бит, но существенные ограничения в скорости изменения демодулированной функции приводят к работе кодера с перегрузкой по кру, , , . Известные алгоритмы дельта-модуляции второго порядка позволяли повысить скорость изменения демодулированной функции, но характеризовались неустойчивостью процессов преобразования, возможностью существенного перерегулирования и возникновения колебаний и, соответственно, низким качеством преобразования при работе с интенсивно изменяющимся сигналом.

В Таганрогском государственном радиотехническом университете (ТРТУ) разработаны алгоритмы оптимизированных дельта-преобразований второго порядка, отличительными особенностями которых являются их простота, высокое быст-, ,

, /1/. преобразований лежит построение для исходного сигнала аппроксимирующей ,

и отличающихся по знаку квантов. Это представляет возможности осуществлять передачу/хранение информации на уровне одноразрядных значений (кодов знаков ), . использования алгоритмов дельта-преобразований со сглаживанием существенно повышает качество преобразования интенсивно изменяющихся и зашумленных .

Применение этих алгоритмов позволяет обеспечить увеличение отношения сигнал/шум при кодировании сигналов, характеризуется слабой чувствительностью аппроксимирующей функции к помехам независимо от их амплитуды, оптимизацией по быстродействию отработки скачка (переходный процесс) модулируе-, , -, -мены полноразрядных отсчетов исходного сигнала одноразрядными знаками квантов вторых разностей демодулированной функции.

Примеры преобразования строки изображения и аудиосигнала с использованием алгоритмов оптимизированных дельта-преобразований второго порядка при. 1 2.

Значения

сигнала

Рис.1. Пример преобразования строки изображения с использованием алгоритма оптимизированных дельта-преобразований второго порядка

Рис. 2. Пример преобразования речевого сигнала с частотой 8000 Гц алгоритмами оптимизированных дельта-преобразований второго порядка. Скорость выходного

потока кодера - 10.8 Кбит/с

3. Цифровая компрессия видеоизображений и аудиосигналов на основе алгоритмов оптимизированных дельта-преобразований второго порядка.

Суть разработанного метода покадровой компрессии видеоизображений состоит в построчном кодировании участков изображения алгоритмами оптимизированных дельта-преобразований второго порядка с последующей коррекцией ошибок дельта-преобразования на участках, где эта ошибка превышает предельно допустимые значения. Подавление выполняется на незначительном количестве участков, требующих коррекции и содержащих, как правило, резкие, контрастные переходы, точность передача которых может быть снижена.

Особенностью алгоритма является реализация иерархической системы кодирования и возможность существенного повышения быстродействия за счет отказа от использования корректирующих методик на участках с достаточно малой ошибкой дельта-преобразования. Трудоемкость кодера составляет от 2-4 (в простейшем случае) до 12-14 (на участках с "полной" схемой кодирования) целочисленных операций типа сложений и сдвигов на отсчет. Трудоемкость алгоритма восстановления составляет от 2 до 5 операций целочисленного сложения на отсчет.

При проведении экспериментальных исследований алгоритма кодирования неподвижных фотографических изображений были получены коэффициенты сжатия, в среднем не уступающие международному стандарту 1РБв (порядка 1114 ). -

тавимо со стандартом 1РБв (при разнице по соотношению сигнал/шум в среднем не более 1.2-2 дБ в пользу 1РБв). Было также отмечено существенное повышение быстродействия в первую очередь алгоритма восстановления изображения (порядка 2-2.5 раз) /2/.

В разработанном методе кодирования аудиопотока сжатие достигается при поблочной обработке аудиосигнала алгоритмами оптимизированных дельтапреобразований второго порядка за счет замены полноразрядного представления отсчетов в виде последовательности одноразрядных знаков квантов модуляции. Для сжатия требуется порядка 10-12 операций целочисленного сложения и сдвигов, а для восстановления - порядка 2-х операций целочисленного сложения на .

Особенностью разработанного подхода является возможность использования кодера как в режиме с постоянной скоростью выходного потока (при гарантиро-

), -ей скорости выходного потока к фактической пропускной способности канала свя-.

системе речевого уплотнения позволяет обеспечить предельно высокое качество кодирования с учетом пропускной способности канала связи и количества задействованных абонентских линий. Другой областью применения такого режима работы является обмен звуковыми сообщениями в 1Р-сетях с коммутацией пакетов, где скорость выходного потока кодера адаптируется к текущей пропускной способности канала связи, оцениваемой по количеству дошедших до адресата пакетов.

Сравнительные субъективные оценки качества кодирования по 5-бадьной шкале М08 стандартных подходов и разработанного метода для различных типов аудиосигналов приведены в табл. 1 [3].

Таблица 1

Тип аудиосигнала, область использования Схема кодирования - кретизации, КГц Выходной поток (моно), Кбит/с Битов на отсчет Оценка МОБ

речь, телефония СБЬР 8 8.0 1.0 3.9

речь, телефония разработанный метод 8 9.0 1.125 2.3

речь, телефония СБЬР 8 16.0 2.0 4.1

речь, телефония разработанный метод 8 17.0 2.125 4.0

речь, телефония G.721 ADPCM 8 32.0 4.0 4.1

речь, телефония разработанный метод 8 32.8 4.1 4.4

речь, радиовещание G.722 16 48.0 3.0 3.7

речь, радиовещание G.722 16 56.0 3.5 4.0

речь, радиовещание G.722 16 64.0 4.0 4.1

речь, радиовещание разработанный метод 22 24.0 1.1 4.1

речь, радиовещание разработанный метод 22 46.0 2.1 4.5

музыкальный сигнал MPEG Layer I 44 224.0 5.1 5.0

музыкальный сигнал MPEG Layer II 44 192.0 4.4 5.0

музыкальный сигнал MPEG Layer III 44 64.0 1.5 4.9

музыкальный сигнал разработанный метод 44 48.0 1.1 2.0

музыкальный сигнал разработанный метод 44 92.0 2.1 3.6

музыкальный сигнал разработанный метод 44 180.0 4.1 4.7

6. Особенности применения алгоритмов аудио и видеокомпрессии на основе оптимизированных дельта-преобразований второго порядка в системах - . -

лений дальнейших разработок и применения алгоритмов аудио и видеокомпрессии на основе оптимизированных дельта-преобразований второго порядка на сегодняшний день являются программные системы компьютерной аудио и видеоконференц-связи. Применение подобных алгоритмов имеет ряд особенностей /4/:

1.

задача смешивания аудиопотоков для генерации "единого звукового сигнала" аудитории. Если количество пользователей достаточно велико, то решение

- - -

.

дельта-преобразований позволяет в значительной мере упростить ее решение.

2. " " -зи. Особенностью защиты на основе дельта-преобразований является реализация достаточно высокой степени защиты информации на основе простых .

3. -

не развития вычислительной техники пока не в состоянии обеспечить чисто программную компрессию в реальном масштабе времени со скоростью более 1-2- / , -, , -раничивает область ее применения. Кроме того, наиболее перспективный ры-

нок для систем подобного рода - коммерческие и государственные организации, имеющие локальные и корпоративные сети с достаточно высокой пропу-. -, -рования по сравнению со стандартными кодеками, но позволяющих реализовать передачу видеопотоков с частотой 8-10 кадров/сек и выше на обычных , .

ЛИТЕРАТУРА

1. Кравченко П.П. Основы теории оптимизированных дельта-преобразований второго порядка. Цифровое управление, сжатие и параллельная обработка информации. Таганрог: Изд-во ТРТУ, 1997.

2. Кравченко П.П., Хусаинов Н.Ш. Разработка методов компрессии аудио и видеоинформации с использованием оптимизированных дельта-преобразований второго порядка /Тез.докл. 3-й Международной конференции "Цифровая обработка сигналов и ее применения DSPA-2000". М.: МЦНТИ, 2000.

3. Holl P. Digital Audio Coding for Visual Communications //Proceedings of the IEEE. 1995. v.83, № 6

4. . ., . . . .:

«Мобильные коммуникации», 1999.

УДК 007.681.518.2

И.В. Г речин

ТЕХНОЛОГИЯ РАБОТЫ ЭКСПЕРТНОЙ СИСТЕМЫ В СЕТИ INTERNET/INTRANET

Задолго до появления Internet разрабатывались программы для ЭВМ, моделирующие действия человека-эксперта при решении задач в определённой предметной области, на основе накопленных знаний, составляющих базу знаний (БЗ). Эти программы принято называть экспертными системами (ЭС). В настоящее время создано большое количество ЭС различных типов, которые помогают человеку в различных областях его деятельности в медицине, образовании, экономике, строительстве и т.д. Но все эти системы обладают большим недостатком, они не доступны многим нуждающимся в них людям по разным причинам, большой стоимости, , . итоге накопленное программное и информационное обеспечение не используется в полном объёме и не имеет общего стандарта хранения, используется только для конкретных и узких задач. Исправить эти недостатки возможно, если дать доступ к ЭС посредством глобальной сети Internet.

В данное время ведётся разработка обучающей ЭС, к которой будет возможен доступ через сети Internet/Intranet. Работать с системой возможно при наличии стандартного программного обеспечения, доступного всем, а именно при наличии широко распространённых броузеров Internet Explorer или Netscape Communicator.

i Надоели баннеры? Вы всегда можете отключить рекламу.