Научная статья на тему 'Методы и модели передачи и трансляции потокового видео в Интернет'

Методы и модели передачи и трансляции потокового видео в Интернет Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
543
77
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дюбко Г. Ф., Павленко Р. В., Вечур А. В.

Рассмотрены современные проблемы передачи потоковой видео информации в Интернет. Приведены наиболее распространенные форматы передачи потокового видео в Интернет и их особенности. Описана улучшенная модель стандарта кодирования, основанная на современном эффективном стандарте H.264 и предполагающая реализацию дискретного вейвлет-преобразования взамен целочисленного преобразования, которая может быть использована для реализации стандартов кодирования видео для последующей передачи в Интернет

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы и модели передачи и трансляции потокового видео в Интернет»

содержимого мультимедиа в формате MPEG-7 и более высокоуровневое текстовое описание. В статье предложена такого рода модель, а также операции ее формирования.

При классификации мультимедиа, близкие по содержанию и текстовому описанию мультимедиа также можно объединять в один класс, содержащий обобщенные описания объектов, отображаемые в мультимедиа, связи между ними и ключевые слова текстовых метаданных из некоторого тезауруса. Авторами также предложены модель этого класса и метод его обновления, а также методы классификации мультимедиа и разбиения их на классы. Описанный подход даст возможность расширить область поиска и навигации мультимедиа благодаря привлечению медиа-данных, похожих по содержанию и текстовому описанию.

Литература

1. Вихровский К., Игнатенко А. Применение МРБС-7 для классификации и поиска визуальных данных // Сетевой журнал «Графика и Мультимедиа». — 23.12.2006. — Режим доступа к статье: http://cgm.graphicon.ru/content

/^е»/161/61/

2. Дюран Б., Оделл П. Кластерный анализ. — М.: Статистика, 1977. — 128 с.

3. Ночевнов Д. П. Об одном подходе к формализации адаптивного информационного поиска на основе модели пользователя // Вюник Черкаського державного техно-лопчного ушверситету. — 2003. — № 4. — С. 14-16.

4. Озкархан Э. Машины баз данных и управление базами данных: Пер. с англ. — М.: Мир, 1989. — 696 с.

5. Dance Sandy, Caelli Terry, Liu Zhi-Qiang. Picture Interpretation: A Symbolic Approach//World Scientific Series In Machine Perception And Artificial Intelligence; Vol. 20 — 1996.

6. Getty's Art and Architecture Thesaurus. — Режим доступа к библиотеке: http://www.getty.edu/research/conduc-ting_research/vocabularies/aat/

7. Goodrum A. A. Image information retrieval: An overview of current research // Informing Science, 3 (2): P. 63-66, February 2000.

8. MPEG-7 Overview. — Режим доступа к описанию: http://www.mpeg-7.com.

9. Pedrycz Witold. Knowledge-based clustering: From Data to Information Granules. — John Wiley & Sons, 2005. — 316 p.

10. Petridis K., Kompatsiaris I., Strintzis M.G., Bloehdorn S., Handschuh S., Staab S., Simou N., Tzouvaras V., Avri-this Y. Knowledge representation for semantic multimedia. Content analysis and reasoning. — EWIMT, 2004.

11. Petrushin V. A., Khan L. (Eds). Multimedia Data Mining and Knowledge Discovery. — Springer-Verlag London Limited, 2007. — 521 p.

12. Stamou Giorgos, Kollias Stefanos (Eds). Multimedia Content and the Semantic Web. — John Wiley & Sons Ltd, 2005 — 392 p.

13. Thesaurus for Graphic Materials // Library of Congress. — Режим доступа к библиотеке: http://www.loc.gov/rr /print/tgm1/

МЕТОДЫ И МОДЕЛИ ПЕРЕДАЧИ И ТРАНСЛЯЦИИ ПОТОКОВОГО ВИДЕО

В ИНТЕРНЕТ

Г. Ф. Дюбко

кандидат технических наук, профессор кафедры*

Р. В. Павленко

магистрант кафедры* Контактный тел.: 8-097-619-62-21 E-mail: pavroman@gmail.com

А. В. В е ч у р

кандидат технических наук, доцент кафедры*

*Кафедра Программного обеспечения ЭВМ Харьковского национального университета радиоэлектроники пр. Ленина, 14, г. Харьков, Украина, 61166

-□ □-

Рассмотрены современные проблемы передачи потоковой видео информации в Интернет. Приведены наиболее распространенные форматы передачи потокового видео в Интернет и их особенности. Описана улучшенная модель стандарта кодирования, основанная на современном эффективном стандарте H.264 и предполагающая реализацию дискретного вейвлет-преобразования взамен целочисленного преобразования, которая может быть использована для реализации стандартов кодирования видео для последующей передачи

в Интернет -□ □-

1. Введение

В процессе коммуникации людей визуальное восприятие информации наряду со звуковым сопровождением имеет большое значение и способствует понима-

нию сторонами друг друга. Интернет как среда общения и взаимодействия людей, способствует развитию различных средств и методов коммуникации общества на различных уровнях — от самых примитивных (текстовые сообщения), до видео-трансляций высокого качества

в режиме реального времени. В настоящее время в Интернет создано большое количество сервисов, предоставляющих возможности записи, трансляции и просмотра потокового видео в режимах реального времени и по-требованию, т. е. с предварительным сохранением файла на сервер. Результатом деятельности таких сервисов являются созданные сообщества пользователей, объединенных одинаковыми интересами, идеями, взглядами и мнениями. Значит, растет уровень общения и обмена информацией в подобных сетях. Если учитывать последние тенденции в развитии глобальной сети и сетевого аппаратного обеспечения, очевидно, что количество просматриваемого онлайн видео в Интернет будет только расти.

2. Проблемы кодирования и декодирования видео для Интернет-передачи

Несмотря на бурный рост видео сервисов и развитие сетевой аппаратуры, по-прежнему остается большое количество проблем, требующих решения, на пути к усовершенствованию технологий кодирования и декодирования видео. Проблемы кодирования (сжатия) видео заключаются в необходимости достижения:

■ минимальной потери качества;

■ минимальных затрат ресурсов;

■ быстродействия алгоритма;

■ эффективной компрессии видео данных с целью возможности навигации по файлу или потоку при просмотре;

■ устойчивость к ошибкам;

■ масштабируемость;

■ стоимость программного комплекса для кодирования.

Проблемы декодирования представлены:

■ малым временем декодирования;

■ временем задержек — частично можно отнести к сетевым проблемам;

■ частотой и временем ребуферинга;

■ необходимость загрузки дополнительных модулей или программ для просмотра видео.

3. Существующие форматы кодирования видео для передачи в Интернет

Решение данных проблем требует более подробного ознакомления с существующими технологиями и способами Интернет-передачи видео. Сегодня основными форматами представления видео для передачи в Интернет являются Real Video, QuickTime, Windows Media и Flash Video, разрабатываемые соответственно компаниями Real Networks, Apple, Microsoft и Adobe. Лидирующие позиции по распространению и использованию в настоящее время занимают Windows Media и Flash Video, но, не смотря на это, остальные форматы также продолжают развиваться и придерживаться достаточно высоких показателей качества кодирования.

Формат Real Video использует в основе своего алгоритма кодирования стандарт H.263, а последние версии кодировщика реализуют стандарт H.264 с некоторыми модификациями:

■ визуальное качество улучшено за счет удаления видимых артефактов;

■ поддержка всех режимов кодирования формата Real Video 9 — с постоянным битрейтом, c переменным битрейтом;

■ выполнение строгого анализа для декомпрессии и компрессии видео содержимого;

■ более сложная сегментация изображений и анализ движения;

■ высокоточные решения режимов, направленные на совершенствование эффективности работы кодировщика;

■ улучшенное предсказание пикселов изображения;

■ поддержка широкоформатных видео данных, включая 720 х 1080;

■ поддержка видео с чересстрочной разверткой до 60 полей.

Видео, передаваемое в формате QuickTime, кодируется по новому промышленному стандарту H.264/AVC, показатели которого по качеству и производительности очень высоки, согласно последним исследованиям.

Формат Windows Media использует стандарт VC-1, являющийся, по сути, альтернативой H.264/AVC. Так, данный стандарт подразумевает реализацю ряда нововведений в сравнении с другими стандартами — H.263, MPEG-1, MPEG-2, MPEG-4:

■ адаптивная трансформация размеров блока;

■ 16-битовая трансформация;

■ контурный фильтр движения;

■ кодирование чересстрочного видео;

■ усовершенствованное кодирование B-кадров;

■ компенсация затемнения;

■ дифференциальное квантование.

Flash Video формат является контейнером для видео сжатого по стандартам Spark и VP6. Последняя версия кодировщика реализует стандарт VP6 компании On2. VP6 является форматом семейства форматов H.264, хотя даже по метрике PSNR он превосходит H.264 в нескольких случаях. Для VP6, с точки зрения технической составляющей, в первую очередь характерно использование I-кадров и однонаправленных P-кадров. Таким образом, в этом формате отсутствуют B-кадры, но P-кадры могут иметь несколько ссылок на предыдущие кадры. VP6 использует адаптивную суб-пиксельную оценку движения. VP6 также реализует более совершенную модель предсказания частотных коэффициентов низшего порядка и усовершенствованную стратегию квантования, которая позволяет сохранять больше деталей в выходном потоке. Для кодирования энтропии VP6 использует различные подходы, в зависимости от сложности и/или размеров кадра, включая коды переменной длины (VLC) и контекстно-моделируемое бинарное кодирование. Таким образом, одним из главных преимуществ VP6 в сравнении с H.264, является простота его реализации и отсутствие дополнительных затрат за использование стандарта, как интеллектуальной собственности, а также плата за использование приемлемого H.264 кодировщика видео.

4. Описание улучшенной модели кодирования видео

Предлагаемая модель основана на последнем широко-распространенном промышленном стандарте ^264 и подразумевает использование дискретного вейвлет-преобразования (ДВП) вместо предлагаемого стандартом ^264 целочисленного преобразования.

Первый этап работы стандарта выполняет формирование (подготовку) кадров для дальнейшей обработки, то есть разбиение изображения на макроблоки размеров 16 х 16 пикселов. Подготовка реализована в виде модели предикторов, зависящей от типов предсказаний: интра-предсказание, при котором предсказание макроблока, основанное на ранее закодированных данных, выполняется с использованием данных текущего кадра, либо ин-тер-предсказание, в котором используются данные ранее закодированных кадров. Обработка (преобразование) макроблоков начинается с целочисленного преобразования, подобного дискретному косинус-преобразованию. Эффективным нововведением считается использование подобного подхода к преобразованиям данных, поскольку, имея дело с коэффициентами-целыми числами, исключены ресурсоемкие и продолжительные операции над числами с плавающей точкой. Кроме этого, преобразование происходит в результате применения операций сложения и деления на число-степень 2, то есть сдвигов. Целочисленное преобразование макроблоков яркости как и блоков цветности (СЬ, Сг), позволяет сжимать данные без существенных потерь, что, практически исключает несовпадение декодированных данных с оригиналом. Сжатые таким образом данные скалярно квантуются коэффициентами из специально разработанной таблицы, поддерживаемой данным стандартом, имеющей следующие данные — это параметры и шаги квантования. С увеличением параметра квантования на 1, шаг увеличивается на 12,5 %, а каждые 6 параметров происходит удвоение последнего. Такая гибкая система параметров квантования позволяет реализовать эффективную систему квантования данных без значимых потерь, в зависимости от изменения битрейта. На следующем шаге происходит кодирование энтропии квантованных последовательностей — САВАС и CAVLC [1].

Как было сказано выше, теоретически, эффективным усовершенствованием рассматриваемого стандарта Н.264 может быть применение дискретного вейвлет-преобра-зования (ДВП) взамен целочисленного преобразования для интра-режима. Основаниями для данного предположения можно считать следующие преимущества ДВП:

■ оценка сложности преобразований равна О(Ы) для первого уровня преобразований.

■ применение частного случая ДВП — нормализованного преобразования Хаара, которое, хоть и является

простейшим ДВП, но содержит в себе все необходимые для качественного сжатия данных свойства. Поскольку поддиапазоны низкого уровня состоят из несущественных особенностей изображения, поэтому их можно смело квантовать и даже отбрасывать. Это дает хорошее сжатие с частичной потерей информации, которая, однако, не отразится на качестве восстановленного образа. Реконструкция образа делается очень быстро при минимальной потере качества.

■ определение нульдеревьев и определение минимально допустимого предела количества незначимой информации в дереве — такой подход можно назвать частичным квантованием, поскольку деревья с незначимой информацией не принимаются во внимание во время последующего скалярного квантования и дальнейшей передаче данных на энтропийное кодирование.

■ ДВП может сжимать изображения, как с потерями, так и без. В нашем случае допускается некоторая степень потери данных из-за специфики среды просмотра видео — Интернета.

■ ДВП не вносит дополнительной избыточности в исходные данные, и сигнал может быть полностью восстановлен с использованием тех же самых фильтров.

Таким образом, последовательность действий, выполняемых модифицированной моделью можно представить в виде диаграммы на рис. 1.

В нашем случае дискретное вейвлет-преобразование будет представлено денормализированным преобразованием Хаара, при котором делителем коэффициентов будет число-степень 2, что, с одной стороны, усложнит процесс обратного преобразования, поскольку использование делителя -/Ы, где N = 2п, ведет к манипулированию ортогональными матрицами, а обращение такой матрицы, как известно, выполняется через ее транспонирование [2]. С другой стороны, деление коэффициентов на число-степень 2 упростит машинное время, затрачиваемое на операции деления, ведь в таком случае, будут использоваться операции сдвига.

Двумерное ДВП, которое будет применяться для пикселов макроблоков каждого из кадров реализуемо стандартно, как для одномерного массива данных, так и в виде пирамидального разложения матрицы входных данных. Для нашего случая более подходящим можно считать пирамидальное преобразование данных. Пирамидальное разложение вычисляет вейвлетное преобразование,

Процессы кодировщика

Источник, видео

Модуль предсказания кадров Модуль преобразования Энтропийное кодирование

Дискретное вейвлет-преобразование

Скалярное квантование

Передача или

'сохранение видео

Рисунок 1. Диаграмма процессов кодировщика предлагаемой модели

применяя итерации поочередно к строкам и столбцам. На первом шаге вычисляются полусуммы и полуразности для всех строк (только одна итерация, а не все вейвлетное преобразование). Это действие производит средние в левой половине матрицы и полуразности — в правой половине. На втором шаге вычисляются полусуммы и полуразности для всех столбцов получившейся матрицы.

В итоге в левом верхнем квадранте будут стоять средние четырех квадрантов исходного образа, а в остальных квадрантах будут находиться соответствующие полуразности. Шаги 3 и 4 оперируют со строками и столбцами, в результате чего средние величины будут сконцентрированы в левой верхней подматрице (одной шестнадцатой всей исходной таблицы). Эти пары шагов применяются к все более и более маленьким подматрицам, до тех пор, пока в верхнем левом углу не будет стоять среднее всей исходной матрицы, а все остальные пикселы преобразуются в разности в соответствии с ходом алгоритма. Весь процесс показан на рис. 2.

Таким образом, преобразование Хаара реализует под-диапазонное разбиение образа. Результирующие данные состоят из двух главных областей — левый верхний поддиапазон, который является ничем иным, как уменьшенной копией исходного образа с ухудшенным качеством и более низким разрешением, в то время как правый нижний поддиапазон отображает диагональные особенности образа. Описанные поддиапазоны определяют, как низкочастотные коэффициенты с низким разрешением и уровень высокочастотных коэффициентов высокого разрешения соответственно [4]. Поддиапазоны образуют древовидную структуру преобразованного об-

Рисунок 2. Пирамидальное разложение

раза (рис. 3), которая предоставляет необходимую информацию для прореживания коэффициентов ДВП.

Определение коэффициентов ДВП предполагается производить посредством матричного представления. Если предположить, что I — исходный массив данных, то для полного его вейвлетного преобразования необходимо не только умножить на полученную матрицу ^ а и применить преобразования W к вектору WI, что равносильно произведению W на (WI)T. Полное преобразование в таком случае будет выглядеть так:

14г = ^^1)т)т = WIWT,

(1)

где 14г — преобразованная последовательность, W имеет вид (2).

1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8' 1/8 1/8 1/8 1/8 -1/8 -1/8 -1/8 -1/8 1/4 1/4 -1/4 -1/4 0 0 0

W=

. (2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

0 0 0 0 1/4 1/4 -1/4 -1/4 1/2 -1/2 0 0 0 0 0 0 0 0 1/2 -1/2 0 0 0 0 0 0 0 0 1/2 -1/2 0 0 0 0 0 0 0 0 1/2 -1/2

Как правило, на данном этапе при использовании ДВП делители — степени 2 подменяют на где N = 2п, что приводит к оперированию ортогональными матрицами и упрощает процесс обратного преобразования, при котором достаточно перемножить преобразованные вектора данных на транспонированную матрицу [3]. Но в силу того, что в нашем случае требуется оптимизация алгоритма кодирования, мы оставим делители в виде чисел-степеней 2, с целью упразднения операций сложения, деления и взятия корня квадратного до сложения и сдвига вправо.

Для обратного преобразования справедлива формула:

1Ь = = Ш-Ч!^-1)1), (3)

1 н и. ш г~ <— Г" НН 1.Н 1.Н

Н1_ НН Н1_ НН Н1 НН

Рисунок 3. Пространственно ориентированные деревья

где 1ь — обратно преобразованная последовательность.

Следующим этапом вейвлет-преобразо-вания является определение нульдеревьев и их фильтрация. Для начала стоит определиться со структурой деревьев коэффициентов ДВП. Так, корнем дерева считается крайний правый и одновременно самый нижний высокочастотный вектор (НН, HL, LH). Остальные же вектора, ближе к низкочастотному поддиапазону являются дочерними элементами дерева ДВП.

Зачастую, в алгоритмах, основанных на ДВП и нульдеревьях, обход каждого из деревьев для определения значимости их векторов является итеративным и подразумевает просмотр всех без исключения элементов (векторов) дерева. Просмотр векторов начинается с низкочастотного поддиапазона и продолжается по векторам, позиционирующимся в соответствии с низкочастотным коэффициентом (рис. 3) в секторах высших частот — НЦ LH, НН. Нульдеревом считается

а

дерево коэффициентов ДВП, величины которых не удовлетворяют условию |х| < Т или другими словами являются незначимыми, где х — величина коэффициента ДВП, Т — некоторое граничное значение, величина которого может быть, как константой, так и варьироваться в зависимости от определенных условий.

В стандартных реализациях ДВП с нульдеревьями, как было упомянуто выше, рассматриваются все без исключения элементы векторов дерева. В итоге деревья помечаются, как значимые (те, чьи абсолютные вели-

После полного дискретного вейвлет-преобразования блока кадра размерами 8 х 8 он подается на обработку квантователю стандарта Н.264. Стандартный модуль скалярного квантования Н.264 разработан таким образом, чтобы при изменении битрейта реагировать соответствующим выбором подходящего параметра и шага квантования. Это позволяет сохранять целостность данных при изменении условий их передачи и гибко реагировать на помехи при кодировании видео данных. В табл. 1 представлены параметры скалярного квантования стандарта Н.264 [1].

Таблица 1

Параметры и шаги скалярного квантования стандарта H.264

QP 0 1 2 3 4 5 6 7 8 9 10 11 12

QStep 0,625 0,6875 0,8125 0,875 1 1,125 1,25 1,375 1,625 1,75 2 2,25 2,5

QP 18 24 30 36 42 48 51

QStep 5 10 20 40 80 160 224

чины превосходят установленный барьер), нульдеревья и изолированные нульдеревья (чьи элементы содержат как значимые, так и незначимые данные). Такой подход предполагает формирование карт значимости, содержащих величины значимых коэффициентов, специальные символы, обозначающие нульдеревья, изолированные нульдеревья, а также, иногда выделяют дополнительные понятия отрицательных значимых элементов. Данная методика, очевидно, ресурсоемка и громоздка на фоне оптимизации алгоритма сжатия, поэтому были предложено выполнение несколько модифицированных и упрощенных действий с целью формирования кода коэффициентов ДВП.

Новый подход предполагает проводить фильтрацию элементов векторов деревьев несколько иным способом, основанным на гипотезе, утверждающей, что в случае незначимости низкочастотного коэффициента дерева, незначимыми стоит также считать все коэффициенты дерева, то есть те, которые локализованы в подобных пространственных секциях, что и данный незначимый элемент крупномасштабного поддиапазона. Таким образом, определение нульдеревьев происходит не итеративно, а лишь в один проход, что позволяет сэкономить ресурсы и время обработки данных. Такая фильтрация является своего рода квантованием ДВП, а также часто определяется как фильтрация малых высокочастотных коэффициентов.

При нахождении незначимого низкочастотного коэффициента дерево определяется, как нульдерево и помечается в кодируемой последовательности величин специальным символом. Обозначение нульдеревьев важно для декодеров, которые будут производить обратное преобразование кодированных данных. Значимые коэффициенты дерева также помещаются в кодируемый поток для последующего квантования.

Принимая во внимание достаточно жесткие условия фильтрации, некоторые данные — высокочастотные детали образов — могут быть утеряны в случае незначимости дерева. Но, как показывает практика, вероятность ошибочного предположения для данной гипотезы составляет не более 0,1.

Стоит отметить, что блок пикселов подаваемых на обработку имеет размеры 8 х 8 и выбирается как часть стандартного для Н.264 макроблока размеров 16 х 16.

Для управления предельным значением коэффициентов ДВП, определяющим их значимость предлагается использовать таблицу, аналогичную табл. 1 , которая будет устанавливать зависимость между битрейтом (скоростью обработки данных) и предельным значением Т (табл. 2).

Таблица 2

Предельные значения значимости коэффициентов ДВП

KBps 20 40 60 600

T 1 2 3 31

Последним значением Т в табл. 2 является 31, поскольку в случае кодирования одного пиксела максимальным значением яркости или цветности (СЬ, Сг) может быть 255, которое необходимо разделить на максимальный делитель матрицы дискретных вейвлет-пре-образований: 8 - 255/8 = 31,875. Данная таблица предопределенных граничных значений позволит более гибко управлять фильтрацией нульдеревьев преобразованных изображений в процессе ДВП.

5. Результаты экспериментального исследования модели

Для экспериментального исследования предлагаемая модель модифицированного стандарта H.264 с использованием дискретного вейвлет-преобразования была запрограммирована в виде WinForms приложения. Кодировщик видео потока был разработан на платформе .NET 2.0 с реализацией на языке C# 2.0. К кодировщику был также добавлен модуль тестирования, ответственный за расчет метрики PSNR и степени сжатия для каждой из тестовых видео последовательностей.

Суть сравнительного экспериментального исследования заключалась в расчете и сравнении показателей степени сжатия видео и сохранения качества видео для собственного целочисленного метода преобразования стандарта H.264 и предложенной модификации данного стандарта, основанной на использовании дискретного вейвлет-преобразования.

Эксперименты проводились на четырех QCIF видео последовательностях: «Foreman» (144 х 144, 300 кад-

ров, 30 кадров/сек), «Mobile» (144 х 144, 300 кадров, 30 кадров/сек), «Mother_daughter» (144 х 144, 300 кадров, 30 кадров/сек) и «Suzie» (144 х 144, 150 кадров, 30 кадров/сек) [5]. Для каждой из экспериментальных видео последовательностей рассчитывались метрики качества видео такие, как Compression Ratio (CR) — степень сжатия, и Peak Signal-to-Noise Ratio (PSNR) — мера отношения сигнала к шуму.

Величина CR рассчитывалась, как:

„„ начальный_размер_файла - размер_сжатого_файла

=-:-^-. (4)

начальный_размер_файла

Метрика измерения качества видео PSNR рассчитывалась следующим образом:

PSNR = 10lg ^ Met) dB, (5)

которая основана на среднеквадратичной ошибке (MSE) между оригинальным и уменьшенным изображениями (кадрами), относительно (2n -1)2 — квадрату наибольшего значения сигнала в изображении.

Табл. 3 и 4 отображают показатели производительности в сравнении целочисленного (ДКП-подобного) стандарта H.264 и предлагаемого дискретного вейвлет-преобразования Хаара с нульдеревьями для YUV-пред-ставленных последовательностей изображений, таких как Foreman, Mobile, Mother_daughter, и Suzie. Параметры производительности включают значения PSNR наряду со степенью сжатия, количеством бит в кадре при 8-битном кодировании пиксела) и временем кодирования.

Результаты, представленные в табл. 3, показывают, что предлагаемый подход в преобразовании изображений работает в 1,15 раз быстрее существующего в стандарте H.264. Относительно показателей яркости по метри-

ке PSNR, рассматриваемая модель достигает величины большей на 2,5 дБ, что является несомненным улучшением качества передачи видео. Сравнительная производительность нового подхода достигается при одинаковой степени сжатия, характерной для собственной методики преобразований стандарта.

Данные из табл. 4 отображают показатели метрики PSNR, степени сжатия и времени сжатия, а также среднее количество бит в одном изображении видео последовательностей «МоШег_6яи£Ы;ег» и при

сравнительной их обработке целочисленным (ДКП-по-добным) и дискретным вейвлет-преобразованием. Так, предлагаемый подход показывает лучшие результаты в скорости кодирования в 1,3 раза. Аналогично показаны лучшие результаты степени сжатия и расчета метрики качества видео — PSNR. Можно наблюдать улучшение показателя PSNR на 1,3 дБ в среднем.

6. Выводы

В результате проделанной работы, предложенная модель позволила разработать модифицированный алгоритм компрессии видео данных на основе широко используемого промышленного стандарта Н.264, который по своим характеристикам не уступает базовому, что подтверждается экспериментально, но даже показывает лучшие результаты сжатия и сохранения качества видео. В качестве модификации был выбран механизм дискретного вейвлет-преобразования взамен собственной модели целочисленных (ДКП-подобных) преобразований стандарта Н.264. Помимо внедрения самого ДВП, как нововведения, в алгоритм было добавлено преобразование с использованием нульдеревьев, которое позволяет сжимать видео данные более эффективно. В предлагаемом алгоритме ДВП отсутствуют операции умножения

Таблица 3

Сравнение производительности целочисленного (ДКП-подобного) преобразования и дискретного вейвлет-преобразования на примере последовательностей кадров «Foreman» и «Mobile»

Видео последовательность «Foreman» «Mobile»

Параметры ДКП ДВП Хаара ДКП ДВП Хаара

PSNR Y(дБ) 33,68 33,75 32,05 34,48

PSNR и(дБ) 33,80 36,19 31,89 34,47

PSNR V(дБ) 33,87 36,00 31,92 34,48

Время кодирования (с) 1676,104 1451,217 1959,355 1639,257

Степень сжатия (CR) 0,8768 0,8768 0,7712 0,7722

Ср. количество бит/кадр 11245624 11176528 20766232 20706376

Таблица 4

Сравнение производительности целочисленного (ДКП-подобного) преобразования и дискретного вейвлет-преобразования на примере последовательностей кадров «Mother_daughter» и «Suzie»

Видео последовательность «Mother daughter» «Suzie»

Параметры ДКП ДВП Хаара ДКП ДВП Хаара

PSNR Y(дБ) 34,48 36,76 34,37 36,30

PSNR и(дБ) 34,13 36,19 34,44 36,49

PSNR V(дБ) 34,18 36,23 34,45 36,47

Время кодирования (с) 1554,032 1183,067 651,373 581,145

Степень сжатия (CR) 0,9135 0,9135 0,9237 0,9246

Ср. количество бит/кадр 7851616 7766600 3475376 3440328

и деления, что также должно способствовать ускорению процесса обработки видео.

Литература

1. Iain E G Richardson. White Paper:An Overview of H.264 Advanced Video Coding, 2007. — 7 p.

2. Воробьев В. И., Грибунин В. Г. Теория и практика вейв-лет-преобразования. ВУС, 1999. СПб., 1999. — 204 с.

3. Pankaj N. Topiwala. Wavelet Image and Video Compression. Kluwer Academic Publishers Norwell, MA, USA, 1998. — 438 p.

4. Д. Сэломон. Сжатие данных, изображений и звука, Москва: Техносфера, 2004. — 368 с.

5. http://see.xidian.edu.cn/faculty/xbgao/html/VIPSL/da-tabase Video.html

Рассмотрены вопросы, касающиеся представления и модификации реляционных схем данных. Для повышения эффективности решения таких задач предлагается модель расширения реляционных схем (МРРС), которая позволяет строить новые виртуальные схемы данных из существующих, аналогично механизму представлений (VIEW) языка SQL

УДК 004.942:004.62

МОДЕЛЬ РАСШИРЕНИЯ РЕЛЯЦИОННЫХ СХЕМ

Е. В. Малахов

кандидат технических наук, доцент заведующий кафедрой Информационных систем в менеджменте*

Контактный тел.: +38 (048) 7797-417 E-mail: mev@opu.ua

Б. Ф. Трофимов

аспирант*

Контактный тел.: +38 (067) 937-0-973 E-mail: btrofimov@acm.com

*Одесский национальный политехнический университет пр. Шевченко, 1, г. Одесса, Украина, 65044

Введение

В настоящее время, в условиях постоянного изменения исходной модели данных, качеству спроектированных систем баз данных уделяется огромное внимание. Существующие подходы не являются универсальными и масштабируемыми. Кроме того, современные реляционные СУБД заставляют разработчиков самостоятельно искать пути для решения следующих задач:

■ Итеративная модификация схемы данных во время выполнения. Постоянные модификации схемы в процессе эксплуатации ее на практике — достаточно частая операция. При этом постепенный перевод множества работающих программ на новую схему с сохранением их работоспособности — процесс не мгновенный и не тривиальный.

■ Итеративная нормализация (следствие итеративной модификации схемы данных).

■ Логическая группировка отношений. Линейное перечисление всех отношений в рамках реляционной схемы одной БД, в случае большого количества отношений, затрудняет понимание пользователем структуры данных. На практике, как правило, отношения сгруппированы по классам связности и уровням доступа.

■ Поддержка OLAP.

■ Версионность. Схема данных реляционной базы данных подвержена постоянной корректировке и изменению. Внедрение механизма версионности, по принципу

его использования в системах контроля версий, на уровне схемы данных снимает эту задачу с разработчика.

Унифицированная поддержка решений перечисленных выше задач на уровне СУБД дает огромное преимущество разработчику и является актуальным.

Применение паттерна MVC к схемам данных

В предлагаемой модели авторами применяется концепция паттерна проектирования М^С (модель — представление — контроллер), главная идея которого сводится к разделению понятий хранения и представления некоторой сущности. Паттерн М^С современная архитектура все чаще использует в самых разных вариантах. Это коснулось не только программных интерфейсов, а также программных систем: систем контроля версий, почтовых клиентов, GUI-интерфейсов.

Применение паттерна М^ к рассматриваемой области сводится к следующему. Рассмотрим исходную схему данных «Схема 1» некоторой базы данных (рис. 1). Определим новую схему «Схема 2» из исходной специальным образом, а именно: исходная схема данных рассматривается как модель для построенной схемы, которая является представлением исходной. Контроллер отвечает за детали осуществления подобного построения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.