Научная статья на тему 'Синергетические оценки качества восприятия мультимедийных систем'

Синергетические оценки качества восприятия мультимедийных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
211
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Синергизм / мультимедиа / МОS / стандарт H. 264 / КОРРЕЛЯЦИЯ / Synergism / Multimedia / mos / the standard H. 264 / Correlation / MPEG

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шелухин Олег Иванович, Даньшина Елена Викторовна

Рассмотрена аудиовизуальная модель оценки качества потокового видео, учитывающая аудио- и ви- део- составляющие мультимедийных файлов; приведено понятие взаимной компенсации аудио- и видео- качества; представлены синергетические оценки качества восприятия мультимедийных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шелухин Олег Иванович, Даньшина Елена Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The authors consider audiovisual model of quality evaluation of streaming video, which takes into account audio and video components of multimedia files; the article gives the notion of mutual compensation of the audio and video quality; the authors present the synergetic evaluations of quality of perception of multimedia systems

Текст научной работы на тему «Синергетические оценки качества восприятия мультимедийных систем»

УДК 681.3.07.

СИНЕРГЕТИЧЕСКИЕ ОЦЕНКИ КАЧЕСТВА ВОСПРИЯТИЯ МУЛЬТИМЕДИЙНЫХ СИСТЕМ

Шелухин Олег Иванович, доктор технических наук, профессор, sheluhin@mail.ru,

Даньшина Елена Викторовна, магистрантка, danshina_l@mail.ru,

ФГОУВПО «Российский государственный университет туризма и сервиса», г. Москва

The authors consider audiovisual model of quality evaluation of streaming video, which takes into account audio and video components of multimedia files; the article gives the notion of mutual compensation of the audio and video quality; the authors present the synergetic evaluations of quality of perception of multimedia systems.

Рассмотрена аудиовизуальная модель оценки качества потокового видео, учитывающая аудио- и видео- составляющие мультимедийных файлов; приведено понятие взаимной компенсации аудио- и видеокачества; представлены синергетические оценки качества восприятия мультимедийных систем.

Key words: MPEG, synergism, multimedia, MOS, the standard H. 264, correlation

Ключевые слова: MPEG, синергизм, мультимедиа, МОS, стандарт H. 264, корреляция

Постановка задачи

Современные мультимедийные системы характеризуются не только взаимодействием режимов видео и аудио, но и присутствием явления синергизма между медийными составляющими.

Синергизм (от греч. synergos — (syn) вместе (ergos) действующий, действие) — это взаимодействие двух или более факторов, характеризующееся тем, что их действие существенно превосходит эффект каждого отдельного компонента в виде их простой суммы.

Например, в видеотелефонии даже при низком качестве видео потока хорошее качество голосового потока может компенсировать ухудшение полного воспринимаемого качества, и наоборот [2].

Для предсказания аудиовизуального качества мультимедийных систем необходимо создать показатель, принимающий во внима-

ние качество воспроизведения аудио- и видеокомпонентов.

При оценке качества мультимедийных систем с помощью комбинированной оценки нельзя представить ее в виде простой комбинации составляющих, поскольку она не дает адекватного реальным условиям качества восприятия [1].

Аудиовизуальные тесты. 3G потоковые клипы

Рассмотрим три видеопоследовательности, обладающие принципиально различными характеристиками: кино «трейлер», «видеоклип» и «видеотелефония (звонок)» (рис. 1).

В кино «трейлере» сцены изменяются очень быстро, а съемка производится c нескольких ракурсов, кроме того, присутствует музыка. «Видеоклип» характеризуется инструментальной музыкой, сопровождающей голос. В отдельных сценах клипа имеются быстрые движения. «Видеозвонок» — самый простой

(а) (Ь) (с)

Рис. 1. Тестируемые файлы: кино «трейлер» (a), «видеоклип» (b), «видеотелефония (звонок)».

89

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

сценарий. Съемка осуществляется зафиксированной в пространстве камерой, а в сценах присутствуют малозначительные движения. Аудиоматериал в этом случае — речевой монолог без музыки.

Все файлы мультимедиа длиной почти 8 сек. [3]. Файлы закодированы при помощи программы QuickTime Pro version 6.5 с несколькими кодеками и комбинациями скорости передачи информации. В качестве видеокодеков использовали кодеки H. 263 и MPEG-4, а в качестве аудиокодеков AMR (Adaptive Multi Rate — автоматическая запись сообщения) и AAC (Advanced Audio Coding — перспективное звуковое кодирование).

Взаимно компенсационное свойство

Проведенные исследования совместного аудиовизуального качества [5] показали, что наблюдается явление взаимной компенсации аудио- и видео- качества. Под взаимной компенсацией подразумевается возможность получить неименное аудиовизуальное качество при различных комбинациях качества аудио и видео, это можно использовать для обеспечения гарантированно хорошего аудиовизуального качества. Рассмотрим аудиовизуальную модель оценки качества, учитывающую аудио- и видео- составляющие мультимедийных файлов.

Как правило, качество каждого сюжета оценивается с использованием оценок субъективного восприятия по пятибалльной шкале МОS (Mean Opinion Score — средняя субъективная оценка), где 1 — очень плохо, 2 — плохо, 3 — удовлетворительно, 4 — хорошо, 5 — отлично.

Будем использовать для оценки мультимедийного качества следующие оценки:

MOSa — средняя субъективная оценка аудио последовательности;

MOSv — средняя субъективная оценка видео последовательности;

MOSav — субъективное аудиовизуальное качество (качество оценки мультимедиа).

Для учета синергетического эффекта составляющих на уровне качества восприятия сформируем аудиовизуальную модель качества восприятия мультимедиа в виде комбинации показателей качества восприятия аудио MOSa и видео MOSv соответственно. Очевидно, что увеличение MOSa и соответствующее уменьшение MOSv или наоборот, не приведет к изменению MOSav и может остаться неизменным.

Рассмотрим пример взаимной компенсации качества восприятия MOSav на основе оценкок аудио MOSa и видео MOSv составляющих, представленный на рис. 2 [4]. Сравнивая столбики гистограмм с «белыми» вершинами можно видеть, что качества восприятия на уровне MOSav = 3 можно добиться как при MOSa = 4.5 и MOSv = 2.5, так и при MOSa = 3 и MOSv = 3.

Рис. 2. Взаимно компенсационное свойство для «видео телефонии».

Зависимость качества восприятия от количества информации

Показатели MOSa, MOSv и MOSav позволяют прогнозировать видео-, аудио- и аудиовизуальное качество с помощью объективных параметров.

В стандарте ANSI [3], разработан визуальный показатель, который дает возможность предсказать MOSv. Аналогичным является такой показатель качества аудио, различающийся для речи и музыки, чтобы корреляция с результатами выполненных звуковых тестов была максимальна.

На основе использования оценок предсказания MOSv и MOSa разработано несколько аудиовизуальных показателей.

Для формирования аудиовизуального показателя качества анализируемых клипов предварительно нужно изучить результаты субъективных аудиовизуальных тестов [4]. Отметим, что субъективные оценки людей различны для кино «трейлера» или «видеоклипа» с одной стороны и «видеотелефонии» с другой. «Видеозвонок» характеризуется медленными и незначительными движениями, с фиксиро-

90 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Синергетические оценки качества восприятия мультимедийных систем

ванным положением видео камеры и однородным тоном голоса. Диапазон оценок в этом случае для видео звонка в 66,7% случаев оценивается величиной 2 < MOSav < 3.

Если кодировать «видеоклип», характеризующийся быстрыми и частыми изменениями сцен при неизменной скорости передачи информации, можно увидеть, что объективные параметры не показывают столь же высокое качество как в видеотелефонии. Однако субъективная оценка выше во втором случае. Люди оценивают качество файла видеоклипа выше, потому что их мнение основано на подробной информации о сюжете.

Это различие в субъективной оценке между видеоклипом, кино «трейлер» и видео телефонией приводит к необходимости создания для речи и музыки различных аналитических соотношений.

Построение аналитических оценок

Получили распространение следующие аналитические оценки аудиовизуального качества:

(1) MOSav = K + A■ MOSa + V ■

(2) MOS’l = K + AV ■ MOSa ■

(3) MO S™ = K + A ■ MO Sa + V ■ MO Sv + A ■ MO Sa ■

(4) MO SV = K + A ■ MO Sa + V ■ MOSv +

+AV ■ MO Sa ■ MO Sv + A '■ MOSl + MO S ^

Первая модель при заданных MOSv и MOSa позволяет оценить MOSav при хорошем качестве музыки и речи. Однако при высокой корреляции между объективной и субъективной оценками MOSav используются другие оценки.

С этой целью в уравнения (2), (3) и (4) введены дополнительные элементы, что приводит к увеличению корреляции и отражает синергизм между качеством видео и аудио [6]. Синергизм составляющих хорошо описывается параболической зависимостью в уравнении (4).

Значения коэффициентов, входящих в уравнения (1) ... (4), полученные экспериментально, приведены в табл. 1 и 2 [7]. На рисунках 3—10 показаны трехмерные зависимости MOSav от MOSv и MOSa (С. 92-95).

Самые высокие корреляции соответствуют моделями (3) и (4).

Таким образом, рассмотренные соотношения для оценки субъективного качества предсказания аудиовизуального качества клипов на основе анализа их объективных характеристик, позволяют сформировать синергетические оценки качества восприятия мультимедийных систем.

Коэффициенты и корреляция для модели «видеозвонка»

Таблица 1

Номер формулы K A V AV A’ V’ корреляция

1 -0,4934 0,5420 0,4327 / / / 0,8800

2 0,9987 / / 0,1536 / / 0,8915

3 0,6313 0,2144 0,0124 0,1184 / / 0,9023

4 0,5723 9,6508 0,2686 0,2244 -0,0171 -0,0940 0,9057

Таблица 2

Коэффициенты и корреляция для моделей кино «трейлера»/«видеоклипа»

Номер формулы K A V AV A’ V’ корреляция

1 -1,5025 0,7380 0,7411 / / / 0,8879

2 0,9135 / / 0,2329 / / 0,8415

3 -0,9222 0,5691 0,5064 0,1697 / / 0,9106

4 -1,1895 0,5947 0,7126 0,0677 -0,0031 -0,0395 0,9117

91

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

92

Рис. 3. Модель для «видеотелефонии» (формула 1)

Рис. 4. Модель для «видеотелефонии» (формула 2)

научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Синергетические оценки качества восприятия мультимедийных систем

MOSa

Рис. 5. Модель для «видеотелефонии» (формула 3)

MOSa

Рис. 6. Модель для «видеотелефонии» (формула 4)

93

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

Рис. 7. Модель для «кинотрейлер»/«видеоклип» (формула 1)

MOSa

Рис. 8. Модель для «кинотрейлер»/«видеоклип» (формула 2)

94 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Синергетические оценки качества восприятия мультимедийных систем

_____ MOSv

MOSa 1

Рис. 9. Модель для «кинотрейлер»/«видеоклип» (формула 3)

Рис. 10. Модель для «кинотрейлер»/«видеоклип» (формула 4)

Литература

1. American National Standard for Telecommunications. T1.801.03—2003. Working Group on Performance, Reliability, and Signal Processing. Digital Transport of One-Way Video Signals- Parameters for Objective Performance Assessment. Copyright 2004 by Alliance for Telecommunication Industy Solutions.

95

________________________ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ________________________________________

2. ISO/IEC 14496—3:2001/Amd. 2:2004, Parametric Coding for High Quality Audio, 2001.

3. ITU-T Recommendation. P. 910—1999, Subjective video quality assessment methods for multimedia application. International Telecommunication Union.

4. O. Nemethova, M. Ries, E. Siffel, M. Rupp. Quality Assessment for H. 264 Coded Low-Rate and low-Resolution Video Sequences. Proc. of Conference on Internet and Information Technologies (CIIT), St. Thomas, US Virgin Islands, Nov. 2004. P. 136-140.

5. R. Puglia. Influence of audio and video quality on subjective audiovisual quality H. 263 and adaptive multi rate (AMR) coding. P. 58-61.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. S. Winkler. Digital Video Quality. Vision Models and Metrics. Genista Corporation, Montreux, Switzerland, Jan. 2005. P. 38-39.

7. Winkler. Digital Video Quality. Vision Models and Metrics. Genista Corporation, Montreux, Switzerland, Jan. 2005. P. 38-39.

96 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.