УДК 681.3.07
Сравнительный анализ метрик оценки качества восприятия потоковой видеоинформации
Олег Иванович Шелухин, д.т.н., проф., e-mail: [email protected]
Михаил Владимирович Марков, магистрант, e-mail: [email protected]
ФГОУ ВПО «Российский государственный университет туризма и сервиса», Москва
Представлены метрики оценки качества передаваемой видеоинформации; приведены описания алгоритмов вычисления объективных и субъективных оценок видеоизображений, в том числе RMSE, PSNR, PQR, VQM; рассмотрены основные проблемы, которые возникают в процессе оценки качества и связаны с рассинхронизацией изображений и другими негативными эффектами, проявляющимися при передаче видеоинформации по беспроводным каналам связи; осуществлен краткий сравнительный анализ рассмотренных метрик.
The authors introduce metrics to evaluate the quality of transmitted video information and describe the algorithms to calculate the objective and subjective assessments for video, including RMSE, PSNR, PQR, and VQM. The study examines the problems in the process of quality assessment associated with image desync and other negative effects, manifested in the video transfer over wireless communication channels. The authors conduct a brief comparative analysis of the metrics.
Ключевые слова: качество видеоинформации, SSCQE, DSIS, DSCQS, RMSE, PSNR, PQR, VQM, MPQM.
Keywords: video quality, SSCQE, DSIS, DSCQS, RMSE, PSNR, PQR, VQM, MPQM.
Постановка задачи
Цифровая видеоинформация, передаваемая через телекоммуникационные сети, подвергается искажениям, возникающим в процессе оцифровки, сжатия, передачи, декодирования и воспроизведения видеосигналов. Так, например, при сжатии видеосигналов происходит снижение качества передаваемой видеоинформации, связанное с уменьшением количества информации о структуре изображения. Параметры, которые остаются неизменными, используются для субъективного и объективного измерения качества.
Субъективные измерения самым широким образом использовались и используются не только при разработке новых систем, но и в практике телевизионного вещания. Это обстоятельство обусловлено тем, что субъективное суждение дает прямую интегральную оценку качественных показателей изображения (строгую формальную при использовании стандартных методик и быструю визуальную при обычном наблюдении телевизионного изображения). Визуальная оценка качества изображения широко использовалась в аналоговом телевидении и, несомненно, будет не менее широко применяться в цифровом вещании.
Вместе с тем эксперименты по субъективной оценке качества весьма трудоемки и связаны с большими затратами времени, а их результаты отличаются большим разбросом, поскольку подвержены влиянию большого числа трудно контролируемых факторов. Субъективные измерения не
могут использоваться для целей мониторинга. Это приводит к необходимости разработки методов объективных измерений, пригодных для оценки качества изображения, создаваемого цифровыми телевизионными системами с компрессией. Потребность в объективных измерениях особенно велика при измерениях во время передачи телевизионных программ.
Поэтому целью многочисленных исследований стала разработка новых прямых объективных методов и метрик измерения качества изображения, при которых оцениваются искажения изображений в реальных программных материалах (или искажения тестовых изображений, типичных для программных материалов).
Рассмотрим наиболее распространенные метрики оценки качества видео.
Субъективные метрики
Современные методы субъективных измерений обладают рядом несомненных достоинств, позволяя получать оценку качества как статических, так и динамических изображений. Они пригодны для получения сравнительной оценки качественных показателей изображения, создаваемого разными цифровыми и аналоговыми системами. Результат этого метода представляет собой скалярную величину в виде усредненной зрительской оценки, дающей интегральную характеристику эффективности в отношении способности систем создавать изображения высокого технического качества.
Дополнительным фактором, усиливающим роль субъективной оценки качества, является то, что только с использованием субъективных измерений можно получить исходные данные для создания моделей зрения и разработки методов объективной оценки качества, результаты которых хорошо соответствуют визуальному восприятию. Этот фактор способствует активизации исследований в области субъективных измерений качества телевизионного изображения.
В стандарте ITU-R BT.500-8-11 описаны субъективные метрики, использующие особенности человеческого зрения: SSCQE (Single-Stimulus Continuous Quality Evaluation - непрерывная оценка качества в ходе единственного просмотра), DSIS (Double Stimulus Impairment Scale - попарная оценка ухудшения качества видео), DSCQS (Double Stimulus Continuous Quality Scale - непрерывная оценка качества по результатам двух просмотров).
Методика SSCQE. Наблюдателю демонстрируется несколько видеороликов. Количество искажений в этих роликах может быть различным. Оценки выставляются в пределах от 0 (за худшее качество) до 1 (за лучшее качество). Оценка выставляется только один раз и в дальнейшем не может быть изменена.
Методика DSIS. Наблюдателю предлагается сравнить две видеопоследовательности - искаженную и оригинальную. Длительность теста -8 с. Наблюдатель оценивает визуальные искажения по пятибалльной шкале. Максимальный балл 5 соответствует незаметным искажениям, средний балл 3 - искажения мешают смотреть, минимальный балл 1 - изображение просматривать невозможно.
Методика DSCQS. Этот метод, основанный на двух предыдущих, получил широкое распространение и позволяет оценивать потоковое видео с высокой степенью точности. Качество изображений оценивается так же, как и в методике DSIS. Отличительной особенностью является то, что видеоролик воспроизводится в псевдослучайном порядке, а затем повторяется. По окончании просмотра наблюдателю дается некоторое время для выставления оценки. Методика оценивания также пятибалльная: 5 - превосходное качество, 4 - хорошее качество, 3 - удовлетворительное качество, 2 - плохое и 1 - очень плохое качество. Наблюдатель записывает выставленную оценку в специальный бланк или заносит данные в специализированную программу. Затем все оценки усредня-
ются и преобразуются в стандартную шкалу (от 0 до 100). Таким образом, всегда можно оценить различия между оригинальным и искаженным видеорядом. По окончании сбора информации от всех экспертов данные обрабатываются с использованием статистических алгоритмов.
Объективные метрики
Для автоматизации процессов оценки качества потокового видео разработаны объективные метрики, позволяющие оценивать качество видеоинформации в двух режимах. В первом режиме для анализа доступна вся видеопоследовательность, во втором - оценка формируется отдельно для каждого кадра.
Существуют следующие объективные метрики: RMSE (Root Mean Square Error) - среднеквадратическая ошибка, определяемая как расстояние между двумя пикселями. Для вычисления этого параметра необходимо усреднить значение разности между отсчетами оригинальной и искаженной последовательностей:
M-1N-1
^RSM
1 UU[f'(mn)-f(m,n (1)
\M * N
m=0 n=0
где f - оригинальный кадр; f ' - искаженный кадр; N и М - параметры, отвечающие за формат кадра. SNR (Signal-to-Noise Ratio) - отношение между уровнем сигнала и уровнем шума, вычисленное для данного изображения и определяемое по формуле
M-1N-1
LU f '(m, n)]2
SNR =
m=0 n=0
M-1N-1
(2)
LU f' (m, n) - f (m, n)]
m=0 n=0
PSNR (Peak Signal-to-Noise Ratio) - пиковое (логарифмическое) отношение сигнал/шум, которое используется для определения качества работы алгоритмов кодирования и зависит от величины различий между оригинальным и искаженным изображением. Вычисляется отношение PSNR с помощью уравнения
( 255
PSNR = 20log,n I---------
101RSME
(3)
Основным недостатком описанных метрик является то, что они очень плохо коррелируют с субъективной оценкой и сильно зависят от пространственной и временной избыточности изображений. Поэтому были разработаны более эффективные метрики оценки качества.
PQR (Picture Quality Ratio) - рейтинг качества изображения. Эта метрика учитывает ряд особенностей человеческого зрения.
На вход поступает две видеопоследовательности, каждая из которых имеет произвольную продолжительность. Каждый кадр разбивается на три области отсчетов (отсчеты яркости Y, отсчеты цветоразностного-синего (Сь') и цветоразностного-красного (Сг') ). На основании этих данных формируются такие цветовые компоненты, как красный R, зеленый G и синий B. Блок обработки фронта изображения используется для формирования из компонент RGB сигнала яркости и получения бихроматического изображения (u , v ), которое используется в нижележащих блоках. Блок обработки отсчетов яркости осуществляет выборку параметра Y для двух типов изображения (оригинальной видеопоследовательности и искаженного видеоряда). Затем создается карта отсчетов PQR. Эта карта представляет собой изображение, состоящее из полутонов, уровень которых пропорционален разности пикселей анализируемых кадров. Данная схема также содержит блок обработки цветностных компонент, который на своем выходе формирует карту интенсивностей цвета.
Процесс обработки хроматических данных и информации об интенсивности цвета позволяет определить различия в структуре оригинального и искаженного кадра. При этом данные об отсчетах яркости и отсчетах интенсивности цвета выбираются из небольших областей передаваемого изображения и наносятся на соответствующую карту. Анализ таких карт позволяет более детально определить искажения принятого изображения. Метод PQR требует обязательной синхронизации анализируемой и оригинальной видеопоследовательностей. После формирования карт PQR осуществляется сравнение вычисленных параметров с субъективной оценкой пользователей.
VQM (Video Quality Metric) - это метрика, использующая дискретное косинусное преобразование для точного соответствия человеческому восприятию. Принцип действия заключается в следующем. Оригинальная и искаженная видеопоследовательности проходят через один и тот же набор функциональных блоков, которые осуществляют выборку данных, их корректировку, вычисление различных показателей качества и, наконец, вычисление параметра VQM. Сам параметр оценивает искажения, вызванные прохождением видеосигналов через различные цифровые блоки системы передачи. К таким искажениям относятся погрешности кодиро-
вания, ошибки, возникающие в дискретном канале связи, и ошибки декодирования сигналов. Для оценки таких искажений, как «подтормаживание» кадров, размытие и блокинг-эффект, используется вероятностная модель. Вероятность появления искажений, равная 1, говорит о том, что изображение обладает очень низким качеством. Вероятность 0,5 соответствует серьезным искажениям, но, тем не менее, можно рассмотреть детали изображения. Вероятность, равная 0, говорит о том, что искажения не заметны большинству экспертов.
Процедура вычисления метрик качества состоит из нескольких шагов. Сначала происходит устранение пространственной избыточности и оценка искажений. Затем определяется область изображения для более детального анализа. Эта область обычно не содержит информацию о горизонтальном или вертикальном смещении объекта в кадре. Далее осуществляется оценка и корректировка уровня контрастности и яркости. Это необходимо в том случае, если амплитуды некоторых сигналов превышают уровень импульсов гашения. Отличительной особенностью данного алгоритма является то, что он может автоматически корректировать уровень яркости, насыщенности цвета и импульсов гашения. После этого выполняется коррекция временных искажений. Алгоритм автоматически определяет минимальное время задержки, требуемое для обработки видеоинформации, и согласует это время с длительностью исходного видеоряда. На следующем шаге осуществляется вычисление показателей качества для выбранной пространственной подобласти. Полученные в результате вычислений параметры являются функциями пространства и времени. Они сравниваются с параметрами, вычисленными для кадра из оригинальной видеопоследовательности. В конечном счете будут получены группы параметров, которые характеризуют искажения, возникшие в определенном месте и в определенное время. После этого вся видеоинформация проходит перцептивный фильтр, позволяющий наиболее точно оценить качество изображений (особенно это касается границ кадров). В дальнейшем для перехода к соседним областям выполняется математическая операция сдвига. Таким образом, каждая анализируемая область представляется в виде пространственно-временной зависимости, для которой вычисляется свой набор параметров, на основании которых и формируются качественные метрики.
Метрика У ОМ позволяет определить качество принятой картинки, однако не решает пробле-
мы синхронизации между оригинальной и искаженной видеопоследовательностями. Обычно принятый видеоролик имеет более низкое качество, чем оригинальный, но не имеет потерянных кадров. Обе видеопоследовательности имеют одинаковую длину и полностью синхронизированы. Следовательно, программа реализующая У ОМ, может верно вычислить параметры качества.
На рис. 1 серым цветом показаны искаженные кадры. В процессе работы программа должна выдать оценку соответствующих параметров и процентное ухудшение качества информации. Проблема возникает в том случае, если синхронизация отсутствует. Тогда в принятой последовательности могут отсутствовать некоторые кадры -они потеряны. Особенно сильно это сказывается на качестве принятой информации в том случае, если потерян один из опорных 1-кадров.
В таком случае кадры, расположенные левее потерянного (рис. 2), не могут быть корректно декодированы. Кроме того, принятый видеоряд состоит из меньшего количества кадров. Это приводит к тому, что текущий принятый кадр сравнивается с совершенно другим (соседним) кадром оригинальной последовательности. Следовательно, вычисленные метрики не будут корректными. Алгоритм УОМ автоматически сравнивает две видеопоследовательности, находит в оригинальном видеоряде кадр, аналогичный потерянному, копирует его и добавляет к концу искаженной видеопоследовательности (рис. 3). В результате длина принятого видеоряда остается равной длине оригинального ролика. Это позволяет сравнить две последовательности. Однако данное
решение характеризуется достаточно низкой точностью, так как одни и те же кадры оригинальной и искаженной последовательности все равно остаются сдвинутыми друг относительно друга. Таким образом, в результате сравнения двух кадров будут получены метрики, достоверность которых можно поставить под сомнение.
Во время анализа также возможно возникновение таких искажений, как «подтормаживание» картинки. Эта проблема связана с неправильной работой кодека. В моменты ввода данных в сеть нагрузка на протокол RTP может оказаться избыточной, что приведет к появлению задержки в передаче. Приемник же, не имея достаточного числа бит для восстановления кадра, снова повторяет предыдущий кадр и тем самым гарантирует непрерывность воспроизведения.
MPQM (Moving Picture Quality Metric) - оценка качества движущихся изображений. Эта метрика также использует особенности восприятия видеоинформации зрительной системой человека. Схема вычисления параметров качества показана на рис. 4.
Процесс формирования метрики качества состоит из нескольких шагов. На первом шаге анализируется вся видеопоследовательность. Она пропускается через набор специальных фильтров, которые измеряют количество искажений. В результате формируется несколько каналов. Для каждого канала вычисляется контрастная чувствительность и маска, необходимая для коррекции искажений. Наложение маски происходит только в том случае, если ошибка превышает заранее заданное пороговое значение, что позволяет устранить наиболее заметные искаже-
Рис. 1. Корректирование искажений в программе VQM
Рис. 2. Неправильная оценка параметров качества в случае потери пакета
Рис. 3. Добавление кадров к принятому видеоряду для обеспечения одинаковой длины видеороликов
Рис. 4. Алгоритм вычисления MPQM
ния. Вычисление метрики МРрМ происходит на основе параметров, полученных на выходе фильтров. МРрМ вычисляется для каждого блока данных с использованием выражения
Е = ~1 тлттт И2 ех-у-^] 1 ■ (4)
У с=1 ^ 1 =1 Х=1 у=1 ^ )
где N - число каналов (наборов фильтров), необходимых для обработки данных; ^, N - расстояния по горизонтали и вертикали; N - время передачи блока данных; е[х,у, t, с] - сигнал ошибки, обладающей координатами (х,у), произошедшей в момент времени t в текущем блоке данных, обрабатываемых в канале С; Р - параметр Минковско-го, обычно равный 4.
Масштаб изображения принято измерять в децибелах. Дополнительной метрикой, используемой при оценке качества видеоинформации, является маскированное пиковое отношение сигнал/шум (МРБКЯ):
MPSNR = 10log
2552
10
(5)
Таким образом, сравнительный анализ различных методов оценки качества восприятия потокового ви-
део при передаче через беспроводные сети показал, что субъективные методы оценки позволяют оценить лишь визуальное качество изображений и не могут быть реализованы программно, что не позволяет автоматизировать процессы вычисления метрик качества видеосигналов. Объективные метрики даже при ограниченном наборе данных позволяют однозначно определить количество искажений принятых кадров. Самыми простыми методиками определения качества являются вычисление отношений PSNR, SNR и RMSE, однако они имеют низкую точность. Метрики PQR, VQM, MPQM более адекватны субъективному восприятию при реальном тестировании.
ЛИТЕРАТУРА
1. Шелухин О. И., Иванов Ю. А. Методика оценки качества декодирования видео стандарта H.264/AVC/SVC в беспроводных сетях // Электротехнические и информационные комплексы и системы. 2009. Т. 5. № 4. С. 35 - 47.
2. Pulido, J. A., Video quality evaluation in IP videoconference between fixed and mobile devices. С.: Universitat Politecnica de Catalunya, 2008.
3. Tektronix. A guide to maintaining video quality of service for digital television programs: электронная версия.
4. URL:
http://www.tek.com/Measurement/App_Notes/Technical_Briefs/ digital QoS/25W 14000 1.pdf (дата обращения 21.03.10).
5. URL: http://graphics.cs.msu.ru/index.html.en (дата обращения 21.03.10).
Поступила 15.04.2010 г.
МАШИНЫ, АГРЕГАТЫ И ПРОЦЕССЫ
УДК 629.436.068
Техническая эффективность нанесения покрытий фрикционным методом на цилиндры без разборки двигателя
Владимир Николаевич Быстров, к.т.н., e-mail: [email protected] Евгений Игоревич Деркач, аспирант, e-mail: [email protected] ФГОУ ВПО «Российский государственный университет туризма и сервиса», Москва
Представлена технология нанесения покрытия на цилиндры фрикционным методом без разборки бензиновых двигателей с длительным сроком эксплуатации; осуществлена оценка технической эффективности применения этой технологии по результатам моторных динамометрических и дорожных испытаний карбюраторного четырехтактного двухцилиндрового двигателя автомобиля до и после применения технологии; доказано, что технология безразборного восстановления двигателя позволяет сократить вредные выбросы при одновременном повышении мощностных характеристик, компрессии в цилиндрах и сокращении расхода топлива.
The authors introduce a technology for coating cylinders based on the friction method without disassembling the gasoline engines of long service life. The study estimates the technical efficiency of the technology using the motor, dynamometer and road tests. The article discusses the motor tests' results for the gasoline four-cycle two-cylinder car engine before and after the coating by means of the engine restoration technology without disassembling. The technology reduces emissions, improves the power characteristics, optimizes the compression in the cylinders, and reduces the fuel consumption.
Ключевые слова: моторные испытания, выбросы загрязняющих веществ, мощность двигателя, компрессия, расход топлива.
Keywords: motor test, emission, power, compression, fuel consumption.
Для повышения основных технических и экологических характеристик бензиновых двигателей с длительным сроком эксплуатации была разработана технология нанесения покрытия на цилиндры фрикционным методом без разборки двигателей. Применение этой технологии при ремонте легковых автомобилей уменьшает загрязнения окружающей среды выхлопными газами. При этом существенно снижаются трудовые и финансовые затраты предприятий автомобильного сервиса, а также экономятся средства автовладельца, наряду с быстрым и качественным восстановлением двигателя.
Для оценки результатов применения данной технологии были проведены моторные испытания, которые показали существенное улучшение технических и экологических характеристик двигателя.
Объектом моторных испытаний является четырехтактный двухцилиндровый двигатель марки ВАЗ. Испытания проводились на моторном стенде фирмы
Бспепск с гидравлическим тормозом (рис. 1), оснащенным весоизмерительным устройством типа С1-2001А (рис. 2), и четырехкомпонентным газоанали-
Рис.1. Общий вид моторного стенда фирмы БсИепск с двигателем автомобиля ВАЗ