УДК 621.391
В.В. БАРАННИК, С.С. ШУЛЬГИН
МОДЕЛЬ ОЦЕНКИ ИНФОРМАТИВНОСТИ СЛОТА Р-КАДРОВ НА ОСНОВЕ ВЫЯВЛЕНИЯ СТРУКТУРНО-ГРАДИЕНТНЫХ МЕЖТРАНСФОРМАНТНЫХ ОГРАНИЧЕНИЙ
Разрабатывается модель оценки битовой интенсивности слотов Р-кадров на основе эффективного синтаксического представления информативных дифференциально-описанных спектрограмм с учетом обобщенной характеристики градиентного пространства локально-структурных (градиентных) ограничений. Показывается, что такой тип структурных закономерностей обусловлен целым рядом причин, а именно: наличие коррелированости между видеокадрами; незначительные изменения освещенности объектов видеосцен; зависимости между компонентами ДКП соседних трансформант; предварительное снижение динамического диапазона элементов спектрограмм в результате их дифференциального описания. Обосновываются потенциальные характеристики создаваемого подхода относительно дополнительного снижения битовой интенсивности динамического информационного ресурса.
1. Введение
Постановка проблемы и анализ литературы. Снижение безопасности информации и качества предоставления видеоинформационных услуг с использованием инфокоммуника-ций в значительной степени вызвано превышением битовой интенсивности видеопотока относительно пропускной способности сети [1]. Такое противоречие особенно обостряется в условиях селективной обработки видеопотока на основе закрытия базового кадра.
Использование технологий обработки видеопотока обеспечивает уменьшение его битовой интенсивности. Здесь применяются такие технологии как MPEG [2 - 4]. В то же время такое синтаксическое представление потока кадров связано с внесением потерь целостности информации и дополнительными временными задержками на обработку. Интегрирование в информационные системы базовых технологий обработки динамических видеоресурсов (ДВИР) неоднозначно влияет на эффективность их функционирования. Особенно это проявляется в случае необходимости беспроводного доступа к ДВИР, источник формирования которых находится на значительных расстояниях. Значит, актуальным требованием, определяющим научно-прикладную задачу, является создание систем эффективного синтаксического представления динамических видеоинформационных ресурсов в режимах сохранения необходимого уровня безопасности информации и сокращения сложности реализации кодеков. Для решения такой задачи необходимо построение технологий обработки ДВИР с использованием методов, устраняющих межкадровую избыточность с учетом форм представления информации на внутрикадровом уровне [5]. Для MPEG-технологий обработка потока кадров проводится по группам с применением процесса формирования Р-кадров, т.е. образования слотов Р-кадров [4]. Поэтому цель исследования заключается в создании математической модели для оценки информативности слота Р-кадров на основе выявления межкадровых закономерностей.
2. Обоснование подхода для эффективного синтаксического представления
слота Р-кадров
Для повышения эффективности формирования и обработки кадров Р-типа предлагается предварительно осуществлять трансформирование видеокадра из пространственно-временного в пространственно-спектральное описание. После получения трансформант двумерного преобразования проводится построение дифференциального представления на основе формирования величин разностей между соответствующими компонентами по позициям в кадрах.
В результате этого группа YT трансформированных кадров заменяется на совокупность, состоящую из одного базового трансформированного кадра Y(1) и последовательности ET-i дифференциально представленных трансформированных кадров Е(т), т = 2, Т, т.е. YT ^ {Y(1); ET-1} . В данной формуле составляющая ET-1 представляет собой последовательность длиной (T -1) кадр и записывается как ET-1 = {E(2),...,E(T)} . Здесь каждый дифференциально описанный трансформированный (ДО^) кадр Е(т) образуется по
совокупности двумерных массивов Е(т)х,у размером w х w элементов. При этом срез по т составляющей в последовательности ДОT кадров образует слот ДОT кадров, состоящий из последовательности двумерных массивов Е(т)х,у для т = 2, T. Слот E(T - 1)X2Y ДОT кадров представляется следующим выражением:
E(T - 1)X2Y = {E(2)x,Y ,...,E(t)x,y ,...,E(T)x,y}, где E(T - 1)(2> - последовательность (слот) двумерных массивов с координатами (х; у) в ДОT кадрах длиной (T -1).
Слот E(T -1)(2> фактически представляет собой сквозную квадратную трубу, вырезанную вдоль последовательности ДОT кадров на позиции (х; у), в каждом сечении которого
находится двумерный массив Е(т)ху дифференциального описания трансформированного кадра.
Далее предлагается обработку Р-кадров проводить в межтрансформантном направлении по временной оси по слотам. Для этого нужно выявить структурные свойства слотов Р-кадров с учетом структурных особенностей дифференциально-описанных трансформант. При этом для повышения чувствительности выявления закономерностей относительно динамического изменения содержания слотов предлагается ввести такую структурную
единицу как дифференциально описанная спектрограмма е(М) .
Дифференциально описанная спектрограмма (ДОС) E(k,i) представляет собой срез вдоль слота по координате (k; i) в каждой трансформанте, т.е.
Б(М) = {e(2)(k,i),...,e(T)(k,i),...,e(T)(k,i)}.
Структурной характеристикой ДОС является динамический диапазон dek,i) ее элементов. Поскольку в общем случае межтрансформантные разности e(T)(k,i) принимают как положительные, так и отрицательные значения, величина dek,i) без учета знака находится
по формуле dek,i) = max {|e(T)(k,i) |}, где dek,i) - динамический диапазон элементов 2 - т - T
(k; i) -й дифференциально описанной спектрограммы без учета знака величин e^)^^; | e^)^^ | - абсолютное значение межтрансформантной разности между (т -1) -й и т -й трансформантами.
Для ДОС характерны следующие закономерности (свойства). Первое свойство. Динамический диапазон для элементов ДОС в низкочастотной области трансформант больше, чем динамический диапазон для высокочастотной области. Второе свойство состоит в том, что значения динамических диапазонов элементов ДОС внутри слота Р-кадров распределены неравномерно. Третье свойство. Количество ДОС с высоким динамическим диапазоном меньше, чем количество ДОС с меньшим динамическим диапазоном. Четвертое свойство. Для кадров с наличием высокой когерентности динамические диапазоны элементов ДОС в области низкочастотных компонент также имеют ограниченные значения.
3. Разработка модели оценки информативности слота Р-кадров на основе выявления межкадровых закономерностей
Для выполнения требований относительно повышения безопасности динамических ВИР на основе повышения эффективности синтаксического представления слотов Р-кадров с учетом структурных и статистических свойств ДОС предлагается выбирать в качестве базового подхода - структурно-комбинаторный принцип описания.
Данный подход базируется на синтезе функционала F(E(k,^)apr, задающего синтаксическое представление (аппроксимацию) дифференциально описанной спектрограммы E(k,^).
При построении функционала F(E(k,^)apr необходимо учитывать, что элементы e(x)(k,^) ДОС принимают как положительные, так и отрицательные значения, т.е.
«мм -К""' ^ eW<t" г
[-eM^», ^ «(т)<k•'> < °. Отсюда значения элементов «(x)(k,^) в общем случае будут изменяться в диапазоне e(V) < «(x)(k,^) < e^f'?. Здесь приняты такие обозначения: «(k,^) - минимальное значение
min v ' max А min
элемента в ДОС, вычисляемое как: «тъР = min {e(x)(k,^)}; «(k,^) - максимальное значе-
2 < т < T max
ние элемента в ДОС, которое определяется по формуле «maX) = max {e(x)(k,^)}.
2 <т< T
-(М)
Соответственно, динамический диапазон d« с учетом разброса в области положительных и отрицательных значений будет равен d«k^ = | «mkiiT) _ «maX) I +1.
Максимальная битовая интенсивность V(T - 1)«k,^) синтаксического представления ДОС на основе структурно-комбинаторного подхода для заданного значения динамического
диапазона d« , ) оценивается по формуле
V(T - 1)«М) = ((T - 1)[bg2 d«M)]+1). Анализ полученного выражения позволяет заключить, что поскольку динамический диапазон ДОС не превышает значения динамических диапазонов для спектрограммы и для последовательности элементов исходных кадров группы, то в результате предложенного подхода создаются условия для повышения эффективности синтаксического представления динамического ВИР.
Однако необходимо выделить недостатки такого подхода относительно формирования синтаксического представления ДОС, которые связаны с тем, что:
- длина (T -1) дифференциально описанной спектрограммы выбирается заранее и является фиксированной на локальном промежутке видеопотока;
- динамический диапазон элементов ДОС определяется по факту обработки фиксированного количества межтрансформантных разностей.
Это может привести к потере адаптивности относительно изменения структурных и статистических характеристик кадров группы. В результате увеличивается битовая интенсивность потока Р-кадров.
Для устранения недостатков предлагается разрабатывать направление, базирующееся на дополнительном выявлении закономерностей, основанных на учете локально-структурных свойств для дифференциально описанных спектрограмм в направлении временной оси. Данный вариант базируется на дополнительном выявлении закономерностей, основанных на учете локально-структурных свойств ДОС для последовательности смежных видеокад-
ров. Tакое свойство заключается в наличии закономерности относительно ограниченного значения градиента между значениями соседних элементов ДОС.
Величина градиента g^/1^^ между информативными элементами ДОС задается следующей формулой:
g^f ,i) = | e(x +1)f - e(т)(Jk^i) | с, где e^ikf^, e(т + 1)(,kfi) - информативные элементы (k; i) -й интерполированной ДОС
соответственно расположенных в ней на т -й и (т +1) -й позициях; g(т)(k,i) - отклонение
(градиент) между значениями (k; i) -й ДОС для т -й и (т +1) -й трансформант.
По результатам такой обработки для всех информативных элементов интерполируемой
(k; i) -й ДОС, т.е. т = 1, ninf формируется вектор градиента G(k ,i). Это задается следующим соотношением: G(k,i) = {g(1)(k,i),...,g(т)(k,i),...,g(ninf - 1)(k,i)}, где ninf - количество
информативных элементов в ИДОС.
Недостатком здесь является то, что мерность градиентного пространства совпадает с
мерностью информативной ДОС. Значит, требуется сократить мерность вектора G(k,i). В этом направлении предлагается для вектора G(k,i) градиента информативной ДОС формировать такую характеристику как величина g(max)(k,i) динамического диапазона его компонент. Величина g(max)(k,i) находится по формуле 0 - g(т)(k,i) - g(max)(k,i).
Здесь g(max)(M) определяется как g(max)(k,i) = max ^(т)(М)}. 5V ^ 1-т-ninf
Данная формула учитывает в процессе определения обобщенного градиентного ограничения только информативные элементы. Это позволяет сузить величину разброса между компонентами ДОС, т.е. уменьшить значение градиентного ограничения. В связи с этим, в дальнейшем предлагается использовать сокращенное описание градиентного пространства. ^гда для информативных элементов ДОС будут выполняться ограничения, заданные следующей системой соотношений:
eCOf -g(max)(k,i) -e^ + 1)f -e^f + g(max)(k,i), т=1^. (1)
Величина обобщенного градиентного ограничения g(max)(k,i) вычисляется для каждой
информативной дифференциально описанной спектрограммы. Это обеспечивает адаптивную подстройку характеристики градиентного пространства под особенности локально-структурных закономерностей межтрансформантных последовательностей (слотов) на каждой частотной составляющей.
Для определения битовой интенсивности созданного синтаксического представления ДОС с учетом ее интерполирования и выявления градиентных ограничений необходимо оценить соответствующую информативность. В соответствии со структурно-комбинаторным подходом для определения степени информативности базовым понятием является количество Q(n^f; g(max)(k,i))е различных информативных ДОС, длиной n^f, которое можно составить в случае наложения ограничений на динамические диапазоны d(т)ink,i) изменения значений их элементов e(т)1(]kí?i) в условиях выявления локально-структурных закономерностей.
Для определения величин d(т)inlk,i) элементов e(т)(nfi) информативной дифференциаль
но описанной спектрограммы еЩ,^ используется выражение (1). Анализ данного выражения позволяет заключить следующее:
1. Динамический диапазон первого элемента е^)^ 1), 1 = 1, оценивается из условия независимости от значений последующих элементов информативной ДОС. Тогда его динамический диапазон ¿(^П^'* будет равен общему динамическому диапазону ¿е ' ) последовательности Е^, т.е.
т(М)
¿(^^ = ¿Г^ = |е^ - е^^ . (2)
2. Величина ¿(т)^^ динамического диапазона остальных элементов ДОС, т = 2, п^ , в соответствии с формулой (2) будет формироваться с учетом градиента относительно предыдущего значения. Поэтому величина ¿(т)^^ будет оцениваться как
¿(т)^ = 2 g(max)(k^ +1, т = 2"Пм . (3)
В таком случае динамический диапазон элементов информативной ДОС на позициях 2 < т < П;п£ полностью определяется значением g(max)(k,^ ) обобщенной характеристики градиентного пространства.
Значит, на максимальные абсолютные значения (спецификации) элементов е(т)(П^)
последовательности Е^ ^ в градиентном пространстве 0(кналожены ограничения, записываемые следующей системой неравенств:
^(к,^) 1 | е(т)(М) | = I ¿е , ^ т = 1;
1 е(т)^ 1 = 1 Л (4)
[2 g(max)(к ) +1, ^ 2 < т < пм . W
Отсюда сформулируем следующие определения.
Определение 1 (комбинаторная трактовка). Комбинации еЩ,^, составленные из элементов е(т)1(П^), удовлетворяющие спецификациям в соответствии с системой соотношений (4), будем называть перестановками с повторениями, на динамические диапазоны элементов которых наложены двухтиповые ограничения.
Определение 2 (структурная трактовка). Последовательности ЕЩ^ 1), элементы которых имеют ограничения на динамический диапазон в соответствии с выражениями (2) и (3), будем называть дифференциально описанными спектрограммами с двухкомпонентными локально-структурными ограничениями (двухкомпонентными градиентными ограничениями).
С учетом этого величина Q(ninf; g(max)(k,^))е, определяемая как количество различных дифференциально-описанных спектрограмм с двухкомпонентными градиентными ограничениями { ¿ек,^); g(maX)(k,^) } , будет оцениваться с помощью такого выражения:
Q(nmf;g(max)(k,^)е = П ¿(т)^ = ¿еМ) • (g(max)(k,^)ninf-1.
т=1
Отсюда количество двоичных разрядов У(п^; g(max)(k,^))е на синтаксическое представление информативной ДОС в двухкомпонентном градиентном пространстве ограничений определяется по формуле
У(Пш; g(max)(k,^)е = [^ ¿еМ)] + (ninf-1) [^(g(max)(M))] + 2 .
Полученное выражение позволяет оценить максимальную битовую интенсивность V(ninf; g(max)(k,^))6 синтаксического представления информативной ДОС на основе структурно-комбинаторного подхода с учетом ее интерполирования и выявления двухкомпонен-
тных градиентных ограничений { dlk'^; g(max)(k'^ } .
4. Выводы
1. Разработана модель оценки битовой интенсивности слотов Р-кадров на основе эффективного синтаксического представлении информативных ДОС с учетом обобщенной характеристики градиентного пространства локально-структурных (градиентных) ограничений. Такой тип структурных закономерностей обусловлен целым рядом причин, а именно: наличие коррелированости между видеокадрами; незначительные изменения освещенности объектов видеосцен; зависимости между компонентами ДКП соседних трансформант, характерные в области как низких, так и высоких частотных составляющих; предварительное снижение динамического диапазона элементов спектрограмм в результате их дифференциального описания.
Научная новизна. Впервые создана модель оценки информативности эффективного синтаксического представления слотов Р-кадров на основе обработки дифференциально описанных спектрограмм. Отличия заключаются в том, что сокращается межтрансфор-мантная (временная) избыточность, обусловленная наличием таких закономерностей: межкадровая (временная) психовизуальная избыточность на уровне обработки дифференциально описанных спектрограмм, что обусловлено особенностями ограниченной чувствительности зрительной системы относительно коррекции отдельных частотных составляющих; межкадровая (временная) структурная избыточность, обусловленная наличием локально-структурных ограничений между соседними информативными элементами дифференциально описанной спектрограммы. Это обеспечивает оценку минимального уровня снижения битовой интенсивности видеопотока при сохранении требуемой целостности информационного ресурса.
Список литературы: 1. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов / В.Г. Олифер, Н.А. Олифер. СПб.: Питер, 2006. 958 с. 2. Миано Дж. Форматы и алгоритмы сжатия изображений в действии: учебное пособие / Дж. Миано. Пер. с англ. М.: Триумф, 2003. 336 с. 3. СэломонД. Сжатие данных, изображений и звука / Д. Сэломон. М: Техносфера, 2004. 368 с. 4. Баран-никВ.В. Структурно-комбинаторное представление данных в АСУ / В.В. Баранник, Ю.В. Стасев, Н.А. Королева. Х.: ХУПС, 2009. 252 с. 5. Акимов Р.И. Технология кодирования пакетов предсказанных кадров в инфокоммуникационных системах // Сучасна спещальна технша. 2012. N° 4. С. 17 - 18.
Поступила в редколлегию 11.09.2015
Баранник Владимир Викторович, д-р техн. наук, профессор, начальник кафедры Харьковского университета Воздушных Сил им. И. Кожедуба. Научные интересы: кодирование и защита информации для передачи в телекоммуникационных системах. Адрес: Украина, 61000, Харьков, ул. Сумская, 77/79. E-mail: [email protected].
Шульгин Сергей Сергеевич, соискатель Киевского Национального авиационного университета, г. Киев. Научные интересы: обработка видеоинформации и безопасность инфоком-муникационных систем. Адрес: Украина, 01000, Киев, пр. Космонавта Комарова, 1.