Научная статья на тему 'Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных'

Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
39
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
мультиплексированный цифровой поток / источник сообщения / статистическое уплотнение / марковская модель случайного процесса / цепь Маркова / избыточность сообщения / ряды распределения. / multiplexed digital stream / message source / statistical compaction / Markov model of a random process / Markov chain / message redundancy / distribution series.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов В.А., Конышев М.Ю., Маркин А.В.

Структура двоичного потока на выходе мультиплексора определяется правилом, согласно которому общий групповой канал связи делится на некоторое количество интервалов (подканалов), определяемых абонентским трафиком на его входе. Для внешнего наблюдателя групповой поток представляет собой двоичную последовательность с неизвестным изменяющимся во времени распределением многомерных двоичных случайных величин. Цель работы заключается в нахождении параметров распределения дискретной двоичной величины, аппроксимирующего двоичный поток на выходе мультиплексора. Новизна работы состоит в том, что для аппроксимации имеющего избыточность разнородного двоичного потока предлагается использовать математический аппарат марковских цепей. Показано, что двоичный поток, в целом являясь нестационарным, состоит из участков локальной стационарности, на которых распределения двоичной случайной величины могут считаться постоянными. Предложена вероятностная мера оценки распределения многомерных двоичных случайных величин для оценивания разладки, на основе которой могут быть обнаружены границы участков локальной стационарности. Практическая значимость работы заключается в возможности использования модели при разработке процедур и алгоритмов сжатия цифровых потоков в режиме реального времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов В.А., Конышев М.Ю., Маркин А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A conceptual model of a message source at the output of a multiplexer for studying the properties of a binary stream in data compression procedures

The structure of the binary stream at the output of the multiplexer is determined by the rule according to which the common group communication channel is divided into a certain number of intervals (subchannels) determined by subscriber traffic at its input. For an external observer, the group stream represents a binary sequence, with an unknown dynamic distribution of a multidimensional binary random variable on the time axis. The aim of the work is to find the distribution parameters of a discrete binary quantity (1.0) approximating the binary stream at the output of the multiplexer. The novelty lies in the fact that it is proposed to use the mathematical apparatus of Markov circuits to approximate a heterogeneous binary stream with redundancy. It is proved that the digital stream, as a whole being non-stationary, consists of sections of local stationarity on which the distribution of a binary random multidimentional variable remain constant. A probabilistic measure for estimating this distribution and determining the moments of the breakdown, showing the change of local stationarity sites, is proposed. The practical significance lies in the possibility of using the model in the development of procedures and algorithms for compressing digital streams in real time.

Текст научной работы на тему «Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных»

ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ

УДК 621.317

Концептуальная модель источника сообщений на выходе мультиплексора

для исследования свойств двоичного потока в процедурах сжатия данных

Иванов В.А., Конышев М.Ю., Маркин А.В.

Аннотация. Структура двоичного потока на выходе мультиплексора определяется правилом, согласно которому общий групповой канал связи делится на некоторое количество интервалов (подканалов), определяемых абонентским трафиком на его входе. Для внешнего наблюдателя групповой поток представляет собой двоичную последовательность с неизвестным изменяющимся во времени распределением многомерных двоичных случайных величин. Цель работы заключается в нахождении параметров распределения дискретной двоичной величины, аппроксимирующего двоичный поток на выходе мультиплексора. Новизна работы состоит в том, что для аппроксимации имеющего избыточность разнородного двоичного потока предлагается использовать математический аппарат марковских цепей. Показано, что двоичный поток, в целом являясь нестационарным, состоит из участков локальной стационарности, на которых распределения двоичной случайной величины могут считаться постоянными. Предложена вероятностная мера оценки распределения многомерных двоичных случайных величин для оценивания разладки, на основе которой могут быть обнаружены границы участков локальной стационарности. Практическая значимость работы заключается в возможности использования модели при разработке процедур и алгоритмов сжатия цифровых потоков в режиме реального времени.

Ключевые слова: мультиплексированный цифровой поток, источник сообщения, статистическое уплотнение, марковская модель случайного процесса, цепь Маркова, избыточность сообщения, ряды распределения.

Введение

Основным фактором, стимулирующим развитие и практическое воплощение идеи эффективного использования каналов и сетей связи для обмена информацией, является потребность в повышении их пропускной способности при минимальных затратах на их строительство и эксплуатацию. По результатам исследований [1] среднемесячный объем трафика в сетях связи общего пользования только за последние 5 лет вырос более чем в 3 раза. До 2025 года его повышение планируется еще в 6 раз, в том числе за счет мобильного варианта предоставления новых видов услуг абонентам и развития информационной инфраструктуры в зонах удаленного доступа. Движущей силой этого процесса является опережение темпов развития спектра услуг по отношению к возможностям телекоммуникационных платформ для их реализации с позиций пропускной способности. Поэтому наличие фрагментов в сетях связи с недостаточной пропускной способностью является объективной закономерностью их функционирования и развития.

Для оперативного устранения возникающих нежелательных ситуаций, связанных с недостачей пропускной способности приёмо-передающих трактов, применяют устройства, повышающие информационную эффективность каналов связи, за счет

протокольной оптимизации, кеширования данных и снижения избыточности передаваемых по сети сообщений, в том числе и служебного характера. Такие устройства впервые появились в начале 2000 годов и получили название сетевых акселераторов трафика. Об их востребованности свидетельствует оборот продажи на рынке телекоммуникаций, который к настоящему времени превысил планку 10 млрд. долларов. [2, 3]. На рынке акселераторов трафика основными поставщиками технических средств выступают иностранные производители и компании. Российские потребители телекоммуникационного ресурса, закупали подобное оборудование за рубежом. В условиях экономических санкций и импортозамещения проблема разработки отечественных средств повышения эффективности пропускной способности каналов и трактов связи на базе архиваторов цифрового потока становится важной и актуальной. В теоретическом аспекте решение этой проблемы опирается на информационную модель, интегрирующую свойства потока в виде согласованной и взаимоувязанной системы, способной определять параметры, которыми необходимо руководствоваться при разработке алгоритма сжатия данных

Концептуальная модель источника сообщений и условия формирования мультиплексированного цифрового потока

Структура мультиплексированного цифрового потока (МЦП) в приемопередающих трактах определяется правилом, согласно которому общий групповой канал связи делится на некоторое количество интервалов (цифровых подканалов), закрепляемых за источниками сообщений (рис. 1).

Рис. 1. Обобщенная структурная схема многоканальной системы передачи информации

В современных многоканальных системах передачи информации мультиплексор может быть выполнен в виде отдельного устройства или платы, встраиваемой в другие устройства (коммутаторы, маршрутизаторы пакетов и интеграторы цифрового потока). При статистическом и динамическом мультиплексировании правило распределения общей пропускной способности тракта адаптируется к значениям трафика, передаваемого от абонентов на мультиплексор. При статическом - пропускная способность подканалов не зависит от входящей нагрузки и не меняется во времени. Современные системы мультиплексирования в основном используют принцип динамического уплотнения каналов, при котором если суммарная скорость от всех источников сообщений (ИС)

меньше скорости МЦП, то полная и своевременная передача трафика от абонентов обеспечивается за счет перераспределения общего ресурса пропускной способности мульплексированного цифрового потока в соответствии с потребностями всех источников сообщений, в противном случае - снижается скорость передачи сообщений от некоторых источников в соответствии с их приоритетами. Все изменения в групповом потоке передаются оборудованием мультиплексора от передающей к приемной стороне по каналу управления.

Вариант мультиплексирования абонентского трафика в групповом канале связи представлен на рисунке 2.

Рис. 2. Схема мультиплексирования при передаче трафика одновременно от трех абонентов связи

Учитывая, что с одной стороны МЦП не является стационарным, а с другой состоит из участков локальной стационарности случайных по длительности и случайных относительно распределения двоичной последовательности бит, то для разработки адаптивного алгоритма сжатия МЦП необходимо оценивать и прогнозирование его статистических свойств. Поэтому разработка концептуальной модели мультиплексированного цифрового потока предполагает ее чувствительность к нагрузке в уплотняемых каналах, правилу ее распределения в общем потоке, структуре кадра, и статистическим свойствам источников сообщений.

В простейшем случае для статического мультиплексировании в t -м кадре МЦП реализация сообщения И-го ИС определяется следующим выражением:

А = &, а..., а,..., <} (1)

где t - порядковый номер бита ИС, Ыи - количество бит И-го источника в кадре мультиплексированного цифрового потока.

Правило закрепления бит в кадре мультиплексированного цифрового потока записывается как вектор (2)

Я = [*, 11 < 1 < Кц, (2)

где i - порядковый номер бита ИС, N - количество бит h-го источника в кадре мультиплексированного цифрового потока.

Для динамического мультиплексора правило мультиплексирования (уплотнения) является функцией, в качестве аргумента которой выступает нагрузка, поступающая на вход мультиплексора от абонентов.

При мультиплексировании с разделением по времени TDM (Time Division Multiplexing) закон мультиплексирования, определяющий закрепление временных интервалов за источником сообщений, определяется выражением (3).

A(0 = ^\{Ah (t)} _1

v ' Ц v >)h=\,N J (3)

где S - функция, отражающая правило закрепления бит в цикле мультиплексированного цифрового потока за уплотняемыми ИС; t - порядковый номер бита в цикле МЦП; Ак({) -реализация сообщения h-го ИС.

Учитывая аппроксимацию МЦП случайным процессом, описание которого на участке локальной стационарности опирается на марковскую модель, запишем выражение для распределения финальных вероятностей двумерной двоичной случайной величины (ДСВ) в виде (4).

p (a^af ) = p (a-) p (of / a^)

(4)

где ahi - 1-й символ И-го ИС; р(аИ1 ¡аИ-\ ) - условная вероятность, элемент матрицы переходных вероятностей.

Выражением (5) определим реализацию сообщения И-го ИС на длине кадра мультиплексированного цифрового потока

{Ah (t )}= {of, afa;

h=1, N

(5)

где И - порядковый номер ИС в мультиплексированном цифровом потоке; N - количество ИС, уплотняемых в МЦП; Nh - объем сообщения И-го источника; I - порядковый номер бита источника сообщения.

Тогда, учитывая структуру статического МЦП, суммарный цифровой поток представим выражением (6).

А ')}=(«! (1), «2 (2),-, < Мц)), (6)

где « (1) - 1-й символ в сообщении И-го ИС, расположенный на позиции I в МЦП, N -длина кадра МЦП.

На рис. 3 представлен фрагмент структуры МЦП, соответствующий введенным выше обозначениям

1 ... 6 .л 9 .. Ыц

Номер источника

i |... 1 |... * |...| 2

Кадр 1

о; (1) a6 (6) 02N (9) o:2 (j+1) oN„ ( N.)

Кадр 2

aU ( N +1) О!,; + 2 ( N , + 6 ) oN+2 ( N + 9 ) oL2 (Ne + j +1) o^ ( 2N)

Кадр m

oli+;((m -1)N +1) ol„i+2 ((m -1)Ne + 6 ) olx+2 ( (m -1) Ne + 9 ) < ((m-1)Ne + j +1) o^ (mNe)

Рис. 3. Фрагмент структуры мультиплексированного цифрового потока в групповом

приемопередающем тракте

Известно [1, 2], что избыточность группового сообщения, предаваемого в МЦП, зависит от избыточности сообщений в уплотняемых абонентских каналах и эффективности использования пропускной способности группового приемо-передающего тракта, определяемой выражением

1 М

КМЦП =Т^

у ц Ь=1 , (7)

где Кмцп - коэффициент эффективности использования пропускной способности группового

тракта; 8и = 0 при отсутствии нагрузки в И-м источнике сообщения мультиплексированного цифрового потока и 8и = 1 - при максимальной нагрузке в И-м источнике сообщений мультиплексированного цифрового потока; Ыц - количество бит в цикле МЦП; N -количество ИС, уплотненных в МЦП

Проведенный анализ показывает, что коэффициент использования пропускной способности групповых каналов для сетей связи общего пользования в среднем составляет 85 %, а для ведомственных сетей, к которым предъявляются дополнительные требования, от 10 % до 70 % .

Поскольку эффективное снижение избыточности в сообщении предполагает кодирование длинных битовых групп, а на практике существуют ограничения, определяемые требованиями к задержкам при передачи сообщений, то на выходе ИС определенная доля избыточности сохраняется. Тогда, с учетом структуры МЦП и корреляционных связей между символами сообщений в уплотненных каналах, вероятность значения ¿-го бита в мультиплексированного цифрового потока А(^), выделенного для передачи информации И-го ИС, определим выражением (8).

р (а (а1„ (/),..., аЧ (/})) = р (^ (у),..., а-(/)) р (а-, (/),..., а* (/) / а-п (/),..., аЦ

где .1,./" - порядковые номера бит мультиплексированного цифрового потока, выделенных И-му ИС непосредственно перед ¿-м битом; г - порядковый номер бита в сообщении И-го ИС; п - связность цепи Маркова.

В случае динамического уплотнения правило уплотнения может изменяться во времени и выражение (5) принимает следующий вид:

4 ')=[А (4=^ 151 [А (о}^ 1..., [А ], (9)

где Я - правило (шаблон) уплотнения мультиплексированного цифрового потока на 1 -м интервале времени формирования мультиплексированного цифрового потока, N -количество ИС, уплотненных в мультиплексированном цифровом потоке на 1 -м интервале времени формирования МЦП, м - количество интервалов времени формирования мультиплексированного цифрового потока.

Очевидно, длительность интервала времени формирования мультиплексированного цифрового потока соответствует длительности стационарного состояния для шаблона уплотнения, а количество интервалов определяется количеством состояний шаблона уплотнения для реализации МЦП. Поскольку состояния шаблона уплотнения 5 , 5 ,... , 5 в реализации мультиплексированного цифрового потока, представленной выражением (9), зависит от алгоритма управления структурой мультиплексированного цифрового потока, то решение задачи прогнозирования ряда распределения двоичных комбинаций в МЦП требует знания априорной информации относительно не только изменения во времени статистических свойств уплотняемых источников сообщений, но и реакции системы управления оборудованием мультиплексирования на изменение потребностей ИС в передаче информации.

С учетом выражения (5) для прогнозирования статистических свойств потока на выходе мультиплексора представим его в виде последовательности из М сообщений распределенных по времени

м={4, ам }. (10)

Статистические свойства сообщений на каждом из I интервалов времени описываются распределением финальных вероятностей и-мерной двоичной случайной величины. Тогда статистические свойства Ь-го ИС Ак (/') определяются соответствующей последовательностью вероятностей двумерных двоичных случайных величин (ДСВ) следующего вида

{р(Ак ) р(< )}, (11)

где р(А) = (Р(00), р(01), р(10 ), р(11)).

При разделении сообщения к -го ИС на М сообщений, соответствующих различным интервалам времени формирования мультиплексированного цифрового потока получаем матрицу вида (12). элементы в строках которой описывают распределения двумерной ДСВ на каждом из интервалов времени

р(00), р(01) р(10), р(11),

М II р(001, Р(01).+1 р(101, р(11к

Р(00)М р(01)м Р(10)^М р(11)^м

(12)

Учитывая доказанное в [3] утверждение о том, что распределение финальных вероятностей двумерной ДСВ, задаваемой односвязной цепью Маркова, полностью определяется распределением финальных вероятностей одномерной двоичной случайной величины (ДСВ) и значением любого из элементов вектора финальных вероятностей двумерной ДСВ, то

/ (р( *), л)

р(*) = 1 - р(х\р, ^ {р(00), р(01), р(10), р(11)}, (13)

где рг,,=о е^=р (00), рх=р (01), р2=р (10), ръ=р (11)},

Для характеристики расстояния между рядами распределений в строках матрицы (12) предлагается использовать метрику Евклида. Расстояние между рядами распределения двумерных двоичных случайных величин в строках матрицы (12) ] и к определяется выражением

= л/(р(°)> - р(0)к )2 + Ы00), - р(00)к )2 (14)

Уплотняемые источники сообщений могут описаны в виде последовательности расстояний между рядами распределений двумерной ДСВ, соответствующих различным временным интервалам наблюдения реализации двоичного случайного процесса на выходе мультиплексора. Полученный в (14) и-мерный вектор можно рассматривать как временной ряд, и использовать для прогнозирования статистических свойств потока на выходе мультиплексора [4, 5, 6].

Выводы

Аппроксимация потока марковским случайным процессом позволяет использовать полученную информацию о распределениях вероятностей двоичных комбинаций в анализируемом мультиплексированном цифовом потоке для прогнозирования распределений двоичных случайных величин на участках локальной стационарности и составления кодовой книги, определяющей принцип и особенности работы поточного

архиватора, реализующего минимальные задержки по времени при передаче речевых и видео сообщений.

Литература

1. Гавлиевский С.Л. Принципы построения мультисервисной сети ПАО «Ростелеком». М.: Горячая линия - Телеком, 2018. 228 с.

2. Department of Defense Unified Capabilities Framework 2013, http://disa.mil.

3. Статьи аналитических компаний Infonetics Research http://infonetics.com и Gartner Group http://gartner.com.

4. Конышев М.Ю., Близнюк В.И., Панкратов А.В., Санин Ю.В. Математическая модель мультиплексированного цифрового потока для систем потокового сжатия // Информация и Космос. 2014. № 3. С. 35-39.

5. Конышев М.Ю., Близнюк В.И., Иванов В.А., Панкратов А.В. Метод оценивания статистических свойств дискретного канала с памятью в системах передачи информации с мультиплексированием // Науковедение. 2014. № 3 (22). С. 95-105.

6. Баранов В.А., Конышев М.Ю., Панкратов А.В., Шинаков С.В. Идентификация модели двоичного Марковского процесса по выборке ограниченного объема // Материалы международной научной конференции «Радиолокация, навигация, связь» («RLNC-2012»). Том 1. Воронеж: Изд. ВГУ. 2012. С. 22-33.

7. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. М.: Финансы и статистика, ИНФРА-М.: 2010. 320 с.

8. Кендэл М. Временные ряды: пер. с англ. / М. Кендэл. М.: Финансы и статистика, 1981.

9. Четыркин Е.М. Статистические методы прогнозирования / М.: Статистика, 1977.

References

1. Gavlievsky S.L. Principles of building a multiservice network of PJSC Rostelecom. Moscow. Hotline. Telecom, 2018. 228 p. (in Russian).

2. Department of Defense Unified Capabilities Framework 2013, http://disa.mil .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Link to articles of Infonetics Research analytical companies http://infonetics.com and Gartner Group http://gartner.com

4. Konyshev M.Yu., Bliznyuk V.I., Pankratov A.V., Sanin Y.V.. Mathematical model of multiplexed digital stream for streaming compression systems. Information and space. 2014. No. 3.Pp. 35-39. (in Russian).

5. Konyshev M.Y., Bliznyuk V.I., Ivanov V.A., Pankratov A.V. Method of estimating the statistical properties of a discrete channel with memory in information transmission systems with multiplexing. Naukovedenie. 2014. No 3 (22). Pp. 95-105. (in Russian).

6. Baranov V.A., Konyshev M.Y., Pankratov A.V., Shinakov S.V. Identification of the binary Markov process model by a limited volume sample. Radar, navigation, SV. (in Russian).

7. Afanasyev V.N., Yuzbashev M.M. Time series analysis and forecasting: textbook. Moscow. Finance and Statistics, INFRA- M. 2010. 320 p. (in Russian).

8. Kendal M. Time series: translated from English. Moscow. Finance and Statistics, 1981. (in Russian).

9. Chetyrkin E.M. Statistical methods of forecasting. Moscow. Statistics, 1977. (in Russian).

Статья поступила 15 марта 2022 г.

Информация об авторах

Иванов Владимир Алексеевич - Доктор военных наук, профессор, главный специалист ФГУП «НТЦ «ОРИОН». Тел: +7-926-4747812, E-mail: iva.mac@mail.ru.

Конышев Михаил Юрьевич - Доктор технических наук, доцент, начальник отдела ФГУП «НТЦ «ОРИОН». Тел: +7-953-6204881, E-mail: misha-kon@mail.ru.

Маркин Алексей Валерьевич - Директор ФГУП «НТЦ «ОРИОН». Тел: +8-495-914-94-11, E-mail: markin.a.v@fgupntcorion.ru.

Адрес: г. Москва, ул. Образцова, д. 38, стр.1.

A conceptual model of a message source at the output of a multiplexer for studying the properties of a binary stream in data compression procedures

V.A. Ivanov, M.Y. Konyshev, A.V. Markin

Annotation: The structure of the binary stream at the output of the multiplexer is determined by the rule according to which the common group communication channel is divided into a certain number of intervals (subchannels) determined by subscriber traffic at its input. For an external observer, the group stream represents a binary sequence, with an unknown dynamic distribution of a multidimensional binary random variable on the time axis. The aim of the work is to find the distribution parameters of a discrete binary quantity (1.0) approximating the binary stream at the output of the multiplexer. The novelty lies in the fact that it is proposed to use the mathematical apparatus of Markov circuits to approximate a heterogeneous binary stream with redundancy. It is proved that the digital stream, as a whole being non-stationary, consists of sections of local stationarity on which the distribution of a binary random multidimentional variable remain constant. A probabilistic measure for estimating this distribution and determining the moments of the breakdown, showing the change of local stationarity sites, is proposed. The practical significance lies in the possibility of using the model in the development of procedures and algorithms for compressing digital streams in real time.

Keywords: multiplexed digital stream, message source, statistical compaction, Markov model of a random process, Markov chain, message redundancy, distribution series.

Information about Authors

Vladimir Alekseevich Ivanov - Doctor of Military Sciences, Professor, Chief Specialist of FSUE "STC "ORION". Tel: +7-926-4747812, E-mail: iva.mac@mail.ru.

Mikhail Yuryevich Konyshev - Doctor of Technical Sciences, Associate Professor, Head of the department of FSUE "STC "ORION". Tel: +7-953-6204881, E-mail: misha-kon@mail.ru.

Alexey Valeryevich Markin - Director of FSUE "STC "ORION". Tel: +8-495-914-94-11, E-mail: markin.a.v@fgupntcorion.ru.

Address: Moscow, Obraztsova str., 38, p.1.

Для цитирования: Иванов В.А., Конышев М.Ю., Маркин А.В. Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных. // Техника средств связи. 2022. № 1 (157). С. 61-68.

For citation: Ivanov V.A., Konyshev M.Y., Markin A.V. A conceptual model of a message source at the output of a multiplexer for studying the properties of a binary stream in data compression procedures. Means of Communication Equipment. 2022. No. 1 (157). Pp. 61-68 (in Russian).

i Надоели баннеры? Вы всегда можете отключить рекламу.