Научная статья на тему '«Дерево информации» и его построение на основе последовательности случайных событий'

«Дерево информации» и его построение на основе последовательности случайных событий Текст научной статьи по специальности «Математика»

CC BY
211
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОЛИЧЕСТВО ИНФОРМАЦИИ / ЭНТРОПИЯ / ПОТОК СОБЫТИЙ / СОСТОЯНИЯ СИСТЕМЫ / «ДЕРЕВО СОБЫТИЙ» / INFORMATION AMOUNT / TREE GRAPH OF EVENTS

Аннотация научной статьи по математике, автор научной работы — Дулесов Александр Сергеевич, Кондрат Нина Николаевна, Прутовых Марина Александровна

В статье рассматривается простейшая методика построения «дерева информации». При его построении предлагается рассматривать поток событий дискретной природы, в котором каждое из событий несёт в себе информацию частного характера, определяемого по известной формуле Шеннона. В вершине дерева представляется интегральная информация о возможных событиях. В процессе построения дерева изучаются вероятностные сценарии развития событий и количество информации, которые они вносят в интегральную информацию. Приводится пример построения «дерева информации» с представлением математических выражений, по которым определяется величина неопределённости информации (энтропия).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

«Information Tree» and its Scheming Based on Accidental Events Sequence

The article discusses the simplest method of «Information Tree» scheming. Stream of events of discrete properties are represented. Each one carries out its private information unit (Shannon rule). The example of tree graph scheming and mathematics expressions are represented.

Текст научной работы на тему ««Дерево информации» и его построение на основе последовательности случайных событий»

ТЕХНИЧЕСКИЕ НАУКИ

УДК 621.390

«ДЕРЕВО ИНФОРМАЦИИ» И ЕГО ПОСТРОЕНИЕ НА ОСНОВЕ ПОСЛЕДОВАТЕЛЬНОСТИ СЛУЧАЙНЫХ СОБЫТИЙ

А. С. Дулесов, Н. Н. Кондрат, М. А. Прутовых

Хакасский государственный университет им. Н. Ф. Катанова

В статье рассматривается простейшая методика построения «дерева информации». При его построении предлагается рассматривать поток событий дискретной природы, в котором каждое из событий несёт в себе информацию частного характера, определяемого по известной формуле Шеннона. В вершине дерева представляется интегральная информация о возможных событиях. В процессе построения дерева изучаются вероятностные сценарии развития событий и количество информации, которые они вносят в интегральную информацию. Приводится пример построения «дерева информации» с представлением математических выражений, по которым определяется величина неопределённости информации (энтропия).

Ключевые слова: количество информации, энтропия, поток событий, состояния системы, «дерево событий».

В статье рассматривается состояние технической системы с точки зрения наличия в ней информации и/или энтропии. Под информацией подразумевают совокупность сообщений (сведений) об окружающем мире, подлежащих хранению, передаче и преобразованию. Для вычисления количества информации и энтропии Клод Шеннон, опираясь на позиции теории информации, предложил свои формулы [1], которые совпали с соответствующими выражениями из статистической физики. Эти выражения опираются на вероятностный подход к получению количества информации.

Любая техническая система состоит из элементов, функционирующих во взаимодействии друг с другом, которые с течением времени могут принимать различные состояния. Им предшествуют события, порождённые воздействием разнообразных случайных факторов. Состояния (например, работоспособный или неработоспособный элемент) как результат физического процесса могут быть функциями времени. В зависимости от того, какие значения могут принимать амплитуда и аргумент (время (), случайный поток состояний может быть дискретно непрерывным, дискретным по уровню, дискретным по времени, дискретным по уровню и времени. Забегая вперёд, отметим, что нас будут интересовать дискретные по времени состояния, которые определены лишь в отдельные моменты времени и могут принимать значения одного уровня.

Большинство состояний системы фиксированы и несут в себе статистическую природу. Поэтому в теории информации вопрос об измерении количества информации о состояниях решается через вероятностные свойства, присущие потоку событий.

Если события могут «разворачиваться» во времени, следуя последовательно друг за другом, развиваясь согласно сценариям в различных направлениях, то говорят о возможностях построения «дерева событий». Связь событий и вероятности с количеством информации позволяет строить «дерево информации». Оно применимо тогда, когда построение возможных вероятностных сценариев развития события с присущей ему интегральной (исходной) информацией позволит, учитывая условия неопределённости, найти её составляющие для конечных состояний системы.

Количественная характеристика состояний. Рассматривая лишь дискретные по времени состояния элементов системы, неизбежно приходится вносить упрощения в задачу определения количества информации.

Элементам технической системы приписываются статистические характеристики, рассматриваемые на длительном интервале времени Т. Если в основу функционирования системы положить теорию надёжности, то в числе характеристик фигурируют частота отказов и восстановлений, время наработки на отказ и другие показатели. В совокупности через предварительные расчёты они позволяют представить на оси времени поток состояний элемента и системы. В простейшем случае расчётов события берутся в виде двух вероятностных состояний: работоспособное и неработоспособное. Поток таких событий можно характеризовать наличием времени их существования или вероятностью соответственно работоспособности и отказа.

Если абстрагироваться от теории надёжности, то в качестве состояний можно непосредственно рассматривать события как свершившееся явление, или как подмножество исходов эксперимента.

Исследуя сценарий развития событий на интервале Т, имеем совокупность возможных 1-х состояний с про-должительностями ^, или вероятностями = ^/Т. При этом необходимо принять во внимание следующий факт: какой величины будет вероятность наступления интересующего нас события, так как она может зависеть от развития остальных событий.

Алгоритм построения «дерева событий» предусматривает в его вершине наличие интегрального события, вероятность которого определяется следующими условиями: 1) сценарий представляет собой цепь последовательных элементарных дискретных событий, характер появления которых в среднем не меняется со временем, то есть налицо стационарный процесс; 2) процесс должен быть эргодическим, так как при определении вероятностных характеристик стационарного процесса усреднение по амплитудным значениям можно заменить усреднением по времени и вероятности. Данные условия указывают на то, что вероятностные свойства построения «дерева» предусматривают наличие лишь одной достаточно длинной реализации. Следовательно, вероят-

ность интегрального события должна быть больше вероятностей появления всех других событий. По сути, основное событие аккумулирует в себе множество частных событий.

Интегральное событие содержит в себе определённую величину информации. Поскольку природа события случайна, то имеется неопределённость относительно того, с какой вероятностью оно появится. Например, техническая система в целом может полностью отказать, то есть находиться в неработоспособном состоянии в течение 24 часов. Тогда вероятность её отказа будет равна: р = 24/8760 = 0,00274, где знаменатель 8 760 обозначает число часов в году.

Величина вероятности интегрального события складывается из вероятностей потока отдельных событий, каждое из которых порождено своей причиной. Случайный характер факторов трудно учесть, поскольку они комбинируются между собой, воздействуя на систему. Если предположить, что факторы обусловливают появление независимых событий, то можно, опираясь на модель Хартли [2], определить количество информации, содержащейся в интегральном событии по формуле:

/=-/о&Л (1)

где Р - вероятность появления интегрального события длительностью На практике эту вероятность находят, исходя из наличия статистических данных.

Выражение (1), в котором значение 2 в основании логарифма учитывает наличие в потоке событий двух противоположных состояний, представляет собой логарифмическую (аддитивную) меру количества информации, позволяющую оценивать количество информации, содержащейся в интегральном сообщении.

Строя «деревья» количественного распределения информации между событиями, будем предполагать, что количество интегральной информации является достоверной величиной с вероятностью р = 1 или с вероятностью, близкой к Р. В последнем случае информация и её мера связаны с вероятностью её возможного появления, то есть с понятием «неопределённость». С позиции «что есть неопределённость» речь уже идёт об информационной энтропии как о логарифмической мере неопределённости информации, которая может быть определена по выражению К. Шеннона [1]:

Н = -Р1о§2 Р. (2)

Выражение (2) имеет классический вид и обладает универсальностью, позволяя нам в дальнейшем вычислять значения энтропии отдельных событий при построении «дерева информации» при условии, что

п

(3)

7=1

где п - число конечных событий дерева.

Построение «дерева информации». Если рассматривать построение «дерева сценариев», то важно предварительно определиться с ситуацией: будет ли вероятность наступления интересующего нас события зависеть от того, как развиваются остальные события. Если события рассматриваются как независимые, то реализация одного из них никак не влияет на вероятность другого события. Однако в технических системах появление одновременно двух и более независимых приводит к изменению состояния системы.

Строя дерево из исходной вершины и рассматривая при этом возможные сценарии развития событий, следует обратиться к теоремам сложения и умножения вероятностей. На их основе при построении «дерева неопределённости» можно воспользоваться схемой «дерева вероятностей», которая по смысловому содержанию сходна с «деревом решений» (рис. 1). Каждая ветвь в нём представляет собой отдельный сценарий развития событий с наличием условных вероятностей.

Рис. 1. «Дерево вероятностей»

Если рассматривать систему или какое-либо исходное событие с позиции применения меры неопределённости информации, то через построение сценариев можно определить значения информаций по каждому из них

как долю её присутствия в интегральной информации. Математически интегральная величина неопределённости информации может быть определена как

Н = -^Р,1О82Р

(4)

при условии независимости событий и выполнения равенства (3). В (4) р - это результирующее значение вероятности для конечного события / «дерева информации».

Рассмотрим построение «дерева информации» с наличием вероятных сценариев возникновения пожаров при эксплуатации автотранспортных средств (автомобилей).

Статистика пожаров, произошедших в период 2001-2003 гг., показывает, что причинами их возникновения являются [3]:

- технические неисправности и аварийные ситуации, возникающие в процессе эксплуатации автомобиля;

- искусственно инициированные ситуации: поджоги и неосторожное обращение с огнём.

Для построения «дерева информации» воспользуемся рисунком 1 и статистическими данными, объединив некоторые из них для удобства.

Пожары, возникающие в процессе эксплуатации автомобиля (примерно 65 % всех возгораний), связаны, во-первых, с неисправностями топливной и электрической систем, неисправностью газового оборудования (85 % возгораний данного вида), во-вторых, с взрывами, разрушениями узлов и деталей в результате ДТП, перегревом отопителей и других аварийных режимов (15 %).

Другой источник возгорания - открытый огонь - является причиной примерно 35 % пожаров автомобилей. Из них около 65 % случаев связано с неосторожным обращением с огнём: нарушение правил пожарной безопасности при проведении сварочных и других ремонтных работ, пуском двигателя, курением. Остальные 35 % - пожары, вызванные поджогами.

Введём обозначения: х = 1 - вероятность потери работоспособности автомобиля, связанная с возникновением пожара; у - вероятность возникновения пожара в процессе эксплуатации автомобиля, у = 0.65; { - у 0.35 -вероятность возникновения пожара под воздействием открытого огня; г = 0.85 - вероятность возникновения пожара в связи с неисправностью систем; г^0.15 - вероятность пожара, вызванного ДТП и другими аварийными ситуациями; г = 0.65 - вероятность пожара при неосторожном обращении с огнём; 4,-г = 0.35 -вероятность пожара, вызванного поджогами.

Учитывая формулу (2), построим «дерево информации» (рис. 2).

Потеря работоспособности автомобиля

X = 1

Возгорания при эксплуатации автомобиля у = 0.65

Неисправность систем г = 0.85

-х-у1оё2р

ДТП и другие аварийные ситуации

<-г"=0.15

-х- <~у~}^2р

Неосторожное обращение с огнём г = 0.65

Наличие открытого огня <-у>0.35

Поджог <-г"=0.35

-х-у

-х- К — у^ К —ГJ.log2p -х - ^ — r^r■log2p

1=1

0.553 0.098-/о£2/> 0.122 -^2р 0.227 -^2р

Рис. 2. «Дерево информации» Полученные расчётные значения энтропии соответствуют условию (3).

Рассмотрев пример, в котором представлены сценарии развития независимых событий, можно отметить, что «дерево информации» позволяет видеть количество энтропии, принадлежащее каждому конечному событию в общей энтропии исходного события.

Приведённые примеры «дерева информации», построенные на основе логарифмической меры информации, позволяют отметить следующее:

- они дают возможность сравнивать варианты развития событий (поскольку на схеме у них будут разные «развилки») по количеству присутствия в них неопределённости информации;

10

- применение «дерева информации» способствует сосредоточению внимания на факторах, зависящих от влияния человека, т. е. на «развилках», распределение вероятностей (иначе - предположение о появлении информации) в которых особенно не устраивает исследователей и/или пользователей технических систем.

Библиографический список

1. Шеннон, К. Работы по теории информации и кибернетике / К. Шеннон. - М.: Изд-во иностр. лит., 1963. - 830 с.

2. Hartley, R. V. L. Transmission of Information / R. V. L. Hartley // Bell System Technical Journal. - July, 1928. - Р. 535-563.

3. Особенности установления причины пожара на автотранспортных средствах (Электронный ресурс). - URL: http://fireplanexpress.ru/publ/ustanovlenie_prichiny_pozhara_avtomobilja/1-1-0-10 (дата обращения: 3.07.2013).

© Дулесов А. С., Кондрат Н. Н., Прутовых М. А., 2013

i Надоели баннеры? Вы всегда можете отключить рекламу.