Анализ алгоритмов преобразования информации в информационно-вычислительных системах

Басалова Галина Валерьевна

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

УДК 004.942

АНАЛИЗ АЛГОРИТМОВ ПРЕОБРАЗОВАНИЯ ИНФОРМАЦИИ В ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

Г.В. Басалова

Рассмотрен подход к анализу алгоритмов преобразования информации в информационно-вычислительных системах с использованием математического аппарата сетей Петри. Предлагаемый подход позволяет выполнять моделирование и анализ алгоритмов обработки информации в разрабатываемой или уже существующей вычислительной системе. При этом анализ может производиться с помощью вычислительной техники, так как все его этапы строго формализованы.

Ключевые слова: алгоритмы обработки информации, моделирование вычислительных систем, сети Петри.

Одним из основных этапов разработки любых, в том числе и специализированных, вычислительных систем являются изучение и анализ процессов обработки информации в проектируемой системе. В процессе изучения и анализа должны быть уточнены структура вычислительной системы, входные, промежуточные и выходные данные, процедуры обработки информации и последовательность их реализации, основные характеристики специализированной вычислительной системы и ограничения на ее реализацию [1].

При анализе процессов преобразования информации используются информационные модели, предназначенные для отражения информационных связей между объектами. Особенность такого рода моделей заключается в их графическом представлении, но при этом имеется возможность матричного или аналитического способа их изображения. Информационные модели отражают информационные потоки между различными объектами, отношения между ними, содержат идентификаторы объектов, объемные, временные, частотные и другие характеристики как самих объектов, так и входящих и исходящих потоков данных, а также последовательность выполнения расчетов.

В основу описываемого подхода положен принцип последовательного эквивалентного преобразования матричных моделей систем обработки данных в зависимости от этапа анализа системы и необходимости получения требуемых характеристик.

Исходной информацией для моделирования и анализа технологии обработки данных является состав информационных ресурсов (ИР) по каждой задаче, отношения предшествования между ними, области их определения, множество используемых констант, структурированные матрицы смежности и достижимости, определяющие технологию обработки данных.

На основе анализа матриц смежности и достижимости ИР строится информационных граф для каждой задачи. Анализ информационного графа и его подграфов позволяет определить состав процедур, необходимых для решения задачи. Объединения множества процедур и множества ИР по множеству задач определяют полное множество ИР и процедур заданного множества задач обработки данных. Путем проведения специальных операций "выравнивания" и "наложения" графов отдельных задач формируется общий интегрированный граф технологии решения задач обработки данных, матрица смежности которого является результатом логического сложения матриц смежности анализируемых задач.

Интегрированный граф содержит общие и специфические части технологии решения рассматриваемого множества задач. Исходными данными для анализа, систематизации и формирования требований к схеме обработки данных является информация о парных отношениях между наборами информационных ресурсов системы обработки данных, формализуемая в виде матрицы смежности.

Рассмотрим матричные и графовые модели описания исходной информации и процедур ее обработки. Для описания алгоритмов решения задач обработки данных используют два стандартных блока: функциональный блок и блок принятия решений (рис. 1).

Рис. 1. Блоки для построения моделей обработки информации

Функциональный блок и представляет собой отдельную процедуру обработки данных, под которой понимается некоторое преобразование одних информационных элементов в другие безотносительно к средствам, на которых реализуется это преобразование. Основным требованием при вы-

делении функциональных блоков является одинаковый уровень абстракции и детализации при анализе отдельных задач обработки данных. Под блоком ип принятия решений понимают процедуру или операцию логического сравнения поступающих входных данных с заданными. В результате операции сравнения управление передается одному (и1) или другому (и2) функциональному блоку. С помощью этих блоков описывают циклические участки в алгоритмах обработки данных.

Информационное обеспечение алгоритма обработки данных составляет множество типов ИР, обрабатываемых процедурами алгоритма. В качестве ИР в зависимости от уровня абстракции рассматриваются базы данных, массивы, блоки, записи и т.д. Процедуры обработки данных, входящие в функциональный блок, можно рассматривать как преобразования множества входных либо промежуточных ИР в множество промежуточных либо выходных ИР задачи [2].

Степень абстракции процедур обработки информационных элементов зависит от необходимого уровня детализации описания задач обработки данных при их анализе.

Представим процессы преобразования и обработки информации в вычислительной системе с помощью сети Петри.

Как известно, сеть Петри определяется множеством состояний и переходов, а также входными и выходными функциями переходов. Состояния сети будем обозначать кружками, а переходы черточками (барьерами). Дуги соответствуют функциям, связывающим множества состояний и переходов. Входная функция переходов определяет для каждого перехода множество его входных состояний, а выходная - множество его выходных состояний.

При использовании сетей Петри вводится понятие маркера, под которым понимается метка готовности запуска перехода по каждому из его входных состояний. Наличие маркера будем обозначать точкой в кружочке, соответствующем состоянию. Число точек соответствуют числу маркеров в каждом состоянии.

Переход может сработать, если в каждом его входном состоянии имеется хотя бы один маркер. Размещение маркеров по вершинам-состояниям сети Петри называется ее разметкой.

Таким образом, сеть Петри - это набор N = (Р, Т, Р, Н, М0), где

- Р - конечное множество состояний;

- Т - конечное множество переходов;

- Р: Р хТ ^ {0, 1}, Н: Т хР ^ {0, 1} - функции инцидентности;

- М0: Р ^ {0, 1, 2, ...} - начальная разметка сети.

Графически сеть Петри представляется в виде ориентированного графа. Вершину-состояние р и вершину-переход ? соединяют дугой (р^), если Р(р,1)=1 и дугой ^р), если Н^,р)=1.

Вершины-состояния помечаются целыми неотрицательными числами или соответствующим числом маркерных точек.

Если все состояния сети обозначить последовательно символами p1, p2,p3, ... pn, то разметку всех состояний сети можно представить в виде п-мерного вектора M, координаты которого равны числу маркерных точек в соответствующих состояниях.

Функционирование сети заключается в переходе от одной разметки к другой. Смена разметок происходит в результате срабатывания переходов. Переход t может сработать при разметке М, если

M(p) - F(p,t) > 0, "p е P.

Это означает, что каждое входное состояние перехода t помечено хотя бы одной маркерной точкой.

В результате срабатывания некоторого перехода t, удовлетворяющего условию (1) разметка M заменяется разметкой M':

"p е P: M'(p) = M(p) - F(p,t) + Щ^),

то есть при срабатывании перехода из каждого его входного состояния удаляется и в каждое его выходное состояние добавляется одна маркерная

t

точка. Это обозначается: М ® М'.

Пусть В ={й1, й2, ..., - множество ИР специализированной вычислительной системы, где £ - число элементов; и = {и1, и2, ..., иь} - множество процедур обработки данных.

Поставим в соответствие каждому элементу фе Б вершину-состояние pi сети. Каждому элементу и-еИ поставим в соответствие переход ^ сети.

В соответствии со взаимосвязью информационных ресурсов и процедур обработки соединим дугами элементы множеств Р и Т. Элемент PiеP соединяется с элементом ^еТдугой t]), если информационный ресурс 4 является входным элементом процедуры и- и дугой (— pi) - если выходным. Так как информационный ресурс может являться входным для нескольких процедур, то для восстановления маркерных точек состояния pi после срабатывания перехода ^ необходимо также построить дуги (— pi) для таких ^ и pi, для которых существует дуга (pi, -).

Под матрицей смежности ИР М0 понимают квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов и содержащую запись 1 в позиции (¡, -) ¡, - = 1, ^, если между информационными ресурсами ё и существует отношение Я такое, что для получения информационного элемента непосредственно необходимо обращение к ИР

Считается также (для удобства), что каждый элемент достижим из самого себя, то есть Я , г = у . Наличие такого отношения будет обозначать как di Rdj, а его отсутствие как di Я , чему соответствует запись 0 в позиции (-', ]) матрицы М0.

Такая формализация позволяет однозначно идентифицировать входные и выходные ИР в алгоритме обработки данных [3].

Матрице смежности М0 ставится в соответствие граф информационных взаимосвязей G(Д М0), множеством вершин которого является множество ИР, а дуга (4-, dj) соответствует записи 1 в позиции (', у) в матрице смежности. Взаимосвязь между процедурами обработки, наборами входных и промежуточных данных удобно представлять с помощью таблицы инцидентности, которая представляет собой таблицу вида

Т = \ttis |, I = 1, А я = 1, £, где

+1, если является входным элементом процедуры и1,

0, если не используется процедурой и1, -1, если является в входным элементом процедуры и1.

В таблице Т0 каждая строка отображает процедуру обработки данных, а каждый столбец - использование всеми процедурами рассматриваемого ИР, то есть в строке содержится информация о множестве входных и выходных данных, связанных с анализируемой процедурой.

В я-м столбце таблицы допускается больше одной позиции (I, я) со значением -1, если существуют альтернативные варианты получения соответствующего ИР. В этом случае их число должно совпадать с общим числом процедур, имеющих в пересечении с я-м столбцом значение -1.

Рассмотрим графовое представление двух основных видов взаимосвязи между элементами таблицы Т0. Выделим два случая. Пусть столбцу информационного ресурса соответствует единственная процедура и1 со значением -1, а входными элементами процедуры и1 являются dk, 4р, что обозначим в виде и1 ^^ = ^, 4р, } (рис. 2). Этот случай соответствует единственному варианту получения .

=

Рис.2. Пример графа для единственного варианта получения информационного ресурса

8

Пусть столбцу ИР соответствуют процедуры щ и и- со значением -1, то есть:

и[ (й^) = {йк, dp}, и- (й^) = {йк, йт}.

Этот случай соответствует наличию двух альтернативных вариантов получения информационного элемента (рис. 3). В первом случае ИР получается с помощью процедуры и[, входными ИЭ которой являются йк, dp во втором - с помощью другой процедуры, имеющей входы йк, йт.

Рис.3. Пример графа при наличии альтернативных вариантов получения информационного ресурса

Для проведения основных процедур анализа задач обработки данных требуется получить структурированную матрицу смежности и построить соответствующие им графы. Для формирования структурированной матрицы смежности необходимо преобразовать исходные данные таким образом, чтобы выявить уровни обработки, последовательность используемых процедур и т.д.

Вначале осуществляют переупорядочение ИР в матрице смежности по уровням их обработки. С этой целью используют матрицу достижимости ИР. Под матрицей достижимости В0 понимается квадратная бинарная матрица, проиндексированная одинаковым образом по обеим осям множеством информационных ресурсов В = }, £ = 1, £. Запись 1 или 0 в каждой позиции (/, -) матрицы достижимости соответствует наличию или отсутствию для всех упорядоченных пар ИР (й, й-) отношения достижимости Я, обладающего свойством транзитивности.

Информационный ресурс й- достижим из информационного ресурса (Я й-), если на графе информационных взаимосвязей можно указать направленный путь от вершины к вершине й-, либо = й-, то есть если для получения информационного ресурса й- используется ИР йг-.

Матрица достижимости определяется с использованием матрицы смежности Т0 и свойства транзитивности отношения достижимости. При этом заданной матрице достижимости может соответствовать некоторое

9

множество матриц смежности Т0, любая из которых имеет одну и ту же матрицу достижимости В0. Следовательно, имеется множество графов информационных взаимосвязей, любой из которых содержит необходимую информацию для построения матрицы достижимости.

Процедура выделения уровней обработки с использованием матрицы достижимости В0 состоит в следующем. Информационный ресурс di е В, принадлежит множеству элементов верхнего уровня матрицы достижимости, если ) п ) = ), где Я^) и А (4) - соответственно множество предшествования и достижимости информационного элемента di.

С использованием матрицы достижимости производится итеративное разделение множества ИР на подмножества в соответствии с уровнями их обработки.

Упорядоченному множеству ИР соответствует структурированный граф информационных взаимосвязей, ИР которого разделены на различные уровни.

Обозначим структурированную матрицу смежности Т0С. В этой матрице информационные ресурсы разделены на подмножества в соответствии с уровнями их обработки. Информационные ресурсы, столбцы которых в матрице Т0С не содержат единиц (нулевые столбцы) являются входными элементами задач обработки данных, а информационные ресурсы, соответствующие высшему уровню обработки Ь1, являются выходными ресурсами. Остальные ресурсы являются промежуточными.

Для полного анализа необходимо получение взаимосвязи между информационными ресурсами и процедурами в алгоритме обработки данных. Поэтому на втором этапе анализа, используя информацию, содержащуюся в структурированной матрице смежности и таблице инцидентности задач обработки данных, строится структурированная матрица смежности технологии задач обработки данных [4]. Она отражает существующую взаимосвязь между информационными ресурсами и процедурами в общем алгоритме обработки данных. В этой матрице процедуры упорядочены по уровням их использования, а информационные ресурсы - по уровням их обработки.

Таким образом, рассмотренный метод позволяет выполнять моделирование и анализ алгоритмов обработки информации в разрабатываемой или уже существующей специализированной вычислительной системе. При этом анализ может проводиться с помощью вычислительной техники, так как все его этапы строго формализованы.

Список литературы

1. Гудман С., Хидетниеми С. Введение в разработку и анализ алгоритмов / пер. с англ. М.: Мир, 1981. 366 с.

10

2.Типизация разработки модульных систем обработки данных / Мамиконов А.Г., Кульба В.В., Косяченко С.А. М.: Наука, 1989. 165 с.

3. Мамиконов А.Г., Кульба В.В. Синтез оптимальных модульных систем обработки данных. М.: Наука, 1986. 275 с.

4. Методы и модели анализа данных: OPLAP и Data Mining / А. А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. СПб.: БХВ-Петербург, 2004.

Басалова Галина Валерьевна, канд. техн. наук, доц., galina hasalovaamail.ru, Россия, Тула, Тульский государственный университет

ANALYSIS OF TRANSFORMATION ALGORITHMS IN INFORMATION-COMPUTING

SYSTEMS

G. V. Basalova

The article considers approaches to the analysis of data processing algorithms in computing systems using mathematical apparatus of Petri nets. The proposed approach allows performing simulations and analysis of information processing algorithms in a developed or existing computer system. The analysis can he performed with the help of computer technology, because it is strictly formalized.

Key words: data processing algorithms, modeling of computer systems, Petri

nets.

Basalova Galina Valerievna, candidate of technical sciences, docent, galina hasalovaa mail.ru, Russia, Tula, Tula State University

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Басалова Галина Валерьевна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Басалова Галина Валерьевна

ANALYSIS OF TRANSFORMATION ALGORITHMS IN INFORMATION-COMPUTING SYSTEMS

Текст научной работы на тему «Анализ алгоритмов преобразования информации в информационно-вычислительных системах»