Научная статья на тему 'Теория представления процесса обработки данных в информационной системе'

Теория представления процесса обработки данных в информационной системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
803
101
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Белый Владимир Михайлович

В статье приводится формальное описание информационного процесса на основе теоретико-множественного подхода. Определяется концептуальная модель базы данных, дается ее состав. Показаны операции, необходимые для вывода отношений. Предлагается общий подход к языковым средствам общения пользователя с информационной системой. Рассмотрен процесс целенаправленной обработки поступающей информации как основного режима функционирования информационной системы. Предложен вариант информационной системы, предусматривающей возможность целенаправленной обработки информации, определяемой совокупностью запросов на получение регламентированных по форме и содержанию выходных документов. Ориентирована на научных сотрудников, преподавателей вузов, аспирантов и специалистов, занимающихся вопросами обоснования и проектирования информационных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Теория представления процесса обработки данных в информационной системе»

Ив62006

В.М. Белый

Теория представления процесса обработки данных в информационной системе

В статье приводится формальное описание информационного процесса на основе теоретико-множественного подхода. Определяется концептуальная модель базы данных, дается ее состав. Показаны операции, необходимые для вывода отношений. Предлагается общий подход к языковым средствам общения пользователя с информационной системой. Ориентирована на научных сотрудников, преподавателей вузов, аспирантов и специалистов, занимающихся вопросами обоснования и проектирования информационных систем.

В настоящее время большинство исследований в вопросах обоснования моделей данных носят отпечаток такого исторически сложившегося подхода к информационным системам (ИС), когда система обработки данных реализует лишь один режим работы: обеспечивает ответы на запросы произвольного содержания.

В данной статье рассмотрим процесс целенаправленной обработки поступающей информации как основного режима функционирования ИС. При этом традиционный режим, предусматривающий формирование ответов (отчетов) на произвольный вопрос (запрос), рассматривается как вспомогательный, но, безусловно, необходимый в любой ИС. Это объясняется эволюцией информационных потребностей пользователя в любой сфере деятельности человека, а, следовательно, периодическим изменением целей (т. е. состава, форм и содержания выходных документов, требуемых от ИС).

Кроме того, несмотря на изменчивость целей в любой ИС режим целенаправленной обработки обладает более высоким быстродействием, что очень важно на практике.

В литературе не встречается материалов по обоснованию и формализации процессов целенаправленной обработки ин-

формации. В связи с актуальностью этого режима в ИС и отсутствием теоретических проработок в статье делается попытка дать его формализованное описание. При этом за основу принят реляционный подход и его теоретическое обоснование в соответствии с традиционной организацией информационного процесса, который затем развивается применительно к процессу целенаправленной обработки данных.

Формальное описание информационного процесса опишем в следующем виде.

Согласно [3], будем рассматривать совокупность специальных множеств называемых доменами или типами

О = {0„ О,, О, О,}, где / = 1, п,

т.е. множество, состоящее из однотипных элементов, а также множество имен атрибутов

/4 = {Д, А,, ..., Д., Д}, гдеI =1,а

Полагаем, что задано отображение Р: А ^ О, которое ставит в соответствие каждому атрибуту один домен, называемый областью значений этого атрибута. Сочетание имени атрибута и домена Ар/ позволяет наделить каждый элемент б е О^ определенным смыслом и, наоборот, конкретизировать атрибут при употреблении совместно с его именем одного из значений, т. е. одного из элементов О/ с Ар.

Теория представления процесса обработки данных в информационной системе

ІІ962006

Так, множеству «Дата» с помощью таких имен атрибутов, как «Дата изготовления», «Дата обнаружения неисправности» и т. п., придается соответствующий смысл. А употребление каждого значения в сочетании с именем атрибута конкретизирует общее понятие, например, «Дата изготовления — 10.03.06 г.».

Приписывание, именам атрибутов множеств значений позволяет формально обозначить различные объекты как отношения атрибутов.

Отношение Яг определяется как подмножество декартова произведения базовых множеств, выражаемых именами атрибутов

Д с Ак 1 ■ \2 Ая<,

где ї — степень множества, т. е. количество

сомножителей декартова произведения.

Яї представляется множеством, элементами которого являются кортежи наборов элементов вида:

<и „ иІ2 ия, >,

ак 1 Є Ак,, Є А/_2, ..., адї Є Адї .

Другими словами, Яї определяет класс объектов, характеризуемых одинаковым набором свойств (атрибутов) для каждого из них.

Очевидно, на заданном наборе атрибутов А можно построить 2/А1 различных отношений, если трактовать схему каждого отношения как множество атрибутов без учета их взаимного расположения во множестве.

В этом случае просто решалась бы проблема построения (вывода) любого отношения, так как множество А с заданными на нем операциями объединения и, пересечения П и дополнения - образует алгебру с константами Ф и А:

< А-, и, П, -, Ф,А>.

Следовательно, решалась бы и проблема формирования ответов на запросы, поскольку ответ на запрос можно трактовать как вывод определенного отношения на ос-

нове множества отношений, образующих базу данных.

Однако в силу того что на практике атрибуты множества А не являются независимыми, воспользоваться этим простым математическим аппаратом нельзя. Кроме того, при построении ИС нельзя не учитывать такие факторы, как требование экономического представления данных в памяти, экономичного использования машинного времени, оперативности, обеспечения непротиворечивости информации, поступающей из разных источников. В связи с этим возникает проблема построения такого математического аппарата для описания информационного процесса в системе, который давал бы возможность учитывать требования практики.

Первым важным фактором, который накладывает ограничения и определяет операции, с помощью которых могут быть выведены новые отношения из имеющихся, является структура функциональных зависимостей между атрибутами множества А. Структура функциональных зависимостей отражает объективные закономерности, реально существующие в моделируемом фрагменте внешнего мира (предметной области).

Другим ограничивающим и определяющим операции над отношениями фактором является семантика отношений, т. е. ИС должна порождать и использовать в качестве исходных только те отношения, которые имеют смысл для данной предметной области.

Например, бинарному отношению на атрибутах «Заводской № изделия» и «Дата» можно придать множество смыслов. В частности, его можно связать с изготовлением изделия, монтажом изделия, обнаружением неисправности, восстановлением работоспособного состояния и т. п. Для примера будем связывать это бинарное отношение с возникновением неисправности. Нетрудно убедиться в том, что этих двух атрибутов достаточно, чтобы однозначно идентифицировать любую неисправность,

Ивб 2006

учитывая тот факт, что в действительности не может быть более одной неисправности одного конкретного изделия в течение одних суток (во всяком случае, очень редко). Этим достигается выполнение требования уникальности каждого кортежа в отношении.

Рассмотренное бинарное отношение является минимально возможным взглядом пользователя на неисправность как на некий абстрактный объект, проявляющийся только при одновременном появлении значений двух атрибутов. При употреблении только одного из атрибутов смысл «Неисправность» разрушается. Поэтому мы и назвали бинарное отношение минимально возможным взглядом на неисправность, но, очевидно, не единственным. Можно обеспечить множество взглядов на одну и ту же неисправность, добавляя к схеме новые атрибуты, т. е. расширяя отношение до тернарного, например, указывая дополнительно «Завод изготовитель», до квадратного, указывая в дополнение к тернарному отношению «Дата устранения», и т.д. Очевидно, что такое расширение возможно лишь в том случае, если в базе данных (БД) имеется отношение, устанавливающее связь «Заводской № изделия» с «Завод изготовитель», отношение, устанавливающее связь «Неисправность» с «Дата устранения», и т.д.

Множественный взгляд на один и тот же объект широко распространен в различных сферах деятельности человека. В рассматриваемом примере можно привести ряд таких документов, как «Рекламационный акт», «Акт удовлетворения рекламации» и т.д., в которых зафиксированы различные взгляды на один и тот же объект — «Неисправность». При этом оказывается, что установление минимально возможного взгляда на объект имеет не только теоретическое, но и практическое значение, обеспечивая согласование различных сообщений об одном и том же объекте, т. е. согласование (интеграцию) различных точек зрения.

Таким образом, большое значение имеет выявление всех функциональных зависимостей между атрибутами множества А и всех отношений, имеющих смысл, в «минимальной» форме. Поскольку при этом затрагивается семантика данных, подобную процедуру может осуществить только пользователь, хорошо знающий предметную область. Методика выявления возможных связей состоит в попарном сочетании всех атрибутов, проверке наличия смысла в каждом таком сочетании и фиксации осмысленных сочетаний в форме:

• функциональной зависимости

р : д ^ д , д ф а , /, I = 1,

• объекта

И с А ■ А, /, I = 1,&

В результате мы получаем множество (структуру) функциональных зависимостей Р и множество объектов И.

Далее потребуется исключить все избыточные функциональные зависимости, пользуясь следующим правилом: если атрибут А функционально определяет атрибут В(р: А ^ В), а атрибут В функционально определяет атрибут С(Р2: В ^ С) и имеется (зафиксирована) функциональная зависимость Р3: А ^ С, то последняя является избыточной в том смысле, что она может быть при необходимости восстановлена путем композиции функций р и Р2, а именно:

Рз = Р1Р2 = (А ^ В)(В ^ С) = (А ^ С).

Пару <Р, И>, состоящую из двух множеств: множества неизбыточных функциональных зависимостей и множества объектов, назовем концептуальной моделью предметной области. Можно показать, что все отношения (функции и объекты) концептуальной модели (КМ) находятся в третьей нормальной форме и образуют минимальное покрытие базы данных [5]. КМ предметной области обеспечивает соединение взглядов пользователей и является непротиворечивой, вследствие своей неизбыточно-

ВМ Белый

Теория представления процесса обработки данных в информационной системе

ІІ962006

сти (минимальности). Внесение противоречий в КМ становится невозможным, если в процессе функционирования системы каждое сообщение контролировать на непротиворечивость содержащейся в нем информации с информацией, имеющейся в базе данных. Контролируемый процесс обновления базы данных может быть осуществлен следующим образом. Каждый входящий документ формально описывается как нормализованное до первой нормальной формы отношение или совокупность иерархически взаимосвязанных отношений в первой нормальной форме. Извлечение информации для контроля непротиворечивости и обновления БД осуществляется путем выполнения операции проекции схемы документа на схему каждого отношения и каждой функции КМ.

Обозначим Аг множество атрибутов документа. Очевидно, при этом должно выполняться условие Аг с А.

Пусть М = Р и Я множество схем отношений концептуальной модели. Тогда процедура проекции схемы документа на КМ состоит в следующем:

1) проверяется путем пересечения множеств Аг и А, і = 1, /М/, условие А, с Аг или А, П А- = А,;

2) при выполнении условия А, с Аг из документа производится выборка связки значений, соответствующих атрибутам из множества А,. Эта связка значений представляет собой кортеж (реализацию, экземпляр) отношения (функции) со схемой А,.

В результате проекции последовательно на все /М/ схем КМ получаем множество кортежей Mi

/Mi/ < /М/.

Следующим этапом обработки поступившего документа (сообщения) является проверка каждого кортежа из множества Mi на его уникальность по отношению к состоянию КМ. Проверка уникальности кортежа осуществляется путем поиска в точно-

сти такого же кортежа в соответствующей связи. Формально этот процесс можно представить как проверку истинности высказывания (суждения), которым по существу является кортеж. Если информация, заключенная в суждении, имеется в базе данных, то суждение получает значение «истина», в противном случае — «ложь».

В соответствии со значениями истинности, полученными для каждого кортежа из множества М/, производится дальнейшая обработка сообщения. Каждая связь КМ относится к одному из двух классов: парадигматических (постоянных) связей или ситуационных (переменных) связей. В зависимости от принадлежности кортежа к тому или иному классу связи и от значения истинности кортежа определяется реакция системы. При этом парадигматические связи отражают закономерности, объективно (независимо от взгляда пользователя) присущие предметной области. Следовательно, появление новой информации должно расцениваться как необычное явление, требующее тщательного контроля правильности новой информации, прежде чем будет принято решение о ее включении в БД. И наоборот, отсутствие новой информации для парадигматических связей считается обычным явлением: свидетельством отсутствия противоречий в сообщении и БД или, другими словами, если полагать, что в БД находится абсолютно достоверная информация, — свидетельством отсутствия ошибок в той части сообщения, которая соответствует парадигматическим связям.

В противоположность парадигматическим ситуационные связи отражают те явления в предметной области, которые представляют объект интереса (точки зрения) пользователя. Здесь новая информация обычное явление, а информация, совпадающая с той, которая имеется в БД, — это ошибка, которая может быть следствием повторного ошибочного ввода (или отправки) одного и того же сообщения, так как двух одинаковых ситуаций в один и тот же момент быть не может.

ПРИКЛАДНАЯ ИНФОРМАТИКА ____ —

*— Неб 2006

Таблица 1

Действия пользователя при осуществлении ввода данных

Тип связи, к которой имеет отношение кортеж Значение истинности кортежа, определяемое по состоянию БД: истина — информация старая, ложь — информация новая Действия пользователя и системы

Парадигматическая Истина Тщательный анализ. Коррекция ошибок в сообщениях или БД

Ложь Действия отсутствуют

Ситуационная Истина Автоматическое обновление БД

Ложь Выявление причины повторного ввода сообщения

Таким образом, реакции системы и действия пользователей в описанных ситуациях можно систематизировать (табл. 1).

После контроля непротиворечивости сообщения (а также устранения противоречий, если это необходимо) и обновления КМ базы данных сообщение проходит второй этап обработки — избирательное обобщение и распределение информации.

В предлагаемом варианте ИС предусматривается новая возможность: целенаправленная обработка информации, определяемая совокупностью регламентированных запросов на получение регламентированных по форме и содержанию выходных документов.

В качестве рабочей гипотезы выдвигается предположение, что покрытие, образованное концептуальной моделью, является оптимальным. При этом под КМ мы будем понимать:

• совокупность, в которую входят множество атомарных отношений, соответствующих элементарным объектам, и множество первичных функциональных отношений;

• соответствующую сигнатуру ^ = Я1 иР1.

Тогда любой взгляд пользователя на данные, так называемый внешний уровень возможный в рамках конкретной КМ, может быть обеспечен путем вывода соответствующего отношения из объектных и функциональных отношений КМ.

Под атомарным отношением, или элементарным отношением, соответствующим элементарному объекту, будем понимать такое отношение, каждый кортеж которого позволяет неизбыточно и однозначно идентифицировать определенный пользователем информационный объект, атрибуты которого функционально независимы.

Например, учет семантики объекта «Неисправность» позволяет сопоставить с ним отношение: Я с ДО хЗН, где ДО — дата обнаружения неисправности, ЗН — заводской номер изделия, т.е. точно определить (эксплицировать) информационный объект «Неисправность».

Любой кортеж этого отношения однозначно будет определять любую неисправность, если выполняется условие, что в течение одних суток одно изделие не может иметь более одной неисправности. Очевидно также, что каждая неисправность определяется этим отношением неизбыточно: удаление любого из атрибутов схемы (например, путем операции проекции) разрушает семантику отношения.

Другие примеры экспликации объекта «Неисправность»:

Я1 с ВОх ДО х ЗН,

Я2 с ДО х ЗН х ДУ,

где ВО — время обнаружения неисправности,

ДУ — дата устранения неисправности.

ВМ Белый

Теория представления процесса обработки данных в информационной системе

Н962006

В первом случае отношение будет избыточным (если условие «не иметь более одной неисправности одного изделия в течение одних суток» сохранить) за счет, может быть, полезного, но не необходимого для экспликации дополнительного атрибута ВО, т.е. отношение Я1 не будет элементарным объектным отношением. Однако это отношение превратится в элементарное объектное, если условие «не иметь более одной...» снять.

Во втором случае экспликация объекта «Неисправность» оказывается избыточной за счет атрибута ДУ при сохранении вышеупомянутого условия, т.е. отношение Я2 не является элементарным объектом. Или может даже оказаться недостаточной для однозначной идентификации объекта, если вышеупомянутое условие снять (можно представить ситуацию, что в течение одних и тех же суток обнаружены две неисправности одного изделия, которые устранены также в течение одних и тех же суток).

Очевидно, что во всех трех рассмотренных вариантах в экспликации Я, Я1 и Я2 атрибуты функционально независимы.

Теперь можно дать определение объектного отношения.

Объектным будем называть отношение, получаемое из элементарного отношения, путем добавления к нему одного атрибута, несвязанного функциональной зависимостью ни с одним из подмножеств атрибутов исходного отношения.

Пример 1.

Добавление атрибутов ДУ и ВУ приводит к отношению: Я1 с ВОх ДОхЗНх ВУ х х ДУ, где ВУ — время устранения неисправности.

Очевидно, что никаких функциональных зависимостей между атрибутами ВО, ДО, ЗН, ВУ и ДУ объективно не существует в рамках семантики, рассматриваемой в качестве примера предметной области.

Введенные выше понятия (и их определения) элементарного отношения и объект-

ного отношения имеют значение для определения формальных операций над такого рода отношениями и для выявления тех требований и ограничений, которые должны учитываться при проектировании информационной модели объектной системы.

Из приведенных выше рассуждений ясно, что единственной формальной операцией над объектными отношениями может быть операция проекции [5]. При этом область определения на операцию проекции ограничивается.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть АНо — множество имен атрибутов, образующих схему объектного отношения Я0, а АЯЭ — множество имен атрибутов, образующих схему объектного отношения Яэ. Из определения Я0 и Яэ следует, что

АЯЭ с АЯо.

Результатом проекции отношения Я0 с набором атрибутов АЯ0 на схему АЯ является отношение Я со схемой АЯ. Очевидно ограничение, накладываемое на аргумент операции:

АЯ ^ АЯо .

Другими словами, схема АЯ, на которую проектируется отношение Я0 со схемой АЯо, должна содержать все без исключения атрибуты, образующие схему элементарного отношения. Смысл операции проекции объектного отношения состоит в ограничении числа атрибутов множества информационных объектов при сохранении семантики, определяемой схемой элементарного отношения, т. е. любое объектное отношение должно иметь семантическое ядро.

Из единственности операции проекции, применимой к объектному отношению, вытекает следствие.

Единственным покрытием (или физической, хранимой в памяти связью) может быть только объектное отношение с полной схемой АЯ|, т.е. такой схемой, что

аяэ с ая, ;

и АЯ 0 е АЯ, ;

АЯо е 2Ап".

Нвб 2006

Другими словами, покрытие Яп должно обеспечить выводимость любого Я0 со схемой Ая0 е 2Аяп, при этом АяЭ с Ая0.

Перейдем к рассмотрению функциональных отношений.

Как известно [2], на множестве 2А может существовать множество функциональных зависимостей (или функций).

Определим операцию композиции функциональных отношений.

Пусть Р: А ^Я и в: В ^ С две функции (функциональные отношения). Тогда результатом операции композиции функций Р и в (Р • в) является функциональное отношение Р• в: А ^С. Таким образом, операция композиции определена (применима) для функций Р и в, если существует такой атрибут (множество атрибутов), который является для одной функции областью определения, а для другой — областью значений.

Первичным будем называть такое функциональное отношение, которое не может быть получено из фиксированного множества функциональных зависимостей применением операции композиции. Из определения операции композиции следует, что во множестве {Р в, Р-в} первичными являются функции Р и в. Другими словами, первичные функции выполняют роль аксиом, а все остальные — роль теорем, выводимых с помощью правила композиции из аксиом и других уже выведенных теорем.

Отметим, что при коллективном использовании ИС информационная модель объектной системы может рассматриваться с многих точек зрения. При этом для некоторых пользователей важны объектные отношения, включающие в себя атрибуты, которые находятся в функциональной зависимости, но этот факт может быть неизвестен. В таком случае возникает задача поддержки подобных объектных отношений (взглядов пользователей) с учетом скрытых для этих пользователей, но объективно существующих функциональных зависимостей. С этой целью определим операцию соединения объектных и функциональных отно-

шений, которая позволяет осуществить поддержку псевдообъектных отношений, т. е. таких отношений, которые внешне (с точки зрения некоторых пользователей) выглядят как объектные, а по существу являются соединением объектных или псевдообъект-ных и функциональных отношений.

Операция соединения объектного или псевдообъектного отношения со схемой АЯ0 по подмножеству атрибутов АЯ где А^о с АЯо,

с функциональным, отношением Р: А!Но ^АР порождает псевдообъектное отношение со схемой Ая о р—Ая о и Ар , причем АЯ с Ая оР .

Операция соединения записывается следующим образом:

и :(Яо,Р) ——^Яор

или, если требуется указание схем, то

и :(Я0( Ая0),( Р : АЯ 0 ^ АР ))-10—> Я0 Р ( АЯ 0 Р ),

где Я0, Р, Я0Р—соответственно имена исходного объектного, исходного функционального и результирующего псевдо-объектного отношений.

Очевидно, что операция соединения и определена в том случае, если А'Во с АЯ0.

Пример 2.

Пусть Я0 отношение со схемой

Ая0 — {ДО, ЗН, ДУ} и

Р: (ДУ, ДО) ^ ВУ,

где Р — функция, позволяющая установить зависимость ВУ от даты обнаружения и даты устранения неисправности.

С помощью операции

и :(Я0 , Р) ——-—^ Я1

можно построить псевдообъектное отношение Я1 со схемой

АЯ 0 — {ДО,ЗН,ДУ, ВУ}.

Очевидно, что к псевдообъектным отношениям применима операция проекции, оп-

ВМ Белый

Теория представления процесса обработки данных в информационной системе

Н962006

ределенная для объектных отношений. Допустимы, например, проекции АЯ0 на такие множества, как {ДО, ЗН, ДУ} или {ДО, ЗН}, в результате которых получим исходное объектное отношение Яо в первом случае и элементарное объектное отношение ЯЭ — во втором.

Нетрудно заметить, что операция композиции является производной от операции соединения и проекции, т.е. вместо применения операции композиции можно для получения того же самого результата последовательно применить операцию соединения, а затем — операцию проекции.

Пример 3.

Пусть дано отношение со схемой АЯ0 и функциональные отношения:

Р :ЗН ^ П,

Р:П ^ Д,

Рз: Д ^ А

где П — участок цеха,

Д — цех,

А — завод.

Р1 устанавливает функциональную связь заводского номера изделия с участком, на котором это изделие установлено, Р2 — связь участка с цехом, Р3 — связь цеха с заводом. Очевидно, что отношения Р1, Р2 и Р3 являются функциональными и отражают объективно существующие закономерности рассматриваемой предметной области.

Пусть требуется получить псевдообъект-ное отношение Я1 со схемой

А^0 = {ДО, ЗН, Д, А}.

Такое отношение можно получить двумя способами с использованием операций:

1) соединения и проекции (Пр):

и :(Яо, Р) ———^ Яо1(ДО,ЗН,П); и :(Яо1, Р) —{—^ Яо2(ДО,ЗН,П,Д); и :(Яо2, Рз) — 1—+ Яоз(ДО,ЗН,П,Д,А); Пр:(Яоз) — ————^ яо(ДО,ЗН,Д,А);

2)композиции (К) и соединения:

К:(Р, Р2) ^ (Р 1:ЗН ^ Д); и :(Яо, Р1) ———^Я1 ((ДО, ЗН,Д); и :(Яо (, Р3) — ^—-> Я1(ДО,ЗН,Д,А).

Очевидно, что применение операции композиции сокращает длину цепочки вывода целевого отношения. Кроме того, может оказаться, что при выполнении операции композиции придется манипулировать меньшими объемами данных, чем при выполнении заменявших ее операций соединения и проекции. Поэтому следует считать целесообразной реализацию этой операции в ИС, наряду с операциями соединения и проекции.

Этими тремя операциями исчерпывается то множество операций, которое необходимо для обеспечения любого требуемого взгляда на информационную модель предметной области.

При этом под «любым» взглядом подразумевается только такое объектное или псевдообъектное отношение, которое сохраняет семантику исходных объектных отношений и функций, т.е. которое может быть осмыслено в рамках некоторой предметной области. А эта сохранность семантики обеспечивается самими определениями операций проекции, композиции и соединения: любое объектное или псевдо-объектное отношение сохраняет семантику элементарного отношения.

Как следует из определений операций, их результатами являются отношения, которые можно рассматривать как множества объектов (кортежей), каждый из которых характеризуется множеством значений соответствующих атрибутов. В силу этого имеется возможность выделения (взятия) подмножеств для любого множества объектов, определенного как отношение.

Введем операцию ограничения множества (отношения). Для этого будем различать два типа значений: имена и числа. Для огра-

Нвб 2006

ничения множества по имени, представляющему значение некоторого атрибута, достаточно задать булевское выражение, в котором имена связаны логическими знаками «ИЛИ» (V), «НЕ» (—1).

Знак конъюнкции (логическое «И» (А)) применительно к булевским выражениям над именами значений одного и того же атрибута (точнее, одной области значений) не имеет смысла, так как любой объект (кортеж) множества (отношения) может иметь одно и только одно значение, т. е. одновременно (что и выражает знак «И») не может появиться более одного значения.

При этом указывается имя атрибута, для которого входящие в выражение имена являются значениями. Например, запись А(В) означает, что В — булевское выражение, определяющее некоторое подмножество имен А'

А' с А,

являющихся значениями атрибута с именем А. Заметим, что в записи А(В) — А обозначает имя атрибута, а в записи А' с А обозначает множество значений атрибута с именем А.

Примеры булевских выражений:

а (ае А, {а} с А);

—а (по всем значениям, кроме а); а V Ь (по значениям а и Ь);

—а V Ь(по всем значениям, кроме а и Ь).

Ограничение множества по числовым значениям атрибута с числовыми значениями может быть сведено к форме ограничения по именным значениям, если в качестве имен используются следующие выражения:

а — точное значение числа;

[а, Ь] — все значения в диапазоне от а до Ь, исключая сами значения а и Ь;

]а, Ь[ — все значения в диапазоне от а до Ь, включая а и Ь;

[а, Ь[ — то же, исключая а, включая Ь;

]а, Ь] — то же, включая а, исключая Ь;

[а — строго больше а;

]а — не меньше а; а] — строго меньше а; а[ — не больше а.

Примеры булевских выражений для числовых значений:

а;

—а;

[а, Ь] V [с, б];

— [а, Ь[.

Смысл этих выражений очевиден. Ограничение множества (отношения) по одному атрибуту может быть обобщено для случая ограничения по нескольким атрибутам. Записывается такое ограничение в следующем виде:

Яо(А1(В1) * А2(В2) * ^ * An(Br)),

где * — символ, обозначающий одну из логических связок а, V;

А1, А2, ..., Ап — имена атрибутов;

В1, В2, ..., Вп — соответствующие именам атрибутов булевские выражения, определяющие подмножества их значений; Яо — имя отношения со схемой АЯо.

При этом ограничение будет правильно построенной формулой в том случае, если

{А-Ь ^ Ап} с АЯо .

Подразумевается, что связки а и V обладают «старшинством»: сначала рассматриваются цепочки имен, соединенных знаками конъюнкции, а затем эти конъюнктивные связки соединяются знаками дизъюнкции в выражение.

Пример 4.

Пусть требуется получить множество всех тех неисправностей с составом атрибутов {ДО, ЗН, Д, А}, которые были обнаружены в мае 2ооб года в цехах б и б2.

Очевидно, что исходным множеством должно быть отношение со схемой

Ая = {ДО, ЗН, Д, А}.

Ограничение по дате обнаружения, которую можно считать атрибутом с числовыми

ВМ Белый

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теория представления процесса обработки данных в информационной системе

нввгооб

значениями (в форме указания двух цифр года, двух цифр месяца и двух цифр числа месяца), запишется в виде ДО (]600501, 600531[), а ограничение по атрибуту Д (цех) — в виде: Д (б^).

Выражение для ограничения отношения со схемой по атрибутам имеет вид:

и [до Н600531, 600501[) л Дб V б2)].

Следующим выражениям легко дать соответствующую интерпретацию:

И [ДО (- ]600531, 600501[) л Дб V б2)] — «... обнаружены не в мае 2006 года в цехах ^ и б2»;

И [ДО (]600531, 600501[) V Д(а1 V б2)] — «... обнаружены или в мае 2006 года, или в цехах б и б2, или в мае и в цехах б и б2»;

И [ДО (]600531, 600501[) л Д - (б, V б2)] — «... обнаружены в мае 2006 года во всех цехах, кроме бї и б2».

Таким образом, во всех случаях результатом ограничения, декларируемого соответствующим выражением (которое легко интерпретируется на естественном языке) является ограниченное отношение, т. е. множество объектов характеризуемых определенным составом атрибутов и удовлетворяющих заданному условию. Само по себе это множество объектов или, другими словами, результирующее (выведенное) отношение может быть ответом на вопрос, формулируемый в виде выражения на ограничение. Однако в ИС могут поступать запросы, вместе с выражением на ограничение содержащее и требование на то или иное обобщение ограниченных множеств. Наиболее типичными и широко распространенными могут быть требования, выражаемые словами «сколько» или «количество», «суммарное значение», «среднее значение» и т. п.

Чтобы обеспечить возможность ответа на такие запросы (вопросы), введем функции множеств Ї следующих основных видов.

1. Количество — результатом является число, выражающее количество элементов (объектов) во множестве (исходном или определенном ограничением).

2. Сумма —результатом является число, выражающее суммарное значение заданного атрибута числового типа для всех объектов множества.

3. Среднее (эталон) — Ї (сумма, количество), где Ї — операция (функция) деления.

4. Мини (макси) — результатом является одно из чисел, представляющих минимальное (максимальное) значение заданного атрибута (числового типа) среди всех объектов заданного множества.

сумма А

сумма В

где

^количество А количество В, сумма А(В) сумма

функция

количество А(В) количество

примененная к множеству А(В);

А с В.

6. Процент (%) — доля умноженная на

1оо и т. д.

Состав функций множеств можно изменять (сокращать или расширять) в зависимости от потребностей пользователей в каждой конкретной сфере применения ИС и от предметной области.

Из определения рассмотренных наиболее распространенных в деловой сфере деятельности человека функций множеств следует, что процесс обобщения есть не что иное, как выражение в форме одного значения определенного (обобщенного) свойства множества объектов. При этом наименование (и содержание) свойства совпадает с наименованием (содержанием) функции множества, а само множество, к которому применяется та или иная функция, определяется в форме ограничения, задаваемого с помощью рассмотренного выше булевского выражения.

Собственно значение обобщенного свойства получило название показателя [1, 4].

Нвб 2006

Очевидно, наименование свойства (функции, множества) вместе с определением множества (булевское выражение) есть смысл (содержание, семантика) этого показателя.

Пример 5.

Выражение «Количество неисправностей» (с составом атрибутов ДО, ЗН, Д, А), которые были обнаружены в мае 2006 года в цехах а и а2, сопоставляют с числом, являющимся результатом применения функции «Количество» к ограничению, выражаемому в виде

н (до (600531,600501[) л д (а, V а2)).

Приведенному выражению на естественном языке может быть придана вопросительная форма: «Сколько неисправностей обнаружено ... ?»

Изложенные примеры иллюстрируют подход к решению проблемы общения с ИС на языке близком к естественному. Можно также ожидать осуществления прямого общения на ограниченном естественном языке, применяемом в определенной деловой сфере. Это возможно при условии решения проблемы автоматизированного перевода предложений с ограниченного естественного языка на формальный. Например, для описания (выражения смысла) показателей используется лексика естественного языка и ряд правил построения с помощью связок л, V, -1 булевских выражений.

Обобщенные показатели и формальные выражения их смысла, очевидно, могут быть объектами (элементами) базы данных ИС, т. е. могут храниться, поддерживаться в актуальном состоянии и выводиться на устройства отображения в ответ на соответствующий запрос (вопрос). Более того, обобщенные показатели могут быть элементами более сложных структур, т. е. могут быть связаны отношениями.

Многочисленными примерами таких отношений, заданных на множестве обобщенных показателей, являются обобщен-

ные выходные документы. При этом наименование самого документа, наименования столбцов и строк обобщенных документов в табличной форме соответствуют формальным выражениям смысла одиночных показателей, а «тело» документа — это не что иное, как упорядоченное множество одиночных показателей. При этом, как мы видели, каждый показатель — это характеристика определенного подмножества (ограничения) объектного или псевдообъект-ного отношения.

Такая интерпретация обобщенных выходных документов создает предпосылки для создания формального языка не процедурного типа, позволяющего точно описывать сложные выходные документы, т. е. точно декларировать цель для ИС без указания путей достижения этих целей. Сам процесс вывода требуемых отношений, их ограничений, а также вычисления обобщенных показателей, может выполняться автоматически.

Таким образом, пользователю предоставляются средства точного формулирования только входных (исходных посылок) и выходных документов (заключений), снимая проблему программирования самого процесса обработки.

Список литературы

1. Автоматизированные информационные технологии в экономике: Учебник / Под ред. проф. Г.А. Титоренко. М.: Компьютер, ЮНИТИ, 1998.

2. Вендров А.М. Проектирование программного обеспечения экономических информационных систем. М.: Финансы и статистика, 2000.

3. Цаленко М.Ш. Философия и математика моделирования процессов обработки информации (на примере реляционных баз данных). В сб.: Семиотика и информатика. М.: ВИНИТИ, 1979. Вып. 13.

4. Шамин Ю.В., Белый В.М. Модель информационной системы. В сб.: Вопросы информатики. М.: ЦИВТИ МО, 1980. №70.

5. Экономическая информатика: Введение в экономический анализ информационных систем: Учебник. М.: ИНФРА-М, 2005.

В.М. Белый

i Надоели баннеры? Вы всегда можете отключить рекламу.