Научная статья на тему 'Метод формирования представлений данных для работы с информационными ресурсами'

Метод формирования представлений данных для работы с информационными ресурсами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
103
22
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зыкин С. В.

В работе рассматривается проблема формирования интерфейса между различными представлениями данных. В качестве основы построения используется метод межмодельных коммутативных преобразований. Предполагается отсутствие взаимнооднозначного соответствия состояний исходной и целевой моделей данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of data representation in information resources

The problem of an interface shaping different data type representation is considered in the article. As a basis the method of intermodel commutative conversions is used. It is assumed that there is no one-to-one conformity in the initial and target data models.

Текст научной работы на тему «Метод формирования представлений данных для работы с информационными ресурсами»

Библиографический список

1. Клейнрок Л. Теория массового обслуживания: Пер. с англ. / Л. Клейнрок; Под ред. В.И.Нейман; «Пер. ИИ. Грушко ». -М.: Машиностроение, 1979. — 432 с.

2. Клейнрок Л. Вычислительные системы с очередями: Пер. сангл/ЛКлейнрок;Подред.Б.С. Цыбакова. — М.: Мир, 1979. — 600 с.

3. Задорожный В.Н. Анализ систем с приоритетами методом декомпозиции / В.Н. Задорожный // Омский научный вестник. - 2005. - №3(32). - 126-132 с.

4. Кокс Д Р. Теория восстановления: Пер. с англ. / Д.Р.Кокс , В.Л.Смит;.Под ред. Ю.К Беляева. - М.: Сов. радио, 1967 г. - 312с.

5. Уилкс С. Математическая статистика: Пер. с англ. / С. Уилкс; Под ред. Ю.В. Линника. - М.: ГРФМЛ, 1967 г. - 632 с.

6. Ширяев А.Н. Вероятность / А.Н. Ширяев. - М.: Наука, ГРФМЛ, 1980. - 576 с.

ЗАДОРОЖНЫЙ Владимир Николаевич, кандидат технических наук, доцент кафедры АСОИУ.

Дата поступления статьи в редакцию: 20.02.06 г. © Задорожный В.Н.

УДК 519 72 С. в> ЗЫКИН

Омский филиал института математики СО РАН

МЕТОД ФОРМИРОВАНИЯ ПРЕДСТАВЛЕНИЙ ДАННЫХ ДЛЯ РАБОТЫ

С ИНФОРМАЦИОННЫМИ РЕСУРСАМИ

В работе рассматривается проблема формирования интерфейса между различными представлениями данных. В качестве основы построения используется метод межмодельных коммутативных преобразований. Предполагается отсутствие взаимнооднозначного соответствия состояний исходной и целевой моделей данных.

1.Введение

Проблема использования информационных ресурсов была сформулирована основоположником реляционной модели данных - Е. Кодл,ом с соавторами [1]: "... обладание большой корпоративной БД имеет маленькое значение, если конечные пользователи не имеют возможностей легко синте-зироЕать необходимую информацию из этих запасов (складов) данных". Эта ситуация обусловлена тем, что весь сервис работы с информационными ресурсами создается прикладными программистами и, как следствие, необходимая информация к моменту ее получения перестает быть актуальной. Для решения указанной проблемы необходимо создание инструментария, ориентированного на организацию интерфейса между пользовательским представлением данных и информационными ресурсами.

Понимание этой проблемы вынуждает разработчиков программного обеспечения информационных систем дополнять свои продукты соответствующим инструментарием. Примером для сильноструктурированных моделей данных могут служить разработки; MS Access для Windows, Oracle Express, Delphi, InfoVizorT-д. Особенно популярны в настоящее время OLAP-технологии при построении гиперкубического представления данных (2,3,4,5]. Эти системы обладают широким спектром возможностей: быстрое создание форм для просмотра и редактирования данных, создание отчетов с возможностью расчета интегральных характеристик, вплоть до построения диаграмм, и т.д. Однако есть принци-

пиальное ограничение: эти разработки не используют формальное определение целевой модели данных и, как следствие, отсутствуют универсальные алгоритмы преобразования данных. Этот недостаток в существующих системах компенсируется программированием интерфейса по данным на встроенных языках, при этом, об оперативном предоставлении информации пользователю не может быть и речи.

2. Обобщенные состояния представления данных

Рассмотрим методику построения отображения исходной модели данных в целевую. Обозначим: ¿2= =<М, ДР,Р> — полностью определенная исходная модель, где М — логическая модель (схема) данных; О — совокупность допустимых состояний представления данных; Р — набор операций для модели М; Р — совокупность предикатов, ограничивающих допустимые состояния йМиБв совокупности являются носителем системы. Пусть С2= <М',1У,Р,Р'> — целевая модель, которую необходимо построить. Независимо от £2 может быть построена только схема целевой модели. Остальные компоненты определяются моделью £2, и механизмом их определения является отображение:

п => а.

Необходимо отметить, что исходных моделей может быть несколько, либо какие-то модели будут промежуточными, как в случае с построением гиперкуба [6]. Однако во всех случаях парное взаимодействие моделей должно быть самодостаточным, то есть независимым от других моделей. Достигается это свойство за счет парных алгоритмов

преобразования представления данных. Следовательно, достаточно рассмотреть принципы формирования таких алгоритмов для одной исходной и одной целевой моделей данных.

Основой построения отображения является установление соответствия между допустимыми состояниями С и О'. В [7] предложен следующий подход к построению коммутативных преобразований:

а: (М,Р) (М\Р'), V : Э -> Э', <р : Г I,

где /- произвольное подмножество Р.

Требования к отображениям: 1) взаимнооднозначное соответствие состояний хранимой информации {у/ - биективно); 2) обеспечение коммутативности диаграммы отображения логических моделей информации и ограничений целостности, 3) обеспечение коммутативности диаграммы отображения команд обработки информации одной модели в последовательность команд другой модели.

При формировании пользовательской модели либо модели описания информационных ресурсов в большинстве случаев используется только часть данных из представления исходной модели: переходу из одного элементарного состояния целевой модели в другое соответствует только изменение данных в исходной модели (переход в другое состояние), которые участвуют при формировании представления целевой модели. Данные в представлении исходной модели, не участвующие в формировании целевой, могут изменяться произвольным образом, что не приводит к изменению состояния целевой модели. С другой стороны, в реализации целевой модели могут присутствовать специализированные первичные данные пользователя, отсутствующие в реализации исходной модели, либо в реализации модели описания информационных ресурсов присутствуют данные из другой исходной модели. Изменение этих данных переводит целевую модель в другое элементарное состояние, тогда как состояние исходной модели, соответствующее этим состояниям, будет одно:

Определение 1. Совокупность элементарных состояний одной модели, которым соответствует одно состояние другой модели, будем называть обобщенным состоянием. Причем каждому элементарному состоянию йу модели П соответствует одно и только одно обобщенное состояние модели /7, и наоборот: каждому элементарному состоянию модели соответствует одно и только одно обобщенное состояние (прообраз) модели П. Из определения 1 следуют очевидные свойства:

1) О,, п Ц = 0, О' п С'. =0,1

2) Количество обобщенных состояний исходной модели равно количеству обобщенных состояний целевой модели.

Для доказательства рассмотренных свойств предположим, что какое-либо из них не выполнено. Тогда будет существовать элементарное состояние одной модели, которому соответствует не менее двух обобщенных состояний другой модели, что противоречит определению 1.

Таким образом, требование взаимнооднозначного соответствия состояний исходной и целевой модели сохраняется. Однако это свойство устанавливается для обобщенных состояний, а не для элементарных.

Предположим, что исходная модель ^полностью определена. В отличие от технологии [8], в которой

не предполагается наличие парных алгоритмов, предлагается следующая последовательность шагов при построении отображения исходной модели /2 в целевую £2

1. Формирование схемы целевой модели iY.

2. Разработка алгоритма преобразования представления целевой модели и определение условий его применимости для исходной модели.

3. Определение допустимых состояний для целевой модели.

4. Разработка алгоритма преобразования представления исходной модели.

В данч' jü последовательности шагов, в отличие от [8], нет необходимости в определении образов для каждой операции. Соответствующие преобразования представлений заменяются парными алгоритмами (шаги 2 и 4), что существенно сокращает время на разработку инструментальной среды. Кроме того, отработка каждой операции в уже сгенерированном приложении требует постоянного соединения приложения с источником данных и перехвата прерываний от клавиатуры на компьютере пользователя (даже если он выполняет ошибочные действия), что в совокупности дополнительно загружает операционную среду, и в некоторых системах, например в Microsoft Office, вызывает постоянное мигание экрана на мониторе пользователя. Парные алгоритмы запускаются по инициативе пользователя, что позволяет решить проблемы с перечисленными недостатками.

3. Формирование схемы целевой модели

Формирование схемы предполагает использование языка описания данных (ЯОД) для фиксации состава и структуры логического уровня целевой модели. Во Многом эта проблема решается за счет возможностей выбранной инструментальной системы, в рамках которой предполагается работа с целевой мод'елью. Способы формирования схемы и требования к ней достаточно широко обсуждались в литературе, например [9,10] и т.д. Поэтому в данном разделе достаточно ограничиться указанными ссылками.

4/Алгоритм преобразования представления целевой модели

После построения схемы целевой модели необходимо определить способ формирования представления целевой модели. Для этого предлагается разработка алгоритма построения представления целевой модели А1д, то есть основного алгоритма преобразования сформированного представления исходной модели в первоначально пустое представление целевой модели.

Разработанный алгоритм построения представления целевой модели должен стать основой для построения и обоснования корректности последующих шагов. Следствием этого являются основные требования к алгоритму: 1) наименьшая топологическая сложность алгоритма (в смысле цикло-матической меры Мак-Кейба), 2) однозначность интерпретации его предложений (операторов). Требование вычислительной оптимальности для основного алгоритма должно быть отвергнуто, если оно противоречит предыдущим двум требованиям. Это обусловлено тем, что А1д задает семантику преобразования данных и является основой для обоснования корректности последующих шагов.

Если А1д не является оптимальным с вычислительной точки зрения, то необходимо разработать

более оптимальную версию алгоритма и доказать его эквивалентность основному, Например, в [11] исходному алгоритму A/g достаточно одного просмотра исходной таблицы для формирования представления целевой модели, более оптимальной версии просто не существует. То есть, А1д является линейным по количеству операций ввода-вывода относительно размера исходной таблицы. Другая ситуация в [8], исходный алгоритм является экспоненциальным, поэтому были разработаны квазилинейные алгоритмы преобразования представления целевой модели при выполнении базисных операций над исходной моделью. Была доказана эквивалентность новых алгоритмов исходному.

Для алгоритма A/g, после его построения, необходимо определить область его существования. То есть, не все допустимые состояния исходной модели могут иметь сформированные алгоритмом образы в целевой модели, корректные с точки зрения приложения. Если исходная модель имеет такие состояния, то придется вернуться к первому этапу, и пересмотреть схему целевой модели либо алгоритм А1д.

В качестве входных параметров алгоритма А1д могут быть заданы ограничения пользователя на данные, передаваемые из представления исходной модели в приложение, как это сделано в [6]. Будем такие ограничения называть динамическими и обозначим — L. Таким образом, в принятых обозначениях результат работы алгоритма запишется следующим образом: d'=Alg{d^L).

5,Определение допустимых состояний для целевой модели

Для исходной модели данных £2 может быть задана совокупность ограничений: функциональные и многозначные зависимости, зависимости соединений, ссылочная целостность данных и т.д. [12]. Все они в совокупности определяют допустимые состояния данных и переходы между ними для исходной модели £2. Поскольку алгоритм А1д определяет образы состояний модели /2для модели £У, то соответствующие образы для ограничений на допустимые состояния и переходы также определяются этим алгоритмом. Образы ограничений целостности должны быть достаточными для выполнения исходных ограничений модели £2. То есть для целевой модели £2' могут быть заданы более "жесткие" ограничения, если реализация образов ограничений, являющихся необходимыми и достаточными, является невозможной. В крайнем случае, ограничением целостности будет запрет на модификацию группы данных.

Дополнительные ограничения могут быть получены из семантики приложения. Так, в [6] после структурных преобразований представления данных пользователю запрещено удалять и модифицировать значения координат гиперкубического представления, допустимо только дополнение новых значений. Кроме того, определенная пользователем величина L может ограничить допустимые значения, вводимые в рабочем поле приложения.

6. Алгоритм преобразования представления исходной модели

В процессе работы с моделью £2 пользователь в рабочей области приложения вводит новые данные, удаляет и модифицирует старые. В [11] предполагается. что отслеживается каждое изменение состояния реализации £7. Ранее ужо обсуждались

негативные стороны работы приложения в таком режиме. Предлагается предоставить пользователю возможность самостоятельно инициировать изменение состояния реализации модели £2 после завершения работы с моделью £2'. Такой подход требует разработки алгоритма обратного преобразования данных из пользовательского представления в исходное представление модели £2. Обозначим этот алгоритм — Inv. Входным параметром Inv является состояние представления целевой модели d'tf В отличие от алгоритма А1д для алгоритма inv ограничение I не является входным параметром. Так как при формировании представления в приложении данные, неудовлетворяющие I, отсеиваются алгоритмом А1д, а при работе с приложением — образами ограничений на допустимые состояния целевой модели Р'. Таким образом, в принятых обозначениях результат работы алгоритма запишется следующим образом: d^lnvld^).

Очевидными являются условия, накладываемые на алгоритмы А1д и Inv:

d.^InviAlgldJ) для любых состояний d^eD, и

d'^Algdnvfd'y)) для любых состояний d'tjeD'. Условие коммутативности, используемое в [6,7,8,11] в том числе и для определения образов операций feFn прообразов операций FeF, в данном случае становится не актуальным. Поскольку соответствующие друг другу операции могут быть выражены через алгоритмы A/g и Inv. Для записи соответствующих формализмов заметим, что f и Г являются операторами языков запросов для работы с данными. Причем, результат выполнения оператора зависит от текущего состояния или d'ijt и этот результат будет единственным. Поэтому используем запись операций в виде функций: dlt[=f(dy) и d'lk=r(d'J. Следовательно, образ операции / имеет следующий вид:

ffd'^AIgflnvfffd^f, где d'=Alg(dlfi Соответственно:

ff d^-InvfAIg (F(d'J)),

где d=Inv(d'0).

7. Заключение

Рассмотренный метод построения является развитием метода коммутативных отображений моделей данных [7,8] на случай, когда между состояниями исходной и целевой моделей отсутствует взаимнооднозначное соответствие. Такая ситуация является неизбежной при пос троении целевой модели пользовательского представления данных.

Традиционно ограничения целостности на данные отслеживаются централизованно в СУБД. В предложенном подходе предлагается дублировать эту функцию в пользовательском приложении. Прежде всего, это связано с тем, что схема данных приложения может существенно отличаться от схемы исходной базы данных и, как правило, ограничения целостности могут существенно отличаться от исходных. Если ошибки пользователя диагностировать в терминах исходной базы данных, то эта диагностика не будет понятна. С другой стороны, ограничения целостности исходной базы данных используются для проверки правильности настройки приложений, сформированных по рассмотренной технологии, и для других приложений, использующих другие принципы формирования.

Данная работа является обобщением подхода, предложенного для сильноструктурированных

моделей данных [7,8,11] и делает этот подход пригодным для слабоструктурированных моделей ( 13,14].

Библиографический список

1. Codd E.F., Codd S.B.. Salley С.T. Providing OLAP to UserAnalist: An 1T Mandate. H.F. - Codd & Associates. - 1993.

2. Щавелев Д.В. Способы аналитической обработки данных для поддержки принятия решений / Л.В. Щавелев // СУБД. -1998. - № 4-5. - С. 51 - 60.

3. Армстронг Р. Семь этапов оптимизации производительности хранилища данных / Р Армстронг // Открытые системы. - 2002. - N° 1.

4. ПедерсенТ.Б., Йенсен К.С. Технология многомерных баз данных / Т.Е. Педерсен, К.С. Йенсен // Открытые системы. -2002. -№ 1.

5. Чаудхури С., Дайал У., Гаити В. Технология бал данных в системах поддержки принятия решений / С. Чаудхури, У Дайал,

B. Гаити // Открытые системы. - 2002. ■ № 1.

6. Зыкин C.B. Инструментальные средства разработки приложений для работы с базами данных / C.B. Зыкин // V Междунар. научно-технич. конф. «Динамика систем, механизмов и машин»: Материалы. - Омск:ОмГГУ. - 2004. -

C. 376 - 380.

7 Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных / А. А. Калиниченко. - M.: Наука, 1983. - 423 с.

8. Зыкин C.B. Построение отображения реляционной ба зы данных в списковую модель данных / C.B. Зыкин // Управляющие системы и машины. - 2001. - № 3. - С. 42 63

9. Дейт К. Введение в системы баз данных / К. Дейт. - М.: Диалектика, 1998. - 782 с.

10. Замулин А. В. Типы данных в языках программирования и базах данных / A.B. Зимулин. - i Ьвосибирск. Наука, 1987. -150 с

11. Зыкин C.B. Формирование пользовательского представления реляционной блзы данных с помощью отображений /C.B. Зыкин // программирование. - 1999. - № 3. - С. 70 - 80.

12. Мейер Д. Теорик реакционных баз данных / Д. Мейер. -М.: Мир, 1987 - 608 с.

13. Осипов M А.. М.чульский О.Л., калиниченко Л.А. Отображение модели данных XML в ооъектную модель языка СИНТЕЗ / л I.A. Осипов, О .Л. Мачульский, Л.А. Калиниченко // Программирование - 2000. - N 4. - С. 23 - 30.

14. Новак л.Г., Кузнецов С.Д. Канонические формы схем XML / Л.Г. Новак, С.Д. Кузнецов// Программирование. - 2003. - N 5. - С. 65 - 80

ЗЫКИН Сергей Владимирович, кандидат физико-математических наук, заведующий лабораторией МППИ.

Дата поступления статьи в редакцию: 03.02.ОС г. © Зыкин C.B.

УДК 004.8:004.052.3 В И ПОТАПОВ

Омский государственный технический университет

ИНФОРМАЦИОННЫЕ КРИТЕРИИ ОЦЕНКИ СОСТОЯНИЯ ВОССТАНАВЛИВАЕМОЙ ПОСЛЕ ОТКАЗОВ НЕЙРОКОМПЬЮТЕРНОЙ СИСТЕМЫ

Рассматриваются модели нейрокомпьютерных систем, содержащие восстанавливаемые после отказов нейронов искусственные нейронные сети и устройства автоматического контроля и управления процессом восстановления. Приводятся информационные критерии оценки состояния рассматриваемых нейрокомпьютерных систем.

В работах [1-3] рассматриваются принципы работы и дается аппарат для оценки вероятности безотказной работы и среднего времени «жизни» нейрокомпьютерных систем (НКС) на базе логически стабильных искусственных нейронных сетей (ИНС), адаптивных к отказам и сбоям в процессе выполнения задания. Модели изучаемых нейрокомпьютерных систем включают в состав восстанавливаемую после отказов (адаптивную к отказам) ИНС, устройство контроля состояния нейронной сети и устройство восстановления работоспособного состояния ИНС. При этом полагается, что процесс возникновения внезапных отказов и сбоев в адаптивной ИНС пуассоновский с параметром Х'либо для «стареющих" нейронных сетей, а интенсивность восстановления Ц после отказов ИНС постоянная.

Для оценки состояния НКС в [1-3] составлялась система дифференциальных уравнений Колмогорова, решая которую при соответствующих начальных условиях и ограничениях, можно получить вероятность безотказной работы P(tj нейрокомпьютерной системы и среднее время ее «жизни» Т, а также другие надежностные характеристики, например коэффициент готовности Кг

В развитие положений работ [1-3] будем рассматривать нейрокомпьютерную систему с восстанавливаемой после отказов нейронной сетью как систему автоматического управления [4], а точнее,— автоматизированную систему контроля и управления, где процессом управления, подлежащим автоматизации, является процесс восстановления | после отказов функциональных свойств искус- j

' Работа выполнена при поддержке гранта Президента Российской Федерации МК-7420.2006.8 и гранта РФФИ - проект 06-07-89013-а

i Надоели баннеры? Вы всегда можете отключить рекламу.