УДК 681.3.016
МОДЕЛИРОВАНИЕ АНАЛИТИЧЕСКИХ ИЗМЕРЕНИЙ В МНОГОМЕРНЫХ БАЗАХ ДАННЫХ А.В.Висков1, М.Б.Фомин2
1Лаборатория новых информационных технологий (ЛАНИТ), 105066, г. Москва, ул. Доброслободская, 5. 2Российский университет дружбы народов, 117198, г. Москва, ул. Миклухо-Маклая, 6.
Рассматриваются вопросы моделирования аналитических измерений в многомерных базах данных, приводится формальное определение аналитического измерения, исходя из анализа которого сформулированы и доказаны некоторые его свойства. Ил. 5. Библиогр. 3 назв.
Ключевые слова: многомерные модели данных; аналитическое измерение; OLAP система.
MODELING OF ANALYTICAL DIMENSIONS IN MULTIDIMENSIONAL DATABASES A.V. Viskov, M.B. Fomin
Laboratory of New Information Technologies (LANIT),
5 Dobroslobodskaya St., Moscow, 105066. Peoples' Friendship University of Russia,
6 Miklukho-Maklay St., Moscow, 117198.
The paper deals with modeling of analytical dimensions in multidimensional databases. It proposes a formal definition for the analytical dimension, whose analysis enabled to formulate and prove some of its properties. 5 figures. 3 sources.
Key words: multidimensional data models; analytical dimension; OLAP system.
Введение. Анализ многомерных данных, как правило, производится в привязке к конкретному информационному контексту, определяемому предметной областью. Точка зрения на анализируемые данные задается аналитическими измерениями - сущностями предметной области, от которых зависит предмет анализа. Аналитическое измерение (далее просто измерение) состоит из множества объектов (называемых членами измерений) одного или нескольких типов, обеспечивающих информационный контекст анализируемых данных.
Определение измерения. Измерение включает объекты, представляющие различную степень детализации анализируемых данных. Совокупность элементов, обозначающая одну и ту же степень детализации, образовывает уровень измерения. Уровни показывают, как элементы измерения группируются для применения агрегационных функций. Связи, определенные между элементами на разных уровнях агрегации, являются композицией.
Таким образом, измерение можно определить как связный ориентированный граф. Каждая вершина в этом графе соответствует уровню агрегации, а дуга показывает, что каждый элемент уровня, определяющего конец дуги, декомпозируется на множество элементов нижележащего уровня, соответствующего началу дуги.
Рис. 1. Пример измерения
Свойства измерений. Как показано на рис. 2, можно выделить три различных, не зависящих от области применения типа отношений «часть-целое», определяемых составной структурой целого. Выделяется три типа структуры целого:
1) масса - в случае отсутствия определенной структуры целого, считающегося гомогенным (например, кучка риса);
2) коллекция - в случае, когда рассматриваются различные элементы целого, имеющего однородную составную структуру (например, колонна грузовиков);
3) комплекс - в случае, когда различные части целого выполняют различные роли, а целое является комплексом с гетерогенной составной структурой (например, части двигателя).
1 Висков Алексей Валерьевич, кандидат физико-математических наук, ведущий системный аналитик департамента корпоративных систем, тел.: (903) 7402993, e-mail: [email protected]
Viskov Aleksei, Candidate of Physical and Mathematical Sciences, Leading System Analyst of the Corporate Systems Department, tel.: (903) 7402993, e-mail: [email protected]
2Фомин Максим Борисович, кандидат физико-математических наук, доцент кафедры информационных технологий, тел.: (903) 7403001, e-mail: [email protected].
Fomin Maxim, Candidate of Physical and Mathematical Sciences, Associate Professor of the Department of Information Technologies, tel.: (903) 7403001, e-mail: [email protected]
Масса (гомогенная)
Ц
Коллекция (однородная)
Ц
Комплекс
(гетерогенный) Ц
Обьем
Ч Ч Ч Элементы
Ч2 Ч3 Ч4 Ч5 Компоненты
Ц - Целое Ч - Часть
Р - Роль
Рис. 2. Типы целого
Главная цель определения связей между различными сущностями измерения состоит в том, чтобы показать, каким образом могут применяться агрегаци-онные функции (такие как сумма, минимум, максимум, среднее и т.д.). Так как эти функции рассматривают элементы измерения как играющие в агрегации одну и ту же роль, то эти связи должны рассматриваться как коллекция. С этого момента отношения «часть-целое» между уровнями агрегации в измерении должны пониматься как образующие коллекцию.
В случае рассмотрения коллекции для описания и обоснования свойств целого, а также связей между составляющими элементами можно использовать аксиоматику классической экстенсиональной мереоло-гии [1].
1) Существование. Если А является частью В, то и А и В существуют.
2) Асимметричность. Если А является частью В, то В не является частью А.
3) Транзитивность. Если А является частью В и В является частью С, то А является частью С.
4) Дополнение. Если А является некоторой частью В, тогда существует другой субъект С, который является оставшейся частью В.
5) Экстенсиональность. А и В состоят из одних и тех же частей тогда и только тогда, когда А и В совпадают.
6) Сумма. Для любых двух субъектов всегда найдется составленный из них третий субъект.
Исходя из определения и аксиом мереологии, можно вывести некоторые свойства измерений.
Свойство 1. Измерение не содержит циклов.
Доказательство. Предположим, что в графе измерения есть цикл. В цикле участвуют хотя бы два уровня. По аксиоме 3 (транзитивность) элемент А одного уровня есть часть элемента В другого уровня и наоборот. Получаем противоречие с аксиомой 2. Значит предположение неверно.
Свойство 2. Для каждого измерения существует единственный атомарный уровень агрегации, содержащий элементарные сущности, которые не могут быть разделены на более мелкие части.
Доказательство. По свойству 1 существует как минимум один уровень, элементы которого не содержат частей.
Если существует более одного атомарного уровня, то, ввиду того что граф измерения связный и учитывая аксиому 3, будет существовать элемент Е, который является композицией элементарных сущностей каждого из атомарных уровней. По аксиоме 5 все коллекции элементарных сущностей, составляющих Е, должны являться одной и той же коллекцией элементов. Таким образом, существует только один атомарный уровень.
Свойство 3. Для любого измерения может существовать уровень «Все», содержащий элементы, составленные всеми элементарными сущностями измерения. Если такой уровень существует то:
1) его элементы не являются частями никакого другого уровня агрегации;
2) этот уровень агрегации содержит в точности один элемент;
3) этот уровень единственный в измерении.
Доказательство. Последовательно применяя аксиому 6, можно построить элемент Е, состоящий из всех элементарных сущностей измерения.
1) Если Е будет являться частью некоторого элемента Е', то по аксиоме 4 будет существовать элементарная сущность, не входящая в Е, что противоречит предположению. Поэтому Е принадлежит уровню, элементы которого не являются частью никакого другого уровня в измерении.
2) Если этот уровень будет содержать два элемента и оба элемента содержат все элементарные сущности, то, согласно аксиоме 5, они будут являться одним и тем же элементом.
3) Этот уровень единственный, потому что если бы существовал другой уровень, элементы которого включают все элементарные сущности, то они бы совпадали с элементом, имеющемся на уровне «Все» (по аксиоме 5).
Свойство 4. Те уровни, элементы которых не являются коллекцией элементов любого другого уровня (т.е. не являются началом дуги в графе), могут быть связаны некоторым ребром с уровнем «Все».
Доказательство. Элемент уровня «Все» может быть разложен на сущности любого уровня, покрывающие атомарный уровень. Если существует уровень, не покрывающий атомарный уровень, то, согласно аксиоме 6, к его элементам могут быть добавлены
Ч
Ч
Ч
новые элементы, составленные из коллекций недостающих элементов атомарного уровня.
Свойство 5. Каждый элемент уровня, не являющегося атомарным, содержит как минимум одну часть.
Доказательство. Сущности, не включающие части, являются элементарными, а все элементарные сущности, согласно свойству 2, располагаются на атомарном уровне.
Свойство 6. Каждый элемент уровня, не являющегося атомарным, может иметь более чем одну часть.
Доказательство. Согласно аксиоме 4, если элемент включает часть, то найдется другой элемент, являющийся оставшейся частью исходного элемента.
Свойство 7. Элемент может являться частью нескольких коллекций в одно и то же время.
Доказательство. Не существует мереологической
Товары
ного целого, так и нескольких. Следует отметить, что если элемент нижележащего уровня может являться частью только одного элемента вышележащего уровня, то в таком случае он обязательно входит в состав некоторого элемента вышележащего уровня, если же множества разложений элементов могут пересекаться, то, вообще говоря, элемент нижележащего уровня может и не входить в элемент вышележащего уровня. Однако, учитывая аксиому 6, которая свидетельствует о том, что для любой части всегда можно определить целое, получаем, что в случае необходимости всегда можно доопределить элемент вышележащего уровня, который будет включать рассматриваемый элемент нижележащего уровня. Это означает, что элемент нижележащего уровня всегда включается как минимум в один элемент вышележащего уровня в соответствующей иерархии.
Типы
Семейства
Рис. 3. Пример образования целого с пересечением
аксиомы, запрещающей, чтобы элемент являлся частью нескольких коллекций. В качестве доказательства можно рассмотреть пример. Как показано на рис. 3, заданный товар (на уровне «товаров») может принадлежать двум различным видам товаров на уровне «видов товаров». Такое допущение не создает каких-либо концептуальных проблем, однако может являться причиной возникновения вычислительных сложностей. Так, например, некоторые вычисляемые атрибуты сущностей на уровне «семейство» (которые состоят из элементов уровня «виды товаров») должны рассчитываться на основании элементов на уровне «товар» (например, размерность множества разложения элемента подарки - уровень «семейство товаров» -не равна сумме размерностей множеств разложений элементов сладости и игрушки - уровень «типы товаров»: сагё(подарки) ф сагё(сладости ) + сагё(игрушки)).
Исходя из определения измерения и согласно свойствам 1 и 2 можно сделать вывод, что в общем случае граф уровней агрегации измерения образует полусеть. Кроме того, свойства 3 и 4 показывают, что в графе измерений для того чтобы получить сеть, всегда можно определить уровень «Все». Свойства 5 и 6 показывают, что отношение между двумя уровнями будет включать 1...Ы частей для каждого целого. То есть для каждого элемента на вышележащем уровне всегда можно определить его разложение на нижележащем уровне в соответствующей иерархии. Свойство 7 поясняет, что часть может входить в состав как од-
На рис. 4 показаны допустимые кардинальные отношения между элементами уровней в агрегационных иерархиях. Можно выделить два вида отношений таких, что каждому целому будет принадлежать хотя бы одна часть. В наиболее распространенном случае оказывается, что существует в точности одно целое для каждой части. Однако также возможно, что определенная часть принадлежит нескольким целым. В таком случае, если найдется часть, которая не принадлежит ни одному целому, всегда могут быть построены целые, так что каждая часть будет принадлежать хотя бы одному целому.
Кроме отношений «часть-целое» между элементами измерения можно выделить связи, являющиеся ассоциациями. Такой тип связи используется для того, чтобы показать, что одна сущность описывает некоторое свойство другой сущности. Все сущности в измерении будут связаны с некоторыми другими сущностями, так как они являются их частями, либо для того, чтобы показать некоторые их свойства.
Отношение «часть-целое» показывает, как различные элементы группируются вместе в измерении, тогда как ассоциация показывает, какие характеристики доступны для построения выборок сущностей. Таким образом, операции «подъём» («roll-up») и «спуск» («drill-down») будут выполняться вдоль связей «часть-целое» (по иерархии), тогда как выбор элементов («slice-dice») будет выполняться в соответствии с отношениями ассоциации.
Рис. 4. Возможные кардинальные отношения между элементами уровней в иерархии измерения
Специализация - это одно из наиболее важных отношений, которое должно быть показано на многомерной схеме [2, 3]. Изолированные уровни агрегации не могут быть специализированы для отображения более специфичных аспектов, они должны рассматриваться в рамках измерения.
Свойство 8. В общем случае, уровень и его специализация могут не принадлежать одному и тому же измерению.
Доказательство. Предположим, что и уровень Ц и его специализация Ц находятся в одном измерении. Для того чтобы определить полусеть с уровнем «Все», возможно, потребуется добавить на уровне Ц некоторые элементы, так как в таком случае Ц должен покрывать атомарный уровень. Эти элементы могут не удовлетворять критерию специализации. Поэтому не всегда возможно обеспечить принадлежность обоих уровней одному измерению.
На рис. 5 приведен пример, когда измерение «Люди» специализировано в виде измерения «Продавцы» на уровне «Профессия» (сплошная непрерывная стрелка). Это специализированное измерение содержит уровень, элементами которого являются все люди, являющиеся продавцами, и еще один уровень с единственным элементом (который является сущностью «Профессии»), представляющим собой множество всех продавцов. Разрывная линия показывает, что уровень является специализацией другого (элемент уровня «Все» измерения «Продавцы» является сущностью «Профессии» в случае, когда выполняется критерий специализации «Профессия = 'Продавец'»). Уровень «Возрастная Группа» для измерения «Продавцы» не рассматривается. Следует отметить, что если бы такой уровень в измерении «Продавцы» рассматривался, то он бы не являлся специализацией
соответствующего уровня в измерении «Люди», так как его элементы отличались бы от элементов на уровне «Возрастная Группа» в измерении «Люди» (они включали бы меньше людей).
Обобщая пример, можно сказать, что если Ds -это специализация измерения D на уровне Ц то в этом случае Ds включает, по меньшей мере, уровень Ц (специализацию уровня L) и специализации каждого из уровней в D, содержащих часть элементов Ц. Эти специализированные уровни содержат в точности те элементы соответствующих уровней из D, которые являются любой частью элемента Ц. Кроме этих обязательных уровней, в Ds также, возможно, включаются и другие уровни (которые не являются специализацией каких-либо уровней в D), элементы которых не содержатся в D.
Специализации измерения предоставляет возможность показать специфику отношения «часть-целое» для некоторого подмножества элементов измерения, а также выделить общие для этого подмножества атрибуты. Все сущности некоторого уровня имеют общие свойства, так как уровень определяет заданный класс объектов, выполняющих одну и ту же роль в коллекции. Отношение ассоциация, так же как и агрегации, наследует в рамках специализации. Таким образом, отношение специализации имеет большое значение в вопросе повторного использования измерений.
Рассматриваемые семантические особенности отношения специализации важны не только для конечных пользователей - аналитиков, они позволяют также оптимизировать запросы и повышать их производительность, позволяя, например, осуществлять параллельные вычисления по разным специализациям измерения.
Рис. 5. Пример определения специализации
Заключение. В работе были рассмотрены и доказаны свойства аналитических измерений. Рассуждения основывались на мереологических аксиомах. Кроме описания связей между элементами одного измерения, были разобраны возможные виды отношений между различными измерениями как одной
схемы данных, так и разных. Рассмотренный способ описания измерений и вытекающие из него свойства могут быть полезны для построения модели предметной области и позволят разработчикам информационных систем более чётко проводить классификацию и группировку данных.
Библиографический список
1. Gerstl P., Pribbenow S. Midwinters, end games, and body parts: A classification of part-whole relations // International Journal of Human-Computer Studies. 1995. V. 43, № 5. P. 865889.
2. Trujillo J., Palomar M., Gomez J. Applying Object-Oriented Conceptual Modeling Techniques to the Design of Multidimensional Databases and OLAP applications // In Proceedings of the
1st International Conference on Web-Age Information Management. Springer, 2000. P. 83-94.
3. Tryfona N., Busborg F., Christiansen J. A conceptual model for data warehouse design // In Proceedings of the 2nd International Workshop on Data Warehousing and OLAP - DOLAP 99. ACM, 1999. P. 3-8.
УДК 004.891.2
ИСПОЛЬЗОВАНИЕ НЕЧЕТКОЙ ЛОГИКИ ДЛЯ ОЦЕНКИ ЭФФЕКТИВНОСТИ МАТЕРИАЛА, ПРИМЕНЯЕМОГО ПРИ ИЗГОТОВЛЕНИИ СОСУДОВ ДАВЛЕНИЯ
л
Минь Нгуен Данг1
Иркутский государственный технический университет, 664074, г. Иркутск, ул. Лермонтова, 83.
Математическая теория нечетких множеств, предложенная Л.Заде более четверти века назад, позволяет описывать нечеткие понятия и знания, оперировать этими знаниями и делать нечеткие выводы. На этой теории основаны методы построения системы нечеткого вывода, позволяющие разрабатывать экспертную систему и проводить на ней исследования. В работе рассматривается использование методов нечеткой логики для создания экспертной системы оценки эффективности материала, применяемого при изготовлении сосудов давления. Сравнение полученных результатов с результатами других классических методов выбора материала показывает преимущества системы нечеткого вывода. Ил. 7. Табл. 3. Библиогр. 7 назв.
Ключевые слова: нечеткий вывод; экспертная система; оценка эффективности материала.
USING FUZZY LOGIC FOR EVALUATING THE EFFECTIVENESS OF MATERIAL USED IN PRESSURE VESSEL
MANUFACTURING
Minh Nguyen Dang
Irkutsk State Technical University, 83 Lermontov St., Irkutsk, 664074.
The mathematical theory of fuzzy sets, proposed by L. Zadeh more than a quarter of a century ago, allows to describe fuzzy concepts and knowledge, to operate this knowledge, and make fuzzy inferences. This theory serves the basis for the methods to construct a fuzzy inference system. They allow to develop an expert system and conduct investigations on it. The article discusses the application of fuzzy logic methods to create the expert system evaluating the effectiveness of the material used in pressure vessels manufacturing. Comparison of the obtained results with those of other classical method for material selection shows the advantages of the fuzzy inference system. 7 figures. 3 tables. 7 sources.
Key words: fuzzy inference; expert system; assessment of material effectiveness.
Введение. Можно сказать, что плохих материалов не бывает, а бывают плохие инженеры, применяющие не те материалы, которые следовало бы использовать в данных конкретных условиях эксплуатации [3]. Следствием неправильного выбора материалов является плохое качество конструкций, машин и оборудования. В работе рассматривается применение методов нечеткой логики для оценки эффективности материалов. Дается сравнительный анализ применения методов нечеткой логики и weight properties.
Постановка задачи. При выборе материала для сосудов давления необходимо оценить влияние комплекса необходимых свойств материала, обеспечивающих надежную и долговечную работу оборудования в заданных условиях эксплуатации. Так как конструкционные материалы характеризуются механическими, физико-химическими и технологическими свойствами, то рассматривать необходимо всю гамму свойств. Заметим, что цена материала играет существенную роль в процессе изготовления изделия, однако цены мате-
1Минь Нгуен Данг, аспирант, тел.: 89247045898, e-mail: [email protected] Minh Nguyen Dang, Postgraduate, tel.: 89247045898, e-mail: soldier.85 @ mail.ru