Научная статья на тему 'Проектирование хранилища данных для информационно-аналитической системы обеспечения качества подготовки бакалавров'

Проектирование хранилища данных для информационно-аналитической системы обеспечения качества подготовки бакалавров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
274
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ХРАНИЛИЩЕ ДАННЫХ / DATA WAREHOUSE / ИЕРАРХИЯ OLAP-ИЗМЕРЕНИЙ / HIERARCHY OF OLAP-DIMENSIONS / АНАЛИТИЧЕСКАЯ ПЛАТФОРМА DEDUCTOR / ANALYTICAL PLATFORM DEDUCTOR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Артюшина Елена Анатольевна

В статье рассматривается процесс построения реляционного хранилища данных на базе аналитической платформы Deductor с использованием технологии OLAP, входящего в состав системы поддержки принятия решения по результатам выборочного тестирования в ВУЗе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DESIGNING OF A DATA WAREHOUSE FOR INFORMATIONAL ANALYTICAL SYSTEM OF PROVIDING HIGH QUALITY OF BACHELORS’ TRAINING

The article describes the process of creation of relational data warehouse on the basis of the analytical platform Deductor with use of the OLAP-technology, a part of Decision Support System by results of selective testing in higher education institution is considered.

Текст научной работы на тему «Проектирование хранилища данных для информационно-аналитической системы обеспечения качества подготовки бакалавров»

Л.В. Алиева, И.В. Руденко

КРИТЕРИИ И ПОКАЗАТЕЛИ ЭФФЕКТИВНОСТИ ВНЕУЧЕБНОЙ .

CRITERIA AND PERFORMANCE INDICATORS EXTRACURRICULAR ACTIVITIES -INNOVATION UNIT OF EDUCATIONAL SYSTEM OF HIGH SCHOOL

© 2014

L.V. Alieva, Doctor of Education, Professor, Senior Fellow at the Center of the theory of education Institute of Theory and History of Pedagogy RAO, Moscow (Russia) I.V. Rudenko, Doctor of Education, Professor Togliatti State University, Togliatti (Russia)

Annotation: The article discusses the specifics of approaches to evaluating the effectiveness of the educational activities of the university , disclosed the concept of " criterion ", "monitoring" . Comprehensive evaluation of the functioning of the educational system involves organizing systematic monitoring on certain criteria. The authors reveal the contents of the criteria by providing a set of criteria , focusing on the qualitative characteristics of the educational system as a dynamic, evolving . Particular attention is given to extra-curricular activities, which should be , according to the authors , is aimed at forming and development of professional competencies subject position of students. Effectiveness of education is directly related to the development of a subject position of students , innovative education subjects to which the authors refer the student community.

Keywords: educational system, extracurricular activities, performance criteria, monitoring, subject position of the student, the student community as innovative education subjects.

УДК 004.652.4

ПРОЕКТИРОВАНИЕ ХРАНИЛИЩА ДАННЫХ ДЛЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ ОБЕСПЕЧЕНИЯ КАЧЕСТВА ПОДГОТОВКИ БАКАЛАВРОВ

© 2014

Е.А. Артюшина, старший преподаватель кафедры «Вычислительные машины и системы» Пензенский государственный технологический университет, Пенза (Россия)

Аннотация: В статье рассматривается процесс построения реляционного хранилища данных на базе аналитической платформы Deductor с использованием технологии OLAP, входящего в состав системы поддержки принятия решения по результатам выборочного тестирования в ВУЗе.

Ключевые слова: хранилище данных, иерархия OLAP-измерений, аналитическая платформа Deductor.

Постановка проблемы. В настоящее время для выработки управленческих решений все чаще применяются корпоративные аналитические системы, которые входят в совершенно новый класс информационных систем поддержки принятия решения (информационных СППР) и становятся все более востребованными на российском рынке программных продуктов.

В основе управленческих решений, принимаемых внутривузовской системой обеспечения качества подготовки специалистов, лежит статистическая информация о результатах выборочных интернет-аттестаций. Эффективность управления процессом тестирования во многом будет зависеть от эффективности применяемого метода хранения и обработки накопленных данных статистического наблюдения.

Для качественного и всестороннего анализа результатов выборочного тестирования в ВУЗе предлагается создать информационную СППР, основанную на использовании технологии OLAP (Online Analytical Processing) и включающую многомерную БД или хранилище данных.

Хранилище данных (Data Warehouse) - оптимально организованная БД, содержащая данные, агрегированные по многим измерениям, и обеспечивающая максимально быстрый доступ к информации, необходимой для анализа и последующего принятия управленческих решений. Агрегаты (или суммарные показатели) хранятся в явном виде, чтобы ускорить выполнение аналитических запросов. Пополнение хранилища происходит периодически из внешних источников данных, например, из статистических отчетов. В целом, содержимое хранилища предметно ориентировано и инвариантно во времени, данные должны быть интегрированы, а также обладать стабильностью и минимальной избыточностью [1].

Анализ последних исследований и публикаций. Осями многомерной системы координат должны являться основные атрибуты анализируемого управленческого процесса. В качестве одного из измерений обязательна временная ось. В нашем случае, измерения многомерного куба назначим на основании данных, опубликованных

в [2]:

- тестируемые специальности (ось оС);

- тестируемые циклы дисциплин (ось оD);

- периодичность интернет-аттестаций (временная ось оТ);

На пересечениях осей-измерений должны находиться данные, количественно характеризующие процесс -факты.

В соответствии с расчетами, приведенными в [3], генеральная статистическая совокупность представлена следующим образом: на факультете ВУЗа имеется 6 направлений подготовки, общее количество студенческих групп очной формы обучения 56, по каждой образовательных программе в циклах Б1 (гуманитарный, социальный и экономический блок дисциплин), Б2 (математический и естественнонаучный блок), а также в профессиональном цикле Б3 изучается в среднем 42 дисциплины. Для тестирования из генеральной совокупности ежегодно должны выбираться 3 специальности, 2 блока и 5 дисциплин. Межсерийная дисперсия выборки равна 1.2.

Формирование целей статьи. Разработанная многомерная модель ХД представлена на рисунке 1:

Рисунок 1 - Измерения и факты в многомерной модели ХД «Тестирование»

Е.А. Артюшина

ПРОЕКТИРОВАНИЕ ХРАНИЛИЩА ДАННЫХ ...

Центральную роль в OLAP-решении играют иерархии, что собственно и отличает его от обычной реляционной базы данных. Каждое OLAP-измерение строго структурировано на основе соответствующих иерархий, и метаданные определения куба также содержат иерархические уровни.

На основе положений, подробно рассмотренных в [2] и [3], для осуществления статистического контроля качества продукции выделены следующие однородные партии (или единицы статистического наблюдения): специальности, потоки, группы, циклы, дисциплины циклов.

В связи с этим при проектировании структуры многомерного куба используются следующие уровни детализации:

- специальность - группа;

- поток - цикл - дисциплина цикла;

- год - учебный семестр.

Пример иерархии измерений изображен на рисунке 2.

ная модель ХД (рисунок 1) воплощается в схему «снежинки», обеспечивающую максимально эффективную работу с иерархическими измерениями и представленную на рисунке 3.

Рисунок 3 - Схема реляционного хранилища данных (нотация IDEF1X)

Для физической реализации разработанной ROLAP-схемы используется редактор метаданных программы Deductor Studio Academic. При этом для каждого узла метаданных - измерения или его атрибута - задаются идентификатор, метка и тип данных. Например, для измерения «Специальность» это будут Spec_ID, Шифр_ специальности и строковый тип, соответственно. Затем необходимо определить ссылки (или иерархию) измерений, а также установить их связь с центральной таблицей фактов.

Результат разработки семантического слоя хранилища представлен ниже на рисунке 4:

Рисунок 2 - Иерархия измерения «Тестируемые блоки дисциплин»

Исходные данные берутся из нижних уровней иерархий, а затем суммируются для получения значений более высокого уровня. Для того чтобы ускорить процесс перехода на нужный уровень, все просуммированные значения (агрегаты) хранятся непосредственно в кубе.

Вместе с базовой концепцией OLAP существуют 3 типа инструментария:

- OLAP со многими измерениями (Multidimensional OLAP);

- реляционный OLAP (Relational OLAP);

- гибридный OLAP (Hybrid OLAP).

Каждый тип хранения имеет определённые преимущества, хотя есть разногласия в их оценке у разных производителей. В настоящее время большое распространение получили реляционные ХД, которые не требуют от клиентских станций столь значительных вычислительных мощностей, как инструменты MOLAP.

Для реализации ROLAP-решения могут применяться альтернативные программные средства. В первую очередь к ним относятся встроенные аналитические компоненты профессиональных СУБД.

Процесс проектирования хранилища данных для информационно-аналитической системы с использованием компонента Analysis Services, входящего в комплект поставки СУБД Microsoft SQL Server, достаточно подробно описывается в статье, опубликованной в [4].

Целью настоящей работы является построение реляционного хранилища на базе аналитической платформы Deductor от российского разработчика BaseGroup Labs [5, 6]. Данное программное средство изначально ориентировано на обработку многомерных данных и предназначено для создания готовых прикладных решений.

Основной материал исследования. К основным этапам разработки ХД Deductor Warehouse относят:

1. проектирование многомерной структуры хранилища;

2. формирование ROLAP-схемы «снежинка»;

3. построение сценария загрузки внешних данных.

На логическом уровне полученная ранее многомер-

Г 1"1 # - d

IJ ггье кт Имя

Ql Тестирование Statist A

ЦЁП Кубы

|рДПП1 Процессы

В- Ш Тестирование Test

Атрибуты

В Ц] Измерения

Группа.Номер ab GroupJD

Дисциплина.Шифр ■ab DisciplJD

¡Ü Семестр ab SemesterJD = :

Ó 12] Факты

[íol Число дисциплин 12 Count_Discipl

Число групп 12 Count_Group

1 Ы fin Измерения

В- tii+ Специальность.Шифр ab SpecJD

В ТкГ] Атрибуты

►ф Специальность.Наименование ab Spec_Name

fu] Измерения -l

В-ti Группа.Номер ab GroupJD

[►S] Атрибуты

В ® Измерения

Специальность.Шифр ab SpecJD =J

Рисунок 4 - Семантический слой ХД «Тестирование»

Следующим важным этапом является загрузка внешних данных в ХД. Источниками данных в образовательной версии аналитической платформы Deductor Academic могут служить текстовые файлы (*.txt) и файлы СУБД Firebird (*.gdb). В нашем случае статистические данные о результатах выборочных интернет-аттестаций получены в отделе менеджмента качества образования и хранятся в структурированном виде в нескольких текстовых файлах.

Сценарий первоначальной загрузки (или же пополнения) данных имеет древовидную форму, его узлами является следующая последовательность операций [5]:

1. импорт данных из внешних источников;

2. экспорт данных в измерения с атрибутами, обяза-

Е.А. Артюшина

ПРОЕКТИРОВАНИЕ ХРАНИЛИЩА ДАННЫХ ...

на-

тельно начиная с самого верхнего уровня иерархии, пример, с измерения «Специальность»;

3. экспорт данных в процесс «Тестирование». Фрагмент полученного сценария загрузки, хранящегося в файле проекта Load.ded, изображен на рисунке 5.

Рисунок 5 - Панель сценариев для ХД «Тестирование»

На заключительном этапе с помощью мастера визуализаций создается сценарий получения данных из Хд Deductor Warehouse и формируются OLAP-отчеты. Результаты визуализации представляются в виде трехмерных таблиц, в заголовках строк и столбцов которых содержатся аналитические признаки (срезы данных) с вложенной группировкой, а в ячейках таблиц - суммарные показатели отчета.

Выводы и перспективы дальнейших исследований. Спроектирована многомерная модель представления данных для СППР, обеспечивающей выработку планов внутривузовского тестирования в целях повышения качества подготовки бакалавров. Рассмотрены альтернативные возможности для реализации многомерной модели.

Полученная метаструктура реализована на базе ана-

литической платформы Deductor Academic. Разработаны сценарии загрузки накопленных статистических данных в реляционное ХД "Тестирование".

Результаты исследований являются основой для последующего анализа и визуализации данных из хранилища.

СПИСОК ЛИТЕРАТУРЫ

1. OLAP и бизнес-аналитика: [Электронный ресурс]. 2001-2014. URL: http://www.olap.ru.

2. Артюшина Е. А., Бершадская E. Г., Бершадский А. М. Использование статистических методов при планировании внутривузовского тестирования // Информационные технологии в науке, социологии, экономике и бизнесе: Сборник трудов XXXIV международной конференции. - Приложение к журналу «Открытое образование», 2008. С. 2б-28.

3. Артюшина Е. А., Бершадская E. Г. Методологические аспекты применения математической статистики для прогнозирования результатов интернет-аттестаций студентов // Открытое образование: Научно-практический журнал - М.:МЭСИ, 2010. №б (83). С.4-8.

4. Борисова Ю. М., Артюшина Е. А. Проектирование информационно-аналитической системы на базе OLAP-средств Analysis Services // Современные методы и средства обработки пространственно-временных сигналов: Сборник статей XII Всероссийской научно-технической конференции. - Пенза: Приволжский Дом знаний, 2014. С. 20б-210.

5. Паклин Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям: Учебное пособие. 2-ое изд., испр. -СПб.: Питер, 2013. 704 с.

6. BaseGroup Labs. Технологии анализа данных: [Электронный ресурс]. 1995-2014. URL: http://www. basegroup.ru.

THE DESIGNING OF A DATA WAREHOUSE FOR INFORMATIONAL ANALYTICAL SYSTEM OF PROVIDING HIGH QUALITY OF BACHELORS' TRAINING

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

© 2014

E.A. Artyushina, assistant professor of the chair «Computers and systems» Penza State Technological University, Penza (Russia)

Annotation: The article describes the process of creation of relational data warehouse on the basis of the analytical platform Deductor with use of the OLAP-technology, a part of Decision Support System by results of selective testing in higher education institution is considered.

Keywords: data warehouse, hierarchy of OLAP-dimensions, analytical platform Deductor.

УДК: 378.14

ФОРМИРОВАНИЕ НЕПРЕРЫВНОГО И МНОГОУРОВНЕВОГО ТЕХНИЧЕСКОГО ОБРАЗОВАНИЯ

© 2014

Н.П. Бахарев, доктор педагогических наук, профессор кафедры «Сервис технических и технологических систем» Поволжский государственный университет сервиса, Тольятти (Россия)

Аннотация: В статье рассматриваются теория и модели построения образовательного процесса подготовки технических специалистов, которые отличаются от традиционной схемы последовательно-параллельным построением фундаментальных и специальных дисциплин на основе междисциплинарности и мультидисциплинарности.

Ключевые слова: инверсное фундаментальное образование, техническое образование, техническая креативность, многоуровневое профессиональное обучение, трансдисциплинарность, мультидисциплинарность, энтропия, развитие.

At the World conference of UNESCO which was taking place in Paris in July, 2009, it was noted that education is the most important support of human rights, the democracies, a sustainable development of the world and therefore has to become available to those who wishes to study throughout all the life. Coordination and cooperation between various levels and the education directions are necessary for implementation of this requirement, especially between average (full) the general, initial, average and the highest professional, and also between schools, lyceums, colleges and universities.

Ensuring equal access to the higher education has to be based on strengthening of its communications with other steps of education, especially with an average. The higher education in this case is considered as a component of system which originates in preschool and primary education and includes all intermediate steps which «passing» has to be irrespective of time and age so that education was continued so much time, how many it is required being trained.

The role of the leader of transformation and development of all education system is assigned to higher educational institutions for the successful solution of this problem. In this

i Надоели баннеры? Вы всегда можете отключить рекламу.