Научная статья на тему 'Коэффициент книгообеспеченности как критерий многомерного ана Лиза обеспеченности учебного процесса'

Коэффициент книгообеспеченности как критерий многомерного ана Лиза обеспеченности учебного процесса Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
612
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОНИТОРИНГ / КАЧЕСТВО ОБРАЗОВАНИЯ / КНИГООБЕСПЕЧЕННОСТЬ / OLAP-ТЕХНОЛОГИИ / ХРАНИЛИЩЕ ДАННЫХ / БИЗНЕС-АНАЛИТИКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фомичева Светлана Григорьевна, Попкова Алла Алексеевна

Рассмотрена система внутреннего мониторинга информационно-образовательных ресурсов вуза, с помощью которой формируются сводные отчёты по книгообеспеченности. Приведена структура многомерной БД, являющейся хранилищем информации, и структура витрины данных, поверх которой был построен гиперкуб и необходимые меры для расчёта книгообеспеченностиI

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фомичева Светлана Григорьевна, Попкова Алла Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n article is considered system of the internal monitoring information-educational resource of the high school, by means of which are formed consolidated reports on provision of books. The Broughted structure multivariate BD, which is warehouse, and structure of the data mart, over which was built multi-dimensional cube and necessary measures for calculation provision of books

Текст научной работы на тему «Коэффициент книгообеспеченности как критерий многомерного ана Лиза обеспеченности учебного процесса»



УДК 004.67

С.Г. Фомичева, А.А. Попкова

коэффициент книгообеспеченности как критерий многомерного анализа обеспеченности учебного процесса

Сетевые информационные ресурсы в сочетании с традиционными ресурсами обеспечивают современной вузовской библиотеке роль информационно-образовательного центра. Несомненно, качество образования напрямую зависит от качества учебно-методических и научных фондов образовательного учреждения. В связи с этим для многих вузов РФ становится актуальной задача непрерывного мониторинга уровня информационно-библиотечного обеспечения учебного процесса и обоснованности рационального использования аппаратно-программных и людских ресурсов вуза для комплектования соответствующих фондов в контексте системы качества образовательного учреждения.

При комплектовании фонда библиотека вуза руководствуется нормативными документами, которые являются определяющими критериями для оценки соответствующих учебных заведений при их лицензировании, аккредитации и аттестации. Следует отметить, что многие вузы РФ обладают достаточно обширной базой электронных внутривузовских изданий, включая статьи, учебные пособия, методические указания и т. д. При этом доля электронных изданий по отношению к традиционным существенно возрастает из года в год, а механизмы их учёта при подсчёте книгообеспеченности либо не автоматизированы, либо не интегрированы с системой учёта твердых копий изданий.

Если в большинстве высших учебных заведений применяются информационные системы, позволяющие вести автоматизированный учёт бумажных и собственных электронных изданий, то системы принятия решений о необходимости переукомплектования учебно-ме-

тодического фонда в основном отсутствуют. Это приводит к существенным задержкам при формировании заказов на закупку литературы, необоснованным затратам на покупку неактуальных или невостребованных изданий, а также завышенному штатному составу библиотечных работников. Следовательно, разработка системы поддержки принятия решений при управлении современной библиотекой вуза и системы непрерывного оперативного мониторинга информационно-библиотечного фонда вуза весьма актуальна.

Отметим, что между системами учёта и системами принятия решений имеются существенные отличия как в структурах данных, так и способах доступа к ним. Поэтому возникает необходимость в разработке методов интеграции данных из различных реляционных структур баз данных вузов в единую многомерную структуру БД, системы бизнес-правил для быстрого и гибкого формирования необходимых сводных аналитических отчётов.

В данной статье рассматриваются решения по созданию рациональной многомерной структуры хранилища данных, представляющего основу для системы мониторинга информационно-библиотечных фондов вузов РФ, которая может быть интегрирована в систему качества образовательного учреждения. В качестве одного из базовых критериев деятельности библиотеки образовательного учреждения анализируется коэффициент книгообеспеченности фонда в различных иерархических срезах, определяется степень его агрегации, а также влияние степени агрегации на скорость выполнения запросов при различных ограничениях на объёмы дискового пространства.

Обоснование необходимости

проектирования хранилищ данных в вузе

Реформирование системы образования РФ приводит к необходимости совершенствования целой совокупности взаимосвязанных процессов управления вузом и сопровождения образовательной деятельности. Систематизация и формализация данных процессов в современном вузе, будучи сложной научно-технической задачей, при правильных решениях реализуется в виде эффективно функционирующей системы качества образовательного учреждения (СК ОУ). В свою очередь, система качества ориентирована на обеспечение реализации стандартов внутренней гарантии качества и предоставления объективной отчетности о качестве предоставляемых образовательных и иных услуг всем заинтересованным сторонам, в том числе при лицензировании, аккредитации и аттестации. По своему основному назначению система качества представляет собой аналитическую систему, поэтому структура ее данных должна быть оптимизирована для операций оперативного анализа. При системном подходе к управлению вузом информационно-библиотечные фонды не могут существовать изолированно от системы качества вуза, следовательно, автоматизированные информационно-библиотечные системы (АИБС) должны быть рационально интегрированы в единое хранилище данных (Data Warehouse) системы качества вуза. Отметим, что процесс "Библиотечное и информационное обслуживание" в типовой модели системы качества входит в инвариантное ядро, отнесен к основным (бизнес-процессам) и тесно связан с процессами "Управление информационной средой", "Управление ресурсами ОУ (управление инфраструктурой, образовательной и производственной средой)", "Редакционно-издательская деятельность", "Управление закупками", со всеми процессами "Деятельность руководства ОУ" и "Основные процессы ОУ". В частности, в процессе эксплуатации системы качества в ГОУВПО "Норильский индустриальный институт" по фактам представленного в

данной статье многомерного куба производится более двухсот запросов в месяц.

Отметим, что наиболее популярные на данный момент АИБС, используемые в вузах России, являются транзакционными (OLTP) системами (табл. 1), которые не адаптированы для реализации аналитических функций.

Для системы поддержки принятия решений требуются хронологические данные - факты за определенные интервалы времени. В OLTP-си-стемах истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной транзакции. Важное отличие OLAP от OLTP-систем заключается в том, что данные в них сохраняют свою истинность в любой момент процесса чтения. В самом простом варианте для хранилищ данных используется та модель, которая лежит в основе транзакционной системы. Если, как это часто бывает, транзакционная система функционирует на реляционной СУБД (Oracle, Informix, Sybase, MS SQL Server, Post-grees и т. п.), самой сложной задачей становится выполнение запросов ad-hoc, поскольку невозможно заранее оптимизировать структуру БД так, чтобы все запросы работали эффективно.

Разработка единого корпоративного хранилища - долгий и дорогостоящий процесс. Это обусловлено как организационными, так и техническими причинами: информационная структура вузов, как правило, очень сложна, и руководство часто плохо понимает специфику происходящих бизнес-процессов; технология принятия решений ориентирована на существующие технические возможности и с трудом поддаётся изменениям; может возникнуть необходимость в частичном изменении организационной структуры вуза; требуются значительные инвестиции до того, как проект начнёт окупаться; как правило, требуется значительная модификация существующей технической базы; освоение новых технологий и программных продуктов сотрудниками вуза может потребовать много времени; на этапе разработки бывает трудно наладить взаимодействие между разработчиками и будущими пользователями хранилища. Поэтому в данном случае рациональным может стать подход формирования витрин данных.

Таблица 1

Обзор автоматизированных информационно-библиотечных систем, используемых в образовательных учреждениях РФ

Название АИБС Автоматизированные функции СУБД Пользователи АИБС Интеграция с СК ОУ

Буки (ООО "Рикс Хаус", г. Ярославль) 1. Модуль каталогизации. 2. Модуль инвентарного учёта. 3. Модуль абонемента и работы с читателем. 4. Модуль книгообеспеченности для библиотек вузов. 5. Модуль поиска данных через www. 6. Модуль администратора SyBase ASE 12.5 и DBF-формат (архитектура файл-сервер) 10 ОУ и 3 библиотеки Отсутствует

ИРБИС (ГПНТБ РФ, г. Красноярск) 1. Модуль каталогизации. 2. Модуль комплектования. 3. Модуль абонемента и работы с читателем. 4. Модуль администратора DBF-формат (архитектура файл-сервер) 15 ОУ Отсутствует

Библиотека 5.4 (ООО "Библиотечная компьютерная сеть", Москва) 1. Модуль каталогизации. 2. Модуль комплектования. 3. Модуль инвентарного учёта. 4. Модуль абонемента и работы с читателем. 5. Модуль поиска и загрузки данных через www DBF-формат (архитектура файл-сервер) 49 ОУ и 27 различных организаций Отсутствует

Руслан (компания "Открытые библиотечные системы", Санкт-Петербург) 1. Модуль каталогизации. 2. Модуль комплектования. 3. Модуль инвентарного учёта. 4. Модуль абонемента и работы с читателем. 5. Модуль поиска и заказа документа в электронном каталоге через www. 6. Модуль книгообеспеченности Oracle (архитектура клиент-сервер) 43 вуза и 18 библиотек Предлагаются решения интеграции данных с системой управления вузом

МАРК SQL (НПО "Информ-система", Москва) 1. Модуль каталогизации и картотеки статей. 2. Модуль комплектования и заказа периодики. 3. Модуль инвентарного учёта. 4. Модуль абонемента и работы с читателем (с поддержкой штрих-кодирования). 5. Модуль администратора. 6. Модуль книгообеспеченности. 7. Модуль поиска Поддерживает реляционную модель БД и структурированные SQL-запросы, таких фирм как Microsoft, Sybase, Oracle, и др. 800 библиотек России и СНГ Отсутствуют

КАИБС (Компания "Kazakh Soft", г. Алмата) 1. Модуль администрирвания. 2. Модуль комплектования и заказа периодики. 3. Модуль каталогизации и картотеки статей. 4. Модуль абонемента и работы с читателем (с поддержкой штрих-кодирования). 5. Модуль электронной библиотеки полнотекстовых ресурсов. 6. Модуль книгообеспеченности учебного процесса. 7. Модуль BookScan - создание электронных версий отсканированных книг. 8. Web-модуль поиска DBF-формат (архитектура файл-сервер) 27 вузов, 82 библиотеки, 23 колледжа и лицея, 179 школ Отсутствует

МИБС (г. Томск) 1. Модуль абонемента и работы с читателем 2. Модуль Internet поиска. 3. Модуль каталогизации Postgrees 25 библиотек и 7 различных организаций Отсутствует

Под витриной данных (ВД) понимается специализированное хранилище, обслуживающее одно из направлений деятельности вуза. Важно, что происходящие здесь бизнес-процессы, во-первых, относительно изучены и, во-вторых, не столь сложны, как процессы в масштабах всего вуза. Количество сотрудников, вовлеченных в конкретную деятельность, также невелико (рекомендуется, чтобы витрина обслуживала не более 10-15 человек).

Обращая внимание на данные табл. 1, отметим, что значительная часть АИБС в вузах РФ реализована на СУБД MS SQL Server. На сегодняшний день существует целый спектр фирм, предлагающих системы построения витрин данных, среди которых Informatica (PowerMart Suite), Sagent Technology (Data Mart Solution), Oracle (DataMart Suite), SQL Server Management Studio 2005 и многие другие. С целью соблюдения требования для идентичности платформы разработки, позволяющего уменьшить затраты на транспортировку данных из реляционных СУБД, в данной статье рассмотрим задачи проектирования многомерных структур данных с помощью SQL Server Management Studio 2005.

Практика принятия решений показала, что существует зависимость между частотой запросов и степенью агрегации данных, с которыми запросы оперируют, а именно чем более агрегированными являются данные, тем чаще запрос выполняется (табл. 2).

Таблица 2

Производительность запросов для действующего проекта АИБС "МАРК-вОЬ" по формированию сводных отчётов

Тип запроса Среднее время выполнения запроса, мин Частота запроса, %

Запросы с высокой избирательно стью < 0,051 До 20

Запросы со средней избирательностью > 0,051 и < 1, 47 20 - 90

Запросы с низкой избирательно стью > 1,47 Более 90

Несмотря на то что предсказать, какую именно информацию и в каком виде захочет получить пользователь, работая с СППР, практически не-

возможно, измерения, по которым проводится анализ, достаточно стабильны.

МАЯС-формат представления данных широко распространен в системах представления библиотечных ресурсов не только образовательных учреждений, но и в общенациональных библиотеках. Система "MАPK-SQL" полностью совместима с международными библиографическими форматами иММАЯС и ШМАЯС на основе средств двухсторонней конверсии данных. Система также поддерживает Российский коммуникативный формат К^МАЯС. Поэтому принципы организации хранилищ данных могут сыграть важную роль в развитии таких перспективных систем, как электронные библиотеки и средства доступа к ним посредством информационных магистралей. Концентрируя большие объёмы информации из множества источников в складах данных, к которым организован доступ по общенациональной сети, можно предоставлять огромные массивы информации обучающимся непосредственно по месту жительства, обучения или работы.

Формализация показателей книгообеспеченности вуза

В международной практике университетская библиотека рассматривается как многоцелевая система [1-3], и сегодня управление библиотекой считается многокритериальной задачей [4]. Весьма важна и проблема определения множества критериев, адекватно оценивающих качество работы библиотеки. Пока нет единого мнения о том, какими критериями должна оцениваться ее работа. В [5, 6] проанализировано более ста различных критериев (их также называют индикаторами качества), описанных в научной литературе и международных стандартах. К одним из базовых (но не единстенным) критериев относят коэффициент книгообеспеченности, который в соответствии с "Письмом учебно-методического управления по высшему образованию Министерства высшего и среднего специального образования СССР от 26 января 1978 г. №96-084-113/8" рассчитывается как частное от деления количества экземпляров книги конкретного наименования на число студентов, изучающих данную дисциплину или дисциплины, по которым используется данная книга:

* = Р,

5

(1)

к = рср

(Рх + Р + ...) : 2 = Р + Р + ...

5ср (5 + 52 + ...) : 2 5 + 52 + ...!

(2)

Р + Р + Р + ... + Р

12 3 п

к =-

СР 5 + 5 + 5 + ... + 5

12 3 п

(3)

где: Р1, Р2, Р3, Рп — количество экземпляров каждой книги; S2, Sз, Sn — количество студентов, использующих каждую книгу.

Предположим, что по некоторой дисциплине для одного и того же контингента читателей используются п книг. Первая книга имеется в библиотеке в количестве Р1 экземпляров, вторая — в количестве Р2, п-я — в количестве Рм. Общее число студентов, использующих данные книги, равно S. Тогда формула (3) примет следующий вид:

кср =

Р1 + р2 + Рз + ... + рп

s * п

где Р — количество экземпляров данной книги; S — количество студентов.

При расчёте коэффициента книгообеспе-ченности по книге, используемой в двух семестрах, коэффициент обеспеченности определяется как частное от деления суммы экземпляров данной книги в каждом семестре на сумму числа студентов, использующих книгу в данных семестрах:

= \Р + Р + Р + ... + Рп ] / п =

5 5 5 5)

Кх + Кг + Кз + ... + кп

где Рср — среднее количество экземпляров книги; Sср — среднее количество студентов, использующих данную книгу; Р1 - количество экземпляров той же книги в первом семестре; Р2 - количество экземпляров той же книги во втором семестре; S1 — количество студентов, использующих данную книгу в первом семестре; S2 — количество-во студентов, использующих данную книгу во втором семестре.

Для расчёта показателя книгообеспеченно-сти по дисциплине, специальности или циклу, где используется не одна, а несколько книг, коэффициент обеспеченности определяется как сумма экземпляров используемых книг, деленная на сумму числа студентов, использующих каждую книгу. Для п наименований коэффициент книгообеспеченности равен:

где п — число используемых наименований книг.

Другими словами, по конкретной дисциплине для одного и того же числа читателей нескольких книг коэффициент книгообеспеченности по дисциплине будет равен среднему арифметическому от суммы коэффициентов каждой книги.

Выражения (1) - (4) реализованы в большинстве АИБС, но в последнее время в связи с широким ростом использования в образовательном процессе электронных изданий они искажают истинную картину книгообеспеченности. Так, если в фонде количество экземпляров книг превышает количество студентов, которые используют данную книгу, коэффициент книгообес-печенности, определяемый в соответствии с (1) или (2), превышает единицу, что также приводит к искажению результатов при агрегировании данных. В случае электронных изданий наличие даже одного такого доступного экземпляра позволяет достичь верхней границы для коэффициента книгообеспеченности данного издания независимо от размера контингента, которому оно предназначено. Поэтому модифицируем выражение (1):

к=

Р

— при Р < 5 5

1 при Р > 5 или ЗРЭ1

(5)

Тогда при агрегации данных выражение (4) будет корректным в записи (5):

кср =

*1 + К 2 + Кз + ... + Кп

X К, X КГ1* X К,

_ I=1

I = 1 + I = 1

+= п

(6)

+ ф(1),

п

п

I

п

п

п

п

где I — количество электронных изданий; т -количество изданий только в бумажном виде; п = т + I; ф(1) - доля электронных изданий во всём множестве наименований.

До тех пор, пока доля электронных изданий сравнительно мала, проблема управления объёмом дискового пространства, требуемого для их хранения, не является острой. Однако, учитывая, что повысить показатели книгообес-печенности за счёт электронных изданий существенно проще с финансовой точки зрения (стоимость бумажных изданий растёт с каждым годом, требует значительно больших площадей и затрат для их хранения в фондах вуза, приобретения и учёта), необходимо разработать рациональные механизмы хранения и обработки электронных фондов на стадии проектирования витрин данных.

При проектировании структуры хранилища или витрин данных часто возникает желание использовать как можно больше агрегатов и за счёт этого повысить производительность системы. Нетрудно подсчитать, что для модели "звезда" с одиннадцатью измерениями можно построить более 11!=39916800 различных агрегированных значений, размещение которых в памяти при установлении связей с соответствующими измерениями приведет к резкому увеличению занимаемого дискового пространства и замедлению доступа к данным. Другая крайность состоит в использовании слишком малого числа агрегатов, а это может привести к необходимости выполнять агрегирование динамически, что заметно снижает эффективность запросов.

При использовании АИБС "МАРК^и' (ЗАО "НПО "Информ-система", Москва) формируются сводные отчёты, отражающие следующую информацию: книгообеспеченность по циклам дисциплин (гуманитарный, математический, профессиональный, специальный и факультативный), книгообеспеченность по определённой кафедре и специальности за весенний или осенний семестры с разбивкой по учебной литературе. Коэффициент книгообес-печенности по умолчанию вычисляется в соот-

ветствии с выражением (1); также отметим сложность и неравномерность времени выполнения вложенных SQL-запросов для формирования и генерации, ограниченных по структуре, отчётов (табл. 3).

Таблица 3

Время выполнения оптимизированных реляционных запросов для действующего проекта ИБС "МАРК-врЬ" по формированию сводных отчётов в НИИ

Название сводного отчёта Время выполнения OLTP-за-проса, мин (БД, 120 Гб)

Книгообеспеченность кафедры 2

Общая книгообеспеченность дисциплины по семестрам 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Книгообеспеченность специальности. Осенний семестр 3

Книгообеспеченность специальности. Весенний семестр 3

Книгообеспеченность кафедры по семестрам 4

Книгообеспеченность специальности 4

Книгообеспеченность цикла ЕСН дисциплин. Весенний семестр 11

Книгообеспеченность цикла ГСЭ дисциплин. Весенний семестр 17

Книгообеспеченность цикла ОПД дисциплин. Осенний семестр 17

Учитывая, что даже в небольшом вузе количество кафедр и специальностей измеряется десятками, а количество дисциплин сотнями, OLTP-систему для определения показателей книгообеспеченности можно использовать в режимах off-line, затратив на это десятки часов. Однако книгообеспеченность не единственный показатель деятельности библиотеки, целый спектр данных мониторинга ИБФ вуза требуется предоставить системе качества ОУ (по крайней мере ежемесячно, в частности, для определения стимулирующих надбавок работникам библиотеки в соответствии с новой системой оплаты труда - НСОТ), и, как правило, в вузе библиотека не обладает собственным серверным парком, следовательно, требуется разработать аналитические процедуры на базе технологий, адаптированных специально для данных целей, например OLAP.

Отмеченные функции АИБС могут быть дополнены при внедрении в модуль "Информационное обеспечение вуза" элементов анализа с использованием ОЬАР-технологий, где в качестве детальных данных будем рассматривать измерения и факты, на основании которых получим агрегированные данные (построены меры) путём суммирования числовых фактических данных по определённым измерениям. При этом время выполнения запросов и их гибкость могут быть значительно оптимизированы. Учитывая объём поставленной задачи - построение многомерной структуры БД для мониторинга информационно-библиотечного фонда (ИБФ) вуза — выполним данный процесс проектирования в четыре этапа, результаты которых объединим в гиперкуб, оптимизировав при этом степень агрегации данных.

Проектирование витрины данных "Книжный фонд". Этап I

Рассмотрим процесс проектирования витрины данных МагкЭДЬ ОЬАР.тёГ на основе реляционной базы данных МагкВОЬ.тёГ, с помощью которой обеспечим оперативный учёт литературы по следующим фактам: общее количество книг (по названию), изданных автором (или авторами); количество книг (по названию), изданных автором (или авторами) по определённому типу литературы (например, методическое пособие, учебное пособие и т. д.); количество книг (по названию), изданных автором в определённом городе и определённым издательством; количество названий книг, изданных в определённом городе (или во всех) определённым издательством (или во всех); количество определённого названия книги, изданной в определённом городе определённым издательством; количество книг (в том числе и по типам), изданных в определённом городе определённым издательством (издательствами); количество книг (в т. ч. и с грифом), имеющихся в наличии в библиотеке на определённую дату издания; количество книг, выпущенных издательством на определённую дату.

Выделим для проектирования витрины данных следующие меры: количество экземпляров определённого типа литературы (по названию); количество экземпляров, изданных издательством; количество экземпляров пособий, напечатанных в городе; количество экземпляров

пособий на определённую дату; количество пособий определённого заглавия; количество пособий, изданных автором (по названию).

В качестве измерений и иерархий в витрине данных при проведении многомерного анализа будем рассматривать следующие наборы данных, представленных в виде справочников: тип литературы, издательство, город издания, дата издания документа, заглавие книги, автор документа (книги), документ. Тогда витрина данных ВД "Книжный фонд" схемы "звезда" будет иметь логическую структуру, представленную на рис. 1.

В приложении Microsoft Visual Studio 2005 создадим проект служб Анализа - SSAS (Analysis Services Project, SSAS), который позволит построить OLAP-куб поверх существующей витрины данных. При заполнении витрины данных реализованы три взаимосвязанные задачи: сбор данных (Data Acquisition), очистка данных (Data Cleansing) и агрегирование данных (Data Consolidation). Под сбором данных понимается процесс, который состоит в организации передачи данных из внешних источников в ВД. Под очисткой данных - процесс модификации данных по ходу заполнения ВД: исключение нежелательных дубликатов, восстановление пропущенных данных, приведение данных к единому формату, удаление нежелательных символов (например, управляющих) и унификация типов данных, проверка на целостность. При агрегировании данных обеспечена выборка данных из тран-закционной базы данных и других источников в соответствии с метаданными, поскольку агрегирование происходит в терминах бизнес-понятий.

Проектирование витрины данных "Контингент". Этап II

Следующим этапом проектирования является построение витрины данных, с помощью которой библиотекарю (для определения книго-обеспеченности) или сотруднику студенческого отдела кадров можно оперативно определить контингент учащихся по следующим фактам: контингент учащихся по факультету, в том числе с учётом или без формы, курса и семестра обучения; контингент учащихся по специальности, в том числе с учётом или без формы, курса и

Таблица измерений "Тип литературы

Таблица фактов "Книжный фонд

Таблица измерений "Издательство" ИИ Код издательства ^ь0 Название издательства

Таблица измерений "Город издания" ИИ Код города

ИИ Код ИИ Код ИИ Код ИИ Код ИИ Код ИИ Код ИИ Код

типа литературы ^К) издательства (FK) города ^К) документа (FK) даты издания ^К) заглавия книги (FK) автора ^К)

1-во документов, изданных автором

1-во док-тов данного заглавия

1-во док-тов, изд. на определённую дату

1-во док-тов, изданных в городе

1-во док-тов, изданных издательством

1-во док-тов данного типа литературы

Таблица измерений "Дата издания" ИИ Код даты издания

Рис. 1. Логическая структура витрины данных "Книжный фонд"

семестра обучения; контингент учащихся по кафедре, в том числе или без с учётом формы, курса и семестра обучения; контингент учащихся по группе, в том числе с учётом или без формы, курса и семестра обучения.

Соответственно для проектирования витрины данных потребуется только одна мера — количество студентов. При этом отметим, что заполнение витрины данных "Контингент" может происходить, минуя источники АИБС. Если вуз не обладает выделенной системой сопровождения контингента, то данная задача может быть решена в АИБС "MАPK-SQL", в которой имеются встроенные источники для реализации данных функций.

В качестве измерений и иерархий в витрине данных будем рассматривать такие наборы данных, как факультет, специальность, кафедра,

группа, форма обучения, курс обучения, семестр обучения.

В результате проектирования построена витрина данных "Контингент" схемы "снежинка", логическая структура которой представлена на рис. 2.

Проектирование витрины данных "Дисциплины". Этап III

Следующий этап проектирования - построение витрины данных, которая обеспечит связь между группами и имеющимися дисциплинами и позволит как сотруднику библиотеки, так и сотрудникам кафедр и деканатов анализировать следующие факты: какие дисциплины преподаются в группах и их количество; какие дисциплины преподаются на кафедре (специальности, факультете) и их количество; какие дисциплины

Таблица измерений "Семестр обучения" НИ Код семестра обучения

Таблица измерений "Курс обучения" ИИ Код курса обучения

Таблица измерений "Форма обучения" ИИ Код формы обучения

Таблица фактов "Контингент" ИИ Код группы (РК) ИИ Код специальности (РК) ИИ Код формы обучения (РК) ИИ Код курса обучения (РК) ИИ Код семестра обучения (ЯК)

Таблица измерений "Факультет" ИИ Код факультета ^ Название факультета

Таблица измерений "Кафедра" ИИ Код кафедры

Код факультета (РК)

Название кафедры АьР Имя завкафедрой

Таблица измерений "Специальность" ИИ Код специальности 1 Код кафедры (РК) ИИ Код факультета (РК)

АьР Название специальности Шифр специальности Краткое название специальности 11 Краткое название специальности 2|

преподаются в вузе и количество дисциплин по каждому циклу дисциплин.

С учётом этого выделим следующую меру — количество дисциплин. На данном этапе проектирования эта мера не может быть вычислена напрямую или загружена в витрину данных из OLTP-системы MarkSQL. Поэтому меру "количество" добавим на уровне OLAP-куба, который будет построен поверх этой витрины данных.

В качестве измерений и иерархий в витрине данных при проведении многомерного анализа будем рассматривать следующие наборы данных, представленных в виде справочников: факультет, кафедра, специальность, группа, цикл дисциплин, дисциплина.

В результате проектирования построена витрина данных "Дисциплины" схемы "снежинка" , логическая структура которой представлена на рис. 3.

В созданном проекте служб анализа построим OLAP-куб поверх витрины данных, а на этапе конструирования куба создадим меру количество (Число Fact Grp Discp).

Проектирование витрины агрегированных данных. Этап IV

Следующим этапом проектирования становится построение витрины данных, которая обеспечит возможность сотруднику библиотеки анализировать такие факты, как: количе-

ство экземпляров книг, выделяемых группе по определённой дисциплине (циклу); количество экземпляров литературы, выделяемых на определённую специальность (кафедру).

Для анализа по выделенным фактам нам потребуется только одна мера — количество экземпляров литературы, информация по которой содержится в реляционной БД (MarkSQL. mdf) и вычисляется через агрегатную функцию.

В качестве измерений и иерархий в витрине данных при проведении многомерного анализа будем рассматривать такие наборы данных, как факультет, кафедра, специальность, группа, цикл дисциплин, дисциплина, документ.

В результате проектирования построена витрина данных "Количество экземпляров книг - Дисциплины" схемы "снежинка", логическая структура которой представлена на рис. 4.

Объединение этапов проектирования в один AS-куб

В результате рассмотренных этапов проектирования была разработана единая структура витрины данных (рис. 5), содержащей одиннадцать измерений, четыре из которых имеют вложенные уровни иерархии. На основе данной ВД " ИБФ вуза" были построены четыре OLAP-куба, обеспечивающие оперативный аналитический учёт по ранее выделенным фактам.

Таблица измерений "Цикл дисциплин" tt# Код цикла дисциплин

Название цикла Краткое название цикла

Таблица измерений "Дисциплина"

Код дисциплины ## Код цикла дисциплин (РК)

Аьс Название дисциплины ©Дата ввода дисциплины

Таблица измерений "Факультет" tttt Код факультета Название факультета

Таблица измерений "Цикл дисциплин" ## Код цикла дисциплин

аьр Название цикла аьр Краткое название цикла

Таблица измерений "Дисциплина" ## Код дисциплины ## Код цикла дисциплин (РК)

аьр Название дисциплины ©Дата ввода дисциплины

Таблица измерений "Документ'

Таблица фактов "Кол-во экз. книг - Дисциплины" ## Код дисциплины (РК) ## Код группы (РК) ## Код специальности (РК) Код документа (РК)

Таблица измерений "Факультет" ## Код факультета

Таблица измерений "Кафедра" ## Код кафедры ## Код факультета (РК)

Название кафедры Имя завкафедрой

^блица измерений "Специальность" ## Код специальности ## Код кафедры (РК) ## Код факультета (РК)

Аьр Название специальности

Шифр специальности № Краткое название специальности 11 Краткое название специальности 2|

Рис. 4. Логическая структура витрины данных "Количество экземпляров книг — Дисциплины"

В результате в качестве измерений и их иерархий в витрине данных "ИБФ вуза" (рис. 5 и 6) выделены следующие наборы данных: структурная единица с иерархиями вуз, факультет, кафедра, специальность, группа; дисциплины с иерархиями учебный план, цикл дисциплин, дисциплина; время обучения с иерархиями курс обучения, семестр; форма обучения; наименование издания; дата издания с иерархиями месяц издания, год издания; издательство; место издания; автор издания; тип литературы.

В качестве мер на уровне витрины данных (см. рис. 5 и 6) содержатся следующие агрегатные значения: количество экземпляров определённого типа литературы (по названию) (таблица БасШосАиШог); количество экземпляров, изданных издательством (таблица Рас1БосАи1;Ьог); количество экземпляров пособий, напечатанных в городе (таблица БасШосАиШог); количество экземпляров пособий на определённую дату (таблица Рас1ВосАиШог); количество пособий определённого заглавия (таблица БасШосАи-

Таблица измерений Заглавие книги Код_заглавия_книги

Таблица измерений Дат

^Значение

Таблица фактов Книжный

а (РК)

(РК)

Код_типа_литера ** Код_иадательств Код_города (РК) ? Код_документа (РК) ИИ Код_даты_иэдания (РК) НИ Код_ааглавия_книги (РК) ИИ Код_автора (РК)

рений Тип литературы

Таблица измерений Доку

тов "Кол-во экз. книг - Дис

«И Код_цикла_дисциплин (РК) •И Код_группы (РК) ** Код_специальности (РК) ИИ Код_документа (РК)

измерений Издательс

измерений Город издани;

Таблица измерений Автор д Код_автора

Наэ ©Дат

ИИ Код_группы И* Код_специальности (РК) ИИ Код_кафедры (РК) ИИ Код .факультета (РК)

Таблица фактов "Дис

"И Код_дисциплины (РК) ин Код_цикла_дисциплин (РК) и* Код_группы (РК) НИ Код_специальности (РК)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица

ИИ Код_группы (РК) ИИ Код_специальности (РК) ИИ Код_формы_обучения (^К) ии Код_курса_обучения (РК) ИИ Код_семестра_обучения (РК]

Кол

о_студентоЕ

измерений Семестр обучения

ИИ Код_семестра_обучения

рений Курс обучения

измерений Форма обучения

Имя а

нии Цикл д

мерений Д

ин (1-К)

а дисциплины

•_____

Таблица из

обучен

ание_группы

мы обучения

STRTOSET(@DimTypeLitTermType, CONSTRAINED), [Dim Type Lit].[Term Type].current-member ) )

CELL PROPERTIES VALUE, BACK_COLOR, FORE_ COLOR, FORMATTED_VALUE, FORMAT_STRING, FONT_NAME, FONT_SIZE, FONT_FLAGS В табл. 4 приведена сравнительная характеристика по времени генерации сводных отчётов, формируемых в ИС "ИБФ вуза" и в ИБС "МАРК SQL" соответственно.

Итак, было проведено проектирование многомерной структуры данных схемы «снежинка», включающей 11 измерений и 4 таблицы фактов, реализующих анализ по 8 мерам. На основе ВД был построен AS-куб архитектуры MOLAP, где на этапе конструирования куба были добавлены 4 меры.

По результатам сравнительного анализа времени выполнения запросов для генерации сводных отчётов по таким показателям, как, например, книгообеспеченность, можно говорить о значительном повышении (для данного примера в 6-10 раз для одного многомерного запроса) производительности и эффективности систем поддержки принятия решения на базе хранилищ данных.

В заключение хотелось бы отметить, что внедрение системы внутреннего мониторинга информационно-образовательных ресурсов и данный способ организации учебного процесса позволит вузу выйти на новый уровень повышения качества образования и тем самым гарантирует потребителям высокий международный уровень компетенций выпускников.

Таблица 4

Сравнительная характеристика производительности запросов к многомерной БД и реляционной БД

по выполнению сводных отчётов

Название сводного отчёта Время выполнения запроса, мин

к РБД, 120 Гб к МБД, 75 Гб

Книгообеспеченность кафедры 2 0,25

Общая книгообеспеченность дисциплины по семестрам 2 0,25

Книгообеспеченность специальности. Осенний семестр 3 0,4

Книгообеспеченность специальности. Весенний семестр 3 0,4

Книгообеспеченность кафедры по семестрам 4 0,6

Книгообеспеченность специальности. 4 0,6

Книгообеспеченность цикла ЕСН дисциплин. Весенний семестр 11 1,5

Книгообеспеченность цикла ГСЭ дисциплин. Весенний семестр 17 4,5

Книгообеспеченность цикла ОПД дисциплин. Осенний семестр 17 4,5

список литературы

1. Полл Р., Бокхорст П. Измерение качества работы: Международное руководство по измерению эффективности работы университетских и других научных библиотек / Пер. с англ. Н.В. Соколовой. Под. ред. О.Ю. Устинова. М.: Логос. 2002. 152 с.

2. Moore N. Measuring the Performance of Public Libraries: a Draft Manual. Paris: General Information Programme and UNISIST, UNESCO. 1989.

3. International Standards Organisation ISO 11620 Information and Documentation Library Performance Indicators Draft. ISO/FDI1620 [Electronic source]. 1997.

4. Бочаров Б.П., Воеводина М.Ю. Определение рациональной стратегии автоматизированного управления современной библиотекой вуза // Культура народов Причерноморья / Межвузовский центр "Крым". Симферополь. 2006. № 94. С. 39-51.

5. Бочаров Б.П. Формирование векторного критерия оценки качества автоматизированного управ-

ления современной библиотекой // Культура народов Причерноморья / Межвузовский центр "Крым". Симферополь, 2005. Т. 1. № 60. С. 31-35.

6. Рябченко И.Н., Бочаров Б.П. Применение статистических методов при формировании векторного критерия оценки качества управления современной библиотекой. // Вюник книжково!' палати. 2005. № 4. С.24-27.

7. Браст Эндрю Дж., Форте Стивен. Разработка приложений на основе Microsoft SQL Server 2005. Мастер-класс [Текст]: Пер. с англ. М.: Русская Редакция. 2007. 880 с.

8. Ларсон Б. Разработка бизнес-аналитики в Microsoft SQL Server 2005 [Текст]. СПб.: Питер. 2008. 684 с.

9. Фомичева С.Г. Обработка больших массивов данных [Текст] : Учеб. пособие / Норильский индустр. ин-т. Норильск. 2009. 325 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.