Научная статья на тему 'Построение модели эффективного управления пассажироперевозками на базе технологии OLAP'

Построение модели эффективного управления пассажироперевозками на базе технологии OLAP Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
42
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ / MODEL / ОРГАНИЗАЦИЯ ДАННЫХ / ОНЛАЙНОВАЯ АНАЛИТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ / DATA STRUCTURE / OLAP

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Цуканов Александр Викторович, Потанина Марина Викторовна

Предложен способ организации данных для построения моделей эффективного управления городскими пассажиропере-возками на базе технологии OLAP.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Цуканов Александр Викторович, Потанина Марина Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The way of a data structure for creation of models of effective management of the city transportations of passengers on the basis of the OLAP technology is offered

Текст научной работы на тему «Построение модели эффективного управления пассажироперевозками на базе технологии OLAP»

ПОСТРОЕНИЕ МОДЕЛИ ЭФФЕКТИВНОГО УПРАВЛЕНИЯ ПАССАЖИРОПЕРЕВОЗКАМИ НА БАЗЕ ТЕХНОЛОГИИ OLAP

Цуканов Александр Викторович

Док. тех. наук, профессор кафедры менеджмента организаций, СевГУ,

г. Севастополь

Потанина Марина Викторовна

Канд. тех. наук, доцент кафедры менеджмента организаций, СевГУ,

г. Севастополь

АННОТАЦИЯ

Предложен способ организации данных для построения моделей эффективного управления городскими пассажиропере-возками на базе технологии OLAP

ABSTRACT

The way of a data structure for creation of models of effective management of the city transportations of passengers on the basis of the OLAP technology is offered.

Ключевые слова: модель, организация данных, онлайновая аналитическая обработка данных

Keywords: model, data structure, OLAP

Автобусный пассажирский автотранспорт является одним из основных и наиболее распространенных видов пассажирского транспорта в городах страны. Для городских пассажироперевозок характерна небольшая протяженность маршрута, частые остановки и частая смена пассажиров.

Главной проблемой пассажирского транспорта является повышение эффективности работы автобусного транспорта общественного пользования. На продуктивность его труда влияет: неудовлетворительное развитие транспортной сети и маршрутной системы; нерациональное использование транспорта общего пользования; низкое качество транспортного обслуживания; уменьшение парка автобусов; несовершенство системы скоростных и экспрессных автобусных маршрутов. Также работа пассажирского транспорта в большой степени зависит от случайных, неуправляемых факторов, таких как погодные условия, ремонтные работы, массовые общественные мероприятия и др.

Каждое автотранспортное средство и сам процесс пасса-жироперевозок характеризуется огромным числом показателей, которые обычно коррелируют между собой, и структура модели такого сложного объекта, которым является пассажироперевозки, не определена.

Одним из главных финансовых показателей экономической эффективности предприятия, осуществляющего пас-сажироперевозки, является рентабельность использования автотранспортных средств. Обозначим этот ключевой показатель эффективности через у.

Для разрешения проблемы повышения рентабельности пассажироперевозок необходимо использовать АСУ АТП (автоматизированную систему управления автотранспортным предприятием). При этом, для управления рентабельностью, надо определить структуру модели объекта управления пассажироперевозками.

Обозначим через вектор

x = [xl,x2,...,xn ]

управляемых факторов или независимых входных перемен-

I = [г,,12,...,г ]

ных, через вектор 1 т - контролируемые,

но неуправляемые факторы. Например,

z

временной

Z 2 Z3

период, 2 - погодные условия, - количество пасса-

жиров,

z

4 -

средняя продолжительность поездки и т.д.

Для каждого сочетания уровней атрибутов необходимо выбирать модель, которая будет содержать различные управляемые факторы, например, х, - списочное (планируемое) количество автобусов определенной марки на маршруте в характерные временные периоды, неуправляемые факторы, например, х2 - фактическое количество автобусов на маршруте в машинах, неуправляемые, но контролируемым факторы, например, х3 - варианты возможных изменений протяженности автобусного маршрута в километрах, х5 - количество недопущенных врачом водителей на маршрут, х6 - количество недопущенных техником автобусов на маршрут, х8 - продолжительность оборотного рейса одного автобуса в минутах и т.п.

В общем виде модель объекта управления пассажиро-перевозками можно записать в виде регрессионной модели

У = п (х, I, а,) + Е

(1)

а

вектор неизвестных параметров,

вектор

где Е

- случайная составляющая, включающая в себя влияние всех неучтенных факторов.

Методы построения моделей управления требуют определенной организации данных. Объем данных, которые описывают процесс пассажироперевозок и значения которых хранятся в АСУ АТП, может быть очень большим. При этом формирование соответствующей матрицы исходных данных для системы селекции моделей может занимать длительный период времени. Как правило, для получения данных система передает этот запрос СУБД (системе управления базой данных), которая тратит несколько минут на выполнение запроса. Это время объясняется тем, что СУБД должна прочитать все записи в соответствующих таблицах,

выбрать необходимые данные и агрегировать их по определенным признакам.

Статистические данные, хранящиеся в БД АСУ АТП, характеризуются сильной мультиколлинеарностью, а идентификация модели объекта управления пассажироперевоз-ками должна осуществляется в режиме нормальной работы. К тому же, наряду с быстрым устареванием данных, характеризующие процесс пассажироперевозок, необходимо учитывать контролируемые, но неуправляемые факторы (погода, аварии, болезни водителей и т.п.). С учетом всего этого, предприятие-пассажироперевозчик должно постоянно оптимальным образом перестраивать транспортные потоки. Если использовать традиционные методы статистической обработки данных, то происходит большая задержка реагирования на требуемые изменения по времени. Это показывает практика работы реальных АТП г. Севастополя, осуществляющих автобусные городские пассажироперевоз-ки [1].

Для ускорения подготовки и обработки данных в такой ситуации предлагается воспользоваться известной технологией OLAP (онлайновая аналитическая обработка данных) которая позволит облегчить системе доступ к данным [2].

Систему OLAP можно определить только пятью ключевыми словами: Быстрый Анализ Разделяемой Многомерной Информации. Система позволяет представить данные для

любого логического и статистического анализа. Как правило, такие системы должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий. Важным свойством OLAP систем является возможность в равной степени эффективно обеспечивать доступ, как к собственному хранилищу данных, так и к внешним данным. При этом системы должны предоставлять инструменты для обработки отсутствующих значений.

Главная задача исследователя - находить закономерности в больших массивах данных. Все данные в системе носят характер «набор атрибутов - число» [3].

В АСУ, как правило, используются реляционные СУБД, в которых данные хранятся в нормализованном виде. Например, на рисунке 1 показан фрагмент базы данных по пас-сажироперевозками.

Так как эффективность пассажироперевозок для АТП оценивается с помощью показателя рентабельности и других экономических показателей, которые определяются отношением первичных показателей к общим расходам предприятия, то для построения модели управления необходимо формировать матрицы исходных данных, которые будут содержать не только первичные данные, но и агрегированные и расчетные данные.

Рисунок 1. Фрагмент модели базы данных АТП

На рисунке 2 показан пример запроса на языке SQL для получения данных по расходам на горючее за год. Этот отчет содержит только одно число - общую сумму расходов по всем перевозкам и всем автобусам в текущем году [4].

SELECT sum (Статья_17)

FROM Расходы_горючее_факт, Дата_и_время

WHERE Расходы_горючее_факт.йте^ =

Дата_и_время.1те^ AND Дата_и_время.уеаг = 2015 Рисунок 2. Пример запроса на языке SQL Для подготовки исходных данных для многомерного анализа селекции моделей необходимо преобразовать реляционную базу данных, в которой применяются термины строки (кортежи) и столбцы (атрибуты), в многомерные данные, в которой используются термины - переменные и строки. Для проведения быстрых расчетов используя в качестве

источника данных систему OLAP необходимо формировать торой показан на рисунке 3. оперативные интегрированные таблицы данных, пример ко-

Рисунок 3. Интегрированная таблица для построения модели

На рисунке «Марка автобуса», «Маршрут», «Год» являются атрибутами, а «Объем перевозок» и «Прибыль» -числовыми значениями. Задачей системы идентификации моделей, является выявление с помощью методов идентификации стойких взаимосвязей между числовыми параметрами для различного сочетания уровней атрибутов.

Показатель эффективности также может меняться в зависимости от качественных атрибутов данных, хранящихся в базе данных.

Многомерные массивы данных, подготовленные для селекции моделей, в терминах OLAP называются многомерными кубами.

Построение многомерных кубов для обработки данных приводит к проблеме пропущенных значений, так как не всегда в базе данных существует информация для всех комбинаций качественных атрибутов.

Преимущества OLAP очевидны - основная масса данных запрашивается из реляционной СУБД в начале - при построении куба. Затем эти данные только корректируются и добавляются. Благодаря этому, не только исключаются перебои в работе сервера реляционной СУБД (нет запросов с тысячами и миллионами строк ответов), но и резко повышается скорость доступа к данным для системы моделирования. Кроме того, производительность повышается и за счет подсчета промежуточных сумм иерархий и других агрегированных значений в момент построения куба. То есть, если изначально данные содержали информацию о дневной выручке по типам автобусов на отдельно взятом маршруте, то при формировании куба OLAP-приложение считает итоговые суммы для разных уровней иерархий (недель и месяцев, районов города).

Конечно, за повышение таким способом производительности приходится расплачиваться объемом данных - куб

OLAP может занимать в десятки, и даже сотни раз больше места, чем исходные данные.

Использование системы OLAP позволяет ускорить на порядок процесс построения регрессионной модели [1], тем самым ускорить выработку решений по управлению пасса-жироперевозками и как результат снизить потери за счет оптимального распределения транспорта по маршрутам.

Выводы:

Предлагаемая при анализе динамических бизнес-процессов АТП технология OLAP позволяет не только устранить перебои в работе сервера реляционной СУБД, но и резко повысить скорость доступа к данным для системы моделирования, уменьшить издержки и недополученную прибыль и в окончательном итоге повысить рентабельность предприятия.

Также надо учитывать социальный эффект, который заключается в повышении удовлетворенности и удобства пассажиров.

Список литературы:

1. Потанина М.В. Повышение рентабельности процесса городских автобусных пассажироперевозок за счет его оптимизации / М.В. Потанина//: Вюник СевНТУ: зб. Наук. пр. Вип.. 130/2012. Серiя: Економша i Фшанси. - Севастополь, 2012. С. 185-190.

2. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. - СПб.: БХВ-Петербург, 2004. - 336 с.

3. Миронов А.А., Мордвинов В.А., Скуратов А.К. Семан-тико-энтропийное управление OLAP и модели интеграции xOLAP в SemanticNET (ONTONET). Информатизация образования и науки №2, 2009. С. 21-30.

4. Ларсон Б. Разработка бизнес-аналитики в Microsoft SQL Server 2005. - СПб.: Питер, 2008. - 684 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.