Научная статья на тему 'Принципы создания системы планирования и прогнозирования бюджетных данных с использованием аналитических технологий MS SQL Server'

Принципы создания системы планирования и прогнозирования бюджетных данных с использованием аналитических технологий MS SQL Server Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
553
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / ДОХОДЫ БЮДЖЕТА / АВТОМАТИЗИРОВАННАЯ СИСТЕМА / МНОГОМЕРНАЯ БАЗА ДАННЫХ / ВРЕМЕННЫЕ РЯДЫ / АДАПТИВНЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ / МУЛЬТИПЛИКАТИВНАЯ ФАКТОРНАЯ МОДЕЛЬ / FORECAST-MAKING PROCESS / BUDGET REVENUE / AUTOMATIC SYSTEMS / MULTIDIMENTIONAL DATABASE / OLAP / TIME ROWS / ADJUSTMENTS-BASED FORECASTING METHODS / MULTIPLICATION FACTOR MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кондрашов Юрий Николаевич, Катков Игорь Леонидович

В статье рассматриваются автоматизированная система планирования и прогнозирования доходной части бюджета, используемые математические методы прогнозирования, применение для анализа бюджетных данных технологий многомерного интерактивного анализа. Приводятся результаты анализа математических методов прогнозирования и разработки компонентов программного обеспечения, которые позволяют проводить интерактивный многомерный анализ исторических данных, формировать модели прогнозирования и строить вариантные прогнозы по сформированным моделям.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кондрашов Юрий Николаевич, Катков Игорь Леонидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MS SQL Server-Based Budget Builder System Development Principles

The article authors examine the characteristics of the automatic systems used for budget planning and for making forecast related to the budget revenue change. They also describe the mathematical methods used in forecast-making and the way the multi-dimensional interaction analysis-based technologies are used to process the budget data. Various mathematical modeling methods' and various software applications' characteristics are described into the article. The methodology is used to do the multi-dimensional interaction analysis of the historical data, form the forecast-making patterns and build various scenarios using the already available patterns.

Текст научной работы на тему «Принципы создания системы планирования и прогнозирования бюджетных данных с использованием аналитических технологий MS SQL Server»

Ключевые слова:

прогнозирование, доходы бюджета, автоматизированная система, многомерная база данных,

OLAP, временные ряды, адаптивные методы прогнозирования, мультипликативная факторная модель

Ю. Н. Кондрашов, д. т н., профессор, зав. кафедрой «Автоматизированная обработка информации» Академии бюджета и казначейства Минфина России (e-mail: jkondr@yandex.ru)

И. Л. Катков, ст. преподаватель кафедры «Автоматизированная обработка информации» Академии бюджета и казначейства Минфина России (e-mail: garrinews@mail.ru)

Принципы создания системы планирования и прогнозирования бюджетных данных с использованием аналитических технологий MS SQL Server

В настоящий момент поддержка исполнения задач, возложенных на финансовые органы, осуществляется посредством автоматизированных систем. Они относятся к классу транзакционных (учетных) систем, которые ориентированы на сбор различной информации по расходным и доходным показателям бюджета и на предоставление стандартной отчетности. Они позволяют в должной мере автоматизировать казначейское исполнение бюджета согласно Бюджетному кодексу и прочим нормативным документам, а также контроль исполнения бюджета на основе стандартных отчетов.

Однако, несмотря на преимущества, которые дает использование таких систем в финансовых органах, существует целый ряд проблем, возникающих из-за специфики их построения:

1. Постоянные изменения, которые вносятся в автоматизированные системы по мере изменения законодательной базы, затрудняют использование собранных исторических данных. Изменения в структуре данных учетных систем делают практически невозможным анализ данных за несколько лет даже на основе стандартных форм.

2. В системах отсутствует ряд данных по различным законодательным, социальноэкономическим, нормативным показателям, необходимых для принятия управленческих решений, что делает их практически бесполезными в процессе разработки основных социально-экономических программ развития и новых направлений бюджетной и налоговой политики.

3. В таких системах не предусмотрены развитые средства прогнозирования и планирования.

4. В их составе отсутствуют гибкие средства составления аналитических отчетов.

В системах, используемых в финансовых органах, не существует средств, которые позволили бы аналитику при помощи интуитивно понятных операций составить нерегла-ментированный запрос любого уровня сложности.

Перечисленные проблемы показывают всю сложность использования автоматизированных систем при составлении бюджета, решении задач прогнозирования доходов бюджета, прогнозировании социально-экономической ситуации, в условиях которой принимаются управленческие решения, а также разрабатываются основные направления бюджетно-налоговой политики. Решение этих проблем на данный момент лежит в области применения специальных методов, технологий и программных средств обработки информации.

На сегодняшний день наиболее подходящей моделью представления информации для анализа является многомерная модель данных, суть которой — в многопараметрическом представлении фактов реального мира. В многомерных моделях данные рассматриваются либо как факты с соответствующими численными параметрами, либо как текстовые измерения, которые характеризуют эти факты. С применением этой модели данных и специализированных средств анализа, интегрированных в MS SQL Server, открываются новые способы поддержки принятия решений в области планирования и управления в бюджетной сфере, необходимые бюджетным аналитикам в их профессиональной деятельности.

Технология интерактивного многомерного анализа данных (OLAP) была разработана специально для решения задач анализа больших массивов накопленных данных, ориентирована на обработку нерегламентированных, неожиданных запросов аналитиков к данным.

OLAP — online analytical processing — это класс продуктов, занимающихся оперативной аналитической обработкой данных. Технология OLAP дает возможность быстро менять взгляд на данные в зависимости от выбранных параметров и обеспечивает лицу, принимающему решения, полный обзор ситуации с его собственной стратегической точки зрения.

Использование систем данного класса подразумевает интеграцию различных источников информации и может дать доступ к актуальной информации о состоянии бюджета, что позволит в результате анализа изменения различных характеристик во времени обнаружить тенденции изменения бюджетных показателей.

Тем не менее, для решения задач планирования и управления бюджетным процессом наряду с инструментами многомерного интерактивного анализа в автоматизированной системе должен использоваться специализированный математический аппарат. Он позволяет оптимизировать решаемую задачу на основе множества факторов, ранжировать их по значимости, прогнозировать развитие экономической модели с учетом выбранных факторов и рассматривать полученный результат с различных точек зрения.

основные принципы анализа и прогнозирования бюджетных данных

Транзакционные (учетные) системы автоматизации исполнения бюджета плохо приспособлены для анализа. Для анализа накопленных бюджетных данных необходимо использовать OLAP-технологии.

В основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся анализируемые (числовые) данные (показатели). Многомерное представление, по мнению известных аналитиков, является наиболее естественным взглядом управляющего персонала на объект управления. Это множественная пер-

спектива (см. рис. 1), состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных.

Рисунок 1

Пример многомерного куба показателей доходов бюджета

Осями многомерной системы координат служат основные атрибуты анализируемого процесса. Например, для доходной части бюджетного процесса это может быть классификатор налогов, классификатор корреспондентов бюджета и др. В качестве одного из измерений используется время. На пересечениях осей (измерений) находятся данные, количественно характеризующие процесс — бюджетные показатели. Это могут быть данные о поступлениях доходов, объемы расходов бюджета, плановые бюджетные показатели, прогнозы поступлений и т. п.

Важной особенностью многомерной модели OLAP-анализа является возможность создания осей измерений иерархической структуры (например, год, квартал, месяц), позволяющей анализировать не только детальные, но и агрегированные данные.

При работе с гиперкубом пользователь, анализирующий информацию, может «разрезать» куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по месяцам) сведения и осуществлять прочие манипуляции, которые необходимы в процессе анализа.

Использование средств OLAP-анализа открывает новые перспективы в решении задач эффективного планирования и управления бюджетным процессом. Совокупность бюджетных показателей и отчетности, накопленные за достаточный период времени, составят базу фактографической информации, которая в дальнейшем должна использоваться в задачах планирования и прогнозирования. Средства многомерного анализа OLAP-систем дают возможность с различной степенью подробности рассматривать показатели, характеризующие состояние бюджета на любой момент времени, выявлять крупнейшие (системообразующие) предприятия, статьи доходов и расходов, а также отслеживать динамику изменения бюджетных показателей в исторической ретроспективе. Таким образом, многомерное представление на основе исторических данных позволяет создать целостную картину бюджетного процесса. С помощью базовых OLAP-средств агрегирования и дезагрегирования данных значительно упрощается решение задач анализа и прогнозирования бюджета.

Для эффективного решения задач планирования и управления бюджетным процессом инструменты многомерного интерактивного анализа данных дополняются инструментами для прогнозирования и статистического анализа данных.

При планировании бюджета перед работниками финансовых органов стоит важная задача прогнозирования показателей доходной части бюджета на различные временные периоды.

В соответствии с Федеральным законом РФ от 20 июля 1995 г. № 115-ФЗ «О государственном прогнозировании и программах социально-экономического развития Российской Федерации» выделяются три вида прогнозирования: долгосрочное, среднесрочное и краткосрочное.

Долгосрочные прогнозы разрабатываются раз в пять лет на десятилетний период. Долгосрочное планирование доходов бюджета является, как правило, частью процесса составления социально-экономического прогноза на долгосрочную перспективу. Данные такого прогноза используются при разработке концепций социальноэкономического развития, прогнозов и программ на среднесрочную перспективу, т. е. на период от трех до пяти лет при условии внесения ежегодных корректив. Краткосрочные прогнозы составляются на финансовый год.

Однако в процессе исполнения бюджета оценивается и анализируется фактическое поступление доходов текущего периода, что отражается в оперативном планировании доходов. Для контроля за ходом поступления доходов в бюджет разрабатываются квартальные и месячные планы, которые не изменяют показателей ранее составленного прогноза доходов бюджета, утвержденного в качестве закона, а конкретизируют их. Соответственно, данные для анализа и прогнозирования бюджета должны рассматриваться в системе с различной степенью агрегированности по времени: по годам, кварталам, месяцам. Гибкое представление данных в процессе OLAP-анализа дает возможность реализовать многовариантный анализ и прогнозирование.

С помощью базовых OLAP-средств значительно упрощается решение задачи анализа и прогнозирования бюджета. В многомерной модели может быть создан, например, показатель «Прогноз поступлений доходов».

Агрегированные показатели могут прогнозироваться на основе модели соответствующего агрегата или получаться суммированием прогнозных значений с нижнего уровня иерархии. Так, например, прогнозные данные о величине поступлений «предприятий района» (агрегат равен сумме поступлений отдельных предприятий) могут быть получены созданием математической модели прогнозирования этого показателя или разработкой моделей прогнозирования поступлений для отдельных предприятий, а затем агрегированием полученных значений.

Аналогичный принцип может использоваться и для любого другого показателя. Такой подход дает аналитику свободу в выборе степени подробности рассмотрения задачи прогнозирования по любому направлению многомерной модели.

Таким образом, применение OLAP-технологий дает возможность построить прогнозы на основе обобщенных агрегированных данных и таким образом получить общую картину или позволяет провести более детальную проработку вопроса, построив модели прогнозирования и вычислив значения прогнозов для элементов нижнего уровня.

Бюджетный прогноз представляет собой сложную, комплексную проблему — необходимо постоянно изыскивать и обновлять самую разнообразную экономическую, финансовую, социальную информацию. Организация единого, централизованного, согласованного хранилища данных, снабженного удобными инструментами для поиска и анализа информации должно способствовать повышению оперативности, достоверности и качества бюджетирования.

Возможность гибкого формирования вариантов прогнозов поступлений с учетом изменения различных экономических условий, применение разнообразных математических моделей прогнозирования, основанных на разных принципах, обеспечивают надежную информационную базу для выполнения многовариантного анализа.

Исходя из перечисленных принципов, была разработана система, предназначенная для: построения прогноза бюджетных показателей с привязкой к бюджетным классификаторам доходов и расходов, объектам административно-территориального деления, видам экономической деятельности и времени; OLAP-анализа вычисленных прогнозов; выявления факторов, влияющих на прогнозируемый показатель и нахождения зависимости показателей от выявленных факторов.

В аналитической системе реализованы следующие функции:

— хранение статистических и прогнозных данных в базе данных для анализа;

— статистическая обработка (очистка) данных (сглаживание, устранение пропусков и аномалий):

— загрузка данных в хранилище из различных источников;

— построение моделей прогнозирования на основе имеющихся данных и хранение их для последующего расчета прогнозов;

— создание многомерных моделей для проведения операций анализа (OLAP-кубов);

— расчет прогнозов и агрегатов в OLAP-кубах;

— загрузка и регулярное обновление данных в хранилище данных;

— создание необходимых моделей прогнозирования на основе исторических данных и запись их в базу моделей;

— вычисление данных прогноза по моделям входящим в состав варианта OLAP-прогноза.

Возможность гибкого формирования вариантов прогнозов поступлений с учетом изменения различных экономических условий, применения разнообразных математических моделей прогнозирования, основанных на разных принципах, обеспечивают надежную информационную базу для выполнения многовариантного анализа.

Исходя из анализа требований задач планирования и прогнозирования бюджетных данных, выбрана модульная структура системы, представленная на рис. 2.

Рисунок 2

Обобщенная структура автоматизированной системы

Для разработки системы использовались следующие средства.

Microsoft Visual Studio, который включает среду разработки с обновленным интерфейсом и отличается интегрированной поддержкой Microsoft SQL Server, позволяя создавать и развертывать проекты с применением сервера баз данных.

Язык программирования VB.NET — объектно-ориентированный язык программирования высокого уровня, являющийся основным языком разработки под платформу .NET Framework 2.0. VB.NET — полноценный первоклассный игрок на поле объектноориентированных языков программирования. Предыдущие версии применяли некоторые элементы концепции ООП. Однако весь набор был реализован только в VB.NET, и это позволило разработчикам VB получить все преимущества объектноориентированной технологии разработки.

MS SQL server — система управления реляционными базами данных с поддержкой средств интеллектуального анализа данных и технологий многомерного интерактивного анализа данных (OLAP). SQL Server является масштабируемой базой данных, может хранить значительные их объемы и поддерживать работу многих пользователей, осуществляющих одновременный доступ к базе данных.

В качестве технологии программирования доступа к данным использовалась ADO.NET как составляющая часть .NET Framework.

Для управления многомерной моделью данных применялась технология ADO MD — расширение ADO, реализованное в библиотеке msadomd.dll и содержащее объектную модель, позволяющую обращаться как к метаданным многомерных баз данных, так и к результатам MDX-запросов.

Для управления аналитическими службами Microsoft Analyses Services использовалась технология SQL DSO. Decision Support Objects (DSO) — это набор библиотек, содержащих COM-объекты, позволяющие создавать и модифицировать многомерные базы данных и их объекты (кубы, коллективные измерения и т. д.).

Решение задач планирования и прогнозирования бюджетных данных в современной аналитической системе предполагает использование широкого круга математических методов анализа и прогнозирования. В этот круг методов должны входить как методы статистического анализа и прогнозирования данных на основе временных рядов, так и методы факторного анализа.

При использовании методов прогнозирования на основе временных рядов рассматривается зависимость бюджетных показателей от единственного фактора — времени, которая являет собой усредненную равнодействующую факторов, влияющих на бюджетный процесс. Для выявления зависимости бюджетных показателей от времени могут применяться трендовые модели. В то же время адаптивные модели прогнозирования, основывающиеся на эвристических алгоритмах, хорошо зарекомендовали себя при решении задач краткосрочного прогнозирования. Для объединения положительных качеств обеих видов моделей прогнозирования используются адаптивные комбинированные модели, являющиеся гибридом моделей первого и второго типа.

Наряду с методами прогнозирования на основе временных рядов в системе должны быть реализованы методы факторного анализа.

Чтобы построить корректные прогнозы с использованием математических методов прогнозирования, система должна обеспечивать выполнение операций предварительной подготовки данных для создания моделей. В ходе подготовительных операций должны решаться задачи приведения исторических данных к сопоставимым величинам путем учета изменения законодательных параметров, влияния инфляции,

а также задача выявления и устранения аномалий с использованием формальных методов очистки данных.

Формально математические методы анализа могут обрабатывать любые данные. Однако для правильного выявления закономерностей они должны удовлетворять определенным требованиям. Предварительный анализ данных нужен, чтобы определить соответствие данных требованиям, предъявляемым к ним математическими методами (объективность, сопоставимость, полнота, однородность и устойчивость).

Сопоставимость данных достигается в результате одинакового подхода к наблюдениям на разных этапах формирования временного ряда. Уровни во временных рядах должны выражаться в одних и тех же единицах измерения, иметь одинаковый шаг наблюдений, рассчитываться для одного и того же интервала времени, по одной и той же методике, охватывать одни и те же элементы, относящиеся к неизменной совокупности.

Полнота данных связана с их количеством. Достаточное число наблюдений определяется в зависимости от цели проводимого исследования временного ряда.

Однородность данных означает отсутствие нетипичных, аномальных наблюдений, а также изломов тенденций.

Устойчивость временного ряда отражает преобладание закономерности над случайностью в изменении уровней ряда.

Невыполнение хотя бы одного из этих требований делает бессмысленным применение любого математического аппарата исследования.

Таким образом, в процессе предварительной обработки данных в системе должны решаться задачи выявления и исправления аномалий.

Для диагностики аномальных наблюдений в системе используется несколько критериев: критерий Ирвина, критерий «квартилей» и др. Обработка пропущенных наблюдений в автоматизированной системе может выполняться путем интерполяции или аппроксимации данных.

Интерполяция данных в автоматизированной системе может выполняться с помощью разных методов (канонический полином, полином Лагранжа или полином Ньютона). Для заполнения пропущенных значений используется аппроксимация кривыми роста, а для выбора класса кривых, наиболее подходящих к данному ряду — метод характеристик прироста.

В качестве аппроксимирующих кривых применяются: прямая, парабола, кубическая парабола, логарифмическая кривая, логарифмическая парабола, модифицированная экспонента, логистическая кривая, кривая Гомперца. Для подбора параметров аппроксимирующих зависимостей в системе был выбран метод наименьших квадратов (МНК).

Для сглаживания выбросов используются такие методы, как скользящее среднее, взвешенное скользящее среднее, адаптивное скользящее среднее, экспоненциальное скользящее среднее.

Ряды данных могут содержать сезонные компоненты. Они могут представлять интерес сами по себе или выступать в роли мешающего фактора. В любом случае их надо выделить и устранить из временного ряда. Для выявления и оценки сезонной составляющей могут применяться методы на основе среднего — аддитивная и мультипликативная модели или их комбинация, носящая название «оценка на основе сезонных индексов».

Выбор инструментов поиска и устранения аномалий производится с помощью окна «Очистка данных», представленного на рис. 3.

Рисунок 3

Выбор метода очистки данных

Очистка данных

Выбор метода очистки | Поиск аномалий] Очистка данных | График]

Выбор метода очистки:------

С Аппроксимация

Подбор параметров зависимости для вычисления значений внутри таблично заданной Функциональной зависимо™.

(* Интерполяция

Поиск Функции заданного вида, проходящей через точки с целью вычисления значений численного ряда. |Полином Ньютона [АО + А1 *(х-нО) + А2“(х-к0)“(х-х1) +...) ]▼] Далее

С Скользящее среднее Скользящее срецнее.

На вкладке «Очистка данных» окна «Очистка данных» (см. рис. 4) осуществляется отображение цветом аномальных значений, выбор изменяемых значений, выполнение расчетов, связанных с устранением и выявлением аномалий и построение отчета.

Рисунок 4

Вкладка для просмотра и выбора заменяемых данных

^Очистка

Выбор метода очистки ] Поиск аномалий Очистка данных | Г рафик ]

иЩ

Время Немодные дан... Высчитанные данные Включить/Зам...

ЕЕШНН^Ш [ШШШШШВШШ и

2 квартал 2... 103.9 103.9 и

3 квартал 2... 105,5 105,5 и

4 квартал 2... 102,6 102,6 и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 квартал 2... 1 103,357142857143 и

2 квартал 2... 107,5 107.500000000001 0

3 квартал 2... 106,8 106.800000000001 0

4 квартал 2... 107,4 107.400000000001 0

Заменить исх. данные

Отменить расчеты

Выйти и сохранить

Параметры аппроксимирующей зависимости, интерполяционного полинома или данные критериев аномальности можно получить в виде отчета. Результаты устранения «выброса» в данных представлены на рис. 5.

Рисунок 5

Результат сглаживания аномального «выброса»

Методы прогнозирования на основе временных рядов основываются на ряде предположений о природе прогнозируемых явлений. При использовании данных методов предполагается, что основным объектом рассмотрения являются последовательности значений каких-либо показателей бюджета в различные моменты времени.

Фактор «Время» является условным представителем всей совокупности причинных факторов, влияющих на показатель.

Значения ряда являются комбинацией нескольких составляющих, отражающих закономерность и случайность развития: D(t) — детерминированная составляющая, используемая для оценки прогноза и E(t) — остаточная(стохастическая) компонента.

Детерминированная составляющая включает: тренд, сезонную компоненту, циклическую компоненту.

В качестве прогнозируемого показателя доходной части бюджета подойдет, например, ежемесячная величина поступлений по конкретному виду налога для предприятия. Модель прогнозирования может модернизироваться на основе новых данных.

При прогнозировании бюджетных данных с использованием временных рядов необходимо обеспечить поддержку решения автоматизированной системой следующих задач:

— анализ и моделирование тенденций;

— количественная оценка взаимосвязи между последовательными уровнями ряда;

— построение прогноза значений временного ряда;

— оценка достоверности прогноза.

В автоматизированной системе для построения прогнозов экономических показателей используются экстраполяционные и адаптивные методы прогнозирования.

Экстраполяция за период наблюдения, т. е. подстановка в модель очередного значения фактора «время» ^=N+1, N+2...) является основой прогнозирования трендовых моделей. Трендовые модели исходят из равноценности всех данных и отражают общую тенденцию развития, поэтому лучше подходят для долгосрочных прогнозов.

Однако для рядов показателей доходов бюджета довольно часто характерна значительная изменчивость уровней ряда, поскольку свойство динамичности развития финансово-экономических процессов часто преобладает над свойством инерционности (модели надо строить, опираясь в основном на малое количество самых свежих данных).

Адаптивные методы прогнозирования позволяют создать самокорректирующиеся (самонастраивающиеся) модели, которые способны отражать изменяющиеся во времени условия, учитывать относительную ценность различных членов временной последовательности и давать достаточно точные прогнозные оценки, что в итоге позволяет получать лучшие результаты при краткосрочном прогнозировании.

Таким образом, для построения различных видов прогнозов временных рядов в систему были включены и экстраполяционные, и адаптивные модели прогнозирования. Среди адаптивных методов прогнозирования временных рядов были выбраны: адаптивный метод «экспоненциальное скользящее среднее», модель Брауна, модель Хольта и модель авторегрессии. Дополнительно для прогнозирования с учетом сезонной составляющей в системе были реализованы сезонные модели скользящего среднего, модель Хольта-Уинтерса и модель Тейла-Вейджа.

Однако в случае среднесрочного прогнозирования ни первая, ни вторая группа методов в отдельности не обеспечивает необходимой точности прогнозирования в силу их узкой специализации. Решение данной проблемы было найдено в использовании адаптивных комбинированных и гибридной модели прогнозирования временных рядов, сочетающих достоинства различных методов прогнозирования.

Адаптивные комбинированные модели формируются путем построения комбинации более простых адаптивных моделей. В зависимости от способа вычисления результирующего значения различают комбинированные модели селективного типа и гибридные комбинированные модели.

Адаптивная селективная модель рассчитана на выбор одного предиктора из некоторого их множества. Вычисления будущих значений ряда осуществляются по каждому из них в отдельности, в качестве прогноза выбирается расчетная величина, полученная по модели, наилучшим образом отражающей на данном временном интервале реальный процесс. Отбор модели осуществляется в соответствии с заданным критерием селекции. Наилучшая модель определяется по критерию качества.

В случае адаптивной гибридной модели прогноз вычисляется как взвешенная сумма прогнозов, полученных по входящим в нее предикторам.

Качество модели оценивается, как правило, двумя дополняющими друг друга характеристиками: точность и адекватность. Интегрированный критерий качества модели, используемый для ее сравнительной оценки, формируется как взвешенная сумма интегрированного критерия точности и интегрированного критерия адекватности.

Состав и количество показателей, используемых для расчета интегрированного критерия качества, зависит от вида оцениваемой модели и настроек системы пользователем. Так, можно задать, что точность характеризуется только коэффициентом детерминации, или коэффициентом детерминации и средней ошибкой аппроксимации, или всеми тремя перечисленными выше критериями точности. Значения отдельных критериев оценки рассчитывается автоматически по исходным и вычисленным с помощью модели данным. Предварительно для каждого отдельного критерия выполняется процедура его нормировки.

Под адекватными моделями понимаются такие, у которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения. Для проверки указанных свойств существует ряд специализированных критериев, таких как: критерии наличия автокорреляции остатков, сериальная корреляция первого порядка, автокорреляционная функция (АКФ), частная автокорреляционная функция (ЧАКФ), критерий Дурбина-Уотсона. Перечисленные критерии после нормировки включаются в состав интегрированного критерия адекватности модели.

Однако в задачах принятия управляющих решений при планировании и управлении доходной частью бюджета часто помимо получения простого прогноза бюджетного показателя требуется также определить факторы, влияющие на его изменение и оценить это влияние количественно. Данную проблему можно решить только применением методов факторного анализа. Поэтому в систему была включена хорошо зарекомендовавшая себя на практике мультипликативная факторная модель прогнозирования.

Первоначальный набор факторов для включения в модель формируется пользователем. В процессе создания модели выбираются значимые факторы и формируется аналитическая зависимость исследуемого показателя.

Расчет параметров результирующей зависимости осуществляется методом наименьших квадратов. Состав модели формируется исходя из критерия минимизации остаточной дисперсии. Для расчета временного прогноза производится расчет значений исследуемого показателя по упорядоченной во времени совокупности значений факторов для периода упреждения. Статистическая модель для расчета значения исследуемого показателя формируется в виде произведения одномерных функций, каждая из которых зависит от отдельного фактора.

В общем виде модель может быть представлена как:

т

у=со П ъ х' с) >

]=±

где Со — свободный член;

Ъ — произвольная одномерная функция;

хj — значение фактора;

с — вектор коэффициентов функций;

т — количество одномерных функций, входящих в модель.

Одномерные функции выбираются из набора опорных функций, являющихся стандартными одномерными функциями (линейная, квадратичная, степенная и др.) и хранящихся в системе. Данный метод позволяет свести сложную задачу формирования многомерных статистических зависимостей к последовательности формирования одномерных статистических моделей.

Создаваемые модели прогнозирования временных рядов и факторные модели накапливаются в системе и могут использоваться для вычисления прогнозных значений показателей бюджета с целью их дальнейшего анализа с помощью О^Р-инструментов.

Создание модели прогнозирования в системе рассмотрим на примере построения адаптивной модели Брауна и мультипликативной факторной модели.

Для создания адаптивной модели прогнозирования Брауна пользователь выбирает тип модели в окне «Выбор создаваемой модели» (рис. 6).

Рисунок 6

Окно выбора параметров для создания модели Брауна

0 С-лдоШ ".'.ШНЯЩШШ :

1 Выбор основных параметров модели :| Таблица и график |

Ь™ Выбрать исторические данные

Выбрать корреспондента Построить модель |

|ввп — 1

Выбрать доход/налог

0 |1 Квартал 2002 | По |4 квартал 2004 | Исторический период

(♦ задать вручную [0...1] |о.е Вперед на | 3 шагов

І Т екущие параметры модели:

Корреспондент:Россия Налог: ВВП Выбранный интервал времени для построения модели: с 1 квартал 2002 по 4 квартал 2004

Для построения модели необходимо указать корреспондента (плательщика в бюджет), вид прогнозируемого дохода (налога), временной интервал для отбора исторических данных, а также предполагаемое количество периодов времени, на которые будет построен прогноз.

В рассматриваемом примере корреспондентом является Россия, прогнозируемым показателем — ВВП, данные на уровне кварталов с I кв. 2002 г. по IV кв. 2004 г. Коэффициент дисконтирования (убывания значимости исторических данных) по умолчанию равняется 0,5 и может варьироваться от 0 до 1. Минимальное количество спрогнозированных значений — один период. Указав перечисленные параметры, можно просмотреть данные для построения модели (вкладка «Таблица и график», рис. 7).

Рисунок 7

Представление исходных данных

В этом окне возможен вызов мастера «Очистка данных» для выявления и устранения аномальных значений в выбранном ряду данных.

После возврата на вкладку параметров модели и щелчка по кнопке «Построить модель» будет построена адаптивная модель Брауна и рассчитан пробный прогноз на указанное количество шагов.

Результаты моделирования: модели прогнозирования ряда сохраняются в базе моделей и могут использоваться в дальнейшем для расчета прогнозных значений показателя, включаемых в многомерный гиперкуб для OLAP-анализа данных.

Для создания факторной модели вызывается окно создания факторной модели, представленное на рис. 8.

Рисунок 8

Окно создания факторной модели

=» Ь Г®:

11Выбор ос^^ Таблица исторических данных | Графики |

Корреспондент: Россия Налог: ВВП

Выбранный интервал времени для построения модели: с 1 квартал 2002 по 4 квартал 2004

Для построения модели необходимо задать корреспондента (плательщика в бюджет), вид прогнозируемого дохода (налога). Также предусмотрена возможность поиска ранее созданных моделей прогнозирования для данного пересечения. Для ввода или выбора значений факторов и исследуемого показателя нужно указать временной

диапазон исторических данных. Перечень факторов для исследования выбирается из классификатора показателей системы. С целью оптимизации времени построения модели пользователь может осуществить отбор базовых кривых, включаемых в состав исследований.

Данные факторов и анализируемого показателя отображаются в графическом или табличном виде на вкладках «Таблица исторических данных » и «Графики» (см. рис. 9).

Рисунок 9

Диаграмма изменения фактора во времени

После построения модели можно получить отчет (см. рис. 10) о созданной модели, щелкнув по кнопке «Описание модели».

Рисунок 10

Отчет с параметрами факторной модели

Параметры модели:

Дата создания модели: 03.07.2009 13:39:40 Прогнозируемые поступления по: классификатору корреспондентов Россия классификатору налогов ВВП

Выбранный интервал времени для построения модели: с I кв. 2002 по IV кв. 2004 Факторы, вошедшие в модель:

Экспорт товаров ($млрд)

Выбранный тип кривой для данного фактора — линейная функция вида ax + b, где a = 7,25732055524973E-03, b = 1,03658729641746 Индекс потребительских цен (% к пред. периоду)

Выбранный тип кривой для данного фактора — линейная функция вида ax + b, где a = 0,851644236390094, b = —0,692172852916135 Цена нефти Urals (долл.за баррель)

Выбранный тип кривой для данного фактора — линейная функция вида ax + b, где a = 0,712046667009599, b = —0,381479518482677 Конечный вид мультипликативной факторной модели:

y = (7,25732055524973E-03 • x1 + 1,03658729641746) • (0,851644236390094 -x2 —

0,692172852916135) • (0,712046667009599 • x3 — 0,381479518482677),

где

x1 — экспорт товаров ($млрд); x1 = (x1 — 21,6)/(52,9 — 21,6)

x2 — индекс потребительских цен (% к пред. периоду); x2 = (x2 —100,6)/(105,4 — 100,6) х3 — цена нефти Urals (долл. за баррель); x3 = (x3 — 19,8)/(37,8 —19,8)

Результаты расчета значений прогнозного показателя могут быть представлены в табличном или графическом виде и экспортированы в формат Excel, как представлено на рис 11.

Рисунок 11

Исторические данные и ретроспективный прогноз

Валовой внутренний продукт (млрд руб.)

Аппрокси-

мирующая

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

кривая

Результат создания модели фиксируется в базе моделей системы и позволяет вычислять прогноз показателя на различные периоды времени.

Хранилище данных является важной составляющей частью системы прогнозирования и анализа бюджетных данных, во многом определяющей надежность и быстродействие работы последней.

Основной функцией разрабатываемой базы данных является хранение бюджетных данных и моделей прогнозирования для последующего их анализа и прогнозирования для долгосрочного и оперативного планирования.

Разработанная схема загрузки данных обеспечивает выполнение операций предварительной подготовки данных для построения моделей прогнозирования. В процессе выполнения подготовительных операций решаются задачи приведения исторических данных к сопоставимым величинам путем учета изменения законодательных параметров, влияния инфляции.

Для процесса предварительной подготовки данных реализован ряд формальных методов очистки данных, выявления и устранения аномалий.

При прогнозировании в системе создаются различные варианты прогнозов поступлений. Возможность гибкого формирования вариантов прогнозов поступлений с учетом изменения различных экономических условий, применения разнообразных математических моделей прогнозирования, основанных на разных принципах, обеспечивают надежную информационную базу для выполнения многовариантного анализа.

Информация в хранилище данных подразделяется на статистические (исторические) и прогнозные данные (полученные в результате вычисления прогноза или задаваемые как предполагаемые сценарные условия для вычисления прогноза).

Анализируемая информация — данные сформированных вариантов и исходная информация показателей, используемых для построения моделей, — хранится в виде многомерной структуры (для проведения) OLAP-анализа, а информация о моделях

прогнозирования для экономии места и повышения эффективности доступа хранится в реляционной базе данных, как представлено на рис. 12.

Рисунок 12

Схема хранения данных системы

Реляционная база данных моделей

Информация параметров и структуры моделей прогнозирования

Очищенная информация для формирования моделей прогнозирования и данные ретропрогнозов

Многомерная база данных OLAP

Модели прогнозирования

Варианты прогнозов поступлений

Фактографическая информация из внешних источников

і

і

Хранилище исторических данных

Историческая Историческая информация

информация для системы комплексного

для создания моделей анализахода исполнения

прогнозирования бюджета

і

\

і

Данные Федеральной службы Данные Федерального

государственной статистики казначейства

На сегодняшний день наиболее доступным открытым официальным источником информации для использования в системе прогнозирования доходной и расходной частей бюджета является сайт Федеральной службы государственной статистики. Он предоставляет информацию о демографических, социальных и экономических показателях страны, которая может использоваться в качестве независимых или целевых переменных в факторных моделях прогнозирования.

Предварительно очищенная и агрегированная информация из внешних источников размещается в хранилище данных в жесткой привязке к временной шкале и в дальнейшем может использоваться как для 01_АР-анализа, так и для создания моделей прогнозирования.

Многомерная база данных для решения задачи анализа доходной части бюджета включает следующие измерения:

— «доходы» — бюджетный классификатор доходов;

— «время». Иерархия состоит из четырех уровней: год — полугодие — квартал — месяц;

— «ОКАТО» — административно-территориальный классификатор;

— «ОКВЭД» — классификатор видов экономической деятельности и информации о них.

С целью моделирования влияния различных факторов на показатели доходной части бюджета в системе предусмотрена возможность создания и редактирования классификатора показателей. Значения показателей хранятся в системе в привязке к временной шкале и могут загружаться из внешних источников.

С точки зрения анализа бюджетных данных каждый анализируемый факт удобно рассматривать как функцию от его характеристик. Таким образом, естественная структура базы данных для подобного представления — это многомерный куб, ребра которого соответствуют измерениям, а внутренний объем — мерам.

Гиперкуб с данными бюджетных показателей включает следующие измерения: время; классификатор доходов/налогов; классификатор корреспондентов.

Для создания гиперкуба варианта необходимо задать начальные параметры в окне «Создание варианта», представленном на рис. 13.

Рисунок 13

Окно задания параметров при создании варианта гиперкуба

* Создание варианта х]

-11 ара метры варианта:

Н азвание варианта: | и Сследование динамики В В П

Временной интервал, на котором бвдет построен вариант:

С 1 квартал 2005 По 4 квартал 2006 | |: Выбрать интервал ;|

1 1

Нажмите кнопку "Создать вариант"

1

Параметры сознаваемого варианта: Создать вариант |

Название варианта: Исследование динамики ВВП Вариант строится на временном интервале 1 с: 1 квартал 2005 по: 4 квартал 2005 Т ип варианта квартальный

Закрыть

При создании варианта в многомерной базе OLAP появляется новый куб с идентификатором следующего формата «УХХХ», где «ХХХ» — целое число, (порядковый номер варианта). На начальном этапе в гиперкубе не содержится прогнозных данных. Для пополнения варианта данными нового прогноза необходимо воспользоваться окном «Редактирование варианта».

В окне отображен список построенных ранее вариантов с краткой характеристикой:

— идентификационный номер варианта;

— название;

— временные границы варианта нижнего уровня времени в иерархии измерения «время»;

— дата создания.

Для добавления моделей прогнозирования к варианту доходной части бюджета необходимо указать пару значений корреспондент/вид дохода.

Отображение найденных/созданных моделей для расчета прогнозов в варианте производится автоматически после задания условий поиска, как показано на рис. 14.

Рисунок 14

Окно для выбора модели прогнозирования

Добавление моделей в вариант х|

Идентификатор варианта: У28 1 Описание варианта: Исследование динамики ВВП Начало периода: 1 квартал 2005 Конец периода: 4 квартал 2005 Дата создания: 2005-12-0713:30:47 —I

I Россия ы

Выбрать корреспондента I

ІВВП ы

Выбрать доход/налог I

I

п

'

І I

Коменгарий к модели: I

Идентификатор модели: Є80 I ■ Факторная модель

Дата создания: |07.12.200513:38:41

Модель построена на интервале с: И квартал 2002

по: |4 квартал 2004

Прогноз высчитан: I Нет

Высчитать прогноз

I

Ок

Для добавления в куб данных прогнозных значений, вычисленных по выбранной модели, кнопкой «Вычислить прогноз» открывается окно «Вычисление прогноза для варианта», представленное на рис. 15.

Рисунок 15

Окно «Вычисление прогноза для варианта»

!* Вычисление прогноза для варианта

X]

Г и писание модели: Корреспондент: |Россия

1=1

Налог/доход: |ВБП ~

Коменгарий к модели:

Идентификатор модели: ІЄ30

Дата создания: lQ7.12.2005 13:38:41

Модель построена на интервале с: |1 квартал 2002

по: 4 квартал 2004

Статистические данные на основе которых строится прогноз:

Экспорт товаров (млрд. долларов [ Индекс потребительским цен [X к пред. п Цена нефти

1 квартал 2005

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 квартал 2005

3 квартал 2005

4 квартал 2005

Высчитать прогноз

□чистка данных

В таблице данных (рис. 15) задаются предполагаемые значения факторов, от которых зависит прогнозируемый показатель.

Результаты прогнозирования записываются в гиперкуб для последующего анализа. Система предоставляет возможность просмотра содержимого многомерного куба при помощи электронных таблиц Excel и программы многомерного анализа бюджетных данных «Бюджет-аналитик».

ЗАКЛЮЧЕНИЕ

В настоящее время разработано и используется большое количество автоматизированных систем исполнения бюджета. Они решают важную роль сбора первичных данных и автоматизации исполнения бюджета.

Однако количество специализированных систем для поддержки принятия решений в области бюджетного процесса невелико, в особенности систем, использующих последние достижения в области интеллектуального анализа данных, в том числе технологии интерактивного многомерного анализа данных.

Применение традиционных методов прогнозирования на основе временных рядов и адаптивных методов прогнозирования в сочетании с технологией многомерного анализа данных показало высокую эффективность.

Принципы прогнозного моделирования в сочетании с многовариантным подходом предоставляют возможность гибкого прогнозирования развития бюджетного процесса в различных сценарных условиях.

Использование методов интеллектуального анализа данных обеспечивает автоматизированное выявление влияющих факторов и построение аналитической зависимости целевого показателя для любого набора факторов с различной степенью агрегирования, что дает возможность осуществлять разносторонний анализ бюджетных данных для выработки целевой бюджетной политики.

Применение методов интерактивного многомерного анализа данных в сочетании с широким спектром математических методов прогнозирования бюджетных данных существенно повышает качество принимаемых решений.

Целесообразно активизировать работы по созданию и внедрению в практику работы органов финансового управления аналитических систем на основе методов интерактивного анализа данных в сочетании методами факторного анализа и прогнозирования временных рядов.

Библиография

1. Бэйн, Т., Госнелл, Д. Visual Basic .Net и SQL Server 2000. Эффективный уровень данных / пер. с англ. С. М. Молявко. — М.: Бином. Лаборатория знаний, 2004. — 604 с.: ил.

2. Ларсон, Б. Разработка бизнес-аналитики в Microsoft SQL Server 2005. — СПб.: Питер, 2008. — 684с.: ил.

3. Каленик, А. И. Использование новых возможностей Microsoft SQL Server 2005. — М.: Русская редакция; СПб.: «Питер», 2006. — 334с. : ил.

4. Э. Дж. Браст, С. Форте. Разработка приложений на основе Microsoft SQL Server 2005. Мастер-класс. / пер. с англ. — М.: Русская редация, 2007 — 880 с.: ил.

5. Прокофьев, С. Е, Мазина, Е. Б., Шубина, Л. В. Комментарии к бюджетной классификации Российской Федерации. — М. — 2006.

6. Спирли, Э. Корпоративные хранилища данных. — М.: Издательский дом Вильямс, 2001.

7. Дюк, В., Самойленко, А. Data mining: уч. — СПб: Питер, 2001.

8. Коннолли, Т. и др. Базы данных: уч. пособие. — М.: Издательский дом Вильямс, 2000.

9. Общероссийский классификатор видов экономической деятельности ОКВЭД ОК 029-2001 (КДЕС Ред. 1) / [Электронный ресурс]: официальный сайт компании «Консультант Плюс». — Режим доступа:

http://base.consultant.ru/cons/cgi/online.cgi?req=doc;base = LAW;n=34086

10. Официальный сайт Федеральной службы государственной статистики [Электронный ресурс] — Режим доступа: http://www.gks.ru/, свободный.

i Надоели баннеры? Вы всегда можете отключить рекламу.