Научная статья на тему 'Программный комплекс расчета моделей прогнозирования'

Программный комплекс расчета моделей прогнозирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
224
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДОБРАБОТКА ДАННЫХ / МЕТОД ПРОГНОЗИРОВАНИЯ / ТРЕНДОВАЯ МОДЕЛЬ / РЕГРЕССИОННАЯ МОДЕЛЬ / ПРОГРАММНОЕ ПРИЛОЖЕНИЕ / PRELIMINARY DATA PROCESSING / FORECASTING METHOD / TREND MODEL / REGRESSION MODEL / PROGRAM APPLICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бучацкая Виктория Викторовна, Студенцов Дмитрий Витальевич

Рассматривается необходимость создания программного модуля, реализующего некоторые методы прогнозирования и методы предварительной обработки временных рядов, учитывающие наличие случайных составляющих типа аномальных значений. Описываются структура и алгоритм работы такого приложения, реализующего эти методы прогнозирования. Результат работы продемонстрирован на примере.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бучацкая Виктория Викторовна, Студенцов Дмитрий Витальевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Program complex of calculation of models of forecasting

This paper shows the need to create the program module realizing some methods of forecasting and preliminary processing temporal series, considering existence of casual components of the abnormal value type. The publication describes the structure and algorithm of work of such module, realizing these methods of forecasting. Based on an example, we show the result of this work.

Текст научной работы на тему «Программный комплекс расчета моделей прогнозирования»

УДК 621.398 ББК 32.965.7 Б 94

Бучацкая В.В.

Кандидат технических наук, доцент кафедры прикладной математики и информационных технологий факультета математики и компьютерных наук Адыгейского государственного университета, Майкоп, тел. (8772) 59-39-04, e-mail: buch_vic@mail.ru Студенцов Д.В.

Студент 4 курса факультета математики и компьютерных наук Адыгейского государственного университета, Майкоп, тел. (8772) 59-39-04, e-mail: studentsoff@gmail.com

Программный комплекс расчета моделей прогнозирования

(Рецензирована)

Аннотация. Рассматривается необходимость создания программного модуля, реализующего некоторые методы прогнозирования и методы предварительной обработки временных рядов, учитывающие наличие случайных составляющих типа аномальных значений. Описываются структура и алгоритм работы такого приложения, реализующего эти методы прогнозирования. Результат работы продемонстрирован на примере.

Ключевые слова: предобработка данных, метод прогнозирования, трендовая модель, регрессионная модель, программное приложение.

Buchatskaya V.V.

Candidate of Technical Sciences, Associate Professor of the Department of Applied Mathematics and Information Technology, Faculty of Mathematics and Computer Science, Adyghe State University, Maikop, ph. (8772) 59-39-04, e-mail: buch_vic@mail.ru Studentsov D.V.

Fourth-year student of Faculty of Mathematics and Computer Science, Adyghe State University, Maikop, ph. (8772) 59-39-04, e-mail: studentsoff@gmail.com

Program complex of calculation of models of forecasting

Abstract. This paper shows the need to create the program module realizing some methods of forecasting and preliminary processing temporal series, considering existence of casual components of the abnormal value type. The publication describes the structure and algorithm of work of such module, realizing these methods of forecasting. Based on an example, we show the result of this work.

Keywords: preliminary data processing, forecasting method, trend model, regression model, program application.

Стремительно развивающиеся компьютерные технологии способны накапливать, обрабатывать, передавать и хранить огромные объемы цифровой информации, в которых содержатся скрытые знания. Эти информационные ресурсы могут быть эффективно использованы для анализа и принятия решений в рамках работы таких программных комплексов, как ситуационные центры. Одной из основных задач центра является задача прогнозирования. Решение подобных задач осуществляется в основном статистическими пакетами прикладных программ. Они открыли новые горизонты использования методов прикладной статистики. Однако большинство этих приложений отличаются высоким уровнем сложности для реализации и анализа прогнозных моделей, дороговизной, а также отсутствием достаточного внимания на анализ и устранение аномальных значений, отсутствием механизма встраивания в состав других программных приложений в виде отдельного программного модуля.

В связи с этим актуальным является создание дружественного по отношению к пользователю программного приложения, реализующего информационно-аналитическое обеспечение технологий прогнозирования, которое может быть использовано как самостоятельное приложение, а также как отдельный модуль в составе программного обеспечения ситуационного центра.

Методика прогнозирования, представленная в [1], реализована в виде компьютерного приложения «ОРБИТА 1.0», алгоритм работы которого представлен на рисунке 1 [2].

Рис. 1. Алгоритм работы программного приложения

Программа выполняет следующие функции: ввод данных пользователем с клавиатуры или загрузка их из файла; предобработка данных (сглаживание и устранение аномальных значений); проверка наличия тренда; выбор метода прогнозирования в зависимости от особенностей исходных данных; оценка адекватности модели прогнозирования; выбор наиболее точной модели. В приложении реализованы трендовые (с различными видами кривых) и регрессионный методы прогнозирования [3].

Рассмотрим более подробно этапы и логику работы программы.

Загрузка исходных данных производится из файла формата Microsoft Excel 2007. Этот формат является очень распространенным и простым для пользователя. Таблица должна иметь следующий формат: первая строка содержит названия переменных, первый столбец - обозначения промежутков времени.

Расчет числовых характеристик включает в себя вычисление математического ожидания, дисперсии, среднеквадратического отклонения и ряда других статистических величин, необходимых в дальнейшем для подбора прогнозной модели.

В процессе подготовки исходных данных для прогнозирования необходимо наличие проверки на присутствие аномальных значений, т.е. значений, которые не отвечают потенциальным возможностям исследуемой системы и которые, оставаясь в качестве уровней ряда, оказывают существенное влияние на значения основных характеристик, в том числе на трендовую модель [4]. В этом качестве применен метод Ирвина. При этом аномальные значения устраняются либо заменой аномальных уровней простой средней арифметической двух соседних уровней ряда, либо заменой аномальных уровней соответствующими значениями по кривой, аппроксимирующей данный временной ряд [5]. Более точным является второй вариант, который и реализован в приложении.

С целью более четко выявить тенденцию развития исследуемого процесса необходимо выполнить сглаживание (выравнивание) исследуемого временного ряда. Наиболее простым и удобным является метод взвешенной скользящей средней. Именно этот алгоритм реализован в программе.

Далее определяется наличие тренда. Одним из самых точных и надежных считается метод Фостера-Стюарта [5]. Кроме тренда самого ряда (как говорят, тренда в среднем) он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т.д.

Следующим этапом является построение прогнозной модели. Для программной реализации нами были выбраны модели: полиномиальная первого, второго порядка, а также регрессионная модели. Более сложной с точки зрения реализации является регрессионная модель, т.к. она требует большого объема дополнительной информации [5]. В связи с этим в программном приложении реализованы следующие функции:

• анализ корреляционных связей для выявления наличия статистически значимых связей между переменными и оценки степени их тесноты;

• проверка переменных модели на мультиколлинеарность.

Обязательным этапом является оценка адекватности и точности полученных моделей. Независимо от вида и способа построения математической модели вопрос о возможности ее применения в целях анализа и прогнозирования может быть решен только после установления адекватности, т.е. соответствия модели исследуемому процессу или объекту. Для адекватных моделей имеет смысл ставить задачу оценки их точности. В качестве статистических показателей точности использованы следующие [5]: средне-квадратическое отклонение, средняя относительная ошибка аппроксимации, коэффициент сходимости, коэффициент детерминации.

Алгоритм оценки качества регрессионной модели также включает в себя две части: проверку адекватности модели и оценку точности. Сначала необходимо оценить

значимость каждого коэффициента регрессии [6] на основании ¿-критерия Стьюдента. Проверка адекватности всей модели выполняется по ^-критерию Фишера. Определение точности прогнозной модели возможно осуществлять несколькими способами, напри-

мер, по критерию среднеквадратической ошибки Se =

- ~ )2

или показателю

n = к

средней ошибки аппроксимации е — — ^ ——— -100% , где уг - фактическое значение

П Уг

признака, уг - значение по уровню регрессии.

Результатом работы программы является построение прогнозной модели и расчет значений прогнозируемого показателя на указанный период. Эти сведения представляются как в текстовом варианте, так и в графическом. Работа программы проверена на примерах данных о динамике изменения курсов валют, уровня прожиточного минимума и других социально-экономических показателей. Результат работы программы на примере показателя, используемого для оценки эффективности деятельности органов местного самоуправления городских округов и муниципальных районов (Краснодарский край), представлен на рисунке 2. Данные приведены из ежегодного статистического сборника [7].

Выберите параметр: V

а) результат построения трендовых моделей

О 5 PSA ? (ОетомХгэЧкэт IJIMWI Флйл Справка Выберите параметр; * т

Исходны* личные Критерий Ирнннл Трецдовм« нддои 1"егресо"»*аи иодель

Чиммвнн* Средней. ОГК. Ср. отн. ошпЬш

.00 00« 4RB4SL S6S JSJ и 0 3 04 ISS9SJ и л- X4J ♦ t -69 R30 301473 WS Об И"; Г 541 7А S 0 «4 м lag лл

"1Ч иишмт

\ - — - -1

»&U Л Л (4

/

».«61 »73 Г »41-» \

\ ■

Sj / s

\ / \

/ \

>Z*J ТЙ14 7.171 S у 1 1 \ /

\ /

ч

\ {

\ \ /

V \ / V

ewj /

ч S /

1 J « • i • « и О К 1* 1» П 1* » 71 7* Ж

б) результат построения регрессионной модели Рис. 2. Результат работы программного приложения

Программное приложение реализовано средствами среды визуального программирования Delphi. Это позволило создать стандартный Windows-интерфейс для программы, максимально понятный для пользователя, обеспечить ввод и вывод информации в удобном для чтения виде, а также связь с вычислительным блоком программы. Результаты прогнозирования представляются для дальнейшего анализа.

Особенностью созданного приложения является то, что от пользователя не требуется специальных знаний в области математической и теоретической основы методологии прогнозирования, а также информационных технологий. В дальнейшей работе планируется расширение диапазона доступных для выбора методов прогнозирования, а также совершенствование технологий программирования для реализации кроссплат-форменности приложения.

Примечания:

1. Симанков В.С., Бучацкая В.В. Обзор методов прогнозирования. Деп. в ВИНИТИ. 2012. № 9, б/о.

2. Бучацкая В.В., Бучацкий П.Ю., Студенцов Д.В. Свидетельство о государственной регистрации программы для ЭВМ № 2014619633 Программный комплекс информационно-аналитического обеспечения технологий прогнозирования («ОРБИТА 1.0»).

3. Бучацкая В.В. Сравнительный анализ некоторых моделей прогнозирования временных рядов // Актуальные проблемы прикладной математики, информатики и механики: материалы Междунар. конф. Воронеж, 2012. С. 8-10.

4. Бучацкая В. В. Методика определения интервальных оценок при прогнозировании методами экстраполяции // Вестник Адыгейского государственного университета. Сер. Естественно-математические и технические науки. 2012. Вып. 3 (106). С. 136-140.

URL: http://vestnik.adygnet.ru

5. Экономико-математические методы и прикладные модели: учеб. пособие для вузов / В.В. Федосеев, А.Н. Гармаш, Д.М. Дайитбегов [и др.]; под ред. В.В. Федосеева. М.: ЮНИТИ, 1999. 391 с.

6. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. 3-е изд. М.: Диалектика, 2007. 912 с.

7. Территориальный орган федеральной службы государственной статистики по Краснодарскоу краю.

URL: http ://www.krsdstat.ru/munstat/default.aspx

References:

1. Simankov V.S., Buchatskaya V.V. Review of methods of forecasting. VINITI Dep. 2012. No. 9, b/o.

2. Buchatskaya V.V., Buchatskiy P.Yu., Student-sov D.V. The certificate on the state registration of the computer program No. 2014619633 the Program complex of information and analytical ensuring of technologies of forecasting («ORBITA 1.0»).

3. Buchatskaya V.V. Comparative analysis of some models of forecasting of time series // Actual problems of applied mathematics, informatics and mechanics: materials of the International conf. Voronezh, 2012. P. 8-10.

4. Buchatskaya V.V. Technique to define the interval estimates when forecasting by extrapolation methods // The Bulletin of the Adyghe State University. Ser. Natural-Mathematical and Technical Sciences. 2012. Iss. 3 (106). P. 136-140.

URL: http://vestnik.adygnet.ru

5. Economic-mathematical methods and applied models: a manual for higher schools / V.V. Fe-doseev, A.N. Garmash, D.M. Dayitbegov [etc.]; ed. by V.V. Fedoseev. M.: UNITY, 1999. 391 pp.

6. Draper N., Smith H. Applied regression analysis. 3rd ed. M.: Dialectics, 2007. 912 pp.

7. Territorial authority of the Federal State Statistics Service in Krasnodar Krai.

URL: http://www.krsdstat.ru/munstat/default.aspx

i Надоели баннеры? Вы всегда можете отключить рекламу.