Научная статья на тему 'Алгоритм выбора эффективного количественного метода прогнозирования'

Алгоритм выбора эффективного количественного метода прогнозирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
173
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕРА НЕОПРЕДЕЛЕННОСТИ ИНФОРМАЦИИ / В-ЭНТРОПИЯ / АЛГОРИТМ / МЕТОД ПРОГНОЗИРОВАНИЯ / THE MEASURE OF UNCERTAINTY INFORMATION / B-ENTROPY / ALGORITHM / A PREDICTION METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дулесов Александр Сергеевич, Хрусталёв Виталий Игоревич

Представлены модель и алгоритм определения меры неопределенности информации. Дано обоснование применимости данной меры в отличие от меры Шеннона посредством введения расстояния между значениями событий. Рассмотрен пример выбора эффективного количественного метода прогнозирования параметров системы. Варианты сопоставлялись исходя из определения величины погрешностей и энтропии. На примере показано, что алгоритм является эффективным инструментом в выборе метода прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дулесов Александр Сергеевич, Хрусталёв Виталий Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithm of the choice of the effective quantitative method forecasting

The article presents the pattern and algorithm for identification of information uncertainty measure. It gives theaplicability grounds of the suggested measure versus Shannon’s measure by introduction a distance between the mea nings of the events. An example of choice of effective quantitative variant method of prediction of the system parameters is also analyzed. The variants were compared by determining the quantity faults and entropy. The example illustrates the fact that algorithm is an effective tool in the choice of the prediction method.

Текст научной работы на тему «Алгоритм выбора эффективного количественного метода прогнозирования»

ТЕХНИЧЕСКИЕ НАУКИ

УДК 330.47

АЛГОРИТМ ВЫБОРА ЭФФЕКТИВНОГО КОЛИЧЕСТВЕННОГО МЕТОДА ПРОГНОЗИРОВАНИЯ

А. С. Дулесов, В. И. Хрусталёв

Хакасский государственный университет им. Н. Ф. Катанова

Представлены модель и алгоритм определения меры неопределенности информации. Дано обоснование применимости данной меры в отличие от меры Шеннона посредством введения расстояния между значениями событий. Рассмотрен пример выбора эффективного количественного метода прогнозирования параметров системы. Варианты сопоставлялись исходя из определения величины погрешностей и энтропии. На примере показано, что алгоритм является эффективным инструментом в выборе метода прогнозирования.

Ключевые слова: мера неопределенности информации, В-энтропия, алгоритм, метод прогнозирования.

Решение задачи прогнозирования сводится к получению прогноза параметров. При этом ни один из методов прогнозирования не способен дать точный результат по причине присутствия неопределенности информации при подготовке и обработке прогнозируемых параметров.

Общеизвестно, что повышение качества прогнозов и систем прогнозирования является составной частью развития науки прогнозирования и в целом относится к развитию системного анализа, цель которого заключается в исследовании эволюции сложных систем.

Под понятием «качество» понимают не только точность прогноза, но и полноту набора прогнозируемых величин, корректность математической модели, знания и опыт оператора и т. д. Если говорить о системе прогнозирования в целом, то здесь речь идет о её совершенстве, то есть о практической пригодности системы для достижения цели получения наилучшего прогноза. Можно задать резонный вопрос: какая из систем наиболее совершенна? Ответ очевиден: та, которая имеет наименьшую неопределенность.

Качество прогноза отражается в его конечном результате, за величинами которого скрыты факторы, влияющие на процесс прогнозирования. Системный анализ факторов может дать ответ на поставленный вопрос, а именно: какими качествами обладает прогноз. Однако решение такой задачи трудоемко и востребовано тогда, когда нас будет интересовать личный вклад (в общую неопределенность) каждого из системообразующих элементов в достижении результата прогноза. В том случае, когда требуется выбрать наилучший из вариантов прогноза, можно ограничиться рассмотрением только «точностного» аспекта качества прогнозирования. Далее в работе под «качеством» прогнозирования понимается исключительно «точность» прогнозирования.

Опираясь лишь на точность прогнозирования, исследователи используют определенный инструментарий -оценку погрешности прогнозирования. Он не претендует на завершенность, однако позволяет оценивать точность анализируемых систем. Уже на основе такой оценки их можно сопоставлять между собой [1]. В этой же работе говорится о том, что сравнительный анализ точности прогнозов ранее не проводился. Этого не делалось, возможно, по причине отсутствия достаточного набора данных для регулярного сравнения прогнозных и фактических величин.

Оценка погрешности опирается на относительную ошибку как разность между прогнозным и фактическим значениями. Величина ошибки показывает отклонение прогноза от реальности, то есть фактических данных от прогнозных значений, и по своему содержанию является характеристикой (мерой) точности измерений.

Оценивая погрешность прогнозирования и погрешность измерений, исследователи фактически используют одни и те же математические инструменты. Однако за каждым из этих процессов стоит понятие «неопределенность»: «неопределенность прогнозирования» и «неопределенность измерений». Такое сходство понятий позволяет применять методы, направленные на определение меры неопределенности информации в задаче выбора методов прогнозирования из альтернативных.

Решая задачу выбора метода прогнозирования, будем исходить из понятия «эффективный метод». Для нас оно означает, что среди рассматриваемых альтернативных методов эффективным является метод, прогнозируемые параметры которого наилучшим образом приближены к фактическим результатам.

Моделирование процесса получения меры неопределенности. К. Шеннон предлагает следующее определение информации: информация - результат выбора из возможных альтернатив. Он также предложил формулу для её определения. Последующее развитие теории информации позволило трактовать применение формулы Шеннона как возможность определения энтропии неопределенности информации:

м

н(х) = -£р{х)\о%р(х1) , (1)

1=1

гдер(х,) - вероятность появления события (исхода) хI( = 1, 2, ...,М).

Несмотря на полезность (1) в выборе качественного прогноза из имеющихся альтернатив, формула Шеннона имеет недостаток: не позволяет сопоставить величины исходов между собой. Фактически мера Шеннона не может претендовать на полный учет всех факторов, определяющих неопределенность поведения системы в полном смысле, какой может встретиться в жизни. Приведем пример. Следует определить энтропию для двух

ансамблей случайных величин. В первом ансамбле имеется три величины (0,9; 1,1 и 1,0) с вероятностями соответственно (0,25; 0,5; 0,25), во втором - величины (100; 1; 1000) с вероятностями (0,5; 0,25; 0,25). Применив (1) видно, что значения энтропий равнозначны и зависят только от вероятностей исходов опытов, но не зависят от того, каковы сами исходы: насколько они «близки» или «далеки» друг от друга в смысле величин.

В настоящей работе эта проблема имеет своё решение, связанное с реализацией нового подхода к понятию вероятностного пространства стохастических данных, которое должно быть снабжено геометрической структурой путем введения расстояния между значениями элементарных событий (исходов).

Аккумулируя результаты работы [2] по применению способа геометрического обобщения параметров и работы [3] по определению энтропии, предложим к рассмотрению модель и алгоритм определения энтропии с целью сопоставления и выбора эффективного метода прогнозирования параметров системы.

Краткое описание модели и алгоритма заключается в нижеследующем. Для каждого из рассматриваемых альтернативных методов прогнозирования формируется дискретный ансамбль данных, состоящий из фактических и прогнозных показателей. Разность между каждым из показателей и вероятности их появления на числовой оси позволяют получить дискретный ансамбль с М возможными состояниями (разностями):

Х , Х х, х„ м

Х= , Р,=Р(х,)^0^ Р, =1 . (2)

Р1,Р2,..., Р,,..; Рм 1=1

Выражение (2) является основанием для определения энтропии по (1), позволяющее измерять информацию количественно, но без учета геометрического обобщения данных.

Согласно [4] при определении энтропии случайного распределения показателей, кроме рандомизированной меры р, можно ввести симметричную неотрицательную вещественнозначную функцию от пар исходов на основном множестве вероятностного ансамбля как «рандомизированное» расстояние р, подчиняющееся естественному условию ри= 0 и ограниченное сверху единицей:

0<р(х1,х]) = р1]<1. (3)

На основании данного утверждения, р - расстояние между значениями событий I и]:

я —Х\ . >ч

(4)

В качестве априорной меры неопределенности дискретного вероятностного ансамбля с расстоянием примем геометризованную энтропию, определяемую формулой (в битах)

м м

вр(р) = ~11рЛо%іТ.(1- р^р,’

Э2 і

7=1

получившей название В-энтропия.

Выражение (5) для определения В-энтропии и условие о независимости вероятностного появления событий (исходов) рассматриваемого ансамбля данных позволяют выделить свойства, свидетельствующие о том, что В-энтропия:

X

- X

1=1

лено на два равных подмножества с постоянными значениями XI в каждом.

Модель (1)-(5) реализована в алгоритме и в разработанной программе на ЭВМ [5]. В общем виде алгоритм включает в себя нижеследующий порядок выполнения операций:

Шаг 1. Загрузка входных данных.

Производится автоматическая загрузка данных из файла с данными имеющего расширение.хк, что позволяет пользователю не вносить данные вручную, а работать с массивами данных, сокращая время вычислений.

Шаг 2. Определение временного промежутка.

На этом шаге пользователь выбирает интересующий временной промежуток с целью выполнения расчетов не всего массива данных, а требуемых участков.

Шаг 3. Определение шага квантования.

Для удобства работы с промежуточными результатами вычислений необходима их группировка. Эта процедура выполняется посредством функции квантования.

Шаг 4. Группировка по величине значения во входных данных.

В случае необходимости, кроме установления временного промежутка, выставляется отбор по величине значения.

Шаг 5. Расчет меры неопределенности по формулам Шеннона или В-энтропии.

Центральным местом алгоритма является расчет по формулам Шеннона и В-энтропии. Произведя расчеты, программа выводит данные в виде построения диаграмм различного вида и текстовой информации.

Шаг 6. Анализ полученных результатов.

На основе произведенных вычислений и полученных результатов пользователь анализирует данные для принятия последующих решений.

Шаг 7. Вывод на печать полученных результатов.

После того как произведены все расчеты и построены графики, результаты вычислений можно вывести на бумажный носитель с помощью функции печати.

Шаг 8. Сохранение полученных результатов.

Для хранения результатов вычислений используется база данных. В неё заносятся записи результатов вычислений, осуществляется выгрузка сохраненных значений.

Реализация алгоритма. Представим практический пример реализации алгоритма определения энтропии и выбора эффективного метода прогнозирования на примере энергосбытовой компании. Компания приобретает на оптовом рынке электроэнергию на каждый час суток. По истечении суток фиксируется фактическое потребление электроэнергии.

От степени достоверности (соответствия) прогнозных параметров фактическим данным зависит величина штрафных санкций, предъявляемых к энергосбытовой компании со стороны оператора оптового рынка энергии (мощности).

С целью снижения риска потерь от некачественного прогноза энергии на сутки вперед были рассмотрены количественные методы прогнозирования, реализуемые по следующим технологиям: нейросетевой метод (программа NeuroPro 0.25 - разработчик группа Нейрокомп при Институте систем моделирования СО РАН); программы SPSS и Statistica.

Для получения прогнозных результатов из массива статистических данных (720 единиц - 30 суток по 24 часа), включающих в себя данные о фактическом электропотреблении, было взято 552 значения (23 суток по 24 часа). Прогноз выполнялся на каждый час последующих суток, по истечении которых он уточнялся (корректировался) исходя из полученных (по истечении суток) фактических данных. Посуточное 24 -часовое прогнозирование с корректировкой распространялось до 7 суток (168 значений).

Выполнив прогноз с использованием имеющихся методов (включая методику прогнозирования на предприятии «Энергосбыт»), были получены значения погрешностей, которые отражены в таблице 1.

Имея прогнозные значения и сопоставив их фактическими данными, для каждого из пяти методов нами были построены дискретные ансамбли отклонений. Далее по алгоритму с использованием разработанного программного продукта нами определены значения энтропий по Шеннону и В-энтропии (см. табл. 1). Значения погрешностей и энтропий позволили сопоставить методы прогнозирования между собой. Как видно из таблицы 1, наиболее эффективным методом прогнозирования является SPSS-эксперт.

Таблица 1

Сопоставление методов прогнозирования

Методы и технологии Оценки

Средняя квадратичная погрешность, МВт*ч Средняя относительная погрешность, % Энтропия по Шеппопу, бит В-эптропия, бит

Система прогнозирования предприятия «Энергосбыт» 0,12 3,10 2,66 0,04

Нейросетевой метод (персептрон) 0,23 5,69 3,50 0,14

SPSS экспертное построение моделей 0,07 1,48 1,95 0,01

SPSS экспоненциальное сглаживание 0,11 2,33 2,48 0,03

Statistica 0,17 4,17 2,99 0,06

Максимальная величина - 100 7,39 1,0

Соотношение значений энтропий и погрешностей подтверждает гипотезу о применимости метода определения меры неопределенности для выбора эффективного количественного метода прогнозирования.

Предложенный алгоритм определения энтропии может быть полезен не только для сопоставления прогнозных, но и плановых показателей с фактическими данными. Например, при сопоставлении двух и более вариантов планируемых показателей можно по полученным значениям энтропий определить вариант, обладающий меньшим значением. Чем ниже значение энтропии для рассматриваемого варианта плана, тем меньше неопределенности в него заложено при подготовке и реализации.

Библиографический список

1. Аполонский, О. Ю. Сравнительный анализ долгосрочных прогнозов развития мировой энергетики / О. Ю. Аполонский, Ю. Н. Орлов // ИПМ им. М. В. Келдыша РАН. Москва, 2007 - URL: http://www.keldysh.ru/papers/2007/prep26/prep2007_26.html (дата обращения 12.01.2012).

2. Дулесов, А. С. Применение формулы Шеннона и геометрического обобщения для определения энтропии / А. С. Дулесов, С. В.

Швец, В. И. Хрусталёв // Журнал «Перспективы науки. Science prospects». - 2010. - № 3[05]. - С. 94-98.

3. Дулесов, А. С. Определение энтропии как меры информации при сопоставлении прогнозных и фактических показателей предприятия / А. С. Дулесов, В. И. Хрусталёв // Современные проблемы науки и образования.- 2012. - N° 1. (Электронный журнал). - URL: www.science-education.ru/101-5290 (дата обращения: 17.01.2012).

4. Леус, В. А. О геометрическом обобщении энтропии / В. А. Леус // Проблемы передачи информации. - 2003. - Т. 39. - Вып. 2. -С. 15-22.

5. Хрусталёв, В. И. Определение меры неопределенности информации по Шеннону / В. И. Хрусталёв // Свидетельство о государственной регистрации программы для ЭВМ №2012610018. Зарегистрировано в Реестре программ для ЭВМ 10 января 2012 г.

© Дулесов А. С., Хрусталёв В. И., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.