Васильев А.А.
К.т.н., доцент, кафедра математики, статистики и информатики в экономике,
Тверской государственный университет
ОБЪЕДИНЕНИЕ ПРОГНОЗОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ НА ОСНОВЕ БИВЕС-ОЦЕНКИ С ВЕСОВОЙ ФУНКЦИЕЙ ХЬЮБЕРА
Аннотация
В статье предложено использовать для объединения прогнозов индивидуальных моделей прогнозирования бивес-оценку с весовой функцией Хьюбера вместо взвешенного арифметического среднего, а также проведено сравнение показателей точности предложенного метода объединения прогнозов экономических показателей с другими методами.
Ключевые слова: бивес-оценка, объединение прогнозов, точность прогноза. Keywords: accuracy of forecast, biweight-estimate, combination of forecasts.
В практике прогнозирования экономических показателей чаще всего применяются методы объединения индивидуальных прогнозов, основанные на их простом или взвешенном усреднении. Результаты исследований точности комбинированного прогноза при объединении прогнозов на основе простого среднего арифметического показали, что простое среднее арифметическое чувствительно к аномальным прогнозам. Поэтому в ряде исследований предлагается для объединения прогнозов использовать усеченное среднее значение с целью отсеивания аномальных прогнозов [1, 21; 2, 205].
Предметом данного исследования является метод объединения индивидуальных прогнозов на основе другой робастной статистической оценки, а именно на основе одношаговой бивес-оценки Тьюки с весовой
функцией Хьюбера. Цель исследования заключается в сравнении показателей точности предложенного метода объединения прогнозов с показателями точности индивидуальных моделей прогнозирования, а также с другими параметрическими и робастными методами объединения прогнозов.
П. Хьюбер предложил в 1964 г. в качестве робастной оценки параметра положения использовать М-оценку, определяемую в результате решения
неявного уравнения вида £ у( (xt-вп)/Sn ) = 0, где вп и Sn - оценки
i =1
математического ожидания и среднего квадратического отклонения соответственно [3, 138]. М-оценка Хьюбера параметра положения е-загрязненной нормально распределенной случайной величины определяется функцией у вида [4, 71]
( x, -qn )/Sn ПРи l( xi -qn )/Sn I £ b , bsign (( xi -qn V Sn ) ПРи |( xi -qn V Sn 1 > b .
Уь ( x )
Значения параметра b для конкретных значений е приведены в [5, 92]. Если значение доли аномальных наблюдений е неизвестно, то рекомендуется выбирать значение b из промежутка [1,2] [5, 27]. Этим значениям параметра b соответствуют значения доли аномальных наблюдений е в выборке в диапазоне примерно от 0,005 до 0,150.
Вычисление М-оценок производится на основе итерационной процедуры. Один из вариантов итерационного алгоритма на основе метода Ньютона заключается в последовательном вычислении М-оценки по формуле
[5, 149] e'i=e'i)+s™ £ у((x,-en’)/s<;>) £ у((x, -в'£) Vs':>),
где
j, j = 0,1,..., - номер итерации.
Для решения возможных проблем вычисления М-оценок, связанных со сходимостью итерационного алгоритма и с чувствительностью к неверной оценке параметра рассеивания S (n0), рекомендуется использовать
одношаговые М-оценки с робастными начальными значениями параметров
положения и рассеивания [3, 187]. Одношаговые М-оценки, являющиеся результатом первого шага итерационной процедуры вычисления М-оценок, определяются по формуле [3, 139]
в\ =вт + s::> i у((X,-eT)/sт)/ :Ё y((x, -en')/sC1),
где q( 0) и s ( 0) - начальные оценки параметров положения и рассеивания.
В качестве начальных оценок параметров положения и рассеивания рекомендуется использовать следующие робастные оценки [3, 139]: медиану q(0) = med (x,) и нормированную медиану абсолютных отклонений
S(n0) = M'AO = 1,483MAD (x,) = 1,483 med. {|x, - med . (x . )|} соответственно.
Основная проблема применения одношаговых М-оценок заключается в том, что при некоторых выборках знаменатель, равный
i y ((xt -в(°)/ S(n0)), может оказаться равным нулю [3, с. 188], что и имеет
i = 1
место при объединении прогнозов на практике. Один из методов решения данной проблемы состоит в переходе к одношаговой W-оценке Тьюки с
весовой функцией Хьюбера вида W n = i xrw(ur)/i w(u,), где
i=1 / i=1
ut = [xt - med (xt) ]/[1,483 MAD (x,) ], а неотрицательная весовая функция w связана с у соотношением w (u) = у( и)/ и [3, с. 188]. Таким образом, одношаговая бивес-оценка Тьюки с весовой функцией Хьюбера, пригодная для объединения n прогнозов, имеет вид
Wn = i x,w([x-M0]ImAo )/ i w([x,-M0]lMAo),
где w
о 1 у l MAo j 1 при 1 О
l MAo j x - M 0 г 0 MAo
mAo
b
x - M
г___
Ml
при £ b,
x - M,
M
<- b.
AO
b
f , r \
x - M „
г____0
mAo j
п ри
x - M.
г___(
MAo
> b.
В данном исследовании фиксированный базовый набор гибридной модели прогнозирования на один интервал времени вперед формировался с использованием восьми индивидуальных моделей, которые могут применяться на начальных этапах прогнозирования: 1) модель на основе предыдущего значения показателя; 2) модель на основе абсолютного прироста за предыдущий интервал времени; 3) модель на основе
коэффициента роста за предыдущий интервал времени; 4) модель на основе простого среднего значения; 5) модель на основе среднего абсолютного прироста; 6) модель на основе среднего коэффициента роста; 7)
однопараметрическая модель Брауна на основе экспоненциального среднего нулевого порядка; 8) двухпараметрическая модель Хольта.
Для оценки точности комбинированных прогнозов, полученных при объединении индивидуальных прогнозов на основе одношаговой бивесоценки с весовой функцией Хьюбера, были использованы фрагменты временных рядов объемов продаж легковых автомобилей, компьютеров, бензина, хлеба, мяса и мороженого, приведенные в [6, 79-80]. Выбор для исследования данных временных рядов обусловлен необходимостью сравнения с результатами ранее проведенных исследований.
Для оценки точности прогнозов были использованы следующие показатели, рассчитанные для 5 уровней ряда (с 3 по 7): максимальное значение модуля относительной ошибки прогноза (d max); средняя
квадратическая ошибка (RMSE) прогноза; средняя абсолютная ошибка в процентах (MAPE). Значения перечисленных показателей были нормированы значениями соответствующих показателей для гибридной модели на основе объединения прогнозов с использованием взвешенного арифметического среднего значения.
Пример результатов исследований для случая, когда комбинированный прогноз на основе бивес-оценки с весовой функцией Хьюбера оказался менее точным (по одному показателю точности), чем на основе взвешенного
среднего представлен в табл. 1, а когда более точным - в табл. 2. В данных таблицах приведены также показатели точности наиболее точных для данного временного ряда индивидуальной модели, гибридной модели и гибридной модели на основе одношаговой бивес-оценки с весовой функцией Эндрюса [7, 270-271], аналогичной рассматриваемой модели.
Таблица 1
Показатели точности прогноза объема производства автомобилей ( dmax » 12,22%; RMSE » 25116 штук; MAPE=8,48%)
Оценка для объединения прогнозов (наиболее точная индивидуальная модель) Показатели точности прогноза
d ^ max RMSE MAPE
Взвешенное среднее 1,00 1,00 1,00
Модель Хольта 0,96 0,96 0,98
Оценка Диксона в виде среднего из двух наилучших наблюдений 1,02 0,93 0,82
Одношаговая бивес-оценка с весовой функцией Хьюбера (e= 0,05-0,40) 1,05-1,08 0,95 0,80-0,85
Одношаговая бивес оценка с весовой функцией Эндрюса ( a = 1,00) 0,98 0,91 0,80
Таблица 2
Показатели точности прогноза объема производства мороженого (dmax » 151,16%; RMSE»51495,49 тонны; MAPE=60,16%)
Оценка для объединения прогнозов (наиболее точная индивидуальная модель) Показатели точности прогноза
d max RMSE MAPE
Взвешенное среднее 1,00 1,00 1,00
На основе простого среднего значения 0,74 0,72 0,92
Оценка Диксона в виде среднего из двух наилучших наблюдений 0,99 0,73 0,93
Одношаговая бивес-оценка с весовой функцией Хьюбера (e= 0,20-0,80) 0,92 0,89-0,92 0,85-0,88
Одношаговая бивес оценка с весовой функцией Эндрюса ( a = 1,00) 0,87 0,91 0,85
Для наглядности анализа полученных результатов наиболее точные индивидуальные и гибридные модели прогнозирования упорядочены в табл. 3 по количеству временных рядов, для которых все показатели точности прогноза не хуже, чем при использовании комбинированной модели на основе взвешенного арифметического среднего значения.
Таблица 3
У порядочивание индивидуальных и гибридных моделей по всем показателям
Индивидуальная модель или оценка для объединения прогнозов Не хуже, чем при использовании взвешенного среднего В том числе лучше
Модель Хольта (индивидуальная модель) 5 из 6 4 из 6
На основе оценки Диксона в виде среднего из двух наилучших наблюдений 5 из 6 4 из 6
Винзорированное среднее (a =0,250; a =0,375) 4 из 6 4 из 6
Бивес-оценка с весовой функцией Эндрюса ( а=1,91) 4 из 6 4 из 6
Бивес-оценки с весовой функцией Хьюбера (f =0,10; e =0,20; e=0,30) 4 из 6 4 из 6
Бивес-оценка с весовой функцией Эндрюса (a=2,10) 4 из 6 3 из 6
На основе предыдущего значения (индивидуальная модель) 3 из 6 2 из 6
На основе простого среднего значения (индивидуальная модель) 2 из 6 2 из 6
Результаты проведенных исследований позволяют сделать следующие предварительные выводы (для более обоснованных выводов требуется исследование гораздо большего количества временных рядов).
1. Точность пошагового прогноза на основе гибридной модели с использованием одношаговой бивес-оценки с весовой функцией Хьюбера на множестве рассмотренных временных рядов в большинстве случаев выше точности комбинированных моделей на основе простого и взвешенного арифметических средних. Поэтому для прогнозирования экономических показателей на основе коротких временных рядов целесообразнее использовать гибридные модели, использующие для объединения прогнозов робастные одношаговые бивес-оценки с весовой функцией Хьюбера, а не параметрические взвешенное или простое арифметические средние значения.
2. Точность прогноза на основе гибридной модели с использованием одношаговой бивес-оценки с весовой функцией Хьюбера на множестве этих рядов несколько хуже точности индивидуальной модели Хольта и гибридной модели на основе робастной оценки Диксона в виде среднего из двух наилучших наблюдений.
3. Точность прогноза на основе гибридной модели с использованием бивес-оценки с весовой функцией Хьюбера примерно соответствует точности гибридных моделей на основе винзорированного среднего.
4. Точность прогноза на основе гибридной модели с использованием одношаговой бивес-оценки с весовой функцией Хьюбера практически не отличается от точности аналогичной модели с весовой функцией Эндрюса.
Список литературы:
1. А. А. Френкель, А. А. Сурков - Методологические подходы к улучшению точности прогнозирования путем объединения прогнозов // Вопросы статистики. - 2015. - № 8. - С. 17-36.
2. А.А. Васильев - Объединение прогнозов на основе усеченных и винзорированных средних // Вестник Тверского государственного университета. Сер. Экономика и управление. - 2014. - № 2. - С. 204-215.
3. Робастность в статистике. Подход на основе функций влияния: научное изд. / Ф. Хампель, Э. Рончетти, П. Рауссеу, В. Штаэль; пер. с англ. - М.: Мир, 1990. - 512 с.
4. Ершов А.А. - Стабильные методы оценки параметров (обзор) // Автоматика и телемеханика. - 1978. - № 8. - С. 66-100.
5. Хьюбер Дж.П. Робастность в статистике: научное изд. / Пер. с англ. - М.: Мир, 1984. - 304 с.
6. А.А. Васильев - Гибридные модели прогнозирования объема продаж нового товара с использованием оценок на основе порядковых статистик // Современные научные исследования и инновации. - 2014. - № 8-2 (40).-С. 75-85.
7. А.А. Васильев - Объединение прогнозов на основе одношаговой М-оценки Эндрюса // Вестник Тверского государственного университета. Сер. Экономика и управление. - 2015. - № 3. - С. 268-274.