Научная статья на тему 'Комбинированный подход нейросетевого прогнозирования производственного индекса цен : (на примере агропромышленного комплекса)'

Комбинированный подход нейросетевого прогнозирования производственного индекса цен : (на примере агропромышленного комплекса) Текст научной статьи по специальности «Математика»

CC BY
71
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
π-Economy
ВАК
Область наук
Ключевые слова
АГРОПРОМЫШЛЕННЫЕ КОМПЛЕКСЫ / ИНДЕКСЫ ЦЕН / КОМБИНИРОВАННЫЙ ПОДХОД

Аннотация научной статьи по математике, автор научной работы — Леншова Татьяна Михайловна, Чижиков Сергей Александрович

В работе изложены основы применения непрерывного вейвлет-преобразования при моделировании ценовых тенденций на сахарном рынке. На базе вейвлет-анализа временного ряда производственного индекса цен на сахар выявлены локальные особенности и получена предпрогнозная информация поведения сахарного рынка. Для получения прогнозных значений авторами предложен комбинированный подход к использованию нейронных сетей и инструментария дискретного вейвлет-анализа.I

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Леншова Татьяна Михайловна, Чижиков Сергей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n work bases of application of continuous vejvlet-transformation are stated at modelling of price tendencies in the sugar market. On the basis of the vejvlet-analysis of a time number of an industrial price index on sugar local features are revealed and the prelook-ahead information of behaviour of the sugar market is received. For reception of look-ahead values by authors the combined approach to use of neural networks and toolkit of the discrete vejvlet-analysis is offered.

Текст научной работы на тему «Комбинированный подход нейросетевого прогнозирования производственного индекса цен : (на примере агропромышленного комплекса)»

Таблица 2

Параметры трендовых моделей факторных признаков производственной себестоимости 1 центнера продукции в КЧР в 2000-2007 гг.

Факторный признак Параметры трендовых моделей Коэффициент детерминации

Производство одного центнера зерна

Урожайность, ц/га У = -5,8 + 40,738х - 14,829х2 + 1,633х3 D = 66,5%

Материальные затраты, руб./га У = 767,21 + 543,01х D = 81,6%

Уровень оплаты труда, руб./га У = 154,54 + 146,76х D = 87,0%

Производство одного центнера мяса КРС

Расход кормов на 1 голову КРС, ц к.е. У = 2,68 + 1,498х - 0,221х2 D = 83,2%

Расход кормов на производство 1 ц привеса КРС, ц. к.е. У = 21,22 - 4,078х + 0,821х2 D = 81,1%

Зарплатоемкость, руб/ц У = 148,8 + 122,2х D = 96,8%

Производство одного центнера молока и молочной продукции

Расход кормов на 1 голову коров, ц к.е. У = 56,42 - 7,654х + 1,786х2 D = 74,5%

Средний удой молока от коровы, кг У = 2273,1 + 189,5х D = 98,5%

Расход кормов на производство 1 ц молока, ц. к.е. У = 1,24 + 0,981х - 0,461х2 + 0,058х3 D = 81,7%

х - фактор времени.

мяса КРС - 3496 руб./ц (фактически - 3599 руб./ ц), молока и молочной продукции - 582 руб./ц (фактически - 555 руб./ц). Последующая корректировка нормативной себестоимости (З;) на индексы цен на средства производства и услуги, поставляемые сельскому хозяйству, и прибыли (П;) с учетом индекса роста цен потребительских товаров, рассчитанные органами государствен-

ной статистики, позволили определить величину максимальной (контрольной) цены по отдельным видам сельскохозяйственной продукции в республике в 2008 г.

Реализация предложенных в работе направлений будет способствовать эффективному развитию отрасли и повышению инвестиционной привлекательности АПК.

СПИСОК ЛИТЕРАТУРЫ

1. Албегова И.М., Емцов Р.Г., Холопов A.B.

Государственная экономическая политика. М.: Дело и сервис, 1998.

2. Беспохатный Г. Новые механизмы приоритет-

ного развития сельского хозяйства / Экономист. № 7. 2008.

3. Карачаево-Черкесия в цифрах. Статистический сборник 2007-2008. Черкесск: Госкомстат КЧР, 2009 г

УДК 519.68

Леншова Т.М., Чижиков С.А.

комбинированный подход нейросетевого прогнозирования производственного индекса цен (на примере агропромышленного комплекса)

Сахарная индустрия представляет собой ность государства в поступательном развитии

одну из основных опор российского сельского собственной сахарной индустрии и аграрно-

хозяйства и аграрно-промышленного комплекса, промышленного комплекса в целом, развитии

в первую очередь в ключевых регионах (более внутренних и внешних рынков сбыта продукции

80% производства). Понятна заинтересован- отрасли.

Ценовые тенденции на сахарном рынке меняются в зависимости от роста мировых цен на сахар-сырец, объемов импорта сахар-сырца, урожая и качества отечественной сахарной свеклы. Внутренние цены российского рынка на сахар выражаются в производственном индексе цен

- экономическом показателе, характеризующем уровень мировых цен на сырье и продукцию, качество продукции отечественного производителя, экономические условия каждого региона.

При расчете ценовых индексов используются данные ежедневного мониторинга для сахаропроизводящих регионов. В качестве весового коэффициента используется доля региона в общем производстве сахара в стране. Таким образом, наибольшее влияние на производственный индекс оказывает цена Краснодарского края (основного сахаропроизводящего региона). Индексы вычисляются ежедневно до 16-00 по московскому времени и публикуются в информационных материалах ^СО и в Интернет. Предлагаемое исследование базируется на ежедневных и еженедельных значениях производственного индекса.

Для получения прогнозных значений еженедельного временного ряда производственного индекса цен на сахар, авторы предлагают использовать методы искусственного интеллекта, в частности инструментарий нейронных сетей и методы вейвлет-анализа.

Анализ данных с использованием непрерывного вейвлет-преобразования является удобным, надежным и мощным инструментом исследования экономических процессов и позволяет представить результаты в очень наглядном виде, удобном для изучения и интерпретации.

Картина сахарного рынка является себе подобной (автомодельной) системой, в том смысле, что отдельные ее части сходны с целым. Другой пример автомодельной системы в математике

- фракталы. Если отслеживать производственный индекс цен на сахар ежемесячно, еженедельно, ежедневно, а также по гистограммам в течение каждого дня, то в движении сахарного рынка можно увидеть фрактальную структуру. Отсюда следует, что сахарный рынок можно связать с фрактальной моделью и поэтому для исследования временного ряда производственного индекса цен на сахар в настоящей работе предложено применить элементы теории хаоса - вейвлет-анализ, по сравнению с фрактальным анализом он позволяет лучше локализовать процесс во времени.

Основные приложения непрерывного вейв-лет-анализа: локализация и классификация осо-

бых точек сигнала, вычисление его различных фрактальных характеристик, частотно-временной анализ нестационарных сигналов.

Дадим вначале определения некоторых терминов, которыми будем оперировать в дальнейшем. Любую упорядоченную последовательность данных, заданную аналитически или перечислением ее значений назовем сигналом. Значение сигнала может зависеть от одного параметра (например, от времени) или от нескольких. При цифровой обработке сигнала над ним обычно выполняют некоторое преобразование, выявляющее характерные особенности данного сигнала и, выполнив определенные действия (например, подавление шума), делают обратное преобразование. Классическим примером является преобразование Фурье, переводящее сигнал из временной области в частотную и обратно. Преобразование, как прямое, так и обратное, рассчитывается путем вычисления свертки сигнала в каждой его точке с некоторой функцией, называемой фильтром. В дискретном случае фильтры задаются просто перечислением их значений в точках дискретизации. Учитывая статистические особенности большинства сигналов (полезная информация расположена в низкочастотной области спектра сигнала, а помехи или шум - в высокочастотной), сигнал обычно преобразуют с использованием двух дополняющих друг друга фильтров - низких и высоких частот. При этом вейвлет выделяет локальные особенности сигнала в каждой точке и является, таким образом, фильтром высоких частот, а соответствующий фильтр низких частот описывается так называемой масштабирующей функцией.

В качестве сигнала, рассмотрим временной ряд ежедневного измерения производственного индекса цен на сахар (1), за период с января 2004 года по февраль 2009 года.

Р = (р1), г = 1, 2, ...,N (1)

где N - количество наблюдений, составляющих этот временной ряд.

Представим временной ряд (1) в виде некоторой функции/х) и произведем ее вейвлет-анализ при помощи вейвлета у.

Результатом вейвлет-анализа этого сигнала будет функция а), которая зависит уже от двух переменных - от времени х и от масштаба а. Для каждой пары х и а (а > 0) алгоритм вычисления значения №/(х, а) следующий:

1. Растянуть вейвлет в а раз по горизонтали и

1

в — раз по вертикали.

а

2. Сдвинуть его в точку t. Полученный вейвлет обозначим у(х, а).

3. "Усреднить" значения сигнала в окрестности точки а при помощи у(х, а).

Определение непрерывного вейвлет-преобра-зования обобщим формулой (2):

Wf (x,a)=1 J¥f

a J I a

f (t)dt.

(2)

Иначе говоря, при фиксированном значении а функция Ц%х, а) представляет собой свертку исходной функции с "растянутым" в а раз вейв-летом.

Одним из важнейших аналитических показателей финансового процесса является его периодичность, т.е. повторяемость через определенные промежутки времени. При исследовании временного ряда (1) очевидны сезонные колебания, в сентябре уровень производства свекловичного сахара увеличивается, что влечет за собой снижение производственного индекса цен на сахар. Наличие информации о периодических составляющих сахарного рынка и глубине их колебаний позволяет грамотно планировать деятельность предприятия на основании данных предыдущих периодов, а также эффективно распределять резервы в течение периода, в зависимости от его фазы (спад, подъем, текущий пик или упадок). Однако, комбинация нескольких различных колебаний может иметь настолько сложную форму, что выявить их наличие 'на взгляд' не представляется возможным.

Вейвлет можно считать трехмерным спектром, где по оси X отложено время, по оси У - частота, а по оси 2 - амплитуда гармоники с данной частотой в данный момент времени. Обычно на двухмерной плоскости ось 2 отображают в виде градаций черного цвета. При этом, черный цвет - максимальная амплитуда, а белый - минимальная. Тогда самые интересные места сразу видно по черным пятнам.

На рис. 1 представлены фазовые диаграммы непрерывного вейвлет-преобразования временного ряда производственного индекса цен на сахар. В качестве анализирующего выбран вейвлет Морле. Ось X в диаграмме представляет собой ось времени, ось Y показывает периоды циклов. Данные фазовые диаграммы получены с помощью программы MatLab 7.0.1 и одного из его модулей Wavelet Tool Box.

Вертикальные черные кривые представляют собой те моменты, когда поведение производственного индекса цен на сахар меняет структуру. Чем сильнее ветвится кривая, тем сложнее поведение сахарного рынка, так как в эти моменты "играет" множество циклов с маленькими периодами. Поэтому такие моменты играют очень важную роль (фактически, каждая особая точка определяется совокупностью точек бифуркации). Чем длиннее черная кривая, тем сложнее поведение временного ряда производственного индекса цен на сахар вокруг кривой. На рисунке 1 четко прослеживается фрактальная структура ряда, те участки наблюдений, где фрактальность нарушается, являются областями нестабильности поведения временного ряда.

Для более детального анализа фазовой диаграммы непрерывного вейвлет - преобразования временного ряда производственного индекса цен на сахар рассмотрим структуру локальных максимумов (рис/ 2). "Скелет" максимумов - это, грубо говоря, множество точек на плоскости (x, a) в которых находятся локальные "пики" вейвлет-преобразования. Этих точек обычно очень много в области малых масштабов. Именно таким образом вейвлет-преобразование реагирует на любые негладкости сигнала. При росте масштаба мелкие негладкости исчезают, а вместе с ними и точки максимумов. Оставшиеся сливаются в довольно гладкие кривые, которые при дальнейшем росте масштаба тоже сливаются друг с другом. При этом

Рис. 1. Фазовая диаграмма непрерывного вейвлет-преобразования временного ряда производственного индекса цен на сахар р.

Рис.2. Структура локальных максимумов - "скелетон" непрерывного вейвлет - преобразования временного ряда производственного индекса цен на сахар р..

они либо "аннигилируют", либо продолжают "расти" в область еще более крупных масштабов.

В определенном смысле, вся существенная информация о сигнале находится в значениях вейвлет-преобразования в точках скелета максимумов. Важные фрактальные параметры временных рядов можно вычислять при помощи значений преобразования только на скелете. На рисунке 2 локальные максимумы соответствуют 520, 690, 890 наблюдениям. 520 наблюдение соответствует февралю 2006 года, где наблюдается резкий подъем индекса цен на сахар. Если рассматривать годичные отрезки временного ряда производственного индекса цен на сахар, февраль не характерный для подъема цен месяц в годе и в 2006 году значение индекса цен не соответствует сезонному поведению временного ряда. 890 наблюдение соответствует августу 2007 года и отмечено резким падением индекса цен, что не характерно для августа месяца.

Для последующего анализа и получения прогнозных значений производственного индекса цен на сахар авторами использован алгоритм дискретного вейвлет-преобразования и нейронные сети.

Нейросеть весьма трудно обучить при сильной зашумленности данных или наличие большого числа выбросов, пропусков, нелинейных искажений. Такие помехи способны скрывать характерные особенности данных или выдавать себя за них и могут сильно ухудшить результаты обучения. Поэтому прежде чем анализировать данные, рекомендуется произвести их очистку с помощью вейвлетов. При обработке данных на персональном компьютере весьма привлекательной является идея использования вейвлет-преобразования для обработки дискретных данных. Основная трудность заключается в том, что формулы для

дискретного вейвлет-преобразования нельзя получить просто дискретизацией соответствующих формул непрерывного преобразования. И. Добеши предложен метод, позволяющий построить серию ортогональных вейвлетов, каждый из которых определяется конечным числом коэффициентов [3]. Так же существует алгоритм, реализующий быстрое вейвлет-преобразование на дискретных данных (Mallat algorithm). Достоинство этого алгоритма, помимо всего вышесказанного, заключается в его простоте и высокой скорости [1].

Прогнозирование производственных индексов цен на сахар построено на основе истории его ежедневного изменения за последние 5 лет. Эта информация собирается в базу данных, состоящую из двух колонок: дата и значение производственного индекса цен. Для улучшения качества прогноза ежедневный временной ряд производственного индекса цен на сахар агрегирован в еженедельный временной ряд.

Таким образом, в качестве сигнала, рассмотрен временной ряд еженедельных измерений производственных индексов цен на сахар за период с января 2004 года по февраль 2009 года (3).

S = (si), i = 1, 2, ..., N (3)

где N = 260 - количество наблюдений, составляющих этот временной ряд.

Для получения качественного прогноза необходимо провести предварительную обработку данных при помощи программы Deductor Studio Academe [4], разработанной фирмой BaseGroup. Данные по истории изменения производственного индекса цен следует сгладить, т.к. после сглаживания данных при помощи вейвлетов динамика изменений определяется и прогнозируется гораздо качественнее.

Для спектральной обработки (сглаживания данных) необходимо задать глубину разложения и порядок вейвлета. Глубина разложения определяет "масштаб" отсеиваемык деталей: чем больше эта величина, тем более "крупные" детали в исходные данных будут отброшены. При достаточно больших значениях параметра (порядка 7-9) выполняется не только очистка данных от шума, но и их сглаживание ("обрезаются" резкие выбросы). Использование слишком больших значений глубины разложения может привести к потере полезной информации из-за слишком большой степени "огрубления" данных. Порядок вейвлета определяет гладкость восстановленного ряда данные: чем меньше значение параметра, тем ярче будут выражены "выбросы", и, наоборот, - при больших значения параметра "выбросы" будут сглажены.

Параметр глубина погружения, т.е. количество временных интервалов, по которым прогнозируется следующий интревал определим через значение глубины памяти, которое равно 4, отдельно отметим, что указанное значение выгчислено с помощью инструментария клеточного автомата [6]. Таким образом, прогнозирование производственного индекса цен на сахар будет осуществляться по результатам четырех предыдущих недель.

Выполненное вейвлет-преобразование (с глубиной разложения равной четырем и порядком

вейвлета равным шести) позволило из исходного временного ряда исключить несущественные и редко встречающиеся значения, а именно: устранить аномальные выбросы, убрать высокочастотные шумы, исключить интервальные и точечные джокеры. Для дальнейших исследований обозначим ряд еженедельных измерений производственных индексов на сахар, сглаженный вейвлетом как

X = {Xi), i = 1, 2, ..., N (4),

где N = 260 - количество наблюдений, составляющих этот временной ряд.

В результате дискретного вейвлет-преобра-зования, подготовлена обучающая выборка для последующего анализа и построения нейросете-вого прогноза.

Благодаря наличию быгстрык и эффективные алгоритмов реализации, вейвлеты представляются весьма удобным и перспективным механизмом очистки и предварительной обработки данных для использования их в статистических и бизнес-приложениях, системах искусственного интеллекта.

Далее для получения прогнозных значений воспользуемся пакетом Statistica Neural Networks -универсальным пакетом нейросетевого анализа американской фирмы StatSoft, позволяющим моделировать различные типы сетей, использовать несколько алгоритмов их обучения и создавать

Неделя

Рис. 3. Исходные данные сигнала я (синяя линия) и данные сигнала после вейвлет-преобразования х. (розовая линия) производственного индекса цен на сахар

сложные комбинации из сетей различных архитектур.

В ходе исследования рассмотрены различные модификации архитектуры многослойных персеп-тронов (количество элементов в скрытых слоях) и варианты настройки обучения (скорость обучения, инерция, количество эпох, значение моментов). При поиске лучшего варианта сети применялись возможности конструктора сети Intelligent Problem Solver, который реализован в пакете Statistica Neural Networks.

При решении поставленной задачи авторами выбран многослойный персептрон (3 слоя), так как для трехслойного MLP (многослойного персепт-рона) поиск сводится к выбору числа элементов в скрытом слое. По существу, это линейный поиск для функции, содержащей помехи (при разных прогонах обучения сети, даже с одним и тем же числом элементов, могут получаться немного различные результаты). Параметр временное окно Steps выбран с учетом глубины памяти и предпро-гнозных характеристик, полученных с помощью фазовых сплайн-портретов [2]. Максимальный показатель Ляпунова для еженедельного временного ряда производственного индекса цен на сахар X ~ 2, это значение использовано в качестве горизонта прогноза Lookahead при построении нейронной сети. Параметр временное окно задает число предыдущих значений, которые следует подавать на вход, а параметр горизонт указывает, как далеко нужно строить прогноз.

Критериями выбора наиболее подходящей сети, демонстрирующей лучшие результаты классификации, выступают величина контрольной ошибки по тестовому и обучаемому подмножествам и итоговые статистики окна "Статистики классификации" для тестового подмножества.

В результате предложенной классификации выделена тридцать одна сеть, причем наилучшей из них признана тридцать первая (31*) - тип MLP (множественный персептрон). Следует отметить, что кроме множественного персептрона рассматривались и линейные сети.

Лучшие результаты продемонстрировала сеть, скрытый слой которой включал 8 элементов, т.е. архитектура нейронной сети имела вид: 4-8-1.

Наилучшая оценка обученной сети получена из диалогового окна Regression Statistics, при анализе показателя S.D.Ratio (отношение стандартного отклонения ошибки к стандартному отклонению данных), если показатель меньше 0.1, это означает прекрасное качество регрессии. В рассматриваемом примере он не превышает

значение 0.3, что также является достаточно неплохим результатом обучения.

Statistica Neural Networks показывает стандартный Pearson-R коэффициент корреляции между фактическими и предсказанными значениями. Совершенное предсказание будет иметь коэффициент корреляции 1.0. Корреляция 1.0 не обязательно указывает совершенное предсказание (только предсказание, которое является совершенно линейно коррелированным с фактическими данными), хотя практически коэффициент корреляции - хороший индикатор работы. Это обеспечивает простой способ сравнения работы (выполнения) построенной нейронной сети со стандартным методом наименьших квадратов. В выбранной нами нейронной сети коэффициент корреляции равен 0,98, что указывает на хорошее качество прогноза.

Величина контрольной ошибки для ряда x . составляет 0,078 для обучающего подмножества и 0,085 для контрольного подмножества.

На рис. 4 представлен график сглаженного временного ряда производственного индекса цен на сахар xi и его проекция как результат нейросе-тевого прогноза.

Визуализация графика позволяет сделать вывод о том, что прогнозируемый ряд достаточно хорошо аппроксимирует исходную последовательность и, как следствие, дает достаточно надежную оценку прогноза на 2 недели вперед - среднее значение производственного индекса цен на сахар за неделю с 24.02.2009 по 27.02.2009 и с 02.03.2009 по 06.03.2009 г., приведенны в табл. 1.

Как видно из табл. 1, прогнозные значения, полученные с использованием нейросетевой технологии, по сравнению с реальными значениями производственного индекса цен на сахар обладают достаточно высокой точностью, имея низкое значение погрешности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В результате исследования авторами апробирован комбинированный подход к обучению и построению нейронной сети, с целью получения прогнозных значений производственного индекса цен на сахар. Принцип обучения нейронной сети основывается на информации, полученной с помощью инструментария клеточного автомата, фазового анализа сплайн-портретов, характеристики показателя Ляпунова. Предложен инструментарий повышения точности нейросетевого прогноза, основанный на вейвлет-анализе, позволяющем подготовить обучающий набор данных для нейронной сети за счет исключения выбросов, шумов джокеров.

Неделя

Рис. 4. График сглаженного еженедельного временного ряда производственного индекса цен на сахар и его проекция как результат нейросетевого прогноза за период с 01.01.2004 по 18.02.2009 гг.

Таблица 1

Прогнозные и реальные значения еженедельного производственного индекса цен на сахар за периоды

24-27 февраля 2009 г и 2-3 марта 2009 г.

Период Реальные значения Прогнозные значения, полученные на базе нейронной сети Погрешность, %

24-27 февраля 2009 г 636,42 670,45 5

2-3 марта 2009 г. 670,88 670,93 0,01

Подводя итоги, следует отметить, что предложенный авторами комбинированный подход к использованию нейронных сетей и инструментария вейвлет-анализа является мощным средством

оказания помощи в решении экономико-математических задач, в частности, задач классификации и прогнозирования, которые широко применяются в экономике и финансах.

СПИСОК ЛИТЕРАТУРЫ

1. Mallat S. A theory for multiresolutional signal decomposition: the wavelet representation. IEEE Trans. Pattern Analysis and Machine Intelligence, 1989, N7, p.674-693.

2. Винтизенко И.Г. Экономическая цикломатика: монография/ И.Г. Винтизенко, В.С. Яковенко. М.: Финансы и статистика; Ставрополь: АГРУС, 2008. 428 с.

3. Добеши И. Десять лекций по вейвлетам / И. Добеши М.: РХД, 2001. 516 с.

4. Киселев А.А. Основы теории вейвлет-преоб-разования/ А.А. Киселев. Режим доступа: http://www.

BaseGroup.ru.

5. Кричевский М.Л. Интеллектуальные методы в менеджменте/ М.Л. Кричевский. СПб.: Питер, 2005. 304 с.: ил.

6. Перепелица В.А. Прогнозирование природного временного ряда на базе модели клеточного автомата/ В.А. Перепелица, М.Д. Касаева // Современные аспекты экономики. 2002. № 9(22). С. 201-208.

7. Тихонов Э.Е. Методы прогнозирования в условиях рынка: учебное пособие/ Э.Е. Тихонов. Невинно-мысск, 2006. 221 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.