Научная статья на тему 'Нечеткая регрессионная прогнозная многофакторная модель для решения экономической прикладной задачи'

Нечеткая регрессионная прогнозная многофакторная модель для решения экономической прикладной задачи Текст научной статьи по специальности «Математика»

CC BY
580
226
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ (МНК) / УРАВНЕНИЕ РЕГРЕССИИ / БАЗА ДАННЫХ (БД) / НЕЙРОСЕТЕВАЯ МОДЕЛЬ (НСМ) / НЕЙРОСЕТЕВАЯ РЕГРЕССИОННАЯ МОДЕЛЬ (НРМ)

Аннотация научной статьи по математике, автор научной работы — Бирюков Александр Николаевич

В статье рассматриваются теоретические и практические расчеты для решения прогнозных задач, применяемых в производстве для расчета прогнозов запасов незавершенного производства на два квартала вперед по имеющейся за три года базе данных запасов и трех основных экспертно выбранных факторов (поступления материалов, расхода материалов, объема производства).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нечеткая регрессионная прогнозная многофакторная модель для решения экономической прикладной задачи»

Нечеткая регрессионная прогнозная многофакторная модель для решения

экономической прикладной задачи Дата: 30/06/2010 Номер: (22) УЭкС, 2/2010

Аннотация: В статье рассматриваются теоретические и практические расчеты для решения прогнозных задач, применяемых в производстве для расчета прогнозов запасов незавершенного производства на два квартала вперед по имеющейся за три года базе данных запасов и трех основных экспертно выбранных факторов (поступления материалов, расхода материалов, объема производства).

Ключевые слова: метод наименьших квадратов (МНК), уравнение регрессии, база данных (БД), нейросетевая модель (НСМ), нейросетевая регрессионная модель (НРМ).

Abstract: This article discusses the practical and theoretical calculations to solve forecasting problems, used in production for the calculation of forecasts stocks in progress for two quarters in advance on the existing three-year database of stocks and the three core competencies of selected factors (receipt of materials, material consumption, output ).

Keywords: method of least squares (OLS) regression equation, the database (DB), neural network model (HCM), neural network regression model (HPM).

Бирюков Александр Николаевич кандидат экономических наук, ст. преподаватель Башкирский государственный университет

guzsa@ufamts.ru

Выходные данные статьи: Бирюков А.Н. Нечеткая регрессионная прогнозная

многофакторная модель для решения экономической прикладной задачи // Управление экономическими системами: электронный научный журнал, 2010. - № 2 (22). - № гос. рег. статьи 0421000034/. - Режим доступа к журн.: http://uecs.mcnip.ru.

Экономико-математическая модель и метод решения задачи

Данная прикладная экономическая задача относится к типу задач прогноза с учетом изменения ряда входных факторов во времени.

Многофакторная эконометрическая динамическая модель, по которой следует выполнить прогноз, может быть получена в трех видах:

• множественного уравнения регрессии;

• нечеткой регрессии;

• нейросетевой модели.

Наиболее распространенным и теоретически обоснованным методом является метод наименьших квадратов (МНК) для построения линейных и нелинейных по факторам уравнений регрессии вида:

(1)

ы.

где - искомые коэффициенты регрессии; г - расчетное значение моделируемого показателя;

fAxj). априори известные (задаваемые, например, с помощью подбора с использованием программы Excel - Мастер диаграмм) базисные однофакторные непрерывные элементарные функции (линейная, полиномиальная, степенная, логарифмическая, экспоненциальная и др.);

случайная ошибка аппроксимации (остаток).

Отметим, что рассматриваемой задаче, в базе данных (БД) каждый входной фактор должен быть задан своим одномерным временным рядом. Последний член в (1)

соответствует функции:

ЛСО = *'

, т.е. здесь время t выделено явно.

Сильной стороной МНК [1] является, что данный метод не накладывает ограничений на учет нелинейности взаимосвязей х->и г, требуется только, чтобы выбираемые базисные функции были непрерывными. В большинстве случаев при этом

путем замены переменных вида:

^ = ЛС^ (2)

удается свести нелинейное уравнение регрессии (1) к линейному:

(3)

МНК для линейного множественного уравнения регрессии позволяет получить

состоятельные, несмещенные и эффективные оценки [1] искомых коэффициентов J=0’n. В этом заключается основное преимущество МНК.

Однако, как и всякий другой метод, МНК имеет ряд недостатков.

Ы

• Модель (1) должна быть линейной по искомым параметрам Если хотя бы один параметр входит в модель через нелинейные операторы, то классической МНК неприменим.

Например, в известной модели производственной функции Кобба-Дугласа мультипликативного параметра, так и по факторам

II =ь„х^х^

где капитал; - труд, МНК неприменим «в лоб».

Однако, если применить в (4) логарифмическое преобразование, то (4) преобразуется к классической линейной по параметрам модели (3).

Если линеаризующее преобразование невозможно, то приходится прибегать к случайной модификации МНК, где искомый вектор * рассматривается как случайный и организуется его случайный поиск с минимизацией функционала МНК:

хи-л) ___________

^ * = \,м (5)

где **- наилучшее из генерируемых машиной значений вектора * ;

номер экспериментальной точки; н - число экспериментальных точек в БД; м - число генерируемых случайных значений вектора * .

• Другим, и более важным ограничением МНК для экономических задач является необходимость выполнения предпосылок МНК:

1т I . -—

о Входные факторы j=^^* считаются детерминированными (точно

заданными в базе данных) величинами, а наблюдения выходной величины случайными взаимно независимыми величинами. Термин «точно заданными» следует понимать условно в том смысле, что

IX \

погрешность измерения в БД должна быть много меньше

погрешности измерения Данная предпосылка, строго говоря, в

динамических экономических моделях не выполняется, так как чаще всего

погрешности измерения ^и в БД оказываются соизмеримыми, а значения наблюдений и *** оказываются коррелированными в

силу временного тренда, который и является предметом моделирования. Тем не менее, метод МНК применятся при многофакторном прогнозировании [1]. о Не должна иметь место мультиколлинеарность, т.е. линейная зависимость (детерминированная или стохастическая) между входными факторами. В общем случае может наблюдаться наличие нелинейной взаимосвязи между факторами [2]. Нарушение этой предпосылки приводит к неадекватности получаемой регрессионной модели и ее плохой экономической интерпретируемости. о Должно выполнятся требование близости к нулю математического ожидания остатков. Если это требование нарушается, то модель содержит систематическое смещение и, по сути [1], не является эконометрической. о Дисперсия возмущения Е‘ случайной величины У в БД должны быть постоянна в любой точке наблюдений ,е1#. Это условие гомоскедастичности или ровноизменчивости возмущения зависимой переменной У. Нарушение этого требования (гетероскедастичность) ведет

к корреляции остатков ^ с регрессорами ^ и, как

следствие, к несостоятельности получаемых оценок вектора параметров * . о Возмущения и % **-* должно быть некоррелированы между собой, о Возмущения есть нормально распределенная случайная величина.

Для получения уравнения регрессии достаточно выполнения первых пяти

предпосылок. Однако выполнение требования последней предпосылки необходимо для проверки адекватности модели и оценки доверительных интервалов прогноза.

Таблица 1- Исходные данные(тыс.руб.)

t (кварталы по годам) Y (запасы) X1 (поступление материалов) X2 (расход материалов) X3 (объем производства)

1 2 3 4 5

1 5889,5 18692,13 19204,21 27930

12 11635 30547,26 28462,93 36252

В рассматриваемой задаче наблюдается в БД мультиколлинеарность. Это ясно из экономических соображений и количественно оценивается проведением предварительного корреляционного анализа. Можно использовать, например, программу «Excel. Анализ данных. Корреляция» (см. табл.1)

Помимо мультиколлинеарности, в БД можно наблюдать дефицит наблюдений, поскольку в условиях сильного зашумления БД, характерных для производственных систем, коэффициент избыточности опытов

=ЛГ/И =12/4=3

явно недостаточен по экспертным оценкам.

Вывод: условия моделирования сложные и применение МНК может быть

проблематичным.

2. Метод нечеткой регрессии

В этом методе [3] вместо минимизации квадратичного функционала (5) решается задача минимизации ширины нечеткого интервала прогнозных значений Y. Отказ от МНК освобождает этот метод от необходимости выполнения 6 указанных выше предпосылок МНК. Метод нечеткой регрессии прост: поиск коридора изменения Y сводится к решению задачи линейного программирования (Excel. Надстройка «Поиск решения»).

Теория нечетких множеств является частью математики, которая ориентирует на обработку субъективного т неопределенного. Это попытка рассмотреть явления, таким образом, как они предъявляются в реальной жизни, не деформируя их для того, чтобы сделать точными и четкими.

Возможности теории нечетких множеств очень широки. С ее помощью можно составит кратко- и долгосрочные прогнозы того или иного явления в условиях неопределенности и быстрой изменчивости внешней среды.

Практическое использование нечеткой логики и теории размытых множеств позволяет развивать традиционные методы прогнозирования, приспосабливая их к новым потребностям учета неопределенности будущего. В частности, на основании теории нечетких множеств можно построить нечеткие регрессионные модели, используемые для прогнозирования уровня исследуемых показателей.

Процедура построения нечетких регрессионных моделей существенно не отличается от процедуры разработки четких моделей. Требуются достаточная репрезентативность выработки и преемственность данных, обоснование формы уравнение связи и т.д. Задача анализа - найти такое уравнение связи, которое бы наиболее точно описывало

связи между значениями факторов и результативным показателем с учетом того, что данные связи размытые, нежесткие, т.е. коэффициентами уравнения регрессии являются нечеткие числа.

3. Нейросетевые регрессионные модели (НРМ) [4]

НСМ в рассматриваемой задаче аппроксимируют связь между выходной случайной величиной Y и рядом входных факторов в динамике. Следовательно, НСМ имеет смысл эконометрической модели, которую можно записать в виде:

гЦс С0> = /'(ЛЧО.»') + е (7)

где F(...) - оператор нейросетевого отображения значений входных факторов в значении выходной величины;

W - матрица синаптических связей нейронов; е - случайные остатки.

НСМ - это нейроэмулятор, т.е. программно реализуема структура в персональном компьютере (ПК), где имеется определенным образом соединенные элементарные процессоры (нейроны), выполняющие две операции - проецирования сигналов в п-мерном факторном пространстве (суммирования сигналов на входе нейронов с синаптическими весами; нелинейную аппроксимацию результата проецирования). Матрицу весов W НСМ находит сама в результате обучения на примерах из БД, т.е. НСМ является адаптивной моделью.

На сегодняшний день НСМ является наиболее мощным аппроксимационным инструментом в сложных условиях моделирования [6], причем свободным от необходимости выполнения предпосылок МНК.

Однако в НСМ имеется своя «ахиллесова пята»: коэффициент избыточности с (6) по опыту практических расчетов большинства авторов должен быть более 5.10. Другими словами, число примеров в БД для обучения НСМ должно более чем в 5 раз превышать число входных факторов, при погрешности расчета примерно 10%. При требуемой большей точности аппроксимации кизб растет. Причем часть примеров в БД должна выделяться для так называемого «перекрестного подтверждения» (примерно 10.20% от всех примеров) и для тестирования сети (примерно 10% примеров).

Из табл.1 мы видим, что для НСМ, к сожалению, наблюдений очень мало и ее как аппроксиматор приходится отвергнуть.

Учитывая изложенное, в качестве метода решения поставленной прогнозной задачи выбираем метод «нечеткой регрессии».

4. Сущность алгоритма получения нечеткой регрессии

Чтобы понять сущность нечеткой регрессионной модели, рассмотрим классический пример - линейную регрессионную «треугольную» модель. Предположим, что имеется ряд факторов Х1, Х2, ..., Хп, определяющих результативный показатель Y, а также выборка данных из т наблюдений значений факторов Y, которые могут быть четкими, как в случае традиционного регрессионного анализа, и размытыми (например, многовариантными экспертными оценками). Требуется определить такую функцию:

У I «,1, • • - * ",1, » - » Ч„ ЛЧ, ^ -- *~1 - (8 ^

которая бы наиболее точно описывала значение результативного показателя Y. В (8) параметры модели а0,а1,а2,...,ап - нечеткие симметрические доверительные тройки чисел.

Каждый нечеткий коэффициент будет иметь вид:

где аi - наиболее вероятное значение коэффициента, а величина Ы - описывает ширину размытости коэффициента (рис.1).

Тогда моделируемая функция при каждом наборе значений входных факторов

из базы данных -*= 1>Я1 также будет описываться в виде треугольного симметричного нечеткого числа, внутри которого должно располагаться реальное значение результата, соответствующее данному набору факторов.

Формальное описание модели можно представить следующим образом:

21 "21 ’«“I -+ (“о -*о) =£ ^ у = 1.™

гу ~ ; "СО, • + С«о * Л,) V = 1."* (9)

*г>о

где (9) - это включение значения результата Y в интервал возможных значений F;

Ы - ширина интервала, которая не может быть отрицательной, где i -номер члена уравнения регрессии (8).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Необходимо найти такое значение ai и Ы, чтобы ширина получаемого нечеткого коридора, описывающего реальные значения исследуемого результативного признака, была минимальной по сумме всех изменений:

*\-Ьі

Рис.1. Представление нечеткого числа а1

"is *((®i +*/H)+(“o+^)-zi"(ta - ^Ke)J ->n“ (10)

Найденное уравнение нечеткой регрессии в отличие о уравнения четкой регрессии включает в себя 3 составляющие:

• Функцию Y1, содержащую минимальные коэффициенты, значения которой располагаются не выше любого из значений аппроксимируемого показателя Y.

• Функцию Y3, содержащую максимальные коэффициенты и располагающуюся не ниже исследуемого показателя Y.

• Функцию Y2, определяющую середину возможных значений исследуемого показателя Y.

Между функциями Y1 и Y3 находятся все значения исследуемого параметра. Именно по этой причине нечеткую регрессию часто называют «нечетким коридором».

Основываясь на данной теории и используя встроенную функцию «Поиск решения» в среде Excel можно найти числа а0,а1,а2,...,ап путем решения задачи линейного программирования (9)-(10). Подчеркнем принципиальное отличие этого алгоритма от МНК: функция цели (10) не является квадратичной.

Приведем пример прогнозирования запасов незавершенного производства при изготовлении изделий. В таблице 1 представлена база данных (БД), полученная в итоге наблюдений за промышленным предприятием за последние 3 года.

Следующие два квартала будут тестовыми периодами для проверки надежности прогноза. Следует отметить, что два квартала - это наиболее удачный период прогноза при данной длине исходного ряда. Именно такое соотношение можно рекомендовать для практического использования модели. Результаты решения задачи оптимизации (8)-(10) показаны в таблице 2.

Таблица 2 - Коэффициента нечеткой регрессионной модели

Член регрессии ai bi

Свободный коэффициент 6027 0

Поступление материалов (Х1) 0 0,1355

Расход материалов (Х2) 0 0,1296

Объем производства (Х3) 0 0,2572

Основным критерием качества построения нечеткого коридора являются абсолютная и относительная оценки уровня его неопределенности (размытости). В случае треугольной нечеткой регрессии, которая нами использовалась, в качестве абсолютной оценки может выступать средняя ширина коридора (в нашем случае 151,65), а в качестве относительной оценки - отношение интервала изменения нечеткого числа, описывающего прогнозное значение искомого показателя, к его среднему значению (в нашем случае к средней ширине нечеткого коридора).

Дополнительным критерием качества нечеткой регрессии является равномерность распределения значений моделируемой величины Y внутри нечеткого коридора. Для достижения такой равномерности возможно введение дополнительного ограничения на число точек, лежащих выше середины нечеткого коридора. Возможно также использование ограничения на уровень размытости свободного коэффициента. При

снижении размытости последнего достигается снижение гипотетической ошибки прогноза от сопутствующего воздействия побочных факторов, которые, как правило, не являются определяющими. Применение данного ограничения не понадобилось, так как уровень размытости свободных коэффициентов в полученном уравнении регрессии равен нулю.

Как показывает рисунок 2 и данные таблицы 3, высокая точность полученной модели при проверке на тестовом отрезке подтвердилась, так как реальные значения искомых параметров попали в коридор, описанный нечеткой регрессией. Причем с начала временного ряда фактический уровень совпадает с серединой нечеткого коридора. Это подтверждает довольно высокий уровень достоверности результата.

Рис.2. Распределение искомого параметра в нечетком коридоре

Следовательно, полученную модель можно использовать для прогнозирования запасов незавершенного производства. Для этого прогнозные значения факторов нужно подставить в полученное уравнение и рассчитать левое, среднее и правое значения результативного показателя на следующий период. Для получения прогнозных значений факторов используется прогноз по одномерным временным рядам Xj(t) (программы «Стат Эксперт» или «Excel. Анализ данных»).

Запишем уравнение регрессии явно:

Y=(-0,136; 0; 0,136)Х1 + (-0,129; 0; 0,129)Х2 + (-0,257; 0; 0,257)Х3 + 6027

По исходным данным изложенным выше можно рассчитать данные прогноза на 1 и 2 квартала вперёд.

Таблица 3 - Результаты анализа запасов незавершенного производства

Верхняя граница коридора Середина нечеткого коридора Нижняя граница коридора Ширина нечеткого коридора

Данные для прогноза 7209,28 7152,56 7095,85 113,43

7082,45 7031,82 6981,19 101,26

Прогноз 6582,08 6555,45 6528,82

6078,76 6076,28 6073,79

Полученное уравнение, описывающее взаимосвязь между исследуемыми факторами и

запасами несовершенного производства, позволяет дать предположения об интервале возможных изменений последней с возрастанием степени достоверности к середине нечеткого коридора (функции Y1), что значительно повышает аналитический потенциал регрессионного анализа. В данном случае можно предполагать, что запасы незавершенного производства будут колебаться в интервале от 6528,82 до 6582,08 тыс. руб. Середина данного интервала (6555,45 тыс. руб.) отражает наиболее вероятное ее значение в первом квартале прогнозного периода.

Таким образом, регрессионные модели, построенные на основании теории нечетких множеств, обладают существенными преимуществами по сравнению с традиционными, поскольку позволяют прогнозировать результат в рамках заданного коридора.

Полученная нечеткая регрессия использовалась в промышленном предприятии при разработке управленческих решений по повышению эффективности управления оборотными активами в 2009 году.

Библиографический список:

1. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. - М.: ЮНИТИ - ДАНА, 2002.

2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. -М.: ЮНИТИ, 1988.

3. С.А. Горбатков, Д.В. Полупанов Методы нейроматематики в налоговом контроле. - Уфа: БашГУ, 2008.

4. Хайкин С. Нейронные сети: полный курс, 2-е изд.: Пер. с англ. - М.: Издательский дом «Вильямс», 2006.

5. Букаев Г.И., Бублик Н.Д., Горбатков С.А., Сатаров Р.Ф. Модернизация системы налогового контроля на основе нейросетевых информационных технологий. -М.: Наука, 2001.

№ гос. рег. статьи 04210000З4/

Это статья Управление экономическими системами: электронный научный журнал

http ://uecs.mcnip.ru

URL этой статьи: http://uecs.mcnip.ru/modules.php?name=News&file=article&sid=174

i Надоели баннеры? Вы всегда можете отключить рекламу.