ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2009 Управление, вычислительная техника и информатика № 1(6)
УДК 338.26/.28;339.97;004.8.032.26
Ю.С. Соловьева, Т.И. Грекова МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ С ПРИМЕНЕНИЕМ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ
Рассматривается применение нейронных сетей для моделирования и прогнозирования экономических процессов, представленных статистическими выборками. Произведено сравнение качества полученных моделей, а также анализ зависимости топологий выбранных нейронных сетей от типа исходных данных.
Ключевые слова: моделирование, прогнозирование, нейронные сети, экономический процесс, выборка, ряды динамики.
Задачами экономико-статистического моделирования и прогнозирования являются выявление перспективы ближайшего или более отдалённого будущего в исследуемой области на основе реальных результатов деятельности и выработка оптимальных тенденций и перспективных планов с учётом составленного прогноза и оценки принятого решения с позиций последствий в прогнозируемом периоде. Построение модели, наряду с информационными и экспертно-логическими системами, представляется в настоящее время неотъемлемым инструментом теоретической и практической экономики.
Построение моделей экономических процессов осуществляется на основе рядов динамики [1]. Временной ряд, динамический ряд (РД) - это последовательность упорядоченных по времени показателей, характеризующих уровень развития изучаемого явления. В составе динамического ряда в принципе можно выделить четыре компоненты: 1) общую тенденцию развития, или тренд; 2) регулярные колебания относительно тренда (типа циклов); 3) сезонные колебания; 4) остаток, или случайную компоненту, отражающую влияние разнообразных факторов стохастического характера.
Одной из важнейших задач исследования динамических рядов является установление общих закономерностей или тенденций развития. Для решения этой задачи используются разнообразные сглаживающие приёмы (сглаживающие фильтры), среди которых можно выделить два основных метода: сглаживание с помощью скользящей средней и аналитическое выравнивание. Аналитическое выравнивание динамического ряда - это метод выражения тенденций развития в виде функции изучаемого показателя от времени, называемой моделью тренда. Для сглаживания РД, включающих гармоническую компоненту, в основном применяется модель тригонометрического тренда - ряд Фурье [2] с разным числом гармоник, для идентификации параметров которого применяется классический метод наименьших квадратов (МНК) [3] и дискретный фильтр Калмана [4].
Моделирование экономических процессов может осуществляться как с помощью традиционных математических методов, так и с применением современных методов, к которым относятся нейросетевые технологии [6, 8]. Нейронные сети позволяют решать задачи, с которыми не могут справиться традиционные методы, они способны решать задачи, опираясь на неполную, зашумлённую, искажён-
ную информацию. Важным преимуществом использования нейронных сетей для обработки массивов данных являются значительное повышение быстродействия процесса по сравнению с традиционными математическими методами, возможность обучения нейронной сети по эталонным образцам, а также изменение топологии сети, исходя из требований решаемой задачи.
Нейронная сеть - это система, состоящая из многих простых вычислительных элементов (нейронов), определённым образом связанных между собой. Наиболее распространёнными являются многослойные сети, в которых нейроны объединены в слои. Слой, в свою очередь, - это совокупность нейронов, на которые в каждый такт времени параллельно поступает информация от других нейронов сети, т.е. выходы нейронов соединяются с входами других нейронов, так сигнал от одного элемента передаётся другим. После того как определено количество слоёв и число элементов в каждом из них, сеть нужно обучить [7], т.е. определить значения для весов и порогов сети, которые минимизировали бы ошибку прогноза, выдаваемого сетью. Ошибка для конкретной конфигурации сети определяется путём прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с желаемыми (целевыми) значениями. По сути процесс обучения представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным.
1. Моделирование экономических процессов с применением нейронных сетей
Приступая к разработке нейросетевой модели, как правило, сталкиваются с проблемой выбора структуры нейронной сети. Задачи аппроксимации экспериментальных данных можно решать с помощью сетей следующих типов: многослойного персептрона, сетей с радиально-базисными функциями, обобщённорегрессионных, линейных сетей [5, 8] и т.д., однако наличие разных типов сетей и алгоритмов их обучения для различных типов задач не гарантирует автоматически, что созданная сеть обеспечит требуемое качество модели.
В предлагаемой работе рассматривается построение нейросетевой модели экономического процесса с применением радиально-базисной (radial basis neural network [5], RBNN) и каскадной (cascade-forward backpropagation neural network [5], CFNN) структур нейронных сетей. Эти сети были выбраны в результате сравнительного анализа качества полученных моделей с применением нейронных сетей различных структур, так как они наиболее просты и эффективны для аппроксимации данных.
Для обучения нейронных сетей используют различные методы, в том числе алгоритм обратного распространения ошибки [5]. Функция ошибки, благодаря тому, что в нейронной сети используются нелинейные пороговые функции, представляет собой сложную «овражистую» поверхность с большим числом локальных минимумов. Для правильной настройки сети необходимо попасть в глобальный минимум. Существуют различные методы минимизации ошибки: «овражный» метод [5] (gradient descent with momentum, gdm); алгоритм Видроу - Хоффа (Widrow - Hoff, wh) [7]; метод сопряженного градиента (scaled conjugate gradient, scg) [5]; методы второго порядка (Quasi-Newton algorithms, bfg; Levenberg - Marq-uardt method, lm; one step secant, oss) [2]; метод смещений (conscience, con) [5].
Одной из целей моделирования является выявление области топологий нейронной сети (подбор входных параметров, которые гарантируют получение моде-
ли наиболее высокой точности) непосредственно после первичного анализа графического представления исходных данных в зависимости от целей моделирования (т. е. будет ли процесс обработки РД завершен на этапе построенной модели, либо будет продолжен построением прогноза его будущего состояния).
В предлагаемой работе область топологий используемых нейронных сетей, обеспечивающих требуемое качество моделей, выделена эмпирическим путем, когда рассматривается максимально возможное количество вариаций параметров сети с привязкой к определенному типу входных данных. Для радиально-базисной сети таким параметром является среднее допустимое отклонение начальных весовых коэффициентов с, а для СЕЫЫ - количество скрытых нейронов сети п1, количество эпох Е и метод минимизации ошибки.
Для иллюстрации применения нейронных сетей при моделировании экономических процессов были взяты данные, отражающие состояние экономики России на 2006 год. Все выборочные данные представляют три основные группы: стационарные периодические (себестоимость произведённой продукции, тыс. руб., рис. 1), нестационарные непериодические (средневзвешенная доходность биржевых облигаций Томской области за 2006 г., % годовых, рис. 2) и нестационарные периодические (оборот розничной торговли, млрд руб., рис. 3).
2005 2005 2005 2005 2006 2006 2006
Рис. 1. Себестоимость произведённой продукции (тыс. руб.)
2003 2004 2004 2004 2004 2005 2005 2005 2006
Рис. 2. Средневзвешенная доходность биржевых облигаций Томской области за 2006 г. (% годовых)
Январь Июнь Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март 2002 2002 2002 2003 2003 2004 2004 2005 2005 2006
Рис. 3. Оборот розничной торговли (млрд. руб.)
На рис. 1 - 3 представлены наилучшие результаты моделирования с использованием КОМЫ и ОБМЫ в пакете МаНаЪ. Точками изображены исходные данные, сплошной линией - аппроксимирующая функция.
В качестве характеризующего фактора, определяющего степень предпочтительности той или иной нейронной сети, используем коэффициент детерминации [1]:
N _ N-1 _
Ё (гк- 4)2 у+Ё
В2 = 1 - М----------, * = 2 >=2 2
^ -2 N-1
Ё (- * )
к=1
где * - исходная выборка объёма N * - оценка исходных данных объёма N.
Полученные результаты приведены в табл. 1 и 2, где с - среднее допустимое отклонение начальных весовых коэффициентов, п1 - количество скрытых нейронов сети, т - метод минимизации ошибки.
Т аблица 1
Результаты применения ЯБММ
Периодические Непериодические Периодические
с стационарные данные нестационарные данные нестационарные данные
Коэффициент детерминации, Е2
±2,58 1 1 1
±2,7 1 1 0,9999
±3,09 0,9999 1 0,9999
±3,1 0,9999 0,9999 0,9999
Т аблица 2
Результаты применения СГММ
«1 Периодические стационарные данные Непериодические нестационарные данные Периодические нестационарные данные
В1 Е Т, с К1 Е Т, с К2 Е Т, с
150 1 40 10 1 26 54 1 30 11
70 1 40 7 0,7214 26 5 1 30 6
50 0,9995 40 3 0,4009 26 2 0,9991 30 3
Метод (т) 088 1т scg
Радиально-базисная сеть справляется с задачей аппроксимации за незначительный временной промежуток (менее 5 с) и даёт коэффициент детерминации В2 (табл. 1), достаточный для того, чтобы называть результат хорошим. Максимальное приближение достигается также и СРМЫ", но за более длительный период времени (табл. 2).
Сравнение построенных нейросетевых моделей по быстродействию для различных видов исходных данных имеет смысл проводить как на больших, так и на малых выборках, так как при кратном увеличении объемов РД происходит аналогичное увеличение по времени работы сети. Особенно явно данное свойство проявляется на непериодических нестационарных данных. При моделировании экономического процесса, представленного небольшим количеством исходных данных для завершения процесса с применением СБЫЫ и радиально-базисной сети потребуется приблизительно равное время. Но при кратном увеличении объема данных время, затрачиваемое на построение модели с применением СБЫЫ будет измеряться уже не в минутах, а стремиться к часу и более, в отличие от КВММ Поэтому при большом объеме выборки для построения модели непериодического нестационарного экономического процесса предпочтительнее использовать радиально-базисную нейронную сеть. Качество моделирования при правильном выборе регулирующего параметра не ухудшится, а время сократится в разы.
2. Прогнозирование поведения экономических процессов с применением нейронных сетей
После проведения процедуры моделирования экономического процесса возможна его дальнейшая обработка, а именно построение прогнозной модели. Цель остается прежней: выбор области топологий нейронной сети для различных видов данных.
Характеризующими факторами, определяющими степень предпочтительности того или иного метода для определённого вида данных, являются коэффициент детерминации В2 (1) и средняя ошибка аппроксимации на прогнозируемом участке [1]:
1=к+1
2- — 2-
(2)
где 2 - оценка, построенная по соответствующему методу.
Будем говорить о высокой точности прогноза, если у < 0,1, о хорошей точности, если 0,1 < у < 0,2, удовлетворительной точности, если 0,2 < у < 0,5, о неудовлетворительной точности, если у > 0,5.
Для решения задачи прогнозирования применим метод проекции временного ряда. С помощью обученной нейронной сети можно решить задачу прогнозирования следующим образом. Предположим, что необходимо построить прогноз рыночной цены на определенный вид продукции. Количество построенных прогнозных значений называется горизонтом прогнозирования и обозначается символом д. Общий объем ряда динамики обозначается символом N. Выполним так называемую проекцию временного ряда. Вначале сеть обучается на выделенных примерах объема ^ - д) с применением области топологий нейронной сети для построения оценочной модели. Затем выдается прогноз следующего значения ряда динамики (возможна смена метода минимизации ошибки), после чего полученный результат вместе с предыдущей обучающей выборкой снова подается на вход сети. Выдается очередное прогнозное значение. Такую проекцию можно повторять произвольное число раз, хотя в дальнейшем качество прогноза будет ухудшаться.
При прогнозировании экономического процесса по методу проекции временного ряда в качестве обученной нейросети использовалась сеть, полученная с применением параметров из области топологий построения качественной модели экономического процесса с применением нейронных сетей на данных определенного типа. Возможность смены топологии сети в процессе обучения является характерным признаком любой нейронной сети. Модификация сети достигается для радиально-базисной сети сменой параметра сигма, а для каскадной нейронной сети - заменой метода минимизации ошибки. При определении области топологий нейронных сетей для построения прогнозных моделей производится анализ не только качества прогноза, но и его адекватности по коэффициенту детерминации (1) и средней ошибки аппроксимации (2) соответственно. Такие показатели, как R2 и у, являются равными по значимости, но разными по методу конечной оценки результата. Поэтому их необходимо использовать в комплексе, а общий вывод формировать по тому показателю, который демонстрирует худший результат. Кроме того, стоит учитывать тот факт, что средняя ошибка аппроксимации на прогнозируемом участке q может зависеть от величины разброса исходных данных и давать при этом не слишком высокую оценку прогнозам, не отображая при этом действительность.
В нашем случае горизонт прогнозирования используется в двух вариантах: q = 3 и q = 10. По результатам применения метода проекции временного ряда
для каждого взятого экономического процесса была вычислена величина у (2), которая характеризует точность полученного прогноза, и значение коэффициента детерминации (1) для всей модели, включая прогноз.
На рис. 4 - 6 представлены результаты построения прогнозирующих нейросе-тевых моделей. Точками изображены исходные данные, сплошной линией - аппроксимирующая функция. Прогноз выделен более светлым оттенком.
3000- а Д Применение ■> 3000 б Д Применение •
1 1 RB-сети, q = 3 Д 1 1 CF-сети, q = 3 /\
11 / 1 А I \ 1 •
2000 2000
1 1 1 \ Ш \
1000- Т /У • 1000 Т • v/Ч | U л
0 1 1 1 1 1 1 0 Г 1 1 1 1 1 I
Январь Июль Февраль Август Январь Июль Февраль Август
2005 2005 2006 2006 2005 2005 2006 2006
3000 в / \ Применение • 1 RBF-сети, q = 10 # 3000 г 1 \ Применение • \ CF-сети, q = 10
2000 1 • с; • 2000 Чж f \d • \
1000- vVa • • 1000- • V 1
0 1 1 1 1 1 1 0 ■ 1 1 1 1 1
Январь Июль Февраль Август Январь Июль Февраль Август
2005 2005 2006 2006 2005 2005 2006 2006
Рис. 4. Прогнозирующая модель себестоимости произведённой продукции (тыс. руб.)
Ноябрь Февраль Май Август Декабрь Март Июнь Октябрь Январь 2003 2004 2004 2004 2004 2005 2005 2005 2006
2003 2004 2004 2004 2004 2005 2005 2005 2006
2003 2004 2004 2004 2004 2005 2005 2005 2006
2003 2004 2004 2004 2004 2005 2005 2005 2006
Рис. 5. Прогнозирующая модель средневзвешенной доходности биржевых облигаций Томской области за 2006 г. (% годовых)
Январь Июнь Декабрь Июнь Ноябрь Май Октябрь Апрель Октябрь Март
2002 2002 2002 2003 2003 2004 2004 2005 2005 2006
2002 2002 2002 2003 2003 2004 2004 2005 2005 2006
2002 2002 2002 2003 2003 2004 2004 2005 2005 2006
2002 2002 2002 2003 2003 2004 2004 2005 2005 2006
Рис. 6. Прогнозирующая модель оборота розничной торговли (млрд руб.)
Заключение
В табл. 3 и 4 приведены значения коэффициента детерминации Я2, вычисленного по формуле (1), у - по формуле (2), Т - времени работы модели в секундах, где т - метод минимизации ошибки.
На основании данных таблиц можно сделать вывод, что в большинстве случаев радиально-базисная сеть справляется с задачей прогнозирования за более длительный временной промежуток, чем каскадная сеть. Прогноз, построенный с применением СРМЫ", является более адекватным и качественным, что видно по величине у, даже если при этом коэффициент детерминации Я2 радиальнобазисной сети незначительно превышает аналогичный показатель каскадной сети (табл. 3, 4).
Таблица 3
Горизонт прогнозирования q = 3
Данные Характеристики сгт
Периодические нестационарные Я2 0,9933 0,9990
У 0,1187 0,0207
Т, с 6,219 1,792
т ■И
Непериодические нестационарные Я2 0,9998 0,9997
У 0,0032 0,0039
Т, с 3,114 3,064
т
Периодические нестационарные Я2 0,9968 0,9971
У 0,0203 0,0213
Т, с 2,544 2,764
т соп
Таблица 4
Горизонт прогнозирования q = 10
Данные Характеристики сгт
Периодические нестационарные Я2 0,9528 0,9506
У 0,2026 0,1859
Т, с 1,764 1,472
т ■И
Непериодические нестационарные Я2 0,9758 0,9557
У 0,0137 0,0847
Т, с 4,777 2,664
т
Периодические нестационарные Я2 0,9833 0,9886
У 0,0753 0,0507
Т, с 8,973 2,623
т соп
Таким образом, видно, что применение СРМЫ для построения прогнозирующей модели экономического процесса более обоснованно. При этом недостатком данного алгоритма можно считать сильную зависимость результатов для конкретного экономического процесса от выбранного метода обучения сети.
Сравнительный анализ результатов моделирования для конкретных числовых примеров подтверждает применимость нейронных сетей и высокое качество аппроксимации РД и прогнозирования поведения экономической системы. Использование нейросетевых моделей хозяйствующими субъектами может обеспечить получение значительного экономического эффекта, так как позволяет быстро и надёжно заблаговременно просчитать возможное развитие событий.
ЛИТЕРАТУРА
1. КендэлМ. Временные ряды. М.: Финансы и статистика, 1981. 198 с.
2. Статистика: Учебник / Под ред. проф. И.И. Елисеевой. М.: Финансы и статистика, 2002. 479 с.
3. Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1997. 223 с.
4. Браммер К., ЗиффлингГ. Фильтр Калмана Бьюси. М.: Наука, 1982. 199 с.
5. Тютерев В.В., Новосельцев В.Б. Теория нейронных сетей: Учебное пособие. Томск: Изд-во Том. ун-та, 2001. 69 с.
6. Галушкин А.И. Теория нейронных сетей. Кн.1: Учебное пособие для вузов. М.: Издательское предприятие редакции журнала «Радиотехника», 2000. 415 с.
7. Новиков В.А., Калацкая Л.В., Садов В.С. Организация и обучение искусственных нейронных сетей: Экспериментальное учеб. пособие. Минск: Изд-во БГУ, 2003. 72 с.
8. Мкртчян С.О. Нейроны и нейронные сети. М.: Энергия, 1971. 230 с.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета. Поступила в редакцию 12 ноября 2008 г. (После доработки 15 января 2009 г.)