Научная статья на тему 'Гибридные распределенные регрессионные и интеллектуальные системы прогноза показателей социально-экономического развития России'

Гибридные распределенные регрессионные и интеллектуальные системы прогноза показателей социально-экономического развития России Текст научной статьи по специальности «Экономика и бизнес»

CC BY
160
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СФЕРА ИССЛЕДОВАНИЙ И ИННОВАЦИЙ / СИСТЕМЫ РЕГРЕССИОННЫХ УРАВНЕНИЙ / МОДЕЛИ КРАТКОСРОЧНОГО ПРОГНОЗА / РЕТРОВЕРИФИКАЦИЯ ПРОГНОЗА / СИСТЕМА НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ / СИСТЕМА ГИБРИДНЫХ МОДЕЛЕЙ / SPHERE OF RESEARCH AND INNOVATION / SYSTEMS OF REGRESSIVE EQUATIONS / MODELS OF SHORT-TERM FORECAST / RETRO-VERIFICATION OF FORECAST / SYSTEM OF NEURO-NETWORK MODELS / SYSTEM OF HYBRID MODELS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Китова Ольга Викторовна, Колмаков Игорь Борисович, Доможаков Матвей Валерьевич, Кривошеева Ярослава Валерьевна, Пеньков Илья Андреевич

В статье рассмотрены общая методология и архитектура системы гибридных моделей прогноза экономических показателей, ее реализация в виде интегрированной информационной системы на примере показателей сферы исследований и инноваций, инвестиций и бюджетной сферы экономики Российской Федерации. Продемонстрирована схема работы распределенной информационно-аналитической метасистемы, представлен общий алгоритм процесса ретроверификации типового блока прогноза, который способствует значительному повышению доверия к результатам прогнозирования. Показаны стадии процесса прогноза показателей в гибридной модели. Использование подобной системы позволяет не только повысить точность и качество прогнозных расчетов, но и применять их в контуре управления достижением целевых показателей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Китова Ольга Викторовна, Колмаков Игорь Борисович, Доможаков Матвей Валерьевич, Кривошеева Ярослава Валерьевна, Пеньков Илья Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Гибридные распределенные регрессионные и интеллектуальные системы прогноза показателей социально-экономического развития России»

МАТЕМАТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ

ГИБРИДНЫЕ РАСПРЕДЕЛЕННЫЕ РЕГРЕССИОННЫЕ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ПРОГНОЗА ПОКАЗАТЕЛЕЙ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО РАЗВИТИЯ РОССИИ

Китова Ольга Викторовна

доктор экономических наук, профессор, заведующая кафедрой информатики РЭУ им. Г. В. Плеханова.

Адрес: ФГБОУ ВО «Российский экономический университет имени Г. В. Плеханова», 117997, Москва, Стремянный пер., д. 36. E-mail: olga.kitova@mail.ru

Колмаков Игорь Борисович

доктор экономических наук, профессор кафедры информатики РЭУ им. Г. В. Плеханова. Адрес: ФГБОУ ВО «Российский экономический университет имени Г. В. Плеханова», 117997, Москва, Стремянный пер., д. 36. E-mail: kolibor@rambler.ru

Доможаков Матвей Валерьевич

аспирант кафедры информатики РЭУ им. Г. В. Плеханова.

Адрес: ФГБОУ ВО «Российский экономический университет имени Г. В. Плеханова», 117997, Москва, Стремянный пер., д. 36. E-mail: matkhak@yandex.ru

Кривошеева Ярослава Валерьевна

аспирантка кафедры информатики РЭУ им. Г. В. Плеханова.

Адрес: ФГБОУ ВО «Российский экономический университет имени Г. В. Плеханова», 117997, Москва, Стремянный пер., д. 36. E-mail: yaroslava2009@mail.ru

Пеньков Илья Андреевич

аспирант кафедры информатики РЭУ им. Г. В. Плеханова.

Адрес: ФГБОУ ВО «Российский экономический университет имени Г. В. Плеханова», 117997, Москва, Стремянный пер., д. 36. E-mail: bryant55@yandex.ru

В статье рассмотрены общая методология и архитектура системы гибридных моделей прогноза экономических показателей, ее реализация в виде интегрированной информационной системы на примере показателей сферы исследований и инноваций, инвестиций и бюджетной сферы экономики Российской Федерации. Продемонстрирована схема работы распределенной информационно-аналитической метасистемы, представлен общий алгоритм процесса ретроверификации типового блока прогноза, который способствует значительному повышению доверия к результатам прогнозирования. Показаны стадии процесса прогноза показателей в гибридной модели. Использование подобной

системы позволяет не только повысить точность и качество прогнозных расчетов, но и применять их в контуре управления достижением целевых показателей. Ключевые слова: сфера исследований и инноваций, системы регрессионных уравнений, модели краткосрочного прогноза, ретроверификация прогноза, система нейросетевых моделей, система гибридных моделей.

HYBRID ASSIGNED REGRESSIVE AND INTELLECTUAL SYSTEMS FOR FORECASTING RATES OF SOCIAL AND ECONOMIC DEVELOPMENT IN RUSSIA

Kitova, Olga V.

Doctor of Economics, Professor, Head of the Department for Information Science of the PRUE. Address: Plekhanov Russian University of Economics, 36 Stremyanny Lane, Moscow, 117997, Russian Federation. E-mail: olga.kitova@mail.ru

Kolmakov, Igor B.

Doctor of Economics, Professor of the Department for Information Science of the PRUE. Address: Plekhanov Russian University of Economics, 36 Stremyanny Lane, Moscow, 117997, Russian Federation. E-mail: kolibor@rambler.ru

Domozhakov, Matvey V.

Post-Graduate Student of the Department for Information Science of the PRUE. Address: Plekhanov Russian University of Economics, 36 Stremyanny Lane, Moscow, 117997, Russian Federation. E-mail: matkhak@yandex.ru

Krivosheeva, Yaroslava V.

Post-Graduate Student of the Department for Information Science of the PRUE.

Address: Plekhanov Russian University of Economics, 36 Stremyanny Lane, Moscow, 117997,

Russian Federation.

E-mail: yaroslava2009@mail.ru

Pen'kov, Il'ya A.

Post-Graduate Student of the Department for Information Science of the PRUE. Address: Plekhanov Russian University of Economics, 36 Stremyanny Lane, Moscow, 117997, Russian Federation. E-mail: bryant55@yandex.ru

The article deals with general methodology and architecture of the system of hybrid models for forecasting economic indices, its putting into effect in the form of integrated information system illustrated by rates in the field of research and innovation, investment and budget sphere of Russian Federation economy. The authors demonstrate the scheme of work of the assigned information and analytical meta-system, show the general algorithm for the process of

retro-verification of typical forecast block, which can raise trust for forecast results. They depict stages of the indices forecast process in the hybrid model. The use of such system could give an opportunity to improve accuracy and quality of forecasts and at the same time to apply them in the contour of managing the attainment of target rates.

Keywords: sphere of research and innovation, systems of regressive equations, models of short-term forecast, retro-verification of forecast, system of neuro-network models, system of hybrid models.

Переход на систему национального счетоводства открыл перспективу использования накопленного в странах с развитой экономикой опыта моделирования процессов прогнозирования показателей социально-экономического развития, включая показатели макроэкономики, финансовой системы, внешнеэкономической деятельности, бюджетирования, уровня жизни населения, научных исследований и инноваций.

На кафедре информатики Российского экономического университета имени Г. В. Плеханова разработана распределенная информационно-аналитическая мета-система1 (РИАМС) для решения взаимосвязанных регрессионных уравнений. Подход, использованный в программно-технологическом комплексе (ПТК), базируется на применении распределенной эконометри-ческой модели, в которую встраиваются блоки, определяющие основные показатели развития социально-экономического развития России. Концептуальная схема модели представлена на рис. 1.

Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим возникает задача исследования зависимости одной переменной от нескольких объясняющих переменных. Одним из способов решения подобной задачи является множественный регрессионный анализ. Прогнозные расчеты полу-

1 См.: Свидетельство о государственной регистрации программы для ЭВМ «Программа реализации распределенной метасистемы эконометрических моделей прогноза» № 2013617339. Заявка № 2013615488 от 27 июня 2013 г. Зарегистрировано в Реестре программ для ЭВМ 9 августа 2013 г. Авторы-правообладатели: И. Б. Колмаков, О. В. Китова, С. В. Потапов.

чаются на основе использования систем регрессионных уравнений, в которых каждый показатель определяется как функция других показателей-аргументов в соответствии с экономическим смыслом. Все операции - перенастройку параметров системы и вариантные расчеты прогнозов - выполняет эксперт-исследователь (ЭИ).

Основными источниками отчетных данных для системы являются:

- статистические данные Росстата, Минфина России, Банка России, Мин-промторга России, Минэкономразвития России, ЦЭК, Бюро экономического анализа при Правительстве Российской Федерации и другие источники отчетных показателей социально-экономического развития России;

- методологические материалы к составлению прогноза макроэкономических показателей;

- аналитические материалы: аналитические обзоры ЦЭК, Банка России, Мин-промторга России, Минфина России, Минэкономразвития России, Росстата и других организаций.

Дополнительно используются материалы министерств и ведомств социально-экономического блока и аналитических агентств, экспертные разработки российских и зарубежных ученых, а также собственные аналитические материалы авторов.

Сценарные показатели задаются экзо-генно и определяют траекторию прогноза: Ятв/ - ставка рефинансирования Банка России; РШ - средние экспортные цены на нефть, долл./баррель; REZ - изменение международных золотовалютных резервов России; М2 - темп изменения денежной массы.

Главное преимущество системы - оперативная возможность изменения сценарных условий и последующий перерасчет прогнозных значений. Практически для любого сценарно фиксируемого изменения внешней среды можно получать про-

гнозные значения. В качестве примеров рассмотрим выборочные модели прогноза показателей финансовой сферы, показателей сферы исследований и инноваций, показателей инвестиций.

Рис. 1. Концептуальная схема системы моделей краткосрочного прогноза показателей социально-экономического развития России

Перечисленными блоками возможности системы не ограничиваются. Фактически в системе обрабатываются модели показателей макроэкономики, уровня жизни, труда и занятости населения. Возможно включение в систему любых блоков и показателей, наблюдаемых и публикуемых Росстатом.

Общеизвестно, что хорошие показатели качества прогноза являются необходимым, но не достаточным условием для получения прогноза достаточной точности. В настоящее время не существует методов, позволяющих проверить (или гарантировать) точность прогноза до завершения прогнозного периода. Проверить точность прогноза можно только после завершения прогнозного периода, т. е. на отчетных данных можно проверять точность ретропрогноза.

Накопление сведений о поведении ре-тропрогноза и перенастройке модели на высокие показатели точности способствуют значительному повышению доверия к результатам прогноза. Именно поэтому нами разработаны верификаторы (ВРФ) [6]. Происходит процесс сопоставления расчетных результатов модели с соответствующими отчетными данными действительности - фактами и закономерностями

экономического развития. Основное отличие ретропрогноза от прогноза состоит в том, что сценарные показатели перестают быть экспертными и становятся отчетными. В этом случае появляется возможность оценить качество и точность только самих регрессионных моделей [6].

ЭИ устанавливает критерии точности и качества, которым должны удовлетворять результаты прогноза. В системе оценок качества регрессионных уравнений использованы общепринятые критерии: коэффициент детерминации (К2), критерий Дарбина-Уотсона (ОМ), значение статистики Фишера (Р-вЬаЬ), табличное значение статистики Фишера в зависимости от числа степеней свободы дисперсий (Ртаб). Оценкой точности прогноза служит показатель относительной ошибки (МАРЕ). Устанавливая границы указанных критериев, эксперты могут судить о точности прогнозных моделей и формировать характеристики качества прогноза показателей в категориях «плохой» и «хороший» (табл. 1) [6].

После получения предварительных результатов анализа прогнозирования эко-нометрических моделей предпринимают-

ся попытки улучшить оценку качества и точности. Для этого продолжается поиск значимых факторов и происходит включение в расчеты новых регрессионных уравнений либо выявляются закономерности при построении расчетных значений

или применяются другие корректирующие действия [5]. Результаты ретровери-фикации эконометрических моделей за 2014 г. по анализируемым сферам приведены в табл. 2 (отчетные данные для анализа взяты за период 2004-2014 гг.).

Т а б л и ц а 1

показателей

Категория Оценка

качества точности

Хороший К2 > 0,4; Р-вЬаЬ > Ртаб; 0,6 < БШ <= 3,4 МАРЕ < 0,16

Плохой К2 < 0,4 ; Р-вЬаЬ < Ртаб; 0,6 > БШ или БШ > 3,4 МАРЕ > 0,16

Т а б л и ц а 2

Ретроверификация моделей

Модель Общее количество Хорошие Плохие

показателей

Финансовая сфера 180 170 10

Инвестиции 40 30 10

Исследования и инновации 75 64 11

Для ряда показателей существуют объективные причины, не позволяющие улучшить характеристики качества и точности прогноза. То есть достигается предел возможностей регрессионных моделей, преодолеть который в рамках этих моделей не представляется возможным. Причинами таких ограничений могут быть:

- появление новых показателей с короткими (неполными) рядами отчетных данных;

- несопоставимость отчетных данных на исследуемом отрезке времени из-за радикальных методологических изменений в отчетности показателя;

- неполнота наборов отчетных показателей Росстата в системе национальных счетов (например, отсутствие индексов-дефляторов для компонентов структур валового внутреннего продукта и др.) [2];

- использование показателей со скрытыми (ненаблюдаемыми) наборами факторов влияния;

- потеря статистической значимости на исследуемом отрезке времени (происходит переход на «ручное» управление);

- наличие нелинейной связи между рассматриваемыми факторами и зависимым от них показателем, которую не позволяет обнаружить модель множественной линейной регрессии;

- прямая зависимость значений показателя от постановлений законодательной или исполнительной ветвей власти (административно зависимые директивные показатели, внешнее управление).

В последнем случае администраторы определяют будущие значения факторов влияния исходя из опыта собственных оценок (поведения прогнозных рыночных показателей, выработанных доктрин и целей, иногда скрытых) и выдают собственные управляющие воздействия (в форме финансирования или прямых директив), которые и определяют поведение соответствующих показателей.

По результатам работы верификатора (по данным последнего отчетного периода) формируются сводные списки принятых (хороших) и непринятых (плохих) показателей.

В случаях, когда достигнуты предельные возможности эконометрических моделей прогноза, а потребности в показателях прогноза не удовлетворены, возникает необходимость использовать принципиально другие методы, модели и инструментальные средства для получения прогнозных значений востребованных показателей.

Нами были выбраны методы, модели и инструментальные средства для прогнозирования показателей, которые признаны плохими в моделях множественной регрессии:

1) искусственные нейронные сети (ИНС);

2) регрессионные деревья решений (ДР);

3) машины опорных векторов (МОВ).

Искусственные нейронные сети

Одно из направлений поиска прогнозов - применение искусственных нейронных сетей (ИНС) [3], входом которых являются показатели с низкими параметрами качества и точности эконометрической модели. Возникает задача использования нескольких различных методов ИНС в рамках одной архитектуры [4; 7]. Причем необходимо, чтобы инструментальные средства представляли собой взаимосвязанные ИНС модели и удовлетворяли требованиям системы распределенных искусственных ней-росетевых моделей (РИНСМ).

Модель временного ряда имеет следующий вид:

У(Ь) = /(У(Ь - 1), У(Ь - 2), У(Ь - 3), ...) + £(,

где Ь - период времени;

У(Ь) - значение модели в период Ь;

/( ... ) - функция, описывающая зависимость текущего значения временного ряда от его предыдущих показателей;

£ь - ошибка модели.

Все плохие показатели из РИАМС поступают в систему нейросетевых моделей. Искусственная нейронная сеть представляет собой совокупность нейронов - вычислительных элементов. Структура отдельного нейрона следующая (рис. 2): входные сигналы взвешиваются, затем суммируются; полученная взвешенная

сумма подвергается изменению функцией активации.

Смещение b

Y(t-2)

-(W)-

Функция активации

\ I <p(U(t))

Выход Y(t)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сумматор

Y(t-n)

Рис. 2. Модель нейрона: Y(t - 1), Y(t - 2), ..., Y(t - n) - входные сигналы; Wi - синаптические веса нейронов; Ъ - смещение; 9(U(i)) - функция активации

Математическая модель нейрона выглядит следующим образом:

Y(t) = ф(и(£)),

где U(t) = ПЩ ■ Y(t - i) + b.

В качестве функции активации может быть выбрана любая дифференцируемая функция. Обычно используется сигмои-дальная функция. В зависимости от способа связи нейронов между собой существуют четыре основные обобщенные архитектуры [4]: сети прямого распространения; рекуррентные сети; радиально-базисные функции; самоорганизующиеся карты.

Моделирование нелинейной зависимости между будущими значениями временного ряда, его предыдущими значениями и внешними факторами обусловливается архитектурой сети и используемой функцией активации.

В настоящей статье реализована сеть прямого распространения - многослойный персептрон (МП). В сетях подобного типа входной сигнал распространяется в прямом направлении от слоя к слою. На рис. 3 представлен пример МП с двумя нейронами на входном слое, двумя - на скрытом и с одним нейроном на выходном слое.

Входной слой Скрытый слой Выходной слой

щ

Рис. 3. Пример структуры МП

Многослойный персептрон имеет ряд управляемых параметров, которые формируют его структуру и реализованы в системе: количество нейронов на входном слое; количество нейронов на скрытом слое; количество скрытых слоев; количество нейронов на выходном слое; скорость обучения; момент обучения; максимальное количество эпох обучения; максимальное время обучения.

Регрессионные деревья решений

В основе деревьев решений лежит процесс рекурсивного разбиения входных наблюдений на подмножества, относящиеся к классам. Разбиение происходит с помощью решающих правил, в которых осуществляется проверка значений входных признаков по заданному условию. Процесс построения дерева решений является рекурсивным, так как на каждом следующем шаге разбиения используются результаты, полученные на предыдущем шаге.

Деревья решений в большинстве случаев не требуют предположений о статистическом распределении значений признаков, в отличие от методов, основанных на статистическом подходе (логистическая и линейная регрессия, классификатор Байе-са). Ключевыми преимуществами деревьев решений обычно являются способность решать задачи, в которых отсутствует априорная информация о виде зависимости между исследуемыми данными; решение задач как классификации, так и регрессии; отсутствие необходимости отбора атрибутов модели, поскольку алгоритм сам имеет возможность выбирать наиболее значимые из них.

Для построения моделей деревьев решений мы использовали алгоритм CART (classification and regression trees), который предназначен для построения бинарного дерева решений. Каждый узел бинарного дерева при разбиении имеет только двух потомков, называемых дочерними ветвями. Дальнейшее разделение ветви зависит от того, много ли исходных данных описывает данная ветвь. На каждом шаге по-

строения дерева правило, формируемое в узле, делит заданное множество примеров на две части. В результате выбирается такое разбиение, которое максимально выделило в одном из подпространств наблюдения одного из классов. Это разбиение будет корнем дерева решений, имеющим два разбиения. Выбор атрибута, на основе которого осуществляется разбиение, происходит в соответствии с определенными мерами: индекс Джини, мера энтропии. Индекс (коэффициент) Джини как функция оценки качества разбиения определяется следующей формулой:

С1п1(Т) = 1 - Я=1 р2, где Т - исходный набор данных (примеров множества);

р - вероятность (относительная частота) класса I в Т;

п - количество классов.

Если набор Т разбивается на две части Т1 и Т2 с числом примеров в каждом N1 и N2 соответственно, тогда показатель качества разбиения будет равен

СМврш(Т) = ^ • ап1(Тг) + ^ • С1п1(Тг).

N N

Наилучшим считается то разбиение, для которого атврш(Т) минимально.

Процесс построения регрессионного дерева решений аналогичен построению классификационного дерева, но вместо меток классов в листьях располагаются числовые значения. По существу, регрессионные деревья отражают кусочно-постоянную функцию входных переменных.

Результатом построения регрессионного дерева будет такое разбиение исходного множества входных данных, при котором в каждом листе должны оказаться наблюдения с близкими значениями целевой (выходной) переменной. Основная идея - разбиение всего пространства на прямоугольники не обязательно одинакового размера, в которых выходная переменная считается постоянной.

Процесс построения регрессионного дерева решений происходит последовательно. На первом этапе вычисляется рег-

рессионная оценка как константа по всему пространству примеров. Если обозначить все значения выходной переменной как

Yi, Y2, равна

Yn, тогда регрессионная оценка

f (x) =

1

■ IR (x)/

-lliY

vn J

где R - пространство обучающих примеров;

n - число примеров;

IR (x) - функция пространства (набор правил, описывающих попадание переменной x в пространство).

Для определения чистоты узла используется дисперсия, так как чем ближе значения в узле к значениям целевой переменной, тем меньше дисперсия. Таким образом, наилучшим разбиением будет то, которое обеспечит максимальное уменьшение дисперсии выходной переменной.

В статье реализованы две модификации моделей деревьев решений. В первой модификации происходит моделирование на основе сравнения результатов, генерируемых моделями при различных наиболее вероятных значениях параметров, которые необходимы для реализации алгоритма CART. Это параметр глубины дерева (depth) и параметр количества признаков входных переменных (features), на основании которых алгоритм CART будет определять следующее наилучшее разбиение в узле. Ключевой особенностью этой модификации является автоматический выбор наилучшего значения одного параметра при заданном, фиксированном значении другого параметра.

Вторая модификация ориентирована на работу алгоритма AdaBoost, позволяющего улучшать эффективность базового алгоритма обучения за счет перенастройки распределения весов после каждой итерации вызова. Такой подход позволяет фокусировать работу алгоритма на примерах с наибольшей ошибкой за счет присвоения больших весов.

К управляемым параметрам в системе, на основании которых происходит расчет

модели, относятся тип модификации, глубина дерева, количество входных переменных.

Машины опорных векторов

Основная идея метода машины опорных векторов заключается в поиске гиперплоскости, позволяющей разделить исходное множество примеров на два класса.

В основе построения алгоритма обучения опорных векторов лежит понятие ядра скалярного произведения опорного вектора и вектора, взятого из входного пространства. Опорные векторы представляют собой подмножество обучающей выборки. Методы генерации ядра позволяют строить различные обучаемые машины (полиномиальные, сигмоидальные, на основе радиально-базисных функций и т. д.) со своими собственными нелинейными поверхностями решений

Учитывая основную идею метода опорных векторов, важно отметить понятие линейной разделимости образов (рис. 4). Оно связано с возможностью однозначного бинарного разделения примеров множества. При этом в процессе реализации метода происходит поиск образов (примеров), находящихся на границе между двумя классами. Такие образы являются опорными векторами. Эти векторы играют решающую роль в работе обучаемых машин. Они представляют собой те точки данных, которые лежат ближе всего к поверхности решений (область между границами двух разделяемых классов) и являются самыми сложными для классификации. Они лучше всего указывают на оптимальное размещение поверхности решений.

Рис. 4. Разделение исходного множества на два класса на основе определения разделяющей гиперплоскости

Модель классификации или регрессии, построенная на основе метода опорных векторов, считается линейно разделимой, если область между границами двух классов оказывается пустой. Это говорит о том, что в результате функционирования машины опорных векторов удалось разделить все примеры исходного множества на два класса. В случае неразделимости образов, когда невозможно построить разделяющую гиперплоскость, полностью исключающую ошибки классификации, задача сводится к поиску такой гиперплоскости, которая будет минимизировать ошибку классификации на множестве обучающих примеров.

В общем виде задача классификации при помощи метода опорных векторов заключается в поиске некоторой линейной функции, которая разделяет исходное множество образов на два класса и принимает значение меньше нуля для образов (векторов) одного класса и больше нуля -для векторов другого класса.

Недостаток метода состоит в том, что для классификации используется не все множество образцов, а лишь их небольшая часть, которая находится на границах. К его достоинствам можно отнести то, что для классификации методом опорных векторов, в отличие от большинства других методов, достаточно небольшого набора данных. Также преимуществами являются решение задачи квадратичного программирования, имеющей единственное решение, и автоматическое определение коли-

чества скрытых нейронов, которое равно числу опорных векторов [4].

Модели на основе машин опорных векторов реализованы в виде Epsilon-Support Vector Regression (epsilon-SVR) - модели опорных векторов с ключевым параметром epsilon и Nu Support Vector Regression (Nu-SVR) - модели опорных векторов с ключевым параметром nu.

В реализации модели epsilon-SVR расчет производится на основании следующих свободно настраиваемых параметров: C -параметр, влияющий на качество построения поверхности решений за счет ее упрощения; epsilon - значение, регулирующее возможность учета ошибки; kernel -функция ядра. В случае Nu-SVR - это параметр nu. Использование различных функций ядра определяет количество модификаций модели epsilon-SVR. В системе реализована возможность выбирать функцию ядра: линейная (linear), сигмоидаль-ная (sigmoid), полиномиальная (poly), ра-диально-базисная (rbf).

Методология гибридного прогнозирования показателей социально-экономического развития

На рис. 5 представлена обобщенная информационно-логическая схема гибридного прогнозирования показателей развития экономики России, которая представляет собой взаимосвязь компонентов системы.

Рис. 5. Обобщенная информационно-логическая схема гибридного прогнозирования показателей развития экономики России

Процесс прогноза показателей в гибридной модели проходит следующие стадии [6]:

1. На вход РИАМС поступают статистические отчетные данные: Федеральной службы государственной статистики, Министерства образования и науки Российской Федерации, Министерства финансов Российской Федерации, Центрального банка Российской Федерации, Министерства промышленности и торговли Российской Федерации, Министерства экономического развития Российской Федерации, Центра экономической конъюнктуры, Бюро экономического анализа при Правительстве Российской Федерации и других государственных учреждений.

2. Формулируется цель прогноза и задаются сценарные условия.

3. Эксперт-исследователь выполняет прогнозные расчеты в эконометрической подсистеме, получает первичные результаты прогноза и оценки его качества.

4. Выполняются верификация на основе ретропрогноза и анализ полученных результатов. Происходит автоматизированный отбор хороших показателей и формируется выборка показателей, характеризуемых как плохие. Набор плохих показателей поступает на вход в ИНС, ДР, МОВ.

5. Эксперт-исследователь выполняет прогнозные расчеты в подсистемах интеллектуального прогноза, получает первичные результаты прогноза и оценки качества этого прогноза.

6. Осуществляется ретроверификация результатов прогноза, полученного с помощью различных сетей, а также аналогично этой процедуре ретроверификация прогноза в РИАМС. Показатели, которые относились к плохим в подсистеме РИАМС, но критерии точности которых были улучшены в подсистемах интеллектуального прогноза, переходят в набор хороших.

На основании результатов гибридного прогноза принимаются решения:

1) продолжить анализ и дальнейшую работу по улучшению прогнозных оценок путем добавления новых уравнений или уточнения отчетной информации;

2) остановить прогноз и принять для анализа полученные результаты системы гибридного прогноза.

Рассмотрим плохие показатели каждой из анализируемых моделей. В табл. 3 представлены критерии точности и качества для показателей. Как было отмечено ранее, для исследования каждого показателя использовались ряды отчетных данных за 2004-2014 гг.

Нейронные сети Деревья решений Машина опорных векторов

Да

Показ атель

" приемлем?

Сводный список Сводный список

принятых показателей непринятых показателей

Рис. 6. Алгоритм краткосрочного прогноза показателей развития экономики России

Результаты ретроверификации показателей сферы исследований и инноваций приведены в табл. 3. Результаты ретроверификации для финансовой сферы при-

ведены в табл. 4. Результаты ретроверифи-кации показателей сферы инвестиций приведены в табл. 5.

Т а б л и ц а 3

Плохие показатели сферы исследований и инноваций

Оценка точности MAPE, %

Показатель Наименование показателя Оценки качества

SNENK Число организаций, выполняющих ИиР, в том числе некоммерческие организации R2 = 0,98 F-stat = 53,65 DW = 2,4 38

SNEOZ Число организаций, выполняющих ИиР, в том числе опытные заводы R2 = 0,99 F-stat = 156,28 DW = 2,82 19

SNWNK Персонал, занятый исследованиями и разработками в секторе некоммерческих организаций R2 = 0,96 F-stat = 13,67 DW = 2,74 57

SNFOB Внутренние затраты на исследования и разработки за счет внебюджетных фондов R2 = 0,94 F-stat = 10,75 DW = 3,19 35

SNFOUT Внутренние затраты на исследования и разработки за счет средств иностранных источников R2 = 0,98 F-stat = 53,65 DW = 2,4 25

SNFHKO Внутренние затраты на исследования и разработки по сектору НКО (некоммерческих организаций) R2 = 0,91 F-stat = 10,14 DW = 2,25 40

SNRPENRF Подано заявок на выдачу патентов: на промышленные образцы российскими заявителями R2 = 0,99 F-stat = 405 DW = 1,4 31

SNROUPENRF Выдано патентов: на промышленные образцы российским заявителям R2 = 0,98 F-stat = 53,65 DW = 2,4 38

SNINZTPPT Затраты на технологические инновации в промышленном производстве, в том числе на производственное проектирование и технологическую подготовку производства R2 = 0,99 F-stat = 197,15 DW = 3 28

SNINOILGZ Объем отгруженной инновационной продукции в добыче сырой нефти и природного газа R2 = 0,96 F-stat = 22,78 DW = 1,71 31

SNINZCVTIT Связь, деятельность, связанная с использованием вычислительной техники и информационных технологий К2 = 0,95 F-stat = 23,84 DW = 1,9 60

Т а б л и ц а 4

Плохие показатели финансовой сферы

Оценки качества Оценка точности MAPE, %

Показатель Наименование показателя

1 2 3 4

FNTV Доходы федерального бюджета: налоги на товары и услуги. Лицензионные и регистрационные сборы (% к ВВП) К2 = 0,55 F-stat = 2,04 DW = 3,25 36

BCRV Доходы федерального бюджета: платежи за пользование природными ресурсами (% к ВВП) К2 = 0,81 F-stat = 2,64 DW = 2,35 20

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

RFS Расходы федерального бюджета на социальную политику, млрд руб. К2 = 0,83 F-stat = 4,98 DW = 1,94 21

RFSV Расходы федерального бюджета на социальную политику, % к ВВП К2 = 0,80 F-stat = 3,96 DW = 1,71 26

О к о н ч а н и е т а б л. 4

1 2 3 4

ZE.TR Дефицит/ профицит консолидированного бюджета, млрд руб. R2 = 0,90 Е-згаг = 5,65 ОЩ = 2,06 100

гвту Дефицит/профицит консолидированного бюджета, % к ВВП R2 = 0,78 Е-зШ = 2,87 ОЩ = 1,45 45

ZBTD Дефицит/профицит консолидированного бюджета, % к доходам консолидированного бюджета R2 = 0,87 Е-зЬаЬ = 4,09 ОЩ = 2,07 59

BCR Объем кредитов, предоставленных другим банкам R2 = 0,68 Е-згаг = 1,30 ОЩ = 2,08 23

ВВС Доля просроченной задолженности в кредитах другим банкам R2 = 0,62 Е-зЬаЬ = 0,99 ОЩ = 2,86 42

СОБР Объем вкладов физических лиц R2 = 0,38 Е-зЬаЬ = 0,36 ОЩ = 2,19 28

Плохие показатели сферы инвестиций Т а б л и ц а 5

Оценка точности, МАРЕ, %

Показатель Наименование показателя Оценки качества

ЛНЕ Инвестиции в основной капитал - сельское хозяйство, охота и лесное хозяйство R2 = 0,98 Е-згаг = 19,1 ОЩ = 2,5 39

МР Инвестиции в основной капитал - целлюлозно-бумажное производство и полиграфическая деятельность R2 = 0,98 Е-згаг = 19,9 ОЩ = 2,1 41

шг Инвестиции в основной капитал - обработка древесины и производство изделий из дерева R2 = 0,93 Е-зЬаЬ = 4,9 ОЩ = 1,8 36

МС Инвестиции в основной капитал - производство кокса и нефтепродуктов R2 = 0,99 Е-згаг = 368,3 ОЩ = 2,8 49

MRP Инвестиции в основной капитал - производство резиновых и пластмассовых изделий R2 = 0,99 Е-згаг = 44,7 ОЩ = 1,93 21

МВМ Инвестиции в основной капитал - металлургическое производство R2 = 0,97 Е-зЬаЬ = 14,3 ОЩ = 2,8 22

ММБ Инвестиции в основной капитал - производство машин и оборудования R2 = 0,78 Е-згаг = 1,14 ОЩ = 2,77 53

Инвестиции в основной капитал - оптовая и розничная торговля R2 = 0,92 Е-зЬаЬ = 4,73 ОЩ = 2,7 72

Е1 Инвестиции в основной капитал - финансовая деятельность R2 = 0,97 Е-зЬаЬ = 16,44 ОЩ = 2,89 38

RERB Инвестиции в основной капитал - операции с недвижимым имуществом, аренда и предоставление услуг R2 = 0,91 Е-згаг = 4,2 ОЩ = 2,6 67

Для перечисленных показателей регрессионные модели при неплохих значениях оценок качества выдают низкий уровень точности. Построить хорошие экономет-

рические модели для этих показателей не представляется возможным из-за отсутствия в отчетности Росстата количественных данных о факторах влияния на эти показа-

тели. Поэтому для перечисленных показателей были построены альтернативные интеллектуальные модели со следующими управляемыми параметрами, описанными ранее:

1) для ИНС определены границы параметров, построено значительное количество моделей на основе комбинаций значений управляемых параметров:

- количество нейронов на входном слое - 1-3;

- количество нейронов на скрытом слое - 1-4;

- количество скрытых слоев - 1-2;

- количество нейронов на выходном слое - 1-2;

- скорость обучения - 0,0001;

- момент обучения - 0,01;

- максимальное количество эпох обучения - 10 000;

- максимальное время обучения -60 мин;

- функции активации нейрона: сиг-моидальная, тангенсоидальная, экспоненциальная;

2) для моделей в виде деревьев решений:

- максимальное значение глубины дерева (depth) - 10;

- количество входных признаков - 2-3;

3) для моделей, построенных с помощью методов машин опорных векторов, использовались все доступные функции ядра для epsilon-SVR:

- линейная (linear);

- сигмоидальная (sigmoid);

- полиномиальная (poly);

- радиально-базисная (rbf);

- nu-параметр.

Из построенных моделей выбирались наилучшие по каждому типу (табл. 6).

Т а б л и ц а 6

Сравнение точности в различных системах

Блок Показатель MAPE РИАМС, % MAPE ИНС, % MAPE ДР, % MAPE МОВ, %

1 2 3 4 5 6

Исследования и инновации SNENK 38 8 7 (AdaBoost) 5 (poly)

Исследования и инновации SNEOZ 19 40 7 (AdaBoost) 5 (rbf)

Исследования и инновации SNWNK 57 11 30 29 (sigmoid)

Исследования и инновации SNFOB 35 14 17 11 (poly)

Исследования и инновации SNFOUT 25 15 6 (AdaBoost) 10 (nu)

Исследования и инновации SNFHKO 40 11 15 (AdaBoost) 11 (sigmoid)

Исследования и инновации SNRPENRF 31 10 5 4 (nu)

Исследования и инновации SNROUPENRF 38 10 7 4 (poly)

Исследования и инновации SNINZTPPT 28 8 15 (AdaBoost) 16 (nu)

Исследования и инновации SNINOILGZ 31 23 14 19 (rbf)

Исследования и инновации SNINZCVTIT 60 31 17 (AdaBoost) 23 (poly)

Бюджет FNTV 36 15 20 26 (sigmoid)

Бюджет BCRV 20 4 1,8 (AdaBoost) 0,7 (rbf)

Бюджет RFS 21 13 10 (AdaBoost) 9 (sigmoid)

Бюджет RFSV 26 11 9 (AdaBoost) 9 (sigmoid)

Бюджет ZBTR 100 20 11 11 (poly)

Бюджет ZBTV 45 21 20 (AdaBoost) 28 (poly)

Бюджет ZBTD 59 6 20 (AdaBoost) 26 (poly)

Бюджет BCR 23 13 9 14 (nu)

Бюджет BDC 42 41 85 (AdaBoost) 58 (sigmoid)

О к о н ч а н и е т а б л. 6

1 2 3 4 5 6

Бюджет CDEP 28 3 5 (AdaBoost) 4 (linear)

Инвестиции AHF 39 17 21 (AdaBoost) 22 (poly)

Инвестиции MP 41 16,5 14 9,6 (linear)

Инвестиции NW 36 12 23 (AdaBoost) 9,8 (nu)

Инвестиции MC 49 11 4,4 (AdaBoost) 3 (sigmoid)

Инвестиции MRP 21 5 2 (AdaBoost) 4 (poly)

Инвестиции MBM 22 3,5 3,4 (AdaBoost) 2,3 (sigmoid)

Инвестиции MME 53 11,7 8,7 (AdaBoost) 7,5 (poly)

Инвестиции WRT 72 30 30 (AdaBoost) 16 (poly)

Инвестиции FI 38 15,3 17 18,4 (nu)

Инвестиции RERB 67 28 25 25 (poly)

В табл. 6 приведены результаты сравнительных расчетов точности прогнозов, полученных различными программными средствами. Для анализа был выбран 31 плохой показатель. Оказалось, что для 26 из них удается получить более высокие оценки точности, удовлетворяющие критерию «хороший». С помощью моделей МОВ улучшены 11 показателей, для ДР - 5, для ИНС - 5. Сразу четыре показателя модели продемонстрировали одинаковые оценки точности по двум типам: для трех из них - МОВ и ДР, один - по МОВ и ИНС, т. е. на долю МОВ приходится 54% моделей, удовлетворяющих заданному уровню точности.

К показателям, которые не удалось перенести в категорию улучшенных, относятся SNINZCVTIT, ZBTV, BDC, AHF. Воз-

можными причинами этого являются несопоставимость отчетных данных из-за радикальных методологических изменений отчетности показателей, изменение экономической конъюнктуры в стране, скрытые последствия санкций. Оказалось, что альтернативные модели позволяют точнее получать прогноз при тех же исходных данных и тем самым преодолевать перечисленные выше ограничения регрессионных моделей. Но при этом возрастает сложность расчетов и резко снижается производительность.

Дальнейшие исследования авторов направлены на оптимизацию параметров систем прогнозов с целью повышения производительности без потерь точности и качества, совершенствования сервисов управления расчетами моделей показателей.

Список литературы

1. Амосов О. С., Пащенко Ф. Ф., Муллер Н. В. Структурно параметрическая идентификация временного ряда с применением фрактального и вейвлет-анализа // Информатика и системы управления. - 2015. - № 2 (44). - С. 80-88.

2. Доугерти К. Введение в эконометрику : пер. с англ. - М. : Инфра-М, 1999.

3. Китова О. В., Колмаков И. Б., Кольцов А. В., Доможаков М. В. Анализ динамики результатов верификации краткосрочных прогнозов показателей сферы научных исследований и инноваций в РФ // Вестник Российского экономического университета имени Г. В. Плеханова. - 2016. - № 5 (89). - С. 111-119.

4. Китова О. В., Колмаков И. Б., Пеньков И. А. Метод машин опорных векторов для прогнозирования показателей инвестиций // Статистика и Экономика. - 2016. - № 4. -С. 27-30.

5. Китова О. В., Колмаков И. Б., Шарафутдинова А. Р. Анализ точности и качества краткосрочного прогноза показателей социально-экономического развития России / / Вестник Российского экономического университета имени Г. В. Плеханова. - 2013. - № 9 (63). - С. 111-119.

6. Колмаков И. Б., Доможаков М. В. Синтез эконометрических и нейросетевых систем прогноза показателей сферы исследований и инноваций РФ / / Управленческие науки. -2016. - № 2. - С. 27-37.

7. Колмаков И. Б., Кольцов А. В., Доможаков М. В. Основы построения системы комплексного прогноза сферы исследований и инноваций во взаимосвязи с макроэкономет-рическими моделями экономики России // Инноватика и экспертиза. - 2015. - № 1 (14). -С. 255-275.

8. Ivanyuk У. A, Pashchenko F. F. Methods and Models for the Forecasting and Management of Time Series / / Proceedings of International Work-Conference on Time Series (ITISE 2015, Granada, Spain). - Granada, 2015. - С. 283-292.

References

1. Amosov O. S., Pashchenko F. F., Muller N. V. Strukturno parametricheskaya identifikatsiya vremennogo ryada s primeneniem fraktal'nogo i veyvlet-analiza [Structure-Parametric Identification of the Time Series by Using Fractural and Wavelet-Analysis]. Informatika i sistemy upravleniya [Information Science and Management System], 2015, No. 2 (44), pp. 80-88. (In Russ.).

2. Dowgerty K. Vvedenie v ekonometriku [Introduction to Econometrics], translated from English. Moscow, Infra-M, 1999. (In Russ.).

3. Kitova O. V., Kolmakov I. B., Kol'tsov A. V., Domozhakov M. V. Analiz dinamiki rezul'tatov verifikatsii kratkosrochnykh prognozov pokazateley sfery nauchnykh issledovaniy i innovatsiy v RF [Analyzing the Results of Verification of Short-Term Forecasts of Figures of Academic Research and Innovation Sphere in Russia]. Vestnik Rossiyskogo ekonomicheskogo universiteta imeni G. V. Plekhanova [Vestnik of the Plekhanov Russian University of Economics], 2016, No. 5 (89), pp. 111-119. (In Russ.).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Kitova O. V., Kolmakov I. B., Pen'kov I. A. Metod mashin opornykh vektorov dlya prognozirovaniya pokazateley investitsiy [Method of Bearing Vectors for Forecasting Investment Indices]. Statistika i Ekonomika [Statistics and Economics], 2016, No. 4, pp. 27-30. (In Russ.).

5. Kitova O. V., Kolmakov I. B., Sharafutdinova A. R. Analiz tochnosti i kachestva kratkosrochnogo prognoza pokazateley sotsial'no-ekonomicheskogo razvitiya Rossii [Analyzing Accuracy and Quality of Short-Term Forecast for Indicators of Social and Economic Development in Russia]. Vestnik Rossiyskogo ekonomicheskogo universiteta imeni G. V. Plekhanova [Vestnik of the Plekhanov Russian University of Economics], 2013, No. 9 (63), pp. 111-119. (In Russ.).

6. Kolmakov I. B., Domozhakov M. V. Sintez ekonometricheskikh i neyrosetevykh sistem prognoza pokazateley sfery issledovaniy i innovatsiy RF [Synthesis of Econometric and Neuro-Net Systems of Forecasts for Indicators in the Field of Research and Innovation in RF]. Upravlencheskie nauki [Managerial Science], 2016, No. 2, pp. 27-37. (In Russ.).

7. Kolmakov I. B., Kol'tsov A. V., Domozhakov M. V. Osnovy postroeniya sistemy kompleksnogo prognoza sfery issledovaniy i innovatsiy vo vzaimosvyazi s makroekonometricheskimi modelyami ekonomiki Rossii [Principles of Building the System of Complex Forecast in the Sphere of Research and Innovation in Connection with Macro-Econometric Models of Russian Economy]. Innovatika i ekspertiza [Innovation and Expertise], 2015, No. 1 (14), pp. 255-275. (In Russ.).

8. Ivanyuk V. A., Pashchenko F. F. Methods and Models for the Forecasting and Management of Time Series. Proceedings of International Work-Conference on Time Series (ITISE 2015, Granada, Spain). Granada, 2015, pp. 283-292. (In Russ.).

i Надоели баннеры? Вы всегда можете отключить рекламу.