Научная статья на тему 'ФОРМИРОВАНИЕ ПРОГНОЗНЫХ ОЦЕНОК РАСХОДОВ НА ОБРАЗОВАНИЕ В РОССИИ'

ФОРМИРОВАНИЕ ПРОГНОЗНЫХ ОЦЕНОК РАСХОДОВ НА ОБРАЗОВАНИЕ В РОССИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
54
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННОЙ РЯД / АВТОРЕГРЕССИОННЫЕ МОДЕЛИ / НЕЙРОННЫЕ СЕТИ / ГЛУБОКОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кричевский Михаил Лейзерович, Мартынова Юлия Анатольевна

В работе проведено сравнение различных моделей для прогнозирования реального временного ряда, который описывает расходы на образование в России на протяжении 10 лет. В качестве моделей, используемых для формирования прогнозных оценок, применялись авторегрессионная проинтегрированная модель скользящего среднего (ARIMA), двухслойный персептрон (MLP), динамическая нейронная сеть (NARNET), сеть с долговременной краткосрочной памятью (LSTM). При решении задачи для формирования моделей и их оценок был выбран 10-летний интервал наблюдений за выбранным параметром (с 2010 г. по 2019 г.), а в качестве критерия достоверности моделей были приняты расходы на образование за 2020 г. Полученные результаты в определенной степени подтверждают методологический принцип «бритвы Оккамы», который, однако, не запрещает использовать более сложные объяснения тому или иному явлению.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кричевский Михаил Лейзерович, Мартынова Юлия Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECAST ESTIMATES OF EDUCATION EXPENDITURES IN RUSSIA

The comparison of various models for forecasting a real time series, which describes the costs of education in Russia for 10 years, has been carried out. Autoregressive integrated moving average model (ARIMA), two-layer perceptron (MLP), dynamic neural network (NARNET), network with long short-term memory (LSTM) were used as models used to form predictive estimates. When solving the problem, a 10-year observation interval for the selected parameter was selected for the formation of models and their estimates (since 2010 according to 2019). As a criterion for the reliability of the models, education expenditures for 2020 were adopted. The results obtained to a certain extent confirm the methodological principle of Occam's razor, which, however, does not prohibit the use of more complex explanations for a particular phenomenon.

Текст научной работы на тему «ФОРМИРОВАНИЕ ПРОГНОЗНЫХ ОЦЕНОК РАСХОДОВ НА ОБРАЗОВАНИЕ В РОССИИ»

вопросы инновационной экономики

Том 11 • Номер 4 • Октябрь-декабрь 2021 ISSN 2222-0372 Russian Journal of Innovation Economics

>

Первое

экономическое издательство

Формирование прогнозных оценок расходов на образование в россии

Кричевский М.Л. 1, Мартынова Ю.А. 1

1 Санкт-Петербургский государственный университет аэрокосмического приборостроения, Санкт-Петербург, Россия

АННОТАЦИЯ:_

В работе проведено сравнение различных моделей для прогнозирования реального временного ряда, который описывает расходы на образование в России на протяжении 10 лет. В качестве моделей, используемых для формирования прогнозных оценок, применялись авторегрессионная проинтегрированная модель скользящего среднего (ARIMA), двухслойный персептрон (MLP), динамическая нейронная сеть (NARNET), сеть с долговременной краткосрочной памятью (LSTM). При решении задачи для формирования моделей и их оценок был выбран 10-летний интервал наблюдений за выбранным параметром (с 2010 г. по 2019 г.), а в качестве критерия достоверности моделей были приняты расходы на образование за 2020 г. Полученные результаты в определенной степени подтверждают методологический принцип «бритвы Оккамы», который, однако, не запрещает использовать более сложные объяснения тому или иному явлению.

КЛЮЧЕВЫЕ СЛОВА: временной ряд, авторегрессионные модели, нейронные сети, глубокое обучение.

Forecast estimates of education expenditures in Russia

Krichevskiy M.L. 1, Martynova Yu.A. 1

1 Saint-Petersburg State University of Aerospace Instrumentation (SUAI), Russia

введение

Временной ряд - это последовательность наблюдений, которые делаются обычно через равные промежутки времени. Многие наборы данных отображаются как временные ряды, например: ежемесячное количество товаров, отгруженных с завода; недельный ряд количества дорожно-транспортных происшествий; суточное количество осадков; ежечасные наблюдения на выходе химического процесса и т. д. Примеры временных рядов можно найти в таких областях, как экономика, бизнес, инженерия, естественные науки (особенно геофизика, метеорология), общественные науки.

Под прогнозированием, как правило, понимается процедура предсказания важных показателей для отдельных компаний или фирм. Основные сложности в получении точных прогнозов общих показателей экономической деятельности связаны с неожиданными и важными сдвигами ключевых факторов, например, с изменением внешнеполи-

тической ситуации, результатами выборов, природными катаклизмами. Необходимо отметить, что материалы по выбранной теме превышают все мыслимые объемы: при наборе в поисковой строке словосочетания «Анализ временных рядов» Яндекс выдает 10 млн ответов. Укажем наиболее полные (с точки зрения авторов и, следовательно, субъективно отобранные) источники по данному вопросу [1-4] (Tsay, 2002; Brockwell, Davis, 2002; Chatfield, 2016).

Неотъемлемой чертой ВР является то, что, как правило, смежные наблюдения являются зависимыми. Характер этой зависимости среди наблюдений рядов представляет значительный практический интерес. Анализ временных рядов касается методов изучения этой зависимости, что требует разработки стохастических и динамических моделей для рядов и использования таких моделей в важных областях применения.

Как указано в [1] (Box, Jenkins, Reinsel et al., 2016), первой из пяти важных практических проблем при анализе временных рядов является задача формирования прогнозных оценок. Использование доступных наблюдений за время t над рядом с целью прогнозирования его значения на некоторое будущее время t + I может служить основой для:

• экономического и бизнес-планирования;

• управления запасами и производством;

• планирования производства;

• контроля и оптимизации производственных процессов.

ABSTRACT:

The comparison of various models for forecasting a real time series, which describes the costs of education in Russia for 10 years, has been carried out. Autoregressive integrated moving average model (ARIMA), two-layer perceptron (MLP), dynamic neural network (NARNET), network with long short-term memory (LSTM) were used as models used to form predictive estimates. When solving the problem, a 10-year observation interval for the selected parameter was selected for the formation of models and their estimates (since 2010 according to 2019). As a criterion for the reliability of the models, education expenditures for 2020 were adopted. The results obtained to a certain extent confirm the methodological principle of Occam's razor, which, however, does not prohibit the use of more complex explanations for a particular phenomenon. KEYWORDS: time series, autoregressive models, neural networks, deep learning

JEL Classification: C53, C45, C51, I22, I23 Received: 20.11.2021 / Published: 24.12.2021

© Author(s) / Publication: PRIMEC Publishers For correspondence: Krichevskiy M.L. (mkrichevsky@mail.ru)

CITATION:

Krichevskiy M.L., Martynova Yu.A. (2021) Formirovanie prognoznyh otsenok raskhodov na obrazovanie v Rossii [Forecast estimates of education expenditures in Russia]. Voprosy innovatsionnoy ekonomiki. 11. (4). - 1643-1658. doi: 10.18334/vinec. 1 1.4.1 13852

В поставленной задаче предположим, что наблюдения доступны через дискретные равные промежутки времени. Например, в задаче прогнозирования расходов на какой-нибудь вид деятельности расходы zt в текущем месяце t и расходы zt - v zt- 2, zt _ 3,... в предыдущие месяцы могут использоваться для формирования оценок прогноза на время I = 1, 2, 3,... месяцев вперед. Функцию i ;, которая определяет прогнозы для всех будущих значений I на основе доступной информации из текущего и предыдущего значений zt - 1 , zt - 2, zt - 3 через время t, назовем функцией прогноза. Наша цель - получить такую функцию прогноза, чтобы среднее значение квадрата отклонений zt + - j _ . j между фактическим и прогнозным значениями было бы настолько мало, насколько это возможно для каждого времени I.

В такой или сходной постановке обычно ставятся задачи прогноза временных рядов [1-4] (Tsay, 2002; Brockwell, Davis, 2002; Chatfield, 2016), поэтому в данной работе мы только конкретизируем объект исследования и укажем основные шаги ее выполнения. Наблюдаемым временным рядом, показанным на рисунке 1, был ряд расходов на образование в РФ в млрд руб. на протяжении 120 месяцев (десятилетняя помесячная выборка данных с 2010 г. по 2019 г.), который был взят из отчета Росстата [5].

Рисунок 1. Расходы на образование в РФ за 2010-2019 гг. Источник: составлено авторами по данным [5].

ОБ АВТОРАХ:_

Кричевткий Михаил Лейзерович, профессор кафедры метеджмента наукоемких производств, доктор технических наук, профессор (mkrichevsky0mai1.ru)

Мартынова Юлия Анатольевна, доцент кафедры менеджмента наукоемких производств, кандидат экономических наук, доцент (ju1i_ko01ist.ru)

ЦИТИРОВАТЬ СТАТЬЮ:_

Кричевский М.Л., Мартынова Ю.А. Формирование прогнозных оценок расходов на образование в России // Топросы инновационной экономики. - 2021. - Том 11. - № 4. - (3. 1643-1658. Сог 10.18334^пес. 1 1.4.1 13852

Такой же ряд данных за 2020 г. использовался как тестовый для сопоставления пригодности различных моделей прогноза. Цель статьи заключалась в демонстрации возможностей предложенных моделей с точки зрения достоверности формирования прогноза.

Далее работа структурирована следующим образом. Вначале проводится спектральный анализ ряда, описывается методология проведения исследований, включающая краткое описание используемых моделей, в частности авторегрессионной проинтегрированной модели скользящего среднего (ARIMA), двухслойного персептрона (MLP), динамической нейронной сети (NARNET), сети с долговременной краткосрочной памятью (LSTM). Далее приводятся полученные результаты решения поставленной задачи и анализа найденных оценок. В заключение указываются главные выводы и намечаются пути дальнейшего исследования.

Методология

1. Авторегрессионная проинтегрированная модель скользящего среднего

Аббревиатура ARIMA - autoregressive integrated moving average - авторегрессионная проинтегрированная модель скользящего среднего может использоваться при анализе временных рядов, обладающих нестационарностью и сезонностью. Введение модели ARIMA связано с именами Дж. Бокса и Дж. Дженкинса, которые еще в 70-е годы прошлого века обобщили существующие на тот момент знания в анализе временных рядов, а предложенные ими приемы обработки получили название методологии Бокса-Дженкинса. В 2016 г. вышло уже пятое издание монографии Бокса и Дженкинса, дополненное их последователями [1] (Box, Jenkins, Reinsel et al., 2016).

ARIMA представляет собой класс моделей, объясняющих данный временной ряд на основе его прошлых значений, то есть собственных лагов и запаздывающих ошибок прогноза, так что это уравнение можно использовать для прогнозирования будущих значений. Модель ARIMA (p,d,q) характеризуется тремя показателями: p, d, q, где р - определяет порядок авторегрессионной модели; q - порядок модели скользящего среднего; d - число операций дифференцирования (взятия разностей), необходимое для того, чтобы временной ряд стал стационарным.

Наиболее распространенный способ сделать ряд стационарным - вычесть предыдущее значение из текущего значения. Иногда может потребоваться большее число таких операций, зависящих от сложности ряда. Следовательно, значение d - это минимальная величина разностей, необходимая для трансформации ряда к стационарному виду.

При рассмотрении сезонного временного ряда автокорреляция, соответствующая сезонным лагам (12 наблюдений для месячных данных), значительно отличается от нуля. Такие ряды не моделируются обычными моделями класса ARIMA, потому что высокий порядок (12 или больше) авторегрессионных моделей и/или моделей скользящего среднего приводит к необходимости учета этих корреляций при оценке

параметров модели. Не вдаваясь в подробности, о которых можно узнать из приведенных выше источников, отметим, что в этом случае модель преобразуется к виду ARIMA(p,d,q)^(P,D,Q) , где показатели P,D,Q характеризуют сезонность ряда.

2. Двухслойный персептрон

В качестве следующей модели для построения прогноза воспользуемся схемой! двухслойного персептрона, который является традиционным инструментом решения подобных задач. Мы полагаем, что многие знакомы с базовой номенклатурой нейросе-тей типа многослойных персептронов (multi-layerperceptron - MLP), которые успешно применялись для ре шен ия задач прогнозировен ия в различных областях [6-10] (Khaykin, 2006; Kourentzes, 2013; Hyndman, Athanasopoulos, 2018; Makridakis, Hyndman, Petropoulos, 2019; Januschowski, Gasthaus, 2020). Тем не менее разъясним принцип ней-росетевой технологии на однослойной сети с R входами и S нейронами в слое (рис. 2).

В представленной схеме сети каждый элемент входного вектора р соединен с каждым входным нейроном через матрицу весов W. Нейрон с индексом i имеет сумматор, на который поступают взвешенные входы и смещения для формирования i-го скалярного выхода n.. Различные ni объединяются вместе, образуя S-й элемент входного вектора n, которые являются аргументами функции активации f. В итоге на выходе сети формируется выходной вектор-столбец а.

При формировании прогнозных оценок с помощью MLP обычно используется метод скользящих дкоы, сущ ность которого заключается в прохождении системы из двух окон (широкого и узкого) по всей длине анализируемого ряда. Число точек наблюдений!, по павших в п ервое окно, опредеея ет количество нейронов во входном слое персептрона. Значение ряда во втором узком окне (включает только одно наблю-

Входы Слой нейронов

Рисунок 2. Однослойная сеть Источник: [11].

дение) дает сигнал учителя. Такая система последовательно проходит по всему ряду, образуя для нейронной сети базу примеров для обучения. Как только узкое окно выйдет за пределы ряда, персептрон будет выдавать прогнозные оценки.

3. Нелинейная авторегрессионная нейронная сеть

Прогнозирование можно считать разновидностью динамической фильтрации, при которой прошлые значения временного ряда используются для определения будущих значдний. С учетом нелинейного характера временного ряда можне использовать модели, основанные на нелинейной авторегресии (nonlinear autoregressive - NAR) [1217] (Chen, Billings, 1989; Domashchenko, Nikulin, 2017; Kin, Sidorenko, Lisakov, Sidorenko, Sypin, 2019; Pabaa, Elsheikhb, 2020). Тнкня форме прогеозированди может быть записана следующим образом:

z(t)=f[z(t- 1),..., z(t -d)] + £(t),

где d - величина задержки; f - нелинейная функция, которая аппроксимируется в процессе обучения сети путем определения ее оптимальных весов и соответствующего смещения; E(t) - случайные ошибки.

Схема сети нелинейной авторегрессии показана на рисунке 3.

Нелинейная авторегрессионная нейронная сеть дает особенно хороший прогноз в ситуации, когда времендой ряд нелинейный,. Сети с временной задержкой похожи на сети с прямой связью за исключением того, что входной вес имеет связанную с ним линию задержки отвода. Это позволяет сети иметь конечный динамический отклик на входные данные временн о го ряд а. Предложенная сеть обучается с использованием алгори тма обугения обратного распространения ошибки Левенберга-Марквардта, который является самым быстрым алгоритмом этого класса.

4. Рекуррентная нейронная стть

Рекуррентныенейронные сети представляют собой вид нейронных сетей, где связи между элементами образуют направленную последовательность. Благодаря этому появляется возможность обрабатывать серии событий во времени или после-

Input layer Hidden layer Oulput layer

Рисунок 3. Сеть нелинейной авторегрессии Источник: [17] Sabaa, Elsheikhb, 2020).

довательные пространственные цепочки. Рекуррентная нейронная сеть с ячейкой долговременной краткосрочной памяти (Long short-term memory - LSTM) - особая разно вид ность архитектуры таких сетей!, которая может изучать долгосрочные зависимости между временными шагами последовательности [18, 19] (Ognev, Shchetinin, 2020; Hochreiter, Schmidhuber, 1997). Основными компонентами сети LSTM являются слой ввода последовательности и слой LSTM. Первый слой вводит данные последовательности иои временного ряда в сеть. Слой LSTM изучает долгосрочныезависимости между временными шагами данных последовательности.

На рисунке 4 показана архитектура простой сети LSTM для регрессии.

Sequence input Layer

Рисунок 4. Архитектура сети Ь$ТЫ Источник: [12].

Сеть начинается с входного слоя, за которым следует слой ЬБТЫ. Сеть заканчивается полностью связанным слоем и выходным слоем регрессии.

Архитектура ЬБТЫ является наиболее подходящей для моделирования временных связей в глубоких нейронных сетях. Такая архитектура преодолевает проблему исчезающего градиента в РНН для долгосрочного обучения зависимости в данных с использованием ячеек памяти и вентилей.

Сети глубокого обучения первоначально были разработаны для классификации изображений [20] (Оий/вПои, Ввпйгко, Кытуй, 2017). Сеть берет изображение, пропускает его через набор фильтров, применяя весовые коэффициенты к различным аспектам изображения. По существу, здесь работает система отбора признаков, благодаря которой со временем сеть «узнает», какие фильтры аспектов наиболее важны для классификации изображения. Аналогичный метод можно применить и к временным рядам. Хотя временной ряд не имеет физических признаков, как изображение, данные временного ряда содержат пространственные признаки времени.

Ячейка ЬБТЫ состоит из нескольких функций вентилей, которые определяют, является ли новая информация важной для задачи прогнозирования и остается ли старая информация актуальной. Такая память называется состоянием ячейки и может хранить всю ранее изученную релевантную информацию для полной обработки последовательности временных рядов. Это позволяет сохранять информацию, полученную намного раньше в последовательности, в ходе полной обработки. В этом состоит основное преимущество архитектуры ЬБТЫ перед другими структурами рекуррентных нейронных сетей.

Результаты

Анализ временного ряда

Как видно из рисунка 1, исходный ряд расходов на образование характеризуется наличием ярко выраженных максимумов, которые обусловлены неравномерным

финансированием в течение года: в конце; каждого года,очевидно,неизрасходованные средства перечисляются на нужды образования. Наш ряд расходов на образование в какдй-то степени н ап оминает классически й временной ряд Series G перенозки авиапассажиров аэропорта Лондона с 1949 по 1960 г., который присутствует во многих источниках, начиная с первого издания книги Бокса и Дженкинса [1] (Box, Jenkins, Reinsel et al., 2016).

На рисунке 5 показан спектр анализируемого ряда, указывающий на появление выбросов на опред еленных частотах.

Рисунок 5. Спектральная плотность ряда Источник: получено авторами. В таблице 1 приведены значения частот (периодов) появления максимумов.

Таблица 1

результаты спектрального анализа

спектральная плотность: vAR1 (табл. образование) 120 строк. значения периодограммы

Частота период cos -коэфф. sin-коэфф. периодограмма плотность

10 0,083333 12,0000 4,52787 -2,68568 1662,870 779,2449

40 0,333333 3,0000 -2,60157 -3,33992 1075,395 490,9409

20 0,1666e7 6,00 00 -2,96324 е1,29310 627,175 309,0289

60 0,500000 2,000Д -2,62574 0,00000 013,67 1 187,6730

Источник: получено авторам и.

Как следует из таблицы 1, самые большие выбросы появляются с периодичностью в 12месяцев. Кроме того, имеется возрастающий тренд, показывающий увеличение

с 2010 по 2019 г. Таким образом, анализируемый ряд расходов на образование является нестационарным (средние значения на различных участкахряда отличаются друг от друга) и сезонным.

Модель ARIMA

Нужно отметить, что идентификация и оценка параметров модели обязательно пересекаются. Также следует пояснить,что идентификация - это всегда неточная процедура. Это объясняется тем, что виды встречающихся на практике моделей зависят от поведения физичесоого мира, поэтому задачуидентификации не льзя решить чисто математическими аргументами.

Для уменьшения амплитуды временного ряда, показанного на рисунке 1, вна-чало пролоаарифмируем его, а затем вы полним дифференцирование а лауом 1. Преобразованный ряд имеет вид, представленный на рисунке 6, а его автокорреляционная фтнтция (АКФ) аоказана на рисунке 7.

Autyí^nelaliun Funclion

VAR1 : In (Sí i: D(-1) Lag -,-----.

os oa

0,2 0.0

ir

3

■0,2 -0.4 С G Л»

1 13 26 3? 49 61 73 86 67 1<» 121 -1.0 -0.S 0.0 05 1.0

Рисунок 6. Преобразованный ВР Рисунок 7. АКФ ряда

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Источник: получено авторами. Источник: получено авторами.

Из графика на рисунке 7 следует, что проявляются зависимости высокого порядка (с лагом 12), поэтому дифференцирование с таким лагом должно устранить сезонность. Коррелограммы (здесь не приводятся с целью сокращения) не демонстрируют выбросов, вследствие чего можно приступить к подбору модели. Основываясь на природе ряда, выбираем модель следующего вида: ARIMA (0,1,1)(0,1,1) с сезонностью, определяемой лагом = 12. Таким образом, здесь нужно оценить два параметра модели скользящего среднего: сезонный (Q) и несезонный (q). Никаких параметров авторег-

рессии в данном случае не оценивается. На рисунке 8 показан график и сходного ряда вместе с прогнозом на 12 точек вперед (указаны также доверительные интервалы).

Рисунок 8. И сходный ряд и его прогноз Источник: получено авторами.

модель MLP

При использовании двухслойного персептрона его входной слой содержит двенадцать нейронов, соответствующих временному сдвигу. После обучения были выбраны 3 лучших нейронных сети, и их проекции ВР вместе с исходным рядом показаны на рисунке 9.

S***l protection fC* V®r1 ps used as inputs 1 steps predicted atiead AH sampes

12 steps usee- as inputs, 1 steps pretfirad ansa; All samples

WO 120 1« 110 130 so

Steps

Рисунок 9. Проекции ВР Источник: получено авторами.

Рисунок 10. Прогноз исходного ряда Источник: получен авторами.

Как видно из рисунка 9 (приведены 4 кривых), проекции ряда, сформированные тремя нейронными сетями, практически совпадают с исходиым рядо м. Из трех пер-септронов был выбран один с такой архитектурой: 12-13-1.

С помощью этой нейронной сети был выполнен прогноз еще на 12 точек вперед, результат которого - на рисунке 10. Как следует из приведенных графиков - исходного ряда и ряда, созданного нейронной сетью, обе кривые практически идентичны на интервале с точки № 13 до точки № 120, поэтому поведение сформированного ряда на интервале точек № 121-132 выглядит правдоподобным.

Модель ЫАР

При использовании этой модели для обучения сети используется выборка данных, которая делится в следующем соотношении: обучающая выборка - 70%; тестовая выборка - 15%; валидационная выборка - 15%. Обучение нейронной сети производится с помощью алгоритма Левенберга-Маквардта, и архитектура сети показана на рисунке 11.

Рисунок 11. Архитектура сети МАЯ Источник: получено авторами. График исходного ряда вместе с кривыми, описывающими деление выборки на три компонента, представлен на рисунке 12.

[■ uiOuluul tleineul 1 Eur Tims-Series 1

■□ 5D 30 HI ш JQ на то m 1141

Time

Рисунок 12. Графики полученных рядов Источник: получено авторами.

Структура созданной! сети с обрат ной связью изображе на на рисунке 13. Далее;, записав в командном окне Matlab выражение

y2 = netc(cell(0,12),Xic,Aic) y2 = 1x12 cell array, получаем прогнозные значения ряда на 12 точек вперед.

Л MAR Neural Network (view) a

Hidden Output

о А -t I ® Y<4 3 g+

Ii 10 - \

Рисунок 13. Созданная сеть с обратной связью Источник: получено авторами.

Forecast

Monlh

Рисунок 14. И сходный ряд вместе с прогнозными значениями Источник: получено авторами.

Модель LSTM

Эта модель представляет собой разновидность глубокой нейронной сети с такими слоями: последовательность входного слоя; слой LSTM; полностью соединенный слой; слой регрессии. На каждом временном шаге входной последов ательности сеть LSTM учится предсказывать значение следующего временного шага. На рисунке 15 показан исходный ряд, спрогнозированный на следующие 12 точек.

Из рисунка 14 следует, что модель работает вполне достоверно, так как она может точно следовать б ольшинству неожиданных скачков/падений.

В таблице 2 приведены результаты прогноза всех четырех моделей вместе с реальными данными за 2020 г.,а на рисунке 15 - соответствующий график.

Таблица 2

Результаты прогноза

дтмд М1.Р 1^ТМ ЫАР РЕАЬ

121 46 44 47 59 52

122 54 52 55 53 54

123 55 555 54 66 47

124 55 64 78 49 26

125 49 47 47 58 27

1226 48 49 51 77 36

127 37 37 35 60 29

128 42 40 39 65 37

129 62 60 57 76 60

130 62 6>5 60 54 57

1331 60 57 58 82 56

132 75 66 72 86 77

Источник: получено авторами.

ARIMA

MLP

LSTM

NAR

Real

100 90 80 70 60 50 40 30 20 10 0

1 2 3 4 5 6 7 8 9 10 11 12

Рисунок 15. Графикрезультатов прогноза Источник: получено авторами.

Обс^дение

Полученные результаты свидетельствуют о том, что несмотря на подобранные модели прогноза, действительность «не подчиняется» найденным правилам прогнозирования. Как видно из рисунка 15, кривая реальных расходов на образование в первой половине 2020 г. отличается от результатов по всем моделям. Очевидно, сказываются эффекты управления экономикой, на которую оказывают влияние различные, трудноучитываемые факторы, например пандемия, перенос сроков ввода крупных значимых объектов, изменение цен на энергоносители и т.п. По мнению авторов, такая ситуация

дает предпосылки к использованию принципа Оккамы, гласящего: »Не следует множить сущее без необходимости». В нашем случае, трансформируя к задаче прогноза, может быть, не следует подбирать чересчур сложные модели, а ограничиться, например, опцией Excel «Построение линии тренда», что в среднем даст вполне приемлемые результаты. Однако тот же принцип не запрещает более сложные объяснения тех или иных явлений.

Заключение

Таким образом, в работе продемонстрирована возможность подбора модели прогноза расходов на образование в России. В качестве различных моделей использовались авторегрессионная проинтегрированная модель скользящего среднего (ARIMA), двухслойный персептрон (MLP), динамическая нейронная сеть (NARNET), сеть с долговременной краткосрочной памятью (LSTM). Подбор моделей осуществлялся на 10-летнем периоде наблюдений, а проверка достоверности - на данных следующего года. Анализ результатов показал, что ни одна из моделей не дает точного прогноза вследствие, очевидно, трудноучитываемых внешних факторов.

ИСТОЧНИКИ:

1. Box G. E. P., Jenkins G. M. Reinsel G. C. et al. Time series analysis: forecasting and control. / Fifth edition. - John Wiley & Sons, 2016. - 709 p.

2. Tsay R.S. Analysis of financial time series. - John Wiley and Sons, 2002. - 448 p.

3. Brockwell P.V., Davis R.A. Introduction to Time Series and Forecasting. - SpringerVerlag, New York, 2002. - 450 p.

4. Chatfield C. The analysis of time series: an introduction. - Chapman & Hall/CRC, London, 2016. - 352 p.

5. Росстат. [Электронный ресурс]. URL: https://rosstat.gov.ru/folder/14036 (дата обращения: 21.10.2021).

6. Хайкин С. Нейронные сети: полный курс. - М.: Изд. дом Вильямс, 2006. - 1104 p.

7. Kourentzes N. Intermittent demand forecasts with neural networks // International Journal of Production Economics. - 2013. - № 1. - p. 198-206.

8. Hyndman R. J., Athanasopoulos G. Forecasting: principles and practice. - OTexts, 2018. - 505 p.

9. Makridakis S., Hyndman R.J., Petropoulos F. Forecasting in social settings: The state of the art // International Journal of Forecasting. - 2019. - № 36 (1). - p. 1-14.

10. Januschowski Т., Gasthaus J. Criteria for classifying forecasting methods // International Journal of Forecasting. - 2020. - № 1. - p. 167-177.

11. Neural Network Toolbox™. User's Guide. - The MathWorks, Inc., MA, 2015. - 410 p.

12. MatLab. [Электронный ресурс]. URL: getting-started-with-matlab.html (дата обращения: 18.10.2021).

13. Chen S., Billings S. A. Representations of non-linear systems: the NARMAX model // International Journal of Control. - 1989. - № 3. - p. 1013-1032. - doi: 10.1080/00207178908559683.

14. Khana F. M., Gupta R. ARIMA and NAR based prediction model for time series analysis of COVID-19 cases in India // Journal of Safety Science and Resilience. - 2020. - № 1. - p. 12-18. - doi: 10.1016/j.jnlssr.2020.06.007.

15. Домащенко Д.В., Никулин Э.Е. Прогнозирование рядов динамики рыночных индикаторов на основе нелинейной авторегрессионной нейронной сети // Статистика и экономика. - 2017. - № 3. - c. 4-9. - doi: http://dx.doi.org/10.21686/2500-3925-2017-3-4-9.

16. Кин А.И., Сидоренко А.Ю., Лисаков С.А., Сидоренко А.И., Сыпин Е.В. Нейросетевой алгоритм принятия решения о наличии предаварийной или аварийной ситуации в угольной шахте многокритериальным оптикоэлектронным прибором // Южно-сибирский научный вестник. - 2019. - № 4 (28). - c. 104-115. - doi: 10.25699/SSSB.2019.28.48994.

17. Sabaa А. I., Elsheikhb A.H. Forecasting the prevalence of COVID-19 outbreak in Egypt using nonlinear autoregressive artificial neural networks // Process Safety and Environmental Protection. - 2020. - p. 1-8.

18. Огнев Г.Г., Щетинин Е.Ю. Исследование глубоких нейронных сетей с LSTM архитектурой для прогнозирования финансовых временных рядов // Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. 2020. - c. 280-283.

19. Hochreiter S., Schmidhuber J. Long short-term memory // Neural Computation. -1997. - № 9(8). - p. 1735-1780. - doi: 10.1162/neco.1997.9.8.1735.

20. Гудфеллоу Я., Бенджо И., Курвиль А. Глубокое обучение. - М.: ДМК Пресс, 2017. -652 c.

REFERENCES:

Neural Network Toolbox™. User's Guide (2015).

Box G. E. P., Jenkins G. M. Reinsel G. C. et al. (2016). Time series analysis: forecasting and control

Brockwell P.V., Davis R.A. (2002). Introduction to Time Series and Forecasting Chatfield C. (2016). The analysis of time series: an introduction

Chen S., Billings S. A. (1989). Representations of non-linear systems: the NARMAX model International Journal of Control. (3). 1013-1032. doi: 10.1080/00207178908559683. Domaschenko D.V., Nikulin E.E. (2017). Prognozirovanie ryadov dinamiki rynochnyh indikatorov na osnove nelineynoy avtoregressionnoy neyronnoy seti [Forecasting time series of the market indicators based on a nonlinear autoregressive neural network]. Statistika i ekonomika. (3). 4-9. (in Russian). doi: http://dx.doi.org/10.21686/2500-3925-2017-3-4-9.

Gudfellou Ya., Bendzho I., Kurvil A. (2017). Glubokoe obuchenie [Deep learning] (in Russian).

Hochreiter S., Schmidhuber J. (1997). Long short-term memory Neural Computation. (9(8)). 1735-1780. doi: 10.1162/neco.1997.9.8.1735.

Hyndman R. J., Athanasopoulos G. (2018). Forecasting: principles and practice

Januschowski T., Gasthaus J. (2020). Criteria for classifying forecasting methods International Journal of Forecasting. (1). 167-177.

Khana F. M., Gupta R. (2020). ARIMA and NAR based prediction model for time series analysis of COVID-19 cases in India Journal of Safety Science and Resilience. (1). 12-18. doi: 10.1016/j.jnlssr.2020.06.007.

Khaykin S. (2006). Neyronnye seti: polnyy kurs

Kin A.I., Sidorenko A.Yu., Lisakov S.A., Sidorenko A.I., Sypin E.V. (2019). Neyrosetevoy algoritm prinyatiya resheniya o nalichii predavariynoy ili avariynoy situatsii v ugol-noy shakhte mnogokriterialnym optikoelektronnym priborom [Neural network algorithm of making decision on emergency and pre-emergency situations in the coal mine for multicriterial electro-optical system]. Yuzhno-sibirskiy nauchnyy vestnik. (4 (28)). 104-115. (in Russian). doi: 10.25699/SSSB.2019.28.48994.

Kourentzes N. (2013). Intermittent demand forecasts with neural networks International Journal of Production Economics. (1). 198-206.

Makridakis S., Hyndman R.J., Petropoulos F. (2019). Forecasting in social settings: The state of the art International Journal of Forecasting. (36 (1)). 1-14.

MatLab. Retrieved October 18, 2021, from getting-started-with-matlab.html

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ognev G.G., Schetinin E.Yu. (2020). Issledovanie glubokikh neyronnyh setey s LSTM arkhitekturoy dlya prognozirovaniya finansovyh vremennyh ryadov [Research of deep neural networks with LSTM architecture for forecasting financial time series] Information and telecommunication technologies and mathematical modeling of high-tech systems. 280-283. (in Russian).

Sabaa A. I., Elsheikhb A.H. (2020). Forecasting the prevalence of COVID-19 outbreak in Egypt using nonlinear autoregressive artificial neural networks Process Safety and Environmental Protection. 141 1-8.

Tsay R.S. (2002). Analysis of financial time series

i Надоели баннеры? Вы всегда можете отключить рекламу.