Научная статья на тему 'Применение нейронных сетей в задаче прогнозирования численности населения региона'

Применение нейронных сетей в задаче прогнозирования численности населения региона Текст научной статьи по специальности «Математика»

CC BY
394
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МНОГОСЛОЙНЫЙ ПЕРЦЕПТРОН / ЧИСЛЕННОСТЬ НАСЕЛЕНИЯ / ПРОГНОЗИРОВАНИЕ / ДЕМОГРАФИЯ / РЕГИОН / ARTIFICIAL INTELLECT / MULTI-LAYER PERCEPTRON / POPULATION / FORECASTING / DEMOGRAPHY / REGION

Аннотация научной статьи по математике, автор научной работы — Бредихин А. И.

В данной статье описывается применение нейронной сети, а именно многослойного перцептрона в задаче прогнозирования численности населения региона на примере Ханты-Мансийского автономного округа Югры. При решении данной задачи использованы данные о численности населения ХМАО-Югры за период с 1989 по 2018 год, на основании которых сделан прогноз численности населения ХМАО-Югры на 2019-2029 годы. По результатам прогнозирования сделаны выводы о применимости нейронных сетей в задаче прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бредихин А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USAGE OF A NEURAL NETWORKS FOR FORECASTING POPULATION A REGION

This article describes the use of a neural network, namely, a multi-layer perceptron in the problem of forecasting the population of the region on the example of the Khanty-Mansiysk Autonomous Okrug-Ugra. In solving this problem, we used data on the population of KHMAO-Yugra for the period from 1989 to 2018, on the basis of which the forecast of the population of KHMAO-Yugra for 2019-2029 was made. Based on the results of forecasting, conclusions are made about the applicability of neural networks in the forecasting problem.

Текст научной работы на тему «Применение нейронных сетей в задаче прогнозирования численности населения региона»

ВЕСТНИК ЮГОРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

_2019 г. Выпуск 2 (53). С. 16-22_

DOI: 10.17816/byusu20190216-22 УДК 004.8:314(571.122)

А. И. Бредихин

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ЧИСЛЕННОСТИ НАСЕЛЕНИЯ РЕГИОНА

В данной статье описывается применение нейронной сети, а именно многослойного пер-цептрона в задаче прогнозирования численности населения региона на примере Ханты-Мансийского автономного округа - Югры. При решении данной задачи использованы данные о численности населения ХМАО-Югры за период с 1989 по 2018 год, на основании которых сделан прогноз численности населения ХМАО-Югры на 2019-2029 годы. По результатам прогнозирования сделаны выводы о применимости нейронных сетей в задаче прогнозирования.

Ключевые слова: искусственный интеллект, многослойный перцептрон, численность населения, прогнозирование, демография, регион.

A. I. Bredikhin

THE USAGE OF A NEURAL NETWORKS FOR FORECASTING POPULATION A REGION

This article describes the use of a neural network, namely, a multi-layer perceptron in the problem of forecasting the population of the region on the example of the Khanty-Mansiysk Autonomous Okrug-Ugra. In solving this problem, we used data on the population of KHMAO-Yugra for the period from 1989 to 2018, on the basis of which the forecast of the population of KHMAO-Yugra for 2019-2029 was made. Based on the results of forecasting, conclusions are made about the applicability of neural networks in the forecasting problem.

Keywords: artificial intellect, multi-layer perceptron, population, forecasting, demography, region.

Введение

В настоящее время достаточно популярны методы прогнозирования временных рядов. Это объясняется потребностью людей «заглядывать в будущее» для эффективного управления процессами, ресурсами и т. п. Одним из примеров временного ряда является численность населения (страны, региона, города и т. д.).

Существуют различные методы прогнозирования временных рядов. Среди них выделяют методы регрессионного анализа, к которым относят метод наименьших квадратов [1], цель которого - поиск ближайшей к наблюдаемым точкам прямой, и метод максимального правдоподобия [2]. Сюда же относят и авторегрессионные модели, в которые заложено предположение о зависимости значения процесса от некоторого количества предыдущих значений [3]. Отдельно выделяются нейросетевые методы прогнозирования временных рядов [4].

Основным преимуществом нейросетевых методов прогнозирования временных рядов по сравнению с методами регрессионного анализа является их нелинейность [5], т. е. способность выявлять нелинейные зависимости между текущими и прогнозируемыми значениями процессов. Именно поэтому было принято решение рассмотреть в данной работе именно нейронные сети для решения задачи прогнозирования численности населения региона.

Прогнозирование численности населения позволит сделать определенные выводы по дальнейшему развитию инфраструктуры и экономики федерального округа, региона, города, что важно как для городов и регионов, так и для федеральных округов и страны в целом. Со-

гласно полученным выводам главы городов, регионов смогут принимать оптимальные стратегии развития, что при их реализации повысит уровень жизни населения.

В данной статье описано прогнозирование численности населения региона на примере ХМАО-Югры. Для этого использовался многослойный перцептрон и метод скользящего окна. Для обучения перцептрона использовались данные о численности населения ХМАО -Югры за период 1989-2018 гг. На их основании сделан прогноз численности населения на

Полносвязный перцептрон - один из простых видов нейронных сетей. Тем не менее, при обучении он может научиться решать задачи, которые трудно поддаются формализации или не поддаются ей вообще. При этом все зависит от настроек сети.

Простейший перцептрон состоит из входного и выходного слоев нейронов. Нейроны соседних слоев связаны друг с другом по принципу «каждый с каждым». Архитектура простейшего перцептрона показана ниже.

Каждая связь между двумя нейронами имеет собственный весовой коэффициент, а каждый нейрон имеет собственный порог (или смещение). Все весовые коэффициенты и пороги являются настраиваемыми в ходе обучения сети параметрами.

Количество слоев нейронов в перцептроне может быть любым. Тогда перцептрон будет иметь, помимо входного и выходного, скрытые слои нейронов.

Рассмотрим функционирование перцептрона. Пусть первый слой нейронов состоит из т нейронов, а второй - из п нейронов (см. рис. 1). Тогда вычисление значений нейронов второго слоя производится по следующим формулам [6]:

2019-2029 гг.

Полносвязный перцептрон

Слой II

Слой 12

Рисунок 1 - Архитектура простейшего перцептрона

12 , = 2 ,=

(1)

т

где F - значение функции активации от взвешенной суммы £.

/1г и /2. - значения /-го нейрона первого слоя нейронов иу'-го нейрона второго слоя соответственно;

аг>. - значение связи между /-м нейроном первого слоя нейронов и у'-м нейроном второго слоя соответственно;

Т2; - значение порога (смещения)у'-го нейрона второго слоя.

Для обучения многослойного перцептрона используется алгоритм обратного распространения ошибки (АОРО), который относится к методам обучения с учителем.

Рассмотрим обучение многослойного перцептрона. Ошибка формируется на последнем слое нейронов перцептрона и определяется как разность между выходной реакцией сети (значениями нейронов последнего слоя нейронов) у и эталоном I [6, с. 63]:

У = У " ■ (3)

Далее происходит изменение значений весов и порогов по следующим формулам [6, с. 63]:

а ] (г +1) = а г] (0 - ау^ '(Б; )у, (4)

Т] (г +1) = Т] (г) + ау^'(Б] ), (5)

где а - скорость обучения сети;

I и 1+1 - моменты времени до и после изменения весов и порогов соответственно; индексы / и у обозначают нейроны первого и второго слоя нейронов соответственно. Слои перцептрона обучаются по процедуре обучения Розенблатта, согласно которой значение скорости обучения постоянно в процессе всего времени обучения и принимает значения в промежутке (0;1] [7, с. 43].

Обработка данных

Как уже было сказано ранее, для прогнозирования были взяты значения численности населения ХМАО-Югры за 1989 - 2018 годы. Они приведены в таблице 1.

Таблица 1 - Численность населения ХМАО за 1989-2018 годы [8]

Год 1989 1990 1991 1992 1993 1994

Численность населения, чел. 1268439 1267030 1280139 1271505 1267751 1279483

Прирост - -1409 13109 -8634 -3754 11732

Год 1995 1996 1997 1998 1999 2000

Численность населения, чел. 1292985 1303285 1316774 1342991 1359069 1359646

Прирост 13502 10300 13489 26217 16078 577

Год 2001 2002 2003 2004 2005 2006

Численность населения, чел. 1383449 1432817 1437729 1456509 1469011 1478178

Прирост 23803 49368 4912 18780 12502 9167

Год 2007 2008 2009 2010 2011 2012

Численность населения, чел. 1488297 1505248 1519962 1532243 1537134 1561238

Прирост 10119 16951 14714 12281 4891 24104

Год 2013 2014 2015 2016 2017 2018

Численность населения, чел. 1584063 1597248 1612076 1626755 1646078 1655074

Прирост 22825 13185 14828 14679 19323 8996

Все значения численности населения были подвергнуты нормализации - они приведены в промежуток [0;1] путем деления.

Для прогнозирования данного временного ряда используется метод скользящего окна. Он характеризуется длиной окна р, равной числу элементов ряда, одновременно подаваемых на нейронную сеть [7, с. 56].

Обучающую выборку X и прогнозируемые значения Y в таком случае можно представить в следующем виде (длина временного ряда равна т):

" х(1) х(2) . . х(Р) ' х( Р +1)"

X = х(2) х(3) . . х(р +1) У = х( р + 2)

х(т - р) х(т - р +1) . . х(т -1) х(т)

что эквивалентно перемещению окна по ряду х(1) с шагом, равным 1 [7, а 56].

Применение нейронной сети для прогнозирования

Для проектирования нейронной сети была определена длина скользящего окна исходя из длины прогнозируемого периода (2019-2029 гг.). Для данного периода требуется предсказать 11 значений численности населения (2029-2019+1). Следовательно, размер входа нейронной сети должен быть равным 11.

Затем был спроектирован многослойный перцептрон с одним скрытым слоем. Его архитектура описана в таблице 2.

Таблица 2 - Архитектура нейронной сети

Номер слоя Размер слоя (входа) Размер матрицы весовых коэффициентов Функция активации

1 11 11*23 ReLU

2 23 23*1 Сигмоидная

3 1 - -

После проектирования сеть была обучена на обучающей выборке. Количество эпох составило 2000, коэффициент скорости обучения - 0,25. Результаты обучения представлены ниже.

Рисунок 2 - Результаты обучения

Замечание. Синим цветом обозначен график динамики численности населения за 20002018 гг., а желто-оранжевым - график предсказанных нейронной сетью значений населения ХМАО за данные годы.

Как видно из рисунка 2, наблюдается постепенная сходимость реакции сети к динамике численности населения ХМАО, что свидетельствует об успешном процессе обучения сети.

Затем обучение нейронной сети было продолжено - количество эпох составило 2000 (с 2001-ю по 4000-ю), коэффициент скорости обучения был увеличен до 0,55. Результаты продолженного обучения представлены ниже.

Рисунок 3 - Результаты продолженного обучения

Прогресса в обучении не наблюдается, следовательно, нейронную сеть можно считать обученной. При этом она не очень корректно подстраивается к резким перепадам численности населения.

Результаты прогнозирования

На вход обученную нейронную сеть были поданы значения численности населения ХМАО за 2008-2018 годы, и таким образом получено спрогнозированное значение численности населения ХМАО за 2019 г. Данные действия были повторены для всех годов с 2020 по 2029. График предсказанных значений представлен ниже.

.,10е Население ХМАО

1.8 г

За предыдущие годы (1989-2018) Спрогнозированные значения (2019-2029)

■I 2 _1_1_1_1_1_1_'_1_

1990 1995 2000 2005 2010 2015 2020 2025

Год

Рисунок 4 - Результаты прогнозирования численности населения ХМАО

Полученные с помощью прогнозирования значения численности населения ХМАО были сведены в таблицу 3.

Таблица 3 - Спрогнозированные значения численности населения ХМАО

Год 2019 2020 2021 2022 2023 2024

Численность населения, чел. 1668701 1679951 1691125 1702113 1714102 1724625

Прирост 13627 11250 11174 10988 11989 10523

Год 2025 2026 2027 2028 2029 -

Численность населения, чел. 1734281 1744638 1753508 1762900 1770805 -

Прирост 9656 10357 8870 9392 7905 -

Замечание. Спрогнозированные значения численности населения ХМАО-Югры в будущем будут близки к реальным при сохранении текущих тенденций развития округа.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Исходя из данных таблицы 3, население ХМАО-Югры будет продолжать расти. Однако темпы роста со временем будут снижаться. При сохранении текущих тенденций развития округа через несколько десятков лет население ХМАО-Югры может пойти на убыль, что может негативно сказаться на экономическом состоянии региона.

Одну из причин возможного в будущем падения темпов роста населения ХМАО-Югры автор статьи видит в слабо развитой инфраструктуре региона, а именно - большие расстояния между городами (порядка 200-300 км; исключение - города Нефтеюганск и Сургут, расстояние между которыми составляет около 60 км).

Для решения данной проблемы автор предлагает развитие инфраструктуры ХМАО-Югры с помощью усиленного развития городов с населением менее 100 тыс. человек и поселков.

Заключение

В результате выполнения данной работы была спроектирована и обучена нейронная сеть, которая была применена для прогнозирования численности населения Ханты-Мансийского автономного округа - Югры. Сеть обучилась достаточно успешно, так что полученные с ее помощью данные о численности населения ХМАО-Югры на 2019-2029 годы можно считать в той или иной степени корректными. Из этого следует, что многослойный перцептрон вместе с применением метода скользящего окна вполне пригоден для прогнозирования временных рядов.

Что же касается анализа результатов прогнозирования, то согласно им в 2019-2029 гг. возможно падение темпов роста численности населения ХМАО-Югры и, следовательно, некоторое ухудшение экономики региона. Причиной вполне может быть слабо развитая инфраструктура региона, которая может быть решена путем усиленного развития малых городов и поселков ХМАО-Югры.

Литература

1. Draper, N. Applied regression analysis / N. Draper, H. Smith. - New York : Wiley : In Press, 1981. - 693 p. - Text : direct.

2. Maximum likelihood estimation. - Text : direct // Wikipedia : The free encyclopedia. -URL: https://en.wikipedia.org/wiki/Maximum_likelihood (Date of circulation 15.09.2019).

3. Бокс, Дж. Анализ временных рядов, прогноз и управление / Дж. Бокс, Г. М. Д жен-кинс. - Москва : Мир, 1974. - 406 с. - Текст : непосредственный.

4. Mazengia, D. H. Forecasting Spot Electricity Market Prices Using Time Series Models : Thesis for the degree of Master of Science in Electric Power Engineering / D. H. Mazengia. -Gothenburg : Chalmers University of Technology, 2008. - 89 p. - Text : direct.

5. Хайкин, С. Нейронные сети : полный курс / С. Хайкин. - Москва : Вильямс, 2006. 1104 с. - ISBN 978-5-8459-0890-2. - Текст : непосредственный.

6. Татьянкин, В. М. Подход к формированию архитектуры нейронной сети для распознавания образов / В. М. Татьянкин. - Текст : непосредственный // Вестник Югорского государственного университета. - Ханты-Мансийск. - 2016. - № 2 (41). - С. 61-64.

7. Головко, В. А. Нейронные сети: обучение, организация и применение : учебное пособие для вузов / В. А. Головко ; общая редакция А. И. Галушкина. - Москва : ИПРЖР, 2001. -Кн. 4. - 256 с. - Текст : непосредственный

8. Население Ханты-Мансийского автономного округа - Югры. - Текст : электронный // Википедия : свободная энциклопедия. - URL: https://ru.wikipedia.org/wiki/%D0%9D%D0% B0%D1%81%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%A5%D0%B0%D 0%BD%D1%82%D1%8B-%D0%9C%D0%B0%D0%BD%D1%81 %D0%B8%D0%B9%D1% 81%D0%BA%D0%BE%D0%B3%D0%BE_%D0%B0%D0%B2%D1%82%D0%BE%D0%BD% D0%BE%D0%BC%D0%BD%D0%BE%D0%B3%D0%BE_%D0%BE%D0%BA%D1%80%D1% 83%D0%B3%D0%B0_%E2%80%94_%D0%AE%D0%B3%D 1%80%D 1%8B (дата обращения 22.01.2019).

i Надоели баннеры? Вы всегда можете отключить рекламу.