УДК 681.51.015
ТВ. КРИЖАНОВСЬКА, Т.С. КЛЕЦЬКА, А.Ю. АНДРЕЙЦЕВ
Державний економiко-технологiчний ушверситет транспорту
МОДЕЛЮВАННЯ ПОКАЗНИК1В РИНКУ ПРАЦ1 ЗА ДОПОМОГОЮ
НЕЙРОС1ТЬОВИХ МЕТОД1В
Розглянуто можливгсть застосування нейростьових методгв для прогнозування показниюв ринку пращ nid час прийняття ршень в управлтнг соцгально-економгчними системами. Наведено загальну схему прогнозування часових рядiв з використанням нейронних мереж, розроблено алгоритм видшення вхiдних по^довностей. Побудовано нейростьову прогнозуючу модель для короткострокового прогнозування ргвня зареестрованого безробття регюну.
Ключовi слова: нейростьовi методи, ринок працг, прогнозування.
Т.В. КРИЖАНОВСКАЯ, Т.С. КЛЕЦКАЯ, А.Ю. АНДРЕЙЦЕВ
Государственный экономико-технологический университет транспорта
МОДЕЛИРОВАНИЕ ПОКАЗАТЕЛЕЙ РЫНКА ТРУДА С ПОМОЩЬЮ НЕЙРОСЕТЕВЫХ
МЕТОДОВ
Рассмотрена возможность применения нейросетевых методов для прогнозирования показателей рынка труда при принятии решений в управлении социально-экономическими системами. Приведена общая схема прогнозирования временных рядов с использованием нейронных сетей, разработан алгоритм выделения входных последовательностей. Построена нейросетевая прогнозирующая модель для краткосрочного прогнозирования уровня зарегистрированной безработицы региона.
Ключевые слова: нейросетевые методы, рынок труда, прогнозирование.
T.V. KRYZHANOVSKA, T.S. KLETSKA, А.Уи. ANDREYTSEV
State Economy and Technology University of Transport
MODELING OF THE LABOUR MARKET INDICATORS USING NEURAL NETWORK
METHODS
The possibility of applying neural network techniques to predict the labor market indicators for decisionmaking in the management of socio-economic systems is considered. The general circuit time series prediction using neural network algorithm of allocation of input sequences is given. Neuronet forecasting model was constructed for a short-term forecasting of registered unemployment in the region.
Keywords: neural network techniques, the labor market, forecasting.
Постановка проблеми
Проблемы анатзу та прогнозування динашки зайнятосп та ринку пращ, ïx структурних характеристик е одними з найщкавших, але складних задач економ1ки. Складнощ^ що виникають при ïï розв'язанш обумовлеш багатьма причинами: недостатня яшсть i кшьшсть вхщних даних, змши середовища, у якому протжае процес, вплив суб'ективних факторiв. Але саме яшсний прогноз е ключем до розв'язання багатьох соцiально-економiчниx задач. Одшею з таких задач е прогнозування показнишв ринку пращ регюну.
Вщомосп про показники ринку пращ, зокрема, про безробитя населения, е важливим iндикатором соцiально-економiчного становища регюну. На ïx фундаменп формуються показники, як1 використовуються регiональними управлшськими структурами, i е основою для прийняття ршень та напрямшв проведення соцiальноï полiтики.
Аналiз ocTaHHix дослвджень i публiкацiй
Задача прогнозування в загальному випадку зводиться до одержання оцiнки майбутнix значень упорядкованих у чай даних на основi аналiзу вже наявних даних. Вiдомi рiзнi алгоритми пошуку закономiрностей в юнуючих даних. Поряд зi стандартними методами, що використовують параметричнi моделi, останшм часом з цiею метою почали застосовуватися iншi пiдxоди, зокрема, апарат нейронних мереж.
Нейромереж1 належать до класу нелiнiйниx адаптивних систем з архитектурою [1], що умовно iмiтуе нервову тканину з нейрошв [1,4]. Математична модель нейрона являе собою деякий унiверсальний нелiнiйний елемент iз можливютю широкоï змiни i налаштування його характеристик. В однш з найбшьш розповсюджених нейромережевих арxiтектур - багатошаровому перцептронi зi зворотним поширенням похибки - моделюеться робота нейронiв у складi iерарxiчноï мереж!, де кожен нейрон прошарку з'еднаний
сво!ми виходами з входами нейрошв наступного прошарку. На нейрони вхщного прошарку подаються значения вхвдних параметрiв, на основi яких проводяться обчислення, необхiднi для прийняття рiшень, прогнозування розвитку ситуацй' i т.п. Цi значення розглядаються як сигнали, що передаються в наступний прошарок. Величина послаблення або щдсилення сигналу залежить ввд числових (вагових) значень, що приписуються мгжнейронним зв'язкам. У результат! цього на виходi нейрона вихвдного прошарку продукуеться значення, що розглядаеться як вiдповiдь, реакщя вае1 мереж на введенi значення вхвдних параметрiв.
Нейромережа складаеться з дешлькох прошаркав: вхвдний, внутргшт (приховаш) i вихвдш прошарки. Вхвдний прошарок реалiзуе зв'язок з вхвдними даними, вихвдний - з вихвдними. Внутршшх прошаркав може бути один i бiльше. В кожному прошарку метиться декiлька нейронiв.
Для використання нейромереж надалi, ii треба "навчити" на прикладах, для яких ввдомо i значення вхвдних параметрiв, i правильш ввдповщ на них.
Формулювання мети дослщження Метою нашого досл1дження е створення моделi прогнозу за допомогою апарату нейронних мереж р!вня безробптя на прикладi статистичних даних ринку пращ Льв!всько! областi.
Як об'ект дослвдження будемо використовувати часовий ряд, що описуе щомюячний рiвень (кшьшсть) зареестрованих безробiтних Льв!всько! областi [2] за перюд 2006-2008 рр. (рис. 1).
Будувати прогноз на майбутне будемо, грунтуючись на даних минулих перiодiв, тобто припускаючи, що кшьшсть зареестрованих безробггних на наступний мюяць залежить ввд шлькосл зареестрованих безробгтних за попереднi мюящ. Це значить, що вхвдними факторами для моделi можуть бути к1льк1сть безробiтних за поточний, попереднш мюяць i т.д., а результатом повинш бути кшьшсть зареестрованих безробиних за наступний мюяць.
Викладення основного матер1алу досл1дження Для побудови нейронно! мереж1 скористаемось програмою Deductor Studio аналпичнох платформи Deductor [3,4], яка е основою для прийняття шнцевих прикладних рiшень в обласп аиалiзу даних. Реалiзованi в Deductor технологи дозволяють на базi едино! архiтектури пройти вс етапи побудови атлетично! системи ввд створення бази даних до автоматичного тдбору моделей i в!зуал!заци отриманих результапв.
53 ООО 52 ООО 51 ООО 50 000 49 000 48 000 47 000 46 000 g 45 000 .1 44 000 g. 43 000 | 42 000 £ 41 000 i 40 000 | 39 000 38 000 37 000 36 000 35 000 34 000 33 000 32 000 31 000
2005-М12 2006-М04 2006-М08 2007-М01 2007-М05 2007-М09 2008-М01 2008-М05 2008-М09
Дата (Рк + Мюяц)
Рис. 1. Динамша юлькосп зареестрованих безробпних Львшсько1 областi
Суттевим фактором для аналiзу часового ряду та прогнозу е визначення сезонность Графiчний анал1з вхвдних даних не дае змогу зробити висновки про Гх сезоннiсть, тому необхвдно перевiрити Гх на наявнiсть автокореляцii. Метою автокореляцшного аналiзу е встановлення степеня статистичноГ залежностi м1ж рiзними значенями (вiдлiками) випадковог послiдовностi, що утворюе поле вибiрки даних. В процес автокореляцiйного аналiзу розраховуються коефiцiенти кореляцп (мiра взаемноГ залежностi) для двох значень вибiрки, що вiддаленi один ввд одного на визначену шльшсть вiдлiкiв, як1 називаються лагом. Сукупнють коефiцiентiв кореляцii' для всiх лапв е автокореляцiйною функцiею ряду (АКФ):
R(k) = corr(X(t),X(t + k)),
де к > 0 - цше число(лаг).
Провiвши ощнку значення функци aвтокореляцiï та ïï поведiнкy, можна зробити висновок про xaрaктер aнaлiзyючоï послiдовностi i нaявнiсть в нш перiодичностi. В Deductor Studio iнстрyментом, призначеним для вивчення перiодичностi, e iнстyмент «Автокорелящя».
припустимо, що сезоннють, якщо вона мae мiсце, не бшьше року. Виxодячи з цього бyдемо шyкaти зaлежнiсть вiд мюяця, двоx, ..., п'ятнадцяти мiсяцiв тому. Кшьшсть крок1в обирaeмо бiльше 12, щоб визначити на якому мюящ року мae мiсце пiк коефiцieнтa автокореляци, пiсля чого спостерiгaeться його спад.
Дiaгрaмa отримано1' АКФ (рис.2) покaзye, що спочатку кореляцiя дорiвнюe одинищ, тобто значення залежить саме ввд себе. Дал1 зaлежнiсть спaдae, i попм на дiaгрaмi ми бачимо тк, тобто максимальне значення АКФ знaxодиться на 10-му вiдлiкy(лaгy). Це сввдчить про нaявнiсть перiодичностi, яка дорiвнюe 10 мiсяцiв. Таким чином, номер ввдл^, що вiдповiдae максимальному значенню, покaзye к1льк1сть мiсяцiв, шсля якиx спостерiгaeться та ж тенденщя кiлькостi зaреeстровaниx безробiтниx.
1
0,99
0,98
0,97
0,96
0,95
0,94
0,93
X 0,92
f 0,91
ig 0,9
g" 0,89 aj
ю 0,8В 0,87 ъ 0,86 ^ 0,85 0,84 0,83 0,82 0,81 0,8 0,79 0,78 0,77
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Лаг
Рис. 2. Дiaгрaмa aвтокорeляцшноï функци
При прогнозуванш елементiв чaсовиx рядiв за допомогою нейроннт мереж необxiдно подавати на вxiд моделi значення декiлькоx сyмiжниx вiдлiкiв вxiдного набору дaниx. Такий метод вiдборy дaниx нaзивaeться методом ковзниx вiкон (вiкно - осшльки видiляeться тiльки деяка неперервна дмнка дaниx, ковзне - оск1льки це вiкно «рyxaeться» вздовж множини дант.
Авторегресiйний aнaлiз виявив нaявнiсть 10-мюячно1' перiодичностi. В зв'язку iз цим було виршено будувати прогноз на мюяць уперед, грунтуючись на дант за 1, 2, 9 i 10 мюящв тому. Використовуючи вщповвдний iнстрyмент Deductor Studio, одержимо даш (рис. 3), як1 трансформуються до «ковзного вiкнa» так, що будуть достyпнi всi потрiбнi фактори для побудови прогнозу.
Тепер як вxiднi фактори можна використати «Юльшсть безробiтниx - 10», «К1льк1сть безробiтниx -9» - даш, яш вщповщають кiлькостi безробiтниx за 10 i 9 мюящв назад (щодо прогнозованого мiсяця), а також «Kiлькiсть безробiтниx - 2» i «К1льк1сть безробiтниx - 1» - дaнi за 2 попередш мiсяцi. Як в^щне поле позначимо стовпчик «К1льк1сть безробiтниx».
Для побудови моделi прогнозу скористaeмося iнстрyментом "Нейронна мережа" програми Deductor Studio. Пюля тдготовки тaблицi з даними основними кроками програми e налаштування структури та навчання нейромереж1 (прогнозування на 1 мiсяць вперед).
Для визначення структури нейромереж1 вкажемо наступш параметри (рис. 4):
• шлькють нейронiв у вxiдномy прошарку - 4;
• кiлькiсть пртовант прошаркав - 1;
• шлькють нейрошв у виxiдномy прошарку - 1.
1 /5
N- Поле Значение
1 12 Лаг 10
2 Э.О Кшьшсть безробгтних-10 1
3 9.0 Кшьшсть безробгтник-9 0,98935001754Э877
4 Э.О Кшьшсть безробгтник-8 0,987370489837899
5 Э.О Кшьшсть безробгтник-7 0,948572828880572
G Э.О Кшьнисть безробгтник-8 0,930588259395979
7 Э.О Кшьнисть безробгтник-5 0,918718805282977
8 9.0 Ктьнисть безробгтник-4 0,912285288238813
Э 9.0 Ктыусть безробгтник-3 0,911471288395815
10 9.0 Ктыусть безробгтник-2 0,913484981795159
11 9.0 Ктьнисть безробгтник-1 0,9226321 G5560421
12 9.0 Ктьнисть безробгтник 0,928426050316579
Рис. 3. Трансформоват до «ковзного вжна» дат
Рис. 4. Навчання нейронноК мережi
Як функщю активаци (нелшшну функцш, що обчислюе вихвдний сигнал формального нейрона) виберемо сигмовду:
х
f (х) = -
c + х
де х - вихвд нейрона, а с - характеристика крутосп функци.
Для навчання нейромереж1 використаемо метод Resilient Propagation (Rprop) [5]. Алгоритм використовуе так зване «навчання по епохах», коли корекщя ваг ввдбуваеться тсля пред'явлення мережi всiх прикладiв з навчально! вибiрки. Перевага цього методу полягае в тому, що навчання мережi вщбуваеться в 4-5 разiв швидше, нiж стандартний алгоритм Backprop. Задамо умову зупинки навчання при досягненш епохи значенню 10000 i будемо вважати приклад розпiзнаним, якщо похибка менше 0,005.
На наступному кроцi запускаемо процес навчання й спостертаемо за змiною величини похибки й вщсотком розпiзнаних прикладiв у навчальних i тестових множинах. У нашому випадку бачимо, що на епос № 10000 у навчальнш i тестовiй множинах розпiзнано 100%. Фрагмент цього процесу проiлюстровано на Рис. 4.
В результал ми одержали багатошарову нейронну мережу, що здатна прогнозувати к1льк1сть зареестрованих безробiтних на короткотермшовий перiод.
Пiсля побудови моделi для аналiзу И якостi подамо отриманi результати у виглядi дiаграми моделi дiаграми розсiювання (рис. 5), що являе собою графж, на якому по горизонтальнiй осi вщкладеш цiльовi значення навчальних прикладiв, а по вертикально! - значения, яш ощнеш моделлю.
З огляду на дiаграму розсiюваиия вiдхиления прогнозованих значень вщ реальних достатньо невелике. Бшьша частина точок зосереджена на невеликш вiдстанi вiд лши iдеальних ощнок i знаходиться у межах заданого «коридору» похибки. Графiк спостережуваних i прогнозованих значень (рис. 5) показуе, що побудована модель адекватно вадображае сезоншсть I тренд входного часового ряду.
30426 31156 31890 32849 33557 34301 35065
42193 42997
Кгпькють безроб1тних_01Л о Ктькють безроб1тних - Нижняя граница_
- Эталон
■ Верхняя граница
Рис. 5. Д1аграма розс1ювання (ввдхилення) прогнозованих значень в1д реальних
Тепер залишилося одержати необхвдний прогноз. Для цього використаемо шструмент «Прогнозування», вказавши горизонт прогнозу (на який термш будемо прогнозувати) рiвний одиницi.
Побудована дiаграма прогнозу (рис. 6) сввдчить, що розходження м1ж реальним i прогнозованим значенням складае 10%, що шдтверджуе достатньо високу як1сть короткострокового прогнозу за допомогою апарата нейронних мереж.
2006
-М10 2007-М02 2007-М05 2007-М03 2007-М11 2008-М02 2008-М05 2003-М03
Дата (Рк + Мюяц)
2008-М10
I I 40 933 2003-М10 □
I I 41 415 2007-М03 □
I I 35 065 2007-М07 □
I I 31 890 2007-М11 □
I I 32 997 2008-М03 □
I I 30 613 2008-М07 □
Н31 675,312 2008-М10
40 897 2006-М11 □ 39 556 2007-М04 □ 34 301 2007-М03 □ 32 649 2007-М12 □ 32 902 2008-М04 □ 30 426 2003-М03 I I
42 193 2007-М01 □ 33 214 2007-М05 □ 33 557 2007-М09 I I 33 016 2008-М01 □ 32 227 2008-М05 □ 31 403 2008-М09 □
42 997 2007-М02 36 132 2007-М06 31 541 2007-М10 33 794 2008-М02
31 158 2008-М06
32 052 2006-М10
Рис. 6. Д1аграма прогнозу (чорна . мши — прогнозоване значення)
При надходженш нових даних значення прогнозу буде змшюватись, адаптуючись до ново! шформацп. Адаптивш прогнози формуються при автоматизованому доучуванш нейронних мереж. При цьому при короткостроковому прогнозуваннi доучування повинне бути щомюячним на нових даних. Адаптивш прогнози визначають як основний режим ковзно! вибiрки. Суть його полягае в тому, що перед черговим тестуванням здiйснюеться доучування нейронно! мережi на вибiрцi, що включае даш минулого перiоду. У запропонованiй функцюнуючш iнформацiйно-аналiтичнiй платформi Deductor цей режим легко реалiзувати.
Висновки
У статл розглянуто можливiсть застосування нейросiтьових методiв для прогнозування показник1в ринку пращ пвд час прийняття рiшень в управлшш соцiально-економiчними системами. Як шструмент анал1зу даних запропоновано використовувати аналггичну платформу Deductor. Наведено загальну схему прогнозування часових рядiв з використанням нейронних мереж, розроблено алгоритм видшення вхiдних послвдовностей, побудовано нейросiтьову прогнозуючу модель для короткострокового прогнозування рiвня зареестрованого безробiття регiону. Розглянуто залежшсть значення прогнозу ввд змiни початкових даних, продемонстрована його адаптивнiсть до ново! шформацп. Описано процес формування адаптивних прогнозiв при автоматизованому доучуванш нейронних мереж. Запропоновано встановити термш доучування нейромереж1 при короткостроковому прогнозуванш в розмiрi одного мiсяця на нових даних.
Проведеш досл1дження продемонстрували можливiсть i доцiльнiсть використання апарату нейронних мереж для задач прогнозування показнишв ринку працi.
Розглянутий приклад продемонстрував, як за допомогою програм спецiально! аналггачно! платформи прогнозувати часовий ряд, що описуе щомюячш показники ринку пращ регюну. Розглянутий принцип прогнозування часового ряду (виявлення сезонносп, побудова моделi прогнозу та побудова прогнозу часового ряду) забезпечили достовiрний результат прогнозування шлькосп зареестрованих безробггних перiодом на один мiсяць i як1сть побудови моделi прогнозу.
Список використаноК л1тератури
1. Нейроинформатика / [Горбань А.Н., Дунин-Барковский В.Л., Кирдин А.Н. и др.]. - Новосибирск: Наука, 1998. - 296с.
2. Головне управлшня статистики у Львiвськоl обласп [Електронний ресурс] : [Веб-сайт]. -Електронш данi. - Режим доступу: http://www.lv.ukrstat.gov.ua (дата звернення 30.03.2015) - Назва з екрана.
3. BaseGroup Labs. Технологии анализа данных - [Електронний ресурс] : [Веб-сайт]. - Електронш даш. - Режим доступу: http://www.basegroup.ru (дата звернення 18.02.2015) - Назва з екрана.
4. Чубукова И.А. Data Mining [Електронний ресурс] : навч. пойб./ Чубукова И.А. - М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. - 382 с.
5. Riedmiller M. direct adaptive method for faster backpropagation learning: The RPROP algorithm./ M. Riedmiller, H.Braun. . - San Francisco: Proceedings of the IEEE International Conference on Neural Networks. - 1993. - pp.586-591.
6. Кшна Т.М. Використання нейройтьових методiв для прогнозування показнишв ринку пращ / Т.М. Кшна, Т.В. Крижановська. - Зб. наук. праць ДЕТУТ: Серiя «Транспортш системи i технологи». - К.: ДЕТУТ, 2009. - Вип. 14. - С. 139-151.