Научная статья на тему 'РОЗРОБКА МЕТОДУ ФОРМУВАННЯ ЕФЕКТИВНОГО ПЛАНУ ПІДВИЩЕННЯ КВАЛІФІКАЦІЇ'

РОЗРОБКА МЕТОДУ ФОРМУВАННЯ ЕФЕКТИВНОГО ПЛАНУ ПІДВИЩЕННЯ КВАЛІФІКАЦІЇ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
24
10
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ситніков Дмитро Едуардович, Андрусенко Юлія Олександрівна

Досліджено застосування моделі на основі згорткових нейронних мереж для задачі прогнозування поширення захворюваності COVID-19 в Україні. Серед сучасних моделей нейронних мереж для даної задачі обрана InceptionTime на основі архітектури Inception-v4. Дослідження реалізовано за допомогою високорівневої мови програмування Python. Проведено 30 експериментів з навчання моделі на вхідній вибірці даних з використанням різних ознак. Модель продемонструвала високу точність і швидкодію.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ситніков Дмитро Едуардович, Андрусенко Юлія Олександрівна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

СNN-based application for Covid-19 forecasting in Ukraine

The article deals with the problem of predicting the COVID-19 spreading in Ukraine. This task becomes more relevant each day. From all the modern models of CNN-based time series forecasting, the InceptionTime model was chosen. Its advantages are high accuracy and scalability. The research is implemented using the Python high-level programming language. The results are presented as the mean absolute error, mean squared error, root-mean square error, mean absolute percentage error for each experiments. The InceptionTime model has proved its high accuracy for this task.

Текст научной работы на тему «РОЗРОБКА МЕТОДУ ФОРМУВАННЯ ЕФЕКТИВНОГО ПЛАНУ ПІДВИЩЕННЯ КВАЛІФІКАЦІЇ»

Wisniewski, Pedro Orival Luccas. Digital Image Analysis for the Colorimetric Determination of Aluminum, Total Iron, Nitrite and Soluble Phosphorus in Waters // Analytical Letters. Volume 50. Issue 2. 2017. P. 414-430. 4. FirdausM. L., Trinoveldi W. Alwi, F., RahayuI., RahmidarL., Warsito K. Determination of Chromium and Iron Using Digital Image-based Colorimetry // Procedia Environmental Sciences. Volume 20. 2014. P. 298 - 304. 5. Luka G. S., NowakE., Kawchuk J., HoorfarM, Najjaran H. Portable device for the detection of colorimetric assays // Royal Society Open Science. Volume 4. Issue 11. 2017. 171025. 6. HelferG.A.,Magnus V. S., Bock F. C, TeichmannA., FerraocM. F., A. B. da Costa. PhotoMetrix: An Application for Univariate Calibration and Principal Components Analysis Using Colorimetry on Mobile Devices // Journal ofthe Brazilian Chemical Society. Volume 28. Issue 2. 2017. P. 328-335. 7. Multilayer perception: Theory and Applications / ed.: R. Vang-Mata. New York. Nova Science Publishers, 2020. 153 p. 8. Brownlee J. Whento Use MLP, CNn, and RNN Neural Networks. 2019. URL: https://machinelearningmastsry.com/ when-to-use-mlp-cnn-and-rnn-neural-networks. 9. Bernico M. Deep Learning Quick Reference: Useful hacks for training and optimization deep neural networks with TensorFlow and Keras. Birmingham, UK: Packt Publishing, 2018. 10. Hanchett E., Listwon B. Vue.js in Action. Manning Publications, 2018. 304 с. 11. Holovaty A., Kaplan-Moss J. The Definitive Guide to Django. Web Development Done Right. NY, Apress, 2009. 536 p.

Надтшла до редколегИ' 21.05.2021

Сафоник Амдрш Петрович, доктор техшчних наук, професор, професор кафедри автоматизации, електротехшчних та комп'ютерно-штегрованих технологий Национального утверсите-ту водного господарства та природокористування. ^y^Bi штереси: математичне та комп-'ютерне моделювання природних, технолопчних, техногенних процесгв i систем та !х автома-тизацш. Адреса: Украгна, 33018, м. Рiвне, вул. Соборна 11, тел. +38 (050) 378 86 21.

Грицюк ¡вампа Михайшвна, асистент, асистент кафедри компЮтерних наук та прикладно! математики Нацюнального утверситету водного господарства та природокористування. Наук® штереси: математичне та компЮтерне моделювання природних, технолойчних, техногенних процеав i систем та !х автоматизапш. Адреса: Украгна, 33018, м. 1Рвне, вул. Соборна 11, тел. +38 (063) 345 46 11. Мщанчук Максим Миколайович, студент. Наyковi iнтереси: математичне та комп'ютерне моделювання природних, технолопчних, техногенних процеав i систем та !х автоматизащя. Адреса: Украгна, 33018, м. Рiвне, вул. Соборна 11, тел. +38 (098) 083 90 80.

Гльшв 1гор Васильович, аспiрант кафедри вищо! математики Рiвненського державного гyманiтарного ушверситету. Наyковi iнтереси: математичне та комп'ютерне моделювання природних, технолопчних, техногенних процеав i систем. Адреса: Украгна, 33017, м. Рiвне, вул. Степана Бандери 12, тел. +38 (093) 487 26 89.

УДК 004.942 DOI: 10.30837/0135-1710.2021.177.043

Д. Е. СИТН1КОВ, Ю.О.АНДР УСЕНКО

РОЗРОБКА МЕТОДУ ФОРМУВАННЯ ЕФЕКТИВНОГО ПЛАНУ П1ДВИЩЕННЯ КВАЛ1Ф1КАЦ11

Дослщжено застосування моделi на основi згорткових нейронних мереж для задачi прогнозування поширення захворюваностi COVID-19 в Украiнi. Серед сучасних моделей нейронних мереж для дано! задачi обрана InceptionTime на основi архгтектури Inception-v4. Дослвдження реалiзовано за допомогою високорiвневоi мови програмування Python. Проведено 30 експерименпв з навчання моделi на вхвднш вибiрцi даних з використанням рiзних ознак. Модель продемонструвала високу точшсть i швидкодш.

1. Вступ

Пандем1я рашше невщомого коронавирусу SARS-CoV-2, що викликае атипову пневмо-шю COVID-19, впливае на життя людей по всьому св1ту. У багатьох кра!нах введет карантинш обмеження, як ютотно позначаються на вс1х сощально-економ1чних сферах i св1товш економщ в цшому.

Наслдком COVID-19 в Укрш'ш стало пад1ння ВВП i майже повна зупинка д1яльносп у сфер1 роздр1бно! торпвл1, готельного та ресторанного б1знесу, ав1аперевезень. В регюнах, де юнуе пом'якшення карантинних обмежень, спостер1гаються тки захворюваносп. Через те, що вакцина-щя вщ COVID-19 в Укрш'ш розпочата нещодавно та дов1ра населення до вакцинаци дуже низька, перспективи завершення карантину, а, вщповщно, i нормал1зацл життя населення вщцалеш.

В таких умовах значно шдвищуеться актуальшсть задач прогнозування фшансово-економiчних, лопстичних та навiть продовольчих показникiв, на яю впливае поширення COVID-19 в Укра"ш. Тому для прийняття ршення про посилення або пом'якшення каран-тинних обмежень необидно прогнозувати поширення захворюваносп по регiонах Украши в довгостроковш i короткостроковiй перспективi з максимальною точшстю.

Отже, розглянемо задачу прогнозування поширення COVID-19 в Укра"ш в такiй поста-новцi. Вхщними даними е часовi ряди показниюв захворюваностi по регiонах: кiлькiсть шдтверджених випадкiв, кiлькiсть смертей, кiлькiсть активних випадкiв, прирiст тдтверд-жених випадюв i прирiст активних випадкiв. Необидно спрогнозувати прирют тдтвердже-них випадюв з мiнiмальною похибкою.

2. Основна частина

На сьогодшшнш день юнуе значна кiлькiсть методiв прогнозування часових рядiв (time series, TS). Умовно !х можна роздiлити на статистичш, структурнi i комбiнованi [1].

Загальним недолiком статистичних моделей е складнють вибору типу моделi i шдбору й параметрiв. При вирiшеннi задач прогнозування аналгтику доводиться приймати ршення щодо таких характеристик часового ряду як тренд, сезонна i циктчна компоненти, робити припущення про модель часового ряду - адитивно", мультиишкативно" тощо. Автоматичного способу виявлен-ня грендiв у часових рядах не юнуе. У той же час при вивчент кривой що вщображуе результати спостережень, аналiтику важко робити припущення щодо повторюваносп форми кривоi через рiвнi пром1жки часу [2]. Все це ютотно збiльшуе суб'ективний внесок учасникiв процесу аналiзу i прогнозування TS. Таким чином, результат аналiзу i прогнозування TS залежить як вщ квалiфiкацii аналггака в предмегноi галузi, так i вiд його квалiфiкацii в методах аналiзу.

Серед структурних моделей варто вщзначити моделi на основi нейронних мереж (artificial neural networks, ANN). Здатнють нейронноi мереж до рiзнобiчноi обробки iнформацii випливае з ii здатносп до узагальнення i видшення прихованих залежностей мiж вх1дними та вихщними даними [3]. Великою перевагою нейронних мереж е те, що вони здатш до навчання i узагальнення накопичених знань. Апарат ANN передбачае мшмальну участь аналiтика в формуванш моделi часового ряду, оскшьки здатнiсть нейромережевих моделей до навчання дозволяе виявити прихованi взаемозв'язки i закономiрностi мiж даними, а алгоритми навчання адаптують ваговi коефiцiенти вщповщно до структури даних, представлених для навчання [4].

Використання апарату ANN для прогнозування TS полягае в формуванш ANN певноi структури, в ii параметричному налаштуванш на основi поведшки дослiджуваноi системи в заздалепдь вiдомi моменти часу, в передбаченш майбутньоi поведiнки системи за ii передiсторiею. Вибiр архiтектури нейронноi мережi обумовлюеться специфiкою i складш-стю розв'язуваноi задачi.

Для прогнозування TS широко застосовуються архггектури рекуррентноi нейронноi мереж (recurrent neural network, RNN) i згоргковоi нейронноi мереж (convolutional neural network, CNN).

1дея RNN полягае в послiдовному використант iнформацii, тобто виконуеться одна й та ж задача для кожного елемента послщовносп, причому вих1д залежить вщ попереднiх обчислень. На вiдмiну вiд iнших алгоритмiв машинного навчання, рекурентт нейроннi мереж1 з довгою короткочасною пам'яттю (long short-term memory, LSTM) здатнi автоматично виявляти ознаки з тимчасових послiдовностей, обробляти багатовишрш данi, а також виводити послщовносп змiнноi довжини, завдяки чому ik можна використовувати для прогнозування [5].

Одшею з найвiдомiших архтектур е згорткова. CNN широко застосовуеться для ефек-тивного розпiзнавання зображень. Ii' особливють полягае в використанш згорткових i пулiн-гових шарiв. Згортковий шар нейронноi мережi являе собою застосування операцii згортки до виходiв з попереднього шару, де ваги ядра згортки е навчальними параметрами. Ядро являе собою фшьтр, який ковзае по вихщнш матрищ i знаходить певнi ознаки об'екпв. Операцiя пулiнг на результатах згортки - перетворення цiеi множини результата в меншу кiлькiсть елементiв. Типова CNN мае кшька згорткових i пулiнгових шарiв, розташованих послiдовно. Для класифшацп i прогнозування часових рядiв застосовуються одномiрнi CNN.

У багатьох сучасних публiкацiях увага придiляеться методам, для яких характернi висока точшсть i масштабованiсть. Одним з таких метсдав е InceptionTime, представлений у грудш 2020 року, який демонструе високу швидк1сть навчання для часових рядiв за дек1лькома ознаками.

Модель InceptionTime - ансамбль 5 моделей глибоких згорткових нейронних мереж, на осжш архггектури Inception-v4. Кожна модель створюеться шляхом каскадування декшькох модушв Inception [6]. Основна щея модуля Inception - одночасне застосування декiлькох фiльтрiв до видного часового ряду. Модуль включае фiльтри рiзноl довжини, яю дозволяють мереж автоматично отримувати вiдповiднi характеристики як з довгих, так i з коротких часових рядiв [7]. Фактично, отримано мережi з фiльтрами бiльшого розмiру, нiж у тих, що будь-коли дослщжувалися для задач комп'ютерного зору, безпосередньо використовуючи той факт, що часовi ряди демонструють на один вимр менше, шж зображення. За даними авторiв, InceptionTime за рiвнем точностi вiдповiдае HIVE-COTE та бшьш масштабована: модель може навчатись на 1500 часових рядах за одну годину, що повтстю недоступно для HIVE-COTE [7].

Архтектура моделi InceptionTime представлена 2 блоками, кожен складаеться з 3 модулiв Inception, розмщених один за одним. Вхiд кожного блоку передаеться за допомо-гою лiнiйного з'еднання, щоб подати його на вхщ наступного блоку, таким чином пом'якшу-ючи проблему зникнення градiента, дозволяючи прямий потiк градiента [8]. Пiсля блокiв Inception застосовуеть-ся шар глобального об-'еднання (global average pooling, GAP), який усе-реднюе вихвдш багато-вимiрнi часовi ряди за весь часовий вимiр. Завершуе модель тра-дицiйний повнiстю зв'я-заний шар softmax iз кiлькiстю нейрошв, рiвною кiлькостi класiв у наборi даних. Схематично архiтектуру мо-делi InceptionTime представлено на рис. 1.

Зважаючи на переваги моделi InceptionTime, доцiльно застосувати li для виршення поставлено! задачi та дослщити точнiсть моделi в залежносп вiд використовуваних ознак часового ряду.

Дослщження реалiзовано за допомогою високорiвневоl мови програмування Python з використанням бiблiотеки tsai, орiентованоl на сучасш методи класифшацп, регресп та прогнозування часових рядiв. Вхiднi данi отримуемо з офiцiйного сайту РНБО за допомогою API. Нормалiзацiя вхiдних даних проведена в iнтервалi вiд 0 до 1. Цшьовий параметр прогнозування - прирют активних випадкiв. Точшсть прогнозування оцiнюеться середньою абсолютною похибкою (mean absolute error, MAE), середньою абсолютною похибкою у вiдсотках (mean absolute percentage error, MAPE), середньоквадратичною похибкою (mean squared error, MSE) та квадратного кореня з середньоквадратичною похибки (root-mean square error, RMSE).

В результат проведено 30 екс-перименпв навчання моделi з рiзним набором ознак: кiлькiсть активних випадюв, прирiст активних випадюв, кiлькiсть шдтверджених випадкiв, прирiст пiдтверджених випадкiв, кшьюсть смертельних випадкiв. Ча-сове вшно - 56 днiв, горизонт прогнозування - 14 дшв. Час навчання та кшьюсть епох навчання для кожного експерименту представлеш на рис. 2.

Отже, навт при максимальнш кiлькостi епох, час навчання не пе-ревищуе 6 хвилин 29 секунд, що

Рис. 2. Час та кшьшсть епох навчання модел

шдтверджуе швидкод!ю модел! InceptionTime.

Значення показник!в точност! роботи модел! представлено на рис. 3-6.

Рис. 3. Значення MAE для 30 експерименпв

Рис. 4. Значення MSE для 30 експерименпв

Рис. 5. Значення RMSE для 30 експерименпв

Рис. 6. Значення MAPE для 30 експерименпв

Досл!дження модел! InceptionTime демонструе ст!йк!сть результату, за винятком експе-рименту N° 19. Параметри експерименту N° 19 повторен! у експериментах № 20 та № 21 для перев!рки роботоспроможност! модел! для даних ознак. Отриман! результати в!дпов!дають загальн!й картин! i вказують на техн!чну помилку навчання.

3. Висмовки

Застосування модел! InceptionTime для задач! прогнозування поширення захворюваност! на COVID-19 в Укра!н! ц!лком можливе. Серед переваг дано! модел! варто в!дм!тити високу швидк!сть навчання та одночасну роботу з дек!лькома часовими рядами, що можливо застосувати для прогнозування показник!в по кожному рег!ону окремо.

Отримаш результати значень похибки демонструють високу точн!сть роботи модел! для навчально! виб!рки, де середньоквадратична похибка не перевищуе 0,014, а середня абсолютна похибка - 13,6%.

Подальш! досл!дження мають на мет! пошук найефективн!ших моделей на основ! ней-ронних мереж та серед статистичних моделей. На раз! розглядаються модел! CNN ResNet, FCNPlus, ResCNN, RNN_FCNPlus, LSTM_FCNPlus. Кращ! модел! плануеться об'еднати в ансамбль для отримання оптимального прогнозу.

Список лгтератури: 1. Андрусенко Ю. О. Анатз основних моделей прогнозування часових ряда. // Зб!рник наукових праць ХНУПС. 2020. №3(). С. 91-96. 2. Бокс Дж., ДженкинсГ. Анализ временных рядов. Прогноз и управление: М. Мир,1974. 406 с. 3. Bishop C.M. Neural Networks for Pattern Recognition. Oxford University Press, 2014. 482 p. 4.Хайкин С. Нейронные сети. Полный курс. М: Вильямс, 2006. 1104 с. 5. Wei, J., Nan, Z., Xiaoming, X. and Yanhe, X. Intelligent Deep Learning Method for Forecasting the Health Evolution Trend of Aero-Engine With Dispersion Entropy-Based Multi-Scale Series Aggregation and LSTM Neural Network. // IEEE Access, 2020. 34350-34361 pp. 6. Szegedy C, Liu W, Jia Y, SermanetP, ReedS, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A. Going deeper with convolutions. // In: Proceedings of the IEEE conference on computer vision and pattern recognition. 2015. 1-9 pp. 7. Hassan IsmailFawaz, Benjamin Lucas, Germain Forestier. InceptionTime: Finding AlexNet for Time Series Classificatio. // Data Mining and Knowledge Discovery. 2020. Vol. 34, 1936-1962

pp. 8. He K, Zhang X, Ren S, Sun J. Deep residual learning for image recognition. // In: IEEE Conference on Computer Vision and Pattern Recognition, 2016. 770-778 pp.

Над1йшла до редколегИ' 14.05.2021

Ситшков Дмитро Едуардович, кандидат техтчних наук, доцент, професор кафедри систе-мотехшки ХНУРЕ. Науковi штереси: Data Mining and Knowledge Discovery. Адреса: Укра1-на, 61166, м. Харюв, пр. Науки 14, тел. (057) 702 10 06.

Андрусенко Юлiя Олександрiвна, астрантка кафедри електронних обчислювальних машин ХНУРЕ. Науковi iнтереси: методи прогнозування часових р.вдв. Адреса: Украша, 61166, м. Харюв, пр. Науки 14, тел. +38 (063) 407 06 09.

УДК 004.4 DOI: 10.30837/0135-1710.2021.177.047

Н.С. КРАВЕЦЬ

ВИЗНАЧЕННЯ ОБМЕЖЕНЬ РЕАЛ1ЗАЦП ОБРОБКИ ПОД1Й В ХМАРНОМУ ДОДАТКУ ЗА ДОПОМОГОЮ БЕЗСЕРВЕРНИХ ОБЧИСЛЕНЬ

У статп розглядаються безсерверш обчислення як нова i перспективна парадигма для розгортання хмарних додаткiв, зокрема таких що мають подiево-орiентовану архiтектуру. Платформи FaaS провiдних постачальникiв хмарних послуг е найсучастшою реалiзацiею безсерверно1 моделi. На основi порiвняння характеристик та перел^ джерел оброблюва-них подiй платформ FaaS ввд Amazon i Azure визначено переваги та обмеження використан-ня цiеi моделi для реалiзацii високопродуктивних систем, що обробляють поди в режимi реального часу.

1. Вступ

У тепершнш час розробникам все часпше доводиться вирiшувати проблеми, пов'язанi iз обробкою в реальному чаш потоку рiзноманiтних подiй, що надходять з рiзних джерел i вимагають рiзноi обробки. Подiбнi проблеми покликана виршувати подiево-орiентована архiтектура. Для виршення проблем використовуються: асинхронна обробка подш, черги рiзних типiв, мехашзм пiдписки на подп тощо. Хмарш провайдери пропонують значну кiлькiсть ршень на базi сво"х платформ, як також припускають використання безсерверних обчислень.

Безсерверш обчислення - це новий шдхщ, який концептуально ще бшьше дистанщюе програмне забезпечення вiд шфраструктури, на якiй воно виконуеться. Цей рiвень абст-ракцп iстотно полегшуе життя розробникам, дозволяючи зосередитися тшьки на реалiзацii конкретних функцiй. Хоча для реалiзацii безсерверних обчислень ^ента використовуються фiзичнi сервери, розробникам не потрiбно думати про !х конф^уращю, характеристики та обслуговування. Компанiя, що користуеться послугами безсерверного постачальника, по факту сплачуе за використовуваш ресурси i не повинна резервувати i оплачувати фiксовану пропускну здатнiсть або кшьюсть серверiв, оскiльки послуга автоматично масштабуеться.

У багатьох хмарних провайдерiв, що пропонують безсерверш обчислення як послугу, е платформи Function-as-a-Service (FaaS), яю дозволяють створювати проси функцп, якi незалежно запускаються при настанш яко!сь подii i виконують одну задачу. За допомогою FaaS розробники можуть створювати модульну архтектуру, роблячи код бшьш масштабо-ваним, не витрачаючи ресурси на тдтримку бекенда. Основними перевагами безсерверних обчислень е низью експлуатацшш витрати i ефективне управлшня та використання ресурсiв. На тепершнш час безсервернi обчислення пропонуються декiлькома постачальниками загальнодоступних хмарних сервюв. Безсервернi обчислення активно розвиваються, а !х реалiзацii вiд рiзних хмарних провайдерiв мають iстотнi вiдмiнностi, аналiз яких е метою дано^' статп. AWS Microsoft i Azure на даний момент е лщерами ринку хмарних послуг, порiвняемо можливостi !х платформ FaaS з точки зору обробки подiй.

i Надоели баннеры? Вы всегда можете отключить рекламу.