Научная статья на тему 'Алгоритм прогнозування результатів футбольних матчів на основі нейронних мереж'

Алгоритм прогнозування результатів футбольних матчів на основі нейронних мереж Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
503
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейромережа / багатошаровий перцептрон / алгоритм навчання / обернене розповсюдження похибки / neural networks / multilayer perceptron / learning algorithm / backpropagation

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулик Владимир Михайлович, Коротєєва Тетяна Олександрівна

Досліджено використання одного із способів машинного навчання, а саме нейронної мережі у прогнозуванні результатів спортивних подій. На цей час сфера машинного навчання перебуває на піку інтересу серед широкого загалу і використовується у вирішенні великого спектра проблем сучасного світу. Серед основних переваг і одночасно причиною, яка стала основною у виборі способу вирішення поставленої проблеми, є можливість застосування нейронних мереж для вирішення задач, в яких не простежується чіткий алгоритм розв'язання. На основі зібраних даних про архітектури та способи застосування різних типів нейронних мереж, алгоритмів навчання, а також і загалом методів, які можуть бути використані для вирішення проблем прогнозування, досліджено та розроблено алгоритм прогнозування. Враховуючи відсутність у відкритому доступі схожих засобів для прогнозування результатів спортивних подій, оцінку алгоритму проведено за допомогою порівняння точності прогнозування з іншими алгоритмами прогнозування, які не передбачають використання нейронних мереж. Таке тестування здійснено на основі загальнодоступного набору даних, отриманого з відкритих джерел.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM OF THE FOOTBALL MATCH RESULT PREDICTION ON THE BASIS OF NEURAL NETWORKS

The authors present the research of using one of the approaches of machine learning called neural network in predicting sporting events results. At the moment, the field of machine learning is at the peak of interest among the general public and is used in solving a large aspect of the problems of the modern world. One of the main reasons for neural networks and machine learning to be very popular today, is the availability of computer resources for everyone, which gave the opportunity to use them for almost everybody who needs to solve their problems, not spending a huge amount of money on the resources for neural networks specifically. Among the main advantages and at the same time the reason, that has become the main one in choosing the method of solving the posed problem is the possibility of using neural networks to solve problems in which there is no clear algorithm provided. Another area that has been in the lead for several years now is the bookmaking industry, which popularity is only growing. This is especially evident concerning the most popular kind of sport in the world – football. This situation was partly caused because of computerization which today allows almost every computer user make a bet remotely any time they wish, even during the sport match. Based on the collected data about architecture and methods of using various types of neural networks, as well as in general methods that can be used to solve prediction problems, research was conducted and prediction algorithm was developed. The authors have explained the lack of similar tools in the open access to predict the results of sporting events; the evaluation of the algorithm was carried out by comparing accuracy with other forecasting algorithms that do not involve the use of neural networks. Such testing was carried out on the basis of a publicly available data set obtained from open sources.

Текст научной работы на тему «Алгоритм прогнозування результатів футбольних матчів на основі нейронних мереж»

НЛТУ

УКРЛ1НИ

Hl/IUB

Науковий BicHMK НЛТУ УкраТни Scientific Bulletin of UNFU

http://nv.nltu.edu.ua https://doi.org/10.15421/40270924 Article received 16.11.2017 р. Article accepted 28.11.2017 р.

УДК 004.021

ISSN 1994-7836 (print) ISSN 2519-2477 (online)

Ш EE3 Correspondence author T. O. Korotyeyeva [email protected]

Нацюнальний утверситет

В. М. Кулик, Т. О. Коротеева

"Львiвська полтехшка"м. Львiв, Украта

АЛГОРИТМ ПРОГНОЗУВАННЯ РЕЗУЛЬТАТ1В ФУТБОЛЬНИХ МАТЧ1В

НА ОСНОВ1 НЕЙРОННИХ МЕРЕЖ

Дослщжено використання одного iз способiв машинного навчання, а саме нейронно! мережi у прогнозуваннi результат^ спортивних подiй. На цей час сфера машинного навчання перебувае на тку штересу серед широкого загалу i використо-вуеться у виршенш великого спектра проблем сучасного свгту. Серед основних переваг i одночасно причиною, яка стала основною у виборi способу виршення поставлено! проблеми, е можливiсть застосування нейронних мереж для виршення задач, в яких не простежуеться чiткий алгоритм розв'язання. На основi зiбраних даних про архггектури та способи застосування рiзних типiв нейронних мереж, алгоршмв навчання, а також i загалом методiв, якi можуть бути використаш для вирь шення проблем прогнозування, дослiджено та розроблено алгоритм прогнозування. Враховуючи вiдсутнiсть у в^ритому доступ схожих засобiв для прогнозування результата спортивних подiй, оцiнку алгоритму проведено за допомогою пор!в-няння точноста прогнозування з iншими алгоритмами прогнозування, яю не передбачають використання нейронних мереж. Таке тестування здiйснено на основi загальнодоступного набору даних, отриманого з вiдкритих джерел.

Ключовi слова: нейромережа; багатошаровий перцептрон; алгоритм навчання; обернене розповсюдження похибки.

Вступ. 1з стрiмким розвитком техшчно! частини комп'ютерiв вiдкриваються дедалi новi можливостi для розв'язання рiзноманiтних задач, як1 було неможливо розв'язати ранiше, беручи до уваги недостатню обчис-лювальну потужшстъ. Недарма популярнiсть машинного навчання, i особливо нейронних мереж, досягнула свого тку зовам недавно, адже алгоритми машинного навчання були описаш давнiше, нiж !хне використання стало достатньо ефективним навггь для комп'ютерiв, як1 може дозволити собi практично кожна людина. Машин-не навчання е надзвичайно перспективною галуззю, зокрема з використанням нейронних мереж ^огЬап & Rossiev, 1996).

Ще одшею сферою, яка на ввдмшу вщ машинного навчання, користуеться популярнiстю вже багато рошв, е сфера беттингу. Незважаючи на свое довге юнування i доступнiсть, статистика показуе щорiчне зростання по-пулярностi ще! сфери, що змушуе 11 розвиватись i з кожним роком використовувати новi пiдходи та методи для заохочення щораз бшьшо! категори осiб.

Беручи до уваги постшну популярнiсть ще! сфери та iснування на ринку багатьох букмекерських контор, можна зробити висновок про вщсутшсть на цей час алгоритму, який зм^ би зi стовiдсотковою точнiстю роби-ти прогнози ввдносно спортивних подш, як1 вщбудуть-ся. Такий алгоритм навряд чи буде створено, адже на результат спортивного матчу впливае надзвичайно велика шльшсть факторiв, багато iз яких не пiддаються прогнозуванню. Незважаючи на це, чимало проввдних

унiверситетiв у свiтi розробляють алгоритм, який мав би високу точшсть передбачення. Отже, сама спортивна подiя, наприклад футбольний матч, а точшше його результат, е результатом збйу багатьох факторiв, кожен з яких мае рiзнi ступенi впливу. Вiдсутнiсть очевидних зв'язк1в м1ж факторами впливу робить неможливим сто-вщсоткове прогнозування результату експертами, як1 базуються на власних лопчних висновках.

У цш роботi дослiджено алгоритм прогнозування результапв футбольних матчiв на основi нейронних мереж. Для коректно! роботи алгоритму спочатку потр!6-но провести "тренування" нейронно! мереж1, а шзшше здiйснювати його тестування ^аМяЪкт, 2000). Для тренування нейронно! мереж! було вщбрано та вико-ристано рiзноманiтнi фактори, як1 формують результат спортивного матчу. За результатами тренування нейронно! мереж!, можна застосувати алгоритм на вь дiбранiй вибiрцi даних i зробити висновки про його ефектившсть.

Отже, основним дослiдженням ще! роботи е ефек-тивнiсть використання нейронно! мереж! для прогнозування результапв футбольних матчiв, на основi вщбра-них загальнодоступних факторiв. Метою е визначення якостi прогнозування на основi нейронно! мереж! та ви-користання розробленого алгоритму для розроблення програмного засобу.

Матерiали та методи дослщження. Незважаючи на принцип роботи нейронно! мережц iснуе велика шльшсть шдход!в до !! реалiзацi!, варiантiв архiтектури та

1нформащя про aBTopiB:

Кулик Владимир Михайлович, MaricTpaHT кафедри програмного забезпечення. Email: [email protected] Коротеева Тетяна Олексaндрiвнa, канд. техн. наук, доцент кафедри програмного забезпечення.

Email: [email protected] Цитування за ДСТУ: Кулик В. М., Коротеева Т. О. Алгоритм прогнозування результат футбольних матчiв на основi нейронних

мереж. Науковий вкник НЛТУ УкраТни. 2017. Вип. 27(9). С. 111-114. Citation APA: Kulyk, V. M., & Korotyeyeva, T. O. (2017). Algorithm of the Football Match Result Prediction on the Basis of Neural Networks. Scientific Bulletin of UNFU, 27(9), 111-114. https://doi.org/10.15421/40270924

алгоршадв навчання (Adams, 2017). Однi нейронш мереж! простiшi для реатзацд, iншi е не тiльки складними у реал!задп, але й передбачають наявнiсть значних ре-сурав для навчання. Ц твердження також можна засто-сувати i до алгоритшв навчання нейронних мереж. Проаналiзyвавши лггературу, можна зробити висновок про високу ефектившсть нейронно! мереж! прямого по-ширення, а також те, що складисть !! реал!задп е задо-вшьною, пор!вняно з шшими архитектурами нейронних мереж (Kruglov & Borisov, 2001).

Нейронна мережа прямого поширення е одшею з найпопуляршших архитектур нейронних мереж не пльки через складасть свое! реал1зади, але й продуктившсть та ефектившсть свое! роботи (Badde, Gupta & Patki, 2009). Найбшьшою ввдшншстю цього типу нейронних мереж е те, що 11 складники не формують циклу, на ввдмшу вщ рекурентних нейронних мереж, для прикладу.

У нейроннш мереж! прямого поширення нейрон от-римуе дан! вщ !нших нейрошв, як ввдносно нього зна-ходяться на р!вш вище, i передае результат на р!вень нижче. Отже, зпдно з назвою нейронно! мереж!, шфор-мащя в нш мае тшьки один шлях поширення, а саме вщ входу до виходу, проходячи при цьому через ва прихо-ваш шари нейронно! мереж!.

Формування результату в цш нейроннш мереж! е стандартним тдходом, коли шформащя передаеться через синапси з певними вагами в нейрони, як! сумують отриман! результати ! застосовують до отриманих да-них функдш активацп (передавальна функд!я) (Liubun, 2006). Такий процес е незмшним та вщбуваеться кр!зь ус! приховаш шари нейронно! мереж!.

Як зазначено вище, нейронна мережа м!стить приховаш шари. Прихованими вважають шари нейронно! мереж!, як! розм!щен! м!ж вх!дним та вих!дним шарами. Приховаш шари, а саме !хня шльшсть, е одним з вирь шальних фактор!в ефективносп нейронно! мереж!, яш мають безпосередн!й вплив на точн!сть результату (Ko-honen, 2013). Чим бшьше прихованих шар!в, тим вимог-лив!ша до ресурс!в нейронна мережа. Тому ефективною нейронною мережею можна назвати таку, в як!й правильно п!д!брана низка фактор!в, враховуючи к!льк!сть прихованих шар!в.

Значний вплив на точшсть результату нейронно! мереж! мае також ! обраний алгоритм !! тренування. Тре-нування е ключовим етапом у створенн! нейронно! мереж!, який в!дбуваеться безпосередньо п!сля !! реал!за-ц!!. Зважаючи на к!льк!сть тип!в нейронних мереж, ал-горитшв !х навчання е також шлька. Базовий принцип навчання нейронно! мереж! е по сут! корегування ваг на синапсах для м!н!м!зац!! похибки, якою е р!зниця м!ж результатом, отриманим на виход! нейронно! мереж!, та еталонними даними.

П!сля ретельного анал!зу л!тератури, алгоритмом, який використано для тренування нейронно! мереж!, обрано метод оберненого розповсюдження похибки (Hryhorkiv, Yaroshenko & Filipchuk, 2012). Такий метод е !теративним град!ентним алгоритмом, принцип робо-ти якого заснований на передаванн! сигнал!в похибки в!д виход!в нейронно! мереж! до !! вход!в. Цей метод навчання нейронно! мереж! е один !з найпопулярн!ших та найпродуктивн!ших серед описаних.

Тренування в!дбуваеться на еталонн!й виб!рц! да-них, як! в цьому раз! представлен! факторами, що без-

посередньо впливають на формування результату футбольного матчу. Для забезпечення необхщно! продук-тивност! та ефективност! тренування нейронно! мереж! проведено детальний анал!з фактор!в та обрано 12 з них, як1 мають максимальний вплив та яш доцшьно включити у виб!рку.

Оск!льки в цьому раз! нев!домою е оптимальна к!ль-к!сть прихованих шар!в, було прийнято р!шення реал!-зувати нейронн! мереж! з двома та чотирма приховани-ми шарами в!дпов!дно, для експериментального пор!в-няння ефективност! роботи таких нейронних мереж.

Результата дослщження та ix обговорення. Нейронна мережа була реал!зована за допомогою мови програмування Python, зважаючи на !! популярн!сть, достатню продуктившсть та вбудований функцюнал. У реал!зацп було застосовано б!блютеку NumPy, яка дала змогу використати необх!дн! математичн! функц!! та за-безпечила п!дтримку великих багатовим!рних масив!в.

Для оц!нки роботи нейронних мереж обрано матч!, результати яких були заздалег!дь в!домими, тобто як! на час тестування вже в!дбулись. Однаковий наб!р тес-тових даних застосовували до обох нейронних мереж для пор!вняння результат!в !хньо! роботи.

Серед результапв матав, як! обрали для тренування нейронно! мереж!, як вже описано вище, були лише т!, як! мають значний вплив на формування результату футбольного матчу, отже, серед них можна видшити таю:

• статистика останшх п'яти матав кожно! з команд;

• статистика зустр!чей поточних команд;

• статистика !гор вдома команди, яка приймае зустр!ч;

• статистика !гор в гостях команди, яка грае на втзд!.

Ц! фактори ув!йшли до групи тих, як! мають найбшьший вплив. Для прикладу, одним з основним фактор!в, в!д якого можна в!дштовхуватись п!д час складання прогнозу, е саме форма команди, а вона виз-начаеться, зазвичай, за статистикою останшх п'яти !гор команди, тому цей фактор ! потрапив до групи з найб!льшим впливом, !нш! фактори по аналог!!. Отже, максимальний ефект оч!куеться саме використовуючи д фактори. Але е також ! так1, яш мають значно мен-ший вплив на формування результату, серед них:

• погода, тд час яко! вщбуваеться матч;

• перюд дня, коли саме вщбуваеться матч;

• туршрне положення;

• статистика стосовно фол!в, штрафних, кутових.

Щоб оцшити доцшьшсть та правильшсть шдбору параметр!в для тренування нейронно! мереж!, а також перев!рити !х вплив на формування результату на прак-тиц!, було вир!шено застосувати обидв! виб!рки факто-р!в ! пор!вняти !х.

Отже, п!сля формування двох тестових груп, як! складаються !з вс!х фактор!в впливу та в!дпов!дно з тих, як! було в!днесено до групи фактор!в з найб!льшим впливом, наступним етапом став етап тренування нейронно! мереж!, результатом якого стала натренована нейронна мережа, готова для зд!йснення прогноз!в в!д-носно представлених вхвдних даних.

На рис. зображено процес тренування нейронно! мереж! Зм!нш "Epoch" та "Error" вщповвдають за число пройдених !терац!й та похибку в!дпов!дно. З кожною !терац!ею тренування, похибка зменшуеться, що св!д-чить про усп!шн!сть процесу тренування.

Я Winnows Pentrtimi - ~ X

1141 ЕГТОГ 1) 49685512378;

Epoch 1144 Error 0.496608986177;

Epoch 1145 Error 0.496397610571;

Epoch 1146 ЕГГОГ 0.496270163895;

Epoch 114? ЕГГОГ 0 496188344164;

Epoch 1148 ЕГГОГ 0.496166811316;

Epoch 1149 Error 0.496135998734;

Epoch 1150 Error 0.496099992031;

Epoch 1151 Error 0.496055612916;

Epoch 1152 Error 0.495984064596;

Epoch 1153 Error 0.495940883582;

Epoch 1154 Error 0.495870079406;

Epoch 1155 ЕГГОГ 0.495771676559;

Epoch 1156 ЕГГОГ 0.495713701557;

Epoch 115? Error 0.495665027042;

Epoch 1158 ЕГГОГ 0.495623260488;

Epoch 1159 Error 0.495560964156;

Epoch 1160 Error 0.495467634378;

Epoch 1161 Error 0.495370918381;

Epoch 1162 Error 0.495290438732;

Epoch 1163 Error 0.495187384955;

Epoch 1164 Error 0.495107194614;

Epoch 1165 Error 0.495020945441;

Epoch 1166 Error 0.49499918828;

Epoch 1167 Error 0.494967743204;

Epoch 1168 Error 0.49494378072;

Epoch 1169 Error 0.49492956351;

Epoch 1170 Error 0.494909048254;

Рис. Процес тренування нейронно! мережi

Табл. Точшсть прогнозування нейронних мереж

Кшьюсть прихованих шар!в Кшьюсть фактор!в Ввдсоток точноста передбачення

2 12 52,45 %

2 20 55,06 %

4 12 63,41 %

4 20 67,25 %

Зпдно з даними табл., можна зробити висновок, що найкраще себе показала нейронна мережа з чотирма прихованими шарами та 20 факторами, яка отримала результат точносп передбачення 67,25 %. Нейронна мережа, яка складаеться iз двох прихованих шарiв, показала ввдчутно гiрший результат, який становив 55,06 % у разi застосування 20 фага^в.

Незважаючи на те, що рiзниця в кiлькостi факторiв е великою, результат, отриманий з використанням рiзно! кiлькостi факторiв, показав, що вщбрат фактори ма-ють значно бiльший вплив на формування результату, тому рештою факторiв можна нехтувати у раз^ якщо фактор продуктивносп е критичним.

Обговорення отриманих результат. Дослвдивши алгоритми, як1 також використовують для прогнозування результапв спортивних матчiв i отримавши точнiсть розробленого алгоритму вщ 52^до 67 %, можна зробити висновок, що алгоритм проявив себе позитивно i може бути використаний в подальшому для створення iнших програмних засобiв, задачею яких е прогнозування.

Покращити точшсть прогнозу алгоритму можна зас-тосувавши бiльшу к1льк1сть прихованих шарiв нейронно! мереж1, про що сввдчить стрiмке зростання точностi результату прогнозу зi збiльшенням числа прихованих

шарiв, але тодi i час тренування нейронно! мереж! зрос-те вщповвдно.

Висновок. Зважаючи на щор!чне збшьшення штере-су до сфери беттингу, а також надзвичайно малий асор-тимент програмного забезпечення який не тшьки допо-магав би защкавленим людям у здшсненш !хшх прог-ноз!в в!дносно конкретних матав, але й спещал!стам, думц! яких дов!ряють багато шших людей i як! займа-ються цим професюнально, можна зробити висновок, що цей алгоритм може бути використано для покра-щення ше! ситуацп шляхом створення на його основ! р!зномаштних програмних засоб!в прогнозування ре-зультапв матч!в.

Беручи до уваги шш! алгоритми, задачею яких е прогнозування результапв матав, цей алгоритм не ви-р!зняеться своею точшстю, натомють вш мае великий потенщал розвитку, беручи до уваги можливють його модифшацп, наприклад, використавши бшьшу кшьюсть прихованих шар!в для тдвищення точносп результату.

Перелiк використаних джерел

Adams, T. (2017). Training an artificial neural network. Retrieved from: https://www.solver.com/training-artificial-neural-ne1work-intro.

Badde, S., Gupta, A., & Patki, K. (2009). Cascade and Feed Forward Back propagation Artificial Neural Network Models for Prediction of Compressive Strength of Ready Mix Concrete. Second International Conference on Emerging Trends in Engineering (SICETE). Retrieved from: http://www.iosrjournals.org/iosr-imce/papers/sice-te(civil)-volume3/26.pdf Galushkin, A. I. (2000). Teoriia neironnykh setei. Moscow: IPRZhR.

415 p. [in Russian]. Gorban, A. N., & Rossiev, D. A. (1996). Neironnye seti na personal-

nom kompiutere. Novosibirsk: Nauka. 276 p. [in Russian]. Hryhorkiv, V. S., Yaroshenko, O. I., & Filipchuk, N. V. (2012). Ne-ironni merezhi ta yikh vykorystannia dlia prohnozuvannia ten-dentsii rynku nerukhomosti [Neural_networks_and_their application for real estate market trends forecasting]. Scientific Bulletin of UN-FU, 22(5), 324-330. Kohonen, T. (2013). Essentials of the self-organizing map. Neural

Networks, 37, 52-65. https://doi.org/10.1016/i.neunet.2012.09.018 Kruglov, V. V., & Borisov, V. V. (2001). Iskusstvennye neironnye seti: teoriia ipraktika. Moscow: Goriachaia liniia-Telekom. 382 p. [in Russian].

Liubun, Z. M. (2006). Osnovy teorii neiromerezh. Lviv: Vyd. tsentr LNU im. Ivana Franka. 140 p. [in Ukrainian].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В. М. Кулик Т. А. Коротеева

Национальный университет "Львовская политехника", г. Львов, Украина

АЛГОРИТМ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ ФУТБОЛЬНЫХ МАТЧЕЙ

НА ОСНОВАНИИ НЕЙРОННЫХ СЕТЕЙ

Исследовано использование одного из способов машинного обучения, а именно нейронной сети в прогнозировании результатов спортивных событий. В данный момент сфера машинного обучения находится на пике интереса среди широкой общественности и используется в решении большого спектра проблем современного мира. Среди основных преимуществ и одновременно причиной, которая стала основной в выборе способа решения поставленной проблемы, является возможность применения нейронных сетей для решения задач, в которых не видно четкого алгоритма решения проблемы. На основе собранных данных об архитектуре и способах применения различных типов нейронных сетей, алгоритмов обучения, а также методов, которые могут быть использованы для решения проблем прогнозирования, проведено исследование и разработка алгоритма прогнозирования. Учитывая отсутствие в открытом доступе похожих средств для прогнозирования результатов спортивных событий, оценка алгоритма проведена с помощью сравнения точности с другими алгоритмами прогнозирования, которые не предусматривают использования нейронных сетей. Такое тестирование осуществлено на основе общедоступного набора данных, полученного из открытых источников.

Ключевые слова: нейросети; многослойный перцептрон; алгоритм обучения; обратное распространение ошибки.

V. M. Kulyk, T. O. Korotyeyeva

Lviv Polytechnic National University, Lviv, Ukraine

ALGORITHM OF THE FOOTBALL MATCH RESULT PREDICTION

ON THE BASIS OF NEURAL NETWORKS

The authors present the research of using one of the approaches of machine learning called neural network in predicting sporting events results. At the moment, the field of machine learning is at the peak of interest among the general public and is used in solving a large aspect of the problems of the modern world. One of the main reasons for neural networks and machine learning to be very popular today, is the availability of computer resources for everyone, which gave the opportunity to use them for almost everybody who needs to solve their problems, not spending a huge amount of money on the resources for neural networks specifically. Among the main advantages and at the same time the reason, that has become the main one in choosing the method of solving the posed problem is the possibility of using neural networks to solve problems in which there is no clear algorithm provided. Another area that has been in the lead for several years now is the bookmaking industry, which popularity is only growing. This is especially evident concerning the most popular kind of sport in the world - football. This situation was partly caused because of computerization which today allows almost every computer user make a bet remotely any time they wish, even during the sport match. Based on the collected data about architecture and methods of using various types of neural networks, as well as in general methods that can be used to solve prediction problems, research was conducted and prediction algorithm was developed. The authors have explained the lack of similar tools in the open access to predict the results of sporting events; the evaluation of the algorithm was carried out by comparing accuracy with other forecasting algorithms that do not involve the use of neural networks. Such testing was carried out on the basis of a publicly available data set obtained from open sources.

Keywords: neural networks; multilayer perceptron; learning algorithm; backpropagation.

i Надоели баннеры? Вы всегда можете отключить рекламу.