Научная статья на тему 'ПРОГНОЗУВАННЯ КУРСіВ АКЦіЙ НА ОСНОВі ДАНИХ іЗ СОЦіАЛЬНИХ МЕРЕЖ'

ПРОГНОЗУВАННЯ КУРСіВ АКЦіЙ НА ОСНОВі ДАНИХ іЗ СОЦіАЛЬНИХ МЕРЕЖ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
171
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Бизнес Информ
Область наук
Ключевые слова
ПРОГНОЗУВАННЯ КУРСіВ АКЦіЙ / ДАНі СОЦіАЛЬНИХ МЕРЕЖ / АНАЛіЗ ТЕКСТОВИХ ДАНИХ / АНАЛіЗ СЕНТИМЕНТіВ / НОВИНИ В СОЦіАЛЬНИХ МЕРЕЖАХ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Чорноус Галина Олександрівна, Ярмоленко Юлія Артурівна

У статті досліджено можливість реалізації моделей машинного навчання для прогнозування курсів акцій іноземних компаній на основі даних із соціальних мереж. Оскільки традиційні засоби прогнозування є малоефективними в короткостроковому періоді, метою цієї роботи стало доведення зв’язку між текстовим контентом соціальних мереж стосовно діяльності компаній та динамікою відповідних їм фінансових інструментів на біржі. За допомогою інструментів обробки людської мови була досліджена емоційна складова повідомлень у мережі Twitter стосовно діяльності компанії Google впродовж одного тижня. Було показано, яким чином емоції можна перевести до кількісної ознаки та використати дану величину в динаміці для побудови математичної моделі коливань курсу акцій. Дана модель реалізована методом штучних нейронних мереж. Авторами встановлено, що на даний момент питання використання запропонованої методології для прогнозування курсів акцій українських компаній є неактуальним, проте схожий інструментарій аналізу текстових даних було б доречно використовувати для соціологічних, політичних та інших економічних досліджень.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПРОГНОЗУВАННЯ КУРСіВ АКЦіЙ НА ОСНОВі ДАНИХ іЗ СОЦіАЛЬНИХ МЕРЕЖ»

УДК 661.65

ПРОГНОЗУВАННЯ КУРС1В АКЦ1Й НА ОСНОВ! ДАНИХ 13 СОЦ1АЛЬНИХ МЕРЕЖ

© 2016

ЧОРНОУС Г. О., ЯРМОЛЕНКО Ю. А.

УДК 661.65

Чорноус Г. О., Ярмоленко Ю. А. Прогнозування курав акцiй на 0CH0Bi даних i3 соцiальних мереж

У статт'1 досл'джено можливкть реал1зацИмоделей машинного навчання для прогнозування курав акцй ноземних компанш на основi даних ¡з со-цальних мереж. Оскльки традицiйнi засоби прогнозування е малоефективними в короткостроковому пер'юЫ, метою u^iei роботи стало доведення зв'язкумiж текстовим контентом со^альнихмереж стосовно д'тльностi компанш та динамкою тдпов'дних iм ф'шансових 'тструмент'ю на брж1 За допомогою шструмент'в обробки людськоiмови була дотджена емоцшна складова повдомлень у мepeжi Twitter стосовно д'тльност'! компанИ Google впродовж одного тижня. Було показано, яким чином емоци можна перевести до кльк!сно1 ознаки та використати дану величину в динамц для побудови матeматичноiмодел1 коливань курсу акцш. Дана модель реал'вована методом штучних нейроннихмереж. Авторами встановлено, що на даний момент питання використання запpопонованоi методологи для прогнозування курав акцш укранських компанш е неактуальним, проте схожий 'тструментарш аналзу текстових даних було б доречно використовувати для соuiологiчних, полтичних та шших eкономiчних доМжень. Ключов'1 слова: прогнозування курсв акцй, дам со^альних мереж, анал'в текстових даних, анал'в сентимент'в, новини в со^альних мережах Рис.: 2. Табл.: 1. Ббл.: 24.

Чорноус Галина Олександрiвна - доктор економнних наук, доцент, доцент кафедри eкономiчноi юбернетики, Кивський нацональний ушверси-тет ¡м. Т. Шевченка (вул. Володимирська, 60, Кив, 01601, Украна) E-mail: [email protected]

Ярмоленко Юля Артурiвна- аспрантка, Кивський нацональний утверситет ¡м. Т. Шевченка (вул. Володимирська, 60, Кив, 01601, Украна) E-mail: [email protected]

УДК 661.65

Черноус Г. А., Ярмоленко Ю. А. Прогнозирование курсов акций на основе данных из социальных сетей

В статье исследована возможность реализации моделей машинного обучения для прогнозирования курсов акций иностранных компаний на основе данных из социальных сетей. Так как традиционные методы прогнозирования являются малоэффективными в краткосрочном периоде, целью этой работы стало доказательство связи между текстовым контентом социальных сетей касательно деятельности компаний и динамикой соответствующих им финансовых инструментов на бирже. С помощью инструментов обработки человеческой речи была исследована эмоциональная составляющая сообщений в сети Twitter касательно деятельности компании Google на протяжении одной недели. Было показано, каким образом эмоции можно перевести в количественную характеристику и использовать эту величину для построения математической модели колебаний курса акций. Данная модель реализована с помощью метода нейронных сетей. Авторы статьи пришли к выводу, что на данный момент вопрос использования предложенной методологии для прогнозирования курсов акций украинских компаний остается неактуальным, однако похожий инструментарий анализа текстовых данных было бы уместно использовать в социологических, политических и других экономических исследованиях. Ключевые слова: прогнозирование курсов акций, данные социальных сетей, анализ текстовых данных, анализ сантиментов, новости в социальных сетях. Рис.: 2. Табл.: 1. Библ.: 24.

Черноус Галина Александровна - доктор экономических наук, доцент, доцент кафедры экономической кибернетики, Киевский национальный университет им. Т. Шевченко (ул. Владимирская, 60, Киев, 01601, Украина) E-mail: [email protected]

Ярмоленко Юлия Артуровна - аспирантка, Киевский национальный университет им. Т. Шевченко (ул. Владимирская, 60, Киев, 01601, Украина) E-mail: [email protected]

UDC 661.65

Chornous G. O., larmolenko lu. A. Forecasting Stock Prices Based on the Data from Social Networking

The article explores the possibility of implementing models of computerassisted learning for the forecasting stock prices of foreign companies on the basis of data from social networking. Because the traditional forecasting methods are ineffective in the short term, the article is aimed at proving the available connection between the text-based content of social networking concerning activities of companies and dynamics of their respective financial tools at the exchange. Using the tools for processing human speech, the emotional component of messages on Twitter about Google company's activities for one week has been explored. It has been displayed how emotions can be transferred to the quantitative characteristics and how further this value can be used to build a mathematical model of fluctuations of the shares. This model has been implemented using the method of neural networks. The authors of the article have concluded that for the present moment the question about use of the proposed methodology to forecast stock prices of Ukrainian companies remains irrelevant, but similar text data analysis would be appropriate to carry out sociological, political and other economic studies. Keywords: forecasting stock prices, data from social networking, analysis of textual data, analysis of sentiments, news on social networking Fig.: 2. Tbl.: 1. Bibl.: 24.

Chornous Galyna O. - D. Sc. (Economics), Associate Professor, Associate Professor of the Department of Economic Cybernetics, Kyiv National University named after T. Shevchenko (60 Volodymyrska Str., Kyiv, 01601, Ukraine) E-mail: [email protected]. ua

larmolenko luliia A. - Postgraduate Student, Kyiv National University named after T. Shevchenko (60 Volodymyrska Str., Kyiv, 01601, Ukraine) E-mail: [email protected]

Бкьшкть моделей для прогнозування вартост1 цш фшансових шструмент1в використовують ю-торичт дат для виявлення законом1рностей ча-сових ряд1в, видкення так званих техтчних ф1гур на графжах 1 низку шших шдход1в, що дозволяють на осно-в1 ретроспективного анал1зу визначити подальш1 коли-вання цш. Зазвичай таю модел1 демонструють низьку ефектившсть, коли на ринку з'являеться нетрив1альна

iнформацiя, що може сколихнути «передбачуваний» сценарш руху вартост шструменту. Проте, як показуе практика, економiчнi гравщ, а, в^дпов^дно, i цши, е чут-ливими до важливих новин, що розповсюджуються рiз-ними медшними каналами.

Вцповцно до гшотези ефективного ринку вар-тксть щнного папера формуеться на основi вое! наявно! на ринку в певний момент часу шформаци про нього.

Виходячи з цього, спрогнозувати щну фшансового íh-струменту можливо, якщо npoaHaAÍ3yBa™ всю наявну про нього шформацш на ринку. Соцiальнi мережi е одним Í3 найповнiших джерел, що мiстять як об'ективнi факти (поди, що стосуються дiяльностi шдприемств), так i сyб'ективнi судження людей (ощнки цiеi само! дЬ-яльносп, вiдгyки про роботу компанiй тощо). Слiд за-значити, що, незалежно вiд того, достовiрною е деяка новина в мережi чи hí, вона все одно мае вплив на фор-мування вартосп, адже може бути помилково сприйня-та економíчними суб'ектами як правдива (особливо вц впливових джерел).

Таким чином, кнуе можливкть практично! ре-алíзащl прогностичних моделей курав акцш компанш, що використовували б не лише лопку минулих подш, яка мктиться в кторичних даних, а й найактуальншу шформацш про стан ринку. Ниншня ситyацíя у сферí шформащйних технологш та аналíзy даних сприяе цьому. По-перше, глобальна шформати-зацíя суспкьства призвела до того, що постшно гене-руеться величезна ккьюсть користувацького контенту, який можна i необх^дно аналíзyвати з метою виявлення суб'ективних настро!в людей та !хнк ощнок економíчноl реальность По-друге, найсучаснШ шструменти аналíзy текстових та шших тишв даних дозволяють в автоматичному режимí перетворити емощйш характеристики контенту в числовí показники. У данш статт буде показано, яким чином можна створити математичну модель для прогнозування курав акцш компанш на основí текстових повцомлень у сощальних мережах.

Проблемою розробки методологи та регшзаци моделей для прогнозування курав акцш займалися ана-лггики та науковщ рíзних азшських, американських та европейських шюл: O. Aising та O. Bahceci [1], P. D. Azar та A. W. Lo [2], F. Beer [3], A. Buche i M. B. Chandak [4], T. R. Burki [5], X. Li [6], Y. Lu [7], T. H. Nguyen [8], N. Oli-veira [9], T. Preis [10], T. Rao i S. Srivstava [11]. В УкраМ практично вцсутш вцповцш дослцження, за пошуко-вими запитами можна знайти лише згадки про навчаль-hí проекти в рамках курав з Machine Learning. Проте слц вцзначити значний вклад украшських дослцниюв та науковщв у теоретичне висвтлення шструментарш для обробки вцповцних даних та супутнк алгоршадв: застосування нейронних мереж для мошторингу стану ринку акцш (О. В. Шскун, Т. Г. Мщенко [12]), покращен-ня якост даних íз сощальних мереж (О. О. Слабченко, В. М. Сидоренко [13]), шструментарш Data Mining та Text Mining (Д. В. Ланде [14], Н. Б. Паклш [15], О. I. Черняк [16], О. Ю. Чубукова [17]).

Вперше проблема була розглянута на початку 2010-х роив, а за останш 5 роив рíзними дослцниками було протестовано низку mдходíв до попередньо! обробки даних i побудови вцповцних моделей. Для кращого розумшня того, яким чином розвивалася наукова гшоте-за, слц розглянути динамку дослцжень останнк роив та зазначити, до яких саме висновюв приходили автори згаданих робш У 2013 р. у робот [9] було визначено, що на основí динамки твтв (повцомлень у мережí Twitter) можна спрогнозувати обсяг торпв наступного дня.

У цьому ж рощ у стати [3] автор доводить, що оцшки впливових iHBecTOpiB, висловлен в сощальних мережах, деякою мiрою впливають на формування щн фiнансових iнструментiв. Досл^ження [10] того ж самого перюду вказуе на те, що динамка пошукових запитiв сильно корелюе з падшням i зростанням фiнансових ринюв. У статтi [11] показано, що за допомогою повiдомлень у сощальних мережах можна прогнозувати щни на золото, нафту, а традицшш багатофакторна модель шдексу DJIA може бути значно покращена при включены до аналiзу даних iз сощальних мереж. Можна побачити, як ще у 2013 р. рiзнi вчеш приходили до нетривiальних результа-тш при дослiдженнях соцiальних мереж.

Характерним стало те, що вже у 2014 р. студенти провцних техшчних вузiв зацiкавилися даною тематикою та подкилися результатами власних дослцжень. Так, у магiстерськiй роботi [5] автор показуе, яким чином можна комбшувати рiзноманiтнi економетричнi моделi з аналiзом даних соцiальних мереж для прогнозування курйв акцш. Тодi ж дослiдниками з Китаю [6] вперше опублковано статтю щодо прогнозування кур-сiв акцiй на основi аналiзу сентиментiв, застосованого до пов^омлень у мережi Twitter. За допомогою емшрич-но! перевiрки на кторичних даних було продемонстро-вано ефективнкть шести рiзних фiнансових моделей. У наступному, 2015 р. автор квалiфkащйноí роботи [1], о^м уже зазначених пiдходiв, застосовуе алгоритми машинного навчання до даних iз сощальних мереж. У робой [8] показано, як рiзнi методи аналiзу сентимен-тiв впливають на точнiсть прогнозу. Водночас автор [7] дослцжуе питання прогнозування курйв акцiй за по-вiдомленнями в соцiальних мережах у рамках рiзних галузей економiки та описуе характер руху спецiально розроблених «секторальних iндексiв настрою».

Oстаннi дослцження 2016 р. вкотре шдтверджу-ють силу зв'язку сощальних мереж iз реальни-ми економiчними явищами. Так, автор [2] доводить, що навпъ повцомлення вiд користувачiв, яю не мають безпосереднього стосунку до швестування та економiки, все одно впливають на формування вартост курйв акцiй. У статтi [4] зроблено огляд найчастше ви-користовуваних техшк, алгоритмiв та пiдходiв, якi ви-користовуються на кожному з еташв.

Таким чином, можна побачити, що штерес до мо-делювання на основi даних iз соцiальних мереж е акту-альним, а ккьккть дослiджень та спектр аналiтичного шструментарш зростають, тим самим даючи можли-вкть отримувати все точнiшi результати дослцжень.

Методологiя. Як було зазначено ранше, шстру-ментарiй, що використовуеться на кожному iз крокiв побудови математичних моделей, може варiювати. У данш робот описано процес створення моделi нейронно! мережi для короткострокового прогнозування курйв акцiй на основi застосування так званого аналiзу сенти-ментiв до текстових повцомлень iз сощально! мережi Twitter. Найбкьш трудомiстким етапом моделювання на основi даних iз соцiальних мереж е збiр, попередня обробка та трансформацiя даних iз текстово! форми в ккьккну. Найпершi кроки, а саме - збiр текстових по-

вцомлень i3 мережi та попередня обробка можуть бути peaAÎ30BaHÎ за допомогою технолог!! Twitter API (доступ до потоку текстового контенту, що використовують для розробки програмних додатюв на 6a3i Twitter) та в1д-пов^них програмних код!в мовами Python та R. У на-шому випадку анал1з сентименпв було реал!зовано за допомогою б1блютеки sentiment для мови R, а побудова нейронно! мереж! - б!блютеки neuralnet у тому ж серед-овищ1 Дал! розглянемо бкьш детально методи анал!зу сентименпв та застосування нейронних мереж.

В1дпов1дно до визначення, наведеного у [18], ана-л!з сентименпв - це автоматичне розшзнавання ощ-нок та емоцшно! лексики, представлено! в текстах. При анал1з1 текстових масив!в у мереж! 1нтернет ус! повцо-млення можна подкити на дв! групи: факти та оцшки. Визначення та кентифкацш ощнок е ключовою задачею при анал1з1 сентименпв. 1снуе два основш шдходи до класифкащ! повцомлень: через оцшку емоцшного забарвлення кожного окремого слова та на основ! моделей машинного навчання, натренованих на велик!й ккькост текстового матер!алу для розшзнавання емо-ц!й. Другий метод е б!льш ефективним в силу того, що вш ощнюе семантичш конструкщ! загалом, а не окрем1 слова в реченнях.

Використання методу нейронних мереж для про-гнозування курйв акцш обумовлено високою ефективн!стю даного типу моделей при анал!з! фшансових ринюв. Завданню прогнозування часових ряд1в найкраще вцповкають модел! нейронних мереж прямого розповсюдження, що використовують навчан-ня з учителем, осккьки, на вцмшу вц задач! класте-ризаци, наприклад, завжди можна шдготувати багато контрольних приклад!в, посилаючись на !сторичн! дан!. З !х допомогою можна обчислити похибку, необхцну для роботи алгоритм!в. До таких мереж належать одно-шаровий персептрон, мереж! Ворда, персептрон Роз-енблатта, багатошаровий персептрон, мереж! на основ! рад1альних базисних функцш, машини опорних вектор1в та шш1 У цих мереж багато спкьного, перш за все - алгоритм зворотного розповсюдження похибки, що допо-магае узагальнювати клас виршуваних з !х допомогою задач, а результати та обмеження - схожими. Зг!дно з дослцженням [19] при моделюванш фшансових ринюв найб!льшу ефективн!сть показуе мережа - одношаро-вий персептрон.

Для того, щоб оц!нити можлив!сть використання даних сощальних мереж для прогнозування курсш акцш компанш необхцно довести наявшсть зв'язку м!ж текстовим контентом пов!домлень користувач!в та ру-хом щн в1дпов1дних акцш на б1рж1 Тобто, метою дано! роботи е доведення значущост зв'язку та побудова ефек-тивно! прогностично! модел! на основ! штелектуального анал!зу даних онлайн-потокш сощальних мереж. Для досягнення мети необх!дним е вир!шення низки завдань: п!дб!р необх!дного !нструментар!ю для обробки, анал!зу даних ï реал1заци вцповкних моделей. Також у рамках даного дослдження слд ощнити можливкть реал1заци в^дповкних моделей на украшському ринку.

Головним завданням дано! роботи е встановлення взаемозв'язку мiж динамiкою тематичних повцо-млень стосовно роботи деяко! компаш! в сощаль-нiй мережi Twitter та коливаннями курсу акцш в1дпов1д-но! компани. З цiею метою за допомогою шструменту Twitter API були зiбранi повiдомлення користувачiв i3 ключовими словами «Google» та «$GOOG» у режи-мi онлайн за перюд p 3 по 6 травня 2016 р. На жаль, на даний момент Twitter не дае можливост вкьного доступу до кторичних даних, вони продаються самою компаншю та посередниками, проте можна заванта-жити в режимi реального часу (як ткьки повцомлен-ня з'являеться у мережу його можна зберегти разом ш багатьма супутнiми параметрами: час та мiсце створен-ня, автор повiдомлення, характеристики автора тощо). Також обмеженою е пропускна можливкть каналу API, що не дозволяе перевищувати деяку швидкiсть потоку шформащ! для зчитування.

Пiсля збору усгх необхiдних даних (котирування акщ! за вiдповiдний перiод з джерела [20] та текстовi повiдомлення у Twitter) даш приводяться до вигляду часових рядiв. Котирування подаються у виглядi ряду з ча-совим iнтервалом у 15 хвилин. Вибiр такого невеликого часового штервалу пов'язаний, по-перше, iз природою новин та швидюстю !х розповсюдження (завдяки сощ-альним мережам новина може розходитися мiж корис-тувачами за лнеш хвилини), а по-друге - iз об'ективною необхiднiстю видкення якомога бкьшо! кiлькостi точок спостереження (умова використання методу нейронних мереж). Текстовi повцомлення за допомогою по-передньо! обробки переводяться у вигляд, прийнятний для аналiзу за допомогою бiблiотеки sentiment, а далi -у числову ощнку настрою користувачiв за вiдповiдний перiод часу ^з таким самим iнтервалом у 15 хвилин). Ощнювання вiдбуваеться за шкалою вц мiнiмального значення -100 (уа повiдомлення негативнi) до максимального значення 100 (усi повiдомлення позитивш).

Первинний вигляд зiбраних повкомлень е складно структурованим i мiстить величезну ккьюсть характеристик цього самого повцомлення: Twitter API визначае користувача, що створив повцомлення, локацiю пристрою, з якого надклане пов^омлення, стилiстику тексту, довжину тексту (ккьюсть символiв), кiлькiсть посл^ов-никiв користувача, що створив повцомлення тощо. Уа цi данi записуються у виыддд одного рядка у 600-1000 сим-волiв, тому !х необхiдно попередньо обробити з метою вичленення самого тексту. Деяю досл^ники намагалися видкити тi характеристики повiдомлень, що дозволили б виокремити найбкьш iнформативнi з них (наприклад, людина з бкьшою ккьюстю послiдовникiв мае вищий авторитет i, власне, ïï думка з бкьшою вiрогiднiстю впли-не на загальний настрiй користувачiв та викличе в^дпо-вiдну реакцiю). У табл. 1 наведено приклад попередньо! обробки даних i визначення полярност повцомлень за пошуковими запитами «Google» та «GOOG».

Легко помiтити, що насправдi бiльшiсть повцо-млень, отриманих зi стриму Twitter, мають нейтральний змкт iз нульовою полярнiстю. Проте ккьюсть таких повцомлень навiть за досить коротю промiжки часу е великою, тим самим схиляючи данi в цкому до певно!

Таблиця 1

Результати аналiзу сентиментiв для текстових повдомлень Í3 мережi Twitter

Текст Емощя Полярнкть Оцшка

The last time these insiders purchased this stock it skyrocketed dia qqq spy goog Unknown Positive 70

How to block location access in google chrome android guide read more goog Unknown Neutral 29

Google teaches self-driving cars to honk politely read more goog Surprise Neutral 32

Most misspelled words in each state google read more goog Unknown Neutral -21

Review our daytrade and swingtrade history spy aapl amzn goog tsla uso Unknown Neutral 0

Google android n features we love in the new os read more Joy Positive 100

Google is recording your voice even when you're offline read more Surprise Neutral -35

Джерело: авторська розробка.

полярность Також слц зазначити наявшсть помилок при виведенш оцiнки повiдомлення: вона може значно в^^знятися вiд сприйняття тексту людиною.

Нагадаемо, що для дослдження були зiбранi повiдомлення за двома ключовими словами («Google» та «$GOOG»), причому другий ва-рiант пошуку, - фiнансовий тег - зазвичай приводить до повцомлень на швестицшну тематику (тег, що мк-тить бiржовий тiкер компани, використовують для по-вiдомлень про привабливiсть фшансового iнструмента). Як свiдчить дослiдження [2], для моделювання можуть бути використаш обидва типи повiдомлень. Проте для спрощення завдання та уникнення необхцност накла-дання додаткових обмежень на зiбранi повiдомлення було вирiшено використати твии за пошуковим запитом «$GOOG». На рис. 1 зображено часовi ряди котирувань курсу акцИ компани Google та динамiки сентиментiв по-вiдомлень користувачiв Twitter стосовно швестицшно! привабливостi iнструмента.

Легко помiтити, що крива курсу акцш схожа на криву сентименпв iз деяким часовим лагом. Це дозво-ляе висунути гшотезу про те, що динамка оцiнок корис-тувачiв сощально! мережi на деккька годин випереджае рух цiни на бiржi. На основi даних курсу акцiй компани Google з 15-хвилинним iнтервалом та даних проведено-го аналiзу сентиментiв будуемо модель нейронно'1 мере-жi з метою прогнозування курсу акцш у короткостро-

ковому перюд1 Було в1зуально встановлено, що тренд сентимент1в приблизно на 4 години випереджае тренд курсу акцш. Саме тому як вх1дш змшш модел1 були об-ран1 так1 параметри:

+ значення оцшки сентимент1в 1з лагом 16 (3,5 год); + курс акцИ з лагом 2 (0,5 год); + курс акцИ з лагом 4 (1 год); + курс акцИ з лагом 6 (1,5 год). Прогноз за даним фшансовим шструментом був побудований на 8 перюдш вперед (рис. 2). Ккьюсть спо-стережень для побудови моделей - 84, прогнозованих значень - 8. Напрям динамки тренду було спрогнозовано в1рно, прогноз виявився близьким до реальних значень.

Як бачимо, загальний настр1й користувач1в сощ-альних мереж, що висловлюють свою думку, дшсно ко-релюе з рухом цши на б1рж1, що дае змогу прогнозувати динамку в короткостроковому перюд1 Под1бне досл1-дження для шших акц1й показало, що яюсть прогнозу сильно залежить в1д якост1 даних: юлькост створюваних користувачами пов1домлень, як1 дають змогу в1добрази-ти картину загальних настро!в у мереж1; наявно! кторич-но! бази даних, що дозволяе ефективно натренувати не-йронну мережу. Таким чином, прогнозування на основ1 даних 1з сощальних мереж е потужним инструментом та може бути використаним в швестицшнш дшльностЬ

Розглянемо питання перспектив використання описаного п1дходу до акц1й укра!нських компанш. Украш-ська б1ржа, у пор1внянш з аналог1чними в шших кра'шах,

740 735 730 ! 725 Н 720 □I 715 710 705

03.05.2016 04.05.2016

05.05.2016

06.05.2016

100 80 60 40 20 0 -20 -40 -60

-$GOOG

— Оцшка

сентиментт

(ДОП. B¡Cb)

Рис. 1. Динамка курсу акцм $GOOG та оцшки аналiзу сентиментiв повiдомлень Í3 вщпов^ним фiнансовим тегом Джерело: складено за [20].

<

3

и

с о

4

726 724 722 720 718 716 714 712

— $GOOG -- Прогноз

05.05.2016

06.05.2016

Рис. 2. Короткостроковий прогноз курсу акцш компанм Google

Джерело: авторська розробка.

особливо бвропи, Пгвтчно! Америки та кра'1н Ази, слаб-ко розвинута в контекст1 обсяг1в торг1в на б1рж1 та ккь-кост1 учасникгв. Для пор1вняння, зщно з даними УкраМ сько'1 б1рж1, щоденн1 обсяги торпв коливаються в район1 10 млн грн [21], на б1рж1 NYSE цей показник перевищуе 3 млрд дол. [22]. На думку аналииюв та економ1стш, укра-шська б1ржа в останн1 роки перетворилася на «кишень-кову» та не мае реального мехашзму для в1дображення реально'1 ринково'1 вартост1 актив1в п1дприемств.

Тим не менше, необх1дно оцшити можлив1сть про-ведення анал1зу новин з метою виокремлення динамки сентимент1в користувач1в мереж1 1нтернет стосовно тих чи шших компан1й. Оц1нка техннних можливостей ви-конання цього завдання виглядае таким чином:

1. Джерелом новин для анал1зу украМьких реа-л1й може стати обмежене коло ресурав у вигляд1 сощ-альних мереж та сайт1в новин. Проте сайти новин часто не зовйм об'ективно висвплюють поди, що трапляють-ся, а найпопулярн1ш1 ресурси, таю як pravda.com.ua та ua.korespondent.net, не мають роздшв, де публкувалися б новини стосовно роботи компанш або оцшок експер-т1в у режим1 коротких текстових пов1домлень (зазвичай це готов1 статт1, що м1стять вичерпну шформацш, проте п1дготовлен1 вони заздалепдь та на момент публкаци вже втрачають актуальн1сть для ринку акцш). Мережа Twitter е не такою популярною в УкраМ, перев1рка ккь-кост1 пов1домлень, знайдених за результатами пошуку в1домих укра'1нських компанш, що представлен на б1рж1, видае результат у деюлька пов1домлень на день. В Укра-1н1 досить популярною е сощальна мережа Facebook, проте сайт розроблений таким чином, що робот з1бра-ти даш в автоматичному режим1 з нього не може, лише для чикого перелку стор1нок за числовим кентифка-тором. бдиним джерелом даних може бути шформацш GoogleTrends, проте вона мктить лише динам1ку ккь-кост1 запит1в за ключовим словом та не дае шформаци про настрш користувач1в стосовно д1яльност1 компани.

2. Задач1 анал1зу сентимент1в для текст1в украМ ською мовою поки що не можуть бути виршеш в автоматичному режим1 через низку об'ективних причин.

По-перше, ще не розроблений украМький словник для визначення тональностi слiв, а бази для обробки при-родно! мови (Natural Language Processing) перебувають у зародковому стань Проте, за iнiцiативи американсько-украМько! компани Grammarly, нарештi почалася розробка спещальних корпусiв украМько! мови для автоматично! обробки текстiв та проведення аналiзу сенти-ментiв, зокрема [23].

Таким чином, наявш великi перспективи розробки аналiтичних додаткiв для визначення полярностi тексйв укра!нською мовою, проте застосувати 1х до реальних даних з метою прогнозування курав aкцiй укра!нських компанш практично неможливо за поточ-них умов розвитку бiржово! торгiвлi в УкраМ в цкому та ринку акцш зокрема. Натомкть, aнaлiз сентиментш укра!нських текстiв мiг би добре спрацювати у сферах полiтики, сощальних дослiджень тощо.

ВИСНОВКИ

У данш роботi було дослiджено можливiсть вико-ристання даних 1з соцiaльних мереж з метою створен-ня прогностичних моделей для курсiв aкцiй компанш. Вцповцно до теори ефективного ринку вся наявна на ринку шформацш про фшансовий шструмент та дшль-нiсть компани формуе цiну акцш Беручи до уваги, що сощальш та медшш мережi е найбкьшим джерелом ко-рисних даних i, за умови симетри iнформaцi! на ринку, можуть повшстю та всебiчно описати стан компани, цi даш, переведен в кiлькiснi показники, можна викорис-тати для створення математичних моделей, якi опису-ють рух цiн на ринку акци.

Було проведено повний цикл обробки отриманих ш соцiaльно! мережi Twitter даних для того, щоб на !х бaзi побудувати математичну модель прогнозування курав акцш компани Google. Процес дослцження цього зв'язку складався з деккькох етaпiв. Перший етап пе-редбачав налагодження онлайн-потоку повiдомлень iз соцiaльно! мережi за ключовим словом. Цього вдалося досягти завдяки створенню програмного коду мовою

Python та шдключення до ресурсу даних Twitter API, що дае змогу розробникам програмних 3acTocyHKiB на 6a3i даних i3 мережi отримувати вичерпну шформацш щодо опyблiкованих повiдомлень у режимi онлайн. Далi, за допомогою спецiальних пакетiв обробки текстових даних для статистично! мови програмування R, було здш-снено подготовку та очищення даних з метою подальшо-го проведення аналiзy сентиментГв. Оцiнка сентиментiв у кiлькiсномy вимiрi дала змогу представити данi у ви-глядi часових рядiв, що воображали наявну в мережi шформацш стосовно швестицшно! привабливостi ком-панш. Залежнiсть цiн акцiй вiд лагових значень та ощ-нок сентиментГв було подано у виглядi моделi штучно! нейронно! мережi, проведено порiвняння прогнозова-них значень iз реальними.

Упроцесi дослiдження зв'язку мiж динамкою по-вiдомлень у соцiальних мережах та курсом акцш були одержан такi висновки:

1. 1снуе ткний зв'язок мiж оцiнкою дiяльностi компанГ! в соцiальних мережах i курсом акцш тГе! само! компанГ!. Цей зв'язок мае часовий лаг, тобто новини в мережах дещо передують реальнш змГнГ цГн на ринку.

2. За допомогою динамки оцшки сентиментГв по-вiдомлень можна прогнозувати курс акцш у коротко-строковш перспективi (декГлька годин). Такий невеликий часовий промГжок пояснюеться природою даних у сощальнш мережi: вони поширюються дуже динамiчно та всеохоплююче, тим самим спонукаючи iнвесторiв та дослГдниюв до швидко! реакцГ! на реальну ситyацiю.

3. На основГ динамiки новин, якГ набули поширен-ня за перiод, поки бiржа не працюе, можна прогнозувати щну акцiй на момент вГдкриття робочого дня. Це е дуже щнним фактом, адже значнi стрибки курав aкцiй, як правило, припадають саме на початок торгового дня.

4. ЯкГсть обробки текстових даних i резyльтaтiв aнaлiзy сентиментiв часто мае значну похибку, а ви-значення полярностГ повГдомлень може не сшвпада-ти з реальною. Такий результат е зaкономiрним в силу об'ективно! склaдностi обробки неструктурованих даних за допомогою методiв машинного навчання. Проте узагальнена динaмiкa на основГ велико! юлькост повГ-домлень дае доволГ реалГстичну оцГнку настро!в корис-тувачГв мереж1

Також слГд зазначити, що була ощнена можливГсть використання подГбно! методики аналГзу та моделюван-ня для укра!нського ринку акцГй. На нашу думку, вона е низькою в силу того, що нащональш бГржГ не е тим шструментом врГвноваження ринку, яким вони висту-пають у розвинених кра!нах, окрГм того, обсяг торив на вГтчизняних платформах е надто низьким. БГльше того, на даний час не Гснуе шструменив для проведення аналГзу сентиментГв текстГв укра!нською мовою.

Значним обмеженням у реалГзацГ! дослГдження була складшсть видобутку необхГдних текстових даних через неможлившть отримання доступу до шторичних повГ-домлень. Це не дало можливостГ всебГчно оцГнити влив наявно! в соцГальних мережах ГнформацГ! на курс акцш компанГ! та дослГдити динамку за тривалий перюд часу. Полем для подальшо! роботи е вГдкрите питання щодо

можливост фкьтрацп найбкьш iнформативних даних серед усього арсеналу наявних у сощальнш мережу що стосуються дiяльностi окремих компанiй на основi характеристик повцомлень, створюваних користувачами, та впливовост цих користувач1в на медiйному просторЬ ■

Л1ТЕРАТУРА

1. Alsing O., Bahceci О. Stock Market Prediction Using Social Media Analysis: Degree Project in Computer Scienceat KTH Royal Institute of Technology. Stockholm, 2015. 50 p.

2. Azar P. D., Lo A. W. The Wisdom of Twitter Crowds: Predicting Stock Market Reactions to FOMC Meetings via Twitter Feeds. SSRN. March 2016. 21 p. URL: http://dx.doi.org/10.2139/ ssrn.2756815

3. Beer F., Hervé F., Zouaoui M. Is Big Brother Watching Us? Google, Investor Sentiment and the Stock Market. Economics Bulletin. 2013. Vol. 33 (1). P. 454-466.

4. Buche A., Chandak M. B. Stock Market Prediction Using Text Opinion Mining: A Survey. International Journal of Advanced Research in Computer Science and Software Engeneering. 2016. Vol. 6 (6). P. 566-569.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Burki T. R. Social Media Aided Stock Market Predictions by Sparsity Induced Regression: Master of Science Thesis for the Degree of Master of Science in Systems and Control at Delft University of Technology. Delft, 2014. 93 p.

6. News Impact on Stock Price Return via Sentiment Analysis/ Li X., Xie H., Chen I., Wang J. and others. Knowledge-Based Systems. October 2014. Vol. 69. P. 14-23. URL: http://dx.doi.org/10.1016/j. knosys.2014.04.022.

7. Predicting Sector Index Movement with Microblogging Public Mood Time Series on Social Issues/Y. Lu, J. Guo, K. Sakamoto, H. Shibuki, T. Mori // Proceedings in Pacific Asia Conference on Language, Information and Computation. Shanghai, 2015. P. 563-571.

8. Nguyen T. H., Shirai K., Velcin J. Sentiment Analysis on Social Media for Stock Movement Prediction. Expert Systems with Applications. 2015. Vol. 42. URL: http://dx.doi.org/10.1016/j. eswa.2015.07.052.

9. Oliveira N., Cortez P., Areal N. Some Experiments on Modeling Stock Market Behavior Using Investor Sentiment Analysis and Posting Volume from Twitter // Proceedings of the 3rd International Conference on Web Intelligence, Mining and Semantics. New York, 2013. P. 1-8. URL: http://doi.acm.org/10.1145/ 2479787.2479811

10. Preis T., Moat S., Stanley H. E. Quantifying Trading Behavior in Financial Markets Using Google Trends. Scientific Reports. April 2013. Vol. 3. P. 16-24. URL: http://dx.doi.org/10.1038/ srep01684

11. Rao T., Srivastava S. Modeling Movements in Oil, Gold, Forex and Market Indices Using Search Volume Index and Twitter Sentiments // Proceedings of the 5th Annual ACM Web Science Conference. New York, 2013. P. 336-345. URL: http://doi.acm. org/10.1145/2464464.2464521.

12. Пккун О. В., Мщенко Т. Г. Застосування нейронних мереж для мониторингу стану фондового ринку // 1нновацшна стратепя i тактика фiнансово-економiчного розвитку суб'скпв нацюнального господарства: матерiали Мiжнар. наук.-практ. конф., Чершвць 19-20 грудня 2014 р. У 3-х частинах. Черывцп Видавничий дiм «Гельветика», 2014. Ч. 3. С. 211-214.

13. Слабченко О. О., Сидоренко В. М. Аналiз i синтез моделей на основi машинного навчання для iмпутацiï даних i3 персональних акаунпв со^альних мереж. ВкникКрНУ iменi Ми-хайла Остроградського. Травень 2014. № 88. С. 105-111.

14. Ландэ Д. В. Поиски знаний в Internet. Профессиональная работа. М.: Диалектика, 2005. 272 с.

15. Паклин Н. Б., Орешков В. С. Бизнес-анализ: от данных к знаниям. СПб.: Питер, 2013. 704 с.

16. Черняк О. I., Захарченко П. В. 1нтелектуальний ана-лiз даних: пщручник. КиТв: Знання, 2014. 599 с.

17. Чубукова О. Ю., 1вченко Н. О., Кучер С. Л. Алгорит-мiзацiя та програмування процедур обробки економiчноï ш-формаци. КиГв: КНУТД, 2009. 138 с.

18. Pang B., Lee L. Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval. 2008. Vol. 2, No. 1-2. P. 1-135. URL: http://dx.doi.org/10.1561/1500000011

19. Kryuchin O. V., Kozadaev A. S., Dudakov V. P. Forecasting Time Sets Using Artificial Neural Networks and Regression Models as the Example of Forecasting Currency Pairs Quotation. URL: http://dx.doi.org/10.15827/0236-235X.110.070-074

20. Yahoo Finance Official Web-site. AphabetInc. (GOOG). URL: http://finance.yahoo.com/quote/GOOG?p=GOOG

21. Офщшний сайт ПАО «Укра'шська бiржа». Результати торпв. URL: http://www.ux.ua/ru/marketdata/marketresults.aspx (01.10.2016).

22. New York Stock Exchange Official Web-site. NYSE: Transactions, Statistics and Data Library. URL: https://www.nyse.com/ data/transactions-statistics-data-library (01.10.2016).

23. Grammarly Official Web-site. URL: https://www.gram-marly.com/ (01.10.2016).

REFERENCES

Alsing, O., and Bahceci, O. Stock Market Prediction Using Social Media Analysis: Degree Project in Computer Scienceat KTH Royal Institute of Technology. Stockholm, 2015.

Azar, P. D., and Lo, A. W. "The Wisdom of Twitter Crowds: Predicting Stock Market Reactions to FOMC Meetings via Twitter Feeds. SSRN. March 2016" http://dx.doi.org/10.2139/ssrn.2756815

Beer, F., Herve, F., and Zouaoui, M. "Is Big Brother Watching Us? Google, Investor Sentiment and the Stock Market". Economics Bulletin. Vol. 33 (1) (2013): 454-466.

Buche, A., and Chandak, M. B. "Stock Market Prediction Using Text Opinion Mining: A Survey". International Journal of Advanced Research in Computer Science and Software Engeneering. Vol. 6 (6) (2016): 566-569.

Burki, T. R. Social Media Aided Stock Market Predictions by Sparsity Induced Regression: Master of Science Thesis for the Degree of Master of Science in Systems and Control at Delft University of Technology: Delft, 2014.

Cherniak, O. I., and Zakharchenko, P. V. Intelektualnyi analiz danykh [Data mining]. Kyiv: Znannia, 2014.

Chubukova, O. Yu., Ivchenko, N. O., and Kucher, S. L. Alho-rytmizatsiia ta prohramuvannia protsedur obrobky ekonomichnoi informatsii [Algorithmization and programming procedures for the processing of economic information]. Kyiv: KNUTD, 2009.

Grammarly Official Web-site. https://www.grammarly.com/

Kryuchin, O. V., Kozadaev, A. S., and Dudakov, V. P. "Forecasting Time Sets Using Artificial Neural Networks and Regression Models as the Example of Forecasting Currency Pairs Quotation". http://dx.doi.org/10.15827/0236-235X.110.070-074

Lande, D. V. Poiski znaniy v Internet. Professionalnaya rabota [The search for knowledge on the Internet. Professional work]. Moscow: Dialektika, 2005.

Li, X. et al. "News Impact on Stock Price Return via Sentiment Analysis" Knowledge-Based Systems. http://dx.doi.org/10.1016/j. knosys.2014.04.022

Lu, Y. et al. "Predicting Sector Index Movement with Microb-logging Public Mood Time Series on Social Issues". In Proceedings in Pacific Asia Conference on Language, Information and Computation, 563-571. Shanghai, 2015.

"New York Stock Exchange Official Web-site. NYSE: Transactions, Statistics and Data Library". https://www.nyse.com/data/ transactions-statistics-data-library

Nguyen, T. H., Shirai, K., and Velcin, J. "Sentiment Analysis on Social Media for Stock Movement Prediction". Expert Systems with Applications. http://dx.doi.org/10.1016/j.eswa.2015.07.052

Oliveira, N., Cortez, P., and Areal, N. "Some Experiments on Modeling Stock Market Behavior Using Investor Sentiment Analysis and Posting Volume from Twitter". http://doi.acm.org/10.1145/ 2479787.2479811

Piskun, O. V., and Mishchenko, T. H. "Zastosuvannia neiron-nykh merezh dlia monitorynhu stanu fondovoho rynku" [Application of neural networks for monitoring the state of the stock market]. Innovatsiina stratehiia i taktyka finansovo-ekonomichnoho rozvytku sub'iektiv natsionalnoho hospodarstva. Vol. 3. Chernivtsi: Helvetyka, 2014. 211-214.

Pang, B., and Lee, L. "Opinion Mining and Sentiment Analysis" Foundations and Trends in Information Retrieval. http://dx.doi. org/10.1561/1500000011

Paklin, N. B., and Oreshkov, V. S. Biznes-analiz: ot dannykh k znaniyam [Business analysis: from data to knowledge]. St. Petersburg: Piter, 2013.

Preis, T., Moat, S., and Stanley, H. E. "Quantifying Trading Behavior in Financial Markets Using Google Trends". http://dx.doi. org/10.1038/srep01684

"Rezultaty torhiv" [The results of the auction]. Ofitsiinyi sait PAO «Ukrainska birzha». http://www.ux.ua/ru/marketdata/market-results.aspx

Rao, T., and Srivastava, S. "Modeling Movements in Oil, Gold, Forex and Market Indices Using Search Volume Index and Twitter Sentiments". http://doi.acm.org/10.1145/2464464.2464521

Slabchenko, O. O., and Sydorenko, V. M. "Analiz i syntez modelei na osnovi mashynnoho navchannia dlia imputatsii danykh iz personalnykh akauntiv sotsialnykh merezh" [Analysis and synthesis of models based on machine learning for mutaz data from personal social networking accounts]. Visnyk KrNU imeni Mykhaila Ostrohradskoho, no. 88 (2014): 105-111.

"Yahoo Finance Official Web-site. AphabetInc. (GOOG)". http://finance.yahoo.com/quote/GOOG?p=GOOG

i Надоели баннеры? Вы всегда можете отключить рекламу.