УДК 004.457
Лаврентьева М.А. студент магистратуры 2 курс, факультет ИБ МФ МГТУ им. Н. Э. Баумана научный руководитель: Коннова Н.С., к.т.н.
доцент Россия, г. Москва
СОЗДАНИЕ СИСТЕМЫ ОБНАРУЖЕНИЯ ИНСАЙДА НА БИРЖЕ НА ОСНОВЕ ТЕОРЕТИКО - ГРАФОВОГО ПОДХОДА
Аннотация: На сегодняшний день более 50% сделок, совершаемых на бирже, подозрительные. В статье приведено описание системы защиты от инсайда на бирже. Кроме того, приведены выборки и результаты тестирования, а также анализ ошибок первого и второго рода.
Ключевые слова: информационная безопасность, биржа, инсайд, обнаружение подозрительных инсайдеров.
Lavrentyeva M.A. master's degree student 2 course, faculty IB MF MSTU them. N.E. Bauman scientific advisor: Konnova N.S., Ph.D. of engineering
associate professor Russia, Moscow
CREATING AN INSIDER DETECTION SYSTEM ON THE EXCHANGE BASED ON A GRAPH-THEORETIC APPROACH
Annotation: Today, more than 50% of transactions made on the exchange are suspicious. The article describes the system of protection against insider trading on the exchange. In addition, samples and test results are provided, as well as analysis of errors of the first and second types.
Key words: information security, exchange, insider trading, detection of suspicious insiders.
На сегодняшний день информация является исключительным ценным ресурсом, а ее защита - критически важным элементом коммерческой деятельности и функционирования государство [1]. Однако, несмотря на современные технологии, обеспечить полную информационную безопасность невозможно.
Биржа - площадка для проведения торгов между ее участниками, брокерами. При этом проблемами и угрозами информационной безопасности здесь являются внешние атаки и злоумышленники внутри компании: деструктивные действия хакерских групп, так и недобросовестные
сотрудники, продающие конфиденциальную информацию, что приносит вред компании. Например, в следствие крупной утечки в американском в сентябре 2018 пострадало 147 млн человек [1].
По этой причине создается система, позволяющая обнаружить инсайд. Данная система работает на основе анализа совершенных участниками торгов сделок и поиска коэффициента сходства по формуле:
КЬ Ч))2
Б(ТН, ин) = 4 } 1-I Ф ]. (1)
(н,н) \Тн\х\ин\ ' 1 ()
Здесь Б - коэффициент схожести сделок пары участников Тн, ин, работающих в одной компании Н.
Участники торгов Тн, инсовершают сделки ti, и^ соответственно. При
этом эти сделки могут быть одинаковы, тогда значение I(^и.}) = 1, или разными, т.е. 1(¿¿,иу)=0. Соответственно, чем больше рассматриваемая пара участников совершает одинаковых сделок, тем выше коэффициент 5 6 [0; 1].
Далее производится второй этап работы системы, то есть анализ подозрительной активности, а именно - отклонения числа, а также стоимости сделок от среднего показателя, рассчитанного на каждого подозрительного участника торгов. Данный этап при большом объеме выборки позволяет значительно снизить ошибки первого рода.
Следует также учесть, что при поиске коэффициента схожести сделок рассматриваются работники одной и той же компании, то есть та категория, которая имеет значительный шанс на использование внутренней информации в своих целях.
Кроме того, данная система должна работать с большим объемом информации, следовательно, может иметь в алгоритме работы параллельные процессы либо максимально упрощенную структуру с минимумом выполняемых операций на проверку каждого участника торгов. При реализации ее на языке С++ целесообразно использовать последний подход.
Упрощенный алгоритм работы в этом случае представлен на рисунке:
Рисунок 1 - Упрощенный алгоритм работы системы Тестирование системы производится на тестовых наборах, исходные данные для которых расположены в [2]-[4] и генерируются по мере формирования отчета по торгам на бирже. При этом для проведения функционального тестирования системы была предложена выборка из совершенных на бирже сделок в период с 13 марта по 31 марта 2020 года (см. [2], [3], [4]).
Результаты тестирования приведены на рисунках 2-3.
НАС COP PO LA_EDWARD_C ANDE RSON_DANA_K Mar 31 0.5 0000 Л
НАС COP PO LA_EDWARD_C Healey_Doug_J Mar 31 0.5 0000
FIS Norcross_Gary Montana_Gregory_G Mar 30 1.00000
FIS Norcrass Gary Mayo_Marc_M Mar 30 1.00000
FIS Norcross Gary LO'rtTHERS BRUCE F JR Mar 30 1.00000
FIS Norcross_Gary HUNT_DAVID_K Mar 30 1.00000
FIS Norcross_Gary MOZE_BARRY Mar 30 1.00000
FIS Norcross_Gary MOZE_BARRY Mar 30 1.00000
FIS Norcross_Gary HUGHES_ KEITH_W Mar 30 1.00000
FIS Norcross_Gary В oyd_M art i n Mar 30 1.00000
FIS Norcross_Gary PARENT_ LOUISE_M Mar 30 1.00000
FIS Norcross_Gary Aleinany_Ellen_R Mar 30 1.00000
FIS Montana_Gregory_G Mayo_Marc_M Mar 30 1.00000
FIS Montana_Gregory_G LO'rtTHIERS_B RUCE_F_JR Mar 30 1.00000
FIS Montana_Gregory_G HUWT DAVID К Mar 30 1.00000
FIS Montana_Gregory_G MOZE BARRY Mar 30 1.00000
FIS Montana_Gregory_G MOZE BARRY Mar 30 1.00000
FIS Montana_Gregory_G HU GH E S_KEIT H_W Mar 30 1.00000
FIS Montana_Gregory_G Boyd_Martin Mar 30 1.00000
FIS Montana_Gregory_G PARENT_LOUISE_M Mar 30 1.00000
FIS Mоntana_Gregоry_G Al einany_El 1 en_R Mar 30 1.00000
ADI Sondel_Michael Hassett _Joseph Mar 29 1.00000
ADI Son d el _M i ch ael M ah en d r a- Rai ah_P r as h ant h Mar 29 1.00000
ADI Sondel_Michael ROCHE_VINCENT Mar 29 1.00000
HG WEL DON_WAYNE_CURTIS Bert ol ott l _Dennri s Mar 30 1.00000
FIS Mayo_Marc_M LO'rtTHERS BRUCE F JR Mar 30 1.00000
FIS Mayo_Marc_M HUNT DAVID К Mar 30 1.00000
FIS Mayo_Marc_M MOZE BARRY Mar 30 1.00000
FIS Mayo_Marc_M MOZE BARRY Mar 30 1.00000
FIS Mayo_Marc_M HUGHES_ KEITH_W Mar 30 1.00000
FIS Mayo_Marc_M Boyd_Martin Mar 30 1.00000
FIS Mayo_Marc_M PARENT. LOUISE_M Mar 30 1.00000
FIS Mayo_Marc_M Aleinany_Ellen_R Mar 30 1.00000
MFC Wei s s_J о n at h an_G. Shrewsberry_John_R. Mar 29 1.00000
MFC Wei s s_ J on at h an_G. Pelos_Petros_G Mar 29 1.00000
MFC Wei s s_ J or at h an_G. Norton_Amanda_G Mar 29 1.00000
MFC Wei s s_ J or at h an_G. 'rt'inder_Investment_Pte_Ltd Mar 29: 1.00000
MFC Wei s s_ J on at h an_G. Mack_Mary T Mar 29 1.00000
MFC Wei s s_ J on at h an_G. LEVY_RICHARD Mar 29 1.00000
MFC Wei s s_ J on at h an_G. Galloreese_David Mar 29 1.00000
MFC Wei s s_ J on at h an_G. SHAH_HASU_P Mar 29 1.00000
MFC Wei s s_ J on at h an_G. Ross_Ronald_R Mar 29 1.00000
MFC Wei s s_ J on at h an_G. Van_Rajnshorst_Davnd_J Mar 29 1.00000
h'FC Wei s s_ J on at h an_G. Van_Rajnshorst_Davnd_J Mar 29 1.00000
MFC Wei s s_ J on at h an_G. Van_Rajnshorst_Davnd_J Mar 29 1.00000
MFC Weiss_Jonathan_G. Van_Rajnshorst_David_J Mar 29 1.00000
MFC Weiss_Jonathan_G. Lentnnello_S_David Mar 29 1.00000
MFC Weiss_Jonathan_G. Flowers_Der ek_A Mar 29 1.00000
MFC Weiss_Jonathan_G. Connors_John_G Mar 29 1.00000
MFC Weiss Jonathan G. Connors John G Mar 29 1.00000
FIS LO'rtTHERS ERUCE_F JR HUPiT DAVID К Mar 30 1.00000
FIS LO'rtTHERS BRUCE_F JR MOZE BARRY Mar 30 1.00000
FIS LO'rtTHERS BRUCE_F JR MOZE BARRY Mar 30 1.00000
FIS LO'rtTHERS_BRUCE_F_JR HU GH E S_KEIT H_W Mar 30 1.00000
FIS LO'rtTHERS BRUCE_F JR Boyd_Martin Mar 30 1.00000
FIS LO'rtTHERS BRUCE_F JR PARENT_LOUISE_M Mar 30 1.00000
FIS LO'rtTHERS BRUCE_F JR Al einany_El 1 en_R Mar 30 1.00000
Рисунок 2 - Для каждой компании пары инсайдеров, выполняющие
одинаковые операции в одну и ту же дату
¡¡л
И'т 15 ап_51 е уеп_К.
Согак_Оа\/п с1
ИОВЕИТ5_]ОНЦ_1Ю5ЕРН
1_АМ[1)У_5АМиЕ1__А
&а11огее5е_0а\/1с1
5НАН_НА511_Р
^'ап_кал15Иаг51:_0а\/п d_J ^'ап_кал15Иаг51:_0а\/п d_J ^'ап_кал15Иаг51:_0а\/п d_J
Leпt^пellQ_5_Dav^d Р1оиег5_0егек_А. Саппаг5_}аИп_Ь Саппог5_}аИп_С Р арк о^Тасц и е11 п е_5у Ьй 1 ColQППQ_R^chaгd_JaJnes JQhпsoп_AпdгеиЛаг"Ь т п
С аз 5 агп ерИ еп
КУОС ЕкА_С<ЖР
□ТгеНОиР_]Ж
□тгеноир_]ж
□тгеноир_]ж
□тгеноир_]ж
гптеиоир_1нс
□тгеноир_1нс
Н ad1еу_Наг ЬQГ_Masteг_IпvestQгs
l^l^пdeг_Iпvestmeпt_Pte_Ltd
l^l^пdeг_Iпvestmeпt_Pte_Ltd
Н ad1еу_Наг Ьаг _М аз! ег _1 п уеа! аг 5
ВАУ_СТРЕЕТ_Р IN АИСI А1__5. А.
l^l^пdeг_Iпvestmeпt_Pte_Ltd
5рг исе_Наизе_Раг1:пег зИй р_ИС
РРЦ_РАИ"ПЕИ5_1_ 1_С
ТТл'РЬР_ИС
l^l^пdeг_Iпvestmeпt_Pte_Ltd
L^'^lпdeг_Iпvestmeпt_Pte_Ltd
ТТл'РЬР_ИС
ТТл'РБР_ИС
Butteгf^eld_ShelЬу_ }
Butteгf^eld_ShelЬу_ }
РРК_РАЛТ1еН5_1_1_С
Р055_1ЮНА1_0_А
5051ПЛ1_1РР01Ш
5051МЛ1_1РР01Ш
Н и d а ап_В ау_С арп1а1_Мападе!пеп1 В1 аск51: о п е_Ьг ои р_1 п с й50_На1<11 пд5_1_ИС В1 аск51: о п е_С<}Р_С 01Л1пап_Но^со_1 РРК_РАЛТ1еН5_1_1_С Р055_1ЮНА1_0_А 6ШгЕИ_САР1ТА1_ Г_1_1_С Р кЕ5С0ТТ_ЬМ>и Р_САРГТА1_М АМАЬЕМ
Я-пя продолжения нажниуе любую клавишу . . . _^
Рисунок 3 - Инсайдеры, чьи средние показатели стоимости и числа совершенных сделок существенно отличаются от текущего значения Согласно результатам отладки и тестирования, представленным в разделах 3.3.6, 3.4, вероятность ошибки первого рода при работы системы не превышает 0,005. При этом вероятность ошибки второго рода при тестировании с использованием небольшого числа сделок составляет 0,023, а при тестировании с использованием сделок из таблицы 8 также не превышает 0,005.
Кроме того, проанализировав различные объемы выборок от 8 до 600 совершенных сделок, были получены следующие результаты. При совсем небольших выборках второй этап системы не рассматривает много подозрительных инсайдеров. Причиной является недостаток информации для анализа средних показателей.
В случае с большими выборками система работает значительно медленнее, но при этом на втором этапе остаются инсайдеры, которые имели подозрительную активность на бирже. При этом достоверность результатов становится значительно выше.
Использованные источники:
1. Электронная энциклопедия «Академик» // Дециль. Экономический словарь [Электронный документ] - URL: https://dic.academic.ru/dic.nsf/econ dict/20852 (Дата обращения 01.03.2019).
2. Financial visualisations // Top Insider Trading Resent Week [Электронный документ] - URL: https://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=7&o=-transactionValue (Дата обращения 01.04.2020).
3. Financial visualisations // Latest Insider Traiding [Электронный документ] - URL: https://finviz.com/insidertrading.ashx?tc=7 (Дата обращения 01.04.2020).
4. Financial visualisations // Top 10% Owner Trading Resent Week [Электронный документ] - URL: https://finviz.com/insidertrading.ashx?or=10&tv=1000000&tc=7&o=-transactionValue (Дата обращения 01.04.2020).