Научная статья на тему 'Подходы к эффективному упрощению и визуализации больших наборов данных'

Подходы к эффективному упрощению и визуализации больших наборов данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
333
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВіЗУАЛіЗАЦіЯ / ВЕЛИКі НАБОРИ ДАНИХ / АЛГОРИТМ СПРОЩЕННЯ / ПОЛіГОНАЛЬНИЙ ЛАНЦЮГ / СИСТЕМА ЛОКОМОТИВНОї БЕЗПЕКИ / ВИЗУАЛИЗАЦИЯ / БОЛЬШИЕ НАБОРЫ ДАННЫХ / АЛГОРИТМ УПРОЩЕНИЯ / ПОЛИГОНАЛЬНАЯ ЦЕПЬ / СИСТЕМА ЛОКОМОТИВНОЙ БЕЗОПАСНОСТИ / VISUALIZATION / LARGE DATA SETS / SIMPLIFICATION ALGORITHM / POLYGONAL CIRCUITS / SYSTEM OF LOCOMOTIVE SAFETY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Скарга-Бандурова И.С., Грушка М.О., Барбарук Л.В.

Рассмотрены проблемы визуализации последовательностей больших наборов данных. Задача поиска оптимального отображения данных сформулировано в виде задачи выбора алгоритма упрощения простых полигональных цепей с минимальным количеством ошибок. Выполнен анализ эффективности алгоритмов Рамера-Дугласа-Пэкера, Реумана-Виткама, Опхейма, Ланга, алгоритма исключения по высоте треугольника и алгоритма радиального исключения точек при работе с большими данными. Приведены результаты сравнения и оценки эффективности их использования для анализа реальных данных, собираемых в системах локомотивной безопасности. Ил.: 2. Табл.: 1. Библиогр.: 15 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Approaches for Efficient Simplification of Large Datasets

The problems of visualization of sequences of large data sets are considered. The task of finding an optimal data mapping is formulated in the form of selecting the best algorithm for simplification of simple polygonal circuits with a minimum number of errors. The analysis of the efficiency of variation of Ramer-Douglas-Packer algorithm, Reumann-Whitcom algorithm, Opheim algorithm, Lang simplification algorithm, the triangle exclusion algorithm and the radial exclusion algorithm for large data sets are performed. The results of comparison and estimation of their efficiency for the analysis of real data collected in systems of locomotive safety are presented. Figs.: 2. Tabl.: 1. Refs.: 15 titles.

Текст научной работы на тему «Подходы к эффективному упрощению и визуализации больших наборов данных»

УДК 004.922 DOI: 10.20998/2411-0558.2017.50.10

1.С. СКАРГА-БАНДУРОВА, д-p тexн. наук, дoц., пpoф., СНУ

iм. В. Даля, Севеpoдoнeцьк,

М.О. ГРУШКА, мапстр, СНУ iм. В. Даля, Севеpoдoнeцьк,

Л.В. БАРБАРУК, ст. викл., СНУ iм. В. Даля, Севеpoдoнeцьк

ПЩХОДИ ДО ЕФЕКТИВНОГО СПРОЩЕННЯ I

ВIЗУАЛIЗАЦIÏ ВЕЛИКИХ НАБОРIВ ДАНИХ

Рoзглянyтo пpoблeми вiзyалiзацiï пocлiдoвнocтeй вeликиx набopiв дант. Задачу nomyxy oптимальнoгo вiдoбpажeння даниx cфopмyльoванo у вигляд1 задач1 вибopy алгopитмy cпpoщeння пpocтиx пoлiгoнальниx ланцюпв з мiнiмальнoю шлькютю пoмилoк. Bикoнанo анал1з eфeктивнocтi ал^шт^в Рамepа-Дyглаcа-Пeкepа, Рeyмана-Вггкама, Oпxeйма, Ланга, алгopитмy виключeння за виcoтoю тpикyтника та алгopитмy pадiальнoгo виключeння TO4or npH poбoтi з вeликими даними. Hавoдятьcя peзyльтати пopiвняння та o^hkh eфeктивнocтi ïx викopиcтання для анал1зу peальниx даниx, щo збиpаютьcя в cиcтeмаx лoкoмoтнвнoï бeзпeкн. 1л.: 2. Табл.: 1. Б1блюгр.: 15 назв.

Kлючовi слова: в1зуал1защя; вeлнкi набopи даннx; алгopнтм cпpoщeння; пoлiгoнальннй ланцюг; cнcтeма лoкoмoтнвнoï бeзпeкн.

Вступ. Стан будь-яшго тexнoлoгiчнoгo oб'екта, щo ocнащeний датчиками, з якиx пocтiйнo знiмаетьcя iнфopмацiя, мoжe бути oпиcаний пocлiдoвнocтями ïx значeнь, яю, у cвoю чepгy, вiдoбpажаютьcя тoчками, л1н1ями, ^ивими r6O пoвepxнями. Гpафiчнe вiдoбpажeння - дyжe пpocтий та дiевий otocí6 пpeдcтавлeння даниx, щo дoзвoляе пoлeгшити ïx cпpийняття та надае дocтатньo iнфopмацiï для аналiзy i ^ий^тся piшeнь [1]. Biзyалiзацiя даниx мае важливe значeння для вивчeння та poзyмiння cтpyктyp та мoдeлeй даниx, ïx залeжнocтeй та виявлeння нeзвичниx cпocтepeжeнь. Heoбxiднicть бачити данi нeмoжливo пepeбiльшити. Однак наявнicть вeликoï юль^ст! дocтyпниx даниx cyттевo впливае на вибip заcoбiв i тexнoлoгiï ïx вiдoбpажeння [2]. Bикopиcтання тpадицiйниx мeтoдiв вiзyалiзацiï для пocлiдoвнocтeй вeликиx набopiв piзнoманiтниx даниx пpивoдить дo втpати iнфopмативнocтi й мoжe cтвopити на eкpанi oднy вeликy пляму, щo cкладаетьcя з мнoжини тoчoк, яК пpeдcтавляють кoжeн pядoк даниx. Зpoзyмiлo, щo такe вiдoбpажeння yнeмoжливлюе пoдальший аналiз та iнтepпpeтацiю даниx. 1нша пpoблeма пoлягае в тoмy, щo данi надxoдять з piзниx джepeл. Хoча вoни мoжyть oxoплювати аналoгiчний дiапазoн дат, piзнi hr6oph даннк мoжyть мати piзнi iнтepвали мiж запиcаними значeннями. Hаpeштi, пopяд з пpиpoдoю даниx, ïx oбcяги та вимoги дo швидкocтi o6po6kh rocrmHo зpocтають, i цe cтае клаcичнoю пpoблeмoю Big Data. Для того, щoб ycпiшнo аналiзyвати такi типи даниx, ïx нeoбxiднo cпpocтити для гpафiчнoгo вiдoбpажeння, щo вимагае пoшyкy

© 1.С. Скаpга-Бандypoва, М.О. Tpyrnra, Л.В. Баpбаpyк, 2017 55

i використання нових пiдходiв та принцитв обробки. Це дасть змогу дослщити менший розмiрний простiр i виявити цiкавi структури та незвичнi спостереження.

У цш статтi головний акцент зроблено на розглядi проблем вiзуалiзащi даних у виглядi полiгональних ланцюгiв та результатах роботи з великими наборами даних.

Огляд проблем спрощення пол1гональни\ ланцюгiв.

Полiгональний, або багатокутний ланцюг Р в евклiдовiй площинi

визначаеться як упорядкований список вершин Р2,...рп), при якому

будь-якi двi послiдовнi вершини з'еднуються лiнiйним сегментом.

У загальному видi проблема спрощення полiгональних ланцюгiв [3] формулюеться наступним чином. Нехай дана пол^ональна крива

(Р1,..., Рп) i крива Р' = ( Рп,..., р[к) 3 1 = ^ < ... < 1к = п , що спрощуе криву

Р, де Р(г, у) це вiдрiзок шляху з рг до Рj. Для пари iндексiв 1 < г < у < п, 5р (РгРу, Р) позначае помилку спрощення сегментарру вщносно Р (г,у). Тодi,

5 р (Р', Р) = тах 5 р {р,р+ь Р), (1)

1<у<к

де Р' е 8-спрощенням Р, якщо 5р (Р, Р) < е .

Проблема оптимiзащт вiдображення даних може бути сформульована у виглядi задачi вибору алгоритму спрощення простих пол^ональних ланцюгiв, а саме: Для надано'1 пол^онально'1 криво'1 Р, необхщно знайти спрощення Р' з мшмальною кiлькiстю вершин. В лiтературi [3, 4] ця проблема розглядаеться головним чином як задача 8-або #-мЫмзацп.

Проблема 8-мiнiмiзацii. Для наданого пол^онального ланцюга Р i цiлого числа к < п, знайти серед уах апроксимацiй Р з не бшьше нiж к вершинами апроксимащю з мiнiмальною погрiшнiстю.

Проблема #-мiнiмiзацii. Для наданого полiгонального ланцюга Р i дiйсного числа 8 > 0, знайти серед усiх 8-апроксимацiй Р 8-апроксимацiю з мЫмальною кiлькiстю вершин.

Надалi в робот розглянуто проблему 8-мiнiмiзацii.

Спрощення пол^ональних ланцюг1в. Суть алгоритмiв спрощення пол^ональних ланцюгiв полягае у зменшеннi кшькосп точок шляхом видалення тривiальних точок, але без порушення ютотно'1 форми вихщно'1 лшп. Перше застосування з 1960 р. алгоритми спрощення пол^ональних ланцюпв набули у картографп [5, 6] з подальшим поширенням на географiчнi iнформацiйнi системи, комп'ютерну графшу, вiзуалiзацiю часових рядiв [7, 8], проблеми

56

стиснення даних, тощо. Ниш бшьшють нав^ацшних додатюв використовують методи i алгоритми спрощення лiнiй для зменшення об'ему карт та полшшення швидкостi виконання таких операцш як масштабування та прокрутка. Розроблеш й протестованi рiзноманiтнi алгоритми спрощення, наприклад, алгоритм Дугласа-Пекера [9], що спрощуе лiнiю на основi вертикального iнтервалу; алгоритм Реумана-В^кама [10], що спрощуе лiнiю на основi функцiй кутового повороту [11]; алгоритм послщовного спрощення лшп [12], що спрощуе лшю на основi областi та iншi, однак, як зазначаеться в [13], питання вибору алгоритму та ощнка ефективносп залишаеться вiдкритою.

Ключовим моментом у використанш алгоритмiв спрощення полiгональних ланцюгiв е вибiр порогу, що визначае силу спрощення. Саме вщ цього параметру залежить кшькють точок та вид отримано'1 лшп.

У рiзних алгоритмах пор^ спрощення визначаеться по рiзному. Найпоширенiшi варiацii порогу спрощення:

- Вщстань вiд точки до лшп, утворено'1 сусiднiми або крайнiми точками.

- Радiус, в межах якого видаляються усi точки

- Номер точки: видаляеться кожна N точка.

- Площа, в межах яко'1 залишаеться лише зазначена кшькють точок.

Чим бшьшим е пор^ спрощення тим менше рiвень деталiзацii отримано'1 лшп та тим менше точок складають отриману лшю. На рис. 1 показано пол^ональний ланцюг, що складаеться з 13 вершин: (р1, р2, ..., р13} та приклад спрощення при к = 3, що мютить вершини: (р1, р6, р9, Р13}.

6

Рис. 1. Приклад полнонального ланцюга та його спрощення

Рiзноманiття варiацiй порогу спрощення призводить до необхщносп детального аналiзу характеру вхщних даних. Задача математичного обмеження алгорш^в спрощення полiгональних ланцюгiв е найбшьш складною. Недоопрацьоване застосування процесу спрощення лшш, iмовiрно, не зможе значно зменшити розмiр ланцюга.

57

Натомють надмiрна спрощена лшя може призвести до спотворення його вщображення. Погано пвдбраний порiг спрощення може призвести до втрати значущих даних та наштовхнути людину, що аналiзуe вiзуалiзованi даш, до хибних висновкiв. Таким чином, обов'язковими кроками е розрахунок порогу спрощення i вибiр показникiв для визначення якосп.

Метою роботи е обгрунтування вибору методiв та алгорш^в спрощення полiгональних ланцюгiв, якi лежать в основi системи вiзуалiзащi великих наборiв технологiчних даних. Найкращий алгоритм мае забезпечити вiзуальне вiдображення даних у рiзних масштабах зi збереженням 1'х точностi.

Розрахунок сили спрощення пол1гонального ланцюга. Рiвень деталiзацii спрощено'1 лшп тiсно пов'язаний з порогом спрощення вщповщного алгоритму. Порiг асощюеться iз силою спрощення. Для вимiрювання сили спрощення зазвичай використовують алгоритм знаходження середньо'1 вiдстанi зсуву.

Для отримання знаходження сили спрощення у класичному випадку використовуеться формула [14]

Dsimpi = SRp ■ N, (2)

де SRp - просторова розподшьна здатнiсть пiкселя; N - мЫмальна кiлькiсть пiкселiв, що зможе розрiзнити людське око на певнш вiдстанi вiд монiтора.

Просторова розподшьна здатшсть являе собою число незалежних пiкселiв значень на дюйм. Цей показник головним чином впливае на здатшсть ока людини розрiзнити деталi на лшп й обчислюеться наступним чином

Dp

SRp =-p-, (3)

p PPI ■ Scale

де Dp - фiзичний розмiр пiкселя Dp = pP^, Scale - масштаб PPI -кшьюсть пiкселiв на дюйм

JH2 + V;1

PPI = -, (4)

D

^ s

де D s - розмiр дисплея, Hr x Vr - розподiльна здатнiсть дисплея.

Для реалiзацii можливостi змiни пропорцш графiкiв вiдносно один одного до формули (2) додамо стввщношення поточно'1 висоти

компоненти вщображення графшв (Н) до висоти графiка, для якого виконуеться обчислення (Иры)

051тр1 = 8Яр • N • И^. (5)

И рЫ

Оц1нка якостi спрощення полiгональних ланцюпв. Зрозумiло, що спрощення полiгонального ланцюга змiнюе його форму. Чим вище стутнь спрощення, тим бiльше спрощений ланцюг вiдрiзняеться вщ оригiнального. Для оцiнки застосовностi алгоршмв спрощення до мети роботи необхщно розрахувати позицiйнi помилки. Спосiб вимiрювання похибки спрощення полягае в знаходженш вiдстаней мiж вихiдними точками, що були спрощеш, та спрощеним ланцюгом.

Найбшьш часто використовуваними показниками для визначення якост спрощення е [15]:

- максимальне вщхилення (максимальна вщстань вiд орипнально"1 точки, що була спрощена, до спрощено'1 лшп)

тах(р , - рт ); (6)

г =1, N

- мшмальне вiдхилення (максимальна вiдстань вiд оригинально!' точки, що була спрощена, до спрощено1 лшп)

т1п(р, - рт ); (7)

г =1, N

- середньоквадратичне вiдхилення

а =

- рг^; (8)

N

- сума вiдхилень (сума вщстаней вiд оригiнальних точок, що були спрощеш, до спрощено1 лшп)

5 = Е^=1(р г - рт ). (9)

Дослщження алгоритмiв спрощення на практичному прикладь Описанi вище положення використовуються для реалiзацii завдання з формування та вiзуалiзацii послщовностей великих наборiв даних систем локомотивно1 безпеки, призначених для забезпечення безпеки руху в по"1зшй i маневровш роботi.

В системах локомотивно1 безпеки, що оргашзоваш за допомогою сучасних високотехнолопчних пристро1в, використовуються датчики й устаткування для автостопного i службового гальмування; обладнання

для приймання та обробки вхщно! шформацп та формування керуючих команд; операторське обладнання; сервюне та дiагностичне обладнання; блоки живлення. Багато вимiрювань, таю як, наприклад, значення автоматично! локомотивно! сигналiзащi безперервно! дп (АЛСБ), збираються з частотою 50, 100 або 150 Гц. Для аналiзу архiвних даних, дiагностики i визначення причин несправностей та аваршних ситуацiй необхiдно мати можливють вiдображення усiх параметрiв, в залежносп вiд типу, на чотирьох графшах: (1) дискретнi параметри, (2) аналоговi параметри, (3) параметри швидкосп та обмеження, (4) сигнал св^лофору та об'екти з електронно! карти. По ос х мае бути вщображеш дата i час з точшстю до секунди та значення лшшно! координати у кiлометр-пiкетах. По ос у - значення вщповщного параметра у заданiй величинi. Необхщно також надати можливiсть перегляду даних за максимально можливу за тривалютю по'1'здку, що складае 3 доби.

Для пошуку найкращого алгоритму спрощення та забезпечення якюно! вiзуалiзацii послщовностей наявних даних було обрано 6 алгоршмв: Дугласа-Рамера-Пекера (ДРП), Реумана-Вiткама (Р-В), Опхейма, Ланга, алгоритм виключення за висотою трикутника (ВТ) та алгоритм радiального виключення точок (Рад). Порiвняння ефективностi алгоритмiв спрощення складалося з двох етатв: вiзуального аналiзу та розрахунку похибок. Вiзуальний аналiз використовувався для ощнки вiдтворюваностi, тобто наскшьки спрощений ланцюг передае поведiнку (форму) початкового ланцюга. Математичний аналiз дозволив обрати з помiж алгоритмiв, що однаково добре пройшли вiзуальний аналiз, алгоритм з найменшим значенням позицшно! похибки.

Для тестування алгоритмiв спрощення було обрано значення середньо-квадратичного вщхилення сигналу АЛСБ. Результати спрощення надано на рис. 2.

Для порiвняння обраних алгорш^в спрощення полiгональних ланцюпв виконано обчислення позицiйних похибок. Значення похибок обчислювались по формулам (6) - (9) окремо для кожно! точки. Результати обчислення похибок спрощення ланцюпв рiзними алгоритмами надаш у табл.

Координати точок на рис. 2: по ос Х - дата i час в мшсекундах з початку епохи (1970), по ос У - значення середньоквадратичного вщхилення сигналу АЛСБ. Загальний промiжок - 10 секунд. На верхньому графшу кожного рисунку позначений оригшальний ланцюг. На нижньому графшу кожного рисунку позначено спрощений ланцюг. Початкова кшьюсть точок 15425.

M ПК \ M f\|\ ш

1нШ iU йШ

ш

a)

ювкж

e)

вив

д)

им Wi- ш m

m rft- fïW tí

б)

шм

ото®

и

«и

г)

\ MN ш h МПГО

-И m Uli M МЫ-ikt M* 1«

e)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Pnc. 2. Peзyльтат cпpoщeння алгopитмами (а) Дyглaca-Paмepa-Пeкepa, (б) paдiaльнoгo виключeння тoчoк, (e) виключeння за виштою тpикyтникa, (г) Ланга, (д) Опxeймa, (е) Peyмaнa-Biткaмa

Таблиця

Peзyльтaти oбчиcлeння пoxибoк

^^A^rop^m Пйказник^^ APn Paд ВТ Ланг Ош^йм P-B

Мaкcимaльнa пoxибкa 0.022 1.062 1.064 1.062 1.064 0.127

Cepeдня rox^Ka 0.005 0.023 0.008 0.023 0.008 0.018

Cepeдньo- квaдpaтичнa пoxибкa 0.005 0.069 0.064 0.069 0.066 0.019

Сума tox^ok 82.08 352.09 129.49 356.01 128.89 285.63

Kiлькicть точек пicля cпpoщeння 3856 3090 7713 3086 7726 2867

В результат! роботи, враховуючи вимоги забезпечення найменшо'1 похибки, найбшьш оптимальним алгоритмом для спрощення точок сигналу АЛСБ е алгоритм Дугласа-Рамера-Пекера.

Висновки. Обгрунтовано вибiр алгоритму спрощення вiзуального вщображення великих наборiв даних для використання в дiагностичному програмному комплексi системи локомотивно'1 безпеки. Вибiр оптимального алгоритму проведено з урахуванням розрахунюв порогу спрощення i показникiв якостi спрощення. Розрахунки проводилися з урахуванням характеристик дисплею. У рамках поставлено! задач^ баланс мiж вимогами до деталiзацii вихщного зображення та отриманням мшмально! кшькосп точок був зсунутий у бш зменшення сили спрощення та збшьшення деталiзацii.

Результати роботи дозволили виршити частину багатоетапного завдання з розробки тдсистеми адаптивно! вiзуалiзацii арxiвниx даних систем локомотивно'1 безпеки. Наступним кроком реалiзацii проекту е вирiшення проблеми пошуку i видiлення послiдовностей даних, що найменше схож на шш^ або дисонансiв часових рядiв, ршення задачi виявлення цiкавиx структур та незвичних спостережень в наборах великих даних.

Список лггератури: 1. Gorodov E.Yu. Analytical Review of Data Visualization Methods in Application to Big Data / E.Yu. Gorodov, V.V. Gubarev // Journal of Electrical and Computing Engineering. - 2013. - Vol. 2013. - Р. 201-207. 2. Hyndman R.J. Visualization of big time series data [Електронний ресурс] / R.J. Hyndman. - Режим доступу: www. URL: https://robjhyndman.com/seminars/big-time-series/ - 21.10.2017 р. 3. Agarwal P.K. Efficient Algorithms for Approximating Polygonal Chains / P.K. Agarwal, K.R. Varadarajan // Discrete Computing Geometry. - 2000. - Vol. 23. - Р. 273-291. 4. Buzer L. Optimal simplification of polygonal chains for subpixel-accurate rendering / L. Buzer // Computing Geometry Theory Application. - 2009. - Vol. 42 (1). - Р. 45-59. 5. Buttenfield B. Treatment of the cartographic line / B. Buttenfield // Cartographica. - 1985. - Vol. 22. - Р. 1-26. 6. McMaster R.B. Automated line generalization /R.B. McMaster // Cartographica. - 1987. -Vol. 24 (2). - Р. 74-111. 7. Kumar N. Time-series bitmaps: a practical visualization tool for working with large time series databases / N. Kumar, N. Lolla, E. Keogh et al. // Proceedings of the 5th SIAM International Conference on Data Mining, Newport Beach, California, April 2005. - Р. 531-535. 8. Lin J. Visually mining and monitoring massive time series / J. Lin, E. Keogh, S. Lonardi, et al. // Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2005. - Р. 460-469. 9. Douglas D.H. Algorithms for the reduction of the number of points required to represent a digitized line or its caricature / D.H. Douglas, T.K. Peucker // The Canadian Cartographer. - 1973. - Vol. 10. - №. 2. - Р. 112-122. 10. Reumann K. Optimizing curve segmentation in computer graphics / K. Reumann, A.P.M. Witkam // Proceedings of the International Computing Symposium, Amsterdam, North-Holland Publishing Company, 1974. - Р. 467-472. 11. Rangayyan R.M. Polygonal approximation of contours based on the turning angle function / R.M. Rangayyan, D. Guliato, J.D. de Carvalho, S. Santiago // Journal of Electronic Imaging. - 2008. - Vol. 17 (2). - Р. 16-23. 12. Qingsheng G. A progressive line simplification algorithm / G. Qingsheng, C. Brandenberger, L. Hurni // Geo-Spatial Information Science. - 2002. -Vol. 5 (3). - Р. 41-45. 13. Shi W. Performance Evaluation of Line Simplification Algorithms

for Vector Generalization / W. Shi, CK. Cheung // The Cartographic Journal. - 2006. - Vol. 43. - №. 1. - Р. 27-44. 14. Song J. A Novel Evaluation Approach for Line Simplification Algorithms towards Vector Map Visualization / J. Song, R. Miao // International Journal of Geo-Informatics. - 2016. - Vol. 5. - Р. 223. 15. Ekdemir S. Efficient Implementation of Polyline Simplification for Large Datasets and Usability Evaluation [Електронний ресурс] / S. Ekdemir - Режим доступу: www. URL: www.diva-portal.org/smash/ get/diva2:444686/ FULLTEXT01.pdf - 21.10.2017 р.

References:

1. Gorodov, E.Yu. and Gubarev, V.V. (2013), "Analytical Review of Data Visualization Methods in Application to Big Data", Journal of Electrical and Computing Engineering, Vol. 2013, pp. 201-207.

2. Hyndman, R.J. (2015), "Visualization of big time series data, available at: URL https://robjhyndman.com/seminars/big-time-series/ (accessed 21 October 2017)

3. Agarwal, P. K. and Varadarajan, K. R. (2000), "Efficient Algorithms for Approximating Polygonal Chains", Discrete Computing Geometry, Vol. 23, pp. 273-291.

4. Buzer, L. (2009), "Optimal simplification of polygonal chains for subpixel-accurate rendering", Computing Geometry Theory Application, Vol. 42 (1), pp. 45-59.

5. Buttenfield, B. (1985), "Treatment of the cartographic line", Cartographica, Vol. 22, pp. 1-26.

6. McMaster, R.B. (1987), "Automated line generalization", Cartographica, Vol. 24 (2), pp. 74-111.

7. Kumar, N., Lolla, N., Keogh, E., et al. (2005), "Time-series bitmaps: a practical visualization tool for working with large time series databases", Proceedings of the 5 th SIAM International Conference on Data Mining, Newport Beach, California, April 2005, pp 531535.

8. Lin, J., Keogh, E., Lonardi, S., et al. (2004), "Visually mining and monitoring massive time series", Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp 460-469.

9. Douglas, D.H. and Peucker, T.K. (1973), "Algorithms for the reduction of the number of points required to represent a digitized line or its caricature", The Canadian Cartographer, Vol 10, No. 2, pp. 112-122.

10. Reumann, K. and Witkam, A.P.M. (1974), "Optimizing curve segmentation in computer graphics", Proceedings of the International Computing Symposium, Amsterdam, North-Holland Publishing Company, pp. 467-472.

11. Rangayyan, R.M., Guliato, D., de Carvalho, J.D. and Santiago, S. (2008), "Polygonal approximation of contours based on the turning angle function", Journal of Electronic Imaging, Vol. 17 (2), pp. 16-23.

12. Qingsheng, G., Brandenberger, C. and Hurni, L. (2002), "A progressive line simplification algorithm", Geo-SpatialInformation Science, Vol. 5 (3), pp. 41-45.

13. Shi, W., and Cheung, CK. (2006), "Performance Evaluation of Line Simplification Algorithms for Vector Generalization", The Cartographic Journal, Vol. 43 No. 1, pp. 27-44.

14. Song, J. and Miao, R. (2016), "A Novel Evaluation Approach for Line Simplification Algorithms towards Vector Map Visualization", International Journal of Geo-Informatics, Vol. 5, pp. 223.

15. Ekdemir, S. "Efficient Implementation of Polyline Simplification for Large Datasets and Usability Evaluation", available at: URL www.diva-portal.org/smash/get/ diva2:444686/FULLTEXT01 .pdf (accessed 21 October 2017).

Статтю представив д-р техн. наук., проф. НТУ "ХШ" Леонов С.Ю.

Надшшла (received) 01.12.2017

Skarga-Bandurova Inna, Dr. Sci. Tech., Professor

Volodymyr Dahl East Ukrainian National University

59-a Central Avenue, Severodonetsk, Luhansk region, Ukraine, 93400

Tel.: (064) 522-89-97, e-mail: skarga_bandurova@ukr.net

ORCID ID: 0000-0003-3458-8730

Grushka Mykhailo, Magistr

Volodymyr Dahl East Ukrainian National University

59-a Central Avenue, Severodonetsk, Luhansk region, Ukraine, 93400

Tel.: (064) 522-89-97, e-mail: mikkgru@yahoo.com

ORCID ID: 0000-0003-4145-1425

Barbaruk Lina, Senior Lecturer

Volodymyr Dahl East Ukrainian National University

59-a Central Avenue, Severodonetsk, Luhansk region, Ukraine, 93400

Tel.: (064) 522-89-97, e-mail: barbaruk.angelina@gmail.com

ORCID ID: 0000-0001-6639-3001

УДК 004.922

Пщходи до ефективного спрощення та в1зуал1защТ великих набор1в даних / Скарга-Бандурова 1.С., Грушка М.О., Барбарук Л.В. // Вюник НТУ "ХП1". Сер1я: 1нформатика та моделювання. - Харк1в: НТУ "ХП1". - 2017. - № 50 (1271). - С. 55 -65.

Розглянуто проблемы в1зуал1заци послщовностей великих набор1в даних. Задачу пошуку оптимального вщображення даних сформульовано у вигляд1 задач1 вибору алгоритму спрощення простих пол1гональних ланцюпв з мшмальною к1льк1стю помилок. Виконано анал1з ефективносп алгорштшв Рамера-Дугласа-Пекера, Реумана-Вггкама, Опхейма, Ланга, алгоритму виключення за висотою трикутника та алгоритму рад1ального виключення точок при робот з великими даними. Наводяться результати пор1вняння та оцшки ефективносп !х використання для анал1зу реальних даних, що збираються в системах локомотивно! безпеки. 1л.: 2. Табл.: 1. Ыблюгр.: 15 назв.

Ключов1 слова: в1зуал1зац1я; велиш набори даних; алгоритм спрощення; пол1гональний ланцюг; система локомотивно1 безпеки.

УДК 004.922

Подходы к эффективному упрощению и визуализации больших наборов данных / Скарга-Бандурова И.С., Грушка М.О., Барбарук Л.В. // Вестник НТУ "ХПИ". Серия: Информатика и моделирование. - Харьков: НТУ "ХПИ". - 2017. -№ 50 (1271). - С. 55 - 65.

Рассмотрены проблемы визуализации последовательностей больших наборов данных. Задача поиска оптимального отображения данных сформулировано в виде задачи выбора алгоритма упрощения простых полигональных цепей с минимальным количеством ошибок. Выполнен анализ эффективности алгоритмов Рамера-Дугласа-Пэкера, Реумана-Виткама, Опхейма, Ланга, алгоритма исключения по высоте треугольника и алгоритма радиального исключения точек при работе с большими данными. Приведены результаты сравнения и оценки эффективности их использования для анализа реальных данных, собираемых в системах локомотивной безопасности. Ил.: 2. Табл.: 1. Библиогр.: 15 назв.

Ключевые слова: визуализация; большие наборы данных; алгоритм упрощения; полигональная цепь; система локомотивной безопасности.

UDC 004.922

Approaches for Efficient Simplification of Large Datasets / Skarga-Bandurova I.S., Grushka M.O., Barbaruk L.V. // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2017. -№. 50 (1271). - P. 55 - 65.

The problems of visualization of sequences of large data sets are considered. The task of finding an optimal data mapping is formulated in the form of selecting the best algorithm for simplification of simple polygonal circuits with a minimum number of errors. The analysis of the efficiency of variation of Ramer-Douglas-Packer algorithm, Reumann-Whitcom algorithm, Opheim algorithm, Lang simplification algorithm, the triangle exclusion algorithm and the radial exclusion algorithm for large data sets are performed. The results of comparison and estimation of their efficiency for the analysis of real data collected in systems of locomotive safety are presented. Figs.: 2. Tabl.: 1. Refs.: 15 titles.

Keywords: visualization; large data sets; simplification algorithm; polygonal circuits; system of locomotive safety.

i Надоели баннеры? Вы всегда можете отключить рекламу.