Научная статья на тему 'Програмно-апаратні засоби високопродуктивних обчислювальних систем для задач біометрії'

Програмно-апаратні засоби високопродуктивних обчислювальних систем для задач біометрії Текст научной статьи по специальности «Экономика и бизнес»

CC BY
169
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
біометрія / високопродуктивні обчислення / обчислювальні кластери / GPU / biometry / high performance computing / computing clusters / GPU

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Г В. Поліщук, С А. Лупенко, А М. Луцків

Зроблено аналіз та обґрунтування сучасних доступних програмно-апаратних засобів для задач біометрії. Сформовано вимоги до високопродуктивної обчислювальної системи для біометричних задач. Розроблено проект кластерної системи для біометричних досліджень, виходячи з критеріїв гнучкості, доступності, функціональності та простоти розробки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Г В. Поліщук, С А. Лупенко, А М. Луцків

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Software and hardware components for high-performance compute system for biometric tasks

The article deals with the analysis and substantiation of modern low cost hardware and software tools for biometric problems. Requirements for high-performance computing systems for biometric tasks are formed. The design of cluster system for biometric research based on the criteria of flexibility, availability, functionality and ease of development is developed.

Текст научной работы на тему «Програмно-апаратні засоби високопродуктивних обчислювальних систем для задач біометрії»

5. Царук О.В. Статистичне прогнозування державного боргу Укра!ни на 0CH0Bi процесiв Бокса- Дженкшса / О.В. Царук // Проблеми статистики : зб. наук. праць. - 2007. - Вип. 8. - С. 247-253.

6. Соловьева Ю.С. Моделирование экономических процессов с применением нейросете-вых технологий / Ю.С. Соловьева, Т.И. Грекова // Вестник Томского государственного университета. - 2009. - № 1(6). - С. 49-59.

7. Савченко С.А. Застосування МГУА для прогнозування вдексу розвитку людського потенщалу Украши / С.А. Савченко, А.Г. Кондирiвна, О.В. Директоренко // 1ндуктивне моде-лювання складних систем. - 2011. - № 3. - С. 183-190.

8. Горкуненко А.Б. Порiвняльний анашз математичних моделей ци^чних економiчних процесiв в iнформацiйних системах тдтримки прийняття економiчних рiшень / А.Б. Горкуненко, С.А. Лупенко, Г.М. Осуивська // Науковий вюник НЛТУ Украши : зб. наук.-техн. праць. - Львiв : РВВ НЛТУ Украши. - 2012. - Вип. 22.5. - С. 345-351.

9. Горкуненко А.Б. Математичне моделювання та статистичний сумюний анашз взаемо-пов'язаних економiчних цикшчних процесiв / А.Б. Горкуненко, А.М. Луцгав, С.А. Лупенко // Вюник Хмельницького нащонального унiверситету. - Сер.: Техичш науки. - Хмельницький. - 2011. - № 1. - С. 137-143.

Горкуненко А.Б., Лупенко С А. Обоснование диагностических и прогностических признаков в информационных системах анализа и прогнозирования циклических экономических процессов

Обоснованы диагностические и прогностические признаки в информационных системах анализа и прогнозирования циклических экономических процессов на базе теории циклических случайных функций, что позволило обеспечить минимальность по объему и полноте по информативности диагностических и прогностических признаков, по которым осуществляется оценка, диагностика и прогнозирование состояния исследуемых экономических процессов в системах поддержки принятия экономических решений.

Ключевые слова: анализ, прогнозирование, циклический экономический процесс, диагностические и прогностические признаки.

Horkunenko A.B., Lupenko SA. Justification of diagnostic and prognostic features in information systems of analysis and forecasting of cyclical economic processes.

Diagnostic and prognostic features in information systems of analysis and forecasting of cyclical economic processes based on the theory of cyclic random functions are proved, which allowed us to provide minimal volume and fullness of informative diagnostic and prognostic features, which provide evaluation, diagnosis and prognosis of economic processes subjects in support systems of economic decision making.

Keywords: analysis, forecasting, cyclical economic process, diagnostic and prognostic features.

УДК 004.272 Астр. Г.В. Полiщук; проф. С.А. Лупенко, д-р техн. наук;

доц. А.М. Луцмв, канд. техн. наук - Тернотльський НТУ

ПРОГРАМНО-АПАРАТН1 ЗАСОБИ ВИСОКОПРОДУКТИВНИХ ОБЧИСЛЮВАЛЬНИХ СИСТЕМ ДЛЯ ЗАДАЧ БЮМЕТРН

Зроблено аналiз та обгрунтування сучасних доступних програмно-апаратних засобiв для задач бюметри. Сформовано вимоги до високопродуктивно! обчислю-вально! системи для бюметричних задач. Розроблено проект кластерно! системи для бюметричних дослщжень, виходячи з критерй'в гнучкост^ доступности функцюналь-ност та простоти розробки.

Ключовг слова: бiометрiя, високопродуктивш обчислення, обчислювальш кластери, GPU.

На сьогодш бюметрто широко застосовують у таких галузях, як медицина та шформацшна безпека. Основними 11 задачами е планування спостере-жень фiзичних властивостей бiологiчних об'ектiв та оброблення отриманих результата дослiджень за допомогою математичних методiв.

Досить широкого застосування бiометрiя набула в галузi комп'ютерно1 безпеки. Бiометричнi методи аутентифжацп, дають змогу обмежити доступ до конфщенцшно! шформацп та матерiальних цiнностей завдяки статичним (вiдбитки пальщв, райдужна оболонка ока, риси обличчя, геометрiя долош) або динамiчним (тдпис, хода, динашка мовлення) бiометричним ознакам людини.

У медичнш галузi для бюметрп використовують показники життедь яльностi органiзму пацiента. Об'ем таких даних постшно зростае i використо-вуеться для дiагностики та терапп. Основним завданням медично1 бюметрп е пiдвищення якостi обслуговування пащенлв шляхом нагромадження, ушфь кацп та анатзу бiометричних даних. Також у медичнш бюметрп актуальни-ми е задачi електронного навчання лiкарiв, популяцшних дослiджень та ство-рення систем тдтримки прийняття медичних рiшень, що становить основу телемедицини та веб-орiентованоl охорони здоров'я.

Тому доцiльним е створення багатофункцюнально!, гнучко1 за можли-востями використання рiзних методiв бюметрп для рiзних даних, високош-видюсно! апаратно-програмно1 системи, яка була б доступною за щною та простою з точки зору реатзацп конкретних цшей.

Метою роботи е обгрунтування вибору програмно-апаратних засобiв комп'ютерно! системи для опрацювання бiометричних даних з використан-ням розподiлених обчислень.

Вимоги до комп'ютерно'! бюметричноТ системи. Щд бiометричною системою можна вважати автоматизовану систему, що здатна отримувати з сенсорiв данi про користувача, опрацьовувати отримаш данi, видiляти шфор-мативнi ознаки з опрацьованих даних, а у випадку бюметрично! аутентифжа-цп порiвнювати отриманi ознаки з бюметричними еталонами й визначати стутнь 1х подiбностi [1]. Для випадку бюметрично! дiагностики система повинна забезпечувати можливють вiдбору, опрацювання, анатзу i прогнозу-вання фiзичного та психолопчного стану пацiентiв за !х бiометричними (зок-рема циклiчними) сигналами.

Вимоги до бюметричних систем [2]:

1. Стабшьшсть (система повинна розр1зняти користувач1в незалежно вщ змш у зовшшност1);

2. Масштабовашсть (система повинна мати можлив1сть накопичення ресур-мв без значних змш у 11 архггектур1);

3. Зручшсть у використанш (зручний штерфейс для керування системою та роботи з даними);

4. Вщкрилсть (програмне забезпечення та алгоритми роботи системи по-винш бути вщкритими);

5. Нечутлив1сть до змш у зовшшньому середовищ1 (змши температури, во-логоста, освгглення тощо не повинш викликати збо1в роботи системи)

6. Захищешсть даних;

7. Техтчна пiдтримка;

9. Неiнвазивнiсть;

10. Яюсть отриманих даних (система повинна забезпечувати точнiсть та достовiрнiсть отриманих даних);

11. 1нтегроватсть (iнтероперабельнiсть та штегрування в iншi системи);

12. Вартють.

У загальному випадку бюметрична система може бути представлена таким чином (рис. 1).

Рис. 1. Загальна структурна схема бюметрично'1 системи

У pa3i збшьшення кшькост Kop^TyBa4iB бюметрично! системи, на-вантаження на Bci пiдсистеми зростае, що призводить до збшьшення затри-мок у 11 робот^ а при проведеннi дiагностики та терапи час опрацювання даних е критичним. Тому шд час проектування бюметрично! системи необхщ-но врахувати параметри швидкоди процесора чи процесорiв, об'ем оперативно! та дисково! пам'ятi i швидюсть доступу до не!.

Одним i3 критерив вибору програмно! платформи бюметрично! системи е зручнiсть розробки для не! програмного забезпечення, наявшсть шстру-ментальних засобiв: утилiт та вихщного коду вiдповiдних утилiт, бюметрич-них бiблiотек з реалiзованими алгоритмами опрацювання та шдтримкою вщ-повщних форматiв даних. Також потрiбно врахувати критерш зручностi суп-роводу системи, який визначаеться документовашстю, доступнiстю i вщкри-тiстю И компонент.

Основними критерiями для обгрунтування вибору апаратних засобiв системи бюметри з точки зору опрацювання даних е: 1) швидкодiя процесо-рiв та доступний !м об'ем пам'ятi; 2) швидкiсть доступу та латентнiсть при доступ до оперативно! та дисково! пам'ят (на одному вузлi та в системах з розподшеною пам'яттю); 3) ушверсальшсть системи; 4) зручнiсть розробки програмного забезпечення для бюметри; 5) зручшсть супроводу системи; 6) вартють апаратних та програмних компонент системи. Здшснимо обгрунтування апаратно-програмного комплексу паралельних обчислень для реалiза-ци методiв бiометрi! з урахуванням наведених критерив.

Огляд та обгрунтування апаратних 3aco6iB паралельних обчислень для задач бюметри. Досить поширеною технолопею паралельних обчислень е GPGPU (General-Purpose computation on Graphic Processor Unit), що використовуе для обчислень графiчнi процесори вщеокарт. Однiею з таких програмно-апаратних арх^ектур е CUDA (Compute Unified Device Architecture), розроблена компашею nVIDIA. Обчислювальнi можливост мають не лише спецiалiзованi плати, типу nVidia Tesla GPU Modules [3], але i звичайш вь деокарти nVidia, якi можуть бути використат як пристро! для обчислень. Альтернативною технолопею CUDA вщ компанi! AMD е APP SDK (Accelerated Parallel Processing Software Development Kit). Проте з метою забезпечення ушверсальносл створюваного ПЗ доцшьно скористатись технологiю

OpenCL. Використання графiчних процесорiв набуло широкого застосування в бюметрп [4, 5]. Графiчнi карти е багатоядерними та тдтримують багатопо-токовють, а також е доступними за щною, однак вимагають вiд розробникiв бiометричних систем Грунтовно! пiдготовки для написання вiдповiдного програмного забезпечення.

1ншою технологiею паралельних та розподiлених обчислень е FPGA (Field-Programmable Gate Array) - програмоваш лопчш iнтегральнi схеми (ПЛ1С). Порiвняно з GPU, ПЛ1С е дорожчою та передбачае теоретичш знання та практичнi навички в апаратному забезпеченш, однак, як показуе досвщ [13], дае змогу досягти значно! продуктивностi. Виробники намагаються по-долати труднощi розробки програм, створюючи високорiвневi мови програ-мування (DIME-C, Mitrion-C, Handel-C), проте в бшьшосп випадкiв вони е залежними або вщ обладнання, або вiд виробника, а також у разi !х застосування втрачаеться продуктивнiсть порiвняно з методом програмування на ба-зi VHDL-описiв. До переваг ПЛ1С можна вiднести високу енергоефектив-шсть та можливiсть змiни архiтектури обчислювально! системи. 1х використання е доцшьним за значних iнформацiйних потоюв, а також пiд час оброб-лення даних у режимi реального часу.

Ефективним при опрацюванш сигналiв е цифровi сигнальнi процесори (DSP-Digital Signal Processor), як е орiентованi на типи даних з фжсованою та плаваючою комою та показують хорошi результати при !х опрацюванш. Системи на основi таких процесорiв використовують у медицинi, опрацюван-ш звуку, зображення та мультимедiйних даних. DSP-процесори е швидшими при опрацюванш цифрових сигналiв та бiльш енергоефективними порiвняно з CPU, мають високу пропускну здатнiсть, але не е ушверсальними.

Найбiльш доступними на сьогодш апаратними платформами для висо-копродуктивних обчислень е кластернi системи. Вони передбачають об'еднання високошвидюсними каналами зв'язку обчислювальних машин, що здатнi працювати автономно для виршення ресурсоемких задач.

"Вузьким мiсцем" кластерних систем з розподшеною пам'яттю, е ко-мушкацшне середовище (мережа). 1снуе ряд технологш для високошвидюс-но! передачi даних по мереж^ зокрема InfiniBand, SCI, 10Gigabit Ethernet то-що. Однак таю технологи е достатньо вартюними. При оргашзацп кластера з точки зору доступносп, потрiбно розглядати стандарти передачi даних з пропускною здатнютю 1 Гб/c (Gigabit Ethernet). На базi цього стандарту можна створити обчислювальну та сервiсну мережг Недолiком тако! мережi е висо-ка латентнiсть, однак перевагою е доступна щна.

Для органiзацi! високопродуктивно! паралельно! розподiлено! комп'ю-терно! системи (ПРКС) е доцiльним використання кластерно! технологi! з SMP-вузлами. Як CPU варто використати багатоядерш процесори AMD Phe-nom II X4 980, що е досить слушно з точки зору сшввщношення "щна/про-дуктившсть". При виборi графiчних процесорiв для роботи з цифровими сигналами потрiбно врахувати тдтримку форматiв даних з плаваючою крапкою (float, double). Вщеокарти nVidia серп Tesla C2xxx, GTX 4xx, GTX 5xx, GTX 6xx, а також деякi вщеокарти серi! Quadro пiдтримують формат даних як з одинарною, так i з подвшною точнiстю зпдно з [11] (compute capability 2.0).

Оскiльки бшьшють медичних закладiв перебувае на державному фшансуван-ш то придбати нове спещ^зоване обладнання nVidia е досить проблематично, то вибiр GTX 465 е цшком прийнятним як з точки зору щни, так i з точки зору тдтримки форматiв даних. Мережу потрiбно розгортати на базi Gigabit Ethernet. Щд час розробляння програмного забезпечення потрiбно врахувати значнi затримки при мiжвузловiй взаемодiï, тобто варто мiнiмiзувати обмш даними мiж обчислювальними елементами, а першим кроком модершзацп ПРСК буде змша комунiкацiйного iнтерфейсу. Основнi розрахунки треба здiйснювати на обчислювальних ядрах GPU. Така конф^ращя буде дос-татньо продуктивною та недорогою, за рахунок використання процесорiв AMD Phenom, вiдеокарт nVidia GTX 465, яю реалiзують сучасну архiтектуру Fermi (Compute capability: 2.0), та середовища обм^ даними Gigabit Ethernet [7]. Використання ^eï конфiгурацiï апаратного забезпечення уможливить доступшсть, достатню продуктивнiсть, гнучкiсть i зручнють розв'язання бь ометричних задач.

Актуальним питанням в обласп бюметрп, а зокрема в медичнш галуз^ е застосування грiд-технологiй. Впровадження eдиноï електронноï системи з використанням програмно-апаратних засобiв грiд-середовища дасть змогу проводити популяцшш дослiдження, навчання спецiалiстiв, розробку систем пiдтримки прийняття рiшень, тестування та порiвняння дiагностичних мето-дiв. В Украïнi одним iз таких проекпв е "Медична Грiд-система для популя-цiйних дослiджень у галузi кардiологiï на базi даних електрокардюграм" [12]. Однак е низка проблем, пов'язаних iз впровадженням грiд, а саме неоднорщ-нiсть стандартiв збереження даних та висок вимоги до пропускних здатнос-тей мережевоï шфраструктури, також брак фiнансування та мала юльюсть спецiалiстiв у галузi [10].

Огляд та обГрунтування програмних засоб1в паралельних обчислень для бюметрп. Вагомим фактором, що визначае гнучюсть i доступшсть системи бюметричних дослщжень, е використання вiльного вiдкритого програмного забезпечення [6]: прикладного та системного, а також засобiв його розробки. Також у виборi операцiйноï системи ПРКС для бюметричних дос-лщжень потрiбно врахувати критерiï тдтримки нею апаратного забезпечення, зокрема процесора (процесорiв/ядер) i пам'яп, системноï плати, мереже -вих адаптерiв, спецiалiзованих вiдеокарт з пiдтримкою GPGPU та технологи паралельних та розподшених обчислень. У бшьшосп випадкiв, для побудови кластерних систем використовують рiзнi дистрибутиви GNU/Linux, осюльки вони е вщкритими i безкоштовними, а також шдтримують апаратнi засоби ПРКС. У ролi програмних засобiв доцiльно використати безкоштовний ком-пшятор - GCC, а також iншi засоби розробки проекту GNU.

Для проведення дослщжень можна скористатись засобами розробки компанп Intel: безкоштовною версieю компiлятора Intel C/C++ та спецiалiзо-ваною бiблiотекою Intel Math Kernel Library (MKL), що е оптимiзованою для додатюв максимальноï продуктивностi та включае швидке перетворення Фур'е. Однак надалi доцiльно використовувати вщкрип бiблiотеки для робо-ти з сигналами, таю як fftw (Fastest Fourier Transform in the West), vsipl (Vector Signal and Image Processing Library), GNU Scientific Library та шшг

Рис. 2. Архтектура обчислювального кластера

Для програмування на окремих обчислювальних вузлах, де розпарале-лення вiдбуваeться в межах деюлькох ядер одного процесора, варто викорис-товувати програмний iнтерфейс OpenMP, що пiдтримуeгься мовами C/C++ та Fortran, для мiжвузловоï взаeмодiï доцшьно використати програмний штер-фейс MPI, що е вщкритим та забезпечуе ефективну взаeмодiю мiж процеса-ми, а для програмування вщеокарт з тдтримкою GPU фiрми nVidia -OpenCL (Open Computing Language), що e вщкритою та кросплатформеною i дае змогу використовувати апаратне забезпечення з шдтримкою GPGPU рiз-них виробниюв.

Для керування кластером доцшьно використовувати систему пакетноï оброблення завдань - SLURM, менеджер черг Maui та систему веб-мошто-рингу Ganglia. Для забезпечення зручного керування кластером варто скорис-татись програмним засобом SCMS-EMI [9]. Для промiжного програмного забезпечення (middleware) при тдключенш до грiд-мережi УНГ (Укра'нський нацiональний грщ), що е частиною мiжнародного об'еднання NorduGrid [8], варто використати ARC (Advanced Resource Connector), однак при ствпращ з европейськими установами варто використовувати gLite, що е основним стандартним промiжним програмним забезпеченням (Europian Grid Infrastructure) [10].

На думку авторiв бажано, щоб програмне забезпечення кластерноï системи було безкоштовним, а також вщкритим i розповсюджуеться тд ль цензiями BSD та GPL [6].

Арх1тектура кластерно'1 системи. У робот [7] запропоновано архь тектуру обчислювального кластера для задач криптоаналiзу, що використо-вуе бiльшiсть засобiв паралельних i розподiлених обчислень, а також обгрун-товано використання дистрибутиву ALTLinux для побудови високопродук-тивноï обчислювальноï системи. Кластер повинен забезпечувати безпере-бшний доступ до ресурсiв, а його швидкодiя бути достатньою для вирiшува-них задач. Також бiометрiя передбачае проведення популяцшних дослiджень, якi оперують великими та розподшеними обсягами даних, тому доцшьно ско-ристатись розподшеними файловими системами, а саме Lustre FS, що дасть змогу балансувати навантаження при достут до даних, резервувати дат, зменшити загальну вартють сховища за рахунок використання типових комп'ютерiв i недорогих жорстких дисюв та нагромадити значний об'ем ш-формацiï.

Висновок. Отже, сформовано вимоги для високопродуктивного апа-ратно-програмного комплексу для розв'язання задач бюметрп у паралельних та розподшених комп'ютерних системах. Здшснено вибiр i обгрунтування доступних програмно-апаратних засобiв для бiометричних систем, яю харак-теризуються гнучкiстю, багатофункцюнальшстю та доступнiстю за цiною.

Л1тература

1. Романов В.О. Технологй' аутентифжаци особи за б1ометричними характеристиками / В.О. Романов, 1.Б. Галелюка, n.C. Клочан // Комп'ютерн1 засоби, мереж1 та системи. - 2010. -№ 9. - C. 54-61.

2. Dunstone T Biometric System and Data Analysis Design, Evaluation, and Data Mining / T. Dunstone, N. Yager // Eveleigh, NSW, Australia - Springer Science+Business Media LLC., 2009.

- 267 p.

3. Боресков А.В. Основы работы с технологией CUDA / А.В. Боресков, А.А. Харламов.

- СПб. : ДМК Пресс, 2010. - 230 с.

4. Broussard R.P. Accelerating Image Based Scientific Applications using Commodity Video Graphics Adapters / R.P. Broussard, R.W. Ives // Systems Engineering Department / U.S. Naval Academy Annapolis, MD 21402, USA.

5. B^k S. Human Re-identification System On Highly Parallel GPU and CPU Architectures / S. B^k, K. Kurowski, K. Napierala // Multimedia Communications, Services and Security 149 (2011).

6. Бойко I. Вщкрите програмне забезпечення для розробки шформацшних систем: по-рiвняльний аналiз i перспективи розвитку в Укра!ш / I. Бойко, С. Лупенко, А. Луцгав // Комп'ютинг / Терношльська академiя народного господарства. - Тернотль. - 2005. - Т. 4, вип. 1. - С. 99-106.

7. Загородна Н.В. ОбГрунтування вибору доступних програмно-апаратних засобiв висо-копродуктивних обчислювальних систем для задач криптоанашзу / Н.В. Загородна, С.А. Лупенко, А.М. Луцюв // Електрошка та системи управлшня / Нацiональний авiацiйний ушверси-тет. - К. : Вид-во НАУ. - 2011. - № 1(27). - С. 42-50.

8. Мартинов С. Укра!нський Нащональний Грщ - учасник мiжнародного об'еднання NorduGrid / С. Мартинов, О. Смiрнова // Вiсник НАН Укра!ни, 2011. - № 12. - С. 30.

9. Supercomputer Management System. [Electronic resource]. - Mode of access http://www.scms.pro/.

10. Мартынов Е.С. Развитие Грид-инфраструктуры в Украине. Состояние и проблемы / Е.С. Мартынов // Кластерш обчислення : матер. Мiжнар. конф. - К. : Вид-во 1н-ту габернети-ки iм. В.М. Глушкова НАН Укра!ни, 2012. - С. 231-234.

11. IEEE 754-2008. IEEE 754-2008 Standard for Floating-Point Arithmetic. August, 2008.

12. Проект "Медична Грщ-система для популяцшних дослщжень в галузi кардюлогп на базi даних електрокардiограм". [Електронний ресурс]. - Доступний з http://www.medgrid. immsp.kiev.ua/.

13. Sundararajan P. High Performance Computing Using FPGAs // Xilinx, Tech. Rep. - 2010.

- Pp. 23-29.

Полищук Г.В., Лупенко С.А., Луцкив А.М. Программно-аппаратные средства высокопроизводительных вычислительных систем для задач биометрии

Проведены анализ и обоснование современных доступных программно-аппаратных средств для задач биометрии. Сформированы требования к высокопроизводительной вычислительной системе для биометрических задач. Разработан проект кластерной системы для биометрических исследований исходя из критериев гибкости, доступности, функциональности и простоты разработки

Ключевые слова: биометрия, высокопроизводительные вычисления, вычислительные кластеры, GPU.

Polishchuk G.V., Lupenko SА., Lutskiv А.М. Software and hardware components for high-performance compute system for biometric tasks

The article deals with the analysis and substantiation of modern low cost hardware and software tools for biometric problems. Requirements for high-performance computing systems for biometric tasks are formed. The design of cluster system for biometric research based on the criteria of flexibility, availability, functionality and ease of development is developed.

Keywords: biometry, high performance computing, computing clusters, GPU.

i Надоели баннеры? Вы всегда можете отключить рекламу.