УДК 681.142:612.822 Проф. 1.Г. Цмоць, д-р техн. наук; доц. Я.П. Kicb,
канд. техн. наук; студ. О.В. Скорохода - НУ "nbeiecbrn nолiтехнiка"
1НТЕГРОВАНИЙ П1ДХ1Д ДО СИНТЕЗУ ВИСОКОЕФЕКТИВНИХ АПАРАТНИХ ЗАСОБ1В НЕЙРОМЕРЕЖЕВИХ ТЕХНОЛОГ1Й
РЕАЛЬНОГО ЧАСУ
Проаналiзовано засоби реалiзащï та шляхи побудови штучних нейромереж реального часу, вибрано принципи розроблення, розглянуто основш етапи синтезу апа-ратних засобiв, визначено основнi шляхи тдвищення ефективностi використання об-ладнання та вдосконалено метод просторово-часового вщображення нейроалгорит-мiв в узгоджено-паралельнi структури.
Prof. I.G. Tsmots; assoc. prof. Ya.P. Kis; stud. O. V. Skorokhoda -
NU "L'vivs'kaPolitekhnika"
Integrated approach to the synthesis of high-performance hardware neural network real-time technology
Facilities technique and ways of construction of artificial networks of real-time were analyzed, principles of development were selected and main stages of synthesis of hardware design were considered. Main ways of rise of efficiency equipment were detected and method of spatio-temporal mapping of neuroalgorithm into consistently parallel structure was improved.
Вступ. Для сучасного етапу розвитку штучних нейромережевих (ШНМ) технологш характерне розширення сфер застосування. Йдеться на-самперед про ri галуз^ специфжа яких потребуе опрацювання за складними алгоритмами у реальному час р1зних за штенсившстю надходження потоюв даних на апаратних засобах (АЗ), що задовольняють обмеженням щодо габа-рит1в, енергоспоживання, вартост та часу розроблення. Створення таких АЗ потребуе широкого використання сучасноï елементноï бази (нашвзамовних i замовних НВ1С, однокристальних мiкропроцесорiв) та розроблення нових методiв, алгоршшв i НВ1С-структур для реалiзацiï нейроалгорштв.
Аналiз задач, що розв'язуються за допомогою ШНМ, методiв i алго-ритмiв ïхнього розв'язання виявив таю особливост [1]:
• великий об'ем обчислень з перевагою обчислювальних операцш над лопчни-ми;
• постштсть i висока штенсивтсть надходження даних;
• регуляртсть i рекурсивтсть алгоршмв;
• можлившть розпаралелювання процесу оброблення як у час1, так i в простора Для забезпечення розв'язання задач у реальному час за допомогою
ШНМ продуктившсть АЗ повинна бути:
П >
fîRFdknd
Nn
де: П - складнiсть алгорштв розв'язання задач; в - коефщент врахування особливостей засобiв реалiзацiï алгоритму; R - юльюсть операцiй, потрiбна для реалiзацiï алгоритму; Fd - частота надходження даних у каналах; k - кшьюсть каналiв надходження даних; nd - розрядшсть каналiв надходження даних; N - величина i n - розрядшсть вхщного масиву даних.
Режим реального часу шд час оброблення штенсивних потокiв даних за складними алгоритмами забезпечуеться розпаралелюванням i конвеериза-щею процесiв обчислень i використанням нових технолопчних досягнень в областi розроблення надвеликих штегральних схем (НВ1С). З огляду на це, актуальним завданням е розроблення високоефективних АЗ для ШНМ реального часу.
Постановка задачi та формулювання мети дослвдження. Для розроблення конкурентноздатних та ефективних ШНМ реального часу потрiбно використовувати НВ1С i просторово-часове розпаралелювання. У паралель-но-конвеерних ШНМ реального часу висока ефектившсть використання об-ладнання досягаеться завдяки узгодженню штенсивност надходження пото-кiв даних з обчислювальною iнтенсивнiстю АЗ. Аналiз юнуючих варiантiв апаратно! реалiзацй ШНМ реального часу [2] виявив таю недолжи:
• забезпечення режиму реального часу потребуе великих затрат обладнання;
• велика вартють 1 термши розробляння ШНМ реального часу для розв'язання конкретних задач;
• не враховуються вимоги конкретних застосувань щодо габарипв 1 спожива-но! потужностц
• алгоритми оброблення та архггектури ШНМ не зор1ентоват на НВ1С-реал1-защю 1 не забезпечують узгодження штенсивност! надходження даних з ш-тенсивтстто обчислень;
• апаратт засоби ШНМ реального часу мають низьку ефектившсть викорис-тання обладнання.
Для усунення перерахованих недолтв пропонуемо розробити апарат-нi узгоджено-паралельнi ШНМ, як просто адаптуються до вимог конкретних застосувань i забезпечують високу ефектившсть використання обладнання.
Метою цього дослiдження е вибiр принцишв, засобiв реалiзацй та шляхiв пiдвищення ефективностi використання обладнання, розроблення методу синтезу високоефективних АЗ для ШНМ реального часу.
Виклад основного матерiалу. Аналiз i вибiр засобiв комп'ютерно1 ре-алiзацli алгоритмiв ШНМ. Ефектившсть комп'ютерно! реалiзацil алгорштв ШНМ безпосередньо пов'язана з вибором засобiв реалiзацй: програмних, мж-ропрограмних або апаратних [1, 2].
Шд час програмно! реалiзацil алгоритмiв ШНМ обчислювальнi проце-си переважно розгортаються в часi з великим обсягом пересилання шформа-цй мiж оперативною пам'яттю i операцiйними пристроями. Програмнi засоби е доступними для програмюта, перед яким виникае задача мiшмiзацй обсягу програм i часу !х реалiзацil за задано! точностi обчислень. Вказанi засоби характеризуются низькою швидкодiею i гнучюстю з погляду можливостi мо-дифжацй та замiни алгоритмiв.
Мiкропрограмна реалiзацiя обчислень потребуе !хнього розгортання як у чаЫ, так i в просторь Пiд час мiкропрограмування е доступ до системи мжропрограм процесора, що забезпечуеться застосуванням постшно! пам'ят^ програмованих логiчних матриць, а також оперативних запам'ятовувальних пристро!в, використовуваних як пам'ять мiкропрограм. Прикладом мшроп-рограмно! реалiзацil е реалiзацiя алгоритмiв ШНМ на базi одноманiтних об-
числювальних середовищ (ООС). Процесор на 6a3i ООС - це двовимiрна регулярна матриця процесорних елементiв (ПЕ), кожен з яких фiзично пов'яза-ний входом-виходом з чотирма сусщами - зверху, знизу, злiвa та справа [2]. Кожний ПЕ може виконувати нaбiр бггових оперaцiй перетворення шформа-ци з вхiдних кaнaлiв у вихiднi. Процесор на бaзi ООС е унiверсaльною системою, тобто в ньому можливо реaлiзувaти довiльну обчислювальну функцiю. Бiтовий рiвень ПЕ та повна система комутацп дають змогу реaлiзувaти розпа-ралелення обчислень на найнижчому бiтовому рiвнi. У цьому полягае iстотнa перевага мжропрограмно! реaлiзaцiï aлгоритмiв ШНМ. Реaлiзaцiï повною мь рою потенцiйних можливостей мжропрограмних зaсобiв може бути досягну-то лише за умови глибокого вивчення задач^ яка розв'язуеться, та внут-рiшньоï мови процесора. Мшропрограмш засоби реaлiзaцiï aлгоритмiв ШНМ, порiвняно з програмними, е бiльш швидкоддачими.
Успiхи iнтегрaльноï технологiï дають змогу дедaлi бiльше переклада-ти реaлiзaцiю aлгоритмiв ШНМ на aпaрaтнi засоби, яю розгортають обчис-лення не тшьки у чaсi, a i в просторi. Тaкi обчислення потребують додатково-го обладнання i уникають промiжних пересилань iнформaцiï в процес обчислення, а також спрощують функцп мiсцевого упрaвлiння. В основi структурно:' оргaнiзaцiï апаратних зaсобiв покладено принцип адекватного апаратного вщображення потокових грaфiв aлгоритмiв ШНМ на комбшацшну матрицю, процесорнi елементи я^ реaлiзують функцiонaльнi оператори та з'еднаш мiж собою вiдповiдно з потоковим графом алгоритмом [3]. Синтезоваш за таким принципом структури е алгорштчними. В алгорштчних структурах алгоритм виконуеться над вхщними даними за ix одноразового проходження через всi ПЕ. За режимами роботи таю структури дшяться на синxроннi та асинхронш. В асинхронних (однотактних) структурах оброблення даних здшснюеться без промiжниx запам'ятовувань. Продуктивнiсть таких структур визначаеться часом виконання найскладшших функцiонaльниx оперaторiв Фj алгоритму, якi е на шляху проходження даних. Кожна однотактна структура послщовна з погляду реaлiзaцiï функцюнальних оперaторiв Фу. Це е причиною обмеженоï швидкоди та неефективного використання обладнання шд час оброблення iнтенсивниx потокiв даних у реальному чась Тому для оброб-ляння потокiв даних доцшьно використовувати синxроннi структури з кон-веерною реaлiзaцiею грaфiв aлгоритмiв, яка потребуе сумщення у чaсi виконання функцюнальних оперaторiв алгоритму над рiзними даними. Апaрaтнi засоби уможливлять з максимальною швидкодiею реaлiзовувaти алгоритми ШНМ, скоротити витрати на створення та експлуатащю програм. Це доступно тшьки розробникам арх^ектур ШНМ.
Потрiбно зазначити, що всi види реaлiзaцiï aлгоритмiв в безпосе-редньому виглядi трапляються досить рiдко. На практищ в бiльшостi випад-юв для реaлiзaцiï aлгоритмiв функцiонувaння ШНМ використовують комбь новaнi пiдxоди з перевагою одного з перерахованих зaсобiв. Переважання того чи шшого засобу визначаеться вимогами, яю ставляться до ШНМ за швид-кодiею, габаритами, потужнiстю споживання та цшою.
AnaÂÎ3 i eu6ip eapianmie побудови комп'ютерних ШНМ реального часу. Розглянемо три основш вaрiaнти побудови ШНМ реального часу: 5. 1нформацшш технологи r^yîi 271
• на основ! унiверсальних i функционально 3opiemoBaHHx MÏKponpou^ecopÎB шляхом розроблення спецiалiзованого програмного забезпечення;
• на основi утверсального обчислювального ядра, доповненого базовими апа-ратно-програмними компонентами, яю pеалiзують часомштк алгоритми фу-нкцюнування ШНМ;
• у виглядi спецiалiзованоï алгоpитмiчноï системи, архтктура та оpганiзацiя обчислювального процесу в якш ввдображае структуру алгоритму розв'язу-вання задачi.
Перший вар1ант е доступним для широкого кола користувач1в. 1стот-ною його перевагою е можливють використання рашше розроблених прог-рам. Його вадами е невисока швидкод1я, функцюнальна i структурна надлиш-ковють комп'ютерних засоб1в.
Другий вар1ант е перспективним, осюльки вш поеднуе ушверсальш та спещальш засоби. Таке поеднання забезпечуе високу ефектившсть використання обладнання шд час створення систем для опрацювання у реальному час потоюв даних за алгоритмами, як е нерегулярними з великою юльюстю лопчних операцш. При цьому розробляння апаратних засоб1в з заданими тех-шчними параметрами зводиться до доповнення обчислювального ядра додат-ковими апаратно-програмними компонентами.
Третш вар1ант зор1ентований на обробляння у реальному час штен-сивних потоюв даних за складними алгоритмами. При цьому висока ефектившсть використання обладнання досягаеться узгодженням обчислювально1' здатност апаратних засоб1в з штенсившстю надходження потоюв даних. Використання для побудови апаратних засоб1в обчислювальних пол1в на основ! ПЛ1С з динам1чним репрограмуванням вщкривае нов1 можливост1, пов'язаш з оперативним переналаштуванням ПЛ1С на реал1защю конкретного алгоритму. Другий i третш вар1анти е найперспектившшими для синтезу ШНМ реального часу з високою ефектившстю використання обладнання.
Принципи розробляння апаратних 3aco6ie ШНМ. Арх1тектури ШНМ реального часу повинш повною м1рою використовувати можливост НВ1С-технологп, враховувати вартють плошд кристала, а також юльюсть вхщних i вихщних вивод1в. Число зовтштх вивод1в НВ1С обмежене р1внем технологи та величиною кристалу. В основу побудови ШНМ реального часу пропо-нуеться покласти принципи, як дадуть змогу зменшити вартють, термши i розширити галуз1 1'х застосування. Анал1з показуе [5], що забезпечити щ ви-моги можна, використавши таю принципи:
• модультсть, тобто розроблення компонентов АЗ у вигляд! функционально за-вершених пристро1в (модул!в), що мають вихвд на стандартний штерфейс;
• узгодженiсть iнтенсивностi надходження даних з обчислювальною здатнiстю АЗ;
• конвееризащя та просторовий паpалелiзм оброблення даних;
• одноматттсть та pегуляpнiсть архтктури ШНМ;
• локалiзацiя та спрощення зв'язшв мш елементами АЗ;
• вщкрипсть програмного забезпечення, що створюе можливост його нарощу-вання та вдосконалення, максимального використання стандартних драйве-р!в та програмних засобiв;
• спецiалiзацiя та адаптащя апаратно-програмних засобiв до структури алго-ритшв обробляння та штенсивносп надходження даних;
• програмоватсть арх1тектури шляхом використання репрограмованих лопч-
них штегральних мшросхем.
Синтез апаратних засобiв ШНМреального часу. Пропонуемо ство-рити високоефективш АЗ для ШНМ реального часу здшснювати на основi ш-тегрованого пiдходу, який грунтуеться на можливостях сучасно! елементно! бази та охоплюе методи, алгоритми паралельних обчислень, архiтектури апаратних засобiв, враховуе вимоги конкретних застосувань та штенсивност надходження даних.
При цьому задача синтезу АЗ для ШНМ реального часу зводиться до формування множин вимог Я={Я], Я2,..., Як], характеристик Н={Н1, И2,..., Нт] i обмежень В={В1, В2,..., Вк] та знаходження такого вектора Н =[Н ¡, Н
2,., Н*т], Н1—(Я, Н, В), ¿-1,..., т, який забезпечить максимальне значен-ня ефективност використання обладнання Е=шах/(Я, Н, В).
Множину вимог Я становить: Я1 - кiлькiсть каналiв надходження даних тЯ2 - розряднiсть каналiв надходження даних пЯ3 - частота надходження даних Я4 - швидкодiя елементно! бази, яка визначаеться часом за-тримки вентиля ¿в; Я5 - кшьюсть елементiв (слiв) вхiдного масиву Ы; Я6 - роз-ряднiсть вхiдного слова п. Множину характеристик Н становлять: Н\ - за-гальна кiлькiсть зв,язкiв 2; Н2 - просторова зв'язкова вiддаль А); Н3 - кон-веерний такт к Н4 - витрати обладнання Ж; Н5 - кшьюсть тишв функць ональних вузлiв **; Н6 - кшьюсть каналiв введення твв; Н7 - розряднiсть кана-лiв введення пвв; Н8 - кшьюсть виводiв iнтерфейсу зв'язку У. Обмеження В, яю потрiбно враховувати тд час синтезу апаратних засобiв реального часу, такi: В\ - точшсть обчислення, яка визначаеться розрядшстю результату пр;
В2 - час обчислення Тобч, повинен бути Тобч<Тобм, де Тобч = <кЫп , Тобм - час об-
тввпвв
мiну, який можна визначити так:
Т = Ып
Тобм = .
Для вибору варiанту АЗ реального часу використовують критерш ефективностi використання обладнання Е, який враховуе кiлькiсть виводiв штерфейсу, однорiднiсть структури, кiлькiсть i локальшсть зв,язкiв, пов'язуе продуктивнiсть з витратами обладнання та дае оцiнку елементам (вентилям) компонента за продуктившстю [2]. Кшьюсну величину ефективностi використання обладнання для такого апаратного засобу визначають таким чином:
Е =_тКпК_
(кЫп(к{£ Жфуг ф + к2<2 + кзУ)
I=1
де: ЖФУ - витрати обладнання у вентилях на реалiзацiю г-го функцiонального вузла, ф - кшьюсть функцюнальних вузлiв г-го типу, к1 - коефщент враху-вання одномаштност £?=/(**), к2 - коефiцiент врахування регулярност зв,язкiв к2=/( А/), к3 - коефщент врахування юлькост виводiв iнтерфейсу зв'язку
кз=т.
I
Конвеерний такт 1к визначають за формулою 1к = Е тах ^ , де I - кшь-
}
кiсть послiдовно з'еднаних вентилiв у найповiльнiшiй сходинцi конвеера, а Д/ - як рiзниця просторових шдексв.
Етапи синтезу апаратних засобiв. Синтез АЗ складаеться iз таких етатв: вибору та розроблення методiв i алгоритмiв узгоджено-паралельного обробляння, визначення основних параметрiв та переходу вiд алгоритму до структури [3].
Пщ час вибору та розроблення методiв i алгоритмiв узгоджено-пара-лельного оброблення враховують вимоги Я i характеристики Н, але визна-чальним е забезпечення обмежень В. Для оцiнки розроблених алгоритмiв ви-користовують характеристики: шформацшт, операцiйнi та точностi. До ш-формацiйних характеристик належать: кiлькiсть констант, вхiдних, вихiдних i промiжних даних, кiлькiсть каналiв i 1х розряднiсть, кiлькiсть i види опера-цiй. Операцiйнi характеристики дають змогу ощнити час ре^заци та обчис-лювальну здатнiсть. До характеристик точност алгоритму вiдносять: розряд-нiсть операцшних пристро!в, способи заокруглення. В шформацшних техно-логiях узгоджено-паралельного оброблення сигналiв у реальному часi потрiб-но забезпечити взаемозв'язок i узгодження параметрiв апаратних засобiв. Для апаратних засобiв реального часу одним iз найважливших параметрiв е узго-дженiсть штенсивносп надходження даних iз обчислювальною штенсившс-тю на всiх етапах обробляння.
До основних параметрiв оцiнки апаратних засобiв реального часу, крiм витрат обладнання, швидкодй, ефективностi використання обладнання пропонуемо використовувати обчислювальну здатнiсть. Для асинхронних (однотактних) апаратних засобiв, обробляння даних в яких вщбуваеться без промiжних запам'ятовувань, обчислювальну здатнiсть можна визначити так:
топо
ю'ю
Е тах к 1 БОк
/=1
де: т0 - кiлькiсть каналiв надходження даних; п0 - розряднiсть каналiв; к -кшьюсть послiдовно з'еднаних операцшних блоюв, tОБk - час ре^заци опе-
рацiйними блоками найскладнiших функщональних операторiв Ф/к.
Кожна однотактна структура е послщовною з погляду реалiзацil фун-кцiональних операторiв Ф/к. Це е причиною обмежено! швидкоди та неефек-тивного використання обладнання шд час обробляння iнтенсивних потокiв даних у реальному час. Тому для обробляння потоюв даних доцiльно використовувати синхронш структури з конвеерною реалiзацiею графiв алгорит-мiв, у яких вщбуваеться сумiщення у час виконання функщональних опера-торiв алгоритму над рiзними даними. Конвееризацiя структур апаратних за-собiв потребуе роздшення 1х на сходинки шляхом введення буферно! пам'ятi. При цьому кожна сходинка конвеера складаеться з двох компоненлв: буфер-но! пам'ятi та операцшних пристро!в, якi реалiзують функщональш операто-
ри ярусу. Для забезпечення високо! швидкоди та ефективност використання обладнання функцiональнi оператори, яю реалiзуються у сходинках кон-веера, мають бути простими та мати приблизно однаковий час ре^зацй. Од-нотактнi алгоритмiчнi пристро! можна розглядати як одностушнчастий кон-веер. Тому актуальним е синтез конвеерних структур апаратних засобiв реального часу з високою ефективнiстю використання обладнання.
У конвеерних АЗ обчислювальна здатшсть визначаеться так:
т п
в = ткпк
tБП + 1ОБ
де: tEn - час звертання до буферно! пам'ятц t0E - час обчислення операцшним блоком найскладнiшого функцiонального оператора Фд; тк - кiлькiсть кана-лiв надходження даних у сходинках конвеера; пк - розряднiсть каналiв надхо-дження даних у сходинках конвеера.
Шляхи тдвищення ефективностi використання обладнання. В АЗ для ШНМ реального часу висока ефектившсть використання обладнання до-сягаеться мiнiмiзацiею витрат обладнання у разi забезпечення реального часу. Перехщ вiд алгоритму розв'язання задачi в реальному часi до структури АЗ формально зводиться до мшiмiзаци витрат обладнання
к
Was = Win + Wn + Wny + £ Wm, ,
i=1
де: Was, Wny, Wn, Wn, WnE- витрати обладнання вiдповiдно на АЗ для ШНМ, пристро! управлшня, iнтерфейснi пристро!, пам'ять; к - кшьюсть типiв проце-сорних елеменлв, i-й процесорний елемент; mi - кшьюсть процесорних еле-ментiв i-го типу, за дотримання тако! умови:
Nn ^ tKNn (i)
тввпвв
Основними шляхами мiнiмiзацil АЗ для ШНМ реального часу е:
• врахування величини зм1ни елеменпв даних;
• виб1р ефективних метод1в 1 алгоритм1в реал1зацн функцюнальних операторов;
• зменшення розрядност операщйних пристро!в, пам'ят1, шлькосп та розряд-ност1 канал1в передач даних;
• узгодження штенсивносп надходження даних 1з обчислювальною здаттстю апаратних засоб1в.
Метод просторово-часового вiдображення нейроалгорuтмiв в узго-джено-паралельм структури. Для переходу вщ алгоритму до структури АЗ для ШНМ реального часу потрiбно розробити узгоджений потоковий граф [3-8]. Цей процес розробляння можна розбити на таю чотири етапи:
• декомпозищя алгоритму розв'язання задачу
• проектування комуткацш (обмшв даними) мiж функцюнальними операторами;
• укрупнення функцюнальних оператор1в;
• планування обчислень.
На етат декомпозици алгоритм розв'язання задачi Ф розбивають на функцюнальш оператори Фг-, мiж якими установлюються зв'язки, що вщповь дають цьому алгоритму. Чим бшьший ступiнь деталiзацil алгоритму отри-муемо внаслiдок декомпозици, тим гнучюшим буде алгоритм i тим легше можна здiйснити його адаптацiю до виконання завдання. Декомпозищю мож-на здшснювати за методом декомпозици даних або функцюнально! декомпозици. Використання методу функцюнально! декомпозици дае змогу отримати просторово-часове вщображення структури алгоритму на рiвнi операцiй Фь яю використовуються пiд час НВIС-реалiзацiях. Шд час використання методу декомпозицй даних спочатку сегментуються данi, а по^м алгоритми об-роблення. Вибiр методу декомпозици залежить як вщ структури даних, так i вщ алгоритму розв'язання задачi. На практищ для синтезу високоефективних алгоритмiчних структур реального часу використовують метод функцюналь-но! декомпозици, за якого алгоритм Ф розбивають на операцп Ф, кожна iз яких може бути реалiзована операцiйними блоками певного рiвня iерархil. Час i спосiб виконання операцй Ф1 операцiйним блоком е одними iз основних параметрiв шд час визначення конвеерного такту роботи Тк i розрядностi ка-налiв надходження даних пк для алгорштчних структур реального часу. Результатом першого етапу розробляння е графiчна схема алгоритму, де фун-кцюнальш оператори Ф1 мають приблизно однаковий час виконання, а !хня складшсть визначаеться засобами реалiзацil.
На еташ проектування комунiкацiй для конвеерно! алгорштчно! ре-алiзацil алгоритму потрiбно визначити структуру каналiв обмiну даними мiж функцiональними операторами Фг-. Для цього виконують перехiд вiд граф-схе-ми алгоритму до потокового графу, в якому здшснюють просторово-часове розмщення i закрiплення функцiональних операторiв Ф1 за ярусами. Структура зв'язкiв у потоковому графi мiж функцiональними операторами Ф)к сусщшх ярусiв визначае кшьюсть каналiв надходження даних т) i структуру з'еднань мiж операцiйними блоками шд час апаратно! реалiзацil алгоритму. У бшьшос-тi алгоритмiв цифрово! оброблення сигналiв передача даних мiж ярусами ви-конуеться методами досконалого тасування або обмiнноl перестановки.
За результатами перших двох еташв розроблення отримуемо потоко-вий граф, який дае змогу оцшити обчислювальну здатшсть Эк алгоритмiчних апаратних засобiв. Вихщними даними для визначення обчислювально! здат-ностi Эк е тк - кшьюсть каналiв надходження даних, пк - розряднiсть даних, складнiсть функцюнальних операторiв Фг-, особливостi i швидкодiя елемен-тно! бази. Використовувана елементна база i И швидкодiя е визначальними для оцiнки такту роботи Тк апаратних засобiв. Для оцшки узгодженостi iнтен-сивностi надходження даних iз обчислювальною здатнiстю Эк вводиться коефiцiент узгодженостi, який визначаеться так:
Б,
Я = ■
Ра
Узгодження обчислювально! здатностi Бк апаратних засобiв iз iнтен-сивнiстю надходження даних Ра досягають шляхом змши тривалостi такту Тк
або кшькосл mк i розрядностi пк канашв надходження даних у потоковому графь Пiд час розроблення узгодженого потокового графу алгоритму для ре-алiзацil апаратних засобiв з високою ефектившстю використання обладнання потрiбно насамперед максимально використати особливост та швидкодiю елементно! бази, тобто визначити складнiсть функцюнальних операторiв Ф1 i мiнiмiзувати тривалють такту Тк. Потiм треба змшювати кiлькiсть mк i роз-рядшсть пк каналiв у потоковому граф^ яка напряму пов'язана з використову-ваною елементною базою. Змiна параметрiв потокового графу алгоритму мае забезпечити узгодження обчислювально! здатностi Эк апаратних засобiв iз ш-тенсивнiстю надходження даних Р^.
У випадку, коли R=1, розроблений узгоджений потоковий граф забез-печуе отримання узгоджено-паралельно! структури пристрою реального часу з високою ефектившстю використання обладнання.
Якщо R<1, то для забезпечення оброблення потоюв даних у реальному час потрiбно збiльшити обчислювальну здатнiсть Вк, цього можливо до-сягти збшьшенням кiлькостi каналiв mк, 1хньо1 розрядност пк або зменшен-ням такту конвеера Тк., що досягаеться зменшенням складностi функцюналь-них операторiв Фг-. У разi, коли змiною перерахованих параметрiв не вдаеться досягнути належно! обчислювально! здатностi Вк, використовують паралель-не включення алгоритмiчних апаратних засобiв, кiлькiсть яких можна визначити з виразу:
л=~|1/яГ
де 1 Г - знак заокруглення до бшьшого цiлого.
У разi, коли R>1, для забезпечення високо! ефективност використання обладнання потрiбно переходити до третього етапу розроблення - укруп-нення функцюнальних операторiв Фд. На цьому етапi здiйснюеться об'еднан-ня функцiональних операторiв Фjk { каналiв передачi даних у ярусах потокового графа, або об'еднання функцюнальних операторiв сусщшх ярусiв. Граф алгоритму, який отримаемо внаслiдок такого об'еднання, будемо називати уз-годженим потоковим графом. Коефщент об'еднання V можна визначити так:
у< ] Бк/Ра I,
де ] |_ - знак округлення до меншого цiлого.
Внаслiдок об'еднання функцiональних операторiв v сусiднiх ярусiв ут-ворюеться один ярус функцюнальних макрооператорiв, у якому за v iтерацiй виконують обчислення таких функцюнальних макрооператорiв V. Обчислен-ня у серединi ярусу здшснюеться iз тактом Тк, який визначають складшсть функцiональних операторiв Фд а мiж ярусами з макротактом Tмк = уГк. Об'еднання функцюнальних операторiв сусiднiх ярусiв приводить до зменшення у V разiв кiлькостi ярусiв. Таке об'еднання доцшьно здiйснювати, коли яруси потокового графа е однотипними. 1нше укрупнення здшснюють шляхом об'еднання функцiональних операторiв i каналiв передачi даних у межах ярусу. Для випадку, коли у>Ь укрупнення здшснюють шляхом лшшно! проекцй, за яко! всi функцюнальш оператори ярусу потокового графу зливаються в один функцюнальний макрооператор, а канали передачi даних - у оператор зат-римки та перестановки даних. Для забезпечення узгодженост може викорис-
товуватися комбшоване укрупнення, тобто об'еднання функцiональних опе-paTopiB i каналiв передачi даних як у середиш ярусу, так i мiж ярусами.
Структура узгодженого потокового графу алгоритму можна виразити орiентованим графом G=<V, E, D (E)>, де V- функцюнальш макрооператори ярусу; E - орiентоваш дуги, якi моделюють зв'язки мiж функцiональними макрооператорами. Кожна дуга Е зв'язуе вихiд одного функцюнального макрооператора з входом другого та мае вагу, яка дорiвнюе значенню затримки D (e).
Етап укрупнення тюно пов'язаний з етапом планування, на якому шс-ля об'еднання функцюнальних операторiв для збереження шформаци про структуру потокового графа алгоритму здшснюеться планування обчислень, визначають величини затримок i перестановки даних. Для вщтворення обчислень у кожний ярус узгодженого графа вводять оператори управлшня затримки та перестановки даних.
Для апаратного вщображення узгодженого потокового графу алгоритму характерне те, що кожному функщональному макрооператору V вщповь дають багатофункцюнальш операцiйнi пристрой якi забезпечують виконання операцiй ярусу, операторам затримки - буферна паралельна пам'ять, яка мо-же забезпечити потрiбну затримку та перестановку даних, а операторам управлшня - пристро1 керування, яю керують багатофункцiональними опера-цшними пристроями i буферною пам'яттю.
Процес розроблення узгодженого потокового графа алгоритму е ггера-цшним, вiн тюно пов'язаний з покращенням характеристик алгоритму. Висновки
1. Для вибору апаратних засобiв для ШНМ реального часу запропоновано використовувати критерш ефективностi використання обладнання, який враховуе кшьюсть виводiв iнтерфейсу, одноманiтнiсть структури, кшьюсть i локальнiсть зв'язюв, пов'язуе продуктивтсть з витратами обладнання та дае ощнку елементам системи за продуктивтстю.
2. Основними шляхами тдвищення ефективностi використання АЗ для ШНМ реального часу е: врахування величини змши значень даних; вибiр ефективних методiв i алгоритмiв реалiзацiï апаратних засобiв; зменшен-ня розрядностi операцшних пристроïв, пам'ятi, кiлькостi та розрядност каналiв передачi даних; узгодження штенсивност надходження даних iз обчислювальною здаттстю апаратних засобiв на всiх рiвнях.
3. Визначено, що узгодження штенсивност надходження даних iз обчислювальною здаттстю АЗ для ШНМ реального часу може здшснюватися шляхом змши тривалост конвеерного такту, юлькоси i розрядност ка-налiв надходження даних.
4. Основними етапами синтезу АЗ для ШНМ е: вибiр та розроблення мето-дiв i алгоршмв узгоджено-паралельного оброблення; визначення основ-них параметрiв апаратних засобiв; перехiд вщ алгоритму до узгодженоï паралельноï структури.
5. Для переходу вщ алгоритму до структури апаратних засобiв систем реального часу використовують узгоджений потоковий граф, основними етапами формування якого е: декомпозищя алгоритму розв'язання задачi; проектування комунiкацiй (обмiнiв даними) мiж функцюнальними операторами; укрупнення функцiональних операторiв; планування обчислень.
Лггература
1. Круглов В.В. Искусственные нейронные сети. Теория и практика. - 2-е изд., стереотип / В.В. Круглов, В.В. Борисов. - М. : Изд-во "Горячая линия-Телеком", 2002. - 382 с.
2. Галушкин А.И. Нейрокомпьютеры. - М. : Изд-во "ИПРЖР", 2000. - Кн. 3. - 528 с.
3. Осовский С. Нейронные сети для обработки информации : пер. с польского. - М. : Изд-во "Финансы и статистика", 2002. - 344 с.
4. Цмоць 1.Г. 1нформацшш технологи та спещашзоваш засоби оброблення сигнашв 1 зображень у реальному часг - Льв1в : Вид-во УАД, 2005. - 227 с.
5. Параллельная обработка информации. - в 5-и т. / АН УССР. Физ.-мех. ин-т. - К. : Вид-во "Наук. думка", 1984. - Т. 5: Проблемно-ориентированные и специализированные средства обработки информации / А.И. Аксенов, В.В. Аристов, Е.Ю. Барзилович и др. / под ред. Б.Н. Малиновского и В.В. Грицика. - 1990. - 504 с.
5. Грушицкий Р.И. Проектирование систем на микросхемах программируемой логики / Р.И. Грушицкий, А.Х. Мурсаев, Е.П. Угрюмов. - СПб. : Изд-во "БХВ-Петербург", 2002. -608 с.
6. Воеводин В.В. Параллельные вычисления / В.В. Воеводин, Вл.В. Воеводин. - СПб. : Изд-во "БХВ-Петербург", 2002. - 608 с.
7. Немнюгин С.А. Параллельное программирование для многопроцессорных систем / С. А. Немнюгин, О.Л. Стесик. - СПб. : Изд-во "БХВ-Петербург", 2002. - 400 с.
8. Касьянов В.Н. Графы в программировании: обработка, визуализация и применение / В Н. Касьянов, В.А. Евстигнеев. - СПб. : Изд-во "БХВ-Петербург", 2003. - 1104 с.
УДК 64.036 Доц. О.Р. Марець, канд. екон. наук;
асист О.М. Втьчинська - Львiвський НУ iM. 1вана Франка
ОЦ1НЮВАННЯ СТУПЕНЯ ПОЛЯРИЗАЦПДОХОД1В НАСЕЛЕНИЯ ЗА ДОПОМОГОЮ ЗМ1ЩЕНИХ КРИВИХ Щ1ЛЬНОСТ1 РОЗПОД1ЛУ
Використано шструментарш змщених кривих щшьносп розподшу доход1в для оцшювання ступеня поляризацп населення Украши. Сформульовано висновок про негативний вплив на поляризащю населення за доходами збшьшення величини сощ-альних норматив1в. Встановлено, що штучне тдвищення грошових доход1в (за ш-ших однакових умов) посилить поляризащю населення за доходами.
Ключов1 слова: поляризащя доход1в, крива щшьносп розподшу, вщ'емний до-хщ, шдекс поляризацп доход1в, концентратор поляризацп доход1в, концентратор поляризацп населення.
Assoc. prof. O.R. Marets; assist. O.M. Vilchynska -L'viv NUnamed after Ivan Franko
Income polarization assessment through dislodged density
distribution curves
Density distribution curves are used to estimate the Ukrainian population income's polarization. It was made a conclusion about the negative impact on the income polarization because of income increasing value of social norms. It is set that the artificial increase of money profits (at other identical terms) will strengthen polarization of population after profits.
Keywords: income polarization, density distribution curve, negative income, income polarization index, income polarization concentrator, population polarization concentrator
Сощальна полггики держави, спрямована на зменшення поляризацп населення за доходами. Теоретично, таю заходи як збшьшення величини со-