УДК 681.518:004.93.1' А. О. ПАНИЧ, О.Б. БЕРЕСТ
ОПТИМ1ЗАЦ1Я ПАРАМЕТР1В НАВЧАННЯ 1НТЕЛЕКТУАЛЬНО1 СИСТЕМИ КЕРУВАННЯ ЕЛЕКТРОПРИВОДОМ ПЛАТФОРМИ ЛЕТУЧО1 ПИЛИ
Розглядаеться категорiйна модель та шформацшно-екстремальний алгоритм навчання системи пiдгримки прийняття рiшень для керування летучою пилою. Будуються в процесi навчання виршальт правила, як1 дозволяють пiдвищити точшсть рiзання довговимiрних матерiалiв, що рухаються.
Вступ
Летуч пили (ЛП) використовуються в технолопчних лшях для пор1зу довговим1рних матер1ал1в, що рухаються. Оброблюваними виробами, наприклад, можуть бути труби, сортовий прокат, гнут профш, деревш плити [1,2]. Несучим органом ЛП е платформа, на якш розмщене обладнання р1зально! системи. Робочий цикл привода платформи мае перю-ди робочого та зворотного ходу, перший з яких мютить дшянки розгону з переслщуванням перер1зу р1зання оброблюваного виробу та руху з постшною швидюстю з виконанням технолопчно! операцп р1зання [3,4]. Електропривод платформи працюе з високою частотою вмикань I характеризуеться великими витратами електроенергп в перехщних процесах, тому до нього пред'являються жорстю вимоги щодо виконання технолопчних обмежень. Попереднш анал1з та модельш дослщження процес1в керування ЛП з врахуванням випадко-вих змш параметр1в привод1в платформи та оброблюваного виробу показують, що запропо-новаш у працях [5,6] закони руху та способи !х реал1заци не завжди забезпечують необхщну точшсть пор1зу та, вщповщно, потребують застосування метод1в И тдвищення.
Одним ¡з шлях1в тдвищення точносп роботи електропривода платформи ЛП е викорис-тання штелектуально! системи керування ЛП на основ1 машинного навчання та розтзнаван-ня образ1в [7,8], яка функцюнуе роздшьно у час у двох режимах: навчання, на якому будуються виршальш правила, I екзамену, на якому здшснюеться оцшка поточного функц-юнального стану системи.
У статп розглядаеться математична модель та шформацшно-екстремальний алгоритм навчання системи керування електроприводом платформи ЛП.
1. Постановка задачi шформацшно-екстремального навчання
Нехай алфавгг {Х^} складаеться з трьох клаав розпiзнавання, що характеризують отримаш в результатi послiдовностi робочих циктв довжини вiдрiзаних виробiв (за умови виконання синхрошзацп за швидкiстю) за такою трьохальтернативною системою оцiнок: клас Х° - "Норма" (точнiсть порiзу ±3 мм), клас Х2 - "Бшьше норми" i клас Х° -"Менше норми". За результатами моделювання цих трьох режимiв функцюнування систе-ми керування сформовано вхщну навчальну матрицю || у^^ !т = 1,3 ||, в якш рядок е реалiзацiею образу {ут\ |1 = 1, , де N - кшьюсть ознак розпiзнавання, а стовпчик матриц - випадкова навчальна вибiрка {ут\ и = 1,п}, де п - обсяг вибiрки. Дано структурований вектор просторово-часових параметрiв функцiонування §=<§х, ..., gx , ..., gв >, яю вплива-ють на функцiональну ефективнють системи керування з вiдповiдними на них обмеженнями Их (gl, ..., gs) < 0 .
У режимi навчання необхiдно побудувати виршальш правила шляхом вiдновлення в
радiальному базисi простору ознак контейнерiв класiв розпiзнавання в процесi оптимiзацil
*
параметрiв функцiонування {g ^}, якi забезпечують максимум шформацшного критерiю функцюнально1 ефективностi (КФЕ) в робочш (допустимiй) областi визначення його функцй:
Ет = тахЕт
о
де Ет - КФЕ процесу навчання розтзнавати реалiзацil класу хт; О - область допустимих значень параметрiв функцiонування системи керування.
У режимi екзамену, тобто безпосередньо! оцiнки поточного стану ЛП, необхщно визна-чити належнiсть реалiзацil, що розтзнаеться, одному iз класiв заданого алфавггу {Хт |т = 1,3} .
Таким чином, задача шформацшно-екстремального навчання полягае у побудовi оптимального (тут i далi в шформацшному розумiннi) розбиття простору ознак на класи розтзна-вання.
2. Математична модель
Вхщний математичний опис штелектуально1 системи керування подамо у виглядi теоре-тико-множинно! структури:
А в=<О, Т, О, 2, У; Х; П,Фх ,Ф2>, де О - множина факторiв, якi ддать на систему керування; Т - множина момента часу зняття шформацп; О - простiр ознак розтзнавання; 2 - простiр можливих сташв системи керування; У - вибiркова множина (вхщна навчальна матриця); Х - вхщна бiнарна навчальна матриця; П: ОхТх О ^2 - оператор переходiв, що вiдбивае механiзм змши станiв системи пiд впливом внутршшх i зовнiшнiх факторiв; Ф1 :О х Т хО х 2 ^ У - оператор формування вибiрковоl множини У на входi СППР; Ф2: У ^ Х - оператор формування бшарно1 навчально1 матрицi.
На рис.1 показано категоршну модель у виглядi дiаграми вщображення множин, що застосовуються в процес навчання системи керування електроприводом платформи ЛП з
ошгашзащею контрольних допусюв на ознаки розпiзнавання [7]. Оператор 6 :Х вiдновлюе у загальному випадку нечггке розбиття , а оператор класифшацп у: ^I111 перевiряе основну статистичну гшотезу про належнiсть реалiзацiй {хт|)|/'=1, п } нечiткому класу Хт, де I - кшьюсть статистичних гшотез. Оператор у: I111 ^ 3|?| шляхом оцшки статистичних гiпотез формуе множину точнюних характеристик , де д=12 - кшьюсть точнiсних характеристик. Оператор Ф: ^ ^ Е обчислюе множину значень iнформацiйного КФЕ, який е функцюналом точнiсних характеристик.
U
81
Ф
D-
Ф1
♦T x G x Q x Z ■
8 2
Ф2 0 Y— X—1
■ E
У
RR
3 |ч 1 Y
I
\L\
Рис. 1. Дiаграма вiдображення множин у процесi навчання СППР У д1аграм1 (див.рис.1) контур оптим1зацп геометричних параметр1в розбиття R|M 1 зами-каеться оператором г: E ^ R|M 1, оператори якого показано на рис. 2.
■ у-► у-► ф -► г —
Рис. 2. Контур оптимiзацiï геометричних параметрiв контейнерiв класiв розпiзнавання
У д1аграм1 (див.рис.1) терм-множина D складаеться 1з допустимих значень СКД, а контур оператор1в, показаних на рис.3, безпосередньо оптим1зуе контрольш допуски на ознаки розтзнавання.
■ 0 ■
У ■
■ Y
ф
-►81
82-
Рис.3. Контур оптимiзацiï контрольних допусков на ознаки розпiзнавання
Оператор U: E ^ G x T x Q x Z регламентуе процес навчання i дозволяе оптишзувати параметри його плану, яю визначають, наприклад, обсяг i структуру випробувань, чер-говiсть розгляду клашв розпiзнавання тощо.
Таким чином, використання показаноï на рис. 1 категорiйноï моделi достатньо адекватно вiдбивае слабоформалiзований динамiчний процес навчання СППР i, кр1м того, суттево спрощуе побудову структурноï схеми iнформацiйно-екстремального алгоритму навчання.
3. Алгоритм навчання СППР
Алгоритм навчання СППР з оптишзащею контрольних допусюв на ознаки розтзнавання розглянемо вщносно показаного на рис. 4 двобiчного симетричного поля допускiв для i-ï ознаки розпiзнавання yi iз вх1дно1' навчально!' матрицi || yj ||.
A
H,i
I I I I I
A
HK,i
I I I I I
8
yi
A
I I I I I 8 .
BK,i
I I I I I
A
8
HJ_
B,i
yi
A
Рис. 4. Симетричне поле допусков На рис. 4 прийнято таю позначення: yi - номшальне (усереднене) значення ознаки yi;
H,i , ЛВ
Ab -
нижнiй i верхнш нормованi допуски в1дпов1дно;
8H : - ]
AHK,i, Abk,: - нижн1й i верхнiй 8 k,: - поле контрольних
контрольн1 допуски вщповщно; oH,: - поле нормованих допуск1в; допуск1в; 8 - параметр поля контрольних допусюв.
Розглянемо алгоритм навчання СППР з паралельною оптим!защею контрольних допусюв на ознаки розтзнавання. При цьому змша контрольних допусюв, яю формуються в1дносно базового (найбщьш бажаного) класу XO, здшснюеться для вс1х ознак одночасно
г
8
K
за такою двохциктчною ггерацшною процедурою пошуку глобального максимуму шформа-
цiйного КФЕ навчання СППР у робочiй (допустимш) областi визначення його функцп:
* —
5 = argmax{ max E} (D
G5 GE ' ^
де E - усереднене за алфавiтом класiв розтзнавання значення iнформацiйного КФЕ навчання СППР; G5, GE , Gd - допустимi областi значень параметра поля контрольних допусюв на ознаки розтзнавання; КФЕ навчання СППР i радiусiв контейнерiв класiв розтзнавання, що у процесi навчання вщновлюються в радiальному базисi простору ознак вщповщно.
Вхiдними даними е масив реалiзацiй образу {y^j) | m = 1,M; j = 1,n} i система нормова-них допускiв на ознаки розтзнавання {5нд}, яка визначае область значень вщповщних контрольних допусюв. При цьому за область значень параметра 5; береться штервал [1; 5н,; /2], де 5н,; - ширина нормованого поля допусюв для i-i ознаки розтзнавання.
Розглянемо основт етапи реалiзацil алгоритму навчання СППР з паралельною оптимiза-цiею контрольних допускiв на ознаки розтзнавання:
1. Обнулюеться лiчильник крокiв змiни параметра 5 : /:=0.
2. Запускаеться лiчильник: l:=l+1 i обчислюються нижнi та верхнi контрольнi допуски для всiх ознак:
{Ahk,;[l]:= У1,i - 5[l]} i {Авк,;[7] = yu +5[l]}, 1 = 1N, (2)
де y1,i — вибiркове середне значення i -1 ознаки для векторiв-реалiзацiй класу X^, який е
найбшьш бажаним для ОПР .
3. Реалiзуеться базовий алгоритм навчання [8]:
а) формуеться бшарна навчальна матриця || xJmj)i || за правилом
x(j) i1, if У1,1 y(ji * У1,1 +5,
1 |о, if else ;
б) формуеться масив еталонних двшкових векторiв {xm,i | m = 1,M, i = 1,N}, елементи якого визначаються за правилом
In (j) 1, if- S xj >P m; n j=1 '
0, if else,
де p m - рiвень селекцп координат вектора xm e Xm ;
в) розбиваються множини еталонних векторiв на пари найближчих "сусадв":
|2|
^m =< xm, xi > , де xi - еталонний вектор сусiднього класу X0, за такою схемою:
- структуруеться множина еталонних векторiв, починаючи з вектора x1 базового класу
X°, який характеризуе найбшьшу функцiональну ефективнiсть СППР;
- будуеться матриця кодових вщстаней мiж еталонними векторами розмiрностi MxM;
- для кожного рядка матриц кодових вiдстаней знаходиться мiнiмальний елемент, який належить стовпчику вектора, найближчого до вектора, що визначае рядок. За наявносп декшькох однакових мшмальних елемештв вибираеться з них будь-який, оскшьки вони е ршноправними;
- формуеться структурована множина елементiв попарного розбиття {^¿j | m = 1, M} , яка задае план навчання;
г) змшюеться кодова вщстань dm за рекурентною процедурою
dm(k) = [dm(k -1) + h|dm(k) e Gm],
де k - змшна числа збшьшень радiуса контейнера K^ е X^ ; h - крок збшьшення радiуса; G^- область допустимих значень радiуса dm ;
д) обчислюсться значення iнформацiйного КФЕ навчання СППР за модифiкованою формулою критерiю Кульбака [8]:
2 - (a (k) + R(k))
Em = - (amk) mk))], (3)
тут amk), P^ - точнiснi характеристики: помилки першого i другого роду, що обчислюють-ся на k-му кроцi вiдновлення контейнера класу xm;
е) процедура закшчуеться при знаходженнi глобального максимуму КФЕ в робочш
областi його визначення: Em = maxEm, де {d} = {d1,...,dk ,...,dmax} е [0;d(xm © xj) -1] -множина радiусiв концентрованих гшерсфер, центр яких визначаеться вершиною еталонно-го вектора xm е xm .
4. Якщо 5 < 5н / 2 , то виконуеться пункт 2, шакше - пункт 5.
5. Визначаеться максимальне значення КФЕ, обчислене заl кроюв навчання СППР:
*
Em = maxEm
{1}
i визначаеться оптимальне значення параметра поля контрольних допусюв, яке дорiвнюе екстремальнiй сумi l лiчильника крокiв змiни параметра 5 .
6. Визначаються оптимальнi нижш та верхнi контрольнi допуски для ознак розтзнавання
{AHK,i := AHK,i[l ]}; {ABK,i: = ABK,i[l ]},i =1,N
7. ЗУПИН.
Таким чином, алгоритм навчання СППР з оптимiзацiею системи контрольних допусюв полягае в реалiзацil двохциктчно! ггерацшно! процедури пошуку глобального максимуму iнформацiйного КФЕ навчання системи в робочш (допустимш) обласп визначення його функци.
4. Приклад реашзацн алгоритму
Для формування навчальних матриць використана комп'ютерна модель системи керу-вання електроприводом платформи ЛП [6] профiлезгинального стану, яка оснащена двигу-ном постiйного струму Д32 потужнютю 18 кВт, маса платформи 1200 кг. Модель доповне-на блоками, що реалiзують випадковi збурення за нормальним законом розподшення сиг-
налiв статичного моменту Мс, зворотних зв'язкiв по струму i2 та швидкостi обертання ю-якоря двигуна електропривода платформи ЛП; сигналу вимiряноl швидкосп оброблюваного виробу V\; сигналу тривалостi спрацьовування механiзму зчеплення (тсля зчеплення закш-чуеться розгш-синхрошзащя). Вiдповiдно до використовуваних на практищ, при моделю-ваннi встановлена швидюсть руху оброблюваного виробу V[=0,9 м/с, мiрна довжина порiзу Ьм=4 м, прискорення при розгош азадв=2,34 м/с2. Згщно з працею [6], значення похщно! моменту електроприводу прийняте рiвним 20 (у вiдносних одиницях). При цьому задана точнють мiрного порiзу дорiвнювала ± 3 мм. Оптимальний за енерговитратами закон руху привода платформи ЛП в режимi робочого ходу мютить дшянки розгону-синхрошзацп, на яких швидюсть V2 платформи змшюеться вiд 0 до швидкостi VOB виробу й вiдбуваеться и синхрошзащя з перерiзом рiзання, та руху з постшною швидкiстю V2=VOB тд час оброблен-ня виробу. На дшянщ розгону-синхрошзацп реалiзуеться рiвноприскорений рух з обмежен-ням похщно! моменту двигуна привода платформи. Дшянка розгону-синхрошзацп, у свою
чергу, мiстить дшянки змши моменту М2 двигуна згщно з заданою похщною M зад моменту та дiлянку рiвноприскореного руху платформи з заданим прискоренням азадв. Привод платформи ЛП запускаеться в момент досягнення точкою обробки на виробi (перерiзом рiзання) наперед визначеного значення координати, що пов'язане з початковим положенням
платформи, швидюстю VOB та шляхом перемщення, який проходить платформа пiд час розгону-синхрошзаци. Запропонований у [6] закон руху привода платформи ЛП реатзований у комп'ютернiй моделi системи керування електроприводом платформи ЛП [7], яка мютить контури швидкостi та моменту, налаштоваш на модульний оптимум. Задана тахограма руху платформи ЛП формусться у моделi контроллера ЛП та передасться на вхiд електроп-ривода.
На тахограмi сигналу завдання швидкостi, що надходить з контроллера ЛП до електроп-ривода платформи, видiлено 5 характерних точок (n = 1,5). Перша точка вщповщае моменту запуску платформи (V2=0); друга - початку змши завдання швидкосп з заданим приско-ренням азадв; третя - початку змши прискорення вщ азадв до 0; четверта - завданню швидкостi, що дорiвнюe Vi; п'ята - спрацюванню механiзму зчеплення. Для друго!, третьо! та четверто! дiлянок тахограми на випробувальному стендi було сформовано масиви навчальних матриць {y(jm i | s = 2,4;m = 1,3;i = 1,23; j = 1,40} вщповщно для клаав XO1, XO 2 i XO,3.
Словник ознак розтзнавання складався з 23 параметрiв, з яких 5 безпосередньо зчиту-ються з датчикiв на об'eктi: перемщення i швидкостi виробу та платформи - вщповщно, /1 i V1 та /2 i V2; момент приводу платформи М2. Крiм того, враховано поточний час; рiзницi перемщень (/1 -/2) та швидкостей (V1-V2); похiднi моменту M 2 та швидкостей V1,V2 i V2 ; вимiряне значення статичного моменту Мс; вимiряне значення тривалостi спрацьову-вання мехашзму зчеплення; заданi вiд контроллера ЛП значення моменту та швидкосп привода платформи; заданi значення корекцп швидкосп синхрошзацп та по-ложення запуску платформи, як вико-ристовуються у керуючому алгоритмi; розраховано значення миттево! потуж-ностi та роботи току на на^вання якоря двигуна електропривода платформи ЛП; миттева мехашчна потужнiсть, механiчна робота та кшетична енергiя електропривода платформи ЛП.
На рис. 5 показано одержат в про-цес реалiзацi! базового алгоритму на-вчання графши залежностi критерiю (3) вiд радiусiв контейнерiв класiв розтз-навання для алфавггу {X2,m} , побудо-ваного на другш дшянщ тахограми, для § а os неоптимального параметра 5; = ±40 (у вщсотках вiд усередненого значення i-! ознаки), обчисленого для першого кла-
Xo
2,1 i для рiвня селекцп координат
Xo «
2 1, який
дорiвнював р 2,1 = 0,5 .
Аналiз рис.5 показуе, що тiльки в одному випадку (рис.5,б) iснуе робоча область, яку тут i далi на графiку позна-чено темною дшянкою. Цей факт пояс-нюеться тим, що вибрана система кон-трольних допусюв е неоптимальною. Тому для пщвищення функщонально! ефективностi навчання СППР доцiльно застосувати iтерацiйний алгоритм навчання (1) з паралельною оптимiзацiею контрольних допускiв на ознаки розтз-
е 7 Радус
а
Кг ас 2
6 7 Pafliyc б
Клас 3
6 7 Pafliyc
в
Рис.5. Графши залежносп КФЕ вщ рад1уав контейнер1в клаав розтзнавання: а - клас X21;
б - клас X 2 2 ;
X2
2,3
навання. На рис.6 показано одержаний в процес паралельно! оптим1зацп графш залежносп усередненого за алфавпом клас1в розтзнавання КФЕ (2) вщ параметра поля контрольних
допусюв 8 .
Анал1з рис.6 показуе, що оптимальне значення параметра поля контрольних допусюв на
ознаки розтзнавання дор1внюе 5 = ±89 при максимальному середньому значент КФЕ
*
Е = 0,41, що суттево перебшьшуе значення критерда при реал1зацп базового алгоритму навчання (рис. 5,б).
Рис. 6. Графш залежносп КФЕ навчання СППР вщ параметра поля контрольних допусков на ознаки
розтзнавання
На рис. 7 показано графши залежносп КФЕ (2) вщ рад1ус1в контейнер1в клас1в розтзнавання, одержан! в процеш оптим1зацп контрольних допусюв на ознаки розтзнавання.
Рис. 7. Граф^ залежностi критерш Кульбака вщ радiусiв контейнерiв клаав розпiзнавання в процесi оптишзаци контрольних допусков: а - клас Х21; б - клас Х2 2; в - клас Х2 3
в
£ *
Аналiз рис. 7 показуе, що при оптимальному napaMeTpi о поля контрольних допускiв для Bcix класiв розпiзнавання iснують робочi обласп визначення КФЕ i при цьому оптимальш радiуси контейнерiв класiв розтзнавання дорiвнюють у кодових одиницях вщповщно
d2,1 = 3,d2,2 = 1 i d2,3 = 2 .
Таким чином, у процес навчання вщновлено оптимальнi контейнери класiв розтзнавання, центрами яких е еталонт двiйковi вектори-реалiзацil образiв, що забезпечують опти-мальнi радiуси вiдповiдних контейнерiв.
Аналогiчно формувалися в процесi навчання виршальт правила для iнших дшянок тахограми сигналу завдання швидкостi ЛП.
Висновки
1. Розроблено iнформацiйно-екстремальний алгоритм навчання штелектуально! СППР з оптимiзацiею системи контрольних допускiв на ознаки розтзнавання, що дозволяе сформу-вати базу знань для керування ЛП в робочому режимi функцiонування.
2. У процес навчання СППР побудовано оптимальш в iнформацiйному розумiннi вирь шальнi правила у виглядi вщновлених в радiальному базисi контейнерiв клашв розтзнаван-ня, центрами яких е екстремальт еталоннi двiйковi вектори-реалiзацil образiв, якi дозволя-ють в робочому режимi коригувати швидкiсть ЛП з метою тдвищення точностi нарiзки довговимiрних матерiалiв.
Список лiтератури: 1. Червяков В.Д. Летучие механизмы как класс рабочих машин в аспекте задач управления / В. Д. Червяков, А. А. Паныч // Электротехнические системы и комплексы: Межвузовский сборник научных трудов. Магнитогорск: МГТУ. 1998. Вып. 3. С. 176-182. 2. Червяков В.Д. Задачи ресурсосберегающего управления электроприводом несущего органа летучей пилы / В. Д. Червяков, А. А. Паныч // Вюник Нацюнального техшчного ушверситету "Харшвський полггехшчний шститут". Зб1рка наукових праць. Тематичний випуск 10. Харк1в, НТУ ХП1, 2001. С.370-371. 3. БеловМ.П. Автоматизированный электропривод типовых производственных механизмов и технологических комплексов: учебник для студ. высш. учеб. заведений/ М.П. Белов, В.А. Новиков, Л.Н. Рассудов // М.: Издательский центр "Академия", 2007. 576 с. 4. Лимонов Л.Г. Автоматизированный электропривод промышленных механизмов / Л.Г. Лимонов // Х.: Изд-во "ФОРТ", 2009. 272 с. 5. Паныч А.А. Оптимальное по энергозатратам управление процессом рабочего хода платформы летучей пилы / А. А. Паныч, В. Д. Червяков // Вюник Нацюнального техшчного ушверситету "Харшвський полггехшчний шститут". Харшв: НТУ "ХП1", 2008. №30. С.500-502. 6. Червяков В.Д. Анализ законов движения электропривода несущего органа летучей пилы методом компьютерного моделирования / В. Д. Червяков, А. А. Паныч // Зб1рник наукових праць Дншродзержинського державного техшчного ушверситету (техшчш науки). Тематичний випуск "Проблеми автоматизованого електропривода. Теор1я i практика". Дшпродзержинськ: ДДТУ, 2007. С.289-291. 7. Краснопоясовський А.С. 1нформацшний синтез штелектуальних систем керування: Шдхвд, що грунтуеться на метод1 функцюнально-статистичних випробувань / А. С. Краснопоясовський // Суми: Видавництво СумДУ, 2004. 261 с. 8. ДовбишА.С. Основи проектування штелектуальних систем: Навчальний поабник / А. С. Довбиш // Суми: Видавництво СумДУ, 2009. 171 с.
Надтшла до редколегИ' 11.09.2011
Панич Андрш Олександрович, ст. викладач кафедри комп'ютерних наук, факультет елект-рошки та шформацшних технологш, Сумський державний ушверситет. Науков1 штереси: штелектуальш системи управлшня. Адреса: Укра!на, 40007, Суми, вул. Римського-Корса-кова, 2. E-mail: [email protected].
Берест Олег Борисович, астрант кафедри Комп'ютерних наук, факультет Електротки та iнформацiйних технологiй, Сумський державний ушверситет, Укра!на. Науковi штереси: iнформацiйний аналiз i синтез штелектуальних систем, що навчаються. Адреса: Укра!на, 40007, Суми, вул. Римського-Корсакова, 2. E-mail: [email protected].