Нейросетевое управление гибридной силовой установкой на основе метода адаптивной критики

Сериков Сергей Анатольевич

УДК 621.436-55

НЕЙРОСЕТЕВОЕ УПРАВЛЕНИЕ ГИБРИДНОЙ СИЛОВОЙ УСТАНОВКОЙ НА ОСНОВЕ МЕТОДА АДАПТИВНОЙ КРИТИКИ С.А. Сериков, доцент, к. т.н., ХНАДУ

Аннотация. Приведена формальная постановка оптимизационной задачи управления силовой установкой гибридного автомобиля. Рассмотрено её решение методом нейросетевого управления на основе адаптивной критики.

Ключевые слова: гибридный автомобиль, гибридная силовая установка, оптимальное управление, нейросетевое управление, адаптивный критик.

НЕЙРОМЕРЕЖЕВЕ КЕРУВАННЯ ГІБРИДНОЮ СИЛОВОЮ УСТАНОВКОЮ НА ОСНОВІ МЕТОДУ АДАПТИВНОЇ КРИТИКИ С.А. Сєріков, доцент, к.т.н., ХНАДУ

Анотація. Приведено формальну постановку оптимізаційної задачі керування силовою установкою гібридного автомобіля. Розглянуто їїрозв^зання методом нейромережевого керування на основі адаптивної критики.

Ключові слова: гібридний автомобіль, гібридна силова установка, оптимальне керування, ней-ромережеве керування, адаптивний критик.

NEURAL NETWORKS CONTROL OF THE HYBRID POWER UNIT BASED ON THE METHOD OF ADAPTIVE CRITICS S. Serikov, Associate Professor, Candidate of Technical Science, KhNAHU

Abstract. The formal statement of the optimization problem of hybrid vehicle power unit control is given. Its solving by neural networks method application on the basis of adaptive critic is considered.

Key words: hybrid vehicle, hybrid power unit, optimum control, neural networks control, adaptive critic.

Введение

Экономичность и экологическая безопасность гибридного автомобиля в значительной степени определяется качеством управления его силовой установкой и степенью соответствия выбранной стратегии управления текущему тягово-скоростному режиму. Данное обстоятельство диктует необходимость придания системе автоматического управления гибридной силовой установкой (САУ ГСУ) адаптивных свойств, т.е. способности выбора стратегии управления агрегатами ГСУ, которая минимизирует выбранный функционал на текущем ездовом цикле при заданных ограничениях.

Анализ публикаций

В настоящее время существует достаточно большое количество работ отечественных и зарубежных исследователей, посвященных оптимизации управления силовой установкой гибридных автомобилей [1ИВ]. Вместе с тем ряд особенностей процесса управления ГСУ и связанных с ними возможностей остаются неисследованными. Так, при исследовании процессов адаптации стратегии управления агрегатами ГСУ к изменяющимся условиям их функционирования практически не рассматривались богатые возможности методов нейроуправления на основе адаптивных критиков [4 -б].

Цель и постановка задачи

Целью данной работы является исследование особенностей задачи синтеза адаптивного управления силовой установкой гибридного автомобиля. При этом предложен эффективный способ уменьшения размерности оптимизационной задачи путём введения новой переменной □ коэффициента использования электропривода. Рассмотрена возможность реализации адаптивного управления ГСУ на основе использования метода нейросетевых адаптивных критиков.

Гибридный автомобиль как объект управления по скорости

Пусть автомобиль с ГСУ как управляемая система может быть идеализирован настолько, что в каждый фиксированный момент времени наблюдения х = х' на интервале Т = {t\ts < х < ^}, Г е Т его свойства могут

быть описаны двумя действительными числами: ю(х') □ текущая угловая скорость вращения ведущих колёс; 0ТЛВ (х') □ состояние

накопителя энергии (степень заряженности тяговой аккумуляторной батареи). Будем рассматривать данные величины как компоненты вектора состояния системы

x = x (х) = [ю (х), 0ТЛВ (х) ] в момент времени

X'. Множество всех возможных состояний в различные моменты времени X е Т образует двумерное пространство состояний X

:Х<

0 — Ю—Ютах 0 — 0ТАБ — 1

где ютах □ максимальная угловая скорость вращения ведущих колёс. На множестве X можно выделить подмножество эксплуатационных состояний

X =

0 — ю —ю

0 — 0ТАБ — 0

ех.шт ТАБ ех.шах.

X.

Выход состояния системы за пределы Xex не желателен, хотя и не ведёт к аварийной ситуации.

Будем рассматривать автомобиль с ГСУ как многомерный нелинейный стационарный объект вида

Г± = f (X, и \)

'[у = к (х u )

где u = [ро, Рм, Рт , у]т □ вектор управления; Ро □ сигнал управления мощностью ДВС. Ро = —1 соответствует отключенному состоянию ДВС; Рм □ сигнал управления вспомогательной силовой установкой (электромагнитным моментом вентильного

электродвигателя); Рт □ сигнал управления системой гидравлического торможения; у □ передаточное отношение трансмиссии автомобиля. При использовании пятиступенчатой коробки передач у может принимать одно из пяти фиксированных значений. Полагаем, что управляющие воздействия должны быть ограничены, т.е. u є U с М4 V і є Т,

и =

Ро =—1, 0 — Ро —1

— 1 — Рм — 1 0 — рТ — 1 ує{уг}, 1 = 1,5

Вектор управления может быть задан как программное управление

и = и() = [р (х) Рм (х), Рт (х), у(х)]Т, либо в виде координатного управления

и=и (х) = [р (х), рм (х ) рт (х), у(х )]Т;

\ \(х) = [а(х), $0 (X)] □ вектор возмущаю-

щих воздействий, \ с М2 V х е Т ; а □ уклон дороги; <90 □ скорости встречного ветра;

У = У (х) = [V (х), От (х), Ет (х)]Т □ вектор выхода, у с М3, V х е Т ; V □ скорость автомобиля; От □ часовой расход топлива ДВС; ЕТ = / (СКОх, Ссо, Снс ) □ степень токсичности отработавших газов ДВС; СЖх, Ссо, Снс □ часовая эмиссия оксидов азота, оксида углерода и углеводородов соответственно; /(•) и Л(.) □ известные непрерывные или кусочно-непрерывные вектор-функции векторных аргументов, определенные на соответствующих множествах.

2

+

Кроме условий принадлежности состояния автомобиля с ГСУ и управляющих воздействий к множествам возможных состояний х е X, V х е Т и допустимых управлений и е и, V х е Т , на рассматриваемую динамическую систему наложены ограничения в виде неголономной связи /с (х, х, и) = 0 ,

обусловленные динамическими свойствами собственно автомобиля, ГСУ и аппаратуры управления. Данные ограничения определяются кинематической схемой ГСУ и трансмиссии автомобиля

х «Ах = ( х (к + 1)-х (к ))ДТ', можно записать разностные уравнения автомобиля с ГСУ

[(к +1) = х(к) + АТ • /(х (к),и (к),\(к))

[у (к ) = н (х (к ), и (к ))

Уравнение неголономной связи в этом случае приобретет вид

3К (к)

ю( к + 1)-ю(к )

АТ

- муя (к) + мяр (к) + М№ (к) = 0

где JK = JK (у) □ суммарный момент инерции; Мш = Ыш (ю, и) □ момент сил вращения, развиваемый ГСУ; М5Р = М5Р (ю, а) □ момент сил сопротивления движению автомобиля; Мрк □ момент сопротивления, обусловленный силами трения в элементах трансмиссии. В последнем выражении момент инерции и все моменты сил приведены к оси вращения ведущих колёс.

Основной функцией САУ ГСУ является выполнение задачи слежения, т.е. поддержание с минимальной ошибкой заданной скорости автомобиля Vzd (х) при наличии возмущений

\ (х) , х е Т . Кроме этого, процесс управления

должен удовлетворять ряду дополнительных условий: минимизации расхода топлива,

уровня токсичности отработавших газов, отклонения степени заряженности ТАБ от оптимальной.

Постановка оптимизационной задачи в дискретном виде

Модель гибридного автомобиля как объекта управления по скорости может быть представлена в дискретном виде. Для этого выберем шаг дискретизации процесса управления по времени АТ. Будем рассматривать векторные функции х (х) , и (х), У (х) И \ (х) только в дискретные моменты времени хк = х, + кАТ, к = , N = (х/ - х, )ДТ-1:

х (к)=х (хк); и (к)=и (хк); у (к) = у (хк) и

4(к) = 4 (хк ) , хк е Т . Если применить замену производной конечной разностью

Для того чтобы замена операции дифференцирования взятием конечной разности была правомерна, необходимо, чтобы АТ было мало по сравнению с наименьшей из постоянных времени процесса управления.

Функционал качества управления ГСУ может быть представлен в виде

N-1 4

I^ (х,и,N) = ££КргЗг (к),

к=0 1=1

где К Р = [ КР2, КР0, КрО , КрЕ ]т □ вектор приоритетов, учитывающий степень важности отдельных критериев оптимальности;

3(к ) = [12к, 10к, 1Ок, 1 Ек ]Т - векторный КрИтерий качества управления на к -м шаге. Отдельные компоненты вектора 3(к) характеризуют управление, переводящее систему из состояния х (к) в состояние х (к +1)

•V (к) = К

NV

(к +1)- V (к +1))2 ^

+ 52 (V (к +1))

Г0ТЛВ.0 (к + 1р _

10к (к) = KN0 у - 0ТЛВ (к + 1) у

+ 52 (0ТЛВ (к +1) 1ок (к) = ^оОТ (к);

2

1 Ек (к) = К

Ж

, Л

КЕЫОх ' СЫйх (к ) +КЕСО ' ССО (к +КЕНС ' СНС (к)

где К N — [К^ 5 КЫв 5 КЫО 5 КШ ] — вектор

нормирующих коэффициентов, обеспечивающих приведение компонентов вектора 3(к) к безразмерным величинам и нормирование; □ функция штрафа за выход из об-

ласти эксплуатационных режимов Хех

V (к)- V*

V (к )< Уа

V (к )> Уа

V — г ю

ех.тах к ех.тах

□ максимальная эксплуатационная скорость; гк □ радиус качения ведущих колёс; еТЛВ 0 □ оптимальная степень заряженности ТАБ; £е □ функция штрафа за выход текущей степени заряженности ТАБ из области эксплуатационных режимов Хех :

^е (еТЛВ (')) — 05 при еех.тт < еТЛВ (*) < ^х.тах ; $е(еТЛВ (?)) —|еех.тт - еТЛВ ^)| 5 При уСЛОВИИ

евх.тт > еТЛВ () > 0ех.тах ; КЕЫОх 5 КЕСО 5 КЕНС

□ коэффициенты токсичности соответствующих компонентов отработавших газов. Данные коэффициенты должны определяться с учётом влияния компонентов на здоровье человека и окружающую среду5 а также их удельного содержания в отработавших газах. При этом должно выполняться соотношение

К — 1

КЕНС 1 •

Оптимизационная задача управления ГСУ сводится к выбору оптимальной последовательности управлений и* (к) 5 которая на заданном ездовом цикле Vzd (к) 5 к — О5 N доставляет минимум функционалу

1 sV = 1 sV (Х5 и5 N) и удовлетворяет ограничениям на переменные СОСТОЯНИЯ5 управляющие воздействия и ограничениям неголо-номной связи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1*^ = 1SV (* 5и* 5N) — тш1 SV (х5и5 N) 5

х*(к)е X 5 и*(к)е и 5

/с (Ах*(к) 5 х* (к)5 и* (к)) — О5 V к — О5 N.

При этом значение будем называть оптимальным значением функционала качества управления5 а векторную функцию

и* = а^шш 1 sv (5и5 N) 5

доставляющую функционалу оптимальное значение5 □ оптимальным управлением.

Регулятор скорости автомобиля

Решение сформулированной оптимизационной задачи наталкивается на ряд трудностеЙ5 связанных с идентификацией математической модели гибридного автомобиля как объекта управления5 а также с недостатком априорной информации о параметрах ездового цикла.

Одним из способов преодоления указанных трудностей является использование концепции адаптивного управления5 когда низкая точность математических моделей и недостаток априорной информации восполняются за счёт более полного использования текущей информации. В этом случае характеристики системы управления целесообразно представить в виде параметрически задаваемых функциЙ5 а настройку производить путём итеративной оптимизации параметров.

Вместе с тем нахождение оптимального

*

управления и на заданном ездовом цикле не указывает конструктивного пути для построения системы управления. В связи с этим возникает задача синтеза алгоритма управления (регулятораХ обеспечивающего получение управления оптимального или близкого к оптимальному за счёт замыкания системы по переменным состояния: и*— / (Х5 Vzd ) .

Кроме данного регулятора5 САУ ГСУ должна иметь в своём составе блок адаптации5 обеспечивающий асимптотическое прибли-

Тт* *

^ ^ ^ и и ^ и при ^ ^<х> путем настройки параметров регулятора.

Рассмотрим структурную схему САУ ГСУ5 приведенную на рис. 1.

Рис. 1. Система автоматического управления силовой установкой гибридного автомобиля

На данной схеме MVR zd □ момент вращения

ГСУ, требуемый для поддержания заданного тягово-скоростного режима. При этом система гидравлического торможения условно отнесена к ГСУ для удобства изложения. Сигнал MVR zd является выходным для регулятора скорости автомобиля

MVR.zd = fV.RG (V, Vzd )

и входным сигналом адаптивного регулятора ГСУ.

Момент сил сопротивления движению автомобиля, приведенный к ведущим колёсам, определяется из выражения [7]

MSP = (F + Fa + FL ) Гк ,

где FK = kpkmAg • cos (a) □ сила сопротивления качению, являющаяся следствием деформаций, возникающих в зоне контакта шины с дорогой; Fa = mAg • sin (a) □ сила сопротивления движению на подъём или под уклон; Fl = Q, 5pQcwSA (V + $Q )2 □ сила аэродинамического сопротивления; крк □ коэффициент сопротивления перекатыванию, который зависит от особенностей дорожного покрытия и качества шин; mA □ масса автомобиля; g □ ускорение свободного падения; pQ □ плотность воздуха; cw □ коэффициент аэродинамического сопротивления; SA □ площадь наибольшего поперечного сечения автомобиля.

Если MVR zd = MVR zd (t) рассматривать как скалярное управляющее воздействие

MVR.zd 6 [MVR.min , MVR.max ] С V t 6 T И

предположить, что <90 = 0, гибридный автомобиль как динамическая система может быть представлен моделью вида

aV + W2 + С = MVR.zd ,

где а = JKrkl; b = 0,5pocwSArk ;

С = ( Fa + FK ) rk + MFR ■

Применим к управляющему воздействию системы нелинейное преобразование вида

MVR.zd = fnp (MVR.zd , V)= MVR.zd ~ bV + bV ,

где b = const. В результате получим линейное представление нелинейной модели гибридного автомобиля относительно управления MVR.zd : aV + bV + c = MVR.zd .

Для данной модели с использованием стандартных методов теории линейных систем может быть получен регулятор скорости автомобиля MyR zd = MyR zd (V, Vzd ) , обеспечивающий минимизацию функционала JV ^ min , и исследована устойчивость системы. Затем управляющее воздействие MVR zd находится с использованием обратного преобразования

MVR.zd = fnp (MVR.zd , V) = fV.RG (V, Vzd ) -

Адаптивное управление агрегатами гибридной силовой установки

Для ГСУ с параллельной схемой построения можно записать

Мш (<х>5 и ) — ум(юуЛ Р0 ) +

+ УмМто (юУм 5 Рм ) Мггш (Рт ) 5

где МШ5 □ эффективный крутящий момент ДВС5

ыг

МВУ5,шт (ЮУ ) , МУЕ.тах (ЮУ )] ;

М„

□ момент вращения или торможения,

развиваемый электроприводом в двигательном или генераторном режиме,

М„

МУО.шт ( юуМ) , МУВ.шлх ( ®уМ)];

м„

□ тормозной момент5 развиваемый гидравлической системой ТОрМОЖеНИЯ5

МГш е[5 Мгш.тах ];

ум □ передаточное отношение трансмиссии от тягового электродвигателя к ведущим колёсам. Задачей адаптивного регулятора ГСУ является такое перераспределение нагрузки между отдельными её агрегатами5 которое обеспечивает поддержание заданного тяговоскоростного режима Мт — Мт ^ и обращает в минимум выбранный функционал качества 1 ^ ^ тт .

С целью уменьшения размерности задачи для описания перераспределения нагрузки между агрегатами ГСУ введём коэффициент использования электропривода

є = -

У мму

МТ/

В процессе торможения автомобиля5 когда Мга < 0 5 коэффициент е е[°51] характеризует уровень рекуперации энергии торможения. При е — 0 торможение осуществляется исключительно за счёт гидравлической тормозной системы. При 8 — 1 весь требуемый тормозной момент создаётся тяговым электроприводом в генераторном режиме:

Мт — Ум ■ МТО 5 МТО.тт < Мт < 0 . При 0 < е < 1 тормозное усилие создаётся с использованием обеих тормозных систем.

При разгоне автомобиля либо равномерном движение когда Мт > 0 5 коэффициент

8 е [-<х>51] характеризует перераспределение

потребляемой энергии между ДВС и тяговым электроприводом. При 8 < 0 тяговый электропривод работает в генераторном режиме и осуществляет подзарядку тяговой аккумуляторной батареи с использованием энергии5 вырабатываемой ДВС. Если 8 — 05 для создания тягового усилия используется только ДВС. При 0 < 8 < 1 тяговое усилие создаётся за счёт совместного использования тягового электропривода и ДВС. При 8 — 1 используется только тяговый электропривод.

Рассмотрим дискретный процесс управления ГСУ. При известных моделях агрегатов5 вхо-

дящих в состав ГСУ: Моуз = моУ8

муэ = муэ

— В

,Р м

V Ум

И Мігм = МГт

мо-

гут быть получены их обратные модели вида

Р Э = МОУ5

—, М

ЭУ8

Рм = МУЭ

ю

Ум

УЭ

и РТ — М-ш (МГш ) . В этом случае на к -м шаге управления при заданном коэффициенте использования электропривода 8 (к) управляющие воздействия ГСУ

и(к) — [Ро (к)5 Рм (к)5 Рт (к)5 у(к)! 5 которые обеспечивают требуемое значение Мт (к) 5 находятся с использованием следующих выражений.

ПРИ Мшм

управления

(к )< 0

компоненты вектора

Рэ (к ) = -1;

Рм (к) = мУЭ (Ю (к) ■ ум , мУЭ.2й (к)) ;

рг (к) = мгм (м&м.2й (к)) ;

у(к) = у(к -1),

У

где

мтм (k ) = max { M^^ ё (к),

I Ym

M„

Зависимости

MDVS = M DVS (®Y , Pd ) , Se = Se (( , Pd ),

Mtrm.zd (k) =

= min {YMMVD.zd (k) -MVR.zd (k) ,Mtrm.max }

Компоненты вектора управления при

MVR.zd (k) > 0

Рd (k) =

MDVS ( ш (k )-y-1 (k ) , MDVS.zd (k)), при MDVS .zd (k )- MD

-1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ПРИ MDVS.zd (k)< MD

DVS.min ’

Pm (k) = MVD (Ю(k) ' YM , MVD.zd (k)) ;

Pt (k ) = 0; y(k) = y((k), pd (k - ')) =

= arg min Mge ((k )-^1 (k), p D (k - '))}

Y6{y,- },i=',5l V "

где

MDVS .zd (k ) =

• (MVR.zd (k) YMMVD.zd (k)

= min <

у (k )

MVD.zd (k) = min {MVR zd (k) S (k)

I Ym

M

M„

при MVD.zd (k )>0;

MVD.zd (k) =

max

MVR.zd (k)

Ym

(k), M,

VD.min | ’

при MVD.zd (k) <0;

ёе — ёе 15Рп ) □ зависимость эффектив-

ного циклового расхода топлива от скорости вращения коленчатого вала и положения органа управления мощностью ДВС.

При Мт (к) — 0 все агрегаты ГСУ отключены: Ро (к) — -1; Рм (к) — 0; Рт (к) — 0;

у(к) —у(к -1).

mvd = mvd ( ®Yм, Pm ) :

Mtrm = Mtrm (Pt )

могут быть получены в результате теоретических исследований или стендовых испытаний агрегатов, входящих в состав ГСУ.

Таким образом, задача оптимизации управления ГСУ может быть сведена к задаче определения функции

е (k) = 8(MvR.zd (k) x (k)) ,

которая минимизирует функционал

JSV (x,u,N) ^ min на текущем ездовом цикле. Затем, при известном коэффициенте использования электропривода в, управляющие воздействия ГСУ определяются

регулятором ГСУ u = /gsu.RG (X MVR.zd , S) согласно выражениям, приведенным выше.

Учитывая недостаток априорной информации о характере ездового цикла, подобно системам прогнозирующего модельного управления, величина коэффициента использования электропривода в на k -м шаге должна выбираться системой управления с учётом оценок будущего значения критериев качества. Очевидно, что выбор стратегии управления должен стремиться к уменьшению величины потерь различных ресурсов на достаточно длительном отрезке времени T ^<х>. При этом проявляется несовершенство выбранного функционала, который неограниченно возрастает при N ^<х>. Для преодоления указанного недостатка при вычислении функционала качества управления будем использовать взвешенное (discounted) суммирование критериев

ад 4

J SV ,(k ) = £цj IK Pi 3i (k + j ),

j=0 i=1

где ц □ дисконтный фактор, 0 < ц < 1. Дисконтный фактор учитывает, что чем дальше САУ ГСУ заглядывает в будущее при выборе управляющих воздействий, тем меньше её уверенность в оценке будущих потерь различных ресурсов из-за недостатка априорной информации.

Рассмотрим структурную схему адаптивного регулятора гибридной силовой установку который реализует концепцию нейросетево-го управления на основе адаптивной критики [8-10] приведенную на рис. 2.

На к -м шаге управления вычисление коэффициента использования электропривода осуществляется нейроконтроллером

8 — •/'ояи.ж (х5 мт^ ) 5

который реализован в виде трёхслойной искусственной сети (ИНС) прямого распространения с активационной функцией нейронов скрытых слоёв в виде функции гиперболического тангенса и линейном нейроне выходного слоя

мт.2й Л ( мт.гй . Г мт.2й 1Л

= 2 - шіп < >

X X к=0,N I X I

>- -1 V -1 1. -1 ) /

1 мт.2й 1 . I мт.2й 1Л

шах < > - шіп <

к=0, N I X I к=0,N I X I

V ^ 1- -1 ) К. 1- -1 > /

-1

N

МС1

1 + ехр

( ( -2

V V

W

м,

УК. Ей X

Б,

//

-1.

N N0 2 =

1 + ехр (-2 ^'^^N02N N01 + Б N0 2 ^

7 = W N + Б •

& ** N0 З1’ N0 2^Б N0 3 ;

-1:

к=0, N

в = 0,5 (в +1)1 шах {в}- шіп {є} 1 +

4 ' V к=0, N к=0 N 1 ’ 1

+ шіп {в}

где W,

N01 :

W,

^уС3 □ матрицы весовых коэффициентов нейронов первого [12С3] второго [4П12] и третьего [1И4] слоев соответственно; В^ 5 Вш 2 5 Вж3 □ векторы смещений нейронов первого [12 С^1 ] 5 второго [4П1] и третьего [1П1] слоев соответственно. Символом □: □ обозначается поэлементное деление векторов.

Затем регулятор ГСУ определяет вектор управления и — /ози КО (х5 Мт гЛ 5 8) . Управляющие воздействия подаются на вход объекта управления.

Адаптивный критик осуществляет оценку качества управления на данном шаге

Цгц — /о8и.Лс (Х5 Мт^5 8) с учётом прогноза

будущих последствий данного управления. Адаптивный критик реализован на базе искусственной нейронной сети с архитектуроЙ5 подобной ИНС нейроконтроллера:

N =

1,1 А01

( (

1 + ехр

-2

W

А01

V V

м,

УК.Ей

X

АЛ

-1

Б

А01

//

N

А0 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 + ехр (-2 (02N А01 + БА02 ^

Р = w N + Б

■^Ьур WA0Зл А02^БА03 ,

-1

ГДЄ WAC1 , WAC2 :

WA0 3 □ матрицы весовых

коэффициентов нейронов первого [12 И] второго [4П12] и третьего [1И4] слоев соот-

к=0, N

2

Рис. 2. Адаптивный регулятор гибридной силовой установки

ветственно; ВЛС15 ВЛС2 5 ВЛС3 □ векторы

смещений нейронов первого [12 С^1 ] 5 второго [4П1] и третьего [1П1] слоев соответственно.

Блок адаптации обеспечивает параметрическую настройку (обучение) ИНС нейроконтроллера и адаптивного критика путём настройки соответствующих матриц весовых коэффициентов и векторов смещений нейронов. Целевой функцией настройки нейроконтроллера является минимизация функционала 15Кц ^ шт . Адаптивный критик

обучается с минимальной ошибкой аппроксимировать функцию

Jц — /о8П.ЛС (Х5 МУЯ^й 5 8) .

Выражение для функционала качества управления на к -м шаге может быть записано в виде

1 ^ц (к) —IКР13, (к) + ц1ц(к +1).

г—1

В этом случае ошибку адаптивного критика можно представить в виде ошибки временной разности

«(к) = й,уц (к) - X К Р13 (к ) + мР5уц (к +1) =

і=1

= Чуц (к - 1) -^ КРі3і (к - 1) +М-^5Уц (к)

і=1

Для вычисления ошибки временной разности должны использоваться оценки !^Уц (к) и

ЛУц (к +1) при одних и тех же значениях параметров ИНС адаптивного критика.

Коррекция параметров ИНС адаптивного критика осуществляется из условия минимизации квадратичной ошибки е = 0,5 -52 согласно выражениям

WACl (к + 1) = WA01(k)+ AWА0, (к);

БА0і (к + 1) = БА0і (к) + АБА0і (к) , і = 1, 3 ,

где

ШАС1(к) = УА0 AWА0і (к - 1)-

5 Яуц(к)

-^А0 (1 -VA0 )(к)

5 WA01(k )

АБА0і (к) = УА0АБА0і (к 1)

5 й,у,(к);

5 Б Аа(к )

5 й

5Б

= 1^

5 й

8У ц

5Б

А0 2

^Т х(1-N2 );

А0 3 \ А0 2 / ’

5 й

. = WT 5 БА01 А02 5 Б

8У ц

8Уц

А0 2

х(1-N2 );

V лаГ

5 й

ирїу ц = NT ;

5 W 2;

и WA03

5 й 5 й

ийкуц = уц NT ;

5 WA02 5 Б А0 2 ^

5 WЛC\ 5 Б А01

^А0 □ коэффициент скорости обучения ИНС адаптивного критика; VА0 □ коэффициент инерционности обучения, который в ряде случаев позволяет преодолеть локальные минимумы целевой функции в пространстве параметров сети; символом Пх □ обозначается поэлементное умножение векторов.

Коррекция параметров ИНС нейроконтроллера осуществляется согласно выражениям:

WNCl( к +1) = WNCl(k ) + AWNc■(k);

БЖі (к + 1) = БЖі (к) + АБЖі (к) , і = 1, 3 ,

где

AWNC1 (к )) N0 AWN0i (к-1)

) й5Уц(к ) 5є(к ) ;

^N0 '(1 V N0 )

58(к ) 5WN01 (к )

АБ Жі ( к )=V N0 АБ N0i (к 1)

) Чуц(к) 5Кк) ;

^N0 (1 V N0 )

5б(к) 5БЖі (к)

а fSv. (к) =j wt а fsv.

аs(k)

аБ

AC1

аБ

аs

аБ

= 1;

NC 3

аs

NC 2

--WT x (і - N2 );

NC 3 V NC 2 / ’

Значения коэффициента использования электропривода на каждом шаге управления5 асимптотически приближающиеся к оптимальным в процессе движения по заданному ездовому ЦИКЛУ5 могут быть получены на основе использования метода нейросетевых адаптивных критиков при постановке оптимизационной задачи в дискретном виде.

Литература

аs

= W ' " x(l - N2 );

у NC1 / ’

а бnci NC2 а бnc г

= NT

а W NC 2'

W

аs

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а w„

-NT

я И NC1 •

а Б NC 2

аs

а w„

а б.

■'[MVR.zd x] ;

ХЫС □ коэффициент скорости обучения ИНС нейроконтроллера; умс □ коэффициент инерционности обучения. Символом обозначается первый элемент вектора.

Таким образом5 на каждом шаге улучшается закон управления путём обучения нейро-контроллера5 а также повышается способность системы оценивать ситуацию путём обучения критика. Коррекция параметров продолжается5 пока система не достигнет требуемого качества управления.

Выводы

На основании анализа особенностей автомобиля с гибридной силовой установкой как объекта управления по скорости показана возможность уменьшения размерности оптимизационной задачи путём введения новой переменной □ коэффициента использования электропривода5 который определённым образом связан с вектором управления силовой установкой при известных задающем воздействии и векторе состояния.

1. Development of Fuzzy Logic and Neural

Network Control and Advance Emissions Modeling for Parallel Hybrid Vehicles / A. Rajagopalan, G. Washington, G. Rizzoni, Y. Guezennec. Center for Automotive Research. The Ohio State University Columbus, Ohio. Subcontract Report □ December 2QQ3

(http: //www.osti.gov/bridge).

2. Сериков С.А. Нечітка модель системи ке-

рування силовою установкою гібридного автомобіля / С.А. Сериков, Ю.Н. Боро-денко, А.А. Дзюбенко // Вісник ЖДТУ. Технічні науки. □ 2QQ6. □ Вип. IV(39). □ С. 24QC247.

3. Сериков С.А. Синтез оптимального управ-

ления гибридной силовой установкой / С.А. Сериков // Проблемы управления и информатики. □ 2QQ9. □ №2. □ С. 37-47.

4. Мосалов О.П. Самообучающиеся агенты

на основе нейросетевых адаптивных критиков / О.П. Мосалов, Д.В. Прохоров, В.Г. Редько // Искусственный интеллект. □ 2QQ4. □ Т.3. □ С. 550-560.

5. Редько В.Г. Нейросетевые адаптивные

критики / В.Г. Редько, Д.В. Прохоров // Научная сессия МИФИ-2004. 4.2 Нейроинформатика-2004. □ 2004. □ С. 77-84.

6. Чернодуб А.Н. Обзор методов нейро-

управления / А.Н. Чернодуб, Д.А. Дзюба // Проблемы программирования. □ 2011.

□ № 2. □ С. 79-94.

7. Автомобильный справочник. Перевод с

англ. Первое русское издание. □ М.: ЗАО КЖИ -ЗарулемЦ 2002. □ 896 с.

Рецензент: О.П. Алексеев, профессор, д.т.н., ХНАДУ.

Статья поступила в редакцию 01 июня 2012 г.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Сериков Сергей Анатольевич

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Сериков Сергей Анатольевич

NEURAL NETWORKS CONTROL OF THE HYBRID POWER UNIT BASED ON THE METHOD OF ADAPTIVE CRITICS

Текст научной работы на тему «Нейросетевое управление гибридной силовой установкой на основе метода адаптивной критики»