Адаптивный регулятор с активным накоплением информации на основе настраиваемого упредителя

Адонин Олег Валерьевич; Бодянский Евгений Владимирович; Котляревский Сергей Владимирович

УДК 681.513

АДАПТИВНЫЙ РЕГУЛЯТОР С АКТИВНЫМ НАКОПЛЕНИЕМ ИНФОРМАЦИИ НА ОСНОВЕ НАСТРАИВАЕМОГО УПРЕДИТЕЛЯ

АДОНИН О.В., БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В.

обеспечивающий прогноз на d -шагов с ошибкой

vp(t + d) = F(q-* 1)e(t + d).

Подставляя (2) в (1), получаем форму критерия

iQ = M{(P(q _1)(y(t + d/t) + v(t + d)) -- R(q-1 )y* (t + d))2 3 + Q(q-1 )u(t))2} =

= (P(q-1 )y(t + d/t) - R(q-1 )y*(t + d))2 +

+ (Q(q -1 )u(t))2 + M{(P(q-1 )v(t + d))2

Ft},

Рассматривается проблема активно-адаптивного управления в условиях неопределенности динамическим стохастическим объектом с запаздыванием в канале управления с использованием настраиваемого упредителя. Предложенный алгоритм является обобщением известных квазипрямых законов управления.

Согласно современной классификации, дискретные адаптивные системы управления можно разделить на три класса:

1. Прямые системы, в которых настраиваются непосредственно параметры регулятора, при этом вектор настраиваемых параметров может рассматриваться как оценка коэффициентов некоторого эталонного регулятора. Именно такие системы рассмотрены в предыдущих работах [1-3].

минимизируя которую по u(t), приходим к управлению

5IQ _

6u(t)

- 2(aP(q>^l,;d/l) )(P(q)y(t+d/t) - (3)

- R(q)y(t + d)) + 2Q(0)Q(q)u(t) = 0.

Проводя очевидные преобразования (3)

bo(P(q ДуП + d/t) -R(q 1)y (t + d)) +

+ Q(0)Q(q _1)u(t) = 0;

2. Непрямые системы, или системы с настраиваемой моделью с идентификатором в контуре. В этих системах задача решается в два этапа: идентификация модели, совпадающей по структуре с объектом управления, и вычисление параметров регулятора на основе полученных оценок.

3. Квазипрямые системы, занимающие промежуточное положение между прямыми и непрямыми системами. Эти системы содержат в контуре настраиваемый упредитель, который в общем случае отличается от модели объекта. В [4,5] была предложена группа стохастически эквивалентных квазипрямых систем, а в [6] предпринята попытка синтеза активно-адаптивного регулятора с настраиваемым упредителем при минимуме априорной информации.

В основе синтеза квазипрямых систем лежит минимизация критерия

IQ = M{(P(q-1)y(t + d) - R(q-1 )y*(t + d))2 +

+ (Q(q _1 )u(t))2

Ft},

(1)

b0 (C-1 (q-1 )(F(q)B(q)u(t) + G(q)y(t)) -- R(q-1 )y (t + d)) + Q(0)Q(q-1 )u(t) = 0,

вводя полином Q(q_1) = b0Q(0)Q(q_1) и умножая (4) на C(q_1), получаем уравнение

(F(q _1 )B(q-1) + C(q-1 )Q(q-1 ))u(t) -

- C(q)R(q)y * (t + d) + G(q_1 )y(t) = 0,

совпадающее с выражением упредителя, полученным в [ 1 ], откуда следует, что квазипрямая система обеспечивает то же качество управления, что и прямая.

Вводя далее отфильтрованные переменные

lx(t + d/t) = P(q)y(t + d/t),

|x*(t + d) = r(q)y*(t + d),

перепишем уравнение оптимального упредителя в виде:

где Q(q 1) — полином порядка nQ .

Используя методику преобразований, введенную в [1-3], поставим в соответствие преобразованному уравнению объекта оптимальный многошаговый упредитель выхода:

P(q-1)y(t + d/t) =

= —^ (F(q-1 )B(q-1 )u(t) + G(q-1 )y(t)), (2) C(q-1)

x(t + d/t) = F(q 1)B(q 1)u(t) + G(q 1) x x y(t) + (1 - C(q-1))X(t + d/t)

или

x(t + d/t) = 0T<p(t + d), (5)

где 0 - (nB + d + nA + nC) x 1 — вектор параметров, подлежащих определению,

70

РИ, 2001, № 2

9(t + d) =

= (u(t),...,u(t - пв - d + 1),y(t),...,y(t - nA +1), - x(t + d - 1/t - 1),...,-x(t + d - nc /t - nc))T = = (u(t);V(t^T.

Перепишем далее (5) в форме

X(t + d /1) = 0T9(t + d) = mou(t - d) + l Ty(t - d)

Поэтому в расчетах целесообразно использовать просто вычисляемые характеристики, такие как

ошибка слежения упредителя vM(t), ковариаци-

онная матрица Рф (t + d)

t+d t

Z ф(і)ф1(і)

і=1

-1

G-кри-

терии, применяемый в теории планирования эксперимента, и т.д.

и подставим его в соответствующее уравнение настраиваемого упредителя:

X(t) = 9T (t - 1)<p(t + d) =

= mo (t - 1)u(t - d) + l T (t - 1)y(t - d),

параметры которого настраиваются с помощью какого-либо адаптивного алгоритма идентификации, не использующего значение дисперсии ст2 ,

vp

например, рекуррентного метода наименьших квадратов.

МногошаговыИ настраиваемый прогноз можно получить с помощью прогнозирующей модели

X(t + d) = 0T (t)9(t + d) = mo (t)u(t) + TT (t)y(t),

при этом адаптивная система работает следующим образом:

— вычисление ошибки идентификации;

2i (t) = X(t) -0T(t - 1)(t) = x(t) - X(t);

— вычисление оценок параметров настраиваемого упредителя 0(t);

— вычисление управляющего сигнала u(t);

— вычисление многошагового прогноза:

X(t + d) = 9Tф(t + d).

Качество функционирования квазипрямоИ системні оценивается с помощью четырех видов ошибок: ошибки прогнозирования vP(t) = X(t) - X(t/t - d), ошибки идентификации vI (t) = X(t) - X(t), ошибки слежения упредителя vM (t) = X * (t) - X(t) и ошибки управления vc(t) = X*(t) -X(t). Ошибка vp(t) не наблюдается и не вычисляется, поэтому не может быть использована в расчетах. Ошибка vc(t) является функциеИ коэффициентов полиномов A(q_1), B(q_1), C(q_1), определение которых требует дополнительных вычислении. Использовать ошибки идентификации тоже нецелесообразно, поскольку в этом случае необходимо определять коэффициенты полинома C(q_1) • Заметим, что для ошибки идентификации справедливо соотношение [7]:

M{(C(q-1)(v(t) - e(t)))2

Ft_d} = Ф T(t)P(t)9(t).

Введем критерии

ІІ = M{det Рф (t + d -1)/ det P<p(t + d)|Ft} при ограничениях

M{vM (t + d)|Ft} < VM (t + d), u2 (t) < U2(t) и сформируем лагранжиан:

LQ = -Iі +p((X*(t + d) - X(t + d) - vM(t + d))2 +

+ p(u2(t) - U2(t)) =

= -1 - ф T(t + d)P(p (t + d - 1)(t + d) + p((X * (t + d) --0T(t)9(t + d))2 -

- vM(t + d)) + p(u2(t) - U2(t)) =

=-1 - u2(t)Pffio (t + d -1) - 2u(t)P_ToT (t + d - 1)y(t) -

-Ф T(t)P~(t + d - 1)y(t) +

+ P((x * (t + d))2 + u2 (t)in2 (t) +

+ (TT (t)y(t))2 - 2u(t)x * (t + d)^(t) -

- 2x * (t + d)l(t)(t) - 2u(t)mQ (t)~T (t)y(t) -

- vM(t + d)) +p(u2(t) - U2(t)),

оптимизация которого по u(t) приводит к квази -прямому адаптивному регулятору с активным накоплением информации:

u(t) =

_ P(t)mo (t)(x * (t + d) - ~T (t)y(t)) + Pf^(t + d - 1)y(t)

P(t)m02(t) - Pfo (t + d -1) + p(t) ’

■P(t +1) =

= [P(t) + Гр(t + 1)((x * (t + d) - 0(t)9(t + d))2 - V2(t + d)|, p(t +1) = [(t) + r(t + 1)((uQ (t))2 - U2 (t)|,

совпадающему при x * (t + d) = o с прямым регулятором, введенным в [2].

Таким образом, в настоящей и предыдущих [1-3] работах предложены прямые и квазипрямые адаптивные регуляторы с активным накоплением информации для нестационарных стохастических динамических объектов, возмущаемых “цветным” шумом, с запаздыванием в канале управления. Введенные алгоритмы исследованы с точки зрения

РИ, 2001, № 2

71

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

их оптимальности, показано, что они обеспечивают качество управления выше, чем традиционные стохастически эквивалентные системы.

Литература: 1. Адонин О.В., Бодянский Е.В., Котляревс-кий С.В. Управление динамическими стохастическими нестационарными объектами в условиях неопределенности с активным накоплением информации. 1.Достоверно-эквивалентный подход //Радиоэлектроника и информатика. 1999. N4. С. 76-81. 2. Адонин О.В., Бодянский Е.В., Котляревский С.В Адаптивный регулятор с активным накоплением информации // Радиоэлектроника и информатика. 2000. N3. С.57-60. 3. Адонин О.В., Бодянский Е.В., Котляревский С.В. Управление динамическим стохастическим нестационарным объектом в условиях неопределенности с активным накоплением информации. II. Объект с быстрым дрейфом параметров / / Радиоэлектроника и информатика. 2001. N1. С. 68-7l. 4. Бодянский Е.В., Руденко О.Г. Адаптивные модели в системах управления техническими объектами. Киев: УМВК ВО, 1988. 212 с. 5. Бодянский Е.В., Чайников С.И., Ачкасов А.Е., Воронов-ский Г.К. Адаптивные алгоритмы управления в АСУ ТП и оценка их эффективности на ранних стадиях проектирования. Харьков: ХОУС, 1995. 134 с. 6. Бо-

УДК 681.513.7 "

НЕЙРОСЕТЕВАЯ АДАПТИВНАЯ ФИЛЬТРАЦИЯ ПОЛИГАРМОНИЧЕСКИХ СТОХАСТИЧЕСКИХ СИГНАЛОВ

БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В, ЧАПЛАНОВ А.П, ШИЛО А.В._________________

Рассматривается задача выделения гармонических компонент произвольных частот из стохастических последовательностей с использованием нейросетевых технологий. Предлагается архитектура искусственной нейронной сети и алгоритмы ее обучения, являющиеся обобщением дельта-правила на случай, если на настраиваемые веса нейронов наложены ограничения. Разработанные алгоритмы оптимальны по быстродействию в классе градиентных процедур и способны отслеживать дрейф параметров отфильтрованных сигналов.

Во многих прикладных задачах, связанных с обработкой сигналов различной природы, достаточно часто возникает проблема выделения периодических компонент, искаженных шумом. Данная проблема обычно сводится к оцениванию параметров гармоник на фоне помех и может быть решена с помощью традиционных методов Фурье - анализа. Здесь, однако, возникает ряд проблем в случае необходимости обработки нестационарных сигналов в реальном времени. В качестве альтернативы Фурье-анализу в последнее время все чаще используются методы адаптивной цифровой фильтрации [ 1 -7], которые в сочетании с нейросетевыми технологиями [8] позволяют реализовать новые возможности компьютерной обработки информации.

дянський Е.В., Борячок М.Д. Оптимальне керування стохастичними об’єктами в умовах невизначеності. Київ: ІСДО, 1993. 164 с. 7. Yoodwin Y. C, Ramadge P.I., Caines P.E., A globally convergent adaptive predictor // Automatica. 1981. 17. N1. Р. 135-140.

Поступила в редколлегию 20.10.2000

Рецензент: д-р техн. наук. проф. Любчик Л.М.

Адонин Олег Валерьевич, инженер 1-й категории кафедры информатики ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры искусственного интеллекта ХТУРЭ. Научные интересы: адаптивные системы, искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

E-mail: bodya@kture.kharkov.ua

Котляревский Сергей Владимирович, канд. техн. наук, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

Предположим, что анализируемая стохастическая последовательность может быть представлена в виде

у =2 (a j cos Wjk+bj sin Wjk)+%(k) =

j=i

= ^Cj sin(®jk+Vj)+%(k), (1)

j=i

где m — количество гармонических компонент в сигнале y(k) (может быть достаточно велико); a, bj, cj, g>j — неизвестные параметры отдельных гармоник; 0< со,=2nfjT0<n — частоты гармонических компонент, в общем случае неизвестные; Т0—период квантования сигнала; k = 1, 2,..., N, ... — текущее дискретное время; Дк)—стохастическая компонента с нулевым математическим ожиданием и ограниченным вторым моментом.

Модели (1) соответствует разностное уравнение

П (1-2cos®,z-1+z-2) y(k)=4(k), (2)

(здесь z-1 — оператор сдвига назад), описывающее формирующий фильтр порядка 2m, образованный цепочкой из m нерекурсивных звеньев второго порядка. Заметим, что на основе уравнения (2) с помощью тех или иных алгоритмов идентификации могут быть восстановлены лишь оценки частот ® j; для нахождения же амплитудных и фазовых характеристик приходится прибегать к достаточно сложным многоэтапным процедурам.

На практике для выделения гармонических компонент из стохастических сигналов наиболее широко распространены нерекурсивные фильтры [3,4,7]. Однако, как отмечалось в [9], подход, основанный на использовании таких фильтров, связан с определенными ограничениями, особенно в случаях,

72

РИ, 2001, № 2

The adaptive regulator with active accumulation of the information on the basis of adjusted predictor

Текст научной работы на тему «Адаптивный регулятор с активным накоплением информации на основе настраиваемого упредителя»