УДК 681.51:621.3.002.5:621.039.6:533.95
СИСТЕМА С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ ДЛЯ УПРАВЛЕНИЯ ФОРМОЙ И ТОКОМ ПЛАЗМЫ В ТОКАМАКЕ1
Ю.В. Митришкин, А.Я. Коростелёв
Представлены результаты синтеза и моделирования системы с прогнозирующей моделью для управления вертикальной скоростью, формой и током плазмы в токамаке-реакторе. Проведено сравнение с системой, содержащей Ига-робастный регулятор в цепи обратной связи. Рассмотрены особенности метода управления с прогнозирующей моделью для решения задачи магнитного управления плазмой.
Ключевые слова: управление с прогнозирующей моделью, робастное управление, обратная связь, синтез систем, моделирование, магнитное управление плазмой, токамак.
ВВЕДЕНИЕ
Управляемый термоядерный синтез — один из перспективных источников энергии будущего. Необходимые условия для его осуществления могут быть достигнуты посредством специальных установок, токамаков, позволяющих удерживать высокотемпературную плазму в магнитном поле. Для удержания плазмы внутри камеры токамака необходима система магнитного управления с обратной связью [1]. В данной статье представлены результаты разработки такой системы, основанной на методе управления с прогнозирующей моделью [2]. В качестве исходных данных были взяты параметры проектируемого международного экспериментального термоядерного реактора ITER (International Thermonuclear Experimental Reactor) — см. www.iter.org.
Системы с прогнозирующей моделью применялись ранее для скалярного управления вертикальным положением плазменного шнура в токамаке COMPASS-D (Culham Science Centre, Великобритания) [3]. Применение систем данного класса для многомерного управления формой и током плазмы в токамаках авторам не известно.
1. ПОСТАНОВКА ЗАДАЧИ
Плазма в токамаке представляет собой многомерный нелинейный объект управления с распределенными параметрами [1, 4]. Ее динамические
1 Работа выполнена при частичной финансовой поддержке РФФИ (проект № 06-08-00265).
характеристики существенно изменяются на протяжении плазменного разряда, однако на определенном его участке, квазистационарной фазе разряда, когда ток плазмы мало изменяется, остаются практически неизменными с некоторой неопределенностью в виде немоделируемой динамики. Задача, которая ставится в данной работе, состоит в синтезе и моделировании системы с прогнозирующей моделью для магнитного управления плазмой в токамаке на квазистационарной фазе разряда. Структурная схема системы управления показана на рис. 1.
Управляющими воздействиями в системе служат 12 напряжений на катушках полоидального магнитного поля, подаваемые от мощных управляемых многофазных тиристорных преобразователей переменного напряжения в постоянное: одного быстрого преобразователя вертикальной стабилизации (VSC — Vertical Stability Convertor) и 11-ти главных преобразователей MC — (Main Converters) для управления формой и током плазмы. Модели преобразователей имеют насыщение, инерционное и транспортное запаздывание. На объект управления действуют два неконтролируемых возмущения 8Вр и 8l;, представляющих собой соответственно
Pi
вариации отношения вр газокинетического давления плазмы к давлению внешнего магнитного поля и внутренней индуктивности плазмы l; [1, 5, 6].
Система диагностики состоит из дифференцирующего фильтра вертикального положения центра плазмы Fd и многомерного фильтра F для сигналов зазоров между сепаратрисой плазмы и первой стенкой токамака, тока плазмы и токов во
АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ
т-' і
Рис. 1. Структурная схема системы магнитного управления плазмой в токамаке
внешних магнитных обмотках. Выходами объекта управления являются:
— вариации зазоров 8g = [8gp ..., 5g6]T на ква-зистационарной стадии разряда, характеризующие форму плазмы;
— вертикальная скорость центра плазменного шнура dZp/dt;
— вариация тока плазмы Ыр;
— вариации токов в катушках полоидального магнитного поля Ырр = [5/pp1, ..., $1PP11]T.
Под вариациями здесь понимаются отклонения величин от их значений, заранее рассчитанных для данной точки сценария плазменного разряда.
Плазма в токамаке неустойчива по каналу управления вертикальной скоростью. При этом величина обратна неустойчивому полюсу линеаризованной модели ~0,1 с. Система управления с обратной связью должна обеспечивать стабилизацию вертикальной скорости плазмы относительно нулевого значения на всем протяжении плазменного разряда при действии внешних возмущений типа малого срыва, приводящего к быстрым сбросам (спадам) величин и /..
p .
Точность стабилизации формы плазмы на ди-верторной фазе разряда требуется относительно высокая. Отклонение сепаратрисы (граничной поверхности) плазмы при действии возмущений не должно превышать величин порядка 10 см, что составляет примерно 2 % от большого радиуса ITER, равного 6,2 м. Кроме того, при решении задачи управления формой плазмы должны быть учтены ог-
раничения на максимальную мощность управления, которая не должна превышать 100 МВт.
Полное описание технических требований к системе магнитного управления плазмой ITER приведено в работе [5]. В качестве математической модели плазмы в токамаке используется плаз-мо-физический код ДИНА [7] и линейная стационарная модель, полученная путем его линеаризации в выбранной точке сценария [1, 6].
2. УПРАВЛЕНИЕ С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ
Выбор метода управления с прогнозирующей моделью для решения поставленной задачи обусловлен тем, что он позволяет систематически учитывать ограничения на управляющие сигналы, а также без дополнительных сложностей реализуется для управления многомерными объектами с запаздыванием.
Для объяснения основной идеи управления с прогнозированием по модели рассмотрим простейшую систему управления объектом, имеющим скалярный вход и(^ и скалярный выход у(?). Через г(?) обозначим желаемую траекторию выходного сигнала. Мы будем рассматривать систему в дискретном времени, т. е. только в моменты времени ? = кАТ, где АТ — некоторый период квантования, а к — целое число. Для простоты будем считать АТ = 1. Объект управления предполагается строго реализуемым, т. е. знаменатель всех компонент его
Рис. 2. К пояснению идеи управления с прогнозированием по модели объекта
матричной передаточной функции имеет степень выше, чем степень числителя.
Будем считать, что в алгоритме регулятора используется модель объекта управления, достаточно хорошо описывающая его поведение. В наличии такой модели в алгоритме состоит одна из ключевых особенностей управления с прогнозированием по модели. Имея модель объекта управления, можно прогнозировать значения сигнала у(1) на определенное число шагов вперед (рис. 2).
Будем обозначать данный прогноз как у (к + 1| к),
у (к + 2|к), ..., у (к + р|к), т. е. значения сигнала у(1) в моменты времени (к + 1), (к + 2), ..., (к + р), предсказанные в момент к. Число тактов р, на которых строится прогноз, называется горизонтом предсказания. Прогнозируемая траектория будет зависеть от и(к|к), и(к + 1|к), ..., и(к + т|к), т. е. от будущих значений управляющего воздействия и(1). Суть метода заключается в том, чтобы найти некоторую последовательность значений и(1), которая обеспечивает наилучшую в некотором смысле прогнозируемую траекторию у(ґ). Длина последовательности т является фиксированной величиной и называется горизонтом управления. Все последую-
щие значения управляющего воздействия предполагаются неизменными: и(к + /|к) = и(к + т — 1|к), V/ 1 т. Искомая последовательность значений входного воздействия определяется в результате решения некоторой задачи оптимизации. Выбор «наилучшей» траектории определяется показателем качества управления. Обычно применяют показатель качества, содержащий квадрат рассогласования между прогнозируемым выходным сигналом объекта у(?) и желаемой траекторией г(1). Кроме того, показатель качества обычно включает в себя слагаемые, учитывающие энергетические затраты на управление. Примером показателя качества может служить функция вида
р т - 1
J = О £ (У(к + / |к) - г (к + /))2 + Я £ и2(к + /),
I = 1 I = 0
где О и Я — весовые коэффициенты.
На первый взгляд, в результате описанных действий получается управление без обратной связи, так как рассчитанная оптимальная последовательность и(1) не будет учитывать возможных будущих возмущений, ошибок моделирования и других факторов. Однако на самом деле это не
так: после того, как на объект подали первый элемент вычисленной оптимальной последовательности и(к|к), на следующем такте вся процедура повторяется заново, с учетом вновь поступившей информации. При этом определяется уже другая оптимальная последовательность и(к + 1|к + 1), и(к + 2|к + 1), ..., и(к + т + 1|к + 1), первый элемент которой поступит на вход объекта управления. Замыкание обратной связи осуществляется именно благодаря повторению процедуры оптимизации на каждом такте с учетом последней поступившей с объекта информации.
Последовательность действий, выполняемых на каждом такте работы алгоритма, можно описать следующим образом.
• Построение прогноза значений выходных сигналов объекта управления на р шагов вперед. Прогноз строится как функция от будущих значений управляющих воздействий на т последующих шагах и известного текущего состояния объекта. Текущее состояние объекта может определяться с помощью наблюдателя состояния.
• Подстановка построенного выражения прогноза в заданный показатель качества управления. В результате определяется зависимость показателя качества от будущих значений управляющего воздействия.
• Нахождение будущей траектории управляющего воздействия, оптимизирующей значение показателя качества управления.
• Подача на объект управления только первого управляющего воздействия из найденной траектории на горизонте управления.
3. ПРОГНОЗИРОВАНИЕ ВЫХОДА ОБЪЕКТА УПРАВЛЕНИЯ
Пусть объект управления, включая исполнительные устройства и систему диагностики, задан линейной системой разностных уравнений
Хк + 1 = Ахк + Ви иЬ
Ук = Схк.
(1)
Для формализации алгоритма управления удобно воспользоваться вектором приращения управляющего воздействия, определяемым как 8ик = ик — ик _ 1. С учетом данного обозначения из уравнений (1) получим:
Хк + 1 = Ахк + Виик - 1 + Би5ик, ук + 1 = Схк + 1 = САхк + СВиик - 1 + СВи8ик. (2)
Тогда для момента к + 2 после подстановки (1) в (2) и преобразований имеем:
X,
к + 2
- А Хк + (АВи + Ви)ик - і + (АВи + Ви)Ъик +
ик + ВиЪик + 1,
Ук + 2 Схк + 2 САхк + (САВи + СВи)ик - 1 +
+ (САВи + СВи)8ик + СВи8ик + 1.
Данные действия можно продолжить на весь горизонт предсказания (на р шагов вперед). Затем полученные уравнения можно представить в компактной форме:
7 - БхХк + Би1ик - 1 + ^и,
(3)
где 7 - [Ук + 1 Ук + 2:’ Ук + з, ...] , и - [и* ик + 1
к +2, ...] , — [^ик, 8ик + 1, 8ик + 2, ...] , а ^%, ^и1 и
и
Su — матрицы постоянных коэффициентов.
В выражении (3) вектор состояния объекта управления хк определяется с помощью наблюдателя состояния, а значение управляющего воздействия на предыдущем шаге ик _ 1 содержится в памяти регулятора. Таким образом, для построения прогноза достаточно задать вектор 8 и, с помощью которого регулятор может воздействовать на качество управления.
4. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРИ ОТСУТСТВИИ ОГРАНИЧЕНИЙ
При решении поставленной задачи используется показатель качества следующего вида:
/ = (У — R)TWy(Y — Я) + 8UTWSu8U + ит^ии, (4)
где Я — желаемая траектория объекта управления, а Wy, WSu и Wu — положительно определенные весовые матрицы. Первое слагаемое показателя качества отражает рассогласование между желаемой и действительной траекториями объекта управления. Второе слагаемое позволяет заданием матрицы WSu менять плавность регулирования. Третье слагаемое ограничивает абсолютную величину управляющего воздействия. Более выгодными в соответствии с показателем качества будут считаться управляющие воздействия, обладающие меньшей абсолютной величиной.
Подставив выражение прогноза (3) в показатель качества (4) и выразив и через 8 и и ик _ 1, можно получить зависимость /(8 и). Таким образом, цель алгоритма управления заключается в нахождении такого значения 8 и, которое доставляет минимум функционалу /(8 и). Для рассматриваемой линей-
ной системы данная зависимость будет квадратичной.
Минимум функционала ищется только по значениям 8и на горизонте управления, т. е. для первых т тактов (8ик, ..., 8ик + т_ 1), а остальные компоненты вектора 8 и считаются равными нулю. Горизонт управления всегда назначается существенно меньше горизонта предсказания, чтобы реакция системы на выбранные управляющие воздействия была полностью включена в вектор У и имела влияние на показатель качества. При таком выборе процедура оптимизации будет наиболее эффективна. В противном случае алгоритм будет лишен информации о влиянии последних управляющих воздействий на показатель качества, так как часть переходного процесса не войдет в прогноз, что приведет к неверному определению оптимальной траектории.
Если в постановку задачи не входят ограничения на управляющие воздействия, то решение /(8 и) ^ тш находится аналитически, что приводит к линейному закону управления:
8и = Кххо + Ки1ик - 1 + КА где Кх, Ки1 и Кг — числовые матрицы, полученные в результате решения системы алгебраических уравнений
й/( 8 и) = 0 с1{ 8 и) .
После нахождения оптимальной траектории изменения управляющего воздействия 8и на данном такте на объект управления выдается только воздействие ик = ик - 1 + 8ик, а остальные значения отбрасываются, и на следующем такте вся процедура повторяется заново с учетом вновь поступившей информации. Такой подход называется принципом удаляющегося горизонта, позволяющим добиться хорошей работоспособности алгоритма при наличии возмущений и несоответствия между реальным объектом управления и его прогнозирующей моделью, встроенной в регулятор.
5. УЧЕТ ОГРАНИЧЕНИЙ НА УПРАВЛЯЮЩИЕ ВОЗДЕЙСТВИЯ
В реальной постановке задачи исполнительные устройства обладают насыщением, что приводит к ограничениям на управляющие воздействия. Эти ограничения можно выразить следующим неравенством:
(5)
и т итах
-и — итіп
где итах и ит1п — заданные векторы (в случае решаемой задачи — векторные константы). Поскольку вектор и может быть выражен через 8 и и ик - 1, то ограничения можно представить в виде
Ми8и< М1Ш ()
где Ми и М1т — некоторые известные матрицы. В результате оптимальный вектор 8 и может быть найден путем решения задачи /(8 и) ^ тш при ограничениях (6).
6. РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ
В данной работе для синтеза регуляторов использовались линеаризованные модели, полученные путем линеаризации кода ДИНА в заданной точке сценария плазменного разряда [1, 6]. Линеаризованная модель имеет достаточно высокий порядок (около 150 состояний), что может привести к повышенным затратам вычислительных ресурсов при управлении. Поэтому порядок данных моделей снижен до 30 путем применения процедуры численной редукции [1].
При моделировании работы синтезированного регулятора в замкнутой системе управления использовалась как линеаризованная модель высокой размерности с сосредоточенными параметрами, так и исходная нелинейная модель плазмы ДИНА с распределенными параметрами. Этим была показана возможность работы регулятора с прогнозирующей моделью при несоответствии «реального» объекта управления (в данном случае — нелинейного кода ДИНА) и линейной модели, использованной для синтеза прогнозирующего регулятора.
Результаты моделирования работы регулятора при действии на плазму возмущения типа «малый срыв» в момент времени 0,3 с приведены на рис. 3. Возмущение проявляется в виде одновременных сбросов величин вР и I-. Для сравнения на этих же
р 1
рисунках показаны результаты работы системы управления с Нте-регуляторами, предложенными в работе [1]. Видно, что регулятор с прогнозированием по модели приводит вертикальную скорость в окрестность нулевого значения так же быстро, как и Нж-регулятор (рис. 3, б). Аналогичная ситуация имеет место и с ликвидацией вариации тока плазмы (рис. 3, в), когда при быстром падении внутренней индуктивности плазмы 11 плазменный ток скачком возрастает вследствие закона сохранения энергии. На графике отклонений размеров зазоров между сепаратрисой плазмы и внутренней стенкой токамака можно видеть (рис. 3, а), что регулятор с прогнозированием по модели показывает заметно меньшее время переходного процесса
Время (с) а
Время (с) г
0,5
0
^-0,5
'с?
^ -1 §-1,5 -2 -2,5
1 1 1 1 1 1 1 1 1 1 1 1 1
Регулятор с прогнозирующей моделью -■ Н^-регулятор
і і і і
0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65 0,7 0,75 0,8 Время (с) б
х105
Время (с) в
Время (с) д
Время (с) е
Время (с)
ж
Рис. 3. Результаты моделирования замкнутой системы управления плазмой при малых срывах:
а — вариации зазоров между сепаратрисой и первой стенкой; б — вертикальная скорость центра плазменного шнура; в — вариация тока плазмы; г — напряжения на обмотках управления при работе регулятора с прогнозирующей моделью; д — напряжения при работе робастного И^-регулятора; е — вариации токов в обмотках управления при работе регулятора с прогнозирующей моделью; ж — вариации токов в обмотках управления при работе робастного И^-регулятора
по сравнению с Иж-регулятором. Кроме того, прогнозирующий регулятор дает меньшую амплитуду отрицательных отклонений зазоров. Это важно, так как отрицательное отклонение, означающее приближение плазмы к внутренней стенке токама-ка, может привести к разрушению реактора и выбросу энергии плазмы наружу. Такие возможности по сокращению времени переходного процесса и уменьшению размеров отклонений зазоров обеспечиваются тем, что регулятор с прогнозирующей моделью благодаря получению оптимального управления на каждом шаге управляемого процесса приводит к форсированным процессам управления по сравнению с Ите-регулятором (рис. 3, г, д). Управляющие напряжения выходят на насыщение за относительно короткие интервалы времени, что приводит к более быстрым изменениям токов в обмотках, создающих полоидальные магнитные поля (рис. 3, е, ж).
ЗАКЛЮЧЕНИЕ
Результаты сравнения моделирования систем магнитного управления плазмой показывают, что при использовании регулятора с прогнозированием по модели достигается меньшее время переходного процесса. Данные результаты объясняются принципиальным отличием управления с прогнозированием по модели от управления посредством любых линейных регуляторов, состоящее в том, что при оптимизации показателя качества (4) явно учитываются ограничения на входные воздействия (5), результатом чего является нелинейный закон управления. Более того, разработанный регулятор с прогнозирующей моделью одновременно обрабатывает весь набор из 19-ти входных сигналов, поступающих от объекта. Это не приводит к традиционному разбиению системы управления на два контура: быстрый скалярный контур для управления вертикальной скоростью плазмы и медленный многомерный контур для управления формой и током плазмы [1]. В этом заключается оригинальность применяемого регулятора с прогнозирующей моделью по сравнению с известными блок-диагональными регуляторами [1, 5], обеспечивающая новое качество управления.
С другой стороны, система управления с прогнозирующей моделью для своей работы требует больше вычислительных затрат в единицу времени по сравнению с любым линейным регулятором, например, Нж регулятором. Это связано с тем, что на каждом шаге прогнозирующего управления решается задача оптимизации критерия качества с учетом ограничений и находится оптимальное уп-
равляющее воздействие. Сравнительные оценки производительности линейных и нелинейных регуляторов делать преждевременно, поскольку быстродействие вычислительной техники постоянно растет, а строительство термоядерного реактора займет время масштаба 10 лет. Поэтому сейчас важно разобраться в тех дополнительных ресурсах, которые имеются в системах магнитного управления плазмой в токамаках и которые важно научиться использовать посредством разработки новых эффективных алгоритмов управления. На этом пути и получены результаты в данной работе.
Кроме того, для нелинейного регулятора с прогнозирующей моделью, который учитывает ограничения на входные воздействия, важно в дальнейшем получить оценки запасов устойчивости замкнутой системы, что представляет собой сложную аналитическую задачу и является предметом дальнейших исследований.
ЛИТЕРАТУРА
1. Синтез и моделирование H^-системы магнитного управления плазмой в токамаке-реакторе / В.Н. Докука, А.В. Кадурин, Ю.В. Митришкин, Р.Р. Хайрутдинов // Автоматика и телемеханика. — 2007. — № 8. — С. 126—145.
2. Rossiter J.A. Model-Based Predictive Control: A Practical Approach. — CRC Press LLC, 2003. — 318 p.
3. Application of Cautious Stable Predictive Control to Vertical Positioning in COMPASS-D Tokamak / J.R. Gossner, P. Vyas, B. Kouvaritakis, A.W. Morris // IEEE Trans. on Control Systems Technology, 1999. — Vol. 7, N 5. — P. 580—587.
4. Khayrutdinov R.R., Lukash V.E. Studies of Plasma Equilibrium and Transport in a Tokamak Fusion Device with the Inverse-Variable Technique // Journal Comp. Physics. — 1993. — Vol. 109. — P. 193—201.
5. Mitrishkin Y.V., Kurachi K., Kimura H. Plasma Multivariable Robust Control System Design and Simulation for a Thermonuclear Tokamak-Reactor // Int. J. Control. — 2003. — Vol. 76, N 13. — P. 1358—1374.
6. Mitrishkin Y.V., Dokuka V.N., Khayrutdinov R.R. Linearization of ITER Plasma Equilibrium Model on DINA Code // Proc. of The 32nd EPS Plasma Physics Conference, Tarragona, Spain, ID P5.080. — 2005.
7. Лукаш В.Э., Докука В.Н., Хайрутдинов Р.Р. Программновычислительный комплекс ДИНА в системе MATLAB для решения задач управления плазмой токамака // Вопросы атомной науки и техники / Сер. Термоядерный синтез. — 2004. — Вып. 1. — С. 40—49.
Статья представлена к публикации членом редколлегии С.Д. Земляковым.
Митришкин Юрий Владимирович — д-р техн. наук, вед. науч. сотрудник, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, S (495) 334-87-71, e-mail: yvm@mail.ru
Коростелев Александр Яковлевич — аспирант, Московский государственный технический университет им. Н.Э. Баумана, ® (495) 725-44-32, e-mail: akorostel@gmail.com