Математическое моделирование физических процессов
УДК 517.097
В. П. Первадчук, Д. Б. Шумкова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ В ЗАДАЧАХ С ПОДВИЖНЫМ ТЕПЛОВЫМ
ИСТОЧНИКОМ
Теория оптимального управления системами с распределенными параметрами интенсивно изучается и остается актуальной на протяжении нескольких десятков лет. Центральными теоретическими проблемами описания дифференциальных уравнений, их систем и распределенных задач, в том числе и задач оптимального управления распределенными системами являются проблемы, связанные с однозначной разрешимостью, получением необходимых и достаточных условий разрешимости вариационных постановок, а также с непосредственным численным решением. Особый интерес представляют задачи оптимального управления распределенными системами в своих нелинейных постановках. Нелинейность относительно функции управления в дифференциальной задаче приводит к необходимости применения специальных методов теоретического исследования и численного решения [1, 2].
Производство оптических волокон представляет собой сложный высокоточный технологический процесс, включающий в себя различные физико-химические явления. К оптико-механическим характеристикам кварцевых заготовок при производстве кварцевых световодов предъявляются жесткие требования. Качество волоконно-оптических световодов в первую очередь зависит от технологического процесса газофазного осаждения (легирования). Поэтому математическое моделирование и управление этим процессом весьма важно и актуально.
Легирование, которое осуществляется, как правило, с помощью технологии MCVD (Modified Chemical Vapor Deposition - модифицированное химическое газофазное осаждение) - сложный физико-химическим процесс, и пока он мало изучен. Практика показывает, что газофазное осаж-
дение в сильной степени зависит от температуры. Поэтому проблема оптимального управления этим процессом может быть приведена к задаче управления температурным полем в заготовке, которое описывается нестационарным уравнением теплопроводности; в качестве управляющего параметра может быть выбрана скорость движения горелки.
Постановка задачи
Рассмотрим технологический процесс легирования заготовки газофазным осаждением по методике МСУБ. Создание волокна происходит в два этапа. На первом изготавливается цилиндрическая заготовка с заданным профилем показателя преломления путем осаждения из газовой фазы легирующего слоя на внутренней поверхности цилиндрической заготовки. Этот этап является определяющим в технологии изготовления качественного волокна и требует точного соблюдения условий, гарантирующих получение заготовки с заданными параметрами. На второй стадии заготовку вытягивают. Предполагается, что во время вытяжки отношение внешнего диаметра волокна к диаметру сердцевины в любой момент времени сохраняется.
Для получения сердцевины волокна с нужным профилем показателя преломления (показатели преломления оболочки и сердцевины отличаются), применяются различные примеси (легирующие добавки).
В ходе этого процесса опорная кварцевая трубка вращается в герметичных муфтах и нагревается до температуры 1200-1800 °С двигающимся вдоль продольной оси пламенем кислородно-водородной горелки (рис. 1). Внутрь трубки подается смесь кислорода с парами некоторых
из следующих веществ: тетрахлориды кремния и германия, бромид бора, оксихлорид фосфора, шестифтористая сера и другие. В зоне разогрева горелки парообразные реагенты окисляются. Частицы образовавшихся оксидов размером около 0,1 мкм осаждаются на внутренние стенки трубки и сплавляются, образуя слой легированного соответствующим образом кварца. Подбором концентрации компонентов смеси на входе в трубку, температуры факела и скорости его движения можно получить требуемую скорость осаждения слоя и его показатель преломления. После определенного количества проходов (с изменяемыми концентрациями реагентов, скоростью движения горелки и температурой ее факела) и сплавления с помощью той же горелки (при более высокой температуре) объекта в монолитный цилиндрический стержень получается преформа (предза-готовка). В дальнейшем эти преформы химически, механически и термически обрабатываются и собираются в заготовки, из которых вытягивают оптическое волокно.
теплофизические характеристики - постоянные величины;
тепловой поток от факела изменяется вдоль оси г по следующему закону:
Ч = еХР1 -
(1)
где и(£) - скорость движения горелки (функция управления), Н - ширина пламени горелки, -мощность горелки, t - время, г - пространственная переменная вдоль оси заготовки.
Тогда в цилиндрической системе координат (г, ф, г) уравнение теплопроводности запишется в виде:
=1 А
Эг г д г
. Э0
+—
Э г
, ЭЭ
(2)
начальное и краевые условия на цилиндрических поверхностях имеют следующий вид:
, Э0
0(2,0) = е0(2);
= аг(0-0г);
. Э0
= -ас(0-0с) + 9(г,О,
(3)
(4)
(5)
г=Я
Рис. 1. Схематическое изображение установки газофазного осаждения: 1 - кварцевая трубка; 2 - движущаяся горелка (стрелки показывают направления движения); 3 - факел
Решающая роль в процессе газофазного осаждения добавок принадлежит температуре. В связи с этим на первом этапе оптимального управления процессом МСУБ необходимо сформулировать задачу об оптимальном управлении температурным полем кварцевой трубки [5].
Математическая модель нагрева кварцевой трубки подвижным источником получена при следующих предположениях:
температурное поле кварцевой трубки осе-симметричное;
теплообмен с внешней окружающей средой и газом, текущим внутри трубки, описывается законом Ньютона;
где 0, р, с, X - температура, плотность, удельная теплоемкость и теплопроводность кварца соответственно; аг, ас - коэффициенты теплообмена с газом и внешней средой; 0Г, 0С - температура газа и внешней среды; г0, Я - внутренний и внешний радиусы цилиндра.
Сделав еще одно предположение о независимости температуры от радиуса г (что вполне допустимо благодаря малой толщине стенки трубки), проинтегрируем обе части уравнения (2) по области И ={(г, ф)| г0 < г < Я; 0 < (р < 2л}:
т М г дг\ аг •'•'сЫ аг
в о V / о \ У
Тогда с учетом условий (4) и (5) первый интеграл в правой части последнего уравнения примет вид:
д
Я
аг I аг
г
¿ф йг = 2л
. Э0
Э г
г=Я
О 1 Эе
аг
= 2пЯ{- ас (0 - 0С) + д(г, *)) - 2лг0аГ (0 - 0Г).
После интегрирования разделим обе части уравнения теплопроводности на рся()?2 — г02) и получим:
'-а V = (6)
Эг Эг
Здесь а - коэффициент температуропроводности;
а =
SRac+S.aT
pcV
4 7 р сУ р сУ с рсУ г
г е (0, Ь), t е (0, т), Ь - длина заготовки, т -продолжительность процесса осаждения; £л, £ -площади внешней и внутренней цилиндрических поверхностей, К - объем полого цилиндра.
Уравнение (6) дополняется начальным условием (3) и следующими граничными условиями:
(7)
(8)
©0,0)=©10>
Рассмотрим функционал вида т I
/(„) = Л^г)-©^,^2^ ->М, (9) о о
который имеет смысл близости состояния системы к заданной функции в области (0; т) х (0; Ь). Задача оптимального управления (3), (6)-(9) является нелинейной относительно функции управления - скорости теплового источника (см. уравнения (1), (6)) и классифицируется как задача с жестким распределенным управлением и распределенным наблюдением [6]. В качестве пространства управлений рассмотрим пространство
в качестве пространства решений: 0 = ¿2((0; х), Я1 (0;!,)).
Исследование и решение задачи оптимального управления
В силу нелинейности правой части уравнения состояния (6) вопросы разрешимости, единственности (в случае разрешимости) решения задачи оптимального управления и построение системы оптимальности (в своей сильной форме) не являются тривиальными. Чтобы исследовать эти воп-
росы, предлагается метод, который заключается в разбиении решения поставленной задачи на два последовательных этапа. Первый из них предполагает реализацию задачи оптимального управления тепловым источником, где под новой функцией управления щ (t, z) понимается тепловой поток:
(ю)
at dz
Данное уравнение записывается с начальным и граничным условиями (3), (7), (8) и коэрцитивным целевым функционалом
т L
+ -»inf. (11)
о о
В качестве пространства решений рассматривается пространство
© = £2((0;Т>,Я1(0;^)), в качестве пространства управлений -U, =L2((0;T)X(0;Z)), 0^)е£2((О;Т)Х(О;£)), 0o(z)e L2(0;L), 0^), 02(i)e L2(0;т), о > 0.
Задача оптимального управления (10), (3), (7), (8), (11) является линейной относительно функции управления t,z), с распределенным управлением, распределенным наблюдением и компромиссной целевой функцией [4]. Для получения условий разрешимости и единственности решения этой задачи, а также системы оптимальности будет использован один из вариантов метода Лагранжа.
Теорема [7]. Пара (0(i,z), образует
решение задачи оптимального управления (10), (3),(7),(8), (11) тогда и только тогда, когда существует функция p(t,z) е ¿2 ((фх);//1 (О; L^j, такая, что функции 0(i,z), p{t,z) являются решением системы дифференциальных уравнений
f-ad4f+ сс0 = -^; в(0,г)=0, dt dz2 а
dz
at dz
pit,0)=0, ^(t,L) = 0,
dz
(12)
где
©О, *) = 0(г, г) - ©а, г), О, г) = 0^ (Л г) - в(Г, г);
функция является решением дифференци-
альной задачи
-а
Э* Эг2
ё(0,г) = в0(г), 1(*,0) = в1(0; йЙ
и функция оптимального управления находится по формуле
Доказательство.
Решение краевой задачи (10), (3), (7), (8) представим в виде
е(*,г)=в(*,г)+ё(*,гх
где функция 0(/, г) удовлетворяет условиям
—^ - а у ' + ОС0<>, г) = щ (Ь, г); ог с/г
©(0,г)=0; в(?,0)=0;
а является решением задачи
(13)
— а
+ г) = 0;
(14)
Очевидно, что в случае однородности начальных и граничных условий в (13) состояние системы 0(^,2) линейно зависит от функции управления Таким образом, определен линейный оператор (обозначим его Л), который ставит в соответствие каждому м1(^,2)еС/1 единственное ©(¿, 0, а значит и единственное значение 0(^) = 0(^) + 0(^):
(15)
В силу введенных обозначений выполняется равенство
= Ащ г).
Следовательно, исходная задача минимизации сводится к задаче оптимального управления (13) с целевой функцией вида
= ЦГли^^+ё^г)-0^г)~| скЖ +
оо
+ о||м1(г,2)||2 —> тГ.
Введем обозначения: - ©(V, г)+ ©¿(г, г) = г). Тогда
X £
Фд = |/ЕЧСМ) +
о о
(16)
дt " дг2
ё(0,г)=ео(2); 6(^0)=©! (0;
^(^>=02(0.
Система (14) не зависит от функции и имеет единственное решение; таким образом, функцию 0((,г) можно считать известной функцией. Задача минимизации в таком случае сводится к решению задачи для функции 0 (13) с функционалом (11).
Выделим в функционале (16) квадратичную, линейную и постоянную части относительно функции управления щ (х):
1 (М1 )= ©¿Р^гЛ + о||М1||2 + Цм^гЛ = 0 0 0 0 х £ х £ х £
= | |о2<Ы* - 2| ^©¿¿Ыг +1 +
0 0 0 0 0 0 X £ X £ X £
аЦм^Л = Л(Лм1)2йЫг - 2J Jли10(г<feífr 0 0 0 0 X £ X £
о о
ная,
х £ х 1
Здесь ||(Лм1)2+ aj jщdzdt - квадратич-оо оо,
х I х
| - линейная, ^®ldzdt - посто-
оо оо
(l{(йх),V - щ) = 2j J (лщ - Qd) ■ K'ü^dzdt + оо
iL т L
+2gJ|mj • ü[dzdt = 2j J (Ahj - ©¿)Л(v - ü^dzdt 00
iL
+2 aj J щ (v - ü^dzdt.
00
+
00
Здесь использовано определение слабой производной и линейность оператора Л, в силу чего
Нш
Л(м1 + i (v - Mj)) - Aiij _
Am,+iA(v-M,)-AM, . /
= lim—------- = A(v - щ );
i-> 0 t VI/
(м,+i(v-M1))-M1 M, +i(v-M1)-M1 „
lim—---——- = lim—1----—- -v-uv
t-* 0 t <->0 t
Согласно критерию оптимальности [6] имеем: (1{(щ),у-щ) = 0, Vve^
J J ^Vüj - ©¿)a(v - u^dzdt
о о
X L
+ о J Jmj (v - u^dzdt — 0.
+
(17)
о 0
янная относительно функции управления части.
Для выпуклого, коэрцитивного и полунепрерывного снизу на 1/1 функционала (16) существует, и притом единственный элемент щ Е иь на котором этот функционал достигает своего минимума [6]. Действительно, функционал (16) непрерывен на иъ является выпуклым в силу линейности оператора Л, а его коэрцитивность обеспечивает наличие второго слагаемого. Таким образом, существует и притом единственный элемент щ на котором функционал (16) достигает минимума:
щ е Щ : I(и^ )= шТ (Ц).
Получим оптимизационную систему в своей сильной форме, то есть в виде краевой задачи для сопряженной функции. Для этого вычислим слабую производную функционала (16) на элементе щ, доставляющем минимум этому функционалу.
1L
Выразим первое слагаемое (17) через вариацию управления V — и0. Для вариации решения 0 = Л(у — и0) выпишем соответствующую сопряженную задачу. Для этого проварьируем систему (13):
Э0 Э20 ~ „
——а—r- + aö = v-M,: dt dz2 1
,z) = 0; 0(i,O)=O;
(18)
(19)
(20)
(21)
Умножим уравнение (18) на произвольную функцию р(Х, г) е 0 и проинтегрируем по области (0, Ь) х (0, т):
fj^pdzdt-ajj^pdzdt 00 00
+
х L
0 0 X L
+ а| | ©pdzdt = 11 (у - щ )pdzdt.
0 0 0 0 Воспользуемся формулой Грина в первом слагаемом в левой части один раз, а во втором - два раза. Учитывая начальное и граничные условия, получим:
о о
-JJ^Öi/z^ + Jp© dz-
-а
+
ЯХ1 др Э© , , Г Э^ 00 о
dt
+
х L х £
a^Qpdzdt — ^{y-ü^)pdzdt\
о о
X L
0 0
JJ'^Qdzdt +
о о
dt
¡рё [
dz-
( XL
Я
о о
dpQdzdt+ße
dz
dz
dt
de
t
J
dt
+
1 £ _ т £
а J J ®рс1гс11 = ^^ — Щ^Р^Л.
0 0 0 0 В итоге получим: т I
о о
и
1 £ о о
дг2
вс/гЖ + Ц-^в
1
Эг
Л-
Потребуем, чтобы функция р(Х, г) удовлетворяла следующей задаче:
Ър Эр й . „ Эг Эг2
р(т, г) = 0; р^, 0) = 0;
|М = 0.
о о
о о
Ууе С^;
т £ т £
J J (у — щ)рс1гс11 + а J J щ (У — щ = 0.
0 0 0 0 Окончательно имеем: т £
^ ^(у — цХр + = 0, Уу Е С/).
Поскольку V - произвольная функция из 1/ъ то интеграл равен нулю в том случае, если р + а щ =0. Отсюда следует формула для нахождения значения функции оптимального управления через значение сопряженной функции р(^ г):
(28)
Т ~ XI . т £
Яу^ сИ + а11 ®р<1г<и = 11- (22)
Таким образом, получена система оптимальности, не зависящая явно от функции оптимального управления в своей сильной форме, то есть записанная в форме краевой задачи относительно сопряженной функции:
0 = -^, в(о>г) = о, 0(г,О) = О, =
т дг а Эг
^ + хЩ-ар = вл-&, = Ж0) = 0,^(1,£) = 0.
. т дг 02
(29)
(23)
(24)
(25)
(26)
Интегральное тождество (22) в силу этого перепишется в виде
т £ _ т £
110 ■ (©^ - Ай^гЛ = 11 (у - щ)р<Ых. (27) 0 0 0 0
Поскольку 0 = -щ) (это вариация решения), то левая часть (27) совпадает с первым слагаемым в левой части (17). Учитывая это, перепишем (17), выразив производную через вариацию у-Щ:
т £ 1 £
о о
После решения оптимизационной системы оптимальное управление определяется по формуле (28).
Здесь ©и(1:,г) = &адля нахождения решается краевая задача (14).
Теорема доказана.
Решение оптимизационной системы (13) и функция определяющая тепловой поток, далее считаются известными функциями.
Второй этап предполагает минимизацию функционала
х £
/2(и) = jj(u1(t,z) - F(и,í,z))2íJЬíй Ы, (30) о о
где щ(]1,г) - решение задачи оптимального управления (10), (3), (7), (8), (11). Минимизация функционала (12) означает поиск параметров теплового источника (под параметрами, в частности, понимается скорость подвижного теплового источника) так, чтобы количество тепла, передаваемого источником в систему, описывалось функцией, численно близкой функции, которая определяется соотношением
р сУ рсУ р сУ
Здесь д(г, t) выражено формулой (1).
Основные результаты и их обсуждение
В процессе численной реализации предложенных алгоритмов функцию управления и(г, г) предлагается искать в классе кусочно-постоянных функций [3], для чего промежуток [0, т] разбивается на промежутки (> = ^<¡2 <...<£„ = т:
и =
Щ, 0-tl<t<t2',
142 9 ¿2 ~ ^ ^ '
и»-1»
(31)
где м, е Я, 1 = 1, и-1. Таким образом,
ь л-1 '¡+1
1г(и) = /X /("1 С'*) - >*>г))2^. (32)
о '=1 <г
Для минимизации функционала (12) использован метод градиентного спуска:
м"+1=м"-Р-У/2(ми), |3е(0;1). (33)
С учетом выражения (1) и уравнения (2) получим, что
тогда согласно методу градиентного спуска, и?+1=и?~ р- ^ 7
где
Эм, '
Э/(м") Э / „ V
' о '
2=1, И- 1.
Известным недостатком метода градиентного спуска, как известно, является резко возрастающее количество итераций в случае, если гиперповерхность исследуемой функции имеет овражистый характер. Это приводит к частой смене направлений антиградиента, т. е. к «рысканью» и, более того, успех в поиске глобального минимума зависит от выбора начального приближения. Подобная ситуация имеет место в случае минимизации функционала (13).
При решении выбраны следующие значения параметров: Н = 0,02 м; <7,^ = 5 103 Вт/м2; о = 0,01; а = 2-ю_7м2/с; а = 4-ИТ5с~1; I = 1 м; т = 500 с. Поверхность, описывающая функцию приближения состояния системы 0^г), представлена на рис. 2. Полученные оптимальные значения температурного поля тепловой
поток и1(г,г) и скорости теплового источника и(г) представлены на рис. 3-5.
1400: 1200: 1000 800 600400 200 0
0,6 г
1000
0
1400 1200 1000 800 600 400 200 0
0,6 0,4 0,2 0
Рис. 2. Функция приближения состояния системы
Рис. 3. Распределение температуры
г
2
Рис. 4. Функция оптимального управления
Итак, вопросы нахождения решений задач оптимального управления распределенными системами в первую очередь связаны с непосредственным решением систем оптимальности, записанных в своей сильной форме, то есть в виде краевых задач для сопряженной функции. В ряде случаев, когда вариационная задача линейна относительно
Рис. 5. Функция скорости теплового источника и(/)
функции управления и целевой функционал является выпуклым, оптимизационная система несет смысл не только необходимых, но и достаточных условий минимума. Непосредственное решение систем оптимальности для таких постановок наиболее эффективно. Нами рассмотрена задача оптимального управления нелинейной системой с подвижным тепловым источником, решение которой предусматривало решение вспомогательной задачи описанного типа. Полученная система оптимальности решена, и, кроме того, в явном виде найдена функция оптимального управления вспомогательной задачи. Для отыскания решения исходной нелинейной задачи реализован метод градиентного спуска функционала специального вида.
СПИСОК ЛИТЕРАТУРЫ
1. Алексеев, Г.В. Разрешимость стационарных задач граничного управления для уравнений тепловой конвекции [Текст] /Г.В. Алексеев // Сиб. мат. журн. - 1998. - Т. 43. - № 1. - С. 84-98.
2. Алексеев, Г.В. Разрешимость краевой задачи для стационарных уравнений тепломассопере-носа при смешанных краевых условиях [Текст] / Г.В. Алексеев, А.Б. Смышляев, Д.А. Терешко // Журн. вычисл. матем. и мат. физики. - 2003. -Т. 43. - № 1. - С. 84-98.
3. Болдырев, В.И. Метод кусочно-линейной аппроксимации для решения задач оптимального управления [Электронный ресурс] / В.И. Болдырев // Дифф. ур-ния и проц. управл. (Электронный журнал - http: // www.neva.ru/journal). - 2004. - № 1. - С. 28-123.
4. Егоров, А.И. Оптимальное управление тепловыми и диффузионными процессами [Текст] / А.И. Егоров. - М.: Наука, 1978. - 463 с.
5. Первадчук, В.П. Математическое моделирование оптимального управления процессом легирования оптических волокон [Текст] / В.П. Первадчук, Д. Б. Шумкова, В. В. Сыроватская // Вестник ПГТУ. Математика и прикладная математика. -2005. - С. 3-9.
6. Фурсиков, А.В. Оптимальное управление распределенными системами. Теория и приложения [Текст] /А.В. Фурсиков. - Новосибирск: Научная книга, 1999. - 350 с.
7. Шумкова, Д.Б. Оптимальное управление в задачах с неизвестными границами и подвижными источниками [Текст]: дисс. ... канд. физ.-мат. наук: 01.01.02: защищена 21.12 2006.: утв. 12.10 2007 / Шумкова Дарья Борисовна. - Пермь, 2006. - 111 с. -Библиогр.: С. 108-110. - 6107-1/276.