УДК 517.977
Идентификация модели видообразования методами теории оптимального управления
Анна В.Букина*
Иркутский государственный университет, ул. Карла Маркса 1, Иркутск, 664003,
Россия
Получена 10.02.2008, окончательный вариант 15.05.2008, принята к печати 10.06.2008 Идентифицируется модель симпатрического видообразования с помощью теории оптимального управления. Для соответствующей интегро-дифференциальной задачи оптимального управления выводится необходимое условие оптимальности в форме линеаризованного принципа максимума. На основе последнего конкретизируется градиентный метод решения задачи управления моделью видообразования.
Ключевые слова: управляемая интегро-дифференциальная система, необходимые условия оптимальности, модель видообразования, метод условного градиента.
Введение
Одна из версий модели симпатрического видообразования построена на основе методов адаптивной динамики [1], [2]. Данное видообразование является процессом морфологической и последующей генетической изоляции субпопуляций при имеющемся перемешивании особей в однородной среде. Причиной такой дифференциации однородной группы является конкуренция за ресурсы среды обитания, при этом возможность потребления конкретной фракции ресурса определяется совокупными характеристиками организма (фенотипом). Конкуренция в итоге приводит к диверсификации организмов по различным ресурсным (экологическим) нишам. Проблема изучения симпатрического видообразования с помощью методов математического моделирования заключается в следующих двух аспектах: 1) осуществление настройки математической модели в соответствии с имеющейся реальной информацией; 2) управление полученной моделью. И в том, и в другом случае содержательная постановка задачи может интерпретироваться в виде соответствующей задачи оптимального управления системой интегро-дифференциальных уравнений.
1. Постановка задачи
В упомянутой версии модели каждая особь характеризуется численным показателем (фенотипом) s, определяющим используемый ресурс, как, к примеру, размер тела или размер клюва определяет спектр доступной пищи. Динамика роста популяции описывается уравнением
xt(s,t) = rx(s,t)(l - Ksy/ C
S
* e-mail: [email protected] © Siberian Federal University. All rights reserved
которое в своей основе имеет логистическое уравнение. Здесь х(в,г) — число особей популяции с фенотипом в в момент времени г. Предполагается, что особи рождаются с постоянной интенсивностью г и умирают с интенсивностью, определяемой конкуренцией и емкостью среды.
к (•) = ^-(-^ )
— емкость среды (распределение ресурсов), где К — общее количество ресурсов, в — наиболее распространенный ресурс,
C "•« = "К-)
— функция конкуренции между фенотипами s и e — количество ресурсов, потребляемое одной особью. Предполагается, что начальное распределение численности особей популяции известно и определено условием x(s,t0) = x0(s).
Идентификация модели состоит в определении параметров распределения ресурсов и интенсивности конкуренции а = (а к ,ас), при которых в фиксированный момент времени ti численность особей максимально близка к заданному распределению x(s), описывающему видообразование. Поставленная задача может интерпретироваться как задача оптимального управления интегро-дифференциальной динамической системой, в которой одна группа компонент решения подчинена системе обыкновенных дифференциальных уравнений. Вторая группа компонент искомого решения связана с первой интегралами по части области определения независимых переменных. Такие системы используются в динамических моделях, в которых на процесс влияет общее состояние объекта по дополнительному признаку в каждый момент времени.
Опишем формальную постановку задачи оптимального управления. Требуется минимизировать функционал
J(u) = J <f(x(s,t1),s)ds + jj Ф(х, y, u, s, t)dsdt ^ min, (1)
s n
определенный на решениях интегро-дифференциальной системы вида
xt = f (x,y,u, s,t),
y(s, t) = J g(x(Z,t),u(Z,t),s,Z,t)d£,
S
c начальным условием
(2)
х(в, г0) = х (в) (3)
при допустимых управлениях и = и(в,г) из множества
V = {и е ^о(и): и(в,г) е и}. (4)
Здесь (в,г) е п = 5 х Т = (в0,в1) х (г0,г1), х(в,г) е Еп, у(в,г) е Ет, и с Ег.
На параметры задачи (1)-(4) наложим следующие ограничения: функции р = р(х,в), Ф = Ф(х,у,и, в,г), вектор-функции / = /(х,у,и, в,г), д = д(х,и, в,£,г) непрерывны по совокупности своих аргументов и имеют непрерывные производные по переменным х и у, х0(в)-измеримая существенно ограниченная в 5 вектор-функция. Также будем считать, что вектор-функции / и д удовлетворяют условию Липшица по переменным х, у и х в областях Яп х Ят и Нп соответственно.
2. Необходимые условия оптимальности
Система уравнений (2) представима в интегральной форме. Действуя классическим методом последовательных приближений, например, по схеме работы [3], для нее можно доказать существование и единственность решения в пространстве ЬТО(П), а также получить оценки скорости роста решений:
||ж(М)||< мГ Ух0 (в)|| + I (у/(0,0, и, в, т )|| + I ||д(0,«,в,£,т
Ьо Б
г
+ 1 [||х0(*' )|| +1 (||/(0, 0, и, в', т )|| + ^ ||д(0,и,в',£,т )|К)йт
Б г0 б
¿в'
||у(в,^)| < му (|д(0,и, + (5)
Б
где константа М > 0 не зависит от входных данных ж0, д и / задачи (1)-(4).
Рассмотрим два допустимых процесса (и, ж, у) и (и = и+Ди, X = ж+Дж, у = у+Ду). Действуя методом приращений, применяемым, например, в [4] для задач с дифференциальными фазовыми системами, получим следующую формулу приращения целевого функционала
Д J(и) = — JJ ДиН(-0, 0, ж, у, и, в, + п(и, и), (6)
п
где Н(—, 0, ж, у, и, в, г) — функция Понтрягина в следующей форме Н(—, 0, ж, у, и, в, г) =< — (в, £), /(ж, у, и, в, г) > + + У < 0(С,г),д(ж, и, С, в, г) > ¿С — Ф(ж, у, и, в, г),
Б
(—,0) — решения сопряженной системы
—г = — Нх(—,0,ж,у, и, в, г), (в, г) € П,
— (в,^1) = — ^Ж(ж(в,г1), в), в € (7)
0(в,г) = Ну(—,0,ж,у,и,в,г), (в,г) € п,
п(и, и) — остаток формулы приращения вида
П(й,и)=у о^нДжф,^)^ + Л (он (||Дж(М)||) + он (||Ду(М)||)+
Б П
+ < ДйНх, Дж(в,г) > + < ДЙНУ, Ду(в,г)
В случае, когда управление является функцией от переменных в и г, при его игольчатом варьировании, на основе оценок (5), формула (6) служит основой для необходимого условия оптимальности в форме принципа максимума Понтрягина.
Пусть процесс (и*, ж*, у*) оптимален, (—*,0*) — соответствующее ему решение сопряженной задачи, тогда почти для всех (в, г) € П выполняется условие
Н(—*,0*,ж*,у*,и*,в,г) = тах Н(—*, 0*, ж*, у*, в, г).
у^и
Если функции ], д, Ф дифференцируемы по и, а множество и выпукло, на оптимальном процессе (и*,х*, у*) справедлив также линеаризованный (дифференциальный) принцип максимума:
< Ни(ф*,6*,х*,у*,и*, в, г), и*(в, г) >= тах < Ни(ф*, 6*,х*,у*,и*, в,г),ь) > .
Когда, как в рассматриваемой модели видообразования, все компоненты управления являются параметрами, рассмотрев формулу приращения целевого функционала (6) на классической вариации управления, с учетом оценок (5) получим линеаризованный принцип максимума в следующей форме:
<уу Ни(ф*,6*,х*,у*,и*,в,г)Св(Л,и* >= п
= тах < Ни(ф*,6*,х*,у*,и*, в,г)с1вс1г,и > . уеи .1.1
п
(8)
Линеаризованный принцип служит основой для построения градиентных методов численного поиска локальных решений, например, по схеме работы [4].
3. Метод условного градиента
Выпишем основные конструкции метода условного градиента применительно к прикладной задаче:
Г \2,
7П = /(х(в,г1) - З^в ^ тп
(х(
Б
хг(з,г)= тх(з,г)(1 - гщ /С(з,£)х(£,г)<%), х(в,го) = х0(в), (9)
а е и = [аК0,ак 1] х [ас0,ас 1]. Функция Понтрягина примет вид
Н(ф, 6, х, у, а, в, г) = ( а к У2Л (в - з)2 \ х [а(с,л (€ - в)2
Б
а сопряженная система (7) описывается соотношениями
аК\/2п (в - З)2 \ 1 Г (£ - в)
2
фг = -фг[1 - У-з— ехр—-2—--= 6(^,г)ехр--1— ,
К 2ак / ас у 2п .] 2ас
Б
ф(в,г1 ) = -2(х(в,гг) -х(в)), (10)
акл/2п (в - З)2
(в,г) = -фгх—к— ехР 2а2
к
Пусть задано начальное управление а0 = (аК,а°с) е и и на к-м шаге итерационно-
4 ,а%)
го процесса вычислено ак = (аК,а@). Из интегро-дифференциальных систем (9), (10) на
основании метода Эйлера с пересчетом ([5], c.165) построим соответствующие значения фазовых и сопряженных траекторий xk, yk, , 0k в узлах сетки. Определим вспомогательное
— k
управление ak как решение задачи
ak = argmax < J J H (^k,0k ,xk, yk, ak, s, t)dsdt, a >, a e U. n
Подсчитаем величину
W (ak) =< JJ H (^k ,0k ,xk,yk ,ak ,s,t)dsdt,ak - ak >> 0. n
Если W(ak) = 0, то управление ak удовлетворяет дифференциальному принципу максимума (2.4). В случае W(ak) > 0 зададим a-параметрическое семейство управлений ak(a) = ak + a(ak — ak), a e [0,1], положим ak+1 = ak(ak), где величина шага ak выбирается из условия убывания целевого функционала: J(ak+1) < J(ak).
Так как множество U компактно, а градиент функции H удовлетворяет условию Липшица, данный релаксационный метод сходится к множеству точек, удовлетворяющих условию (8) ([6, с. 294-296]).
Автор использовал поддержку гранта РФФИ №08-01-98007-р_сибирь_а.
Список литературы
[1] U.Dieckmann, M.Doebeli, On the origin of species by sympatric speciation, Nature, 1999, no. 400, 354-357.
[2] С.В.Семовский, Ю.С.Букин, Д.Ю. Щербаков, Видообразование в одномерной популяции: адаптивная динамика и нейтральная эволюция, Исследовано в России, 2002 [http://zhurnal.ape.relarn.ru/articles/2002/125.pdf ].
[3] И.Г.Петровский, Лекции по теории обыкновенных дифференциальных уравнений, М., МГУ, 1984.
[4] О.В.Васильев, В.А.Срочко, В.А.Терлецкий, Методы оптимизации и их приложения, Ч.2, Оптимальное управление, Новосибирск, Наука, 1990.
[5] В.А.Срочко, Численные методы: курс лекций, Иркутск, ИрГУ, 2003.
[6] Ф.П.Васильев, Методы решения экстремальных задач, М., Наука, 1981.
Identification of a Speciation Model by Methods of Optimal Control Theory
Anna V.Bukina
The model of sympatric speciation is identified by means of optimal control theory. For the corresponding integro-differential optimal control problem a necessary optimality condition is deduced in the form of the linearised maximum principle. This condition allows concretizing gradient method of solution for control problem of speciation model.
Keywords: controlled integro-differential system, necessary optimality conditions, the model of speciation, gradient method of solution.