Точные штрафные функции в задаче управления одной системой массового обслуживания

Полякова Людмила Николаевна; Карелин Владимир Витальевич; Буре Владимир Мансурович; Хитров Геннадий Михайлович

УДК 539.3

Вестник СПбГУ. Сер. 10. 2015. Вып. 1

Л. Н. Полякова, В. В. Карелин, В. М. Буре, Г. М. Хитров

ТОЧНЫЕ ШТРАФНЫЕ ФУНКЦИИ В ЗАДАЧЕ УПРАВЛЕНИЯ ОДНОЙ СИСТЕМОЙ МАССОВОГО ОБСЛУЖИВАНИЯ

Санкт-Петербургский государственный университет, Российская Федерация,

199034, Санкт-Петербург, Университетская наб., 7/9

Рассматривается детерминированная система массового обслуживания, динамика которой может быть описана системой обыкновенных дифференциальных уравнений. Система массового обслуживания содержит одно обслуживающее устройство с двумя очередями 1 и 2. Скорости поступления заявок зависят от номера очереди и от времени. Скорости обработки заявок обслуживающим устройством могут выбираться внутри заданных ограничений и рассматриваются как управления. В качестве управлений (скоростей обработки заявок в очередях 1 и 2) принимаются кусочно-постоянные управления. Задачей управления является минимизация суммарной длины очередей в конечный момент времени. Обслуживающие системы такого типа получили широкое распространение в последнее время. Найдены необходимые и достаточные условия оптимальности кусочно-постоянных управлений в сформулированной выше постановке задачи управления обслуживающей системой. Библиогр. 10 назв.

Ключевые слова: детерминированная система массового обслуживания, кусочно-постоянные управления, точные штрафные функции.

L. N. Polyakova, V. V. Karelin, V. M. Bure, G. M. Chitrow

EXACT PENALTY FUNCTIONS IN THE PROBLEM OF A QUEUEING SYSTEM

St. Petersburg State University, 7/9 Universitetskaya embankment, St. Petersburg,

199034, Russian Federation

We consider a deterministic queueing system whose dynamics can be described by a system of ordinary differential equations. The queueing system contains one servicer with two queues 1 and 2. The speed of application reception depends on the number of queue and of the time. Speed of application processing by servicers can be selected from within predetermined limits and are considered control. Speeds of processing are considered control. The problem is to minimize total lengths of queues. The necessary and sufficient conditions are received in the problem of piecewise constant control. Bibliogr. 10.

Keywords: deterministic queuing system, piecewise constant control, the exact penalty functions.

Полякова Людмила Николаевна — доктор физико-математических наук, профессор, заведующий кафедрой; e-mail: [email protected]

Карелин Владимир Витальевич — кандидат физико-математических наук, доцент; e-mail: [email protected]

Буре Владимир Мансурович — доктор технических наук, профессор; e-mail: <vlb310154 @gmail.com

Хитров Геннадий Михайлович — кандидат физико-математических наук, доцент; e-mail: [email protected]

Polyakova Lyudmila Nickolaevna — doctor of physical and mathematical sciences, professor, head of the chair; e-mail: [email protected]

Karelin Vladimir Vitalievich — candidate of physical and mathematical sciences, associate professor; e-mail: [email protected]

Bure Vladimir Mansurovich — doctor of technical sciences, professor; e-mail: [email protected] Chitrow Gennady Michailovich — candidate of physical and mathematical sciences, associate professor; e-mail: [email protected]

Введение. Рассматривается детерминированная система массового обслуживания, динамика которой может быть описана системой обыкновенных дифференциальных уравнений. Система массового обслуживания содержит одно обслуживающее устройство с двумя очередями 1 и 2. Скорости поступления заявок зависят от номера очереди и от времени. Скорости обработки заявок обслуживающим устройством могут выбираться внутри заданных ограничений и рассматриваются как управления. Предполагается, что в каждый момент времени обслуживающее устройство может обрабатывать только одну заявку. То есть, если обрабатывается первая очередь, то скорость обработки второй очереди равна нулю, и наоборот. В качестве управлений (скоростей обработки заявок в очередях 1 и 2) принимаются кусочно-постоянные. Из сказанного следует, что произведение управлений в каждый момент времени равно нулю. Задачей управления является минимизация суммарной длины очередей в конечный момент времени Т. Обслуживающие системы такого типа получили широкое распространение в последнее время. Например, в различных обслуживающих центрах пользователь на терминальном устройстве выбирает для себя номер очереди в соответствии с типом своей заявки, после чего получает номер в очереди на обслуживание. Обслуживание происходит с помощью многофункционального обслуживающего устройства, которое переключается во время работы с одной очереди на другую, при этом моменты такого переключения выбираются самим обслуживающим устройством. Сформулированная задача до некоторой степени похожа на хорошо известную задачу управления светофором на изолированном перекрестке [1], но существенно отличается от нее по характеру ограничений, в частности обычно предполагается, что время обслуживания в задаче о перекрестке равно постоянной величине. Близкие, с точки зрения применяемых математических методов теории управления, задачи рассматриваются в [2-4].

Методы штрафных функций подробно обсуждаются в [5-10].

Постановка задачи. Дадим формальное математическое описание модели системы массового обслуживания. Пусть аг(Ь), г = 1, 2, — скорости поступления заявок в очередях 1 и 2, ¿г, г =1, 2, — скорости обработки заявок из очередей 1 и 2 соответственно.

Скорость изменения поступления заявок в очередях вычисляются по формулам

В (2) 61(Ь),62(Ь) - неизвестные ускорения изменения поступления заявок (при этом ускорения могут менять знак), и1,и2 - управление или скорость обработки заявок. Рассмотрим более общую задачу:

цх{Ь) = а1 — ¿1,

Ш = а2 — ¿2.

Положим и1 = ¿1 и и 2 = ¿2.

Приведем систему (1) к нормальному виду:

(1)

Х1 = Ц1, Х2 = а1, хз = д2, Х4 = а2.

Тогда

Х1(Ь) = Х2 — и1, Х2(Ь)= 01(Ь),

Хз(Ь) = Х4 — и2, Х4(Ь)= ЫЬ).

(2)

Х = р (ь)х + д(ь)и.

(3)

Пусть даны две точки: х(1) = х(0) и х(2) = х(Т), Ь € [0, Т].

Вектор-функцию и(Ь) = {и^(Ь)} назовем допустимым управлением, если компоненты иу (Ь) - кусочно-непрерывные функции, допускающие лишь разрывы первого рода.

Разобьем множество допустимых управлений и(Ь) € 2 на непересекающиеся под-ь

множества П ^ У 2г, где 2гП2^ = 0 при г = ] и 2г = 0 V«. В правой части уравнения

г=1

(3) функция х = х(Ь) непрерывна, а и = и(Ь) - кусочно-непрерывна. Эта правая часть не будет кусочно-непрерывной по времени Ь: ее разрыв вызывается переходом управления и(Ь) из одного подмножества 2г в другое (что может происходить бесконечное число раз). Решением уравнения (3) является абсолютно непрерывная функция х(Ь), удовлетворяющая уравнению (3) почти везде. Сузим класс рассматриваемых управлений. А именно, кусочно-непрерывное управление и(Ь), Ь € [Ьо,Ь1], назовем допустимым, если и(Ь) € 2 для всех Ь и интервал [Ьо, Ь{] можно так разбить на конечное число

N

подынтервалов (Ь0,Ь^ = У (тг,тг+1] (Ь0 = т0 < т1 < ... < ^ = Ь1), что на каждом

г=1

из них управление и(Ь) находится в каком-то одном подмножестве 2г. Для допустимого управления и = и(Ь) правая часть уравнения (3) кусочно-непрерывна по Ь.

Преобразуем данную задачу к такому виду, где уравнение будет иметь уже непрерывную правую часть. В качестве последнего возьмем уравнение

ь ь

г=1

Х = иг (Р(Ь)х + Я(Ь)щ),

(4)

в котором иг = иг(Ь) € 2г, иг = иг(Ь) € К - кусочно-непрерывные управления, причем для любого Ь среди чисел и1(Ь), ...,иь(Ь) одно равно единице, а все остальные - нулю. Введем общий вектор управления

и = (и1(Ь), ...,иь(Ь),и1(Ь), ...,иь(Ь)),

0,

ограничения на который имеют вид и € 2и, где 2и = {и : иг € 2г,и, 1,...,Ь),^иг = 1}.

Для любого заданного и € и перепишем уравнение (4) следующим образом:

Х = /(х, и, Ь). Обозначим г = Х и введем множество

Пи := {г € Рп[0,Т], х(Ь) € Рп[0,Т], ^и(г) = 0},

здесь

(5)

фи(г) := Заметим, что Если г € Пи, то функция

J ( г(Ь) — /(х0 + ! г(т)йт,и(Ь),Ь^\ ¿Ь

о V 0 )

фи(г) > 0 Vг € Рп[0, Т], Vu € и. г

х(Ь)= Х0 + I г(т^т

1/2

2

удовлетворяет (5) и наоборот. Таким образом, задача разыскания решения (5) для некоторого фиксированного и € и эквивалентна задаче нахождения такого г € Рп[0, Т], что уи(г) =0.

Следуя работе [5], сформулируем лемму.

Лемма 1. Если уи(г) > 0 (т. е. г € то функция уи дифференцируема

по Гато в точке г.

При этом производная Гато имеет следующий вид:

т / т *

V) = I | «(*), гиф - [ (Щ^) | Л = у), (6)

г

где

т

= - I (Щ^) п(т)<1т,

и}[1) = —^-у ( - /( х0 + I г(т)с1т,и(г),г ) | , (7)

а будем называть «скалярным произведением» и V. Поскольку (6) ли-

нейно по V, а дополнение есть открытое множество, то заключаем, что функция уи является дифференцируемой по Гато в точке г с «градиентом» (в пространстве Рп[0,Т]).

Теперь рассмотрим случай уи(г) = 0. Заметим, что

уи(г) = тах J I г(Ь) — /^х0 + ^ г(т\

о V о )

Если уи(г) = 0, то

Н(г) = г(г) — /1х0 + У г(т)dт,u(t),t \ =0 Ш € [0,Т].

Так как

г

г(Ь) + av(t) — / ^хо + ^(г(т) + av(т))dт, и(Ь), ^ =

Н(Ь) + а

+ о(а),

то

= шах / I - —^ [ у(т)<1т | Л. (8)

Интегрируя (8) по частям, получаем

T / T

/df(t)\ * \

V) = max

11^11 = 1

v(t),v(t)-J v(T)dT I dt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о \ t

Из (8) и (9) видно, что имеет место следующее утверждение.

Лемма 2. Если фи(г) = 0, то функция ф дифференцируема по направлениям в точке г; она даже субдиффеpенциpуема, т. е.

фи(г,^)= (?*,v),

V* еа^и(г)

где

ô^u(z) H V* G Pn[0,T]

T * ï

(t) = v(t) - J (Mil) v(r)dr, ll^lKll.

(10)

Задача оптимального управления. Рассмотрим такую задачу: найти min I (u), где

ueU

T

I(u) = j fo(x(t, u), u(t),t)dt, (11)

0

x(t,u) - решение (5) с u € U, а функция f0 : 1" x 1m x 1 ^ 1" дифференцируема dfo

по x. Функции /о и —— предполагаются непрерывными по R™ х Rm х R. дх

Поставленная выше задача эквивалентна следующей: найти

min §(z,u),

zeP [o,T ],ueu,Vu(z)=o

где

t t

Q(z,u) = J fo^ xo + J z (t )dr,u(t),tjdt.

Определим производную функции Фи(z) = &(z,u) по направлению v G Pn[0,T]:

T

ф' (z; v) = lim - [Ф(г + a, и) - Ф(z; м)1 = / (vit), УФu(z))dt,

a|0 a J

о

в которой

T t

УФ u(z) = J Щ^Лт, fo(t) = f0(x0 + J z(T)dT,u(t),tj .

оо

Отсюда следует, что функция Фи дифференцируема по Гато с «градиентом» УФи^), здесь

¿ = _dMx(t)Mt),t)

дх

*

V

Фи (Т ) = 0.

(13)

Рассуждая так же, как в [5], можно доказать теорему.

Теорема 1. Если функция /0 липшицева по х и и, то найдется такое X* ^ 0, что для любого X ^ X* множество точек минимума функционала 7(и) на множестве и совпадает с множеством точек минимума функции

¥ (г, и) = J /о I хо + J г (т)йт, и(Ь), £ I А +

+ хМ г(г) - /|хо + У г (т )йт,и(г),г

2

1/2

<и

(14)

на всем пространстве Рп[0,Т] х Мт.

Замечание! Заметим, что в (11) присутствуют дополнительные ограничения: х(Ь, и) есть решение системы (5). В (14) г(Ь) - произвольная кусочно-непрерывная п-мерная функция. Следовательно, в (14) дифференциальные уравнения отсутствуют. Функция ¥и = ¥ (г, и) дифференцируема по направлениям (как функция г) для любого фиксированного и € и: если уи(г) > 0, то по лемме 1 функция ¥и даже дифференцируема по Гато с «градиентом»

Ф(г) + х

1

■(г) -1

(<Ш

V дх

■(т )йт

где ф(Ь) удовлетворяет (12)-(13), а ш(Ь) - (7).

Если уи(г) = 0, то по лемме 2 функция ¥и(£) субдифференцируема с субдифференциалом

д¥и(г) = ф + Хдуи (г),

где дуи(г) задано соотношением (10).

По необходимому условию минимума субдифференцируемой функции [8]

0 € д¥(г*,и*).

(15)

В (15) 0 - нулевой элемент пространства Сп[0,Т] х Ст[0,Т]. Отсюда следует существование такого V € Сп[0,Т], ||-у|| ^ 1, что

0/о {х*{т),и*{т),т)йт дх

+

(16)

+ X

-АЛ I I д/(Х*(Т),иЧТ),Т) | -( N , - I (-—-) у(т)<1т

0 т € [0,Т],

д/о(х*(г),и*(г),г) _ д ^ ¿^(¿^(МУ = 0

ди

Обозначая Xv(t) через ф(t) и дифференцируя (16) по t, имеем

j,t)= fdf(x*(t),u*(t),t) У | df0(x*(t),u*(t),t) \ дх ) дх '

ф(Т )=0п. (18)

Здесь 0n - n-мерный ноль,

df(x*(t), u*(t), t)Ym _ dfo(x*(t),u*(t),t) = Q (19)

du J du

Окончательно получаем следующее необходимое условие.

Теорема 2. Для того чтобы функция u* G Cm [0, Т] доставляла наименьшее значение функционалу I(и), необходимо, чтобы нашлось pешение ф(€) G Cm[0,T] диффеpенциального уpавнения (17)-(18), удовлетвоpяющее условию (19).

Замечание 2. Введем новую переменную хо, положим x = (xo,xi, ...,xn) и рассмотрим следующее дифференциальное уравнение:

x = f(x, и, t), x(0) = xo,

где f = (fo,..., fn); fi(x,u,t) = fi(xi,...,xn ,u,t); x = (0,xi, ...,xn) G Rn+1 (функции fi явно не зависят от x0.) Примем, что ф(t) = (ф0(t), ф1(t),..., Фп(t)). Тогда уравнения (17), (18) и условие (19) могут быть переписаны в более симметричной форме

kt) = -(aril4%"'itU))'m, Ф1Т) = (-1,0, ...,0), (ЁЛЩ£Шуфт = о.

Заключение. В работе установлены необходимые условия оптимальности кусочно-постоянных управлений в сформулированной выше постановке задачи управления обслуживающей системой. Полученный результат представляет собой «линеаризованный» принцип максимума для рассматриваемой задачи. Аналогичный подход с помощью точных штрафов в случае отсутствия дифференцируемости f по u приведет к полномасштабному («нелинеаризованному») принципу максимума Понтрягина.

Литература

1. Dad Jack, Alel David,, Ioslovich Ilya, Gutman Per-Olof. Constrained optimal steady-state control for isolated traffic intersections // Control Theory and Technology. 2014 February. Vol. 12, N 1. P. 84—94.

2. Leonov G. A., Shumafov M. M. Stabilization of linear system. Cambridge: Cambridge Scientific Publishers, 2012. 430 p.

3. Матвеев А. С., Якубович В. А. Оптимальные системы управления: Обыкновенные дифференциальные уравнения. Специальные задачи. СПб.: Изд-во С.-Петерб. ун-та, 2003. 53 с.

4. Буре В. М., Сергеева А. А. Метод определения оптимального равновесия при условии штрафных санкций за задержку на строительном рынке ремонтно-отделочных работ // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2013. Вып. 3. С. 32—38.

5. Demyanov V. F., Giannessi F., Karelin V. V. Optimal Control Problems via Exact Penalty Functions // J. of Global Optimiz. 1998. Vol. 12, N 3. P. 215-223.

6. Еремин И. И. Метод штрафов в выпуклом программировании // Докл. АН СССР. 1967. Т. 173. С. 748-751.

7. Zangwill W. L. Nonlinear programming via penalty functions // Management Science. 1967. Vol. 13. P. 344-358.

8. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 431 с.

9. Карелин В. В. Один подход к задаче оценки параметров динамической системы в условиях неопределенности // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2012. Вып. 4. С. 31—36.

10. Лебедев Д. М., Полякова Л. Н. Метод точных штрафов для решения одной задачи выпуклого программирования // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2014. Вып. 1. С. 72—78.

References

1. Dad Jack, Alel David, Ioslovich Ilya, Gutman Per-Olof. Constrained optimal steady-state control for isolated traffic intersections. Control Theory and Technology, 2014, February, vol. 12, no. 1, pp. 84—94.

2. Leonov G. A., Shumafov M. M. Stabilization of linear system. Cambridge: Cambridge Scientific Publishers, 2012, 430 p.

3. Matveev A. S., Yakubovich V. A. Optimal'nye sistemy upravlenija: Obyknovennye differencial'nye uravnenija. Special'nye zadachi (Optimal control systems: Ordinary differential equations. Special problems). St. Petersburg: Izd-vo St. Peterburg University, 2003, 538 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Bure V. M., Sergeeva A. A. Metod opredelenija optimal'nogo ravnovesija pri uslovii shtrafnyh sankcij za zaderzhku na stroitel'nom rynke remontno-otdelochnyh rabot (Algorithm for determing the equilibrium provided penalties for the delay in the construction market). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2013, issue 3, pp. 32— 38.

5. Demyanov V. F., Giannessi F., Karelin V. V. Optimal Control Problems via Exact Penalty Functions. J. of Global Optimiz., 1998, vol. 12, no. 3, pp. 215-223.

6. Eremin I. I. Metod shtrafov v vypuklom programmirovanii (The penalty method in convex programming). Dokl. USSR Academy of Sciences, 1967, vol. 173, pp. 748-751.

7. Zangwill W. L. Nonlinear programming via penalty functions. Management Science, 1967, vol. 13, pp. 344-358.

8. Demyanov V. F., Rubinov A. M. Osnovy negladkogo analiza i kvazidifferencial'noe ischislenie (Foundations of Nonsmooth Analysis and Quasidifferential Calculus). Moscow: Nauka, 1990, 431 p.

9. Karelin V. V. Odin podhod k zadache ocenki parametrov dinamicheskoj sistemy v uslovijah neopredelennosti (One approach to the problem of estimating parameters of a dynamical system under uncertainty). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2012, issue 4, pp. 31-36.

10. Lebedev D. M., Polyakova L. N. Metod tochnyh shtrafov dlja reshenija odnoj zadachi vypuklogo programmirovanija (The exact penalty method for the solution of one problem of convex programming). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2014, issue 1, pp. 72-78.

Статья поступила в редакцию 13 ноября 2014 г.

Точные штрафные функции в задаче управления одной системой массового обслуживания Текст научной статьи по специальности «Математика»

EXACT PENALTY FUNCTIONS IN THE PROBLEM OF A QUEUEING SYSTEM

Текст научной работы на тему «Точные штрафные функции в задаче управления одной системой массового обслуживания»