Г.Н. Решетникова
СИНТЕЗ СЛЕДЯЩЕЙ системы АДАПТИВНОГО УПРАВЛЕНИЯ ТЕМПОМ ПРОИЗВОДСТВА ПО ЛОКАЛЬНОМУ КРИТЕРИЮ
Рассматривается задача адаптивного управления темпом производства с целью получения максимально возможной прибыли. Для решения задачи строится математическая модель экономической системы, описывающей процесс производства, сбыта и хранения продукции, и формируется следящая система адаптивного управления по локальному критерию.
Развитие рыночной экономики сделало актуальной задачу разработки систем управления для экономических процессов. Для решения этой задачи могут быть использованы методы теории управления, разработанные для технических систем. При этом на первый план выступает задача построения математических моделей экономических процессов.
Традиционные модели экономики, основанные на статических соотношениях баланса, не могут использоваться при анализе фактора времени для эффективности экономических решений. Первые попытки построения динамических моделей экономических систем были связаны с описанием макроэкономических процессов. Модели микроэкономических систем оказываются более сложными, так как требуют учета многих локальных факторов, влияние которых в макроэкономических явлениях усредняется. Кроме того, потенциальная область применения микроэкономических моделей значительно шире, чем макроэкономических.
В настоящей работе рассматривается задача адаптивного управления темпом производства с целью получения желаемой прибыли. Для решения этой задачи строится математическая модель экономической системы, описывающей процесс производства, хранения и сбыта продукции, и формируется следящая система адаптивного управления по локальному критерию.
ОПИСАНИЕ МОДЕЛИ ПРОИЗВОДСТВА, ХРАНЕНИЯ И СБЫТА ПРОДУКЦИИ
Процесс производства, сбыта и хранения продукции можно описать системой обыкновенных дифференциальных уравнений [1,2]
X(t) = A(t)x(t) + B(t)u(t) + F(t)q(t), x(t0) = x0 . (1)
Здесь x(t) = (X(t), Z(t), V(t), W(t))T - вектор состояния, компоненты которого имеют следующий смысл: X(t) - объем продукции, выпущенной предприятием; Z(t) - объем продукции на рынке; V(t) - объем продукции у потребителя, еще не потребленной; W(t) - прибыль от реализации продукции; u(t)
- вектор управления, определяющий темп выпуска продукции; q(t) - вектор, задающий действия случайных факторов, который будем считать гауссовским:
M {q(t )} = q (t ),
M { [q(t) - q (t)] [(t) - q (t)] }= Q(t) S(t - t) , (2)
где T - символ транспонирования; 5(t - t) - дельтафункция Дирака.
Матрица A (t) динамических свойств модели (1) и вектор B (t), характеризующий влияние управляющих воздействий, определяются следующим образом:
(0 0 0 0 'ï
A (t) =
0 - nc ( (t) -9v (t)) - nc9z (t) 0
0 nc ( (t) -фv (t)) - ПФ (t) - K 0
0 cnc ( (t) - фv (t)) - K2 cncфz (t) 0
1
B (t) = 11 1 0 -
; (3)
(4)
В (3), (4) Кь К2, c - коэффициенты, характеризующие темп потребления, плату за хранение, превышение цены над себестоимостью; фХО, фг(0, фКО - функции, описытающие математические модели потенциального спроса, ситуацию на рышке и поведение покупателя; пс = п0 е- - скорость продажи продукции, где п0 - коэффициент покупательной способности.
ФОРМИРОВАНИЕ СЛЕДЯЩЕЙ СИСТЕМЫ
УПРАВЛЕНИЯ ТЕМПОМ ПРОИЗВОДСТВА
Будем предполагать, что информация о векторе состояния (объеме производства, ситуации на рынке, поведении покупателя, прибыши) поступает в дискретные моменты времени ^, t2,... , а управления являются кусочно-постоянными непрерывными слева функциями на каждом интервале выдачи управляющих воздействий:
u(t) = u(k), tk < t < tk_
tk+1 - tk = At,
(5)
где k соответствует моменту времени tk = to + кА, k = 0, N, N = T / А/, [/„, T ] - интервал моделирования.
Модель информационной системы, доставляющей информацию о векторе состояния, зададим в виде
у(к) = Их(к) + г(к), (6)
где у(к) - вектор, содержащий информацию о векторе состояния; И - матрица, состоящая из нулей и единиц, нулевые столбцы которой соответствуют компонентам вектора состояния, о которых отсутствует информация; г(к) - вектор ошибок информационной системы, который будем считать дискретной гауссовской последовательностью:
М{г(к)} = 0, М{гдагт(/)} = Шк,; (7)
х(к) - состояние преобразованной в дискретную форму непрерывной системы (1); 5к, у - символ Кронекера,
к, у = 0ы.
При формировании управления для реальной ситуации необходимо учитывать, что в модели (1) есть параметры, которые невозможно задать точно, например такие, которые описывают модели рынка и покупателя, скорость продаж, темп потребления и т.д. Исходя из экономического смысла этих параметров и их величин, введем два вектора параметров: Єї = (Єи, 0і,2, ©і,з), 02 = (©2,1, 02,2, 02,з), где 01 содержит динамически изменяющиеся параметры модели, описывающие потенциальный спрос, ситуацию на рынке и поведение покупателя, а 02 - коэффициенты, определяющие темп потребления, плату за хранение и скорость продаж. Тогда при формировании управляющих воздействий будем считать, что модель объекта имеет вид х(к + 1) = А(к, 01(к), 02(к)) х(к) +
+ В(к)и(к) + Як) 9(к), х(0) = х0, (8)
где матрицы А(01, 02) = А (к, 01(к), 02(к)), В(к), ^(к) заданы следующим образом
c
A( 02 ) =
^1 0
0 1 -д/e ( — е^)
0 0^
д/е21еи 0
i — д/е21еп — д/е22 0
0 д/е2д ( — е12)
0 д/е21 (е13 — е12)—д/е23 д/се21е11
Б(к) = (д/ д/ 0 — д//с);
(10)
F (к) = VXFF (/к) . (11)
Кроме того, будем предполагать, что априорные распределения векторов x0, е1(0), е2(0) являются гауссовскими:
M{x0} = х0,M{(x0 — x0)(x0 — x0)T} = PX0,
M {е1 (0)} = 01,0, M {(е1 (0) — 01,0 )T (е1 (0) — 01,0)} = Peh0,
М{е2(0)} = 62,0 ,M{(02 (0) — 62,0 )T (е2 (0) — 62,0)} = Ре2,0 ,
M{е[ (к)е2(к)} = 0, M{г(к)qT(j)} = 0, к, j = 0,N.
Учитывая, что информация об объекте поступает от информационной системы с ошибками и может быть неполной, будем в каждый момент формирования управляющих воздействий оценивать состояние модели объекта с помощью дискретного фильтра Калмана [3], который реализуется с помощью следующих рекуррентных соотношений:
)с(к +1) = ус(к +1/к) +
+ K(к)[у (к +1) — Их(к +1/к)], x(0) = x0, x(h +1/ к) = A (к, е1(к), (Э2(к)) £(к) +
+ Б(к )и(к) + F (к )q (к),
K (к) = Px (к +1/ к) Ит [HPx (к +1/ к )И T + R]—1,
Px (к +1/ к) = A (к, е1(к), е2(к ))Px (к +1/ к) х х Ат (к, е1 (к), е2 (к)) + F (к )0(к )Fт (к),
P^ +1/ к +1) = [ 14 — K (к )И ]Px (к +1/ к),
Px (0/0) = Px0, (12)
где I4 — единичная матрица четвертого порядка.
Оценивание векторов (Э1(к +1), (Э2(к +1) будем осуществлять с помощью последовательной идентификации параметров в предположении, что при оценивании одного вектора второй известен точно. Тогда для построения оценки вектора е1 (к +1) будет использоваться следующий рекуррентный алгоритм:
е1(к +1) = е1(к) + 11(к, е2 (к))[ у(к +1) —
— И^( х(к), е2(к), и (к)) —
— HG1 (х(к), е2 (к), и (к ))(Э1(к) — HF (к )q (к)], е1(0) = 910,
Ь1(к, (Э2(к)) = P01 (к / к )G1T( Зс(к), (Э2(к), и (к ))И T M1—1 (к, е2(к)),
M1 (к, е2 (к)) = И01 {х(к), е2(к), и(к)) P01 (к / к )G1T (х(к), е2(к ),и(к)) + ИF (к) F "'(к) И T + R,
P^ (к +1/ к +1) = [/3 — ¿(к, е2 (к ))И^ (х(к),
<Э2(к), и (к ))]p01 (к / к),
P%(0/0) = P01,0. (13)
Оценка е2(к +1) получается с помощью следующих рекуррентных соотношений:
164
02(к +1) = 02(к) + Ь2(к, 0Дк + 1))[у(к +1) -
- ^ 2( х(к), 01(к +1), и(к)) -
- И02( х(к), 01(к +1),
и (к ))02(к) - Ш (к )д(к)], 02(О) = 02О,
12 (к, 01 (к +1)) = Р02 (к / к ^2Т (х(к), 01 (к +1), и (к ))ИТМ 2-1(к, 01(к +1)),
М 2 (к, 01(к +1)) = ИG2 (х(к), 01(к +1),
и(к ))Р01 (к / к ^Т (х(к),
(Э1(к +1), и (к)) + И^(к)^Т(к)Ит + Л,
Р02(к +1/к +1) = \/3 - ¿(к, 01(к +1))ИG2 (х(к),
0,(к +1), и(к ))]Р02(к / к),
Р02(О/О) = Р02О. (14)
В (13), (14) матрицы G1(•), G2(•) и векторы §1(-), §2(-) получаются в результате представления модели (8) в виде
х(к +1) = G1( х(к), 02(к), и(к ))01(к) + §1( х(к),
02(к), и (к)) + ^ (к ^(к) (15)
и
х(к +1) = G2( х(к), 01(к), и(к ))02(к) + g 2 (х(к),
01(к), и (к)) + ^(к)д(к). (16)
Управление экономическим процессом практически всегда имеет целью получение максимально возможной прибыши. Для реализации такого управления приходится учтывать достаточно много различных факторов производства и рышка. В настоящей работе это достигается формированием следящей системы управления, при этом слежение осуществляется за состоянием х^), которое соответствует максимальной прибыли для рассматриваемого предприятия на существующем рышке. Такое состояние определяется с помощью факторного анализа и решения задачи нелинейного программирования с ограничениями, где критерием оптимизации является производственная функция Кобба-Дугласа \4], характеризующая прибышь.
Управление темпом производства будем формировать при слежении за состоянием хг(0 на основе оптимизации локального критерия \5]:
3 (к) = 2 М { (х(к +1) - хг (^ ))Т С( х(к +1) -
■xz (/к)) + и "'(к )Би(к) },
р (17)
где С, В - неотрицательно определенная и положительно определенная весовые матрицы. Формирование управляющих воздействий с учетом принципа разделения осуществляется следующим образом:
и (к) = - [вТ (к)ШВ(к) + в]-1 Вт (к) х
х Ш[а(к,0,(к),02(к))х(к) - хг(tk)] . (18)
В (18) матрица Ш является решением итерационным методом уравнения Риккати в ускоренном времени Дп= Atn (п > 0, целое):
Ш(I +1) = [АоШ(/)Ао - аТш(/)Во(В0ТШ(1)Во + В)-1 х х В0ТШ(0А0 + С - Ш(/)] Дп + Ш(/), Ш(0) = С, (19)
где Л = а(0,01(0),02(0)), В0 = В(к) .
1
ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ
Численное моделирование осуществлялось по данным балансовых счетов предприятия, производящего продукты питания. В качестве основных данных, характеризующих деятельность предприятия, были взяты объем выпускаемой продукции (в денежном выфаже-нии) и доход за каждый месяц в течение одного года. Для того, чтобы не учитывать влияние инфляции, все эти величины были приведены к концу рассматриваемого периода. Математические модели, характеризующие потенциальный спрос, рынок и поведение покупателей, были построены, исходя из характера выпускаемой продукции и с учетом того, какую часть рынка занимает продукция, выпускаемая предприятием.
Для определения максимально возможной прибыли и соответствующего объема производства была решена задача нелинейного программирования с критерием оптимизации в виде производственной функции Кобба-Дугласа, связывающей прибыль с объемом и себестоимостью выпускаемой продукции. В качестве ограничений использовались производственные функции Кобба-Дугласа, определяющие зависимости между объемом продукции, численностью работающих, стоимостью оборотных средств, стоимостью основных фондов, себестоимостью. Кроме того, ограничивалось уменьшение себестоимости продукции не более чем на один процент и указывались цены на ресурсы.
Моделирование осуществлялось методом Эйлера с шагом, равным одному дню. Управление, задающее темп производства продукции, формировалось при слежении за состоянием, определяющем максимально возможную прибыль на существующем рынке, при отсутст-
вии информации о ситуации на рынке и поведении покупателей. При этом учитывались естественные ограничения, вытекающие из экономического смысла рассматриваемых процессов, а именно, переменные состояния и управление, характеризующие объем производства, рынок, покупателя и темп производства должны быть неотрицательными. Кроме того, учитывались ограничения, вытекающие из характера выпускаемой продукции: объем продукции на рынке не может превышать объема продукции, выпущенной в предыдущий день; объем продукции у потребителя не может превышать объема продукции на рынке.
При моделировании, кроме приведенных ограничений, использовалось еще дополнительное ограничение на управление: формируемый темп производства не может превышать тот темп, который обеспечивает максимально возможную прибыль для данного предприятия. Последнее ограничение учитывает ограниченные возможности каждого предприятия по увеличению прибыли.
Сравнение результатов моделирования, характеризующих прибыль, с данными балансовых счетов показало удовлетворительное совпадение теоритических расчетов и практических данных. При этом за счет использования предлагаемого подхода к формированию темпа производства прибыль за время моделирования увеличилась примерно на 3 %.
Полученные результаты показали, что следящие системы управления можно применять для формирования темпа производства, если стратегию управления (получение максимальной прибыли) определять с помощью факторного анализа при использовании производственных функций.
ЛИТЕРАТУРА
1. Горский А.А., Колпакова И.Г, Локшин Б.Я. Динамическая модель процесса производства, хранения и сбыта товара повседневного спроса // Изв. РАН. Теория и системы управления. 1998. № 1.
2. Reshetnikova G.N., Krasnov I.U. Unsteady object optimum control algorithm. The ninth International scientific and practical conference of students, post-gradates and young scientist «Modern techniques and technologies» (MTT' 2003). Tomsk, Tomsk polytechnic university, 2003. P. 203-205.
3. Брамер К., Зиффлинг Г. Фильтр Калмана-Бьюси. М.: Наука, 1982.
4. Терехов Л.Л. Производственные функции. М.: Статистика, 1974.
5. Смагин В.И., Параев Ю.И. Синтез следящих систем управления по квадратичным критериям. Томск: Изд-во Том. ун-та, 1996.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 20 апреля 2004 г.