Научная статья на тему 'Теоретико-игровой вариант транспортной задачи целочисленного программирования'

Теоретико-игровой вариант транспортной задачи целочисленного программирования Текст научной статьи по специальности «Экономика и бизнес»

CC BY
52
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМ / КОМПРОМИССНОЕ РЕШЕНИЕ / ДИНАМИЧЕСКАЯ МОДЕЛЬ / УПРАВЛЕНИЕ / ТРУДОВЫЕ РЕСУРСЫ / ALGORITHM / COMPROMISE SOLUTION / DYNAMIC MODEL / CONTROL / LABOR RESOURCES

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Зайцева Ирина Владимировна, Тимошенко Леонид Иванович, Богданова Светлана Викторовна, Шлаев Дмитрий Валерьевич

Предлагается теоретико-игровой вариант транспортной задачи с учетом изменяющихся условий, то есть рассматривается задача, в которой параметры системы зависят от времени. Для такой математической модели решена конкретная проблема нахождения компромиссных значений функций дохода всех участников и соответствующей им последовательности наборов управления, реализующих компромиссную траекторию. Сформулирован алгоритм нахождения компромиссного решения для динамической модели управления трудовыми ресурсами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Зайцева Ирина Владимировна, Тимошенко Леонид Иванович, Богданова Светлана Викторовна, Шлаев Дмитрий Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithm for finding a compromise solution for a dynamic model of human resource management

Many practical tasks of economic activity and a number of important issues of economic theory are associated with the tasks of determining the optimal solution. This article proposes a game-theoretic version of the transport problem with changing conditions, that is, a problem in which the parameters of the system depend on time. For this model, the problem of finding compromise values of the income functions of all participants and the corresponding sequence of control sets that implement a compromise trajectory is solved.

Текст научной работы на тему «Теоретико-игровой вариант транспортной задачи целочисленного программирования»

МАТЕМАТИКА MATHEMATICS

УДК 519.857:331 ББК 22.18 Т 33

Зайцева Ирина Владимировна

Доцент, кандидат физико-математических наук, доцент кафедры информационных систем Ставропольского государственного аграрного университета, Ставрополь, e-mail: zirinazirina2015@yandex.ru Тимошенко Леонид Иванович

Доцент, кандидат технических наук, доцент Ставропольского филиала Краснодарского университета МВД России, Ставрополь, e-mail: TimoshenkoLI@yandex.ru Богданова Светлана Викторовна

Кандидат педагогических наук, старший преподаватель кафедры информационных систем Ставропольского государственного аграрного университета, Ставрополь, e-mail: svetvika@mail.ru

Шлаев Дмитрий Валерьевич

Кандидат технических наук, доцент, зав. кафедрой информационных систем Ставропольского государственного аграрного университета, Ставрополь, e-mail: shl-dmitrij@yandex.ru

Теоретико-игровой вариант транспортной задачи целочисленного программирования

(Рецензирована)

Аннотация. Предлагается теоретико-игровой вариант транспортной задачи с учетом изменяющихся условий, то есть рассматривается задача, в которой параметры системы зависят от времени. Для такой математической модели решена конкретная проблема нахождения компромиссных значений функций дохода всех участников и соответствующей им последовательности наборов управления, реализующих компромиссную траекторию. Сформулирован алгоритм нахождения компромиссного решения для динамической модели управления трудовыми ресурсами.

Ключевые слова: алгоритм, компромиссное решение, динамическая модель, управление, трудовые ресурсы.

Zaytseva Irina Vladimirovna

Associate Professor, Candidate of Physics and Mathematics, Associate Professor of Department of Information Systems, Stavropol State Agrarian University, Stavropol, e-mail: zirinazirina2015@yandex.ru

Timoshenko Leonid Ivanovich

Associate Professor, Candidate of Technical Sciences, Associate Professor of the Stavropol Branch of the Krasnodar University of the Ministry of Internal Affairs of Russia, Stavropol, e-mail: TimoshenkoLI@yandex.ru

Bogdanova Svetlana Viktorovna

Candidate of Pedagogy, Senior Lecturer of Department of Information Systems, Stavropol State Agrarian University, Stavropol, e-mail: svetvika@mail.ru

Shlaev Dmitriy Valeryevich

Candidate of Technical Sciences, Associate Professor, Head of the Information Systems Department, Stavropol State Agrarian University, Stavropol, e-mail: shl-dmitrij@yandex.ru

Algorithm for finding a compromise solution for a dynamic model of human resource management

Abstract. Many practical tasks of economic activity and a number of important issues of economic theory are associated with the tasks of determining the optimal solution. This article proposes a game-theoretic version of the transport problem with changing conditions, that is, a problem in which the parameters of the system depend on time. For this model, the problem offinding compromise values of the income functions of all participants and the corresponding sequence of control sets that implement a compromise trajectory is solved.

Keywords: algorithm, compromise solution, dynamic model, control, labor resources.

1. Формальная постановка задачи

Рассмотрим детерминированную модель, то есть такую модель, в которой система переходит из одного состояния в другое при выборе управляющего параметра с вероятностью, равной 1.

Несколько работодателей организуют процесс предоставления вакансий некоторому числу трудовых ресурсов. В начальный момент времени для работодателей определены типы трудовых ресурсов и их количества, затраты на их содержание, а для трудовых ресурсов -цены и функции полезности вакансий. Также считается заданным общий вид сети, функции пропускных способностей на ее ребрах и стоимость перемещения единицы трудовых ресурсов по ребрам. Таким образом, имеем систему

П = N,М, аг, Д , а*, К(^), ХуУ), ©*(5,)| г = Щ ' = 1М * = (х, у) е я],

где N - количество работодателей; М - количество вакансий; аг - количество трудовых ресурсов г-ого типа производства; 5' - потребность трудовых ресурсов ; в у'-ом пункте производства; р. - затраты на содержание единицы трудовых ресурсов в г-ом пункте производства; а* - цена единицы трудовых ресурсов ; в у'-ом пункте потребления; К(х у) - пропускная способность ребра (ху); - стоимость перемещения единицы трудовых ресурсов

по ребру (х,у) [1]. ___

Для игрока г = 1, N+М в каждый момент времени I = 0, Т -1 определяется множество управлений

и:=к}, (4)

где мощность множества

U

= p'r; lr = 1,2,...p'r - номер элементов множества U ; r - номер

игрока.

Необходимо определить компромиссные значения функций дохода игроков и последовательность наборов управления, реализующую компромиссную траекторию [2].

На 1-ом шаге игроки независимо друг от друга выбирают каждый свое управление. Получается набор управлений

N + М

< = (к1,...,^+М), < е и1 = Пи;, (5)

г=1

где и1 = {к1,...,К } - множество возможных наборов управлений игроков; 21 - мощность

множества и1; - номер набора управлений на 1-ом шаге, то есть ^ е 1,2Х, в соответствии с которым параметры модели меняются [3].

К началу следующего шага в зависимости от выбранных на предыдущем шаге управлений изменяются мощности работодателей, затраты на содержание единицы трудовых ресурсов, цены трудовых ресурсов в пунктах потребления, пропускные способности ребер и стоимость перемещения по ним единицы трудовых ресурсов.

Следовательно, вся система переходит в новое состояние, в котором игроки снова решают задачу выбора параметров управления. Таким образом, возникает динамическая задача, которая решается методом динамического программирования.

Подход динамического программирования в данном случае состоит в том, что решаемая задача «погружается» в более широкий класс задач, описываемых рядом параметров, и вслед за этим с помощью принципа оптимальности на основе определения компромиссного множества определяется основное рекуррентное соотношение.

2. Математическая постановка задачи

Пусть имеется множество работодателей I. Занумеруем их индексом г = 1, N, /={/}. Имеется множество трудовых ресурсов J. Занумеруем их индексом ' = 1,М, Про-

цесс экономических отношений между работодателями и трудовыми ресурсами протекает в течение Т периодов времени I = 0, Т. Также изначально известно количество трудовых ресурсов а° и затраты на содержание единицы трудовых ресурсов Д0. Считаются заданны- 14 -

ми на первом этапе пропускная способность K®x y ) и стоимость перемещения единицы трудовых ресурсов d(0xy) для каждого ребра сети [4]. Таким образом, начальное состояние системы Q можно обозначить как

Q° = {n,m,vI д0>;,K(V,,d(0x,y),(5;))| = Щ j = TMs = 1N (x,y) er\. (6)

В дальнейшем в описание состояний Qt, t = l, T системы Q количество вакансий М,

количество вакансий N и функции полезности 0; (5;) включаться не будут, так как они не

зависят от выбора набора управлений.

Функции дохода игроков задаются следующим образом [5]. Для работодателей:

M

н\ к) =I ) - - f (p,v, (7)

j=i

M

где qt - номер набора управлений в момент времени t; I (5;а;) - выручка от реализации

j=i

трудовых ресурсов в момент времени t; utißti - затраты на содержание трудовых ресурсов в момент времени t:; уt (p,5) - затраты на перевозку товаров в момент времени t, зависящие от пути перемещения p и от количества перемещаемых трудовых ресурсов 5. Для трудовых ресурсов:

N N

н'В]«) = !©; (5;) -I t5;ta;, (8)

;=1

где 0/5* - полезность количества 5-х трудовых ресурсов для у'-го потребителя в момент

времени ' и задается посредством функции; '5*'а* - затраты на покупку 5* единиц 5-х трудовых ресурсов у-ым пунктом потребления по цене а* в момент времени '.

Наряду с функциями дохода для каждого игрока в каждый момент времени ' = 0, Т -1

определяется множество управлений иг = [и1], где г = 1, N + М - номер игрока,

1Г = 1,2,..,рГ - номер элемента множества иГ, рГ - мощность множества иГ.

В данной задаче множества управлений имеют следующий вид [6]. Для работодателей это всевозможные маршруты перемещения трудовых ресурсов ко всем местам работы, то есть

Щ' = {(Д. ^ В,,..., Д ^ Вм) }, где г = 1,N, ' = 0, Т. (9)

Каждый элемент множества Ж' должен удовлетворять ограничениям на пропускную способность ребер сети.

Для трудовых ресурсов множества управлений V' в каждый период времени будут

состоять из различных заказов каждого из вида трудовых ресурсов, то есть

Vу = {(д,...,д;) }, где у = 1М. (10)

Каждый элемент множества V' должен удовлетворять условиям:

а' ='д' +....+'5М , где * = , г = , ' = ОТ. (11)

Каждый игрок г = 1, N + М выбирает элемент из своего множества управлений иг. Если управления выбраны игроками и получен общий набор управлений

< = {(Д ^В!,..., Д ^ Вм),...,(5,...,д) }, (12)

где i = 1, N, j = 1,M, t = 1, T, то система Q из состояния Т 1 переходит в следующее

yt

состояние Тq .

Затем игроки получают свои выигрыши, определенные по формулам (7), (8) и зависящие от периода и выбранного управления [7].

Таким образом, перебирая все возможные управления подобного вида и получая в соответствии с ними значения функции дохода игроков, на каждом этапе найдем компромиссный доход игроков и соответствующий ему набор управлений.

Чтобы найти компромиссные значения функций дохода игроков и соответствующую им последовательность наборов управлений для системы Q, находящейся в состоянии Q0, за

Т шагов необходимо воспользоваться принципом динамического программирования [8].

Обозначим общий доход системы Q, находящейся в состоянии Q0, за Т шагов через

RT (Q0, Q^,..., Q;) = HT «, <,..., uTqT), (13)

где Q0 - начальное состояние системы Q; Q^ - состояние системы Q под номером qt e 1, zt в момент времени t; u^ - набор управлений под номером qt е 1, zt в момент времени t, в соответствии с которым система Q переходит из состояния Qq^ в состояние Q'.

Общий доход зависит от состояний, в которых находилась система в каждый момент времени t = 0, T .

Затем построим функцию Беллмана, значения которой отражают доход системы Q0 за Т шагов при реализации компромиссной последовательности наборов управления.

Ст (Q0) = comp RT (Q0, Q1 ,..., Q^ ), (14)

1 2 T 1 T

u,1, uc|2 ,...,UTT

где Q0 - начальное состояние системы Q; Q^ - состояние системы Q под номером qt е 1, zt в момент времени t; u'qt - набор управлений под номером qt е 1, zt в момент времени t, в соответствии с которым система Q переходит из состояния Q в состояние Q( ; t = 0, T; comp - оператор, вычисления компромиссной точки.

Рассмотрим пространство всех моделей с фиксированным множеством управлений и переменными функциями дохода. В каждой такой модели выбирается единственная компромиссная точка. Таким образом, получаем оператор comp на пространстве всех моделей [9]. Теперь для функции Беллмана построим рекуррентное соотношение.

Сt (Q0) = comp H X) + CT 1 (Q^ )J, (15)

где СT (Q0) - компромиссный доход для системы Q, находящейся в состоянии Q0 при t=0 за Т шагов; comp - оператор, вычисления компромиссной точки; H l(u1') - доход игроков в первый момент времени при реализации общего набора управлений номер q1 ; СT-1(Q1q1) - компромиссный доход для системы, находящейся в состоянии Т^ за последующий (Т-1) шаг.

Другой прием описания этой игры состоит в том, что указывает на то, какие ходы могут делать игроки и какими могут быть размеры платежей на каждом шаге. Игра, описанная таким образом, называется игрой в развернутой форме, а само описание составляется обычно в виде дерева игры. На дереве игры изображены все возможные на данном шаге ситуации игры и указаны соответствующие им выигрыши.

У дерева описанной выше игры в качестве ветвей выступают общие векторы управления,

возможные на этом этапе, а в качестве вершин - состояния системы и доходы всех игроков при выборе какого-либо из возможных управлений. Строится это дерево следующим образом.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для начального состояния системы при t=0 ищем все возможные общие векторы управления и вычисляем доходы всех игроков при выборе того или иного общего вектора управления. Таким образом, по окончании первого этапа имеем некоторое количество возможных последующих состояний системы ^. Далее, проделывая процедуру, аналогичную предыдущей (7-1) раз, получим всевозможные состояния системы на каждом этапе.

3. Алгоритм решения

Алгоритм решения состоит из (7+1) шагов [10].

Шаг 1. Рассмотрим все возможные состояния системы Q при t = T -1 - QT 1. Пользуясь рекуррентным соотношением (15), найдем компромиссный доход для всех возможных состояний системы QT-1 за последний шаг следующим образом:

сч^т:1)=сотРнТ К).

Кт

Шаг 2. Рассмотрим все возможные состояния системы Q при t = T- 2- QT-2. Для них найдем компромиссный доход за последние два шага по формуле:

С2 (nT;2) = comp[HT 1 (С!) + С1 (Q- )].

U9T-1

Шаг Т. Рассмотрим начальное состояние О0 системы О. Для него найдем компромиссный доход за Т шагов

СT (Q0) = comp H Ч<) + CT - 4^)].

Шаг (Т+1). Подставляя полученные соотношения одно в другое, получим компромиссный доход игроков за весь Т-шаговый процесс и последовательность наборов управлений, реализующих компромиссную траекторию на дереве игры.

Таким образом, при нахождении компромисса на каждом этапе на нашем дереве вырисовывается оптимальная траектория, движение по которой и дает компромисс во всей многошаговой задаче.

Приведем пример. Рассмотрим разработанную модель при N=2, М=3, Т=3. Зададим состояние системы при 1=0:

а? = 10, Д° = 5,79, а20 = 8, = 7,24,

K0 АС = 6, d0AiC = 2,57, K0 AD = 9, d0A1D = 3,13, K °CE =15, d °CE - 4,9 ,

K0 а2с = 7, d0 а2с = 3,67, K 0DF = 13, d0 DF = 5,24, K 0 a2 D =11, d 0 a2 D = 4,28,

K °EB1 = 5, d0 EBy = 1,99, K0 EB2 = 7, d0 eb2 = 1,22, K 0 fbj = 4, d 0 fbj = 3,31,

K °fb2 = 9, d0 FB2 = 3,74, K0 EB3 = 8, d0 eb3 = 4,1, K 0 FB3 = 9, d0 FB3 = 1,07 ,

X = 34,27, X = 58,64, X = 39,74, X2 = 54,86, 0X22 = 64,97, 0X32 = 47,98 .

Функции полезности имеют вид:

©j (ö1) = 96,27^3,4 -öj , , ©ö = 76,99^ öf.

j = 1, M.

Из одного состояния в другое система переходит в зависимости от управления посред-

u

ством следующих преобразований:

ft-w„ .t-1

аЦ =aí-1 + 4%

u2 = a21 + 7%

К í) ß

h 2- X:!)

ß2

ß = ßß-1 +10% д.

t-1

где i = 1, N, t = 0, T, j = 1, M, (x, ><) e Л.

'а; ='- + 7%'- 1а;

)=к £)+9% к-у) =)+5%<у)

Действуя по алгоритму, описанному выше, получим следующие доходы игроков:

НА(иттр) = 1592,46, И^(мсотр) = 67,78, ИЛ2(ысотр) = 1808,79, И^и^) = 342,36, Ищ(исотр) = 851,51.

Соответствующая им последовательность общих векторов управления, реализующая компромиссную траекторию на дереве игры, выглядит следующим образом:

u =

comp

(u1, u2, u3),

где

и1 = ((Д1ЛРВ1 [2], 4^В2[2] + ДСЕВ2[5], ДСЕВ3[1]); .

(Л2ЯЯВД + Д2СЕВ1[3], ЛСЕВ2[2], 4СЕВ3[2]);(2,4); (7,2); (1,2)) '

и2 = ((ДЯ^Д [2], ДЯЯВ2[3] + Л1СЕВ2[3], Л1СЕВ3[4]); ;

(Л2£Щ[3] + Л2СЕВ1[3], Л2СЕВ2[3], Л2СЕВ3[2]);(2,6);(6,3);(4,2)) '

и3 = ((Л1^^В1[6], Л1СЕВ2[4] + Л1СЕВ2[5], Л1СЕВ3[4]);

(ДСЕД[7],Л2£>ЯВ2[5],Л2£>^[1] + ДСЕВ3[2]);(6,7);(4,5);(4,3)) '

4. Заключение

Многие практические задачи хозяйственной деятельности и ряд важных вопросов экономической теории связаны с задачами определения оптимального варианта решения. В данной статье предложен теоретико-игровой вариант транспортной задачи с учетом изменяющихся условий, то есть такая задача, в которой параметры системы зависят от времени. Для этой модели решена задача нахождения компромиссных значений функций дохода всех участников и соответствующей им последовательности наборов управления, реализующих компромиссную траекторию.

Примечания:

1. Малафеев О. А. Управляемые конфликтные системы. СПб.: Изд-во СПбГУ 2000. 280 с.

2. Ершова Т.А., Малафеев О.А. Конфликтные управления в модели вхождения в рынок // Проблемы механики и управления: нелинейные динамические системы. 2004. № 36. С. 19-27.

3. Колокольцов В.Н., Малафеев О. А. Динамические конкурентные системы многоагентного взаимодействия и их асимптотическое поведение (часть II) // Вестник гражданских инженеров. 2011. № 1 (26). С. 134-145.

4. Зубов В.И., Петросян Л.И. Математические методы в планировании. Л.: Изд-во ЛГУ, 1982. 112 с.

5. Грицай К.Н., Малафеев О.А. Задача конкурентного управления в модели многоагентного взаимодейст-

References:

1. Malafeev O.A. Managed conflict systems. St. Petersburg: Publishing House of St. Petersburg State University, 2000. 280 pp.

2. Ershova T.A., Malafeev O.A. Conflict controls in the market entry model // Problems of Mechanics and Control: Nonlinear Dynamic Systems. 2004. No. 36. P. 19-27.

3. Kolokoltsov VN., Malafeev O.A. Dynamic competitive systems of multi-agent interaction and their asymptotic behavior (part II) // Bulletin of Civil Engineers. 2011. No. 1 (26). P. 134-145.

4. Zubov VI., Petrosyan L.I. Mathematical methods in planning. L.: Publishing House of Leningrad State University, 1982. 112 pp.

5. Gritsay K.N., Malafeev O.A. The task of competitive management in the model of multi-agent interaction of

вия аукционного типа // Проблемы механики и управления: нелинейные динамические системы. 2007. № 39. С. 36-45.

6. Парфенов А.П., Малафеев О.А. Равновесное и компромиссное управление в сетевых моделях многоагентного взаимодействия // Проблемы механики и управления: нелинейные динамические системы. 2007. № 39. С. 154-167.

7. Pichugin Y., Alferov G., Malafeyev О.А. Parameters estimation in mechanism design // Contemporary Engineering Sciences. 2016. Vol. 9, No. 1-4. P. 175-185.

8. Grigorieva X., Malafeev О.А. A competitive many-period postman problem with varying parameters // Applied Mathematical Sciences. 2014. Vol. 8, No. 145-148. P. 7249-7258.

9. Малафеев О.А. Ситуации равновесия в динамических играх // Кибернетика. 1974. № 3. С. 111-118.

10. Малафеев О.А., Петросян Л.А. Игра простого преследования на плоскости с препятствием // Управляемые системы. 1971. № 9. С. 31-42.

the auction type // Problems of Mechanics and Control: Nonlinear Dynamic Systems. 2007. No. 39. P. 36-45.

6. Parfenov A.P., Malafeev O.A. Equilibrium and compromise control in network models of multi-agent interaction // Problems of Mechanics and Control: Nonlinear Dynamic Systems. 2007. No. 39. P. 154167.

7. Pichugin Y., Alferov G., Malafeyev OA. Parameters estimation in mechanism design // Contemporary Engineering Sciences. 2016. Vol. 9, No. 1-4. P. 175-185.

8. Grigorieva X., Malafeev OA. A competitive many-period postman problem with varying parameters // Applied Mathematical Sciences. 2014. Vol. 8, No. 145-148. P. 7249-7258.

9. Malafeev O.A. Equilibrium situations in dynamic games // Cybernetics. 1974. No. 3. P. 111-118.

10. Malafeev O.A., Petrosyan L.A. A game of simple pursuit on a plane with an obstacle // Managed Systems. 1971. No. 9. P. 31-42.

i Надоели баннеры? Вы всегда можете отключить рекламу.