УДК 622.012:658
ИСПОЛЬЗОВАНИЕ АЛТЕРНАТИВНЫХ КРИТЕРИЕВ ПРИ ВЫБОРЕ ОПТИМАЛЬНОЙ СТРАТЕГИИ ОБОСНОВАНИЯ ПОТРЕБНОСТИ ГОРНОДОБЫВАЮЩЕГО ПРЕДПРИЯТИЯ В ЛЕСОМАТЕРИАЛАХ
Е. Ф. Воропаева1, М. В. Рууз2
Национальный исследовательский Иркутский государственный технический университет, 664074 г. Иркутск, ул. Лермонтова, 83.
Рассматривается математическая модель игры с природой, когда возникает необходимость принятия решения в условиях неопределенности. На примере особенностей горнодобывающей промышленности ВосточноСибирского региона обоснована потребность предприятия в лесоматериалах, дефицитных в социально-экономических условиях. Результаты расчетов по данной методике могут быть использованы в организации и планировании работы горнодобывающих предприятий. Табл. 1. Библиогр. 4 назв.
Ключевые слова: математическая модель; игра с природой; стратегия; риск; критерий; решение.
USE OF ALTERNATIVE CRITERIA WHEN CHOOSING AN OPTIMAL STRATEGY TO JUSTIFY THE DEMAND OF A MINING ENTERPRISE IN TIMBER E. F. Voropaeva, M. V. Ruuz
National Research Irkutsk State Technical University, 83, Lermontov St., Irkutsk, 664074.
The authors consider the mathematical model of the game with nature when there is a necessity to make a decision under conditions of uncertainty. On example of the features of mining industry of the East Siberian region they justify the need of an enterprise in timber, scarce in socio-economic conditions. The calculation results by this method can be used in organizing and planning the operation of mining enterprises. 1 table. 4 sources.
Key words: mathematical model; game with nature; strategy; risk; criterion; solution.
Теория игр все шире проникает в практику экономических решений и исследований, позволяя повысить эффективность плановых и управленческих решений. Игра - упрощённая формализованная модель реальной конфликтной ситуации. Обычно теорию игр определяют как раздел математики. Математическая формализация означает, что выработаны определённые правила поведения сторон в процессе игры. Неопределённость в ситуации принятия решения далеко не всегда связана с сознательным противодействием партнера. Часто бывает, что мы не располагаем точной информацией о поведении партнера и это вызывает неопределённость в игре с ним. В таких случаях данная матричная игра будет называться игрой с природой. В матричной игре с природой ставится задача поиска оптимальной стратегии в условиях риска.
Формально изучение игры с природой должно начинаться с построения платёжной матрицы, что является, по существу, наиболее трудоёмким этапом в принятии решения. Ошибки в платёжной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, называемый игроком А. Игрок В (природа) сознательно против игрока А не действует,
а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнера по игре. Поэтому термин природа характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых игроком В действительно может быть природа (например, обстоятельства, связанные с погодными условиями или стихийными природными силами). Природа может находиться в одном из множества возможных состояний, которое, в принципе, может быть как конечным, так и бесконечным. Довольно часто в этой ситуации речь идёт о выборе одной (соответственно, чистой) стратегии, т.е. «повторить партию», чтобы вести речь о средних выигрышах, невозможно.
Будем считать, что множество состояний природы
ВI, (у = 1,п)конечно. Все возможные состояния известны, не известно только, какое состояние будет иметь место в условиях, когда планируется реализация принимаемого управленческого решения.
Множество управленческих решений (планов) А также конечно и равно т.
Исход игры будем определять платёжной матрицей А. Условимся, что в том случае, если элементы а¿-для игрока представляют собой выигрыш, полезность, будем считать, что А - это игрок, В - природа. И, на-
1Воропаева Елена Федоровна, доцент кафедры информатики, тел.: 89149035279, (3952) 405183.
Voropaeva Elena Fedorovna, associate professor of the chair of Computer Science, tel.: 89149035279, (3952) 405183.
2Рууз Марина Валентиновна, доцент кафедры математики, тел.: 912418, (3952) 405176.
Ruuz Marina Valentinovna, associate professor of the chair of Mathematics, tel.: 912418, (3952) 405176.
оборот, если aj - затраты, потери, то игрок, как таковой, - это игрок В, природа - игрок А.
Один из критериев, применяемых при решении подобных задач - это максиминный/минимаксный критерий (называемый также критерием Вальда).
Рассмотрим некоторые альтернативные критерии
[1].
Критерий Лапласа
Данный критерий опирается на «принцип недостаточного основания», согласно которому все состояния природы Bj полагаются равновероятными, т.е. вероятности того, что природа окажется в одном из n своих состояний, одинаковы и равны:
1
qj = -
n
Если для принимающего решение элементы матрицы aij платёжной матрицы - выигрыши, то оптимальной считается та стратегия Ai, для которой среднее арифметическое возможных выигрышей максимально, т.е. критерий:
i 1* 1
maxiajj > (1)
Ai
n
j=1
Если принимающий решение является игроком В, то критерий становится таким:
А1^} (2)
min<
Bj I n
Критерий Сэвиджа
Введём понятие матрицы рисков R. Это матрица, имеющая размерность тхп. Её элементы Гу определяются по следующей формуле (если А - игрок, В -природа):
=ßj -
(3)
где в - максимальный элемент ]-ом столбце платёжной матрицы.
Если же человек, принимающий решение, - игрок В, т.е. ву - потери, то элементы матрицы рисков определяются так:
г. = а1} -а (4)
где а, - минимальный элемент в ¡-ой строке платёжной матрицы.
Критерий Сэвиджа использует матрицу рисков Я и рекомендует в условиях неопределённости выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т.е.:
тгптаху..} (5)
г . 1
По сути, это тот же минимаксный критерий, только по отношению к матрице рисков, а не к платёжной матрице.
Если принимающий решение - игрок В, критерий становится таким:
тгптаху . } (6)
1 г 1
Критерий Гурвица
Данный критерий основан на использовании так называемого коэффициента доверия. Обозначим его y и предположим, что природа окажется в самом выгодном состоянии с вероятностью y и в самом невыгодном состоянии с вероятностью 1-y.
Критерий Гурвица ориентирован на установление баланса между случаями крайнего пессимизма и крайнего оптимизма путём взвешивания обоих исходов.
Если принимающий решение - игрок А, то: max у max{aij }+ (l - y)min\aij } . (7)
* L_ 1 1 _
Если принимающий решение - игрок B, то:
minY min\ajj}+ (l - y)max\ajj }l (8)
j L i 1 i 1 i
Заметим, что, если коэффициент доверия равен нулю, критерий Гурвица превращается в «классический» минимакс, а при у=1 получаем правило «максимум из максимумов» - выбор лучшего из лучших исходов.
На примере игры с природой рассмотрим проблему заготовки древесины дл изготовления крепи горных выработок.
Задача. Компания «ТрансЛес» - заготовитель древесины для изготовления крепи горных выработок. Генеральный директор этого предприятия должен решить, сколько кубических метров деловой древесины следует поставить рудникам в течение одного месяца. Вероятности того, что спрос на древесину в течение месяца будет 60, 70, 80 или 90 м , равны соответственно 0,1; 0,3; 0,5; 0,1. Затраты на заготовку 1 м3 деловой древесины равны 45 у.е. Компания реализует её по цене 65 у.е./м3. Без обустройства специальных навесов - укрытий штабелей деловой древесины - последняя в течение одного месяца может значительно утратить свои кондиционные свойства, и компания в таком случае не получит желаемой прибыли.
Сколько кубических метров древесины компании следует заготавливать в течение одного месяца?
Решение. Пользуясь исходными данными, строим матрицу игры. Стратегиями игрока А (компания «ТрансЛес») являются различные показатели месячной заготовки древесины, которых ему, возможно, следует достичь. Состояниями природы (игрок В) выступают величины спроса на аналогичное количество кубометров заготовленной древесины.
Вычислим, например, показатель прибыли, которую получит игрок А, если в течение одного месяца он заготовит 80 м3 древесины, а реализует только 70 м3. Каждый кубический метр древесины компания реализует по 65 у.е. Компания реализовала 70 м3, а заготовила 80 м3. Следовательно, выручка составит 6570 = 4550 у.е., а издержки производства - 4580 = 3600 у.е. Прибыль от указанного сочетания спроса и предложения будет 4550 - 3600 = 950 у.е.
Аналогично производятся расчёты при других сочетаниях спроса и предложения. В итоге получим следующую платёжную матрицу игры с природой (табли-
Платежная матрица игры с природой
Производство древесины, м3 Спрос, м3 Средняя ожидаемая прибыль, у.е.
60 (0,1) 70 (0,3) 80 (0,5) 90 (0,1)
В1 В2 В3 В4
А1 60 1200 1200 1200 1200 1200
А2 70 750 1400 1400 1400 1335
А3 80 300 950 1600 1600 1175
А4 90 -150 500 1150 1800 890
ца), где в скобках приведена вероятность спроса на заготовку древесины.
Как видим, наибольшая средняя ожидаемая прибыль равна 1335 у.е. Она соответствует плану заготовки - 70 м3 древесины.
На практике в подобных случаях чаще всего решения принимаются, исходя из критерия максимизации средней ожидаемой прибыли или минимизации ожидаемых издержек. Следуя такому подходу, можно остановиться на рекомендации заготавливать 70 м3 древесины, и для большинства лиц, принимающих решение (ЛПР), рекомендация была бы обоснованной.
Однако, привлекая дополнительную информацию в форме расчета среднего квадратичного отклонения как индекса риска, мы можем уточнить принятое на основе максимума прибыли или минимума издержек решение. Для наших исследований применим формулы теории вероятностей [3].
Дисперсия случайной величины X
Б(Х) = М(Х2) - (М(Х ))2.
Среднее квадратичное отклонение а(Х) = 45(Х), где М(Х) - математическое ожидание случайной величины X:
М(Х) = £ хгрг.
Проводя соответствующие вычисления для плана заготовки 60, 70, 80 и 90 м3 древесины, получаем:
• при плане 60 м3 - а(Х) = 0 у.е.;
• при плане 70 м3 - <у(Х) = 374,5 у.е.;
• при плане 80 м3 - <у(Х) =659,6 у.е.;
• при плане 90 м3 - о(Х) = 520,0 у.е.
Вывод. Из представленных результатов с учётом полученных показателей рисков - средних квадратичных отклонений - очевидно, что заготавливать 80 и 90 м3 при любых обстоятельствах нецелесообразно, так как средняя ожидаемая прибыль, равная, соответственно, 1175 и 890 у.е., меньше, чем при плане заготовки 70 м3 древесины (1335 у.е.), а средние квадратичные отклонения 659,6 и 520 у.е.2, соответственно, больше, чем для аналогичного показателя для 70 м3 (374,52 у.е.2).
Используем альтернативные критерии определения оптимальных стратегий.
1. Максиминый критерий (критерий Вальда) Обычным способом определяем нижнюю границу
игры: а = -150. Оптимальная стратегия - А4.
2. Критерий Лапласа
Определим среднее значение по каждой из строк платёжной матрицы, а затем выберем максимальное значение. В результате расчетов получим: для стратегии А1 - 1200 у.е.; для стратегии А2 - 1272,5 у.е.; для стратегии А3 - 1112,5 у.е.; для стратегии А4 - 825 у.е. Оптимальная стратегия по критерию Лапласа - А2.
3. Критерий Сэвиджа
Сначала составим матрицу рисков Р. Для чего воспользуемся соотношением (3), т.е. будем вычитать каждый элемент платежной матрицы из максимального элемента соответствующего столбца. В результате расчетов получим следующую матрицу рисков: / 0 200 400 600\ „ = / 450 0 200 400 \ I 900 450 0 200 Г 4350 900 450 0 '
Выбирая максимальное значение в каждой строке, получим:
для стратегии А1 - 600 у.е.; для стратегии А2 - 450 у.е.; для стратегии А3 - 900 у.е.; для стратегии А4 - 1350 у.е. Минимальное из полученных значений - 450 у.е. Таким образом, по критерию Сэвиджа, оптимальной является стратегия А2.
4. Критерий Гурвица
Определение оптимальной стратегии по критерию Гурвица предполагает установление коэффициента доверия. Предположим, что коэффициент доверия Y = 0,6 и найдем оптимальную стратегию для данного значения. Вычислим значение выражения (7) для каждой строки платёжной матрицы: для стратегии А1 - 0,6 1200 + 0,4 1200 = 1200 у.е.; для стратегии А2 - 0,6 1400 + 0,4 750 = 1140 у.е.; для стратегии А3 - 0,6 1600 + 0,4 300 = 1080 у.е.;0, для стратегии А4 - 0,6 1800 + 0,4 (-150) = 1020 у.е.
Выбирая максимальное значение, делаем вывод, что оптимальной стратегией по критерию Гурвица является А1. При другом значении коэффициента доверия оптимальное решение может быть другим.
Окончательное решение должен принимать генеральный директор компании «ТрансЛес» с учётом опыта своей работы, склонности к риску и степени достоверности показателей вероятностей спроса: 0,1; 0,3; 0,5 и 0,1.
Мы же склоняемся к рекомендации заготавливать 70 м3 древесины, что вытекает даже из максимизации прибыли без учёта риска.
Применение математических методов в играх с
природой в определенной степени является субъективным (вследствие произвольности выбора критерия принятия решения). Тем не менее, создается упорядочение имеющихся в распоряжении ЛПР данных: задаются множества состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях «среда - решение». Такое упорядочение представлений о проблеме способствует повышению качества принимаемых решений.
Библиографический список
1. Безруков А.Б., Саитгаров С.С. Прикладная теория игр: учеб. пособие. Челябинск: Изд-во Челябинского гос. ун-та, 2001. 127 с.
2. Васин А.А., Морозов В.В. Введение в теорию игр с приложениями в экономике: учеб. пособие. М.: Экзамен, 2003. 278 с.
3. Вентцель Е.С. Исследование операций. М.: Высш. шк., 2001. 206 с.
4. Резниченко С.С., Подольский М.П., Ашихмин А.А. Экономико-математические методические методы и моделирование в планировании и управлении горным производством: учебник. М.: Недра, 1999. 429 с.
УДК 681.5
СИСТЕМНЫЙ ПОДХОД К АНАЛИЗУ СТРУКТУРЫ И ПРОЕКТИРОВАНИЮ АДАПТИВНОГО ИНТЕРОПЕРАБЕЛЬНОГО ОБУЧАЮЩЕГО МОДУЛЯ
Я. В. Курзыбова1
Национальный исследовательский Иркутский государственный технический университет, 664074, г. Иркутск, ул. Лермонтова, 83.
Дано описание системы адаптивного интероперабельного учебного модуля, обладающего возможностью встраивания в автоматизированные обучающие системы. Предложен подход выделения подсистем: обучаемый; кластер курса (дерево курса); подсистема контроля (обратной связи); управляющая подсистема, состоящая из управляющего устройства и адаптера, реализующих адаптивное обучение. Ил. 4. Библиогр. 4 назв.
Ключевые слова: UML; адаптивный интероперабельный обучающий модуль.
A SYSTEMATIC APPROACH TO THE STRUCTURE ANALYSIS AND DESIGNING OF AN ADAPTIVE INTEROPERABLE TRAINING MODULE Ya. V. Kurzybova
National Research Irkutsk State Technical University, 83, Lermontov St., Irkutsk, 664074.
The author gives a description of an adaptive interoperable training module that has the option to be incorporated into automated training systems. She proposes an approach for the allocation of sub-systems: a trainee; a course cluster (the tree of the course); a control subsystem (feedback subsystem); the control subsystem consisting of a controlling device and the adapter that implements adaptive training. 4 figures. 4 sources.
Key words: UML; interoperable adaptive training module.
Применение методов адаптивного обучения, средств индивидуализации обучения в автоматизированных обучающих системах является актуальным направлением исследования ученых и специалистов многих отраслей: дидактики, педагогики, математического моделирования, системного анализа. Это связано, прежде всего, с особенностями предметной области исследования, предполагающими всесторонний анализ, полноту которого можно гарантировать, учитывая междисциплинарные связи: системный анализ — моделирование объектов обучающей среды — процессы генерации обучающих воздействий (обучающих траекторий).
Автоматизация процессов генерации обучающих траекторий позволяет качественно улучшить использование средств электронного обучения за счет снижения временных затрат преподавателя на такие мероприятия, как планирование учебной деятельности, ее мониторинг, проверка качества, консультирование.
Одним из путей решения проблемы автоматизации обучающих воздействий являются анализ и разработка интероперабельных обучающих модулей, способных генерировать обучающие траектории, что позволит дополнять уже существующие системы без их кардинальной реконструкции.
Под адаптивным обучающим модулем будем по-
1Курзыбова Яна Владимировна, аспирант кафедры автоматизированных систем, тел.: (3952) 405616, e-mail: ania-k@yandex.ru
Kurzybova Yana Vladimirovna, postgraduate of the chair of Automated Systems, tel.: (3952) 405616,e-mail: ania-k@yandex.ru