Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 3 (2), с. 152-161
УДК 519.21
УПРАВЛЯЮЩИЕ СИСТЕМЫ И РЕШЕНИЕ ПАРАДОКСА НЕЗАВИСИМОСТИ © 2011 г. М.А. Федоткин
Нижегородский госуниверситет им. Н.И. Лобачевского
Поступила в редакцию 25.10.2010
Построение адекватных математических моделей реальных управляющих систем является первоначальной задачей теории управления. На сегодня методы построения моделей систем в основном исчерпываются двумя подходами. Первый подход основан на рассмотрении системы с позиции «черного ящика» и на представлении системы в виде составляющих её элементов (объекта управления и системы управления). В работах [1-5] впервые предлагается кибернетический подход к построению, анализу и оптимизации моделей управляющих систем, которые функционируют в неопределенных условиях. В этой работе целесообразность такого подхода обосновывается на решении известного в теории вероятностей парадокса независимости Секея [6].
Ключевые слова: статистически устойчивый эксперимент, вероятностная модель, парадокс независимости, кибернетический подход.
Введение
Рассмотрим известную задачу Мостеллера и приведем на содержательном уровне решение аналогичной задачи об экзаменах с целью решения парадокса независимости Секея [6].
Задача Мостеллера. Чтобы подбодрить сына, делающего успехи в игре в теннис, отец обещает ему приз, если сын выиграет подряд по крайней мере две теннисные партии против своего отца и клубного чемпиона. Чемпион играет лучше отца. Сын выигрывает у чемпиона с вероятностью р и у отца - с вероятностью q > p. Предполагается, что выигрыши сына независимы в совокупности. Сын имеет право выбрать один из двух вариантов очерёдности игры: 1) чемпион, затем отец и снова чемпион; 2) отец, затем чемпион и снова отец. Какой вариант поведения следует выбрать сыну с точки зрения получения приза?
Чтобы проверить адекватность основных выводов решения задачи Мостеллера [7], необходимо практически большое число раз реализовать теннисную игру сына с отцом и чемпионом. Очевидно, что этот эксперимент не представляется легко осуществимым. Поэтому вместо теннисной игры далее рассмотрим совершенно аналогичный эксперимент, который автор этой работы имел возможность многократно проводить при приёме экзаменов по теории вероятностей и математической статистике на различных факультетах Нижегородского гос-университета им. Н.И. Лобачевского.
Задача об экзаменах. Студенты сдают экзамен по теории вероятностей и математической статистике, каждый из которых должен обязательно ответить по билету только на три вопроса раздельно профессору и ассистенту. Студенты заранее знают, что вопросы первый и третий являются теоретическими, а второй вопрос заключается в решении практической задачи. Студент сдаёт экзамен, если он два раза подряд положительно отвечает на вопросы. Профессору студент отвечает положительно на любой вопрос с вероятностью p и ассистенту - с вероятностью q. При этом естественно предположить, что студенту легче ответить на вопрос ассистенту, т. е. имеет место неравенство p < q. Студенту предлагается выбрать один из двух вариантов поведения в последовательности ответов. Первый вариант поведения заключается в том, что сначала студент отвечает профессору, затем - ассистенту и, наконец, снова - профессору. При втором варианте поведения на первый вопрос студент отвечает ассистенту, на второй вопрос - профессору, и на последний вопрос - ассистенту. Рассмотрим неформальное решение этой удивительной и поучительной задачи, которое было предложено в работах [6, 7].
Пусть события Л\, Л2 и Л3 означают, что на первый вопрос студент положительно ответил профессору, на второй вопрос - ассистенту и на третий вопрос - опять профессору. Обозначим через Л событие, которое означает, что студент сдаст экзамен при первом варианте его поведения. Аналогичные события введём, если сту-
дент выбрал второй вариант поведения. Пусть события Бі, Б2 и Бз заключаются в том, что на первый вопрос студент положительно ответил ассистенту, на второй вопрос - профессору и на третий вопрос - снова ассистенту. Обозначим через Б событие, которое состоит в том, что студент сдаст экзамен при втором варианте его поведения. Для событий А и Б находим следующие равенства: А = (Аі1А2) и (А21Аз), Б = (Б11В2) и (В21Б3). Обозначим через Г1(^) вероятность для первого варианта поведения студента и через Г2(^) вероятность второго варианта его поведения. Тогда при независимых в совокупности положительных ответах студента преподавателям имеем равенство Гі(А) = Гі((Аі 1А2) и (А21 Аз)) = Гі(Аі 1А2) +
+ Гі(А21 Аз) - Гі(Аі 1А21 Аз) = рц + цр -рдр, если он выбрал первый вариант поведения, и имеем соотношение
Г2(Б) = Г2((Бі 1Б2) и (Б21 Бз)) = Г2(Бі 1Б2) +
+ Г2(Б21 Бз) - Г2(Бі 1Б21 Бз) = цр + рц - црц, если он выбрал второй вариант. Отсюда Гі(А) > Г2(Б) при ц >р.
Итак, студентам целесообразно пользоваться первым вариантом поведения. Мостеллер в книге [7] этот вывод объясняет тем, что если студент не решил практическую задачу, то он в любом случае не сдаёт экзамен, тем самым подчёркивается важность для студента умения решать практические задачи. Другими словами, соотношение вида Гі(А2) = ц > Г2(Б2) = р имеет большее значение для сдачи экзамена, чем трудности два раза отвечать профессору при первом варианте поведения студента. Напротив, Секей в книге [6] говорит о том, что полученное решение этой задачи и выводы существенно опирались на факт независимости в совокупности событий Аі, А2 и Аз относительно вероятности Гі(^) и на факт независимости в совокупности событий Бі, Б2 и Бз относительно вероятности Г2(^). Статистические наблюдения показы-
вают, что студенты, которые в течение 19671992 гг. сдавали экзамены, в основном выбирали первый вариант поведения. Однако после 1992 года студенты всё чаще выбирают более разумный на их взгляд второй вариант поведения, так как в этом случае приходится отвечать два раза ассистенту и один раз профессору. Чтобы объяснить такое поведение студентов, сначала в следующем разделе в предположении независимости в совокупности ответов приведём формальное решение задачи об экзаменах, используя для этого традиционный подход с позиции «черного ящика» в изучении статистически устойчивых экспериментов с управлением [3].
Решение задачи Мостеллера с позиции модели «чёрного ящика»
Известно [2, 3], что одним из основных предметов теории вероятностей является построение адекватной вероятностной модели (О, 3, ГгО) статистически устойчивого случайного эксперимента Жг с управлением г из некоторого множества Л. Произвольный элемент ю из множества О определяет с помощью некоторого языка описание так называемого элементарного исхода эксперимента Жг. Подмножество 3 априори заданного множества всех допустимых исходов является ст-алгеброй и содержит все наблюдаемые исходы В с О эксперимента Жг. Наконец, вероятностная функция ^С): 3 ^ [0,1] задается на ст-алгебре 3 и зависит от выбранного управления г е Л. Если используется подход «черного ящика», то Жг представляется в виде объекта управления Ег и системы управления Сг. В этом случае предполагается, что в результате проведения и наблюдения элементарного исхода каждого из экспериментов Ег и Сг однозначно по некоторому закону определяется элементарный исход эксперимента Жг. Поэтому эксперимент Жг есть
Рис. 1. Модель без канала обратной связи для эксперимента об экзаменах
упорядоченная пара (Ег, Сг), и будем это записывать в таком виде Жг = (Ег, Сг).
Пусть теперь для задачи об экзаменах объект управления Ег есть последовательные ответы студента преподавателям на три вопроса, а система управления Сг означает выбор студентом одного из двух вариантов поведения (управления). Здесь соотношение г = 1 естественно означает выбор первого варианта управления, и равенство г = 2 означает выбор второго варианта поведения. Отсюда следует, что множество Л = {1, 2}. Эта ситуация отображена на рис. 1.
Заметим, что в этой задаче результаты объекта управления Ег не влияют на результаты системы управления Сг. Тогда предложенное в предыдущем разделе неформальное решение Мостеллером задачи об экзаменах фактически основано на представлении эксперимента Жг в виде управляющей системы (Ег, Сг) без канала обратной связи. На этом рисунке величины фг(ю) и фг(ю) измеряют элементарный исход эксперимента Жг с точки зрения объекта управления Ег и соответственно с точки зрения системы управления Сг. При этом значение случайной величины фг(ю) равно единице, если студент сдал экзамен, и равно нулю - в противном случае, а значение величины уг(ю) тождественно равно выбранному управлению г. В качестве математической модели эксперимента Жг можно предложить основное вероятностное пространство (О, 3, Рг(-)). Здесь достоверное событие О = {ю = (иь и2, и3): щ, и2, и3 = 0, 1}. Поэтому множество наблюдаемых событий можно представить в виде: 3 = {В: В с О}. Для заданного значения I = 1, 2, 3 полагаем и = 1, если студент положительно ответил на г-й вопрос. В противном случае принимаем и = 0. Например, элементарное событие {(1, 1, 1)} е 3 означает, что студент положительно ответил на все три вопроса, а элементарное событие {(0, 0, 1)} е 3 заключается в том, что студент положительно ответил только на третий вопрос. Если случайное событие Л означает, что студент сдаст экзамен, то Л = {(1, 1, 0), (0, 1, 1), (1, 1, 1)}. В силу независимости в совокупности ответов студента преподавателям легко найдем вероятность вида РГ(Л) = Рг({(1, 1, 0)}) + Рг({(0, 1, 1)}) +
+ рг({(1, 1 1)}) = (2 - - р) + pq(2 - q).
Так как фг(ю) - индикатор случайного события Л (сдачи студентом экзамена при управлении г), то математическое ожидание Мгфг(ю) = = (2 - r)pq(q - p) + pq(2 - q). Из условия оптимальности Мг’фг’(ю) = 8ир{Мгфг(ю): г е Л} получим, что оптимальное управление г' = 1.
Другими словами, студент должен выбирать первый вариант поведения с точки зрения наиболее успешной сдачи экзамена.
Случайные эксперименты с управлением
с позиции кибернетической управляющей системы
Приведенный в предыдущем разделе подход фактически основан на формальном описании связи между входом уг(ю) и выходом фг(ю) объекта управления Ег. Эта связь задается формулой
рг({ю:фг(ю) = 1}) = (2 - - p) + pq(2 - q),
которая определяет распределение случайной величины фг(ю): О ^{0, 1}. Иначе говоря, этот подход изучает статически устойчивый эксперимент Жг = (Ег, Сг) с управлением г е Л с позиции «черного ящика», как это обычно делается в известных задачах автоматического регулирования. Основной недостаток этого подхода заключается в том, что случайные величины уг(ю) и фг(ю) на самом деле являются всего лишь удобной математической моделью измерителей входа и соответственно выхода объекта управления Ег, а не вероятностной моделью статистически устойчивого эксперимента Жг в целом. Поэтому простой и доступный по структуре принцип «черного ящика» не требует детального изучения строения эксперимента Жг, и, значит, не позволяет в полной мере одновременно учитывать как детерминированную, так и вероятностную природу эксперимента Жг.
В связи с указанными недостатками в работах [2-5] разрабатывается кибернетический подход к построению, анализу, синтезу и оптимизации моделей управляющих систем или статистически устойчивых экспериментов с управлением, которые в общем случае могут функционировать в случайных и неопределённых условиях. При изучении реальной системы всегда возникают трудные вопросы эффективного способа описания и методов изучения с подробным учётом её конкретной физической природы и цели функционирования. В силу этого на реальную систему целесообразно смотреть не с позиции «черного ящика», а с точки зрения её общих фундаментальных свойств и методологического понятия управляющей системы, впервые данного в математической кибернетике [1]. Эта точка зрения по существу была поддержана и последовательно развивалась в работах [2-5]. В основе кибернетического подхода при построении, анализе и оптимизации модели управляющей системы лежат основные положения [1-5]:
• любая управляющая система обладает фундаментальными свойствами: схемой, информацией, координатами и функцией;
• принцип дискретности актов функционирования управляющей системы во времени х;, г > 0, где так называемый стробирующий точечный процесс вида {х;; г > 0} задает на [0, да) шкалу тактов времени;
• принцип нелокальности в математическом описании (кодировании) всех блоков строения схемы управляющей системы;
• принцип совместного рассмотрения блочного строения схемы управляющей системы и её функционирования во времени х;, г > 0 на этапе построения математической модели.
При таком нетрадиционном подходе построение вероятностной модели управляющей системы в общем случае включает следующие основные этапы:
- выделение схемы, информации, координат и функции системы;
- определение для схемы её так называемых структурных блоков: внешней среды, входных полюсов, внешней памяти, устройства по переработке информации внешней памяти, внутренней памяти, устройства по переработке информации внутренней памяти и, наконец, выходных полюсов;
- задание алгоритмов управления изменениями состояний структурных блоков схемы (например, внешней памяти, внутренней памяти и т.д.);
- проведение кодирования информации или нелокальное описание структурных блоков схемы;
- выявление существенных функциональных и статистических связей между блоками схемы.
- выбор основных исходных и искомых характеристик системы;
- решение задач анализа, синтеза, эволюции, надежности и оптимизации управляющей системы.
В следующем разделе с целью демонстрации эффективности кибернетического подхода [1-5] рассмотрим решение парадокса независимости [6] в известной задаче Мостеллера [7].
Задача Мостеллера как управляющая кибернетическая система
Общее понятие управляющей системы [1-3] целесообразно использовать для построения и изучения модели реального случайного эксперимента Жг, связанного с приёмом экзаменов. Покажем, что задача Мостеллера или задача об экзаменах может быть адекватно отображена посредством управляющей системы, общая схема которой приведена на рис. 2.
При этом рассмотрим общий случай этой задачи, когда не предполагается независимость в совокупности трех последовательных ответов студента на вопросы для любой стратегии его поведения.
Обозначим на оси времени через т0 момент получения студентом выбранного им экзаменационного билета с тремя вопросами и объявления первого варианта поведения с вероятностью г є [0, 1] или второго варианта с вероятностью 1 - г. Пусть X/ есть момент завершения ответа студентом на г-й вопрос, где і = 1, 2, 3. Выясним на чисто содержательном уровне неформальный смысл структурных блоков схемы управляющей системы, соответствующей задаче об экзаменах.
1) Процессы формирования внешней среды занимают значительное время и являются консервативными. Внешняя среда представляет собой условия и обстановку перед экзаменом, которые навязывают студенту на интуитивном уровне случайно выбрать конкретный вариант поведения в последовательности ответов из двух возможных. Отсюда вытекает, что внешняя среда имеет два следующих состояния: а) профессор - ассистент - профессор (йі); б) ассистент - профессор - ассистент (й2). Будем считать, что внешняя среда в некоторый момент т0 принимает значение Ьі с вероятностью г є [0, 1]
Рис. 2. Схема управляющей системы для задачи об экзаменах
и значение Ь2 с вероятностью 1 - г. Другими словами, студент выбирает план ответов вида профессор - ассистент - профессор с вероятностью г и стратегию ответов вида ассистент -профессор - ассистент с вероятностью 1 - г. Информация внешней среды есть множество {профессор - ассистент - профессор, ассистент
- профессор - ассистент} = {Ьі, Ь2} из двух состояний внешней среды. Координаты внешней среды - номера 1, 2 её состояний Ьі и Ъ2. Состояние внешней среды в момент тг есть случайный элемент Хг = Хо при і = 0, 1, 2, 3. Код информации внешней среды есть случайный вектор Х = (Хо, Хі, Х2, Хз). При этом распределение вероятностей Р(х0 = Ьі) = г, Р(х0 = Ъ2) =1 - г случайного элемента Хо определяет следующий граф переходов состояний внешней среды:
> ъх—> ьі
ь'-^ о
2) Входной полюс означает получение студентом в момент т0 три последовательных вопроса ві, в2 и вз экзаменационного билета. Информация входного полюса есть множество {(ві, в2, вз)} из единственного состояния (ві, в2, вз) входного полюса. Вектор аг = (ві, в2, вз) определяет состояние входного полюса в момент тг, где і = 0, 1, 2, 3. Код информации входного полюса есть вектор (а0, аі, а2, аз) с равными компонентами. Поэтому граф переходов состояний входного полюса можно представить в следующем виде:
3) Внешняя память фиксирует очередные вопросы, на которые студент должен отвечать. Информация внешней памяти есть множе-ство{(в1, в2, в3), (в2, в3), в3, 0} из четырёх состояний (1\ = (в1, в2, в3), (12 = (в2, в3), (13 = в3 и (14 = 0 внешней памяти. Координаты внешней памяти -номера 1, 2, 3, 4 её состояний ^, й2, й3, й4. Состояние внешней памяти в момент х; есть р; = (11 + 1 при г = 0, 1, 2, 3. Код информации внешней памяти - вектор (р0, р1 , р2 , р3). Отсюда вытекает, что граф переходов состояний внешней памяти можно отобразить в виде:
----> (в1, в2, вз) --> (В2, Вз) -:► в3 ---> 0^
4) Устройство по переработке информации внешней памяти детерминированно удаляет вопросы, на которые студент закончил отвечать и,
тем самым, изменяет номер состояния внешней памяти в последовательности 1, 2, 3 и 4. Информация блока по переработке внешней памяти есть множество {0, ві, (ві, в2), (ві, в2, вз)} из четырёх состояний еі = 0, е2 = ві, ез = (ві, в2) и е4 = (ві, в2, вз) этого блока. Координаты блока по переработке внешней памяти суть номера 1, 2, 3 и 4 состояний еі, е2, ез и е4 этого блока. Состояние блока по переработке внешней памяти в момент тг есть С/ = ег + і, і = 0, 1, 2, 3. Код информации блока по переработке внешней памяти есть вектор (^о, ^ , С2 , Сз), а граф переходов состояний этого блока представляется в виде:
5) Внутренняя память фиксирует как выбранный заранее студентом вариант поведения, так и запоминает последовательность из трёх результатов его ответов преподавателям на три вопроса. Информация блока внутренней памяти есть множество {студент выбрал первую схему ответа (/і), студент выбрал вторую схему ответа (/2), студент ответил на вопрос (/з), студент не ответил на вопрос (/4)} из четырёх состояний /і, /2, / и /4 внутренней памяти. Координаты внутренней памяти суть номера 1, 2, 3 и 4 состояний /ь /2, / и /4. Состояние внутренней памяти в момент тг есть случайный элемент п при і = 0, 1, 2, 3. Здесь по є {/і, /2}, пі є/з, /4}, П2 є {/з, /4}, Пз є / /4}. Код информации внутренней памяти есть случайный вектор п = (п0, Пі, П2, Пз). Напомним, что согласно условиям задачи об экзаменах последовательные ответы студента происходят случайным и, в общем случае, зависимым образом. Эта зависимость при заданном значении є > 0 определяется следующими соотношениями для условных вероятностей случайных элементов по, пі, п2, пз:
р(По = /і) = г, р(Пі = /з I По = /і) = р-,
р(пі = /з 1 по = /2) = q, (1)
Р(П2 = /з 1 по = Уь пі = /з ) = ц + є -є/р >p, (2)
р(п2 = /з 1 по = Уь пі = /4) =
= Р(пз = /з I по = /2, пі = /з, п2 = /4) =
= Р(пз = /з I по = /2, пі = /4, п2 = /4) = ц + є < 1, (3)
р(пз = /з 1 по = А пі = А п2 = /з) = q, (4)
р(п2 = /з 1 по = А пі = /з) =
= р(п2 = /з 1 по = /2, пі = /4) =
= Р(пз = /з I по = /і, пі = /з, п2 = /з) =
= р(пз = /з 1 по = Уь пі = /3, п2 = /4) =
= р(пз = /з 1 по = Уь пі = /4, п2 = /з) =
= р(пз = /з 1 по = Уъ пі = /4, п2 = /4) = р. (5)
Граф переходов состоян ий внутренней памяти
Пз
л
1 - д - є
Используя соотношения (1)-(5) легко отобразить граф переходов состояний блока внутренней памяти.
Поясним на содержательном уровне ограничения (1)-(5) на условные вероятности, которые формализуют зависимость последовательных ответов студента. Ограничение (1) непосредственно следует из случайного механизма выбора последовательности ответов студента и из условий задачи Мостеллера. Условие (2) показывает, что произошло уменьшение вероятности следующего ответа плохо подготовленного студента ассистенту после удачного предыдущего ответа профессору. Это обстоятельство можно проинтерпретировать тем, что у студента часто появляется некоторое психологическое самомнение после удачного ответа профессору. Соотношение (3) означает увеличение на є вероятности следующего ответа плохо подготовленного студента ассистенту после неудачного его предыдущего ответа. Этот факт подтверждается большим числом наблюдений, когда слабо подготовленные студенты стараются более внимательно и ответственно отвечать на очередной вопрос при неудовлетворительном предыдущем ответе. С другой стороны, очень часто на экзаменах преподаватели высокой ква-
лификации используют последнюю возможность обучения плохо подготовленных студентов при их неудачных ответах. Таким способом происходит дополнительное обучение студента высококвалифицированным и опытным преподавателем. Равенство (4) соответствует вполне естественной ситуации, когда ответ студента на третий вопрос не зависит от его положительных ответов на первые два вопроса. Наконец, группа ограничений (5) свидетельствует о том, что профессор оценивает студента более строго и в то же время более объективно по сравнению с ассистентом. Другими словами, оценка студента профессором не зависит от удачных или неудачных его предыдущих ответов. С помощью такого простого алгоритма здесь заложена модель обучения плохо подготовленных студентов на экзаменах. Далее рассмотрим устройство по переработке информации внутренней памяти, которое реализует эту модель обучения на экзаменах плохо подготовленных студентов.
6) Устройство по переработке информации внутренней памяти позволяет по некоторому алгоритму определять условные вероятности очередного положительного ответа студента в зависимости от предыдущих его результатов и реализовывать случайный механизм оценки
ответов на последующие вопросы. Информация блока по переработке внутренней памяти есть множество
{г, (р, ц), (ц + є - є/р, ц + є, р _р),
(р, р, р, р, ц, ц + є, ц + є, ц + є)} из четырёх состояний Яі = г,
й = ^ q),
Яз = (ц + є - є/р, ц + є, р д),
Я4 = (р, р р р ц, ц + є, ц + є, ц + є)
этого блока. Координаты блока по переработке внутренней памяти суть номера 1, 2, 3, 4 состояний £ь я2, яз, я4. Состояние блока в момент тг есть 9г = Яі + і при і = 0, 1, 2, 3. Код информации блока - вектор (9о, 9і, 92, 9з). Поэтому граф переходов состояний этого блока имеет простой вид:
7) Выходной полюс определяет наблюдаемые исходы экзамена студента. Информация блока выходного полюса данного эксперимента есть пространство
П = {ю = (хо, хь Х2, Хз): Хо є /1, /2},
Хі, Х2, Хз є /3, /4}} из 16 состояний
ю1 = (/1, /3, А /3), ю9 = (/2, А /3, /3),
ю2 = (/ъ /3, /3, /4), юіо = А А /3, /4),
ю3 = (/і, /3, /4, УХ ю11 = (/2, /3, /4, /3),
Ю4 = (/1, /з, /4, /4), Юі2 = (/2, /з, /4, /4),
ю5 = (/ъ /4, У, /3), ю13 = (/2, /4, /3, УХ
ю6 = (У, /4, У, /4), ю14 = (/2, /4, /3, /4),
ю7 = (А /4, /4, /3), ю15 = (/2, /4, /4, /3),
Ю8 = (У, /4, /4, /4), Ю16 = (/2, /4, /4, /4)
выходного полюса. Координаты блока выходного полюса суть номера 1, 2, ..., 16 состояний ю1, ю2, ..., ю16. Состояние этого блока в момент тз есть случайный элемент ^, где ^(ю) = ю при ю = (хо, х1, х2, х3) є П. Код информации блока выходного полюса есть случайный вектор ^ = (^о, ^1, ^2, ^з), где ^ (ю) = Х/, і = 0, 1, 2, 3. Используя соотношения (1)-(5) и граф переходов состояний внутренней памяти построим граф появлений состояний выходного полюса:
Вз =
Граф появлений состоя ний выходного полюса
в 1 = С/1 ,Уз,Уз, /з)> Гр(д + Є - є/рР
=С/1,/4, /3/4) С/1,/4, /а,/)'}
= С/1,/з, /з,/4) гр(д + є - е/р)(1 - р
С/1^./3, г^рС 1 - Я - є + є/р)р
/а,/4) г^(1 - Я -є + є/Р')С1-р)
С/1,/4,/з,/з)^ Г(1 - Р)(Я + Є)Р
г(1 - Р)(Я + є)(1 - р г(1 - р)(1 - Я -є)р
> в8 = Сfl,/4,/4,/4) г(1 - р)(1 - Я - є)(1 - р
(1 - г)яря (1 - г)ЯР(1 - Я)
(1 - г)Я(1 - Жя + є)
С/2,/з,/4,У^ (1 - г)я(1 - р)(1 - Я -є)
С/2,/4,/з,/зО (1 - г)(1 - ЯМЯ + є)
Іі^~14 = С/2,/4,/з,(1 - г)(1 - Я)р(1 - Я - є)
С/2,/4,/4,/з) (1 - Г)(1 - Я) (1 - р)(Я + є)
І/2,/4,/4, /4) (1 - Г)(1 - Я) (1 - Р)(1 - Я - є)
х£Г= (/2,/з,//)>
в10 = ^^з^з?
11 = (/2,/з,/4,/з)
На этом рисунке показаны также вероятности появлений тех или иных состояний выходного полюса и символом А отмечены состояния юь ю2, ю5, ю9, ю1о и ю13 выходного полюса, в каждом из которых студент сдал экзамен.
8) Функция проведения и анализа эксперимента Ж, об экзамене заключается в оптимальном выборе студентом одного из двух вариантов поведения и в его ответах на три последовательных вопроса с целью определения объективной оценки преподавателями знаний студента. Окончательный результат экзамена данного студента существенно оказывает влияние на отношение студента к данным экзаменаторам и, значит, в той или иной степени изменяет неконтролируемые условия внешней среды. Итак, для задачи об экзаменах (Мостеллера) выделены схема, информация, координаты и функция.
Результаты работ [2-5] показывают, что кибернетический подход позволяет найти не только функциональные и статистические связи между блоками схемы, но эффективно выбрать основные исходные и искомые характеристики управляющей системы с целью решения задач анализа и оптимизации. Это утверждение имеет место и для задачи Мостеллера. Действительно, за исключением блоков внешней среды, внутренней памяти и выходного полюса, поведение каждого из остальных блоков схемы носит либо детерминированный характер, либо однозначно определяется состоянием других её блоков. Поэтому, наблюдая только случайные состояния блока выходного полюса в момент времени т3, можно восстановить полную картину хода поведения управляющей системы по приёму экзамена. В частности, можно определить все состояния блока выходного полюса, когда студент сдал экзамен. Следовательно, в качестве основной характеристики задачи об экзаменах можно выбрать состояние блока выходного полюса. При этом блок выходного полюса моделирует работу статистически устойчивого эксперимента Ж,, а каждое состояние блока выходного полюса отождествляется с описанием некоторого элементарного исхода эксперимента Ж,. Теперь нетрудно построить вероятностную модель (О, 3, Р,(^)) эксперимента Ж,. Здесь О = {ю1, Юг, — , Ю1б}, 3 = {В: В с О} = {В1, Вг , ..., В 65536} и вероятностная функция Р,(^)) задается равенствами
Р,({ю1}) = гр(? + е - е/р)р,
Рг({ю2}) = = ГР(? + е - е/Р)(1 - ...,
Рг({ю16}) = (1-г)(1 - ?)(1 -^)(1 - ? - е).
Например, элементарное событие
{юв} = {(/1, /4, /4, /4)} е 3
означает, что студент выбрал первый вариант последовательности ответов и отрицательно ответил на все три вопроса. При этом
Рг({ю8}) = г(1 -^)(1 - ? - е)(1 -Д).
Построенная вероятностная модель (О, 3, Р,(^)) эксперимента Ж, позволяет выписать функциональную связь между блоком внешней среды и выходным полюсом в виде равенств:
Хо(ю1) = Хо(юг) = = Хо(юв) = ¿1,
Хо(ю9) = Хо(юю) = ... = Хо(ю1б) = ¿г.
Аналогично найдём функциональную связь между внутренней памятью и выходным полюсом. Например, функциональная связь между внутренней памятью в моменты т3 и выходным полюсом задается равенством п3(ю^) = /3 при нечетном значении я. Приведенные здесь и остальные функциональные связи являются на самом деле поточечным заданием случайных элементов х(ю), п(ю) и ^(ю). Поэтому их законы распределения и связанные с этими случайными элементами условные вероятности могут быть найдены. Например, условная вероятность
Р,(Пг = Уз I По = /1) =
= (Р,(По = /l, Пг = /з)/Р,(Ло = /1) =
= (Р,({ю1}) + Р,({юг}) + Р,({ю5}) + Р,({юб}))/г = =^(? + е -е/р + (1 - ^)(? + е) = ?.
Однако условная вероятность
Рг(Пз = Уз 1 По = /г) =
= (Р,(По = /г, Пз = /з)/Р,(По = /г) =
= (Рг({ю9}) + Рг({ Ю11 }) + Рг({ю13 })+
+ Р,({Ю15}))/(1-г) = ? + е(1 - ^?) > ?.
Следовательно, произошло обучение плохо подготовленного студента на экзаменах.
Пусть случайное событие
А = {Ю1, Юг, Ю5, Ю9, Юю Ю13} означает, что студент сдал экзамен. Тогда
Р,(А) = Р,({Ю1) + Р,({юг}) + Р,({Ю5}) + Р,({Ю9}) + + Р,({Ю1о}) + Р,({Ю1з}) = г[р?(? -р) -
- е(1 + р2 - р - .р?)] + ?р(2 - ?) + .Ре(1 - ?).
Математическая формулировка задачи оптимизации для эксперимента Ж, заключается в определении такого значения г' е [0, 1], для которого выполняется условие оптимальности:
Р, (А) = йир{ Р, (А): 0 < г < 1}.
Определение оптимального поведения студента
При определении оптимальной стратегии выбора последовательности ответов в задаче Мостеллера с обучением необходимо, прежде всего, учитывать естественные ограничения
0 < p, q < 1, q > p, е > 0, q + s < 1, q + s - z/p > p на параметры p и q, которые определяют уровень подготовки студента, и на параметр обучения е. Рассмотрим всевозможные случаи изменения параметров p, q и s в пределах указанных ограничений.
1. Пусть выполняется неравенство
q > (p - 0.5)2 + 0.75.
Тогда имеем соотношение
1 - q < p(q - p)(1 - p)~l < pq(q - p)(1 + p2 - p - pqT1-
Если теперь 0 < е < 1 - q, то q + е -s/p > p и pq(q - p) - s(1 + p2 - p - pq) > 0. Так как вероятность
Pr(A) = r[pq(q -p) - s(1 + p2 -p -pq)] +
+ qp(2 - q) + M1 - q),
то оптимальный план r' = 1.
2. Если имеет место
q < (p - 0.5)2 + 0.75, то
q>(p- 0.5)2 +0.75; 0<е< 1 -q;r'
Ч
N
0.75- ^ о-
/ * — 1
0 0.5 1 р
q<(p- 0.5)2 + 0.75; e=pq(q-p)(l+p2-p- pq)-u, 0 £ г'<, 1
рч(ч - р)(1 + р2 - р - рч) 1 < р(ч-р)(1 - р) 1 < 1 - ч-
Здесь следует выделить три возможности, которые определяются значениями параметра обучения 8.
- Пусть 0 < 8 < рч(ч - р)(1 + р2 - р - рч)1, то рч(Ч - р) - 8(1 + р - р - рч) > 0 и ч + 8 < 1, Ч + 8 - 8/р > р. Следовательно, оптимальная стратегия г' = 1.
- При 8 = рч(ч - р)(1 + р2 - р - рч)-1 выполняются соотношения
рч(ч - р) - 8(1 + р - р - рч) = 0, ч + 8 < 1, ч + 8 - 8/р > р и, значит, оптимальный порядок г' можно выбрать в промежутке 0 < г' < 1.
- Наконец, если рч(ч - р)(1 + р2 - р - рч)1 <
< 8 < р(ч - р)(1 - р)~1, то справедливы неравенства рч(ч - р) - 8(1 + р - р - рч) < 0, ч + 8 - 8/р > р, ч + 8 < 1. Значит, оптимальный план г’ = 0, и студент выбирает второй порядок ответов.
На следующих рисунках приведены заштрихованные области значений параметров р, ч и промежутки изменения параметра 8, в которых следует применять оптимальный план последовательности ответов студента на экзамене.
0.5)2 + 0.75; 0 < е <pq(q-р){\ + р2 —р -pq) x',r’ = 1
q<(p- 0.5)2 +0.75; pq(q - р)(1 + р2 - р - pq) 1 < <£<p(q-p)(l-p)-1; <-’ = 0
Эти области соответствует случаю, когда слабо подготовленным студентам при их ответах преподавателям целесообразно пользоваться первым или вторым вариантом поведения в зависимости от значений параметров р и ч, отвечающих за подготовку к экзаменам, и параметра обучения 8.
Как следствие из предыдущих рассуждений получаем, что при 8 = 0 следует применять только первый вариант поведения при (р, ч) £ {(р, ч): 0 < р, ч < 1, ч > >р}. Заметим, что оптимальный план задачи Мостеллера при 8 = 0 совпадает с решением этой задачи из работ [6, 7]. Приведём теперь решение известного парадокса о независимости [7].
Итак, совет использовать только первый вариант поведения, который даётся в книгах [6,
7], не является всегда верным. В этих книгах ключевым фактом в рассуждениях является важность правильного ответа на второй вопрос. Действительно, только в этом случае студент будет иметь возможность подряд два правильных ответа и может сдать экзамен. Другими словами, большая вероятность ответить на второй вопрос ассистенту якобы всегда играет более существенную роль, чем меньшее число ответов профессору. Однако исследования этой задачи с помощью кибернетического подхода, многочисленные опросы студентов и сами экзамены показывают, что применение первого или второго варианта поведения существенно зависит от подготовки и обучаемости на экзаменах студентов. Так для отлично подготовленных студентов, правильные ответы которых, скорее всего, будут независимыми случайными
событиями (е = 0) или удовлетворяют условию q > (p - 0.5) + 0.75, целесообразно пользоваться первым вариантом поведения. Напротив, для плохо подготовленных студентов и при хорошей их обучаемости, когда 0 < p, q < 1, q > p, q < (p - 0.5)2 + 0.75 и pq(q - p)(1 + p2 - p - pq)-1 <
< е < p(q - p)(1 - p)~l, целесообразно применять второй вариант поведения. Такая ситуация, по-видимому, сложилась после 1992 года не только в Нижегородском госуниверситете.
Список литературы
1. Ляпунов А.А., Яблонский С.В. Теоретические проблемы кибернетики // Проблемы кибернетики. М.: Физматгиз, 1963. Вып. 9. С. 5-22.
2. Федоткин М.А. Процессы обслуживания и управляющие системы // Математические вопросы кибернетики. М.: Наука, 1996. Вып. 6. С. 51-70.
3. Федоткин М.А. Нелокальный способ задания управляемых случайных процессов // Математические вопросы кибернетики. М.: Наука, 1998. Вып. 7. С. 332-344.
4. Пройдакова Е.В., Федоткин М.А. Управление выходными потоками в системе с циклическим обслуживанием и переналадками // Автоматика и телемеханика. 2008. № 6. С. 96-106.
5. Федоткин М.А., Федоткин А.М. Анализ и оптимизация выходных процессов при циклическом управлении конфликтными транспортными потоками Гнеденко-Коваленко // Автоматика и телемеханика. 2009. № 12. С. 92-108.
6. Секей Г. Парадоксы в теории вероятностей и математической статистике. М.: Мир, 1990. 240 с.
7. Мостеллер Ф. Пятьдесят занимательных вероятностных задач с решениями. М.: Наука, 1985. 88 с.
CONTROL SYSTEMS AND THE SOLUTION TO THE PARADOX OF INDEPENDENCE
M.A. Fedotkin
The construction of adequate mathematical models of real control systems is the primary goal of control theory. At present, system modeling and simulation is mainly covered by two approaches. The first approach considers the system as a «black box» and presents the system in the form of its constituent elements (the control object and the control system). A cybernetic approach to the construction, analysis and optimization of control system models operating under uncertain conditions was first proposed in [1-5]. In this paper, the feasibility of this approach is justified by the solution of the well-known paradox of independence (Gabor J. Székely [6]).
Keywords: statistically steady experiment, probabilistic model, paradox of independence, cybernetic approach.