Научная статья на тему 'Адаптация в автоматных системах управления'

Адаптация в автоматных системах управления Текст научной статьи по специальности «Математика»

CC BY
107
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Адаптация в автоматных системах управления»

n(1 - z1) при pa < pxp,

A = \

n

(10)

пРи pa > pxP ,

где

Pr = 0,00896 + ЩШ

f(n) = 0,5615exp

[0,5 772 + Inn 2n

где

n — Rr i--- i+—

z{ = 2--------, R = ln(pas2rn), r = (1,7811n) 2n,

2nE -1

E

1 7811R -1 + —

E = ln( 1, 7811n), y} =

Анализ проведенных исследований позволяет сделать следующие выводы:

- определение значения рКр является первым этапом оценки допустимого значения нагрузки A и позволяет указать одну из границ диапазона изменения A. Если задаваемое значение pa меньше (больше) рКр, величина A будет меньше (больше) П. Это и есть ориентировочная оценка A;

- исследования расчетов подтвердило целесообразность исследования нагрузки при вероятности потерь от 0,01 до 0,05. Сравнительно небольшое возрастание нагрузки приводит к резкому росту вероятности отказа, т.е. к ухудшению качества обслуживания.

В связи с этим приближенные соотношения, полученные в результате моделирования, представляют собой практический интерес и позволяют определить абонентскую нагрузку с заданной вероятностью отказа при заданном качестве связи.

Таким образом, полученная модель СМО и метод расчета нагрузки позволят операторам сотовых сетей прогнозировать распределение нагрузки в пределах зоны действия базовой станции.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Мобильные системы 1997. №3.

2. Lee W.C. Y. Mobile cellular telecommunications systems. - Howard W. Sam’s & Co., 1989.

3. Masaharu Hata. Empirical formula for propagation loss in land mobile radio services// IEE Tr. VT-29. 1980.- №3.- P. 317-144.

4. Лившиц Б.С., Пшеничников А.П., Харкевич А.Д. Теория телетрафика .-- М.: Связь, 1979. - 224 с.

Мажди Насраллах

АДАПТАЦИЯ В АВТОМАТНЫХ СИСТЕМАХ УПРАВЛЕНИЯ

Автоматные системы управления являются дискретными системами, для которых определено множество входных параметров X, состояний Z, выходных параметров Y, а также функции переходов и выходов. Применение адаптивных автоматных систем управления эффективно в том случае, когда динамика изменений процессов в управляемом объекте незначительна по сравнению с динамикой адаптационных возможностей адаптивной автоматной системы управления. Определим основные понятия в структуре взаимодействия «объект управления - адаптивная автоматная система управления».

Последовательность элементов (хє{0,1})фазового пространства X

будем задавать в виде вектора х^, t>s, х^ =(Xs+1,....,Xt), s=0,1,2,...,t. Тогда правило эволюции объекта управления опишется уравнением

Хі+^( х1).

Под взаимодействием «объект управления - адаптивная автоматная система управления» понимается, что значения процесса Xt оцениваются и поступают на вход системы управления (СУ), которая по ним находит очередные управления [1].

Зададим на выходе объекту управления (ОУ) вероятностное пространство элементарных событий (П ЧУ,Р), где П- множество выходных параметров, *¥ст-сигма-алгебра измеримых множеств из П P -определённая на П вероятная мера. Зададим измеримое фазовое пространство (Х,т), где т-0 - сигма -алгебра на множестве X. Определим случайную величину £, значения которой представляет собой элементы множества отправления для отображения О^Х.

Случайная величина е(ш) принимает значения из множества О. Множество О разбито на подмножества Оіи О2. Множество Оі содержит положительные реакции на управления, а множество О2 - отрицательные реакции на управления. Случайной величине €(ш) соответствует мера на пространстве X, МР(М)=Р(ш:є(ш) є М).

Значения случайных вел-ичин £(ш) во времени t называются случайными процессами £,.

Система конечномерных распределений задаётся для каждого п>1, причём t1<t2<...<tn. От конечномерных распределений можно перейти к системе условных мер р(М/х*)=Р^+єМ/х*), где каждая функция является распределением вероятностей на X при всех последовательностях Xі, У и каждая функция Pt+1[xtyt] измерима по совокупности (ХУ), т.е. на пространстве УаУ.

Управляемым случайным процессом назовём класс случайных необрывающихся процессов на (О,,%), определяющих значение элементов последовательностей Xі в фазовом пространстве (X,m) и характеризуемых семейством управляемых условных вероятностей Рі+1(/х(, У).

В классе случайных процессов t>1, образующих

управляемый случайный процесс, содержится бесконечное множество элементов. Чтобы выделить из этого класса какой- либо один процесс, надо назначить способ выбора действия у (управления) в каждый момент времени. Правило выбора действия есть условное распределение

Рф/Х, у-1), Ыетт, >1.

Пусть 0={Р(, t>1} - совокупность правил выбора действий, которую назовём стратегией управляемого случайного процесса в КПДИ. Каждая стратегия будет выделять конкретный случайный процесс из класса{£(ш)}. Стационарные стратегии образованы из одинаковых правил, т. е.

^ = Г(,[х‘, Лу, 1к),

где ! - глубина памяти стратегии; Ft - правило выбора управления в такте времени t. Стационарные (или программные) стратегии заключаются в повторении одного действия ух^уеУ.

Зададим функционал в виде №=№(х*,/1). При программной стратегии <У={1}, где f(t)=yt- определённое в момент времени 1 действие, математическое ожидание функционала определяется [2]

Е^+1=ЩУ)= Фь................................, х, уо,у1,.,у)р(с1х+1/^У)х

>р(ск(/ХМ,У-1)...(с1Х2/Х1,Уо,У1)р(с1Х1/уо).

Если Хts{0,1}, то измерять функционал можно, например, числом нулей в последовательности хК Значение функционала щ есть функция на , и целью управления является минимизация выигрыша. Если определить выигрыш

Ж = 1шЖ(Т)Ж(,) = т/Ъа(,) ,

, а(,)

то цель управления состоит в решении задачи синтеза стратегии, которой будет выполняться неравенство (цель управления в сильном смысле)

1 ,

— < Ж - £, £> 0 .

, 3=1

Определим модель адаптивной системы передачи информации. Сформулируем общие понятия адаптивной системы управления.

В качестве данных объекта исследования рассматривается некоторый класс К. Задаётся множество ^ = {а.}, . = Т,5допустимых стратегий

управления для всех процессов из К. Множество ^ порождает

соответствующие вероятностные меры на пространстве элементарных событий.

Пусть считается известной допустимая цель управления для всякой ( £,щ) е К х Ф. Наложим ограничения на формулировку цели управления в терминах математических ожиданий функционалов из Ф, причём математические ожидания конечны.

Известно [1] "информационное" определение, которое определяет адаптивную систему управления как стратегию, которая приводит к цели управления для всякой пары ( £,щ) е К х Ф за конечное время.

В основе определения адаптивной системы управления лежат понятия обучаемых систем.

Элементарной управляющей системой и адаптивной системы управления со стационарной стратегией называется объект

и=(Х, Р, У),

где X - фазовое пространство управляемого случайного процесса , У — пространство управления, Р - правило управления, причём

Р - вероятностное отображение, т. е.

У=Р(Х1хУи), где I - некоторое целое число (глубина памяти), или

у=РХ-!+1,...,хь уы+1,...,ум).

Совокупность всех допустимых правил управления определим множеством й1, которое задаётся в виде условных распределений на У, т.е. Р(Ы/х',у1 _) .Определим универсальное множество правил

о.= и А.

I

Допустимые (выбранные) правила для рассматриваемых стратегий определим как непустое подмножество Б с Бт .Очевидно, что О

соответствует множеству и элементарных управляющих систем, т.е.

(и/ си~) <-> {и/ = (Х,Г,У), FеБ},

или и = (Х,Б,У).

На управляемом случайном процессе задаются т>1 функционалов, т.е. известно измеримое отображение %: X1 х У ^ Яш, т - мерное эвклидово пространство. Это отображение называют статистикой процесса £1 Пусть Т- отображение Т'.й^й. Тогда Т есть двухпараметрическое

семейство Тд^{, параметрами которого является статистика £\ и время t.

Обучаемой системой называется объект [1] Ь = [и, Т^ ,].

На понятии обучаемой системы построим понятие модели адаптивной автоматной системы управления, которую можно задать и в автоматном виде Ь = (Х,2,У,Т3,), где X и У - множество входных и выходных

сигналов, Z = (¥,Я ,Хдах У ) - множество состояний.

’ \ ’ т ’ /

В обучаемой системе L каждая элементарная управляющая система определяется как и=(Х,Р,У), причём правило управления Р есть вероятностное отображение множества X1 х У1 -Т на У= {у1, у2,.,уы], где у1 - действие, определяемое исходя из кортежа (х\_г,у1-) . Каждая

элементарная управляющая система может быть построена как «стохастическая модель обучаемости» (модель Буша-Мостеллера) [2].

Обучаемая система конструктивно реализуется в виде автоматов с перестраиваемой структурой [3].

Как определено выше, обучаемая система представляет собой автомат А=<Х,Х,У,Пх,Я>, где X — множество состояний, являющееся

счётным, определение которого описано в следующем разделе; Пх

-матрица переходных вероятностей, элементы которой п .(х); д -

функция выходов.

Работа системы управления строится в соответствии с цепью преобразований

....у,_1 ^ х, ^ х ^ р,-т ^ Т^,1 ^р, ^ у, ^...

На вход системы управления как следствие предшествующего управляющего действия у,-т поступает оценка Х1 управляемого случайного

процесса ^. Определяется значение функционала как следствие преобразований £-'Х‘ х У‘ ^ Ям, затем блок оценки функционала

формирует сигнал для преобразования стохастических параметров ^ . , правила ^-1, в соответствии с которым в такте ^1, был выбран

управляющий сигнал у,-т. Пересчитанные вероятности правила Г*-Т засылаются в блок памяти стратегий, затем в соответствии с преобразованием Т^,, из множества стратегий ^ выбирается

очередное правило Г*, в соответствии с которым выбирается действие yt и формирователем сигналов управления формируется управляющий сигнал у(1) в такте управления t. Общая структура системы управления

показана ни рис. 1.

Предположим, что на достаточно большом отрезке времени стохастические распределения, характеризующие выходные параметры ОУ, описываются стационарными распределениями либо стационарность существует на достаточно больших отрезках времени, а на всём рассматриваемом отрезке времени распределения кусочно - стационарны. Тогда на отрезках стационарности параметры на выходе ОУ рассматриваются как однородный процесс с независимыми значениями (ОПНЗ), задаваемый, по определению, управляемой условной вероятностью р(М/у), М е т, уеУ.

Рис. 1

Таким образом, ставится задача построения семейства автоматов, которые в ходе управления не решают задачи оценки ОПНЗ (т.е. не определяют ц(М / у)), но обеспечивают выполнение стратегии управления.

Известно [3],что для построения обучаемых систем применяются асимптотически оптимальные автоматы. Для реализации устройств управления выбором корректирующего кода также можно применить модификации данных автоматов. В общем случае рассмотрим автомат Мура с числом состояний П. В соответствии с известными терминами будем называть сигнал Х1 “поощрением”, а сигнал Х2 -"наказанием” автомата за предшествующее действие. В работе [3] показано, что е -оптимальные семейства конечных вероятностных автоматов обеспечивают е- оптимальность в сильном смысле. Автомат определён набором

А=<Х, I, У, П(п), д(п)>, где Х=(Х1,Х2), У=(у1,у2,.,уп) - множесва входных и выходных сигналов, ПХ(П - функция переходов, задаваемая стохастическими матрицами ПХ1 (п) ПХ (п, д(п) - функция выходов, причём д(п): 1п^У. По свойствам автомата Мура

Iп)=11(п)и12(п)Ы...и1м(п), где 1к(п — множество состояний, соответствующих действию (выходному сигналу Ук). Автомату А(п) сопоставим подавтоматы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ап,к=(Х,1к(п),ук,ПХ(п’к)), к=1,Ы,

каждый из которых имеет один выходной сигнал Ук и функцию переходов Пх(п,к), определённую на подмножестве 1к(п) функцией переходов Пх(пп.

При построении обучаемой системы управления выбором корректирующего кода следует применять ВА 8- оптимального семейства, которые должны удовлетворять следующим свойствам [3].

Предельный средний выигрыш автомата Л(п) равен [3]

Ш(Лы) = £ Ш(ук) <г(П, к=1

где <у[п> - финальная вероятность действия ук, причём

(п) _ Пт ч р(п) т,(г)

к ~г >ш р ’к ■

В работе [3] доказывается 8 - оптимальность семейства Лыт) конечных автоматов, причём ряд доказательств базируется на следующем следствии. Предельные вероятности действий и средние времена

пребывания в подмножестве 2(кМт) связаны следующим уравнением:

^ = Тк/ ]\г1,к = Ты,

к =1

а предельный средний выигрыш автомата определится

Ш(Л) = Х 1¥Тк/£Тк■ к=1 к=1

Рассмотрим доказательство соответствия данного семейства автоматов 8-оптимальности в слабом смысле, воспользовавшись методами теории случайного блуждания.

Изоморфизм всех подавтоматов позволяет остановиться на исследовании среднего времени пребывания в одной из них.

Движение вверх (по уменьшению индекса состояний) происходит с вероятностью прихода сигнала "поощрение" g=(1+W)/2, а вниз (в состояние т) - с вероятностью прихода сигнала "штраф" р=(1 - W)/2.

Обозначим через Тх среднее время пребывания на ветви при условии, что начальным состоянием было 1х( х = 1,т)■ Величина T(m(W) в формуле совпадает по условиям перехода подавтомата с величиной gT1 + рТт■ Пусть известно граничное условие То = 0■ Тогда

gT1 + рТт +1. Определив последовательно 2(0) = 21,22,..,2т, получим

Т2 = gT1 + РТт + 1 = Т1(1 + g),

Т3 = gT2 + РТт + 1 = Т1(1 + g + g2),

Т = gT3 + РТт + 1 = Т1(1 + g + g2 + g3),

Тт-1 = ^т-2 + рТт + 1 = Т 1( 1 + §' + ^ + ■■■ + ^ - ),

Тт = gTm-1 + 1 = Т(1 + g + g2 +■■■ + gm)■

То есть при всех х= -2,...,т получим

Тт = Т £ g• = Т,(1 - й1)/р,

1=0

При х=т получим

Тт = Т>(1 - gm)/p■

Тогда

Тт = (gTm + 1)(1 - gm)/Р или после преобразования получим

Тт = (1 - gm)/Рgm, Т = 1 + рТ/1 - gm)/p = 1/gm■

Определение Тт позволяет выразить искомое среднее время

Т<т>(Ж) = (1/gm-1) + (1 -gm)/gm .

Анализ этого уравнения показывает, что W не может быть равно "+1" или "-1", так как в первом случае возникает поглощающее состояние, а во втором - автомат находится в соответствующем подавтомате лишь один такт.

Значение Тт>{Щ резко возрастает с ростом т, что целесообразно исследовать для практических задач обеспечения достоверности передачи.

Определение Тт>{Щ показывает, что 8- оптимальность

выполняется при произвольных значениях Ж' и Ж". Учитывая предложения по оценке W(Уk) и исходя из выигрыша времени передачи, можно сделать вывод о целесообразности применения данного семейства автоматов для разработки адаптивных автоматных систем управления в условиях недостаточности априорной информации об объекте управления.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Срагович В.Г. Теория адаптивных систем управления. - М.: Наука, 1976.

2. Финаев В.И. Моделирование при проектировании информационно-управляющих систем. - Таганрог: Изд-воТРТУ, - 2004.

3. Варшавский В.И. Коллективное поведение автоматов. - М.: Наука, 1973.

А.А.Афонин, В.В.Ершов ДИНАМИКА ГРУНТОВЫХ ВОД ВОДОХРАНИЛИЩ ЭЛЕКТРОСТАНЦИЙ

Грунтовые воды являются наиболее важным элементом системы водных ресурсов, использующей воду для повседневных нужд населения, промышленности и сельского хозяйства. Управление водными ресурсами предполагает не только обеспечение необходимым количеством воды и высоким ее качеством, но и принятие решений в случае загрязнений ее промышленными и сельскохозяйственными отходами, проседания почвы в районе производственных скважин, а также (для приморских городов, таких, как Таганрог) засоления ее морской водой. Для этого требуется мониторинг, основанный на математических моделях, включающих

i Надоели баннеры? Вы всегда можете отключить рекламу.