Стабилизация 2D-системы итеративного обучающего управления при передаче данных по каналу сети со случайным запаздыванием и потерей пакетов данных

Валов Сергей Александрович

УДК 62.51+681.5.011 ББК Ж 30

СТАБИЛИЗАЦИЯ 2D-СИСТЕМЫ ИТЕРАТИВНОГО ОБУЧАЮЩЕГО УПРАВЛЕНИЯ ПРИ ПЕРЕДАЧЕ ДАННЫХ ПО КАНАЛУ СЕТИ СО СЛУЧАЙНЫМ ЗАПАЗДЫВАНИЕМ И ПОТЕРЕЙ ПАКЕТОВ ДАННЫХ1

Валов С. А.2

(Арзамасский политехнический институт НГТУ им. Р.Е. Алексеева, Арзамас)

В статье рассматривается дискретная 2D-система итерационного обучающего управления, в которой датчик и регулятор обмениваются данными через сетевой канал связи. В ней решается задача стабилизации системы в условиях возможного появления запаздывания передачи данных и потери пакетов данных в сетевом канале. Рассматривается управление на основе вектора состояния и вектора выходного сигнала. Запаздывание и потеря пакета данных моделируются с помощью марковских цепей. Результирующая замкнутая система преобразуется к дискретной 2D-системе Роессера с марковскими переключениями. Для однопакетной передачи данных даются достаточные условия стабилизации системы в терминах линейных матричных неравенств. Приводится численный пример для иллюстрации полученных результатов.

Ключевые слова: итерационное обучающее управление, сетевой канал связи, запаздывание, марковская модель, стохастическая устойчивость, линейные матричные неравенства.

1 Работа выполнена при финансовой поддержке РФФИ, гранты №10-08-00843, №11-01-97025.

2 Сергей Александрович Валов, аспирант (serval_nn@mail.ru).

1. Введение

Большинство современных систем автоматического управления представляют собой технически сложные устройства (например, самолет или ядерный реактор). Они включают в свой состав большое количество подсистем и должны обеспечивать решение комплексных задач. Одной из востребованных в настоящее время задач является построение и реализация алгоритмов управления с итерационным обучением, обеспечивающих достижение системой заданной траектории за конечное время и устойчивость во время повторений в процессе обучения.

Итерационное обучающее управление - это метод управления для систем, работающих в повторяющемся режиме, с требованием, чтобы желаемая траектория прослеживалась с заданной точностью на определенном интервале времени [26]. Итерационное обучающее управление использует информацию с предыдущих итераций для формирования сигнала управления в попытке уменьшить ошибку слежения на следующей итерации. Примерами таких систем являются робот-манипулятор, который должен многократно повторять определенные однотипные действия, процессы серийного производства, химические серийные процессы, системы слежения и т.п. [3, 5, 7, 10, 13].

Итерационное обучающее управление впервые было математически определено Arimoto, Kawamura, Miyazaki в 1984 [5]. С этого момента область итерационного обучающего управления стала предметом интенсивных теоретических и практических научных исследований.

Основы систем итерационного обучающего управления были заложены в цикле статей [5, 6]. Результаты дальнейших исследований представлены в работах [10, 17, 18, 26]. За последние несколько лет была разработана теория линейного и нелинейного, робастного, адаптивного и оптимального итерационного обучающего управления как для непрерывных по времени, так и дискретных систем. Основные результаты по итерационному обучающему управлению представлены в обзорных статьях [3, 9, 19].

В [4, 14] 2,0-теория была применена к итерационному обучающему управлению. Итерационное обучающее управление, рассмотренное в контексте теории повторяющихся процессов, представлено в[22].

В современных промышленных системах такие компоненты, как объект управления, регулятор, датчики и исполнительные элементы сложно расположить в одном месте, поэтому их разделяют и размещают на определенном расстоянии друг от друга. Для связи компонентов такой распределенной системы используют сетевые каналы связи (например, беспроводная сеть). Такие системы называются сетевыми системами управления [23, 32]. В отличие от традиционных систем управления с прямой обратной связью, сетевые системы управления обладают такими преимуществами, как низкая стоимость, простота установки и диагностики, возможность изменения конфигурации, высокая надежность, быстродействие системы; они требуют меньше энергии и обладают меньшим весом [30].

Однако включение сетей связи в контур обратной связи вносит определенные трудности, такие как запаздывание передачи данных, потеря пакетов данных, что приводит к неустойчивости и низкой эффективности [1, 30, 32]. В свою очередь, инженер обладает незначительными ресурсами для использования данной архитектуры и должен учитывать отрицательные моменты, вызванные особенностями сетей связи. Оценка и компенсация запаздывания и потерей пакетов данных - одна из центральных областей исследований сетевых систем управления [24, 28, 29, 31].

Большинство работ по сетевому управлению охватывают только одномерные системы [23, 24, 25, 28]. Новой задачей является синтез управления для двумерной системы итерационного обучения, компоненты которой обмениваются данными через сетевой канал связи, в котором возможны запаздывание передачи пакета данных и его потеря. Данная задача не рассматривалась ранее в литературе и представляет несомненный интерес к изучению, с учетом того факта, что результаты для

одномерных сетевых систем управления трудно применить для анализа двумерных систем, имеющих более сложную динамику.

В [2] были предложены первые варианты моделей систем управления с итерационным обучением и повторяющихся процессов в условиях, когда управление осуществляется через цифровой канал связи с информационными ограничениями.

В данной работе развиваются идеи [2] для двумерной дискретной системы итерационного обучающего управления в условиях, когда данные передаются через сетевой канал связи. Предполагается, что запаздывание и потеря пакета данных возникают только на стороне датчик-регулятор. Такой случай характерен для многих реализаций сетевых систем управления

[29].

Процесс запаздывания передачи данных и потери пакета данных описываются при помощи однородных марковских цепей. При помощи расширения векторов состояния сетевая система итерационного обучающего управления преобразуется к дискретной 2D-системе Роессера с марковскими переключениями. Ставится задача синтеза управления с обратной связью по выходу и вектору состояния совместно, обеспечивающего стохастическую устойчивость результирующей системы.

В данной статье для однопакетной передачи информации даются достаточные условия устойчивости системы в терминах линейных матричных неравенств, а также условия нахождения матриц управления. Приводится численный пример решения задачи стабилизации модели двигателя постоянного тока в условиях управления и передачи данных по сети.

2. Сетевая реализация системы итерационного обучающего управления

Итерационное обучение можно представить как двумерный динамический процесс [14]. Первый процесс отражает динамику системы во времени. Второй процесс отражает динамику итерационного обучения:

х(У +1, k) = Ах(ґ, k) + Ви^, k), у (t, k) = Cx(t, k);

где t - дискретное время; k - номер шага обучения; х е Я" - вектор состояния; у е Яр - выходной вектор;

и е Ят - входной вектор управления и А, В, С - действительные матрицы соответствующей размерности.

В течение обучающего процесса каждая переменная динамической системы может быть выражена как функция двух независимых переменных: времени t и итерации k.

Граничные условия для системы (1) имеют следующий вид:

Алгоритм итерационного обучения состоит в следующем. На каждом шаге обучения все доступные измерению переменные запоминаются и затем используются на следующем шаге для модификации управления и достижения заданной траектории системы. Закон итерационного обучающего управления представляется в виде

где Ли обозначает модификацию сигнала управления; е(^ к) - ошибка на ^й итерации; у() - заданная траектория системы.

Цель итерационного обучающегося управления - уменьшение ошибки от одной итерации к другой, что для двумерной структуры системы формально выражается как

1.1. СЕТЕВАЯ АРХИТЕКТУРА

Рассматривается сетевая система управления с однопакетной передачей информации, которая подразумевает, что данные объединяются в один сетевой пакет и передаются одновременно через дискретные промежутки времени [30]. Такому типу передачи соответствуют сети с пакетом данных большого размера.

(2) х(0, k) = х0, k = 0,1,...,

и(ф = 0, t = 0,1,..., N.

(3) и(^k) = и(^k -1) + Ди^,k -1),

(4) еЦ,k) = уг (0 - у^,k),

(5) Нт||е^, Лг )||= 0.

Л

Например, возможно использование сети Ethernet, один пакет данных которой может содержать до 1500 В [32].

Сетевая архитектура включает датчик, регулятор и исполнительный элемент, которые все подключены через сеть связи и синхронизированы по времени (рис. 1).

еЦ,к) = уг(0- у а,к)

Рис. 1. Сетевая реализация системы итерационного обучения

Влияние квантования сигнала, пакетных очередей и неправильной кодировки в сети связи не рассматривается. Предполагается, что сеть связи находится как на стороне датчик-регулятор, так и на стороне регулятор-исполнительный элемент, однако потеря пакетов данных и появление запаздывания в передачи данных возникает только на стороне датчик-регулятор.

Датчик формирует пакет данных и передает его на регулятор через равные отрезки времени. Регулятор имеет принимающий буфер обмена 1 (рис. 1), который содержит самую последнюю информацию, полученную от датчика. Регулятор считывает данные из буфера периодически через малые периоды времени. Данные буфера обмена 1 обновляются по мере прихода нового пакета данных. Буфер обмена 2 (рис. 1) используется для запоминания управляющегося сигнала на текущей итерации.

Считаем, что вектор состояния системы х(^ к) доступен измерению. Выходной вектор системы у(^ к) определяется из второго уравнения (1). Пакет данных, передаваемый на регуля-

тор для формирования управления, включает вектора х(^ к),

У^, к).

1.2. МОДЕЛИРОВАНИЕ ЗАПАЗДЫВАНИЯ И ПОТЕРИ ПАКЕТА ДАННЫХ

Обозначим щ - запаздывание передачи пакета данных текущей итерации к на стороне датчик-регулятор в дискретный момент времени ґ.

(6) 0 < тік < d, d > 0, d є Z.

Запаздывание щ одинаково действует на величины х(^ к), у(^ к), поступающие на регулятор в одном пакете данных. Модель запаздывания и потери пакета данных строится следующим образом. В случае запаздывания передачи пакета данных (далее по тексту просто запаздывание) информация о пакете с данными у(^ к - щ), х(^ к - щ) будет использована регулятором. Поэтому у(t, к) = у(t, к -щк), х(t, к) = x(t, к -щк). В случае

потери пакета данных регулятор использует информацию с предыдущего шага: у(^к) = у(^к -1), х(^к) = х(^к -1). Модель передачи пакета данных на стороне датчик-регулятор описывается следующим образом:

(7) ^ ^ ^ |х(ґ, к -щк), у(/, к -щк) - пакет успешно передан,

’ ’ ’ [х (¿, к -1),у(/, к -1) - пакет потерян

Данная модель передачи пакета данных позволяет включить потери пакетов данных в модель запаздывания и рассматривать систему с запаздыванием [25].

Регулятор всегда использует самую последнюю информацию из буфера обмена 1. Поэтому, если на шаге к в буфере обмена 1 хранятся данные с предыдущей успешной передачи к - щ и не поступает новых данных с шага к + 1 в дискретный момент времени t (данные потеряны или происходит запаздывание передачи данных по времени), тогда на регулятор поступают данные с шага к - щ, хранимые в буфере обмена 1.

Пример работы сетевой системы с запаздыванием приведен на рис. 2.

Рис. 2. Принцип работы сетевой системы с запаздыванием

Действие запаздывания г,к на сигнал, поступающий на регулятор, описывается как

(8) х(ґ,к) = х(ґ,к — гґк),

(9) у (ґ, к) = у(ґ, к — г (,к).

Как видно из (8)-(9), запаздывание в уравнениях возникает только в области итераций. Такая особенность связана с организацией сетевой архитектуры для рассматриваемой системы. Предполагается, что в буфере обмена 1 регулятора отводится память под данные на каждом дискретном отрезке времени ґ = 0, 1, ..., N. Датчик в дискретный момент времени ґ посылает на регулятор пакет данных, которые прописываются в буфер обмена с отметкой времени по ґ. Таким образом, буфер обмена всегда содержит информацию о траектории системы на всех дискретных отрезках времени, но на разных итерациях, в зависимости от успешности передачи данных. Если в момент времени ґ произошла потеря пакета данных (абсолютная потеря пакета) или пакет данных поступает в буфер обмена регулятора с превышением лимита времени, то данные в памяти буфера с

отметкой времени по t не обновляются. Поэтому из буфера обмена на регулятор поступают необновленные данные с предыдущей итерации (см. рис. 2).

Запаздывание rt¡k моделируем при помощи однородных марковских цепей. Марковская цепь позволяет учитывать зависимости между запаздываниями текущей и предыдущими итерациями [31].

Пусть zt,k - однородные марковские цепи со значениями H = {0, 1, 2, d} и равными матрицами вероятности P = (pij). Вероятность перехода rt,k (переход из состояния i в j) в дискретный момент времени t определяются как

(10) Pij = P(Jt, k+i = j \*t, k = ^,

где Pj > 0, i, j є H, и

d

X Pj = 1 для t = 0, 1, ..., N.

j=o

Структура матрицы вероятности выглядит следующим образом [25]:

Poo P01 0 0 ••• 0

(11) P = P10 P11 P12 0 ••• 0

_ pd 0 pd1 pd 2 pd 3 ••• pdd_

Каждый столбец представляет вероятность перехода из текущего состояния во все остальные. Диагональные элементы представляют вероятность прихода данных с одинаковым запаздыванием. Элементы, расположенные выше диагонали, представляют вероятности больших по времени запаздываний; элементы, расположенные ниже диагонали, указывают на потерю пакета данных или обновление данных.

1.3. РЕЗУЛЬТИРУЮЩАЯ СИСТЕМА С ОБРАТНОЙ СВЯЗЬЮ Ошибка обучения на к-й итерации определяется формулой (4). При наличии запаздывания г,к на стороне датчик-регу-

лятор регулятор использует данные у(,, к) = у(,, к — т,к). Поэтому ошибка обучения, определяемая на регуляторе, есть

(12) ф,к) = уг 0) - y(t,к) = уг(ґ) - у(t,к -тік).

Регулятор периодически вычисляет ошибку обучения на основе данных, которые прописываются в буфере обмена 1. Исходя из того, что в работе регулятора не возникает запаздываний по времени (регулятор не простаивает), то, используя (1) и (12), можно получить:

(13) е(ґ, к + 1) - е(ґ, к) = у(ґ, к - тик) - у(ґ, к +1 - т,,к+1) =

— СА^(і,к — т, к) — СБАи(, — 1,к — тt— к),

(14) ц(ґ, к) = х(, -1, к +1) - х(, -1, к),

(15) ц(ґ, к - т,к) = х(, -1, к +1 - т,-!,к+1) - х(, -1, к - т,-и),

(16) Аи(ґ - ^ к т,-1,к) = и(ґ - 1 к + 1 -тґ-1,к+1) - и(ґ - 1,к — Тґ-1,к) , где сигнал и(ґ - 1, к - тґ-1,к) хранится в буфере 1 как результат предыдущей итерации; и(ґ - 1, к + 1 - т_і,к+і) - управляющей сигнал на следующей итерации.

Из (1) и (3) находим

(17) ц(ґ +1,к) = Ац(ґ,к) + БАи(ґ -1,к).

Приращение управления, связанное с процессом итеративного обучения, формируем на основе векторов ?і(ґ, к), е(ґ, к), с учетом запаздывания:

(18) Аи(ґ -1,к -т,-1,к) = К (т к№,к -т, к) + К(т, к)е(ґ,к -т, к),

где К1(т,к), К2(т,к) - совокупность управлений на основе т,к в момент времени ,.

Приращение управления без учета т,,к выглядит следующим образом:

(19) Аи(ґ -1,к) = К1 (0)^(ґ,к) + К2(0)е(ґ,к).

Уравнения (13) и (17) с учетом (18) и (19) можно переписать в компактную форму:

(20)

7](ґ +1, к)

е(ґ, к +1)

А + БК1 (0) БК2(0) 0 I

П(ґ, к) е(ґ, к)

+

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 0 1 k-га)

+ *

-СА -СВКх(тик) -СВК2(тик)] \ е{г,k -та)

Система (20) представляет 2,0-систему Роессера [20, 21] со случайным запаздыванием т,к. Функции т,к - это однородные марковские процессы на вероятностном пространстве с целочисленными значениями Н = {0, 1, 2, ..., d}.

Граничные условия для системы (20) следуют из (1)-(4) и

(14):

п(1,к) = 0, к = 0,1,...,

(21) ”/

е(^0) = уг ^) - СА х0, t = 1,2,....

Определим следующие расширенные вектора состояний (20):

" Г(,, к) " е(,, к)

(22) г (,, к) = Г(,, к -1) , е (,, к) = е(,, к -1)

Г(,, к - d) е(?, к - d)

Величины г(,, к - т,,к) и е(ґ, к - т,,к) определим следующим образом:

(23) г(,, к — т, к) = ^(т, к )Г(,, к),

(24) е(ґ, к — т, к) = К2(та) е (,, к), где

т.. . [ІЛхИ 0 - °1 т,,к =0,

^1(т, ,к) = ■

(25)

[0 - Іпхп - 0]. т,,к > 0,

(1 + d )блок

к,, 0 - 4 т,к = 0,

(26) КЛт,,‘) № - I,,, - 0І т,,„ > 0.

(1 + d )блок

Все элементы матриц У1(т,,к) и Р2(т,,к) нулевые, за исключением т,,к блока, где он представлен единичной матрицей. Будем рассматривать систему (20) относительно т,,к = 0 и

Ъ,к = 1, 2, d. С учетом (22)-(26) уравнение (20) можно записать в следующем виде:

- для = 0:

(27)

А + ВК1 (0) ВК2(0)

- СА - СВК1(0) I - СВК2(0)

ф, k) е(^ k)

^ +1, k)

е(^ k + 1)

- для т^ = 1, 2, ..., d:

(28) ________________________ __

+1,Л)1 Г А+ВК1(0) ВК2(0) ]Г^Л)'

е^,k+1)_ _-Щ(та)-Щ(т&Шъ) ¥-їїкт^^т#)_ _e(t,V)

где А = diagA,,, А), В = diagB,■■■, В), К1(0) = dia,§(K1(0),, К1(0)) К2(0) = ^(^(0),...,К2(0)), N = Е^, ^(та) = ^(та),

Ччк) = S3V2(тtk), ^2 =[/„х„ 0„х„ ,0„х„ ], ^3 = [^р 0 рхр...~рхр

^ = 1тхт 0 тхт , я = " СА , 0 рхи

_0 тхт _ 0 рхп * * ' 0 рхи

1рх р 0 р х р ■ 0 рхр 0 рх р

1рх р 0 р х р * * * 0 рхр 0 рхр

¥ = 0 рх р 1рх р ■ * * 0 рхр 0 рхр

0 рх р 0 р х р ■ * * 1рх р 0 рхр

Е =

СВ

рхщ

рхт

1 т V 1 1 ~ч 1

Л) = 0 пхн^+1) , V2(Tt,k ) = 0 рх р(й+1)

0 пхп^+1) 0 рх р(й+1)

Система (28) представляет собой дискретную 2Я-систему Роессера марковской структуры (марковская система с переключениями) фиксированного размера и свободную от запаздыва-

0

рхт

ния. Для (28) подразумевается, что матрицы управления К^0) и К2(0) известны.

Обозначим матрицы Ф(0) и Ф(г), вектора состояния системы х(^ к) и х'(^ k) как

" А + ВКД0) ВК2(0) "

- СА - СВК1(0) I - СВК2(0)

" А + ВК1(0) ВК2(0) "

_- Щ(\к) - ^(т,* Д(т( к) ^ )_

г = 1,2, ...,^ .

(29) Ф(0) =

(30) Ф(/) =

n(t, k) x (t, k) , x(t, k) = q(t + 1, k) x1(t +1, k)

e (t, k ) x2(t, k) e(t, k + 1) x2(t, k + 1)

(31) x(t, k) =

Система (28) является стохастической, поэтому для нее необходимо соответствующим образом ввести понятие стохастической устойчивости.

Определение 1. Рассмотрим 2D-cucmeMy (28) с граничными условиями (21), которая удовлетворяет

(32) MХ||x(i +1,0)||? <<х>.

i=0

Тогда будем говорить, что система управления (28) стохастически устойчива, если

II и?

lim M x(t, k) = 0.

t + k

Из определения следует, что:

(33) limM{j| x(t,k) ||}= lim x(t,k) = 0 ,

k ^W

lim n(t, k) = lim n(t, k) = 0,

k ^W e (t, k) k ^W e(t, k)

(35) lim e(t, k) = 0,

k

что является целью итеративного обучающего управления.

3. Основные результаты

Следующая теорема дает достаточные условия стохастической устойчивости для системы (28) в терминах линейных матричных неравенств.

Теорема 1 (достаточные условия устойчивости). Стохастическая система Роессера (28) марковской структуры устойчива, если существуют матрицы Р(г) = diag{P1 Р2(г)} > 0, г = т,к = {1, 2, ..., d}, и выполняются следующие матричные неравенства:

(36) L(i) = Щ)ТРО)Ф(/) - Р(/) < 0,

где Р00 = diagjpl,Ер^О'^,Р = Рт >o, р2(0 = Р2(0Т >0.

Доказательство.

Пусть функция Ляпунова для системы (28) представлена в виде суммы функций Ляпунова по векторам состояний х^, к) и

х2(^ к):

(37) V (х(^ к)) = У1( х1 (t, к)) + У2 (х2 ^, к)), где

«ел У1(Xl(t,к),к) = Xlт(t,к)Р(г^)Xl(t,к),

(38)

У2(x2(t,к),к) = х2 (t,к)Р2(т{к)x2(t,к).

(39) Д У (х^, к)) = М {У1 (х1 Ц +1, к)) + У2 (х2 (t, к +1)) -

- У1(х1^ к)) - У2 (х2 (А к)) ^ } =

= м У1 (х^ +1, к)) + У2 (х2 (?, к +1)) \Т'^ }- [У (Х1 (?, к), т,л = г) +

+ У2( x2(t, к), т( к = г)] =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= Х1Т (? + 1, к)Мр1 (Тг+1,к ) ^(? + 1,к) +

+ х2Т (t, к + 1)М р2 (Т? к+1 )Ц,к = (х2 (t, к + 1) -

- х^, к)Р(та = i)x1T(t, к) - х2Т(^ к)Р,(га = i)x2T(t, к).

(40) М{Р2(т,к+1)\Т(к=г }=]Гру.Р2(7) = Р2(.) для t = 0,1,...,N .

' .=0

(41) AV (x(t, к)) =

x1(t +1, к) T 'P(i) 0 " x1 (t +1, к)

x2(t, к +1) 0 P( j)_ x2(t, к +1)

1 к,) t, x1 T 'P(i) 0 " 1 1 ,t )к 1

1 к,) t, <N 0 1 1 к,) t, <N 1

= xT(t, к )diag{P1(i) P2(i)]x(t, к) - xT(t, к )diag{P1(i) P2(i)}x(t, к) = = xT(t,к)[ф(і)тР(j)O(i) - P(i)]x(t,к) = xT(t,к)L(i)x(t,к).

Для L(i) < 0 из (41) с учетом x(t, к) Ф 0 имеем:

mV (x'(t, к ))| = }- v (x(t, к),

(43)

V (x(t, к ),т к = i)

. . U(L(i)) 1

< - min < — 1 = ß -1.

-я |A(P(i))J ^

(44) ß = 1 - min { (L(i)) 1.

-я [Im (P(i))J

Из (43) и (44) получаем:

MV (x'(t, к ))|т }

(45) ß >—> о.

V V (x(t, к ),тt,k = i)

С учетом (43), 0 < ß < 1. Отсюда

(46) mV(x'(t,к)) | )< ß • M{V(x(t,к),т

=i) xT(t, к)L(i)x(t, к) <

x T(t, к) P(i) x(t, к)

t ,к

= i)}.

M V1 (x (t +1, к)) + V2 (x2 (t, к +1)) |Як= J<

< ß-M{Vj(x(t,к),та = i) + V2(x2(t,к),т к = i)}.

Как и в [27], рассмотрим сумму всевозможных функций V(x(t, к)) на множестве D(r):

(47) D(r) = {(t,к): t + к = r, t > 1, к > 0}.

(48) X M {V (x(t, к ))}=M {V (x (r +1,0))}+M V (x (r,1))}+...

t + kєD(r+1)

... + Mfc(xx(2,r -1))}+Mfc(x(1,r))}+M V2(x2(r +1,0))}+ + M {V2( x2(r,1))} + M {V2( x2(r - 1,2))}+ ... + M {V2( x2(1, r ))} =

і=о

(49) X М {V (х(ґ, k))} = М V (X! (г,0))}+М V (X! (г -1,1))}+...

ґ + kєD(r)

+М{VI(Хі(1,г -1))}+М^(х2(г,0))}+М{V2(х2(г -1,1))}+ . ... + М{V (Х2(1, г -1))} =

= М X [у(х1(г - і, і)) + К,(х1(г - і, і)) \Ту ]

і=о '

і=0

Отсюда

(50) М X |у(х1(г +1 - і; і)) + К,( х1(г +1 - і' і)) 1^ ]<

і=о '

<М Xр [V (х(1, г),Т1Г) + Р2(Х1(г +1,0),тг+1,о)]

і 0

Для г > 0 и последнего неравенства имеем:

г=0 і=0

< (1 + р + . + р* )М{V (х (1,0), х,0) + V (Х2 (1,0), Т10)} +

< (1 + р + . + р* 1 )М{V (Х1 (1,1), ти ) + V (Х2 (2,0), ^2,0 )} +

+...+М{V (х (1,*),х,„) + V (Х2(N +1,0),%+1,0)} <

< (1 + р +... + р* )М X [у(х(1, *),х,*) + V2(x2(N +1,0), т*+1,0)]

г=0

В нашем случае, согласно (21), ^^(1, *)) = 0, N = 0, 1, ....

г=0 і=0

< (1 + р + ... + р* )М XX ^( Х2( N +1,0), т*+1,0)]<

г=0

< (1 + ß +... + ßN)м]Г V (X! (N +1,0)) + V2 (х2 (N +1,0)) |

Г— 0

Из (52) следует, что

(53) £ M £ [xt (r +1 - j, j) P(m) x(r +1 - j, j)] <

r—0 j—0

< (1 + ß + ... + ßN )M £ [x t (r + 1,0)P(h) x(r +1,0)].

Отсюда

(54) £M£ xT(r +1 - j, j)x(r +1 - j, j)

r—0 j—0

N

< «(1 + ß +... + ßN )M Y\x T (r +1,0) x(r +1,0)]

max X (P(m))

где a = jm^H-------> 0 .

min X( P(h))

meH

Nr 2 N 2

(55) XMX||x(r +1 - j, jf <a(1 + ß + ... + ßN)MX||x(r + 1,0)f.

r=0 j=0 r=0

Из (32) и 0 < ß < 1 следует, что правая часть неравенства

(55) ограничена при N ^ да. Поэтому ряд левой части неравенства сходится

r2

(56) M XI|x(r +1 - j, j)|| ^ 0,

j=0

при r ^ да. Переходя к пределу для (56), получаем стохастическую устойчивость системы (28).

Аналогичным образом можно установить достаточные условия устойчивости для системы без учета запаздывания (27).

Теорема 2 (2D-cucmeMa (27) относительно rt,k = 0). Дискретная 2D-cucmeMa Роессера (27) устойчива, если существуют матрицы P(0) = diag{Pi P2(0)} > 0 и выполняются следующие матричные неравенства:

(57) ¿(0) = Ф(0)тР(0)Ф(0) - P(0) < 0,

где Р(0) = diag|р , ]Т Р0;Р2(;)|, р = рт > 0 , Р2(0) = Р,(0)т > 0.

Для вычисления матриц усиления К\(тг,к), K2(тt^), т^к = {1, 2, ..., А}, установлен следующий результат на основании теоремы 1 и преобразовании линейных матричных неравенств (48).

Теорема 3 (нахождение матриц управления К1(г) и К2(г)). Стохастическая система Роессера (28) стохастически устойчива, если существуют симметричные матрицы Х1 > 0, Х2(г) > 0, i = х,к = {1, 2, ..., А}, 2 = diag |Х2(0),..., Х2(А)}> 0 и Р(0, T2(i), такие что выполняются следующие линейные матричные неравенства:

(58) М (^ =

Х 0 [лХ 1 + В1Х1 ]т [- D V1 (і) X1 - т,(і)5,(і)]ТШ (і)

0 -Хз(і) [В!Х!(І)\т [дХДі) - NT¡(I■)S¡(I■)]TW(I■)

< о,

лх1 + В1Х1 В2 X ¡(і) - х1 о

Ш т(і) [- П¥1(і)Х1 - Л/Т1(і)Я1(/)\ Ш т(і) \рх ¡(і) - ЛТ2(і)Я2(і)\ 0 -Х

5 (і)Х = 11 (і)5! (і), Я2 (і)Х2 (і) = Y2 (і^ (і), В = ВКі (0), в2 =Вк2(0),

Ш(і) = (л/р0і,---,л/р7і). *' = 1,-5^ .

Если выполняется (58), тогда матрицы управления К1(і) и К2(і) могут быть вычислены как

(59) К (і) = Ті ОД (і)-1, К2 (і) = Т2 (і^ (і)1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство.

Определим следующие матрицы:

(60) Ш (і) = (Л/р01рх р ,^^л[р~^1рх р ),

(61) Хп = dіag {Р2(0),..., Р2^)}.

Выражение для Р (]) теоремы 1 может быть переписано следующим образом:

(62) Р(;) = dіag|р,¿руР2(;)| = Ш(і) • Хи • Шт(і),

1 0 0

, = 1

0 W (i) 5 n _ 0 ^ _

где Ф(0 =

где W (i) =

В соответствии с (48) теоремы 1, получаем:

(63) фо/¥(і) • гп •¥Т(і)Ф(і) -Р(і) <о,

" А + ВК1(0) ВК2(0)

- Щ(та) - )^(та) Ё - Ж2^ ^(т^)

і = 1, 2, ..., d.

Дополнения Шура [8] для формулы (59) дают следующие линейные матричные неравенства:

(64) М (і) =

-р о [а+Вх]т [-Щ®-Ж^О)]1^)

0 -Р2(і) [В, ]т [ё - Л^(/-)52(/-)] т¥ (і)

А + В Вг - Р 0

¥т(і)[-Щ(і)-Ж^Жо] ¥т(0[ё-Л^К2(/)Х!(г)] 0 -г,-1

Введем матрицы Х1 = Р1-1, Х2(і) = Р2_1(і), и домножим слева и справа неравенство (63) на матрицу diag{Xl, Х2(і), I, I}, получим:

(65) М (і) =

< о

о

AXi + Bxi

о

- X2 (i)

B2X (i)

X 2(¿) - NK2(i)02('

[aX1 + B1X1 ]T [- DV1 (i) X1 - NK1 (i)S1 (i)X1 f W (i) [B2^2 (i)] T [FX2 (i) - ÑK2 (i)S2 (i)X2 (i)] TW (i) - X1 о

W T(i) [- DV1(i)X1 - NK1(i')S1 (i)X1] W T(i)[fX2(i) - NK2(i)S2 (i)X2 (i)] 0 - Z

где Z = diag{X 2(0),..., X 2(d )}.

Для линейных матричных неравенств (65) применим метод, представленный Cesar A.R. Crusius и Alexandre Trofino [11]. Пусть

51 (i)Xi = 7i (i)Si (i), T (i) = Kl (i)Y (i) и

52 (i)X2 (i) = Г2 (i)S2 (i) , T2 (i) = K2 (ОУ2 (i) ,

тогда после несложных преобразований получим окончательные линейные матричные неравенства вида:

(66) M (i) =

- X1 0 [AX1 + B1xJT [- DV1(i)X1 - NT1(i')S1(i)Jw (i)

_ 0_ - X 2(i) \b1X ,(<)]T [FX 2(î) - NT1(i')S1(i)]TW (i)

AX1 + B1X1 B2 X 2(i) - X1 0

w T(i) [- DV1(i)X1 - ÑT1(í)S1(í)] w T(i) [fx^i) - NT^oS^o] 0 - z

< 0

¿1 (і)X1 = 71 (і)¿1 (і) , 52 (і)х2 (і) = 72 (т2 (І) .

Тогда матрицы управления К1(г) и К2(г) определяются как

(67) к (0 = Т од (0-1, к 2 (0 = т2 (/)Y2 (0-1.

Аналогичным образом можно найти матрицы управления К1(0) и К2(0) для системы (27).

Теорема 4 (нахождение матриц управления К1(0) и К2(0)). Дискретная 2D-система Роессера (27) устойчива, если существуют симметричные матрицы Х1 > 0, Х2(0) > 0,

2 = diag{X 2(0),..., X 2(d)} > 0 и Т1(0), Т2(0), такие что выполняются следующие линейные матричные неравенства:

Если выполняется (68), тогда матрицы управления К1 (0) и К 2 (0) могут быть вычислены как:

4. Численный пример

Для иллюстрации работы предлагаемого метода полученные результаты были применены к модели двигателя постоянного тока. Рассматривается двигатель, где ротор работает под действием источника постоянного тока, а величина напряженности магнитного поля на обмотке полюсов переменная [16]. Управление углом вращения двигателя осуществляется при помощи изменения напряжения источника тока, подсоединенного к обмотке полюсов. Двигатель вращает механическую нагрузку (рис. 3).

(68) М (0) =

- Х2(0)

ВТ2(0)

¥т(0)[Х2(0) - СВ32(0)]

0

[АХ1 + В?1(0)Г [-САХ/ -СВТ1(0)]Т№(0) [ВТ2(0)]т [х2(0)-СВВД]т¥(0) < 0

Х1

0

■г

(69) К (0) = Т (0) Х1-1, К2 (0) = Т2 (0) X 2 (0)-1.

Рис. 3. Модель электродвигателя постоянного тока

Для данной модели приводятся уравнения пространства состояний [12]:

(70) х() = Ас(г) + вл>г (Г),

у(г) = Сх(г), г > 0; где х(г) = [Щ w(t) 6(г)], у(г) = 6(г),

R/

А =

/

0 0

-1 0

J

1

, в = 0

0

- -

с = [0 0 1],

где Rf и Lf - сопротивление обмотки полюса и индуктивность; кт - крутящий момент двигателя; J и f - момент инерции механической нагрузки и коэффициент трения соответственно. Также Vf(t), if{t) - напряжение источника тока для обмотки и текущее напряжение в контуре; w(t) и 0г) - частота вращения электродвигателя и угол вращения соответственно.

Для принятой модели необходимо определить приводящее напряжение Vf{t), чтобы выходной сигнал электродвигателя периодически соответствовал заданному сигналу уХО на интервале времени и ошибка обучения с увеличением количества итерации сводилась к нулю.

к

т

1

0

Уравнения состояния электродвигателя можно привести к

дискретной форме, введя период дискретизации Т = 0,01 с и

устанавливая следующие значения параметров модели (70) [12]:

~ ~ ^ -г л п 1 Н • м п _ Н • мс

(71) Rf = 20 Ом ; Lf = 1 Гн ; кт = 100—— ; f = 0,5------— ;

А рад

Н • мс2

J = 2-------; = 12с .

рад

Уравнения состояния в дискретной форме записываются

как

(72)

где

х(і +1, к) = Адх(і, к) + Вди(і, к), у(і, к) = Сдх(і, к), t = 0,1,...,1200, к = 0,1,...;

"0,8187 0 0" "0"

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

АП = 0,4526 0,9975 0 , В0 = 0,0197

0,0023 0,01 1 0,0211

Сд =[0 0 1].

Точная траектория системы (72) показана на рис. 4 и имеет

вид:

(73) у _ ге/ (і) = 10

. , 2ж ж

1 + Бт| — і---

М 2

і

Рис. 4. Точная траектория системы

Исходная система в разомкнутом состоянии неустойчива, вектор ее собственных значений равен [1,000; 0,9976; 0,8187].

Управление и передача данных осуществляется через сеть связи предложенной сетевой архитектуры (рис. 2). Предполагается, что случайное запаздывание гг,к, возникающее в сетевой системе на стороне датчик-регулятор, принимает значения из диапазона т^к = {0, 1, 2, 3}, а матрица вероятностей переходов (переход из состояния 7 в У) в дискретный момент времени г задается следующим образом:

"0,8 0,2 0,0 0,0“

(74) Рг=

0,6 0,3 0,1 0,0

0,5 0,3 0,1 0,1

Тогда

W (0) = [0,8 0,2 0,0 0,0], W (1) = [0,6 0,3 0,1 0,0],

W (2) = [0,5 0,3 0,1 0,1], W (3) = [0,5 0,3 0,1 0,1]. Запаздывание т,,к может увеличиваться не более чем на один шаг и до максимального значения т,,к = 3, а уменьшатся на сколь угодно возможное количество шагов.

Наличие у регулятора принимающего буфера, который содержит последнюю информацию, полученную от датчика, упрощает закон управления, связанный с процессом итерационного обучения для системы с запаздыванием т,,к = {1, 2, 3}.

Приращение управления (17), связанное с процессом итерационного обучения, представляется в виде: для ъ,к = 0:

(75) и(,, к +1) = и(,, к) + КД0)[х(,, к +1) - х(і, к)]+

+ К2 (0)[уг (і, к +1) - у (і, к +1) ].

для ъ,к = 1, 2, ..., d:

(76) и(і, к +1) = и(і, к) + К2 (т,, к )[Уг (і, к +1) - у(і, к +1 - т, л+1)].

Закон управления (75) не учитывает матрицу Кі(т,,к). Значение сигнала управления на первой итерации принималось и(і, 0) = 10, точность сходимости итерационного обу-

чающего процесса eps на каждом дискретном промежутке времени достигает величины eps = 10 .

Линейные матричные неравенства теоремы 3 дают множество решений. Значения матрицы К2(тгк) могут оказаться очень малыми, поэтому сходимость обучающей схемы будет очень медленной. Одним из способов максимизации значений К2(тгк) является минимизация целевой функции для линейных матричных неравенств (58)-(59) [13]:

(77) f (Т2 (072 (7)) = -Т2 (7) + У2 (7)к, 7 = 1,2,3,

где Т2(7) и Г2(0 - матрицы теоремы 3; к - задаваемый положительный скаляр.

При решении линейных матричных неравенств (58)-(59),

(68) для рассматриваемой модели двигателя постоянного тока с принятыми характеристиками сетевой системы, с учетом (77) и к = 0,01, были получены соответствующие матрицы управления (75), (76). Вычисления проводились в среде МЛ^ЛБ с применением пакетов УЛЬМР и SEDUMI при относительной погрешности £ = 1е - 7.

К1(0) = [14,4420 - 3,0985 - 43,3439]; К2(0) = 15,0146;

К2(1) = 3,9687; К 2(2) = 4,0165; К2(3) = 2,1462.

На рис. 5 и рис. 6 представлены графики моделирования запаздывания тг,к, описываемого с помощью марковских цепей, на промежутке времени г = 100 и г = 1000, что соответствует

0,1 с и 1 с соответственно.

На рис. 7 и рис. 8 показаны графики суммарной ошибки обучения по итерациям и ошибки обучения на каждой итерации по всем промежутках времени.

На основании графика, представленного на рис. 7, можно отметить, что алгоритм обучения обеспечивает монотонную сходимость суммарной ошибки обучения.

О 20 40 60 80 100

Рис. 5. Запаздывание т, к на промежутке времени і = 100

0 20 40 60 80 100

Рис. 6. Запаздывание т,к на промежутке времени і = 1000

14000 I 12000 § 10000 I 8000

3

° 6000 сс

а. 4000 £ 2000

0

Итерации

Рис. 7. Суммарная ошибка обучения по итерациям

Итерации

Рис. 8. Ошибка обучения на каждой итерации по всем промежутках времени

Итерации

Рис. 9. Полученные траектории системы

На рис. 9 представлены траектории системы, полученные в результате реализации итерационного процесса обучения при передаче данных через сетевой канал связи. По данным графика можно увидеть, что в начальный период обучения системы траектории имеют скачкообразный характер. Это связано с наличием запаздывания и потерей пакетов данных в сети связи. При увеличении итераций ошибка обучения уменьшается, прослеживается точная траектория системы. Необходимо также отметить тот факт, что в течение итерационного обучения точная траектория системы прописывается и в буфер обмена регулятора.

На рис. 10 и рис. 11 показаны графики суммарной ошибки обучения на всем отрезке времени на каждой итерации и ошибки обучения на каждой итерации по всем промежутках времени для системы без учета запаздывания и потерь пакетов данных в сетевом канале связи.

14000 е 12000

ш

I—

§ 10000

I 8000 □

° 6000 ГГ 03

4000

03

:е

I, 2000

о

0

О 20 40 60 80 100

Итерации

Рис. 10. Суммарная ошибка обучения по итерациям для системы без учета запаздывания и потери пакетов данных

Итерации

Рис. 11. Ошибка обучения на каждой итерации по всем промежутках времени для системы без учета запаздывания и потери пакетов данных

І г-

Итерации

Рис. 12. Полученные траектории системы для системы без учета запаздывания и потери пакетов данных.

На рис. 12 представлены траектории системы, полученные в результате реализации итерационного процесса обучения при отсутствии запаздывания и потери пакета данных в сетевом канале связи. По графику видно, что не наблюдается скачков траекторий системы. На основании графика, представленного на рис. 10, можно отметить, что алгоритм обучения, при отсутствии запаздывания, также обеспечивает монотонную сходимость суммарной ошибки обучения.

Результаты численного моделирования двигателя постоянного тока показывают, что предлагаемый метод имеет неплохую сходимость и обеспечивает устойчивость системы во время итераций.

Литература

1. АНДРИЕВСКИЙ Б.Р., МАТВЕЕВ А.С., ФРАДКОВ АЛ.

Управление и оценивание при информационных ограничениях: к единой теории управления, вычислений и связи // Автоматика и телемеханика.- 2010. - №4. - С. 34-99.

2. ВАЛОВ С.А. Построение моделей сетевого управления для систем с итерационным обучением и повторяющихся процессов // Управление большими системами. Материалы VII Всероссийской школы-конференции молодых ученых. -ПГТУ, 2010. - Т. 1. - С. 15-22.

3. AHN H.S, CHEN Y., MOORE K.L. Iterative learning control: brief survey and categorization // IEEE Transactions on Systems, Man and Cybernetics. - 2007. - Part C, Vol. 37, №2. -P. 1109-1121.

4. AMANN N., OWENS D.H., ROGERS E. 2D systems theory applied to learning control systems // Proceedings of the 33rd IEEE Conference on Decision and Control, Lake Buena Vista, Florida, USA, 1994. - P. 985-986.

5. ARIMOTO S., KAWAMURA S., MIYAZAKI F. Bettering operations of robots by learning // Journal of Robotic Systems. - 1984. - Vol. 1, №2. - P. 123-140.

6. ARIMOTO S., KAWAMURA S., MIYAZAKI F., TAMA-KIE S. Learning control theory for dynamic systems // Proceedings of the 24th IEEE Conference on Decision and Control, Ft. Lauderdale, Florida, USA, 1985. - Vol. 24 - P. 1375-1380.

7. BIEN Z., XU J.X. Iterative Learning Control- Analysis, Design, Integration and Applications. - Kluwer Academic Publishers. -

1998. - 372 p.

8. BOYD S., GHAOUL L.E., FERON E., BALAKRISHNAN V.

Linear Matrix Inequalities in System and Control Theory. -SIAM, 1994. - 203 p.

9. BRISTOW D.A., THARAYIL M., ALLEYNE A.G. A survey of iterative learning control // IEEE Control Systems Magazine. -

2006. -Vol. 26, №3. - P. 96-114.

10. CHEN Y.Q., WEN C. Learning Control: Convergence, Robustness and Applications // Lecture Notes series on Control and Information Science. V. LNCIS-248., London: Springer Verlag,

1999. - 248 p.

11. CRUSIUS C A R., TROFINO A. Sufficient LMI Conditions for Output Feedback Control Problems // IEEE Transactions On Automatic Control. - 1999. - Vol. 44, №5. - P. 1053-1057.

12. DORF R.C., BISHOP R.H. Modern Control Systems. - 10th edition. - Prentice Hall, 2004. - 1018 p.

13. HLADOWSKI L., GALKOWSKI K., CAI Z., ROGERS E., FREEMAN C.T., LEWIN P.L. Using 2D systems theory to design output signal based iterative learning control laws with experimental verification // Proceedings of the 47th IEEE Conference on Decision and Control, December 2008. - P. 3026-3031.

14. KUREK J.E., ZAREMBA M.B. Iterative learning control synthesis based on 2-D system theory // IEEE Transactions on Automatic Control. - 1993. - №38(1). - P. 121-125.

15. LONGMAN R.W. Iterative learning control and repetitive control for engineering practice // International Journal of Control. - 2000. - Vol. 73, №10. - P. 930-954.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16. MADADY ALI. PID Type Iterative Learning Control with Optimal Gains // International Journal of Control, Automation, and Systems. - 2008. - Vol. 6, №2. - P. 194-203.

17. MOORE K.L. Iterative Learning Control for Deterministic Systems // Advances in Industrial Control - London: Springer Verlag, 1993. - 152 p.

18. MOORE K.L. Iterative learning control - an expository overview // Applied and Computational Controls, Signal Processing and Circuits. - 1999. - № - P. 151-241.

19. OWENS D.H., AMANN N., ROGERS E. Iterative learning control: an overview of recent algorithms // Applied Mathematics and Computer Science. - 1995. - №5. - P. 425-438.

20. PASZKE W., LAM J., GALKOWSKI K., XU S., LIN Z. Robust stability and stabilization of 2D discrete state-delayed systems // System Control. - 2004. - №51. - P. 277-291.

21. ROESSER R. A discrete state-space model for linear image processing // IEEE Transactions on Automatic Control. - 1975.

- №AC_20 (1). - P. 1-10.

22. ROGERS E., GALKOWSKI K., OWENS D.H. Control Systems Theory and Applications for Linear Repetitive Processes // Lecture Notes in Control and Information Sciences. Springer Verlag, 2007. - Vol. 349. - 466 p.

23. WANG FEI-YUE, LIU D. Networked Control Systems Theory and Applications. - London: Springer-Verlag, 2008. - 362 p.

24. WU J., CHEN T. Design of Networked Control Systems With Packet Dropouts // IEEE Transactions On Automatic Control. -

2007. - Vol. 52, №7. - P. 1314-1319.

25. XIAO L., HASSIBI A., HOW J.P. Control with random communication delays via a discrete-time jump system approach // Proceedings of American Control Conference, Chicago, USA,

2000. - Vol. 3. - P. 2199-2204.

26. XU J.X., TAN Y. Linear and Nonlinear Iterative Learning Control. - Springer, 2003. - 196 p.

27. XU J., YU Li. H<x Control of 2-D Discrete State Delay Systems // International Journal of Control, Automation, and Systems. -2006. - Vol. 4, №4. - P. 516-523.

28. YU M., WANG L, CHU W., HAO F. Stabilization of Networked Control Systems with Data Packet Dropout and Transmission Delays: Continuous-Time Case // European Journal of Control. - 2005. - №11. - P. 40-49.

29. YU M., WANG L, CHU W. Stability analysis of networked systems with packet dropout and transmission delays: discretetime case // Asian Journal of Control. - 2005. - Vol. 7, №4. -P. 433-439.

30. ZAMPIERI S. Trends in Networked Control Systems // 17th IFAC World Congress, 2008. - P. 2886-2894.

31. ZHANG L., SHI Y., CHEN T., HUANG B. A new method for stabilization of networked control systems with random delays // IEEE Transaction On Automatic Control. - 2005. -Vol. 50, № 8. - P. 1177-1181.

32. ZHANG W., BRANICKY M., PHILIPS S. Stability of Networked Control Systems // IEEE Control Systems Magazine. -

2001. - №21(2). - P. 84-99.

STABILIZATION OF 2D BASED ITERATIVE LEARNING CONTROL SYSTEM OVER NETWORK WITH RANDOM COMMUNICATION DELAYS AND PACKET DROPOUTS

Sergey Valov, Arzamas Polytechnic Institute of R. E. Alekseev, Nizhny Novgorod State Technical University, Arzamas, post-graduate student (serval_nn@mail.ru)

Abstract: A two-dimensional discrete-time iterative learning control system where a sensor and a controller exchange information over network communication channel, is considered. The problem of system stabilization along the trial is being solved in the presence of possible time-varying delays and packet dropouts. A control law is designed for both system state and output vector. Time-varying delays and packet dropouts are modeled as independent Markovian chains. The resulting closed-loop system is transformed into a 2D discrete-time Roesser model with Markovian jumps characterization. Then, sufficient conditions for system stabilization of single-packet transmission are given in terms of linear matrix inequalities. A numerical example illustrates the effectiveness of the results.

Keywords: iterative learning control, network communication channel, delay, Markovian model, stochastic stability, linear matrix inequalities.

Статья представлена к публикации членом редакционной коллегии М. В. Губко

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Валов Сергей Александрович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Валов Сергей Александрович

Stabilization of 2d based iterative learning control system over network with random communication delays and packet dropouts