Научная статья на тему 'Использование ортогонализации Грама-Шмидта для повышения экономичности многоточечных алгоритмов рекуррентного оценивания параметров моделей объектов управления'

Использование ортогонализации Грама-Шмидта для повышения экономичности многоточечных алгоритмов рекуррентного оценивания параметров моделей объектов управления Текст научной статьи по специальности «Математика»

CC BY
637
65
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Карелин А. Е., Светлаков А. А.

Показано что применение ортогонализации Грама-Шмидта векторов измеренных значений при рекуррентном оценивании параметров модели объекта управления позволяет сократить количество арифметических операций за счет отказа от процедуры псевдообращения получаемой матрицы. На каждой итерации алгоритма оценивания необходима ортогонализация только одного текущего вектора измеренных значений. Такой подход приводит к существенному повышению быстродействия алгоритма оценивания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Карелин А. Е., Светлаков А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using Gram

It has been shown that application of Gram-Schmidt orthogonalization of measured value vectors at recurrent estimation of control object model parameters permits to decrease the number of arithmetical operations due to rejection of pseudoinversion procedure of the matrix obtained. In this case at each iteration of estimation algorithm orthogonalization of only one current vector of the values measured is necessary. Such approach results in sufficient increase of operation speed of the estimation algorithm.

Текст научной работы на тему «Использование ортогонализации Грама-Шмидта для повышения экономичности многоточечных алгоритмов рекуррентного оценивания параметров моделей объектов управления»

СПИСОК ЛИТЕРАТУРЫ

1. Мирский Г.Я. Аппаратурное определение характеристик случайных процессов. Изд. 2-е. - М.: Энергия, 1972. - 456 с.

2. Крамер Г Математические методы статистики. - М.: Мир, 1975. - 648 с.

3. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. - М.: Наука, 1965. - 512 с.

4. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. Изд. 3-е. - М.: Наука, 1983. - 416 с.

5. Романовский В.И. Основные задачи теории ошибок. - М.-Л.: ОГАЗ ГИТ-ТЛ, 1947. - 116 с.

6. Вентцель Е.С. Теория вероятностей. - 8-е изд., стер. - М.: Высшая школа, 2002. - 575 с.

УДК 681.5.015

ИСПОЛЬЗОВАНИЕ ОРТОГОНАЛИЗАЦИИ ГРАМА-ШМИДТА ДЛЯ ПОВЫШЕНИЯ ЭКОНОМИЧНОСТИ МНОГОТОЧЕЧНЫХ АЛГОРИТМОВ РЕКУРРЕНТНОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ МОДЕЛЕЙ ОБЪЕКТОВ УПРАВЛЕНИЯ

А.Е. Карелин, А.А. Светлаков

Томский государственный университет систем управления и радиоэлектроники E-mail: [email protected]

Показано что применение ортогонализации Грама-Шмидта векторов измеренных значений при рекуррентном оценивании параметров модели объекта управления позволяет сократить количество арифметических операций за счет отказа от процедуры псевдообращения получаемой матрицы. На каждой итерации алгоритма оценивания необходима ортогонализация только одного текущего вектора измеренных значений. Такой подход приводит к существенному повышению быстродействия алгоритма оценивания.

1. Введение

Как известно [1, 2], наряду со скоростью сходимости и помехоустойчивостью важнейшим свойством рекуррентных алгоритмов оценивания параметров линейных и нелинейных моделей объектов управления является их экономичность, характеризующаяся количеством арифметических операций над вещественными числами, необходимых для реализации одной итерации уточнения оценок параметров идентифицируемых моделей. Особенно актуальным требование экономичности данных алгоритмов оказывается в тех случаях, когда выделяемое на их реализацию время в одном такте функционирования системы управления является в значительной мере ограниченным. С подобного рода ситуациями неизбежно приходится сталкиваться, например, в тех случаях, когда управляемым объектом является некоторый быстропроте-кающий процесс, для эффективного управления которым требуется достаточно высокая частота контроля его состояний и коррекция управляющих воздействий. Аналогичные ситуации возникают и в тех случаях, когда управляемый объект не является каким-либо быстропротекающим процессом, но для коррекции управляющих воздействий требуются значительные затраты машинного времени. Последнее же, очевидно, может иметь место из-за недостаточно высокого быстродействия используемой в системе ЭВМ, либо из-за значительных объемов вычислений, необходимых для нахождения новых управляющих воздействий и других задач, решаемых системой управления. Обе эти си-

туации являются достаточно типичными при разработке автоматизированных систем управления, базирующихся на мини- и микроЭВМ, быстродействие которых, как правило, не столь велико, как это часто бывает необходимо.

В данной работе предлагается модификация многоточечного рекуррентного алгоритма оценивания параметров моделей линейных статических объектов управления, основанного на использовании псевдообратных матриц, требующая для своей реализации существенно меньших объемов вычислений, чем это необходимо для реализации модифицируемого алгоритма. Значительное сокращение объемов вычислений здесь удается добиться за счет ортогонализации измерений входных переменных объекта с применением хорошо известной процедуры Грама-Шмидта ортогонализации векторов [3, 4].

2. Постановка задачи рекуррентного оценивания параметров математических моделей объекта и описание алгоритма ее решения, основанного на использовании псевдообратных матриц

Задачу рекуррентного оценивания параметров модели управляемого объекта сформулируем следующим образом. Пусть имеется линейный статический объект, значения «-мерного входа и скалярного выхода которого связаны соотношением

Уг =^> (!)

где х1 = (хг1,хгхп), у - соответственно значения входа х и выхода у в момент времени ,;

4

а = (а1,а2,...,аи)т - «-мерный вектор неизвестных параметров; Т - символ транспонирования векторов и матриц; « - конечное натуральное число. Пусть, далее, в каждый момент времени , имеются измерения вида

Г-

X, =

\

(

4

У г =

Л

Уг Уг-1

V Уг-I+1У

(2)

В настоящее время существует целый ряд алгоритмов, позволяющих осуществлять ее решение [2]. Одним из них является многоточечный рекуррентный алгоритм оценивания параметров линейных моделей (1), основанный на применении псев-дообратных матриц [5], который имеет вид 4 4 +4 4

а, = а г-1 + Хг (У г- Х, аг-1 X (3)

+

где X - (/х«)-матрица, псевдообратная к матрице X. Алгоритм вычисления данной матрицы в каждый дискретный момент времени , составляют следующие операции:

(4)

где Х1, у( - соответственно (/х«)-матрица и /-мерный вектор измерений входа х и выхода у объекта; / - глубина памяти алгоритма - некоторое натуральное число, такое, что 1</<М; М- конечное натуральное число, которое может быть как больше, так и меньше числа «. Задача рекуррентного оценивания параметров модели объекта при каждом , за-

4

ключается в том, чтобы получить новые оценки а1

параметров а модели (1) на основе измерений

4

(2) и уже имеющихся к моменту , оценок аг-1 данных параметров, полученных на предшествующем (,—1)-м такте оценивания.

Приведенная постановка задачи рекуррентного оценивания параметров модели является одной из простейших задач идентификации математических моделей управляемых объектов. Вместе с тем с точки зрения практических приложений именно она имеет важнейшее значение и представляет первостепенный интерес. Это обуславливается, во-первых, тем, что количественные связи между переменными многих реальных объектов имеют линейный или весьма близкий к нему характер и, следовательно, с достаточно высокой точностью могут быть описаны моделями вида (1). Во-вторых, достаточно типичной является ситуация, когда исследуемым объектом является реальный технологический процесс, значения переменных которого изменяются в достаточно узких пределах, и поэтому, если под значениями у1 и х! понимать не значения переменных у и х, а их отклонения от некоторых фиксированных, например, номинальных или средних значений, то количественные связи между данными отклонениями можно, очевидно, также с достаточно высокой точностью описать моделями вида (1), несмотря на заведомо нелинейные зависимости между значениями переменных у и х. И, наконец, в-третьих, с помощью тех или иных взаимнооднозначных функциональных преобразований переменных у и хх достаточно часто удается перейти к переменным у' и х, количественные связи между которыми адекватно описываются моделями (1).

X, =\Хк-1

(х - ъ Хк-1)+ (ъ |-1Х х * ъ Х-1

(1 + (--))-1 Хк-1 ^ |-1)= - = -к Хк -1= к = 1 1

(5)

где хк - к-я строка матрицы X; Хк - матрица размерности (кхп), составленная из первых к строк матрицы X; Хк - псевдообратная к Хк матрица,

^ ^ + 4

гк = хк Хк-р 0И - нулевой «-мерный вектор.

Основные свойства алгоритма (3) изложены в [2, 6] и сводятся к следующему.

1) Глубина памяти / может быть меньше или равна

4

размерности « вектора параметров а модели (1) либо больше ее. Данное свойство является следствием того, что псевдообратная матрица X, существует при произвольных соотношениях между / и «, что открывает широкие возможности выбора глубины памяти /. Выбирая глубину памяти, можно обеспечить эффективное применение алгоритма.

2) Необходимым и достаточным условием сходи-

4

мости оценок а1, ,=1,2,3..., вычисляемых с помощью алгоритма (3), является линейная независимость измерения хх от предшествующих /-1 измерений входа и выхода объекта.

4

3) Последовательность оценок а1, вычисляемых с помощью данного алгоритма, является монотонно по евклидовой норме сходящейся к ис-

4

тинным значениям параметров а .

4

4) Сходимость оценок а1 имеет место при произ-

4 4

вольных начальных оценках а0 параметров а .

5) Скорость сходимости алгоритма (3) монотонно увеличивается с увеличением глубины памяти и ее изменении в пределах от /=1 до /=«.

6) Имеются возможности повышения помехоустойчивости рассматриваемого алгоритма за счет регуляризации алгоритма (4), (5) вычисления матриц X+, [2,7].

7) Количество арифметических операций, выпол-

4

няемых на одном такте уточнения оценок а1, определяется следующими соотношениями:

а) Ыс = 0,5(3п -1)(/ + 1), б) Ыу = 0,5п(31 + 5)1 и в) N. = I, (6)

где Ис, Иу и Ид - соответственно, количество операций сложения, умножения и деления вещественных чисел.

3. Модификация многоточечного рекуррентного алгоритма (3) на основе использования ортогонализации измерений

Как показано в работах [2, 6], трудоемкость ре-

(В ^

-иг-1

Х-1 =

х, =

в, -

В-1 =

и воспользоваться правилами псевдообращения блочных матриц.

Вторая из обсуждаемых возможностей, реализованная в данной работе, состоит в том, чтобы воспользоваться каким-либо способом ортогона-лизации строк матрицы X, /=1,2,3,... Для этих целей, в частности, можно воспользоваться известной процедурой Грама-Шмидта ортогонализации заданной совокупности векторов. В результате применения данной процедуры к строкам матрицы X и объединения ее с алгоритмом (3) получаем модифицированный многоточечный алгоритм, имеющий следующий вид:

4 _ ь _ _ _

V, = Xг +1 (Хг ,№ )№ -1, (8)

ализации одного такта подстройки оценок аг-1 па-

4

раметров а модели (1) в соответствии с многоточечным алгоритмом (3) характеризуется соотношениями (6). Непосредственный подсчет количества арифметических операций, необходимых для реализации формул (4)-(5) позволяет получить соотношения +

а) Ыс = 0,5((31 -1)п -1 -1)I,

+ +

б) ЫУ = 0,5п(31 + 1)1 и в) N. = I, (7)

где символами Мс,N,N. обозначены соответственно количество операций сложения, умножения и деления вещественных чисел.

Сопоставляя полученные соотношения с (6), можно видеть, что подавляющая часть вычислений

4

при вычислении оценок а1 в соответствии с алгоритмом (3) затрачивается на вычисление псевдооб-ратной матрицы X,. Вместе с тем, сравнивая измерения (2) на ( ,-1)-м и ,-м тактах оценивания, можно видеть, что только первая строка хх (компонента у ) 4

матрицы X, (вектора У,) является новой, а остальные ее строки (его компоненты) являются строками

4

(компонентами) матрицы X—1 (вектора уг-1). Отмеченные обстоятельства наводят на мысль организовать вычисление X, так, чтобы в максимально возможной мере использовать результаты, полученные при вычислении Х^, и за счет этого сократить объем вычислений на каждом такте оценивания параметров модели (1). Имеется по крайней мере два способа реализации данной идеи. Первый из них заключается в том, чтобы выделить в матрицах X и X—1 блок строк, входящих одновременно в обе матрицы, т. е. представить их в виде

= [ Уг -Х (Х г =

аг = аг-1 + [в,- (№г >аг-1)], г = 1,2,...>

(9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(10)

(11)

где верхний предел суммирования Ь определяется соотношением

[, -1, г = 1,2,..., I-1,

]/-1, г = 1,1+1,... .

Ь =

Здесь ||х || - евклидова норма вектора V,, вычисля-

(

емая в соответствии с равенством =

Из соотношений (8)—(11) видно, что на первых

4

/—1 тактах оценивания параметров а осуществляется накопление измерений (2) и их ортонормирование, а на каждом из последующих тактов - сдвиг / ранее поступивших измерений с вычеркиванием самого «старого», т. е. (—/)-го измерения и ортонормирование самого «нового» ,-го измерения по отношению к остальным —/+1 имеющимся измерениям. Поскольку сдвиг измерений и вычеркивание одного из них из ортонормированной совокупности не нарушает ортонормированности остающихся в ней измерений, то в обоих случаях необходимо ортонормировать только одно вновь поступающее измерение хх . Непосредственная коррек-4

ция оценок аг-1 в этом случае также существенно

упрощается. Общий объем вычислений, выполняемых на одном такте в установившемся режиме оценивания (при />/), в данном случае характеризуется следующими соотношениями:

,= 1

,= 1

+

Nc = (21 + 1)п, Ny = (3п +1)1, N. = 1. (12)

Сопоставляя данные соотношения с (6) и (7), можно видеть, что применение ортонормирования измерений (2) существенно сокращает объем вычислений. Так, зависимость величин Ис и Ыу от глубины памяти / в (4) является квадратичной, а в (12) она имеет линейный характер. Значение же Ид в (12) вообще не зависит от значения /, а в соотношениях (6) значение Ид равно /.

Заметим, что сравнение экономичности алгоритмов здесь производится на основе сопоставления количества арифметических операций, выполнение которых необходимо для реализации одного такта подстройки параметров идентифицируемой модели в соответствии со сравниваемыми алгоритмами. Подход к сравнению экономичности алгоритмов на основе отмеченных выше критериев корректен лишь при использовании данных алгоритмов в следящих режимах оценивания [1, 2], когда скорости их сходимости примерно равны. Сравнение же алгоритмов по данным критериям при использовании режима обучения не вполне корректно, так как в этих режимах они имеют существенно различные скорости сходимости. В подобных ситуациях более корректным было бы сравнение экономичности алгоритмов по суммарному количеству арифметических операций, необходимых для реализации процесса подстройки параметров в целом, продолжающегося с первого такта оценивания и, например, до тех пор, пока не будет достигнута заранее заданная точность оценок.

Однако использование такого подхода к оценке экономичности рекуррентных алгоритмов оценивания возможно лишь в некоторых частных случаях и по результатам экспериментальных исследований в одних и тех же условиях. В общем же случае его применение связано со значительными трудностями, так как скорость сходимости данных алгоритмов определяется не только их свойствами, но и свойствами измерений на каждом из тактов оценивания, и, прежде всего, теснотой линейной зависимости между ними и их точностью.

Как видно из представленных выше результатов, использование ортогонализации измерений переменных объекта в значительной мере изменяет структуру алгоритма (3) и позволяет существенно повысить его экономичность. Изменяются при этом и некоторые другие свойства данного алгоритма. В частности, глубина памяти / алгоритма (8)—(11) не может быть больше «. Однако многие свойства алгоритма (3) при этом сохраняются и полностью наследуются алгоритмом (8)-(11). В частности, полностью сохраняются такие его важнейшие свойства, как сходимость при произволь-

4 ,

ных начальных оценках а0 и любом значении /,

удовлетворяющем отмеченным выше ограничениям, а также монотонность сходимости по евкли-

4 4

довой норме оценок а1 к а при ,—<». Справедливость всех этих свойств легко устанавливается с по-

мощью тех же самых рассуждений и приемов, которые были использованы при исследовании алгоритма (8)—(11) с увеличением его глубины памяти / в пределах от 1 до «. Справедливость данного свойства становится совершенно очевидной, если иметь в виду, что в случае ортогональных и точных измерений переменных объекта для получения вектора 4

а нужно использовать не более чем « измерений.

Заключение

Результаты многочисленных экспериментальных исследований алгоритма (8)—(11), выполненных в тех же условиях, что и исследования алгоритма (3), достаточно подробно рассмотрены в [7]. Отметим следующие основные выводы, вытекающие из данных результатов. Во-первых, они иллюстрируют работоспособность исследуемого алгоритма и подтверждают наличие у него всех отмеченных выше свойств. Во-вторых, при малых глубинах памяти (/<5) алгоритм является устойчивым по отношению к ошибкам измерений переменных объекта. В-третьих, при более значительных глубинах памяти (/>6) на некоторых тактах оценивания наблюдаются случаи неустойчивого поведения алгоритма, 4

когда оценки а1 оказываются более удаленными от

4 4 „

а, чем оценки аг-1. В-четвертых, неустойчивость

алгоритма легко устраняется с помощью его регу-лхяризации, осуществляемой заменой мх ножителя ||х ||-1 в формулах (9) и (10) множителем (Ц. ||+г)-1, где г - параметр регуляризации, что в вычислительном отношении незначительно усложняет весь алгоритм. Наконец, в-пятых, наличие у алгоритма регулируемой глубины памяти / и параметра регуляризации г позволяет в каждом конкретном случае подбирать их значения таким образом, чтобы обеспечить желаемое быстродействие и помехоустойчивость алгоритма. Проблема выбора оптимальных значений параметра регуляризации и глубины памяти алгоритма требует проведения дополнительных теоретических и экспериментальных исследований и выходит за рамки настоящей статьи. Здесь мы отметим лишь следующее. Как можно меньшее значение глубины памяти / следует выбирать в случае, когда необходимо обеспечить максимальное быстродействии и более высокую помехоустойчивость алгоритма. Значение же параметра регуляризации г на начальных тактах оценивания параметров модели управляемого объекта следует устанавливать равным нулю или достаточно близким к нему. А на последующих этапах подстройки оценок

4 4

а1, т. е. при />«, когда оценки а1 оказываются

4

близкими к истинным значениям параметров а, значение г должно быть отличным от нуля и тем в большей мере, чем большую помехоустойчивость необходимо обеспечить.

СПИСОК ЛИТЕРАТУРЫ

1. Райбман Н.С., Чадеев В.М. Построение моделей производства.

- М.: Энергия, 1975. - 376 с.

2. Светлаков А.А. Обобщенные обратные матрицы: некоторые вопросы теории и применения в задачах автоматизации управления процессами. - Томск: Изд-во НТЛ, 2003. - 388 с.

3. Ильин В.А., Позняк Э.Г. Линейная алгебра. - М.: Наука, 1974.

- 296 с.

4. Воеводин В.В. Линейная алгебра. - М.: Наука, 1980. - 400 с.

5. Гантмахер Ф.Р. Теория матриц. - М.: Наука, 1967. - 575 с.

6. Светлаков А.А. Многошаговый алгоритм адаптивного оценивания моделей линейных статических объектов // Известия АН СССР. Техническая кибернетика. - 1986. - № 3. -С. 187-191.

7. Светлаков А.А. Адаптивный алгоритм идентификации с регулируемыми параметрами // Корреляционно-экстремальные системы управления. - Томск: Изд-во Том. ун-та, 1980. -Вып. 5. - С. 115-124.

УДК 681.5

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СЛОЖНЫХ ОБЪЕКТОВ С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ В ЗАДАЧАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ СТРУКТУРНО-ПЕРЕСТРАИВАЕМЫХ СИСТЕМ

С.В. Шидловский

Томский государственный университет систем управления и радиоэлектроники E-mail: [email protected]

Рассматривается моделирование управления нестационарными температурными полями объектов со сложной геометрической конфигурацией. Приводятся сравнительные динамические характеристики замкнутых систем автоматического регулирования с перестраиваемой и фиксированной структурами.

Введение

Технические системы управления обычно являются довольно сложными устройствами, динамика которых описывается различными функциональными уравнениями. В каждом конкретном случае при использовании тех или иных математических методов необходимо составить математическую модель объекта. На практике подавляющее большинство объектов - это объекты с распределенными параметрами. Управляемый процесс с распределенными параметрами описывается краевыми задачами для дифференциальных или интегро-дифференциальных уравнений с частными производными или бесконечными системами обыкновенных дифференциальных уравнений [1].

Если рассматривать пространственно-многомерные объекты со сложной формой границы области изменения пространственных координат, а также учитывать принципиально нелинейные эффекты, получить аналитическое решение уравнения объекта затруднительно. Данный аспект привел к широкому распространению на практике приближенных моделей объектов с распределенными параметрами упрощенного вида, описывающих их поведение с требуемой точностью. В инженерной практике получили широкое распространение разностные методы приближенного описания объектов с распределенными параметрами, использующие различные способы пространственного, временного или пространственно-временного квантования в области изменения аргументов входа и выхода рассматриваемого распределенного блока [2, 3].

Для построения моделей будем использовать метод конечных элементов, позволяющий произвести дискретизацию области изменения пространственных переменных путем разбиения с некоторой погрешностью на ряд неперекрывающихся подобластей простой формы, в пределах каждого из которых функция состояния объекта приближенно описывается однотипным образом линейной комбинацией конечного числа заранее выбранных базисных функций.

Поддержание необходимого физического параметра на заданном уровне в подобных объектах является важной и трудоемкой задачей. Одним из возможных способов обеспечения данного режима является вычислительная среда с перестраиваемой структурой, формирующая управляющее воздействие, построенная по автоматному принципу и имеющая в узловых точках многофункциональные логические модули (МЛМ), т. е. автоматы с перестраиваемой структурой [4].

Общее выражение для двувходового автомата можно представить в виде

V = (А х А', 0, Б,ф,у).

Функционирование такого автомата обуславливается некоторым сверхсловом а ', а 'е(А )“, и предполагается, что на первый вход автомата V (алфавит А) в каждый момент времени поступает произвольный входной сигнал, а на второй вход - только очередной символ сверхслова а Следовательно, сверхслово а 'управляет изменением структуры автомата V Под функционированием автомата с перестраиваемой структурой V понимается тернарное

i Надоели баннеры? Вы всегда можете отключить рекламу.