УДК 681.3
М.Ф. Степанов, К. А. Кулаков, П.Н. Глазков, А. А. Григорьев
УПРАВЛЕНИЕ ОБЪЕКТОМ АВТОМАТИЧЕСКИ СКОНСТРУИРОВАННОЙ
НЕЙРОННОЙ СЕТЬЮ НА ОСНОВЕ ИДЕНТИФИКАЦИИ
Предлагается композиция методов нейроуправления и методов современной теории автоматического управления, заключающаяся в реализации закона управления системы автоматического управления с помощью конструируемой нейронной сети. Для получения необходимой информации об объекте управления используется блок идентификации. Проведенные исследования системы автоматического управления стабилизации движения самолета показали эффективность предлагаемого подхода.
Идентификация, автоматизация проектирования, нейроуправление.
M.F. Stepanov, K.A. Kulakov, P.N. Glazkov, A.A. Grigoryev
NEUROCONTROL WITH AN AUTOMATICALLY DESIGNED NEURAL NETWORK BASED ON IDENTIFICATION
The composition of neurocontrol methods and methods of the modern automatic control theory, consisting in realization of the control law of automated control system with a designed neural network is offered. For getting of the necessary information on the control object the identification block is used. The carried out researches of control system of stabilization of plane movement, have shown efficiency of the suggested approach.
Identification, computer-aided design, neurocontrol.
Возрастающее усложнение объектов управления в сочетании с ужесточением требований к точности и качеству управления привели к противоречию с традиционными подходами построения систем автоматического управления (САУ). Активно развиваемые методы нейроуправления направлены на использование для решения задач управления сложными объектами средств параллельной обработки информации, в качестве которых выступают искусственные нейронные сети (ИНС). При этом, как правило, используются такие особенности ИНС, как способность к обучению, высокое быстродействие и возможность выступать в роли универсального аппроксиматора, способного аппроксимировать любой закон управления с любой наперёд заданной точностью. Однако применение методов нейроуправления не всегда приводит к успеху в связи с необходимостью достаточно длительного обучения нейронной сети.
Одним из путей решения всё более обостряющейся проблемы является предлагаемое в данной работе сочетание методов нейроуправления с традиционными методами современной теории автоматического управления (ТАУ):
1) синтез закона управления с использованием средств автоматизации проектирования (САПР) САУ;
2) реализация синтезированного закона управления с использованием ИНС.
Предлагаемый подход можно проиллюстрировать схемой, приведённой на рис. 1.
Рис. 1. Нейроуправление с помощью конструируемой нейронной сети
Наиболее достоверную математическую модель объекта можно найти аналитическим путем. Для этого необходимо располагать всесторонними сведениями об объекте (о конструкции, о законах, описывающих протекающие в нем процессы, об условиях функционирования и взаимодействия со средой). Однако часто из-за отсутствия достаточных данных получить решение задачи таким путем не удается. Трудности применения аналитических методов возникают и при описании реальных объектов, процессы в которых имеют сложный характер. Поэтому актуальна проблема управления, когда параметры математической модели объекта управления заданы не полностью, либо не заданы вовсе. Методы нейроуправления, в принципе, могут обеспечивать достижение целей управления и при отсутствии априорной информации об объекте. Однако необходимое для этого обучение нейронной сети, включая и определение её конфигурации (количество скрытых слоёв, количество нейронов в каждом слое, связность, вид активационной функции и т. д.), может потребовать весьма значительного времени, не гарантируя нахождение оптимальных параметров. Подход, описанный выше, позволяющий снять проблему обучения нейронной сети, реализующей закон управления, предполагает использование априорной информации об объекте (математическая модель, например, в виде обыкновенных дифференциальных уравнений в форме Коши). Однако часто такая информация отсутствует. Поэтому предлагается в дополнение к данному подходу использовать блок идентификации, позволяющий получить недостающую информацию.
Структуру САУ, имеющей блок идентификации параметров объекта управления, можно представить на следующей обобщенной блок-схеме (рис. 2).
Рис. 2. Структура САУ с блоком идентификации
К выбору метода идентификации нельзя подойти однозначно, поскольку в самой постановке задачи заранее предполагается неопределенность (неполнота знаний об объекте, ограничения в наблюдениях объекта во времени, неточность измерения сигналов на входе и на выходе объекта и т. п.). Для решения задач параметрической идентификации разработано большое число методов, учитывающих особенности объектов, условия их
функционирования, способ тестирования и математическую основу анализа экспериментальных данных, вид получаемых моделей и т. п.
Обычно при идентификации объектов управления возмущения и помехи измерений подразумеваются либо отсутствующими, либо случайными процессами типа «белый шум». Но на практике эти предположения часто не выполняются, и стандартные методы идентификации оказываются неточными. В таких случаях оправданным является применение методов, в которых возмущениями являются неизвестные, ограниченные функции, например, метод «конечно-частотной идентификации» [1], для многомерных объектов, статистические свойства внешних возмущений и помех измерений которых неизвестны, а сами возмущения и помехи являются произвольными ограниченными функциями.
Рассмотрим полностью наблюдаемый линейный стационарный объект, который в пространстве состояний может быть описан уравнениями:
x = A x + Bu + M f,
y = C x + D u + N n, (
где x(t) e Rn обозначает вектор состояния; u(t) e Rm - вектор управлений; y(t) e Rr -
вектор измеряемых выходов; f (t) e Rд - вектор возмущений; n(t) e R^ - помехи
измерений, причем: |f (t)| < f* и |n; (t)| < n*, где f* (i = 1, д) и n* (i = 1, £) - заданные
положительные числа. Матрицы параметров объекта A, B, C, D неизвестны и подлежат идентификации.
Чтобы определить оценки матриц A, B, C, D, в методе конечно-частотной идентификации, на вход объекта последовательно прикладываются m векторов испытательных сигналов
uj(t) = ZPk sin ®kt •ej , t0 + O' - 1)т< t < t0 + J т, J = 1 m, (2)
k=1
где pjk (j = 1, m, k = 1, -&) - амплитуда k-й гармоники испытательного сигнала j-го
эксперимента; шк (к = 1, -&) - частота испытательного сигнала (шк ^ 0 (к = 1, -&) и oi ^ш j (i ^ j)); ej - j-й столбец единичной матрицы Em; $ = и +1, и - индекс
наблюдаемости объекта; т - длительность j-го эксперимента, причем t0 + mi = tj, определяемая из необходимых условий сходимости процесса идентификации.
Выходы yj (t) (j = 1, m) объекта подаются на входы фильтра Фурье, выходы которого дают оценки
Л 2 t0+jT
ay-k = ajk(т) =------------------ jyp (t) sin шк(t -10)dt,
P jk1 t0+( j-1) т л 2 t0+jT
Pjk = P jk (т) = -------------- j yfi(t) cos ш к (t - t0) dt,
p jk1 t0+( j-1)i
i = 1, r, j = 1, m, k = 1, (3)
элементов аф и вф матриц Ак = ЯеЩ(ушк) и Вк = 1тЩ(ушк) частотных параметров
объекта, где Щ(я) - его передаточная матрица.
Идентифицируемые матрицы A, B, C, D ищутся в канонической форме
Люенбергера (с матрицами AK, BK, CK, DK соответственно), а блоки AK и С
j
(i = 1, r, j = 1, r ) матриц AK и CK имеют специальную структуру:
аК =
( 0 0 • 0 - а(0)к ^
1 0 • 0 - ар к
0 1 • 0 - а?>к
V 0 0 • 1 - а("г-1)К ии У
АК., =
(0 0 0 0 00
4 =(0 0
1),
сК . =
г> 3
(0 0
- с
00
0
0
0
- а(0)к "\
у
- а
- а
(1) к
У
(2) К
(и. -1) к
(4)
). сКз = (0 0
0);
в которой и. = шт(ц.. и3). и3. 3 = 1. г - индексы Кронекера.
Оценки коэффициентов матриц канонической формы Люенбергера определяются однозначно из решения системы частотных уравнений идентификации
т ( Ц. -1 Л г -1
х1х;,° ь )к + >?к ч ]+х х чз а)*=-*<"*).
г=1 V 3=0 У г =1 3=0
к = 1. г
(5)
в которой = шт(ик. иг) при к < г и = тт(ик +1. иг) при к > г. а столбцы
г(3) =
К-е(3Ю1) 3 Со1г Ет - ^ [С®1) 1с°1г (А1Т + 3ВТ )]
МЗЮ1) 1с°1гЕт - 1т [ОО 3 Со1г (А1Т + 3В1Т )]
МЗ^) 'Со1,Ет - ^ [(3® 2 )[С°1г (А2 + 3ВТ )]
М3^) 1с°1гЕт и Щ1) = - 1т [(.3®2)[С°}г (А2 + Ж )]
К-е(3И ) 3 Со1г Ет - К-е [[) ['Со1, (АТ + Щ)]
_1т(3® ) 1с°1гЕт _ - 1т [[)[ Ыг (а[ + В)]_
(6)
Условия окончания процесса идентификации могут быть выражены следующими неравенствами:
а
(к) К.
(Т + Т) - а.)К (т) <8 а . к = 0. - 1. г = 1. г. 3 = 1. г.
Ъ3) к (т + Т) - Ь3) к (т) <8
сК (т+т ) - сгК (т) <8 с .
йК (т + Т) - < (т) <8 „.
к = 0. иг -1. г = 1. г. 3 = 1. т. г = 1. г. 3 = 1. г. г = 1. г. 3 = 1. т.
(7)
где 8а. 8Ь. 8с. 8й - заданные числа. а « - » - символ отношения: а - Ь = |а - Ь| / Ь. если Ь ^ 0. либо а - Ь = И. если Ь = 0 .
Далее идентифицированная модель объекта управления может быть использована для построения закона управления и его реализации с помощью конструируемой нейронной сети. Современные САПР САУ способны решать задачи синтеза закона управления. как автоматизированно. так и автоматически. В первом случае пользователь САПР САУ - инженер-проектировщик обязан указать в той или иной форме последовательность действий по решению поставленной задачи. Во втором случае задача ставится непроцедурно. т.е. без указания последовательности действий по ее решению. При этом необходимая последовательность действий автоматически формируется самой САПР САУ на основе имеющихся у неё знаний о методах решения задач ТАУ [2].
В связи с бурным развитием ТАУ. расширением классов управляемых объектов. огромным разнообразием методов ТАУ. для инженера-проектировщика наиболее предпочтительным оказывается применение САПР САУ. способных решать задачи в непроцедурной постановке. Непроцедурно поставленные задачи решаются методами искусственного интеллекта. применение которых требует адекватного решения четырех проблем:
1) формализация знаний о методах решения задач проблемной области (в нашем случае - о методах решения задач анализа и синтеза САУ);
2) адекватное представление знаний;
3) эффективный механизм представления действий;
Ь
4) удобные средства выполнения действий, позволяющих получить результат решения задачи.
Системы, основанные на знаниях, традиционно относят к интеллектуальным, а поэтому и САПР САУ, способные решать непроцедурно поставленные задачи, называют интеллектуальными САПР САУ.
К таковым относится система ИНСТРУМЕНТ-3 м-И [3]. Функционирование системы ИНСТРУМЕНТ-Зм-И базируется на концепции автоматического решения задач ТАУ:
1) формализация знаний о методах решения задач синтеза и анализа САУ в виде модели множества формализованных задач (ММФЗ) ТАУ;
2) построение планирующей подсистемы в виде системы автоматического доказательства теорем, представляющей собой прикладную систему исчисления секвенций;
3) использование планирующих искусственных нейронных сетей (ПИНС) в качестве механизма поиска вывода в формальных аксиоматических системах, порождающего план решения задачи на проблемно-ориентированном языке ИНСТРУМЕНТ-ОП, поддерживающем парадигму «правила ЕСЛИ-ТО»;
4) построение исполнительной подсистемы в виде пакета прикладных программ, управляемого интерпретатором планов на языке ИНСТРУМЕНТ-ОП.
Модель множества формализованных задач ТАУ представляет собой триаду Мо = < П, Д, О >, где П={щ,. . ,,пп} - множество формализованных обобщений моделей компонентов САУ, называемых предметами, обладающих свойствами
ЙєРіС р={р|рє{истина|ложь}}, характеристиками к]єНіеК=(хк|ХкєСмк}, где С -множество комплексных чисел; формами математических моделей Ш]Є^і^З={д1,^,дх}; Д={д|д: роКоЗ^-роКоЗоО} - множество действий (операций), выполняемых над предметами, их свойствами и характеристиками; О={о|о: роКоЗ^- {истина|ложь}} -множество отношений (предикатов), определенных на множествах предметов, их свойствах и характеристиках. Действия д;=<у;Д,г^>еД и отношения о;=<у;Д,р;>еО однозначно идентифицируются своими атрибутами: уієроО - условия применимости, ^єроКоЗ - исходные данные, гіериКиЗиО - результаты действия, фєО -требования к результатам действия, ріє {истина|ложь} - значение отношения.
В целях повышения эффективности используется многоуровневое представление знаний в виде трехранговой системы подмоделей, каждая из которых имеет трехуровневое представление знаний: М = (М,1,..., Ы1т, М12,..., Ми2, М'З), М[ = (М0гг., МГі, М Г2І),
Мгкі = {ї ГІ, Агкі , І г і) , где ї к І - множество предметов; Агкі - множество действий; І гкі -
множество отношений подмодели І гкі; т.е. і-й подмодели к-го уровня г-го ранга модели
М. Многоуровневая модель М создается ученым-исследователем на основе модели М0 посредством многоступенчатого обобщения знаний.
Планирующая подсистема является формальной логической системой, представляющей собой прикладную систему исчисления секвенций, называемую многоуровневой аксиоматической теорией автоматических решений, автоматически порождаемой на основе модели множества формализованных задач ТАУ.
Важнейшим недостатком Задача формальных логических систем ________________
Решающая искусственная нейронная сеть
Операции План
решения
задачи
является
«проклятие
Архивная искусственная нейронная сеть
размерности». не позволяющее решать задачи практической сложности. Обойти его позволяют используемые в системе ИНСТРУМЕНТ-3 м-И
тг
«Цель пуста»
Пуск
Устройство
синхронизации
Отказ
планирующие искусственные нейронные сети (ПИНС).
состоящие из решающей
Рис. 3. Структура ПИНС
искусственной нейронной сети
(РИНС) и архивной искусственной нейронной сети (АИНС). Их функционирование координируется устройством синхронизации. Структура ПИНС приведена на рис. 3.
РИНС. представляющая собой трехслойную сеть. осуществляет обратный поиск решения поставленной перед ней задачи в формализме Т^ с сохранением построенного
плана решения задачи в АИНС. РИНС является динамической искусственной нейронной сетью. выход которой изменяется во времени при постоянных входных сигналах. Начальное состояние всех нейронов РИНС является невозбужденным. Для задач. имеющих решение. отдельные нейроны выходного слоя кратковременно переходят в возбужденное состояние. что запоминается в АИНС для последующего включения в план решения задачи. Состояние нейронов одного из внутренних слоев нейронов РИНС сопоставляется с текущими целями поиска решения. Переход их в невозбужденное состояние приводит к формированию сигнала «Цель пуста». свидетельствующего. что решение поставленной задачи получено. В противном случае. по истечении отведенного на поиск решения времени. вырабатывается отказ от решения.
Важнейшим достоинством ПИНС является наличие свойства массового параллелизма. позволяющее одновременно решать все подзадачи исходной задачи. формируя единый план решения. многократно повышая эффективность процесса поиска плана решения задачи. а. следовательно. и решения задачи в целом. На пути использования нейронных сетей всегда необходимо решать две проблемы: предварительного обучения сети и интерпретации полученных результатов. В ПИНС обе проблемы решены в силу конструктивных особенностей.
Различие в принципах функционирования нейронных сетей и ЭВМ с традиционной архитектурой. на которых функционируют пакеты прикладных программ. поднимает вопрос о допустимости их объединения в единой системе. Для решения задач анализа и синтеза САУ применяются действия. связанные с выполнением большого количества вычислений по сложным алгоритмам. Их реализация с помощью нейронных сетей либо пока не выполнима. либо не целесообразна. поскольку лишит исследователя возможности самостоятельно расширять набор допустимых действий в соответствии с потребностями создаваемой им модели знаний ТАУ. В связи с этим в системе ИНСТРУМЕНТ-3м-И планирующие нейронные сети применяются лишь для отбора действий. релевантных решаемой задаче и представления их списка в виде плана на специально разработанном языке ИНСТРУМЕНТ-ОП. Окончательный же порядок выполнения действий определяется непосредственно исполнительной подсистемой - интерпретатором языка ИНСТРУМЕНТ-ОП. Это обусловило и синтаксис языка ИНСТРУМЕНТ-ОП. предложения в котором являются формой записи аксиом теории решений.
В конечном счете. после выполнения действий. предусмотренных построенным планом решения задачи. формируется результат решения задачи. В задачах синтеза это математическая модель управляющего устройства. например. в виде разностных уравнений:
и [(к + 1)Т ] = Орхр [(к + 1)Т ] + НрУ [к! ]; Хр [(к + 1)Т ] = Лрхр [кТ ] + ВУк
В„
Е
X
о„
И„
Е
Рис. 4. Структура нейронной сети
где хй е Я", у е Яг, м е Я” .
Реализация синтезированного
закона управления в виде искусственной нейронной сети может осуществляться:
1) посредством обучения ИНС;
2) посредством автоматического конструирования ИНС [4].
Поскольку первый подход связан с большими затратами времени на обучение нейронной сети, здесь он рассматриваться не будет. В подходе на основе
конструирования ИНС указанный дискретный закон управления может быть легко реализован с помощью нейронной сети типа Мадалин, что иллюстрирует рис. 4.
Таким образом, проблема обучения нейронной сети для достижения целей
управления заданным объектом успешно решается на основе применения средств автоматического решения задач ТАУ.
Для иллюстрации использования блока идентификации в дополнение к управлению с помощью конструируемой нейронной сети приведем пример синтеза конкретной системы управления.
В качестве примера рассмотрим стабилизацию движения самолета по углу тангажа.
На рис. 5 обозначено: Х - сила лобового сопротивления; У - подъемная сила; О -
сила тяжести; Мг - суммарный момент, приложенный к самолету относительно оси г; Р -сила тяги; 9С - угол наклона траектории; ас, 0С -углы атаки и тангажа; V - вектор скорости.
Бортовая система управления по каналу тангажа включает датчики информации, автопилот, выполняющий функцию регулятора, и привод рулей высоты. В качестве датчиков информации используются датчик углового положения (ДУП) и датчик угловой скорости (ДУС). Сигнал с ДУП в виде напряжения U^vc, пропорционального действительному значению угла тангажа самолета 0С, сравнивается с напряжением задатчика U0, так что на автопилот поступает напряжение и0, пропорциональное
отклонению 0 угла тангажа от требуемого значения. Сигнал с ДУС представляется напряжением Ua, пропорциональным угловой скорости самолета =0, относительно поперечной оси г.
Рис. 5. Функциональная схема системы управления
Уравнения возмущенного движения самолета, линеаризованные относительно некоторого режима полета, имеют следующий вид:
0 = юг,
^ - Г122)ш г ' '^0ЬЛ11 '•*21^ 1 "2-
СО г ( ^0 ^22) Ог + (^0^11 ^21) а + Ь2 КІЄ и ,
(х = -^иа + шг, (9)
У = ,
.У2 = КшО ,
где а - отклонение угла атаки от номинального значения; 5 - отклонение угла поворота
руля высоты; ё0, ё11, ё21, ё22, Ь2, g1, g2 - параметры самолета, &г = 0 - угловая скорость
самолета относительно поперечной оси г.
Требования к системе управления:
50 < 0,5 [абаа], г*д < 3,0 , М* < 1,1,
5* , *
0 - изменение угла тангажа, град; гр - время регулирования, с.
Исходные параметры системы нам неизвестны, поэтому для построения модели объекта
необходимо идентифицировать данную систему. Блок
идентификации получен с помощью автоматически конструируемой нейронной сети. Для этого
воспользуемся пакетом
Бішиїіпк системы
МЛТЬЛБ. Структурная
Рис. 6. Структурная схема регулятора
схема системы приведена на рис. 6.
Результаты моделирования приведены на рис. 7.
Рис. 7. Переходные процессы по углу тангажа: с нейрорегулятором (3), с традиционным регулятором (4) и угловой скорости: с нейрорегулятором (1), с традиционным регулятором (2) относительно поперечной оси
Очевидный выигрыш от реализации закона управления при помощи конструируемой нейронной сети заключается в отсутствии необходимости длительного обучения нейронной сети.
Предлагаемый в данной работе подход реализуется в рамках САС САУ «ИНСТРУМЕНТ-3М-И» [3]. При этом в базовую модель М множества формализуемых задач ТАУ введены элементарные проектные операции: 1) конструирование нейронной сети, реализующей заданный закон управления; 2) моделирование САУ, закон управления которой реализован в виде искусственной нейронной сети. Это позволило автоматически решать задачи синтеза закона управления и моделирования поведения замкнутой САУ с учётом реализации в виде нейронной сети [5]. Результаты моделирования совпадают с приведёнными.
Выводы
Предложен подход к автоматизации решения задач проектирования САУ, сочетающий автоматическое решение задач разработки и исследования закона управления САУ с автоматическим построением реализации синтезированного закона управления в виде искусственной нейронной сети.
Подход реализован в рамках известной системы ИНСТРУМЕНТ-Зм-И, а также в составе разрабатываемой распределённой системы автоматического решения задач ТАУ, что позволяет снабдить проектировщика САУ удобным и эффективным инструментарием для решения сложных, в том числе и с вычислительной точки зрения, задач проектирования современных систем управления сложными объектами произвольной физической природы.
ЛИТЕРАТУРА
1. Александров А.Г. Программное обеспечение конечно-частотной идентификации и адаптивного управления многомерными объектами / А.Г. Александров, Ю.Ф. Орлов, Л.С. Михайлова // Идентификация систем и задачи управления. 81СРК0’2002. М.: Институт проблем управления РАН, 2002. С. 2531-2556.
2. Степанов М.Ф. Автоматическое решение формализованных задач теории автоматического управления / М.Ф. Степанов. Саратов: СГТУ, 2000. 376 с.
3. Степанов М.Ф. Система автоматического синтеза систем автоматического управления ИНСТРУМЕНТ-3м-И (САС САУ ИНСТРУМЕНТ-3м-И) / М.Ф. Степанов. Свидетельство Роспатента об офиц. регистр. программы для ЭВМ. № 2003612369. 2003.
4. Комарцова Л.Г. Нейрокомпьютеры / Л.Г. Комарцова, А.В. Максимов. М.: Изд-во МГТУ им. Н. Э. Баумана, 2004. 400 с.
5. Об одном подходе к нейроуправлению с помощью конструируемой нейронной сети / П.Н. Глазков, М.Ф. Степанов, А.А. Григорьев, К.А. Кулаков // Математические методы в технике и технологиях - ММТТ 21: сб. трудов XXI Междунар. науч. конф.: в 10 т. Саратов: СГТУ, 2008. Т. 2. С. 251-254.
Степанов Михаил Федорович -
доктор технических наук, профессор кафедры «Техническая кибернетика и информатика»
Саратовского государственного технического университета
Кулаков Кирилл Андреевич
аспирант кафедры
Stepanov Mikhail Fyodorovich -
Doctor of Technical Sciences, Professor of the Department of «Engineering Cybernetics and Informatics» of Saratov State Technical University
Kulakov Kiril Andreyevich -
Post-graduate student of the Department
«Техническая кибернетика и информатика»
Саратовского государственного технического университета
Глазков Павел Николаевич
аспирант кафедры «Техническая кибернетика и информатика»
Саратовского государственного технического университета
Григорьев Андрей Александрович -
аспирант кафедры «Техническая кибернетика и информатика»
Саратовского государственного технического университета
Статья поступила в редакцию 24.
of «Engineering Cybernetics and Informatics» of Saratov State Technical University
Glazkov Pavel Nikolayevich -
Post-graduate student of the Department
of «Engineering Cybernetics and Informatics» of Saratov State Technical University
Grigoryev Andrey Aleksandrovich -
Post-graduate student of the Department
of «Engineering Cybernetics and Informatics» of Saratov State Technical University
11.08, принята к опубликованию 25.02.09