5. Колташев, А. А. Технология разработки бортового программного обеспечения: управление работами и объектами / А. А. Колташев, А. Н. Антамошкин, О. С. Иноземцева, С. А. Краус // Вестн. Сиб. гос. аэрокосмич. ун-та им. акад. М. Ф. Решетнева. Красноярск, 2008. № 1(18).
6. Колташев, А. А. Управление конфигурацией бортового программного обеспечения спутников / А. А. Колташев, О. С. Иноземцева, С. А. Краус // Системный анализ, управление и навигация : тез. докл. 13-й междунар. науч. конф. М. : Изд-во МАИ-принт, 2008.
7. Программа управления работами и объектами программного проекта : свидетельство об офиц. регистр. программы для ЭВМ № 2006611230 (РФ) СОКРАТ-УР / Колташев А. А., Иноземцева О. С. Зарегистр. Роспатент 10.04.2006.
8. Программа управления проблемами программного проекта : свидетельство об офиц. регистр. программы для ЭВМ № 2006611287, СОКРАТ-УП. / Колташев А. А., Иноземцева О. С. Зарегистр. Роспатент 17.04.2006.
A. A. Koltashev
ON-BOARD SOFTWARE DEVELOPMENT MANAGEMENT
Technology of development of the on-board software of communication and navigation satellites, is considered in aspect of its efficient work breakdown structure and project management.
УЦК 62.501
А. В. Медведев
ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ. ОБЩИЙ ПОДХОД
С настоящей работы начинается цикл публикаций, посвященный новому разделу теории управления. Теория непараметрических систем управления ориентирована на меньший объем априорной информации, что и отличает ее от общепринятой теории управления, которая относится к классу параметрической. Принципиальное отличие состоит в том, что параметрическая теория предполагает этап выбора модели исследуемого процесса с точностью до вектора параметров, а непараметрическая - сведения о качественных свойствах характеристики процесса.
Теория - в виду практики. Девиз конгрессов IFAC
Теория автоматического управления предполагает выбор (определение) уравнения объекта с точностью до набора параметров. При этом существенное значение имеет априорная информация об исследуемом процессе. В фундаментальных монографиях А. А. Фельдбаума [1] и Я. З. Цыпкина [2] рассматриваются различные уровни априорной информации об исследуемом процессе при решении задач идентификации и управления. Методы классической и современной теории автоматического управления подробно рассмотрены в [3-7]. Основы применения теории случайных функций к задачам автоматического управления заложены в [8].
Уровни априорной информации. Под математической моделью объекта (процесса) обычно понимают его количественную формализацию. Математическая модель -это формальное описание процесса с помощью математических средств: дифференциальных, интегральных, ин-тегро-дифференциальных, разностных, алгебраических уравнений, а также неравенств, множеств и т. д. [3]. Крайне важным является ответ на вопрос: как выбрать оператор объекта, превращающий входные переменные, дей-
Опыт - единственный источник истины.
А. Пуанкаре
ствующие на него, в выходные. В некоторых случаях возможно использование фундаментальных законов, лежащих в основе функционирования физических, химических, биологических и других процессов, т. е. имеющих место для механических, электрических, электромагнитных, термодинамических, гидравлических, электрохимических, биофизических и других процессов. К сожалению, мы часто сталкиваемся с серьезными трудностями на этом пути, особенно при изучении технологических, социальных, экономических и многих других процессов, т. е. сталкиваемся с неполнотой информации об интересующем нас процессе. И степень нашего незнания может быть существенно различной. В этой связи Л. Брил-люэном было отмечено, что «всякая плодотворная гипотеза кладет начало удивительному извержению потока непредвиденных открытий», но с другой стороны «физические модели отличаются от мира так же, как географическая карта от поверхности Земли». Имеющийся опыт теории и практики решения задач идентификации убеждает, что априорная информация и ее использование при моделировании исследуемого процесса может оказать-
ся определяющей. Достаточно в общем виде это может быть представлено схемой (см. рисунок)
В блоке «Модель» определен принятый класс моделей на основании априорной информации об исследуемом процессе и анализе текущей информации {л11 [ґ ], хн [ґ ], ґ = 1,51, здесь же осуществляется настройка (обучение) модели принятого класса. В дальнейшем обучающую выборку { и11 [ґ], хн [ґ], ґ = 1, 5} ,изсоображений
простоты записи, будем обозначать |и[ґ ], х[ґ ], ґ = 1,5}.
Итак, математическое представление исследуемого процесса может быть представлено в виде:
х(ґ) = Л{и (ґ), 0(ґ), £(ґ), ґ), (1)
а его модель в форме:
Х[ґ +1] = Л(и[ґ + 1],[ґ ]), (2)
где Л - оператор модели, кроме того, все случайные факторы, действующие в каналах измерения и на процесс, имеют нулевые математические ожидания и ограниченные дисперсии.
Системы с полной информацией. В этом случае оператор процесса А в (1) известен точно, а случайные помехи, действующие на объект и каналах связи отсутствуют, кроме того
и(ґ) єО(и (ґ)), (3)
где 0(и(ґ)) - некоторая известная область допустимых
значений и (ґ). При решении задач идентификации и управления могут быть использованы методы математической теории оптимальных процессов [9; 10], а также другие методы.
Системы с максимальной, но неполной информацией. Здесь предполагается, что помехи Н(ґ) на рисунке отсутствуют, но помеха ^(ґ) может быть точно измерена, отсутствует также входная переменная 0(ґ), а оператор А известен точно. Подробно этот случай исследовался в [1] для непрерывных, дискретно-непрерывных и чисто дискретных систем.
Системы с неполной информацией. Это системы с независимым (пассивным) накоплением информации [1]. В этом случае влияние входного воздействия 0(ґ) воспринимается как просто случайное воздействие, аналогичное £(ґ), тогда мы имеем дело с объединенным входным случайным воздействием (0(ґ), £(ґ)). Тем не менее, природа этих случайных воздействий на процесс существенно различна. Помехи £(ґ) - это обычно предполагаемое в теории стохастических систем случайное воздействие на объект, 0(ґ) - переменные, «имена» которых известны исследователю, но не подающиеся контролю, либо их контроль возможен частично через значительно (в десятки и сотни раз) превышающий Дґ. Кроме того, класс операторов А не известен точно, но необходимы предположения о плотности распределения всех слу-
х [ґ ]
Схема использования априорной информации об исследуемом процессе:
А - оператор процесса; Н - каналы измерения соответствующих переменных процесса; и(і) - ¿-мерный вектор контролируемых входных переменных;
0(ґ) - вектор входных переменных не поддающихся контролю; х(і) - п-мерный вектор выходных переменных; Ни (ґ), Нх (ґ) - случайные помехи при измерении соответствующих переменных; ик[ґ],хь[ґ] - наблюдения переменных в дискретные моменты времени і через соответствующие интервалы времени Дґ ; ^(ґ) - случайные помехи, действующие на процесс; Х(ґ) -выход модели
чайных факторов (см. рисунок), уравнения каналов связи Н, и о классе оператора А с точностью до вектора параметров. Обычно плотности вероятности случайных факторов, действующих на объект и в каналах измерения переменных, предполагаются нормальными и аддитивными. Ясно, что в этом случае необходимо наличие выборки |м[/], х[/], t = 1,5}, а сами наблюдения предполагаются статистически независимыми [1], т. е. наблюдения, например и[1],и[2],... - независимы. Такие системы относят к классу разомкнутых или нейтральных.
Системы с активным накоплением информации. Особенность этого уровня априорной информации состоит в том, что задачи идентификации и задачи управления здесь могут быть объединены. Элементы выборки измерений поступают последовательно в обучающую модель и систему управления, т. е. (и[1]х[1]),(и[2]х[2]),(и[3]х[3]),.... Таким образом, в случае объединения этих задач выработка входных воздействий носит двойственный характер -они должны быть одновременно и изучающими, и управляющими, т. е. носить дуальный характер. Теория дуального управления была создана А. А. Фельдбаумом и существенно развита в [1]. Однако, если помехи, действующие на процесс, аддитивны и в каналах измерения, то в целом система дуального управления может быть приведена к разомкнутой, т. е. темп накопления информации оказывается независимым от значений входных переменных. Такие системы называют приводимыми к разомкнутым или нейтральными [1]. Но существует класс не нейтральных систем, т. е. класс неприводимых. Например, если ^) мультипликативна по отношению к ). Такой случай также исследован в [1 ].
Системы с параметрической неопределенностью. Параметрический уровень априорной информации предполагает наличие параметрической структуры модели и некоторых характеристик случайных помех, обычными из них являются нулевое математическое ожидание и ограниченная дисперсия. Для оценивания параметров используются чаще всего разнообразные итеративные вероятностные процедуры. При этих условиях также решается задача идентификации в узком смысле [3], как и во всех предыдущих случаях.
Системы с непараметрической неопределенностью. Непараметрический уровень априорной информации не предполагает наличие модели, но требует наличие некоторых сведений качественного характера о процессе, например, однозначность, либо неоднозначность его характеристик, линейность для динамических процессов либо характер его нелинейности. Для решения задач идентификации на этом уровне априорной информации (идентификация в широком смысле) применяются методы непараметрической статистики.
Системы с параметрической и непараметрической неопределенностью. Важными с точки зрения практики являются задачи идентификации многосвязных систем в условиях, когда объем исходной информации не соответствует ни одному из вышеописанных типов. Например, для отдельных характеристик многосвязного процесса на основании физико-химических закономерностей, энергетических, закона сохранения массы, балансовых соотношений могут быть выведены параметрические зако-
номерности, а для других нет. Таким образом, мы находимся в ситуации, когда задача идентификации формулируется в условиях и параметрической, и непараметрической априорной информации. Тогда и модели представляют собой взаимосвязанную систему параметрических и непараметрических соотношений.
Синтез непараметрических алгоритмов. Приведем фрагмент синтеза непараметрической модели. Сформируем критерий оптимальности:
Я(х) = Ми {Мх {б(х,х)/и}} (4)
где Q(■) некоторая выпуклая функция.
Задача отыскания наилучшего х сводится к миними-
тл / — \ ОПТ
зации Я(х) по , т. е. к поиску такого х , что Я(хопт) = шшх Я(х). Ясно, что вид х будет определяться видом функции Q(х, х). Так, если Q(х, х) = (х- х)2, то
хопт = х(и) =м{х/и} . (5)
Непараметрическая оценка х(и) будет
^ (и ) =
X х] П ф(С7‘ и - и ^])) /X п ф(С7‘ и - и ^])), (6)
]=1 у=1 / I=1 У=1
] = Iп,
где колоколообразные функции Ф(), параметр размытости С5 удовлетворяет условиям сходимости [11].
В случае идентификации линейных динамических процессов может быть использован иной путь, известный из теории линейных операторов [12; 13]. Остановимся только на общих чертах этого пути.
Пусть оператор исследуемого процесса (влияние переменных 0^) и 'сО опустим)
х(0 = А(и (Г)} (7)
линеен, тогда он может быть представлен в достаточно общем виде при ненулевых начальных условиях (из соображений простоты рассмотрим случай скалярных и(1) и х(г))
х($) = и ^ )0(0) + |д^ -т)u(т)d т (8)
0
где О(t) и д^) - соответственно переходная и весовая функции системы в направлении «вход-выход». При нулевых начальных условиях (8) будет
t
х^) = | д^ - т)и (т)d т. (9)
0
Как известно, оператор обратный оператору (8) будет иметь вид и^) = А-1 х^) и далее (при нулевых начальных условиях)
t
и ^) = х(t )Л(0) +- т) x(т)d т. (10)
0
Заметим, что оператор, обратный (8), также является линейным и ограниченным, а оператор, обратный (9), является линейным, но неограниченным.
Центральная идея непараметрического моделирования и управления линейными динамическими системами состоит в следующем. Сначала снимают на реальном объекте переходные характеристики, подавая на вход объекта единичный сигнал и^) = 1^), т. е. получают выборку х[/] через интервал времени Дt, t = 1,5, затем строят непараметрическую оценку О5 ^) и оценку д5 ^), исходя из того, что д(11) = dО(t)/dt. В результате непараметрическая модель примет вид:
х5(0 = и(^О5(0) +1д5 ^-т)и(т)dт . (11)
0
Следующий принципиально новый этап предложен в такой последовательности. Поскольку на реальном объекте нельзя снимать переходную характеристику в направлении «выход-вход», то переходная характеристика в этом направлении снимается на модели (11), т. е. и^) = 1^) через интервал времени Дt, таким образом, получается реализация х^], t = 1,5 . Далее аналогичным образом строятся непараметрические оценки Л5 ^) и X5 ^), и далее строится оценка (10)
и5 ^) = х^)Л5 (0) +1-т)х(т^т . (12)
0
Таким образом, (12) является непараметрическим регулятором линейной динамической системы, для этого достаточно положить х^) = х* ^), х*^) - заданное значение выхода системы.
Существенным в вышеизложенном является то, что получен регулятор в условиях, когда вид уравнения с точностью до параметров, описывающих его процесс, не известен, как это делается в классической теории управления. Достаточно сказать, что в фундаментальной монографии [13], посвященной теории линейных систем на основе линейных операторов, не приведено ни моделей, ни регуляторов, которые можно было бы использовать на практике. В последующих статьях, посвященных теории непараметрических систем, будут детально изложены модели, решающие правила, алгоритмы управления, оптимизации, принятие решений, способы их настройки и различные тактики накопления информации в условиях непараметрической неопределенности, а также результаты моделирования для различных задач обучения и адаптации. Основное назначение настоящей работы состоит в том, чтобы показать место непараметрической теории при решении разнообразных задач адаптации и обучения в условиях малой априорной информации. В дальнейшем будет обращено специальное внимание на организационные системы. И здесь важное место будет уделено некоторым вопросам моделирования как в игровых [14], так и в стохастических процессах [15], кроме того, будут рассматриваться некоторые результаты непараметрического оценивания линейных операторов [16].
Таким образом, приведены различные уровни априорной информации, соответствующие, по существу, различным разделам теории управления. Проведен анализ подходов при построении адаптивных и обучающихся систем различного назначения. Отмечено, что в условиях непараметрической неопределенности неприменимы известные методы построения соответствующих алгоритмов. Показан фрагмент синтеза непараметрических алгоритмов идентификации статических и линейных динамических объектов. При этом специально обращается внимание на способ получения алгоритмов управления на основе теории линейных операторов. Дальнейший цикл статей будет посвящен более детальному рассмотрению теории непараметрических систем.
Библиографический список
1. Фельдбаум, А. А. Основы теории оптимальных автоматических систем / А. А. Фельдбаум. М. : Физматгиз, 1963.
2. Цыпкин, Я. 3. Адаптация и обучение в автоматических системах / Я. 3. Цыпкин. М. : Наука, 1968.
3. Методы классической и современной теории автоматического управления : учебник. В 5 т. Т. 1. Математические модели, динамические характеристики и анализ систем управления / под ред. К. А. Пупкова, Н. Д. Егупо-ва. М. : Изд-во Моск. гос. техн. ун-та им. Н. Э. Баумана, 2004.
4. Методы классической и современной теории автоматического управления : учебник. В 5 т. Т. 2. Статистическая динамика и идентификация систем автоматического управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд-во Моск. гос. техн. ун-та им. Н. Э. Баумана, 2004.
5. Методы классической и современной теории автоматического управления : учебник. В 5 т. Т. 3. Синтез регуляторов систем автоматического управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд-во Моск. гос. техн. ун-та им. Н. Э. Баумана, 2004.
6. Методы классической и современной теории автоматического управления : учебник. В 5 т. Т. 4. Теория оптимизация систем автоматического управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд-во Моск. гос. техн. ун-та им. Н. Э. Баумана, 2004.
7. Методы классической и современной теории автоматического управления : учебник. В 5 т. Т. 5. Методы современной теории автоматического управления / под ред. К. А. Пупкова, Н. Д. Егупова. М. : Изд-во Моск. гос. техн. ун-та им. Н. Э. Баумана, 2004.
8. Пугачев, В. С. Теория случайных функций и ее применение к задачам автоматического управления /
В. С. Пугачев. М. : Наука, 1957.
9. Беллман, Р. Динамическое программирование / Р. Беллман. М. : Наука, 1960.
10. Математическая теория оптимальных процессов / А. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. М. : Наука, 1961.
11. Медведев, А. В. Непараметрические системы адаптации / А. В. Медведев. Новосибирск : Наука, 1983.
12. Куликовский, Р. Оптимальные и адаптивные процессы в системах автоматического регулирования / Р. Куликовский. М. : Физматгиз : Наука, 1967.
13. Заде, Л. Т еория линейных систем / Л. Заде, Ч. Чезо-ер. М. : Наука, 1970.
14. Нейман, Д. Теория игр и экономическое поведение / Д. Нейман, О. Монгарштерн. М. : Наука, 1970.
15. Калман, Р. Е. Идентификация систем с шумами / Р. Е. Калман // Успехи мат. наук. Т. 40. 1985. Вып. 4.
16. Medvedev, A. V. Identification and control for linear Dynamic System of unknown Order / A. V. Medvedev // Optimization Techniques IFIP Technical Conference. Berlin ; Heidelberg ; New York : Springer-Verlag, 1975. Р. 48-55.
A. V. Medvedev
NONPARAMETRIC SYSTEMS THEORY. GENERAL APPROACH
This article publications cycle devotes to a new part of control theory. Nonparametric control systems theory is focused on the lower size of a priori information that differs it from the standard parametric control theory. The parametric theory assumes the stage of investigation process model to within to the vector ofparameters choosing, but nonparametric one requires data of process characteristics quality properties. It is principally different.
УДК 62-506.1
Д. А. Игнатьев, А. В. Медведев, Д. В. Сергеев, А. И. Шестернев О НЕПАРАМЕТРИЧЕСКОМ МОДЕЛИРОВАНИИ МНОГОСВЯЗНЫХ ПРОЦЕССОВ
Рассматривается задача идентификации многосвязных процессов в условиях, когда параметрическая структура некоторых связей выходных и входных переменных известна или определена, а для восстановления других используется непараметрическая статистика. В этом случае комбинированная непараметрическая модель процесса представляет собой взаимосвязанную систему стохастических соотношений как параметрического, так и непараметрического типов. Приводятся комбинированные непараметрические модели.
Во многих практических задачах возникает необходимость построения модели достаточно сложного комплекса, состоящего из большого числа локальных объектов, объединенных в многосвязную систему. Многосвязным называется объект, состоящий из некоторого количества взаимосвязанных подсистем, которые описываются некоторой системой неявных функций от входных и выходных переменных.
При моделировании разнообразных дискретно-непрерывных процессов в настоящее время доминирует теория идентификации в узком смысле. Ее содержание состоит в том, что на первом этапе каким-то образом определяется параметрический класс операторов В, например,
а на втором этапе осуществляется оценка параметров в на основе имеющейся выборки
М, М, Й7, г1 =15'}>
где 5 - объем выборки.
Успех решения задачи идентификации в этом случае существенно зависит от того, насколько удачно определен оператор (1).
Идентификация в широком смысле предполагает отсутствие этапа выбора параметрического класса оператора (1), если, конечно, для этого нет достаточных априорных сведений. Часто оказывается значительно проще определить класс операторов х(1) = В(и{1),[1(1),1) на основе сведений качественного характера, например, линейности процесса или типа нелинейности, однозначности либо неоднозначности и др. В этом случае задача идентификации состоит в оценивании этого оператора на основе выборки.
В данной работе речь пойдет об описании исследуемого процесса с точки зрения идентификации в широком смысле.
Уровни априорной информации. Важную роль при решении задачи идентификации играет уровень априорной информации об исследуемом процессе. Априорная информация является необходимой для математической постановки задач, и в зависимости от ее уровня, методы решения задач оказываются различными.
Могут быть выделены следующие уровни априорной информации. По мере усиления неопределенности основная задача и ей сопутствующие могут быть рассмотрены при следующих уровнях:
- байесов уровень априорной информации, при котором информация об объекте может быть как полной (максимально возможной), когда точно заданы модель объекта, статистические характеристики наблюдений и возможных помех, так и неполной, когда вероятностные характеристики наблюдений, помех и вид модели известны с точностью до набора параметров;
- уровень параметрической неопределенности, при котором неизвестны законы распределения измерений и помех, а структура модели задана с точностью до набора параметров [1]. Присутствуют выборки статистически независимых наблюдений переменных объекта;
- уровень непараметрической неопределенности, когда неизвестны ни законы распределения помех и измерений, ни структура модели. Известны некоторые качественные характеристики объекта: например, объект статический или динамический, однозначны или нет связи между его переменными и т. п. [2]. Имеются выборки статистически независимых наблюдений переменных объекта.
Многосвязные системы. Во многих практических задачах возникает необходимость построения модели достаточно сложного комплекса, состоящего из большого числа локальных объектов, объединенных в многосвязную систему.
Функционирование объекта происходит по схеме, приведенной на рис. 1.