Теория непараметрических систем. Управление II

Медведев А. В.

34. Vlasov A. Ju., Zaharov Ju. V., Filenkova N. V.

VestnikSibGAU, 2010, № 4 (30), p. 15-20.

35. Lopatin A. V., Udalcov R. A. Vestnik SibGAU, 2010, № 5 (31), p. 221-227.

36. Nesterov V. A. Vestnik SibGAU, 2010, № 5 (31), p. 236-242.

37. Nesterov V. A., Lopatin A. V. Vestnik SibGAU, 2010, № 5 (31), p. 242-246.

38. Nesterov V. A. Vestnik SibGAU, 2011, № 2 (35), p. 48-54.

39. Frost M. B. Vestnik SibGAU, 2011, № 2 (35), p. 76-80.

40. Frost M. B. Vestnik SibGAU, 2011, № 3 (36), p. 8-11.

41. Senashov S. I. Vestnik SibGAU, 2011, № 3 (36), p. 85-88.

42. Deev P. O. Vestnik SibGAU, 2011, № 4 (37), p. 25-30.

43. Senashov S. I., Gomonova O. V., Miheev A. E. Vestnik SibGAU, 2011, № 5 (38), p. 88-90.

44. Senashov S. I., Filjushina E. V., Popov A. M., Kovalev I. V. Vestnik SibGAU, 2011, № 3 (36), p. 90-92.

45. Senashov S. I., Filjushina E. V., Popov E. A. Vestnik SibGAU, 2011, № 3 (36), p. 92-95.

46. Burmak V. I. // Vestnik SibGAU, 2012, № 1 (41), p. 10-15.

47. Lopatin I. A. // Vestnik SibGAU, 2012, № 1 (41), p. 28-31.

48. Annin B. D., Chirkunov Ju. A., Belmecev N. F. Vestnik SibGAU, 2012, № 3 (43), p .4-7.

49. Nesterov V. A. Vestnik SibGAU, 2012, № 3 (43), p. 56-62.

50. Senashov S. I., Filjushina E. V. Vestnik SibGAU,

2012, № 4 (44), p. 53-56.

51. Lopatin A. V., Zaharov Ju. V., Ohotkin K. G., Viljanen V. V., Pashkovskij A. V. Vestnik SibGAU, 2012, № 5 (45), p. 75-80.

52. Lopatin I. A. Vestnik SibGAU, 2012, № 5 (45), p. 80-84.

53. Senashov S. I. Vestnik SibGAU, 2012, № 5 (45), p. 104-106.

54. Nesterov V. A. Vestnik SibGAU, 2013, № 1 (47), p. 68-74.

55. Senashov S. I., Filjushina E. V. Vestnik SibGAU,

2013, № 1 (47), p. 79-82.

56. Senashov S. I. DAN, 1995, 345 (5), p. 619-620.

57. Avtonomov N. N., Puchnin M. S. Vestnik SibGAU, 2011, № 5 (38), p. 124-127.

УДК 62.501

ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ. УПРАВЛЕНИЕ - II

А. В. Медведев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Россия, 660014, Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: [email protected]

Формулируются некоторые новые задачи управления, возникшие на основе анализа реально протекающих процессов. Обсуждается необходимость анализа оптимальных, или близких к ним, параметрических алгоритмов управления с целью их исследования на предмет «грубости» ранее высказанных гипотез, их соответствия реальности или полученных ранее оценок соответствующих параметров моделей и регуляторов. Предлагается путь управления сложными дискретно-непрерывными процессами в диалоговом режиме на основе изменяющихся сцен в трехмерном пространстве, характеризующих поведение управляемого процесса в многомерном пространстве. Рассматриваются некоторые алгоритмы управления и приводятся результаты вычислительных экспериментов.

Ключевые слова: дискретно-непрерывный процесс, прогноз, диалоговая система, дуальное управление, непараметрические алгоритмы управления, адаптивное управление.

THEORY OF NONPARAMETRIC SYSTEMS. CONTROL - II

A. V. Medvedev

Siberian State Aerospace University named after academician M. F. Reshetnev 31 “Krasnoyarskiy Rabochiy” prosp., Krasnoyarsk, 660014, Russia. Е-mail: [email protected]

The author formulates some new control problems, arising on the basis of the analysis of real processes and discusses the necessity of the optimal, or close to it, analysis, parametric algorithms of control with the purpose of their

investigation with respect to the «ruffness» of the previously formulated hypotheses, their conformity to the reality or earlier received investigations of the relevant parameters of models and controllers. A way of the complex discrete-continuous processes control in dialog box mode on the basis of the changing scenes in three-dimensional space, describing the behaviour of a controlled process in the multidimensional space is proposed. Some control algorithms are discussed and the computational results of experiments are presented.

Keywords: discrete and continuous process, forecast, dialogue system, dual control, nonparametric control algorithms, adaptive control.

Традиции теории управления могут быть объединены в два больших направления. Первое из них состоит в выборе параметрической структуры модели исследуемого процесса и синтеза на его основе параметрической же структуры управляющего устройства. Исторически этот путь был пройден от теории аналитического конструирования регуляторов до теории оптимальных систем управления: детерминированных, стохастических, адаптивных и обучающихся. Второе направление составляют многочисленные задачи анализа систем управления, когда структура управляющего устройства каким-то образом найдена или предложена. Типичными являются в последнем случае законы регулирования П, ПИ, ПИД и др. Основная задача этого направления состоит в обеспечении устойчивости замкнутых схем и заданного качества регулирования.

Ранее [1] уже обращалось внимание на формулировку задач управления при различных уровнях априорной информации, различной дискретности измеряемых переменных, сложности процесса и др. Конечно же, эти факторы, безусловно, влияют на окончательную формулировку задачи управления. Следует обратить внимание на то, что теория оптимальных систем управления по существу является теорией оптимального управления принятыми моделями управляемых процессов, которые, конечно же, в большей или меньшей степени отличаются от реальных. Отсюда, синтезированные алгоритмы оптимального управления отнюдь таковыми не являются по отношению к реальным процессам. Известны случаи, когда на практике оптимальные алгоритмы управления вообще оказывались неработоспособными. На этом пути возникает необходимость исследования новых задач, возникающих при традиционном взгляде на построение систем управления дискретно-непрерывными процессами. Ниже мы специально остановимся на формулировке этих задач.

Исходя из того, что теория оптимального управления и, соответственно, алгоритмы оптимального управления следует считать оптимальными по отношению к принятым моделям, которые, конечно же, в той или иной степени отличаются от реальности. В этой связи возникает крайне важное направление исследований, связанное с компьютерным анализом

Теория - в виду практики.

Девиз конгрессов 1ЕЛС

Сегодня всему наступает пора,

Что бредом казалось вчера.

Э. Верхарн

оптимальных алгоритмов управления процессами, отличающимися от принятых на стадии синтеза оптимальных алгоритмов. Иными словами, такое исследование направлено на решение вопроса - как будут функционировать системы оптимального управления, если реально протекающий процесс отличается в большей или меньшей мере от того, который был положен в основу синтеза алгоритма оптимального управления.

Если же управляемый процесс оказывается слишком сложным, зависящим от большого числа входных и выходных переменных, контролируемых в различные интервалы времени, а в ряде случаев просто неконтролируемых, то может быть предложена иная диалоговая система управления. Она может представлять собой «движущийся» сценарий в трехмерных изменяющихся пространствах, характеризующих поведение процесса в многомерном пространстве.

Параметрическое дуальное управление. Ранее была изложена формулировка задачи дуального управления в постановке А. А. Фельдбаума [2]. Приведем систему параметрического дуального управления в постановке Я. З. Цыпкина [3]. Как и ранее, обозначим входную переменную объекта и(/), а выходную - х(/). В этом случае критерий оптимальности в задаче идентификации может быть определен в виде: JИ (с) = М {\¥и (хЩ - Е( -1],Ыр - 1])с)} . (1)

Критерий оптимальности управляющего устройства можно записать в развернутой форме:

JУ (Ь, с) = М {иу (х*[/] - Е( -1], ¥ (х[/ -1]))с)} .(2)

*

где х [/] - задающее воздействие; Ии - критерий идентификации, сформированный на основании имеющейся априорной информации; Иу - критерий управления, сформированный на основании имеющейся априорной информации; ¥ - заданный закон управления.

Оценка параметров с[/], Ь[/] осуществляется на основании метода стохастических аппроксимаций, в основу которого положены рекуррентные вероятностные процедуры оценки параметров в процессе функционирования замкнутой схемы, подробно изложенные в [3].

Непараметрическая система дуального управления. В условиях непараметрической неопределенности предполагается, что априорной информации недостаточно для определения параметрической модели процесса. Тем не менее, предполагаются известными некоторые качественные свойства, характеризующие поведение объекта. Например, объект обладает взаимно однозначной или неоднозначной характеристикой процесса для безынерционых систем, является линейным или указан тип нелинейности для динамических систем и др. Рассмотрим схему, представленную на рис. 1.

Возможно, некоторое отношение к обсуждаемой нами проблеме управления, имеет высказанная Г. Вейлем [5] идея симметрии, зеркальной симметрии. Может быть не случайно лекции, посвященные этой проблеме, прочитанные в Институте высших исследований Принстонского университета Г.Вейль назвал «моей лебединой песней». И далее: «Красота тесно связана с симметрией...ее синоним гармония...».

Общая схема непараметрического дуального управления представлена ниже на рис. 2.

Рис. 1

Из вышеприведенной схемы видно, что

х(ґ) = А < и(ґ) > , и(ґ) = А- < х(ґ) = х*(ґ) > , (3)

где А - неизвестный линейный оператор процесса; А- - оператор, обратный А. Из (3), с учетом, что АА-1 = I - единичный оператор, можно получить

х(ґ) = АА- < х(ґ) = х*(ґ) >= х*(ґ). (4)

Таким образом, вид идеального регулятора (□регулятор) может быть представлен в форме (3). Используя уравнение (4), можно, задавая желаемую траекторию х* (ґ), получить идеальное значение управления и*(ґ). Однако, ключевая проблема на этом пути состоит в том, что в большинстве случаев построить такую схему невозможно, тем более, что оператор А - неизвестен.

Схема, показанная на рис. 1 требует пояснения. С математической точки зрения речь идет о преобразовании (отображении) и є и в х є X , где и и X -линейные векторные пространства, т. е. х = Аи .

Представление х = АА1х означает преобразование х в самого себя, т. е. и и X изоморфны. В реальности дело обстоит несколько иначе. Как справедливо заметил Н. Виннер: «Мы, математики, нуждаемся лишь в таких недорогих материалах, как бумага, и, быть может, типографская краска...». На самом деле нам приходится иметь дело с реальным объектом (турбина, реактор, плавильная печь и т. п.), а точнее с процессами, которые протекают в этих объектах, а не с оператором. В этой связи, если А для нас объект, то А-1 возможно назвать антиобъектом. Тогда можно сказать, что рис. 1 иллюстрирует «включение» на входе объекта антиобъекта, т. е. того, что в теории управления называют регулятором или управляющим устройством.

Уместно вспомнить, что приставка анти уже встречалась в науке ранее. У Н. А. Власова [4] мы встречаем: «Открытие античастиц - одно из крупнейших открытий физики этого столетия. Оно, в сущности, нашло вторую половину мира.».

Рис. 2

Здесь (рис. 2) в результате функционирования замкнутого контура управления происходит уточнение оценки обратного оператора объекта.

Пусть линейный динамический процесс описывается разностным уравнением вида:

х[ґ] = ^ атх[ґ - т] + а0и[ґ].

(5)

где а0, ат, т = 1,і - коэффициенты модели. Поступим, в связи с вышеизложенным, несколько «необычным образом». Перепишем уравнение (5) относительно и[ґ]:

( і Л

и[ґ ] = а,-1 х[ґ] -^ атх[ґ - т]

(6)

В этом случае выражение (6) играет роль обратного оператора по отношению к оператору А объекта.

Вычислительный эксперимент. Для иллюстрации работы «включенного» обратного оператора на входе объекта (рис. 1) приведем следующий пример. При описании объекта была принята существенно нелинейная характеристика (рис. 3). По результатам измерения «входа-выхода» процесса была получена выборка (иі, хі, і = 1,100). Измерение выходной переменной объекта осуществлялось с 5-ти процентной аддитивной помехой. Далее, в соответствии с (4) находилось управляющее воздействие при изменяющихся значениях х (ґ) и это управление подавалось на вход объекта, который реагировал на входное управление и(ґ) соответствующими значениями выхода х(ґ). Результаты эти расчетов иллюстрируются на рис. 4.

На вышеприведенных рисунках проиллюстрирован факт включения приближенного обратного оператора на входе объекта и в итоге оказывается, что

хґ и х* (4).

т=1

Рис. 3

Рис. 4

Рис. 5

Рис. 6

Рис. 7

Был взят объект, описываемый разностным уравнением третьего порядка, который был разрешен относительно управляющего воздействия, которое составляло содержание регулятора. В случае, если коэффициенты уравнения, описывающего объект, и коэффициенты модели совпадают, то естественно ожидать, что выход объекта, в соответствии с рис. 2, будут совпадать. Мы не будем иллюстрировать этот случай. В случае воздействия помех в канале связи переход объекта из одного состояния в другое иллюстрируется рис. 6.

При не совпадающих значениях коэффициентов естественно ожидать, что при использовании разомкнутой системы управления процесс будет расходиться, что и иллюстрирует рис. 6. В последнем случае

необходимо, во-первых, уточнять значения коэффициентов, а во-вторых, использовать обратную связь, то есть возвращаемся к схеме рис. 2.

Рассмотрим достаточно детально схему локальной системы, представленную на рис. 7, где A - неизвестный оператор объекта; УУ - устройство управления; х^) - выходная переменная процесса; и($) -управляющее воздействие; ц(^) - входная контролируемая, но неуправляемая переменная процесса;

) - переменная, характеризующая промежуточное состояние процесса, дающая дополнительную информацию о протекании процесса. Входная переменная Х(^) не поддается контролю, Е(0 - векторное слу-

чайное воздействие, / - непрерывное время, Нц,

Ни, Нх , Ню - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, устройства для измерения наблюдаемых переменных, ц, щ, х(, ю( - означает наблюдение ц^), и (t), х^), ю^) в дискретное время /. Контроль переменных (х, и, ц, ю) осуществляется через некоторый интервал времени, т. е. хг, и1, цг, юг, г = 1,5 - выборка измерений переменных процесса Х U1, ю1 ), (х2 , ^, ^ Ю2 ),..., Х , и5 , Ц5 , Ю5 ^..^ 5 -объем выборки, Иц (/), И* (/), И* (/), Ию (/) со значком вверху - случайные помехи измерений соответствующих переменных процесса.

В этом случае выходные переменные, как и ранее, зависят от входных и ю^) (дополнительная информация), то есть следующим образом:

х(0 = А(и(0, ц(0,ю(0,Х(0,Е(0,t). (7)

Обучающая выборка состоит из элементов «вход-ных-выходных» переменных, доступных для измерений,

и может быть представлена в виде {хг, иг, ц }, г = 1,5,

х = (x1, x2,..., хп ), и = ^ ^..^ ик ), Ц = (Ц^ Ц2,..., Цт ).

Безусловно, управляемый процесс следует отнести к категории сложных, находящихся под воздействием неуправляемых переменных. В частности, на рис. 7 -это вектор Х(Г). Отсюда, естественно считать, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

процесс протекает в некоторой оболочке типа «облако» в многомерном пространстве «входных-

выходных» переменных. Для того, чтобы визуализировать, иными словами, обеспечить «видение» управляемого процесса в пространстве «входных-выходных» переменных предлагается использование постоянно развивающегося во времени сценария, характеризующего поведение изменяющегося во времени процесса, иллюстрируемого в трехмерном пространстве изменяющихся координат, определяемых вектором «входных-выходных» переменных. Область нормального протекания исследуемого процесса показана на нижеследующем рисунке в виде точек, а текущее состояние процесса, оцениваемое ЛПР (оператор, диспетчер) - жирной точкой. В компьютерном диалоге возможно эту ситуацию реализовать в варианте «компьютерной игры», доступной для визуализации состояния процесса в многомерном пространстве. Естественно считать, что в случае, если состояние процесса принадлежит соответствующему облаку, то процесс протекает нормально, в случае, если он на границе или вне, то требуется вмешательство ЛПР в ход процесса. Таким образом, управление подобным сложным процессом может быть реализовано в диалоговом режиме. Ясно, что в этом случае возникают некоторые новые задачи, которые будут изложены ниже.

Пусть управляемый процесс следует отнести к категории сложных, находящихся под воздействием векторных входных переменных. Отсюда, естествен-

но считать, что процесс протекает в некоторой оболочке типа «облако» в многомерном пространстве «входных-выходных» переменных. Для того, чтобы визуализировать, иными словами, обеспечить «видение» управляемого процесса в пространстве «вход-ных-выходных» переменных предлагается использование постоянно развивающегося во времени сценария, характеризующего поведение изменяющегося во времени процесса, иллюстрируемого в трехмерном пространстве изменяющихся координат, определяемых вектором «входных-выходных» переменных. Область нормального протекания исследуемого процесса показана на нижеследующем рисунке в виде точек, а текущее состояние процесса, оцениваемое ЛПР (оператор, диспетчер) - жирной точкой. В компьютерном диалоге возможно эту ситуацию реализовать в варианте «компьютерной игры», доступной для визуализации состояния процесса в многомерном пространстве. Естественно считать, что в случае, если состояние процесса принадлежит соответствующему облаку, то процесс протекает нормально, в случае, если он на границе или вне, то требуется вмешательство ЛПР в ход процесса. Таким образом, управление подобным сложным процессом может быть реализовано в диалоговом режиме. Ясно, что в этом случае возникают некоторые новые задачи, которые будут изложены ниже. Итак, предположим, что на вход объекта поступает управляющая переменная и (/) е Ят и неуправляемая, но контролируемая переменная ) е Як. Выход объекта, как и ранее, обозначим х^) е Яп. В процессе измерения «входных-выходных» переменных объекта может быть сформирована обучающая выборка {, ц, хг, г = 1,5} . Поскольку мы не можем визуализировать эту обучающую выборку в многомерном пространстве, то воспользуемся следующим сценарием.

Введем трехмерные пространства, координаты которых представляют собой компоненты и, д и х. Чередование этих компонент показано на нижеследующих рисунках. Точками показаны элементы обучающей выборки {иг, ц, хг, г = 1,5} . Жирная точка иллюстрирует положение текущего состояния управляемого процесса. Суть состоит в следующем: на экране монитора с некоторой заданной скоростью сцены сменяют друг друга (рис. 8, а, затем рис. 8, б и т. д.). При этом мы можем наблюдать, какое положение в многомерном пространстве принимает текущее состояние процесса (жирная точка) по отношению к ранее наблюдаемым «входным-выходным» переменным объекта. Из этого исследователь может сделать вывод о характере течения процесса. Если значения выходной переменной х (жирная точка) расположены внутри элементов обучающей выборки, то ход процесса можно считать удовлетворительным. Если значение х приближается к границе (находится на границе, либо за ее пределами), то необходимо вмешательство в процесс управления ЛПР.

а

h

t*" «J

б ij ж

:У-

д

L Ли

Л ■ ►

№,

►

в

Um

е

±Xn

Urn —►

Ujj

ftk.

з

и

Рис. 8

Естественно, при разработке такой системы возникают некоторые специальные задачи, в частности, построение модели исследуемого процесса, если принять, что измерения выходной переменной x(t) е Кп или отдельных ее компонент осуществляются через значительные промежутки времени; восстановление «облака» в пространстве «входных-выходных» переменных по имеющейся обучающейся выборке

{и1, {, xi, / = 1,5} . На этом пути неизбежно возникнет

требование максимального упрощения соответствующих алгоритмов с целью достижения необходимого быстродействия.

Таким образом, при движении вышеприведенных сцен и текущего состояния процесса (или его прогноза) можно судить о характере его протекания, а также о необходимости вмешательства в ход процесса в случае необходимости.

На фоне традиционно используемых подходов при построении управляющих систем дискретно-непрерывными процессами, которые могут быть, в значительной степени, отнесены к категории параметрических, рассматриваются явно не традиционные направления.

Один из них, как уже не однократно обращалось внимание ранее, тесно связан с восстановлением обратного оператора управляемого процесса. Другой путь состоит в разработке, исследовании и практическом применении обучающихся алгоритмов при ши-

роком использовании компьютерных технологий при управлении сложными процессами.

Библиографические ссылки

1. Медведев А. В. К теория непараметрических систем. Управление-I // Вестник СибГАУ. 2013. № 2 (48). С. 57-64.

2. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.

3. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968. 320 с.

4. Власов Н. А. Антивещество. М. : Атомиздат, 1966. 184 с.

5. Вейль Г. Симметрия. М. : Наука, 1968. 191 с.

References

1. Medvedev A. V. Vestnik SibGAU, 2013, № 2 (48), р. 57-64.

2. Feldbaum A. A. Osnovi teorii optimalnix i obuchayschihsya sistem (Fundamentals of the optimal automatic systems theory). Moscow, Fizmatgiz, 1963, 552 p.

3. Tsypkin J. Z. Adaptacia I obuchenie v avtomaticheskih sistemah (The adaptation and learning in automatic systems). Moscow, Nauka, 1968, 320 p.

4. Vlasov N. А. Antiveshestvo (Antimatter). Moscow, Atomizdat, 1966, 184 p.

5. Weil G. Simetria (Symmetry). Moscow, Nauka, 1968, 191p.

Теория непараметрических систем. Управление II Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Медведев А. В.

Похожие темы научных работ по математике , автор научной работы — Медведев А. В.

THEORY OF NONPARAMETRIC SYSTEMS. CONTROL II

Текст научной работы на тему «Теория непараметрических систем. Управление II»