Научная статья на тему 'Критерии оптимального управления динамической системой'

Критерии оптимального управления динамической системой Текст научной статьи по специальности «Механика и машиностроение»

CC BY
205
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИЯ / ДИНАМИЧЕСКАЯ СИСТЕМА / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / КОЭФФИЦИЕНТ ЭНТРОПИИ / ЭКСЦЕСС РАСПРЕДЕЛЕНИЯ / ВЕРОЯТНОСТЬ РАСПРЕДЕЛЕНИЙ / КРИТЕРИЙ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ

Аннотация научной статьи по механике и машиностроению, автор научной работы — Полосин В.Г., Бодин О.Н.

Статья посвящена разработке критерия оптимального управления на основе исследования энтропийных и информационных характеристик динамической системы. Рассмотрены свойства и возможности динамической системы, управление которой основано на анализе информационного содержания выборки значений выходного параметра. Предложен способ энтропийно-параметрического управления системы, сохраняющий возможность управления при переходе в низкоэнтропийные состояния.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Критерии оптимального управления динамической системой»

УДК 517.977.5: 519.216.1: 681.5.01: 62.599

В. Г. Полосин, О. Н. Бодин

Пензенский государственный университет

Критерии оптимального управления динамической

системой

Статья посвящена разработке критерия оптимального управления на основе исследования энтропийных и информационных характеристик динамической системы. Рассмотрены свойства и возможности динамической системы, управление которой основано на анализе информационного содержания выборки значений выходного параметра. Предложен способ энтропийно-параметрического управления системы, сохраняющий возможность управления при переходе в низкоэнтропийные состояния.

Ключевые слова: информация, динамическая система, оптимальное управление, коэффициент энтропии, эксцесс распределения, вероятность распределений, критерий оптимальности управления.

Criterion for optimal control of dynamic systems

The article is devoted the development of criterion of optimum control on the basis of research of entropy and information characteristics of the dynamic system. Properties and possibilities of the dynamic system which control is based on the analysis of the information maintenance of a sample of output parameter values are considered. The article provides the entropy-parametric way of control of a dynamic system, preserving the possibility of control in the transition time to low-entropy state.

Key words: the information, dynamic system, optimum control, the factor of entropy, a distribution excess, probability of distributions, criterion of optimum control.

1. Краткий обзор способов оптимального управления динамической системой

В современной технике для описания и управления реальными физическими объектами используют математическую абстракцию «динамическая система», позволяющую проследить изменения и эволюционное развитие объекта с течением времени. Важнейшее свойство динамической системы состоит в возможности однозначного предсказания поведения системы по известному её состоянию в начальный момент времени.

Наличие отрицательной обратной связи позволяет обеспечить управление динамической системы на основе принципа отклонения, состоящего в уменьшении ошибки регулирования, т.е. разнице заданных хз и фактических х значений контролируемого параметра [1]:

Случайный характер изменения состояния системы обуславливает целесообразность использования статистического анализа состояния динамической системы для принятия решения по её управлению. В качестве критерия оптимальности управления таких систем широко распространено условие минимума дисперсии или среднего квадратического отклонения [1, 2]:

V. G. Polosin, O. N. Bodin Penza State University

A = X3 — X\.

(1)

D ^ min, a ^ min.

При наличии нескольких контролируемых параметров для управления динамической системой распространена оптимизация по Парето, заключающаяся в минимизации суммы СКО нескольких параметров или нахождении множества парето-оптимальных альтернатив, эквивалентных минимизации взвешенной целевой функции [11, 12]. Среди наиболее актуальных направлений исследования моделей управления динамической системой следует выделить подходы, основанные на анализе информационных процессов, происходящих при развитии динамической системы [3, 5, 10]. Исследование информационного содержания параметров объекта управления и его внутренней упорядоченности посредством анализа энтропии результатов наблюдения нашло широкое освещение в современной литературе [4, 6, 7].

В работе [3] рассмотрен способ исследования динамической системы на основе построения энтропийных моделей, согласно которому моделирование системы осуществляется с помощью отображения множества варьируемых значений контролируемого параметра х в неслучайную функцию комплексного энтропийного потенциала:

Ьл = Д,

Хп

где хп - значение параметра, характеризующее состояние системы, Дэ - энтропийный потенциал параметра, определяемый как половина диапазона равномерного распределения, имеющий такую же информационную энтропию Н (х), что и закон распределения контролируемого параметра.

При этом для оценки энтропийного потенциала используется следующая взаимосвязь с вероятностными характеристиками распределения контролируемого параметра:

Дэ = Кэ(Т, (3)

где а - среднее квадратическое отклонение контролируемого параметра; Кэ - коэффициент энтропии, характеризующий дестабилизирующие свойства динамической системы по закону распределения контролируемого параметра: 0 ^ Кэ ^ 2, 066.

В качестве критерия оптимальности положено условие минимума энтропийного потенциала:

Дэ ^ min . (4)

По мнению авторов, критерии (1), (2), (4) не обеспечивают оптимальное управление динамической системой в низкоэнтропийном состоянии.

2. Оптимизация управления динамической системой на основе минимизации энтропийного потенциала

При организации управления динамической системой на основе минимизации энтропийного потенциала возможен вариант минимизации энтропийного потенциала Дэ при условии, что оценка энтропийного коэффициента Кэ известна на основе аналогий или получена методами математического анализа. В этом случае изменение энтропийного потенциала сводится к масштабированию изменения среднеквадратичного отклонения (СКО) в соответствии с выражением (3), что не позволяет учесть информационные свойства распределения при управлении объектом. В результате такого метода управления остаётся неясным, каким образом обеспечивается возможность учёта перехода системы в низкоэнтропийное состояние, где минимизация отклонения обеспечивается за счёт уменьшения коэффициента энтропии [3].

Другой вариант управления динамической системой предполагает, что для минимизации величины энтропийного потенциала Дэ с помощью трансформации закона распределения контролируемого параметра необходимо одновременно учитывать изменение СКО и энтропийного коэффициента. Основной недостаток такого способа управления состоит в

возможности самостоятельного перехода динамической системы в устойчивые неблагоприятные состояния с низкими значениями энтропийного потенциала.

Для выявления особенностей управления на основе минимизации энтропийного потенциала рассмотрим описание поведения динамической системы в пространстве энтропийного коэффициента и контрэксцесса. Топографическая диаграмма на рисунке 1, построенная в соответствии с известными работами Новицкого П.В. [8, 9], иллюстрирует изменения состояний динамической системы в осях коэффициента энтропии и контрэксцесса распределения выходного параметра.

Рис. 1. Топографическая диаграмма состояний динамической системы в осях коэффициента энтропии и контрэксцесса распределения выходного параметра

В пространстве коэффициента энтропии Кэ оптимальной работе системы соответствует состояние 1, для которого характерны коэффициент энтропии Ко и контрэксцесс ко. Линия А ограничивает часть пространства возможного положения состояния произвольной системы при её оптимальной работе. В этом пространстве значение энтропийного коэффициента больше 1. Для примера множества распределений с высоким значением энтропии дана группа кривых В\ и В2, соответствующих композициям равномерного распределения с различными экспоненциальными распределениями.

Отклонение от заданного оптимального состояния приведёт систему к переходу в низкоэнтропийное состояние. На топографической диаграмме распределений подобные отклонения показаны в виде переходов С\,С2,С3,С4,С5,С6,С7.

Различие в поведении системы, находящейся в области оптимального состояния с большим значением коэффициента энтропии и системы, перешедшей в одно из неблагоприятных состояний с низким значением энтропии, демонстрируют распределения на рис. 2, где оптимальному состоянию динамической системы соответствует кривая распределения Д (у) выходного параметра с большим значением энтропии. В этом случае результаты измерения выходного параметра системы сгруппированы в области его математического ожидания М(у), и, следовательно, наиболее приближены к оптимальному значению наблюдаемого параметра.

Переход динамической системы в низкоэнтропийное состояние может быть вызван появлением в отдельных узлах системы больших сил трения или других форм гистерезиса значений выходного параметра, которому на топографической диаграмме (см. рис. 1) соответствует участок кривой Б между точками 5 и 6, где энтропийный коэффициент

меньше 0,2. Дальнейшее увеличение внутренних сил трения приводит систему в ещё более низкоэнтропийное состояние с дискретными распределениями выходного параметра. Переходу динамической системы в состояние с дискретными значениями выходного параметра соответствует дискретное распределение /3 (у) на рисунке 2. В этом случае все значения выходного параметра будут находиться на расстоянии СКО относительно математического ожидания и, как следствие, будут наиболее удалены относительно наиболее благоприятного параметра системы. При этом энтропийный потенциал системы Дэ согласно выражению (3) стремится к нулю. Так как управление системой осуществляется на основе минимизации энтропийного потенциала Дэ, то подобное нерабочее состояние системы будет восприниматься как благоприятное.

Рис. 2. Вероятностные распределения выборки значений выходного параметра при различных состояниях системы

Появление в течение длительного времени фиксированных неизменных значений выходного параметра при наличии случайных входных воздействий и случайных внешних влияющих факторов также указывает на неблагоприятное или нерабочее состояние системы, которое, возможно, вызвано выходом из строя её отдельных узлов. На топографической диаграмме эти состояния расположены на кривой экспоненциальных распределений Е в точках 2, 3 и 4 с параметрами формы, равными 1/2, 1/3 и 1/4 соответственно. Такому состоянию будет соответствовать островершинное распределение /4 (у) значений выходного параметра (см. рис. 2). В этом случае все измеренные значения выходного параметра группируются непосредственно вблизи математического ожидания, которое может находиться на значительном удалении от его оптимального результата. В связи с низким значением энтропийного коэффициента это состояние также имеет значение энтропийного потенциала меньшее, чем в оптимальном состоянии, поэтому динамическая система воспринимает это состояние также как благоприятное.

Из рассмотрения топографической диаграммы распределений следует, что существует целое множество низкоэнтропийных распределений, которые система, построенная по алгоритму минимизации энтропийного потенциала Дэ путём трансформации энтропийного коэффициента Кэ, воспринимает как благоприятные состояния несмотря на то, что эти состояния являются устойчивыми неработоспособными состояниями системы. В этих состояниях системы происходит отклонение закона распределения относительно оптимального состояния, имеющего характерную степень неопределённости. В качестве примера множества низкоэнтропийных состояний на рисунке 1 даны возможные композиции экспоненциальных и двухмодальных распределений в виде характерных групп: группы кривых Е\ и Е2, соответствующих композициям экспоненциальных распределений с дискретным двухзначным распределением, и группы кривых Е\ ,Е2 и Е3, соответствущих композициям двухмодальных распределений с экспоненциальным распределением с параметром формы, стремящемся к нулю.

ЛуУ

о

М(у)

Переход системы в устойчивые состояния, отличные от оптимального состояния, показывает, что динамическая система, способ управления которой основан на минимизации энтропийного потенциала, не обеспечивает ряд важных свойств, необходимых для её оптимального управления:

- контроль формы распределения управляемых параметров, в которой заложена информация о внутреннем состоянии объекта;

- распознавание оптимального состояния динамической системы от устойчивых неработоспособных состояний;

- сохранение контроля и управления над динамической системой при её переходе в низкоэнтропийное состояние, что важно для обеспечения возврата системы в оптимальное состояние через ряд промежуточных состояний;

- получение оценок изменения информационных параметров динамической системы непосредственно по данным выборки значений выходного параметра;

- отсутствие анализа неблагоприятных состояний динамической системы и возврата в оптимальное состояние.

Таким образом, в способе управления динамической системой, основанном на минимизации энтропийного потенциала, принципиально возможны преднамеренные переходы системы в устойчиво неработоспособные или неблагоприятные состояния с последующим длительным поддержанием её контроля и управления в этих состояниях, воспринимаемых системой как благоприятные состояния.

3. Оптимизация управления динамической системой на основе минимизации энтропийно-параметрического потенциала

Предлагаемый авторами статьи способ управления динамической системой основан на использовании критерия оптимального управления, позволяющего однозначно определить переход динамической системы из оптимального состояния в устойчиво неработоспособные состояния [13]. Суть предлагаемого подхода заключается в обеспечении нахождения системы в области её оптимальных состояний путём трансформации закона распределения таким образом, чтобы отклонения коэффициента энтропии ДКэ и контерэксцесса Дк стремились к нулевым значениям:

ДКэ - 0, _

Дк - 0. (5)

Условия минимизации отклонений коэффициента энтропии и контрэксцесса (5) достигается посредством постоянного наблюдения за отклонением формы распределения выходного параметра и его целенаправленной трансформации путём изменения свойств системы с помощью органов управления. В пространстве коэффициента энтропии и контрэксцесса отклонения этих параметров откладываются во взаимно перпендикулярных направлениях. Поэтому для нахождения системы в области оптимальных состояний удобно использовать критерий оптимальности, полученный путём суммирования отношения квадратов отклонений коэффициента энтропии и контрэксцесса от их оптимальных значений:

1 =\1()2 + (^)2 < 7тах, (6)

где 7тах - максимальное значение энтропийно-параметрического критерия в области оптимального управления; Кэо, ко - коэффициенты энтропии и контрэксцесса оптимального состояния системы, известные из анализа самой системы или анализа предыдущих результатов наблюдения; Кэ, к - коэффициенты энтропии и контрэксцесса, оцениваемые по выборке значений выходного параметра динамической системы.

Формулы для расчёта коэффициенты энтропии Кэ и контрэксцесса к по выборке значений выходного параметра имеют вид

= Д • <7' к=£ (8)

где а4, - СКО и центральный момент четвёртого порядка соответственно, Дэ - энтропийный потенциал, рассчитываемый по формуле:

1 . , 1

Дэ = -N ■ exp(-щ ■ 1п(п3)). (9)

3 = 1

Здесь Ду - ширина интервалов группирования выходного параметра; п - число значений выходного параметра в ]-м интервале группирования; N - число значений выборки выходного параметра; т - число интервалов группирования.

Среди статистических параметров распределения для контроля формы наиболее важен коэффициент эксцесса е распределения, характеризующий островершинность кривой [8, 9]. На практике более удобно применение контрэксцесса к, обратного эксцессу распределения, значение которого находится в интервале от 0 до 1 из выражения (8). При оптимальном состоянии системы заданному распределению соответствует оптимальное значение контрэксцесса ко распределения. Тогда для нахождения системы вблизи оптимального состояния существует область отклонений контрэксцесса распределений от его оптимального значения, в которой справедливо условие оптимизации вида

К ^ Копт- (10)

Подставив в условие (10) выражение (8), записанное через оптимальные параметры системы и параметры распределения для выборки выходного параметра, получим, что для обеспечения условия оптимизации (10) необходимо сохранение отношения центрального момента четвёртого порядка к четвёртой степени СКО вида

^4опт __(11)

( аопт)2 Копт

В правой части выражения (11) находидся неизменное конечное значение, характерное для оптимального состояния. Так как для оптимального состояния СКО стремится к минимальному значению, то значение центрального момента четвёртого порядка также должно стремиться к своему минимальному значению. Тогда получим условие оптимальности контроля и управления динамической системы для центрального момента четвёртого порядка вида

( аопт) . /in\

^4опт =--> min . (12)

Копт

Из рассмотренного выше материала следует, что необходимым требованием выполнение критерия оптимальности (5) для динамической системы является одновременное обеспечение целого ряда условий оптимизации системы: условий минимизации энтропийного потенциала (9), СКО и центрального момента четвёртого порядка (12). Эти условия имеют вид

а) а ^ min,

б) Дэ ^ min, (13)

в) ß4 ^ min .

Выполнение условий (13,а) и (13,в) позволяет обеспечить нахождение оценки контрэксцесса в области допустимых для него отклонений, ограниченных кривой Н на рисунке 1.

Аналогично, выполнение условий (13,а) и (13,б) делает возможным нахождение коэффициента энтропии в той же области.

Если учесть, что условие оптимальности центрального момента четвёртого порядка следует из условия минимизации СКО (см. выражение (12)), то необходимое требование выполнения критерия оптимальности (5) будет содержать только условия минимизации СКО и энтропийной погрешности:

а) о ^ min (14)

б) Дэ ^ min.

Одновременное обеспечение условий (14, а) и (14, б) возможно при использовании параметра неопределённости, включающего одновременно как информационную, так и статистическую неопределенность выходного параметра.

Авторы считают целесообразным использование в качестве критерия оптимального управления системой энтропийно-параметрического потенциала:

Дэп = ^(Дэ)2 + (кр,п^а)2; (15)

где - коэффициент нормального стандартного распределения.

Энтропийно-параметрический потенциал (15) представляет собой конечную, вещественную, дифференцируемую относительно математического ожидания выходного параметра функцию, монотонно возрастающую при отклонении математического ожидания выборки выходного параметра от своего оптимального значения. Задача контроля и управления динамической системы в области её оптимальных состояний сводится к условию минимизации энтропийно-параметрического потенциала:

Дэп ^ min . (16)

Энтропийно-параметрический потенциал имеет минимальное значение в области устойчивого состояния динамической системы с известным коэффициентом энтропии и контрэксцессом распределения выходного параметра. Изменение состояния динамической системы вызывает изменение этих параметров распределения и, как следствие, отражается в увеличении энтропийно-параметрического потенциала. Тогда для поддержания управления системой достаточно обеспечить минимизацию энтропийно-параметрического потенциала в соответствии с условием (16).

При выходе системы под действием внешних влияющих факторов из области оптимального управления энтропийно-параметрический потенциал может изменяться произвольным образом, и возможны другие состояния динамической системы с экстремально минимальными значениями энтропийно-параметрического потенциала. В этом случае необходим принудительный возврат системы в область оптимального управления, проводимый на основе анализа критерия (6).

4. Заключение

Предлагаемый подход к оптимальному управлению динамической системой обеспечивает повышение точности контроля и управления за счет:

- анализа и контроля формы распределения выходного параметра;

- минимизации энтропийно-параметрического потенциала;

- дифференциации областей устойчивых неработоспособных состояний относительно области оптимального состояния на основе определения и анализа энтропийно-параметрического критерия области оптимального управления;

- сохранения контроля и управления динамической системой при её нахождении как в низкоэнтропийном состоянии, так и в промежуточных состояниях при возврате системы в оптимальное состояние путём минимизации энтропийно-параметрического потенциала и плавной корректировки закона распределения;

- определения информационных параметров непосредственно по выборке результатов выходного параметра в любой момент процесса контроля и управления динамической системой;

- обеспечения процесса анализа неблагоприятных состояний и возврата динамической системы в оптимальное состояние.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, предлагаемый подход к оптимальному управлению динамической системой «устраняет» целое множество низкоэнтропийных распределений, которые система, построенная по алгоритму минимизации энтропийного потенциала Дэ путём трансформации энтропийного коэффициента Кэ, воспринимает как наиболее благоприятные состояния, и сохраняет информационные свойства управления и конроля в области оптимального управления.

Литература

1. Гитис Э.И., Данилович Г.А., Самойленко В.И. Техническая кибернетика. М.: Советское радио, 1968.

2. Лукас В.А. Теория управления техническими системами. Екатеринбург: издательство Уральского государственного горного университета, 2005.

3. Лазарев В.Л. Исследование систем на основе энтропийных и информационных характеристик // Журнал технической физики. 2010. Том 80, вып. 2.

4. Нечёткие множества в моделях управления и искусственного интеллекта / под ред. Д.А. Поспелова. М.: Наука, 1986.

5. Прангишвили И.В. Энтропийные и другие системные закономерности: Вопросы управления сложными системами. Ин-т проблем управления им. В.А. Трапезникова. М.: Наука, 2003.

6. Stable adaptive control and estimation for nonlinear systems: neural and fuzzy approximation techniques / ed. by J.T. Spooner. NY: Wiley-Nescience. 2002.

7. Колмогоров А.Н. Теория информации и теория алгоритмов. М.: Наука. 1987.

8. Новицкий П.В., Зограф И.А. Оценка погрешности результатов измерений. Л.: Энергоатомиздат, 1985.

9. Туричин А.Н., Новицкий П.В., Левшина Е.С. [и др.] Электрические измерения неэлектрических величин. Л.: Энергия, 1975.

10. Лазарев В.Л. Энтропийный подход к организации мониторинга и управления // Известия РАН. Теория и системы управления. 2005. № 6. С. 61-68.

11. Щербаков М.А. Синтез Парето-оптимальных нелинейных фильтров для обработки изображений // Автоматика и телемеханика. 2010. № 2. С. 179-191.

12. Щербаков М.А. Итерационный метод оптимальной нелинейной фильтрации изображений // Известия высших учебных заведений. Поволжский регион. Технические науки. 2011. № 4. С. 43-56.

13. Способ контроля и управления динамической системой / Полосин В.Г., Бодин О.Н. Положительное решение от 15.07.2015 по заявке на изобретение № 2014111833 от 27.03.2014.

References

1. Gitis E.I., Danilovich G.A., Samojlenko V.I. Technical Cybernetics. M.: Soviet radio, 1968.

2. Lucas V.A. The control theory of engineering systems. Yekaterinburg: Ural State Mining publishing university.n 2005.

3. Lazarev V.L. Research of systems based on entropy and information characteristics. Journal of Applied Physics. 2010. V. 80.1. 2. Fuzzy sets in models of control and artificial intelligence. Ed. Pospelov D.A. M.: Nauka, 1986.

4. Prangishvili I.V. Entropy and other systemic laws: Issues of control of complex systems. V.A. Trapeznikova institute of Control sciences. M.: Nauka, 2003. Stable adaptive control and estimation for nonlinear systems: neural and fuzzy approximation techniques. Ed. by J.T. Spooner. NY: Wiley-Nescience. 2002.

5. Kolmogorov A.N. Information theory and the theory of algorithms. M .: Nauka. 1987.

6. Novitsky P.V., Zograf I.A. Evaluation of error of measurement results. Leningrad.: Energoatomizdat. 1985.

7. Turichin A.N., Novitsky P.V., Levshina E.S. [et al.]. Electrical measurements of nonelectrical quantities. Leningrad.: Energy. 1975.

8. Lazarev V.L. Entropy approach to monitoring and control. Izvestiya RAN. Theory and control systems. 2005. N 6. P. 61-68.

9. Shcherbakov M.A. Synthesis of Pareto-optimal nonlinear filters for image processing. Automation and Remote Control. 2010. N 2. P. 179-191.

10. Shcherbakov M.A. Iteratsionny method of nonlinear optimal image filtering. News of higher educational institutions. Volga region. Technical science. 2011. N 4. P. 43-56. A method of monitoring and control of dynamic systems. Polosin V.G., Bodine O.N. A positive decision from 07.15.2015 on the application for invention number 2014111833 from 03.27.2014.

Поступила в редакцию 10.09.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.