ОПТИМИЗАЦИОННЫЙ ПОДХОД В МНОГОКРИТЕРИАЛЬНОЙ СТАБИЛИЗАЦИИ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ ОХРАННОГО МОНИТОРИНГА
Зайцев А.В., Канушкин С.В.*
Ключевые слова: мониторинг, дистанционно пилотируемые летательные аппараты, беспилотный летательный аппарат, информация, управление, информационная неопределенность, алгоритм, стабилизация, бинарность, нелинейность, насыщение, синтез, многокритериальность, Парето, эффективность, регулятор, быстродействие, качество, моделирование.
Аннотация.
Цель работы: обеспечение эффективного управления угловым движением нелинейной системы стабилизации дистанционно пилотируемого летательного аппарата при увеличенных возмущениях в условиях неопределённости.
Метод: комплексный теоретико-прикладной синтез на основе принципа бинарности в классе нелинейных систем, реализующих многокритериальное управление на различных участках фазового пространства.
Результаты: предложен оптимизационный подход в многокритериальной стабилизации динамических объектов на основе модифицированного метода динамического программирования, позволяющий получить эффективное управление; разработан бинарный алгоритм угловой стабилизации с дополнительным квадрантно-избира-тельным управлением, обеспечивающий на 4% больше устойчивость углового движения нелинейной системы при аддитивных возмущениях по сравнению с традиционным линейным алгоритмом стабилизации за счёт увеличения на 40% быстродействия системы угловой стабилизации; сделан вывод о необходимости и целесообразности использования квадрантно-избирательного управления, которое подтверждает свою эффективность.
DOI: 10.21681/1994-1404-2020-3-65-77
В системе правоохранительных органов для разведки, наблюдения, рекогносцировки, мониторинга площадных охраняемых объектов все чаще применяются роботехнические комплексы (РТК) и особенно дистанционно пилотируемые летательные аппараты (ДПЛА) [1, 8-10, 18-20].
Возможности РТК во многом определяются средствами автономного или дистанционного управления при подготовке к применению и технической эксплуатации. РТК имеют ряд сенсоров (устройства получения видовой информации [18]) для восприятия окружающей его среды), исполнительных устройств (эффекторов) для воздействия на среду и систему управления, которая позволяет ДПЛА совершать целенаправленные и полезные действия. В структуре имеется информационно-измерительная система, которая должна
обладать некоторыми интеллектуальными возможностями, и интерфейс с оператором. Устройство информационного обмена обеспечивает распределение видовой информации между бортовыми источниками видовой информации, передатчиком радиолинии видовой информации и бортовым устройством хранения видовой информации. Это устройство также обеспечивает информационный обмен между всеми функциональными устройствами, входящими в состав целевой нагрузки комплекса по выбранному интерфейсу. Таким образом, ДПЛА представляют собой информационную систему и обладают всеми ее особенностями.
Информационная система1 предназначена для своевременного обеспечения операторов ДПЛА надлежащей информацией, т.е. для удовлетворения кон-
1 Международный стандарт ISO/IEC 2382:2015. Information technology - Vocabulary.
* Зайцев Александр Владимирович, доктор технических наук, профессор, профессор Военной академии имени Петра Великого, Российская Федерация, г. Москва. E-mail: [email protected]
Канушкин Сергей Владимирович, кандидат технических наук, доцент, доцент Военной академии имени Петра Великого, Российская Федерация, г. Москва. E-mail: [email protected]
кретных информационных потребностей в рамках определённой решаемой задачи, при этом результатом функционирования информационных систем является «информационная продукция» - информационные массивы, базы данных и информационные услуги.
Современные системы стабилизации ДПЛА становятся все более и более сложными, так как расширяется круг решаемых ими задач. При возрастании сложности систем, уровень которых оценивается объемом циркулирующей в них информации, следует использовать, создавать и развивать наиболее интеллектуальные компоненты и системы управления. Создание систем интеллектуального управления требует учета основных принципов: обмена информацией; открытости систем интеллектуального управления для самоорганизации и самообучения; прогнозирование изменения в системе и внешней среде [2, 9, 11, 13].
Многоуровневая архитектура интеллектуальной системы управления, как правило, состоит из трех уровней: концептуального, информационного и операционного. Система, построенная по такой архитектуре, управляет поведением сложных технических объектов в условиях автономного и коллективного взаимодействия. Концептуальный уровень является ответственным за реализацию высших интеллектуальных функций. Информационный и операционный уровни содержат модули, поддерживающие разные интеллектуальные и информационные процедуры и трансформирующие их в управление.
На информационном уровне управления решаются задачи информационного моделирования, основными из которых являются: построение информационной ситуации и информационной позиции [2, 11, 14-16], которые соответствуют компоненту. На информационном уровне управления решаются задачи построения информационной конструкции, которая является отражением системы правил концептуального уровня. Важно отметить различие между интеллектуальными и информационными технологиями.
Информационные технологии выполняют функции поддержки интеллектуального управления. Основную роль играют интеллектуальные технологии принятия решений. Они дают возможность наряду с решением или в ходе получения решения осуществлять поиск новых знаний и накопления интеллектуальных ресурсов. Информационные технологии создают только информационные ресурсы. Это означает, что знания, формализованные в явном виде, будучи освоенными, могут стать частью опыта и частью базы знаний и быть использованы для решения задач и принятия решений2.
В реальных условиях информация об объекте и действующих на него возмущениях всегда неполна. Информационная неопределенность - это ситуация, при которой полностью или частично отсутствует инфор-
2 ГОСТ Р 53622-2009. Информационные технологии. Информационно-вычислительные системы. Стадии и этапы жизненного цикла,
виды и комплектность документов.
мация о вероятных будущих событиях, т.е. неопределенность - это то, что не поддается оценке.
Если априорной информации достаточно для решения задачи синтеза, т.е. информация точна и допускаются лишь малые отклонения от модели линейного оператора, а цели регулирования заданы не очень «жестко», то для синтеза стабилизирующего оператора вполне применимы классические методы синтеза. В тех случаях, когда отклонение не мало, а об изменениях характеристик объекта управления можно получить необходимую информацию в режиме реального времени, можно организовать настройку оператора обратной связи. Если же изменения оператора объекта происходят интенсивно и к тому же неконтролируемым образом, помеха не является волновой, кроме того, сформулированы «строгие» требования к качеству регулирования, а также имеются ограничения на фазовые переменные и управление, то традиционные методы синтеза стабилизирующих регуляторов неприменимы и следует искать новые подходы к синтезу управления в таких сложных условиях.
Сочетание принципа бинарности с принципом регулирования по отклонению позволяет перейти к автоматическому формированию законов управления в условиях, когда априорной информации недостаточно для прямого синтеза обратной связи, сообщающей замкнутой системе управления требуемую совокупность свойств.
Автопилот является системой, используемой для управления полетом без помощи пилота. Для ДПЛА автопилот является системой полного управления летательного аппарата во время всех фаз полета. Тогда как некоторые функции управления полетом могут находиться на наземной станции управления, автопилотная часть системы управления ДПЛА находится на борту. Основной целью автопилота является управление положением в инерциальной системе и ориентацией в пространстве ДПЛА. Для большинства представляющих интерес маневров, совершаемых в полете, автопилоты, разработанные на основе предположения о динамике «развязанных» движений, дают хорошие результаты.
При дистанционном пилотировании появилась необходимость совершать маневры, достаточные для отработки сигнала управления, без потери устойчивости ДПЛА. В таких условиях традиционные методы управления оказываются ограниченными в применении, так как не обеспечивается требуемое качество.
Современные летательные аппараты сами по себе становятся все более и более сложными. Помимо требования устойчивости, к системе управления аппаратом предъявляются определенные требования по ее качеству. Критериев качества управления много. Выбор частных критериев - это эвристическая плохо формализованная задача, решение которой затрудняется необходимостью удовлетворения следующих отчасти противоречивых условий: полнота, минимальность,
неизбыточность, операциональность, декомпозируе-мость, измеримость и др. [4-7, 12, 13].
Эти обстоятельства диктуют необходимость разработки специальных методов переработки информации, обеспечивающих решение задач многокритериального управления. Современные системы стабилизации беспилотного летательного аппарата становятся все более и более сложными, так как расширяется круг задач, решаемых ими3.
Многокритериальность проявляется при наличии трудно соизмеримых между собой критериев оптимальности и определяет сложность процедуры получения результата. При этом достаточно распространенная на практике задача выбора при многих объектах, характеризуемых своими локальными критериями, еще более усложняет подобную процедуру. Этот фактор, так же как и приведенные выше способы оценки элементов набора ситуационных данных, определяет принцип подхода к получению результата. Для выбора решения необходимо представлять как состояние внешней среды, так и возможности ДПЛА.
Необходимо учитывать, что многокритериальность целого достигается реализацией совокупности одно-критериальных частей. Многокритериальность задачи создает сложности формирования целевой функции и приводит к множеству возможных решений. Много-критериальность задачи оптимизации и возможность ее невыпуклости существенно затрудняют реализацию задач отыскания абсолютного (глобального) оптимума в пространстве допустимых управлений [4-7].
Один из способов учета многокритериальности задачи сводится к формированию некоторого комплексного критерия, представляющего собой, например, сумму отдельных критериев, каждый из которых наделяется определенным весовым коэффициентом [17]. Меняя значения весов, решают, как и при первом способе, несколько оптимизационных задач, а затем выбирают один из результатов в качестве окончательного, оптимального.
Для борьбы с многокритериальностью используют различные методы свертки критериев [17]. Существенная многокритериальность динамических систем, характеризуемая наличием многих формализованных критериев, их несоизмеримостью между собой, не позволяет на достаточно объективной и достоверной основе свести все эти критерии в единственный скалярный критерий оптимальности, а требует рассматривать эти критерии как некоторую совокупность или вектор.
В сложных системах, подчиненных глобальной (общей) цели, возникает необходимость учета неопределенных и неконтролируемых факторов, влияющих на процесс управления. Следствием неопределенности ситуаций, вызываемых наличием неопределенных и неконтролируемых факторов, является невозможность
3 См., например: Системы управления летательными аппаратами: Учебник / Под общ. ред. Г..Н. Лебедева - М.: Изд-во МАИ, 2007. - 756 с. ISBN 978-5-7035-1853-3.
составления полной математической модели системы, описания взаимодействия между подсистемами и составления единого критерия цели или эффективности управления. Таким образом, типичной для задачи управления является многокритериальность, т.е. наличие ряда показателей, одни из которых желательно обратить в максимум, другие - в минимум. Основные подходы к решению задач многокритериальной оптимизации представлены на рис. 1.
Множество допустимых решений, для которых невозможно одновременно улучшить все частные показатели эффективности (т. е. улучшить хотя бы один из них, не ухудшая остальных), принято называть областью Парето, или областью компромиссов, а принадлежащие ей решения - эффективными или оптимальными по Парето. В общем случае эффективные решения не эквивалентны друг другу, так что про два оптимальных по Парето решения нельзя сказать, какое из них лучше. Поэтому при решении многокритериальных задач необходимо дополнительное изучение эффективных решений4.
Возникает необходимость в применении новых принципов управления, учитывающих особенности таких объектов. Один из таких принципов дает теория бинарных систем, использующих местные глубокие обратные связи, когда необходимые условия реализуются локально, в каком-то месте фазового пространства системы. Теория бинарных систем является одним из направлений развития принципов адаптивного управления. Суть этого подхода состоит в систематическом применении при структурном синтезе системы принципа регулирования по отклонению и расширению на этой основе множества типов обратных связей.
Введённое различие между переменными-координатами и переменными-операторами следует понимать условно, как удобный для использования методологический приём. Переменную называют координатой, если над ней осуществляется то или иное преобразование, и ту же самую переменную считают оператором, если она определяет вид преобразования, выполняемого над какой-либо координатой. Двойственное толкование переменных состояния нелинейной динамической системы принято именовать принципом бинарности [3].
Оптимизационный подход в многокритериальной стабилизации движения динамических объектов рассмотрим в следующей постановке [4-6].
Пусть состояние системы описывается вектором х = (ху...,х)) - фазовым пространством. Переход из начального в конечное состояние называют фазовой траекторией процесса, которую условно можно разбить на N участков. Динамика системы описывается дифференциальным уравнением вида:
4 Методы современного классической теории автоматического управления: Учебник в 5-ти тт. Т. 5. Методы современной теории автоматического управления / Под ред. К. А. Пупкова, Н. Д. Егупова. - М.: Изд-во МГТУ им. Баумана, 2004. - 784 с. ISBN 5-7038-2193-2.
ПОСЛЕДОВАТЕЛЬНОЕ РЕШЕНИЕ
ГЛАВНЫЙ КРИТЕРИЙ
АЛЬТ ЕР ИДТИ ВЫ С ЗАДАННЫМИ СВОЙСТВАМИ
СУЖЕНИЕ ЯЫООЕСТВА АЛЬТЕРНАТИВ
Рис. р Основныеподходы к решению задач многокритериалтной оптимизации
х = , и) ( 1)
где: и(О) - вектор управления, т.е. искомая на каждом очастквфарооодо прнстранства рльтернихивн.
На фазовую траекторию и управление налагаются ограничения:
хк еX,,к = 0,...,N
ик еик(хкч),к = 1,...,N
(2)
Последовательность выбираемых альтернатив об-разуетстратегию ((^.Качество альтернативы ио может быть оценено с помощью функции F(uо). Пусть заданы участки фазовой траектории х х2,...,хо и множе-ствоальтернатив.Научастке хкфх0 альтернатива и(хк) выбирается из множества и(и(Й(,...,и(Ок- 1))). Каждой альтернативе и(хк) ставится в соответствие векторная оценка
/(и{хк)) = {/1(и(х^х^и(х0)__.-и(х1_1)__
/,(и(х1), хк,,и (хс),..., и(хг_1) ).
Векторная оценка стратегии {и } определяется следующимобразом:
РАи(хк)}) = £ =1(и( х^ хк, и(х0) и.,и)х.)),
к
<р„({ °(хк)})(и(х/) хкЛх0) u(xk-l)),
к
Рп+Л и(хк)0 = £/Пк1(и(хо)), <3)
к
РпЛ и(хк )}) =Х /п+2 (и( х N )).
к
Необходимо найти парето-оптимальное (П-оптимальное) решение. Следовательно, необходимо установить связь между качеством стратегии и входящих в нее альтернатив и выработать условия, которым должнаудовлетворятьвыбираемая на каждом участкефазовойтраекторииальтернатива,чтобыстра-тегиябылаП-оптимальна.
Ра сс мотри м всевоз можные состояния, которые достижимы системой (1) на участке хк. Пусть управление нЖхкЫпе рдвндотси стему всостояоиехк+1, а управление и2(хк) в состояние хк+2, следовательно, на следующем участкефазовойтраектории выбирается альтернатива и(хк+о). Ее векторная оценка будет зависеть от того, в каком состоянии в этот момент находилась система, а следовательно, и от того, какие альтернативы выбира-лисьв прошлом.
/,(ио(хк+о) Юк+о) у КХио(А+о) х;+о) (4)
Следовательно, задача не является задачей независимого выбора, отсюданеобходимо решить задачу многокритериальной оптимизации модифицированным методом динамического программирования5.
Стратегия считается П-оптимальной, если
для любой другой допустимой траектории (н(л^)}- из соотношения
Р ({ 0 (хк )}) и ^ (хк )}Х * = l,^^^, "
вытекает, что
Р ({и(хк)}) = рА и (хк)}), * = °—, п.
Следовательно, стратегия ("(х^.)} будет эффективной, если на множестве допустимых стратегий не существует такой стратегии {¿/(х^ )} - Для которой выполнялись бы неравенства
9, ({«(** )})£$,({и*{*к)}), V/ е /,,
и хотя быодно изнихбылострогим.
5 Дубов Ю.А.,Травкин С. И., Якимец В.И.Многокритериальные модели формирования и выбора вариантов систем. - М.: Наука, 1986. -296 с.
Здесь I - множество индексов, соответствующих функциям цели (3), которые необходимо максимизировать; 12 - множество индексов, соответствующих функциям цели, которые необходимо минимизировать. При отыскании эффективных стратегий следует помнить, что они могут быть несравнимы по множеству функций цели. Поэтому в процессе синтеза необходимо решить вопрос о существовании эффективных альтернатив. Анализ условий оптимальности можно провести, сравнивая поставленную задачу с аналогичной задачей, но со скалярным критерием. При этом множество векторных оценок альтернатив и множество векторных оценок стратегий являются подмножествами вещественной прямой.
Оптимальная стратегия {и N } в скалярном случае обладает следующими свойствами:
1) если стратегия {и N } оптимальна, то альтернативы им также оптимальны, т.е. /(иN) > f (uN) ;
*
2) если альтернативы UN оптимальны, то составленная из них стратегия {и N } оптимальна;
3) для любой оптимальной альтернативы на участке N существует содержащая ее стратегия.
Оптимальную по Парето векторную оценку / принадлежащую множеству векторных оценок, необходимо считать опасной, если существует такое множество векторных оценок, что оценка f+g не будет оптимальной по Парето. Доказано6, что любая П-оптимальная векторная оценка, не принадлежащая границе выпуклой оболочки, т.е. границе пересечения всех выпуклых множеств его содержащих, является опасной.
Если опасные векторные оценки существуют, то выбор на некотором участке фазового пространства П-оптимальной альтернативы, обладающей опасной оценкой, может привести к тому, что независимо от того, как осуществляется выбор в будущем, стратегия уже не будет П-оптимальна.
При получении условий многокритериальной оптимизации определение опасных векторных оценок имеет большое значение, особенно для реальной задачи с векторной оценкой стратегии (3). Наличие опасных векторных оценок хотя бы для одного участка фазового пространства означает, что свойство 3 не имеет место.
С учетом изложенного для решаемой задачи, в которой часть векторных оценок стратегии связана с качеством альтернатив не аддитивно (3), условия П-оптимальности можно определить следующим образом.
На участках фазового пространства хк, характеризуемых максимальными требования по f. (и(х^), альтернатива и* выбирается таким образом, что при этом составляющая вектора принимает свое наименьшее значение. При этом векторная оценка будет принадлежать границе выпуклого множества, следовательно, не будет являться опасной.
6 Дубов Ю. А., Травкин С. И., Якимец В. И. Многокритериальные модели формирования и выбора вариантов систем. М. : Наука, 1986. 296 с.
Так как принято предположение о том, что для одной из векторных оценок, имеющей не аддитивную связь с качеством альтернативы на участке фазового пространства хк, эта составляющая векторной оценки альтерната в ы fi (и (х.)) принимает свое минимальное значение и при этом этот участок характеризуется максимальными требованиями по этой составляющей, то на любом другом участке фазовой траектории при неизменных альтернативах на других участках фазового пространства невозможно получить составляющую векторной оценки альтернативы, удовлетворяющую условию
fi(и(ч) <^(и(хУ), (6)
следовательно, р1 = fi (и(Хк )). Таким образом, подход многошагового принятия решения на управление движением объекта должен основываться на следующих особенностях решаемой задачи.
1. Если на каждом участке фазового пространства, характеризуемым максимальными требованиями по соответствующей составляющей векторной оценки, выбирается альтернатива, структурно оптимизирующая данную составляющую, то такая стратегия р^ ип} - эффективна по Парето.
2. Наилучшей будет стратегия, в которой число участков фазового пространства равно числу составляющих векторных оценок, не аддитивно связанных с качеством альтернатив, и на каждом участке выбирается альтернатива, минимизирующая составляющую, к которой на данном участке предъявляются максимальные требования.
Выбор частных критериев оценки - это эвристическая плохо формализованная задача, решение которой затрудняется необходимостью удовлетворения следующих отчасти противоречивых условий:
1. Полнота - набор критериев должен полно характеризовать решение.
2. Минимальность - набор должен содержать как можно меньшее количество критериев.
3. Неизбыточность - различные критерии не должны учитывать одни и те же характеристики системы.
4. Операциональность - каждый частный критерий должен иметь понятную формулировку, ясный и однозначный смысл, характеризовать определенные качества.
5. Декомпозируемость - набор критериев должен допускать возможность упрощения исходной задачи оценки альтернатив путем разбиения (декомпозиции) на более простые части.
6. Измеримость - каждый критерий должен допускать возможность оценки (количественной или качественной) интенсивности характеризуемого качества.
Рассмотрим стандартную задачу стабилизации неопределенного объекта в условиях, когда по априорной информации о координатном и операторном возмущениях требуется выбрать оператор стабилизирующей
обратной связи. В качестве объекта управления выберем летательный аппарат, динамика которого в общем виде описывается уравнением вида
Л _ v Л I.T
(7)
где X' = {%1...ХП), Ът = (>! ...Ьп), U -управления; A(t) - матрица размера [71 X7l\ с элементами а, X - аддитивные возмущения; параметры объекта, т.е. Ü и Ь, изменяются в определенных пределах.
Необходимо найти управления U = U (х, t) при котором минимизируется критериальный вектор
шм
I± = min /от 1 dt ; I2= min(Xma*(t)). (8)
Решение задачи будем искать в классе бинарных систем [3, 4, 10]. Теория бинарного управления отражает идеологию единства процессов самоорганизации и управления, т.е. представляет собой своего рода симбиоз кибернетики и синергетики. Основная особенность заключается в формировании нового механизма генерации нелинейных обратных связей. Введение бинарного управления в процедуру синтеза систем позволяет построить регулярный механизм аналитической генерации естественной совокупности отрицательных и положительных обратных связей, которые формируют процессы направленной самоорганизации.
Методологическое отличие между подходом к синтезу бинарных систем и подходом к построению большинства адаптивных систем управления заключается в замене принципа регулирования по возмущению или по его оценкам на принцип регулирования по отклонению для компенсации операторных (параметрических) возмущений в операторе объекта регулирования7. Под отклонением здесь понимается некоторая величина, связанная с отличием фактических свойств системы от требуемых в постановке задачи управления. При таком подходе отпадает необходимость в оценке текущих характеристик оператора, что сулит существенные преимущества и, в частности, позволяет ослабить или снять ограничения типа условий квазистационарности управляемого процесса. Помимо снятия этого ограничения, преимуществом над прочими системами управления является то, что бинарные системы управления не требуют длительного периода подготовки к эксплуатации, как, например, интеллектуальные системы управления на базе нейроподобных сетей и нечеткой логики.
Применение принципа регулирования по отклонению позволяет создавать системы, инвариантные к множеству возмущений, действующих на объект управления, что также упрощает саму систему управления и её применение. Исходя из сказанного, применение теории бинарных систем для управления слож-
7 Методы классической и современной теории автоматического управления: Учебник в 5-ти тт. T. 3. Синтез регуляторов систем автоматического управления / Под ред. К. А. Пупкова, Н. Д. Егупова. - М.: МГТУ им. Н. Э. Баумана, 2004. - 616 с. ISBN 5-7038-2194-0.
ными нестационарными нелинейными динамическими объектами можно считать достаточно перспективным.
В результате синтеза в процессе композиции путем формирования межэлементных прямых и обратных связей посредством специально разработанной системы информационных коммуникаций образуется бинарная подсистема управления. Справедливости ради нужно заметить, что использование дополнительной информации о состоянии объекта позволяет обойтись при решении рассматриваемой задачи только одной глубокой обратной связью.
Переход от формирования сигнала к формированию оператора, вырабатывающего нужный сигнал, можно возвести в принцип и дать ему, например, следующую формулировку. При дефиците информации следует переходить от программного формирования функции к синтезу алгоритма (оператора), генерирующего функцию. Следует синтезировать не сам оператор обратной связи, но алгоритм его формирования, а поскольку все это происходит в условиях неопределенности, то без механизма обратной связи здесь не обойтись.
По мере усложнения задачи стабилизации все большая роль отводится нелинейности. Кроме того, выясняется, что без нелинейной обратной связи не может быть хорошей стабилизации и именно нелинейная обратная связь наделяет систему управления способностью демонстрировать «нужное» поведение в сложных и постоянно изменяющихся внешних и внутренних условиях. Оказывается, что с некоторого уровня сложности задачи «хороший» регулятор обязательно будет нелинейным. Известно, что в нелинейном мире нет регулярных путей и универсальных методов, характерных для локальных теорий, так как специфика нелинейности часто играет решающую роль.
Бинарное управление является достаточно эффективным средством стабилизации неопределенного объекта, поскольку:
- нет необходимости иметь полную информацию о фазовом векторе объекта;
- допускаются как нестационарная неопределенность, так и произвольные внешние воздействия;
- учитывается «разнотемповость» физических процессов, протекающих в реальной системе на различных участках фазового пространства.
Изменение во времени параметров объекта управления принципиально не меняет описанной выше картины, так как уравнения движения при этом остаются прежними. Таким образом, использование свойств бинарности при управлении беспилотными летательными аппаратами позволяют получить П-оптимальное управление при действии как аддитивных, так и мультипликативных возмущений.
Предлагается бинарный алгоритм управления следующего вида [21]:
и = + /Сф ф + ийн (9)
Математическое описание квадрантно-избиратель-ного алгоритма управления динамикой нелинейной
Таблица 1
Значения знака бинарного управления при формировании сигнала управления
Измеряемая величина Знак измеряемой величины
Ф + + + + - - - -
Ф + + - - + + - -
Ф + - + - + - + -
Величина бинарного управления 4 0 0 0 0 0 0 4
Рис. 2. Структурная схема модели с традиционным линейным ПД-регулятором
системы стабилизации ДПЛА, полученного на основе принципа бинарности, выглядит следующим образом:
и = /Сфф + ¿¿ф + (sign ф + sign ф) (sign ф + sign ф).
Предлагаемая система использует переменные состояния нелинейной динамической системы как координа-
(10)
ту, и те же самые переменные считаются оператором, создавая дополнительное управление при одинаковых знаках измеряемых параметров. Основной положительный эффект достигается за счет того, что в первом и третьем квадрантах фазовой плоскости возмущающий момент совпадает по направлению с аэродинамическим, следовательно, движение в данных квадрантах
0.45 0.4
0.35 0.3 0.25 0.2 0.15 0.1 0.05
Signal 1
i
-0.05
0.1
0.2 0.3
0.4 0.5 0.Б
Time (sec)
0.7
D.9
Signal 2
i
т
i
-0.1
0.1
0.2
0.3
0.4 0.5
Time (sec)
0.Б
0.7
0.8
0.9
Рис. 3. Графики возмущающих сигналов: возмущение типа импульс и градиентное возмущение с переменной скоростью изменения
во многом определяет не только быстродействие, но и качество управления. Сущность состоит в том, что необходимо подавать дополнительное управление только в том случае, когда измеряемые параметры угла, угловой скорости и углового ускорения имеют одинаковый знак. Таким образом, повышается быстродействие системы угловой стабилизации ДПЛА в процессе полета при действии внешних возмущений [16].
Принцип формирования сигнала управления представлен в табл. 1.
В роли объекта исследования использована модель системы угловой стабилизации по каналу рыскания, которая относится к системам управления и стабилизации летательных аппаратов и может быть использована в ДПЛА. Она включает измерительные датчики угла, угловой скорости, масштабирующие блоки, усилители, сигнал управления которых соответственно поступает на рулевой привод и управляющие органы. Рассмотрен
рулевой привод ограниченной мощности, т.е. с участком насыщения скоростной характеристики.
В данной системе управление пропорционально управляющим сигналам рыскания и угловой скорости, т.е. использован традиционный ПД-регулятор (пропорционально-дифференциальный). Схема была смоделирована в программе MatLab Simulink8 и представлена на рис. 2.
В ходе исследований устойчивости системы угловой стабилизации были рассмотрены два типа возмущений: возмущение типа импульс (длительность импульса 0,2 с,
8 Методы инженерного синтеза сложных систем управления: аналитический аппарат, алгоритмы приложения в технике. Часть II. Вычислительно-аналитический эксперимент: аппарат матричных операторов и вычислительные технологии / Под ред. К. А. Пупкова, Н. Д. Егупова. - М.: Изд-во МГТУ им. Н. Э. Баумана, 2012. - 416 с. ISBN: 9785-7038-3451-0.
Рис. 4. Структурная схема модели с предлагаемым нелинейным квадрантно-избирательным
алгоритмом управления
амплитуда импульса 0,4 с"2) и градиентное возмущение с переменной скоростью изменения (рис. 3).
Структурная схема модели с предлагаемым нелинейным квадрантно-избирательным алгоритмом управления, в котором дополнительное управление формируется только в том случае, когда измеряемые параметры угла, угловой скорости и углового ускорения имеют одинаковый знак, представлена на рис. 4.
При прочих одинаковых условиях, проведено моделирование динамики системы стабилизации с традиционным линейным и предлагаемым квадрантно-изби-рательным алгоритмом управления. Графики изменения угла рыскания и угловой скорости представлены на рис. 5 и рис. 6 соответственно.
Также было определено максимальное значение возмущения, которое способна выдержать система стабилизации, сохраняя при этом устойчивость движения.
В результате максимальное аддитивное возмущение, которое можно подать на систему угловой стабилизации с традиционным линейным алгоритмом управления без потери ее устойчивости, равно 0,906 с-2. В аналогичной системе с предлагаемым нелинейным бинарным квадрантно-избирательным алгоритмом управления данная величина составляет 0,932 с"2. Таким образом, система с бинарным квадрантно-избирательным алгоритмом управления обеспечивает устойчивость движения при аддитивных возмущениях на 4% больше. При этом быстродействие
системы стабилизации увеличивается на 40% (с 5,4 с до 3,2 с).
Сущность улучшения состоит в том, что необходимо подавать дополнительное управление только в том случае, когда измеряемые параметры угла, угловой скорости и углового ускорения имеют одинаковый знак. При сравнении систем угловой стабилизации с традиционным линейным алгоритмом управления и с предлагаемым нелинейным квадрантно-избиратель-ным алгоритмом управления были получены следующие данные (табл. 2).
В среде MATLAB Simulink проведено моделирование канала стабилизации ДПЛА с линейным и бинарным алгоритмом управления двух типов. В результате введения полезной модели с бинарным алгоритмом первого типа было достигнуто увеличение быстродействия на 40% , а также увеличение максимального подаваемого управления на 4%. Таким образом, использование данного алгоритма в системах угловой стабилизации будет эффективней.
Использование бинарного алгоритма в системах угловой стабилизации ДПЛА является эффективным с учетом и других показателей качества стабилизации (колебательность системы, расход топлива на управление, максимальное отклонение управляющих органов). Лепестковая диаграмма сравнения нормированных критериев качества управления ДПЛА представлена на рис. 7.
Рис. 5. Графики изменения угла рыскания и угловой скорости модели с традиционным линейным ПД-регулятором
□.05
□.05
□.15
01 2345Б78Э10
Рис. 6. Графики изменения угла рыскания и угловой скорости модели с квадрантно-избирательным алгоритмом управления
Быстродействие
,и на ми ческа я ошибка
-^•Линейный алгоритм ■^»Бинарный алгоритм
олебательность
Расход топлива на управление
Рис. 7. Диаграмма сравнения нормированных критериев качества управления ДПЛА с линейным и бинарным алгоритмом управления
Таблица 2
Показатели качества систем стабилизации
Показатели Система с традиционным линейным алгоритмом управления Система с нелинейным квадрантно-избирательным алгоритмом управления
Быстродействие системы стабилизации, с 5,4 3,2
Максимальная величина подаваемого воздействия до потери устойчивости, с~2 0,906 0,932
Таким образом, оптимизационный подход в многокритериальной стабилизации беспилотных летательных аппаратов основывается на утверждении, что если на каждом участке фазового пространства, характеризуемым максимальными требованиями по соответствующей составляющей векторной оценки, выбирается альтернатива, структурно оптимизирующая данную составляющую, то такая стратегия эффективна по Парето.
Для рассмотренной задачи стабилизации ДПЛА предложен алгоритм, который на основе принципа бинарного управления подает дополнительное управление только в том случае, когда измеряемые параметры угла, угловой скорости и углового ускорения имеют
одинаковый знак, т.е. на тех участках фазового пространства, на которых определяется быстродействие системы.
В ходе вычислительного эксперимента в программной среде MatLab Simulink бинарный алгоритм угловой стабилизации с дополнительным квадрантно-из-бирательным управлением подтвердил обеспечение устойчивости углового движения нелинейной системы стабилизации ДПЛА при аддитивных возмущениях на 4% больше по сравнению с традиционным линейным алгоритмом стабилизации за счёт увеличения быстродействия системы угловой стабилизации на 40% и подтвердил эффективность данного управления.
Рецензент: Тютюнник Вячеслав Михайлович, доктор технических наук, профессор, академик РАЕН, Президент
Международного информационного Нобелевского центра, г. Тамбов.
E-mail: [email protected]
Литература
1. Афанасьев П. П. Основы устройства, проектирования, конструирования и производства летательных аппаратов (дистанционно-пилотируемые летательные аппараты). - М.: Изд-во МАИ, 2006. - 528 с. ISBN 978-5-70351626-3.
2. Бородакий Ю. В., Лободинский Ю. Г. Эволюция информационных систем (современное состояние и перспективы). - М.: Горячая линия - Телеком, 2011. - 368 с. ISBN 978-5-9912-0199-5.
3. Емельянов С. В., Коровин С. К. Новые типы обратной связи: Управление при неопределенности. - М.: Наука, 1997. - 352 с. ISBN 5-02-015149-1.
4. Зайцев А. В., Канушкин С. В. Многокритериальное управление робототехническими системами // Труды XVIII Всеросс. науч. конф. «Нейрокомпьютеры и их применение» - М: МГППУ, 2020. - С. 291 - 292. ISBN 978-5-94051214-1.
5. Зайцев А. В., Канушкин С. В. Особенности управления нелинейными робототехническими системами // Труды XVIII Всеросс. науч. конф. «Нейрокомпьютеры и их применение» - М: МГППУ, 2020 . - С. 338 - 339. ISBN 978-594051-214-1.
6. Зайцев А. В., Канушкин С. В. Многокритериальная стабилизация летательного аппарата на основе принципа бинарности управления // Информационные системы и процессы: Сб. науч. тр. - Вып. 18 / Под ред. В. М. Тю-тюнника. - Тамбов: МИНЦ «Нобелистика», 2018. - С. 37 - 45. ISBN 978-5-86609-220-8.
7. Зотов М. Г. Многокритериальное конструирование систем автоматического управления. - М.: БИНОМ. Лаборатория знаний, 2004. - 375с. ISBN 5-94774-125-3.
8. Канушкин С. В. Правовые аспекты реализации функциональных возможностей интеллектуальных роботов в работе правоохранительных органов // Правовая информатика. - 2018. - № 2. - С. 23 - 38. D0I:10.21681/1994-1404-2018-2-23-38.
9. Канушкин С.В. Синергетический подход в управлении группой беспилотных летательных аппаратов интеллектуальной системы охранного мониторинга // Правовая информатика. - 2018. - № 3. - С. 25 -37.D0I:10.21681/1994-1404-2018-3-25-37.
10. Канушкин С.В. Управление робототехническими системами охранного мониторинга в условиях неопределенности // Правовая информатика. - 2019. - № 2. - С. 40 - 48. DOI: 10.21681/1994-1404-2019-2-40-48.
11. Когаловский М. Р. Перспективные технологии информационных систем. - М.: ДМК Пресс, 2003. -288 с. ISBN 5-94074-200-9.
12. Колеснико А. А. Современная прикладная теория управления. Ч.1. Оптимизационный подход в теории управления. - Таганрог: Изд-во ТРТУ, 2000. - 400с. ISBN 5-8327-0045-7.
13. Колесников А. А. Современная прикладная теория управления. Часть III. Новые классы регуляторов технических систем. - Таганрог: ТРТУ, 2000. - 656 с. ISBN 5-8327-0045-7.
14. Ловцов Д. А. Информационная теория эргасистем: Тезаурус. - М.: Наука, 2005. - 248 c. ISBN 5-02-033779-Х.
15. Ловцов Д. А. Системный анализ. Часть. 1. Теоретические основы. - М.: РГУП, 2018. - 224 с. ISBN 978-5-93916- 701-7.
16. Ловцов Д.А. Информационная теория эргасистем: основные положения // Правовая информатика. - 2019. -№ 3. - С. 4 - 20. DOI: 10.21681/1994-1404-2019-3-04-20.
17. Ловцов Д.А. Теоретические основы системной информатизации правового регулирования // Правовая информатика. - 2019. - № 4. - С. 12 - 28. DOI: 10.21681/1994-1404-2019-4-12-28.
18. Ловцов Д. А., Гаврилов Д. А. Моделирование оптико-электронных систем дистанционно пилотируемых аппаратов: Монография. - М.: «Технолоджи-3000», 2019. - 164 с. ISBN 978-5-94472-036-8.
19. Моисеев В. С. Основы теории эффективного применения беспилотных летательных аппаратов. - Казань: РИЦ «Школа», 2015. - 444 с. ISBN 978-5-9905685-4-9.
20. Рэндал У. Биард, Тимоти У. Мак Лэйн. Малые беспилотные летательные аппараты: теория и практика. - М.: Техносфера, 2015. - 312 c. ISBN 978-5-94836-393-6.
21. Патент на полезную модель № 182886 РФ. Система угловой стабилизации / Канушкин С. В., Зайцев А. В., Волков А. В., Шишкин К. В., Сачук А. П. (РФ). - № 2018117102; Заяв. 07.05.2018.
AN OPTIMISATION APPROACH IN MULTI-CRITERIAL STABILISATION OF UNMANNED AERIAL VEHICLES FOR SECURITY MONITORING
Aleksandr Zaitsev, Dr.Sc. (Technology), Professor at the Peter the Great Military Academy, Russian Federation, Moscow. E-mail: [email protected]
Sergei Kanushkin, Ph.D. (Technology), Associate Professor at the Peter the Great Military Academy, Russian Federation, Moscow. E-mail: [email protected]
Keywords: monitoring, remotely piloted aircraft, unmanned aerial vehicle, information, control, information uncertainty, algorithm, stabilisation, binarity, non-linearity, saturation, synthesis, multi-criteriality, Pareto, efficiency, regulator, performance, quality, modelling.
Abstract.
Purpose of work: ensuring an efficient control of the angular motion of a non-linear stabilisation system of a remotely piloted aircraft under increased disturbances in the conditions of uncertainty.
Method used: a multi-faceted theoretical and applied synthesis based on the binarity principle in the class of non-linear systems implementing multi-criterial control in different parts of the phase space.
Results obtained: an optimisation approach for multi-criterial stabilisation of dynamic objects based on a modified dynamic programming method allowing to ensure efficient control put forward. A binary angular stabilisation algorithm with additional quadrant selective control is developed providing a 4% increase in the stability of angular motion of a nonlinear system under additive disturbances as compared to the traditional linear stabilisation algorithm, due to a 40% increase in angular stabilisation performance. A conclusion is made regarding the need and expediency of using quadrant selective control whose efficiency is confirmed.
References
1. Afanas'ev P. P. Osnovy ustroistva, proektirovaniia, konstruirovaniia i proizvodstva letatel'nykh apparatov (distantsion-no-pilotiruemye letatel'nye apparaty). M. : Izd-vo MAI, 2006, 528 pp. ISBN 978-5-7035-1626-3.
2. Borodakii Iu. V., Lobodinskii Iu. G. Evoliutsiia informatsionnykh sistem (sovremennoe sostoianie i perspektivy). M. : Goriachaia liniia -- Telekom, 2011, 368 pp. ISBN 978-5-9912-0199-5.
3. Emel'ianov S. V., Korovin S. K. Novye tipy obratnoi sviazi: upravlenie pri neopredelennosti. M. : Nauka, 1997, 352 pp. ISBN 5-02-015149-1.
4. Zaitsev A. V., Kanushkin S. V. Mnogokriterial'noe upravlenie robototekhnicheskimi sistemami. Trudy XVIII Vseross. nauch. konf. "Neirokomp'iutery i ikh primenenie". M. : MGPPU, 2020, pp. 291-292. ISBN 978-5-94051-214-1.
5. Zaitsev A. V., Kanushkin S. V. Osobennosti upravleniia nelineinymi robototekhnicheskimi sistemami. Trudy XVIII Vseross. nauch. konf. "Neirokomp'iutery i ikh primenenie". M. : MGPPU, 2020 , pp. 338-339. ISBN 978-5-94051-214-1.
6. Zaitsev A. V., Kanushkin S. V. Mnogokriterial'naia stabilizatsiia letatel'nogo apparata na osnove printsipa binarnosti upravleniia. Informatsionnye sistemy i protsessy : sb. nauch. tr., vyp. 18. Pod red. V. M. Tiutiunnika. Tambov : MINTs "Nobelistika" 2018, pp. 37-45. ISBN 978-5-86609-220-8.
7. Zotov M. G. Mnogokriterial'noe konstruirovanie sistem avtomaticheskogo upravleniia. M. : BINOM, Laboratoriia zna-nii, 2004, 375 pp. ISBN 5-94774-125-3.
8. Kanushkin S. V. Pravovye aspekty realizatsii funktsional'nykh vozmozhnostei intellektual'nykh robotov v rabote pravookhranitel'nykh organov. Pravovaia informatika, 2018, No. 2, pp. 23-38. DOI: 10.21681/1994-1404-2018-2-23-38.
9. Kanushkin S. V. Sinergeticheskii podkhod v upravlenii gruppoi bespilotnykh letatel'nykh apparatov intellektual'noi sistemy okhrannogo monitoringa. Pravovaia informatika, 2018, No. 3, pp. 25-37. DOI: 10.21681/1994-1404-2018-325-37.
10. Kanushkin S. V. Upravlenie robototekhnicheskimi sistemami okhrannogo monitoringa v usloviiakh neopredelennosti. Pravovaia informatika, 2019, No. 2, pp. 40-48. DOI: 10.21681/1994-1404-2019-2-40-48.
11. Kogalovskii M. R. Perspektivnye tekhnologii informatsionnykh sistem. M. : DMK Press, 2003, 288 pp. ISBN 5-94074200-9.
12. Kolesnikov A. A. Sovremennaia prikladnaia teoriia upravleniia. Ch. I. Optimizatsionnyi podkhod v teorii upravleniia. Taganrog : Izd-vo TRTU, 2000, 400 pp. ISBN 5-8327-0045-7.
13. Kolesnikov A. A. Sovremennaia prikladnaia teoriia upravleniia. Chast' III. Novye klassy reguliatorov tekhnicheskikh sistem. Taganrog : TRTU, 2000, 656 pp. ISBN 5-8327-0045-7.
14. Lovtsov D. A. Informatsionnaia teoriia ergasistem: Tezaurus. M. : Nauka, 2005, 248 pp. ISBN 5-02-033779-X.
15. Lovtsov D. A. Sistemnyi analiz. Chast'. 1. Teoreticheskie osnovy. M. : RGUP, 2018, 224 pp. ISBN 978-5-93916-701-7.
16. Lovtsov D.A. Informatsionnaia teoriia ergasistem: osnovnye polozheniia. Pravovaia informatika, 2019, No. 3, pp. 4-20. DOI: 10.21681/1994-1404-2019-3-04-20.
17. Lovtsov D.A. Teoreticheskie osnovy sistemnoi informatizatsii pravovogo regulirovaniia. Pravovaia informatika, 2019, No. 4, pp. 12-28. DOI: 10.21681/1994-1404-2019-4-12-28.
18. Lovtsov D. A., Gavrilov D. A. Modelirovanie optiko-elektronnykh sistem distantsionno pilotiruemykh apparatov : monografiia. M. : "Tekhnolodzhi-3000", 2019, 164 pp. ISBN 978-5-94472-036-8.
19. Moiseev V. S. Osnovy teorii effektivnogo primeneniia bespilotnykh letatel'nykh apparatov. Kazan' : RITs "Shkola" 2015, 444 pp. ISBN 978-5-9905685-4-9.
20. Rendal U. Biard, Timoti U. Mak Lein. Malye bespilotnye letatel'nye apparaty: teoriia i praktika. M. : Tekhnosfera, 2015, 312 pp. ISBN 978-5-94836-393-6.
21. Patent na poleznuiu model' No. 182886 RF. Sistema uglovoi stabilizatsii. Kanushkin S. V., Zaitsev A. V., Volkov A. V., Shishkin K. V., Sachuk A. P. (RF). No. 2018117102; zaiav. 07.05.2018.