УДК 351.814.2; 656.7.08
Р. Ю. Царев
Сибирский федеральный университет, Россия, Красноярск
К. А. Семенько
Заполярный филиал ОАО «Горно-металлургический комбинат «Норильский никель», Россия, Норильск
М. В. Тюпкин
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
АНАЛИЗ НАДЕЖНОСТИ И УПРАВЛЕНИЕ РАЗВИТИЕМ КЛАСТЕРНЫХ СТРУКТУР АВТОМАТИЗИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ
Рассматривается вопрос проектирования, развития и надежности кластерных структур автоматизированных систем управления.
При проектировании отказоустойчивых автоматизированных систем управления к надежности технических и программных средств предъявляются высокие требования.
Существует ряд критичных областей науки и промышленности, где невыполнение этого требования и, как следствие, сбой в работе системы могут повлечь за собой значительные экономические потери в рамках как отдельного предприятия, так и целого региона. Такими областями являются банковская система, финансовые организации, космос, авиация, подводные и подземные исследования, атомная промышленность, химическое производство, прогнозирование и т. д.
В связи с этим одной из основных задач, стоящих перед проектировщиками, становится создание таких структур автоматизированных систем управления, которые обеспечивали бы устойчивость систем к программным и аппаратным сбоям, а также их катастро-фоустойчивость, т. е. сохранение данных и продолжение работы в условиях массовых и, возможно, последовательных и связанных между собой отказов подсистем.
Технология отработки отказов в этом случае требует учета взаимосвязи структурных компонентов и способности систем специфически реагировать на каждый вариант последовательности развития событий - сценарий катастрофы, чтобы максимально сохранить защищаемую информацию.
Для обеспечения надежности автоматизированных систем управления предложено множество подходов, включая организационные методы разработки, различные технологии и технологические программные средства, которые требуют привлечения значительных ресурсов. Однако отсутствие общепризнанных критериев надежности не позволяет ответить на вопрос, насколько более надежной становится система при соблюдении предлагаемых процедур и технологий и в какой степени оправданны затраты на ее дальнейшее развитие. Таким образом, приоритет задачи оценки надежности и оптимизации плана развития отказоустойчивой структуры автоматизированных систем управления должен быть не ниже приоритета задачи ее обеспечения.
Под отказоустойчивостью понимается количество одновременных отказов компонентов системы, которые приводят к прекращению работы, т. е. чем больше узлов системы нужно вывести из строя для прекращения ее работы, тем более отказоустойчива такая система.
Отказоустойчивость повышает общую надежность системы, собранной даже из недостаточно надежных компонентов. Требования по отказоустойчивости определяются по разности между требуемым уровнем надежности и реальной надежностью существующих компонентов. В свою очередь надежность - это доля времени непрерывной работы автоматизированной системы управления: чем больше эта величина, тем меньше система простаивает. Для критически важных приложений нужно добиваться как минимум 99,9%-й надежности. Общим требованием сегодня стали «пять девяток» - 5 мин простоя в год. Однако такие же требования нужно предъявлять и к сетевому оборудованию, каналам подключения и электропитанию. И естественно, что надежность серверов должна быть выше надежности рабочих станций и мобильных устройств.
Простое дублирование элементов автоматизированной системы управления зачастую не является эффективным решением проблемы отказоустойчивости. Существует ряд кластерных решений, но при этом опять же возникает проблема развития системы в целом.
Усложнение структуры автоматизированной системы управления предъявляет повышенные требования к эффективности и качеству принимаемых решений на всех этапах ее развития.
Возможны два способа повышения надежности автоматизированных систем управления: увеличение индивидуальной надежности отдельных подсистем и компонентов и улучшение общесистемной отказоустойчивости. В первом случае увеличивается надежность каждого элемента системы, что позволяет строить конфигурации высокой доступности из небольшого количества компонентов. Во втором случае для построения надежной распределенной системы обычно используется большое количество не очень надежных компонентов, а высокая надежность всей систе-
Решетневскце чтения
мы достигается многократным дублированием (резервированием).
Использование резервирования увеличивает отказоустойчивость компьютеров по отношению к сбоям внутренних компонентов: блоков питания, дисков, процессоров. Основной задачей здесь является оперативная идентификация сбоя и перевод системы на работу с резервным аналогом выходящего из строя компонента. При этом для резервирования, например, блоков питания не требуется программной поддержки, в то время как для памяти, жестких дисков и процессора часто приходится менять и программное обеспечение. В результате решение становится не универсальным, и его нельзя применить для других серверов.
Горячая замена вместе с дублированием позволяет выполнять ремонт серверов без прекращения их работы, что увеличивает доступность, но уменьшает отказоустойчивость и надежность компьютера во время смены блока. Наиболее сложно обеспечить горячую замену процессоров, памяти и жестких дисков, поскольку для этого нужно реализовать динамическую перестройку операционной системы. Кроме того, необходимо правильно спроектировать корпус сервера, чтобы можно было менять внутренние элементы, не вынимая весь сервер из монтажной стойки.
Немаловажным элементом надежности систем является диагностика компонентов: процессора, памяти, системной платы, а также контроль возникновения ошибок. Диагностика способствует предупреждению аварий и своевременной замене блока, который пока еще работает корректно, но вероятность его сбоя уже достаточно высока.
Горячая замена компонента также позволяет исправить поломку еще до ее возникновения.
Существуют две реализации кластеров, обеспечивающих надежную работу автоматизированных систем управления: аппаратная и программная. Аппаратная реализация предусматривает специальные компоненты для поддержки целостности кластера и обрабатываемых им данных. Программная реализация ориентирована на создание кластера из универсальных серверов и сетевых технологий, но требует поддержки со стороны операционной системы: баланса загрузки, контроля работоспособности узлов, перераспределения ресурсов и решения других задач. Собственно аппаратные кластеры выпускаются уже давно, а сегодня начали появляться и программные кластеры.
В настоящее время крайне актуальны вопросы постановки и формализации задач синтеза аппаратных и программных структур, разработки оптимизационных моделей, а также построения на их основе процедур синтеза и управления развитием структуры автоматизированных систем управления, позволяющих учитывать динамику функционирования элементов этих систем.
Аппаратно-программные решения для структур автоматизированных систем управления, обеспечивающие катастрофоустойчивость, соответствуют различным типам кластеров: локальному, кампусному
или метрокластеру. Для защиты от катастроф узлы кластера необходимо разнести на достаточное расстояние, которое определяется исходя из конкретной ситуации и в соответствии с используемой технологией репликации данных. Узлы могут размещаться в разных помещениях, на разных этажах здания, в разных районах города или даже в разных городах или странах.
Развитие структуры автоматизированных систем управления заключается в определении моментов ввода различных типов кластеров в структуру серверной сети в каждый период планирования и потоков мощностей между кластерами различных уровней иерархии (согласно выбранным степеням катастрофо-устойчивости) с учетом динамики изменения потребностей абонентов каждого структурного компонента (сервера) в информационно-технологических работах и капитальных затрат на ее развитие.
Управление развитием данных систем требует разработки программного обеспечения, учитывающего особенности их структуры. Однако для многих задач, возникающих при этом, алгоритмы программ не могут быть эффективно адаптированы конкретно к этим системам, или время адаптации сравнимо со сроком полезного использования задачи. Для большого класса задач не нужна высокая производительность обработки одного набора данных. Гораздо важнее возможность использования надежных автоматизированных систем управления с приемлемой производительностью и возможностью одновременной обработки нескольких наборов данных.
Объем доступных ресурсов для автоматизированных систем управления изменяется во времени, поэтому применение методов планирования загрузки системы (составления расписаний) или прогнозирования времени завершения решения задачи, основанных на статических или детерминированных моделях систем или программ, является сложной проблемой, связанной с необходимостью поиска новых подходов к анализу временных характеристик работы узлов системы и методов, обеспечивающих управление вычислением приоритетности задач обработки информации.
Средства разработки современных автоматизированных систем управления стоят на пороге появления конструкторов готовых систем, состоящих из наборов компонентов от различных производителей. Компонентная архитектура стала возможной благодаря поддержке ведущими производителями аппаратного и программного обеспечения общих стандартов на проектирование, разработку и технологию компонентной сборки автоматизированных систем управления, реализуемых на различных программно-аппаратных платформах.
Таким образом, теоретическая и практическая значимость совершенствования модельно-алгоритми-ческого обеспечения высокой надежности и отказоустойчивости автоматизированных систем управления, а также процессов управления развитием кластерной структуры этих систем обусловливают актуальность данного направления исследований.
R. Yu. Tsarev Siberian State University, Russia, Krasnoyarsk
K. A. Semenko
Polar Division of OJSC «MMC «Norilsk Nickel», Russia, Norilsk
M. V. Tyupkin
Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk
RELIABILITY ANALYSIS AND DEVELOPMENT MANAGEMENT CLUSTER STRUCTURES
OF AUTOMATED CONTROL SYSTEMS
The paper deals with the design, development and reliability of cluster structures of automated control systems.
© Царев Р. Ю., Семенько К. А., Тюпкин М. В., 2012
УДК 629.7
Д. С. Чепашев, В. М. Мусонов, В. П. Худоногов, В. Н. Гейман
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
РАЗРАБОТКА ВИРТУАЛЬНОГО УЧЕБНОГО СТЕНДА СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ПОЛЕТОМ ЛЕТАТЕЛЬНОГО АППАРАТА В СРЕДЕ MATLAB/SIMULINK
Предлагается вариант учебного лабораторного стенда, помогающего студентам в изучении теории и практики автоматизированного и автоматического управления полетом воздушных судов, принципа действия, устройства и особенностей автоматических средств.
«Системы автоматического управления полетом» является довольно сложной в освоении. В результате ее изучения студенты должны знать основные положения динамики управления полетом воздушного судна (ВС), свойства самолета как объекта управления; основы теории построения, принцип действия, устройство и работу, особенности законов управления и эксплуатационные особенности систем автоматического управления полетом [1].
Существующая материальная база может быть пополнена виртуальными средствами, способствующими быстрому и качественному освоению данной дисциплины. В качестве возможного решения предлагается вариант виртуального учебного стенда системы автоматического управления полетом, разработанный в среде МЛТЬЛБ Simulink - самой эффективной среди систем для численных вычислений, которая фактически стала мировым стандартом в области современного математического и научно-технического программного обеспечения [2].
Виртуальный учебный стенд состоит из модулей, каждый из которых обозначен соответствующим номером и представляет собой замкнутый контур «летательный аппарат - автопилот» (см. рисунок). Каждый модуль также имеет свою внутреннюю структуру, построенную в соответствии с современной архитектурой систем автоматического управления и положениями учебников и методических указаний по изучению дисциплины.
Модуль системы автоматического управления полетом 1 имитирует работу непосредственно самой
САУ полетом согласно классическим законам управления и дополнительным законам управления, адаптированных для работы в MATLAB. Входными параметрами являются информация, поступающая с выхода модуля нелинейной модели летательного аппарата (вектор угловой скорости, вектор воздушной скорости, вектор углового положения, угол тангажа, угол скольжения, пространственное положение летательного аппарата); информация, поступающая с выхода модуля сигналов VOR/ILS (сигнал рассогласования азимута маяка VOR, сигнал рассогласования от рав-носигнальной линии курса ILS, сигнал рассогласования от равносигнальной линии глиссады); информация, поступающая с выхода модуля плана полета (горизонтальная и вертикальная составляющая плана полета). Выходными параметрами являются управляющие воздействия на руль высоты, управляющие воздействия на элероны, управляющие воздействия на руль направления, управляющие воздействия на тягу двигателей.
Нелинейная модель самолета 2 представляет собой нелинейную математическую модель пространственного движения летательного аппарата, входными параметрами которой являются выходные параметры модуля системы автоматического управления полетом 1, а выходными параметрами - параметры полета (высота полета, координаты летательного аппарата, воздушная скорость, угол скольжения, угол атаки, угол крена, угол тангажа, курс, угловая скорость крена, угловая скорость рыскания, угловая скорость тангажа, ускорения по трем осям).