Научная статья на тему 'Разработка оптимальной системы управления процессом зажигания агломерационной шихты'

Разработка оптимальной системы управления процессом зажигания агломерационной шихты Текст научной статьи по специальности «Математика»

CC BY
156
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАЖИГАТЕЛЬНЫЙ ГОРН / IGNITION FURNACE / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / МОДЕЛИРОВАНИЕ / MODELING / КВАЗИ-МАРКОВСКИЕ ЦЕПИ / QUASI-MARKOV CHAINS

Аннотация научной статьи по математике, автор научной работы — Петрушенко Сергей Юрьевич, Ендияров Сергей Валерьевич

В данной статье разрабатываются математические модели для управления процессом зажигания агломерационной шихты с использованием квази-Марковских цепей. Рассматривается постановка задачи оптимального управления, а также выводятся необходимые соотношения динамического программирования c учетом неопределенности показателей процесса зажигания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Петрушенко Сергей Юрьевич, Ендияров Сергей Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка оптимальной системы управления процессом зажигания агломерационной шихты»

Разработка алгоритма локализации символьной маркировки трубной продукции на основе последовательного двумерного поиска усредненного максимума потребовалась в связи с неравномерностью освещения в условиях производства. Наложение естественного и искусственного освещения создавали случаи «засвечивания» промышленных агрегатов таким образом, что, находясь в составе фона изображения, они имели схожие с маркировкой характеристики.

Использование разработанного алгоритма позволило повысить достоверность идентификации в равномерно освещенных частях на 1-2 %, а в неравномерно освещенных - на 7-8 %. Шанс возникновения ошибки первого рода снизился на 0,72 % и составил 0,95-2,82 %. Шанс возникновения ошибки второго рода снизился на 0,85 % и составил 0,2-0,4 %.

Выводы.

Рассмотренные алгоритмы успешно используются для решения различных задач распознавания образов. Для решения же поставленной задачи ни один из известных опубликованных алгоритмов не соответствовал предъявленным требованиям. Поэтому был разработан специальный алгоритм, опирающийся на специфику поставленной задачи. Именно он решает все проблемы локализации маркера. Он идеально быстр (быстрее в принципе невозможно разработать алгоритм), так как он анализирует только малую часть изображения, не говоря уже о нескольких проходах по всему изображению, которые используются в других алгоритмах. Любой другой алгоритм, анализирующий меньшее количество инфор-

мации, будет иметь вероятность ошибки (пропустить маркер), так как маркер сможет поместиться вне анализируемой области. Кроме того, разработанный алгоритм уникально помехоустойчив.

Литература

1. Астафьев, А. В. Методика и алгоритмы автоматической двухэтапной видеоидентификации металлопрокатных заготовок / А. А. Орлов, А. В. Астафьев, А. В. Прово-торов // Автоматизация в промышленности. - 2013. - № 10.

- С. 53-57.

2. Астафьев, А. В. Метод объединения результатов алгоритмов цифровой локализации символьных маркировок / А. А. Орлов, А. В. Астафьев // Научно-технический вестник Поволжья. - 2013. - № 6. - С. 394-396.

3. Астафьев, А. В. Анализ визуальных систем мониторинга производственного процесса на промышленных предприятиях / А. В. Астафьев, А. В. Провоторов, А. А. Орлов // Вестник Новосибирского государственного университета экономики и управления. - 2011. - №1. - Т. 114.

- С. 26-32.

4. Астафьев, А. В. Методы и алгоритмы локализации изображений маркировок в управляемых системах видеонаблюдения / А. В. Астафьев, А. А. Орлов, А. В. Провоторов // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. - 2011. - № 2.

- С. 22-29.

5. Astafiev, A. Development of algorithm for localization of production markings with the use of analysis of the color data on digital images / A. Astafiev, A. Orlov // Geoconference on informatics, geoinformatics and remote sensing conference proceedings. Vol. 1. - Albena, Bulgaria, 2014. - S. 113-118.

УДК 004.89, 519.2, 519.85

С. Ю. Петрушенко

НПО «Новатор» (г. Екатеринбург), С. В. Ендияров

ОАО «Уралмашзавод» (г. Екатеринбург)

РАЗРАБОТКА ОПТИМАЛЬНОЙ СИСТЕМЫ УПРАВЛЕНИЯ ПРОЦЕССОМ ЗАЖИГАНИЯ АГЛОМЕРАЦИОННОЙ ШИХТЫ

В данной статье разрабатываются математические модели для управления процессом зажигания агломерационной шихты с использованием квази-Марковских цепей. Рассматривается постановка задачи оптимального управления, а также выводятся необходимые соотношения динамического программирования c учетом неопределенности показателей процесса зажигания.

Зажигательный горн, оптимальное управление, моделирование, квази-Марковские цепи.

The authors of the paper deals with the development of mathematical models for an optimal control of the ignition process of sintering mixture using quasi-Markov chains. The problem of optimal control is considered and the necessary relations of dynamic programming taking into account the uncertainty of available parameters of ignition are produced.

Ignition furnace, optimal control, modeling, quasi-Markov chains. Введение.

Использование малогабаритных зажигательных ] горнов небольшой длины при агломерации шихт с

высокой долей тонких концентратов, спекание которых из-за относительно низкой газопроницаемости производится при высоте слоя 300-350 мм, требует

более точного и полного контроля и регулирования качества зажигания.

Качество зажигания шихты на конвейерной агломерационной машине зависит от большого числа неравнозначных факторов, связанных со свойствами используемого топлива и режимом его сжигания, свойствами шихты и параметрами работы машины. Это предопределяет значительные трудности в определении параметров, которые должны быть учтены при настройке процесса зажигания, а также в построении комплексной модели, которая должна применяться в схеме управления зажиганием.

В данной статье предлагается подход управления процессом зажигания агломерационной шихты с использованием квази-Марковских цепей. Введение понятия квази-Марковской цепи позволяет использовать весь набор существенных признаков, влияющих на качественные показатели агломерата. В статье рассматривается постановка задачи оптимального управления, а также выводятся необходимые соотношения динамического программирования с целью максимизации вероятности перехода в заданное состояние.

Основная часть.

Оптимальное управление для Марковской цепи первого порядка. Для введения понятие квазиМарковской цепи, а также для постановки оптимального управления для квази-Марковской цепи опишем данную задачу применительно к «классической» цепи Маркова первого порядка.

Рассмотрим систему с N состояниями, функционирование которой на интервале времени продолжительностью ишах шагов описывается цепью Маркова с доходами. Цепь Маркова называется управляемой, если на каждом шаге п = 1,2,...,птах и в каждом состоянии ' = 1,2,..., N может быть выбрана некоторая стратегия, определяющая дальнейшее функционирование системы [1]:

Р]' = (Р]1, р]2^ Р%).

Величина ]у называется стратегией управления в ' состоянии, а Л. е {X.} - множеством стратегий управления в состоянии. Вектор стратегий ] = (]1,...,]',...,]N) е К1 х К2 х... х KN называется политикой. Если стратегия X. или политика X выбираются на п шаге, то они снабжаются индексом п, а именно: Xуп или ]п = (]1п,...,]уп,...,]ш). Последовательность политик, выбранных на каждом шаге, образует управление ] = (]1;..., ].,..., ] ).

Будем говорить, что управление происходит на конечном горизонте управления, если птах < да иначе о бесконечном.

Пусть Е(Х) - эффективность функционирования системы на заданном интервале управления, тогда

управление X *, максимизирующее эффективность функционирования системы, называется оптимальным:

Е(Х ) = max Е(Х).

А

Обозначим множество возможных состояний системы Q, тогда множество Q0 cQ есть множество заданных состояний:

Ц = {с»!,..., га..,..., } Ц сй = {ш8,...,юд}.

Обозначим множество нежелательных состояний Ц0 = (Ц - Ц0), причем Ц0 пЦл = 0 . При этом задана матрица вероятностей переходов РХп:

рАп =

Г p^ Л

p^Nn

FN

где р. - есть ' вектор строка матрицы вероятностей РХп переходов:

р]" = (р]?,р]2п,...,р^).

Для управляемой цепи Маркова матрица вероятностей переходов РХп может выбираться на каждом шаге п из некоторого конечного заданного множества в соответствии с назначенной стратегией

х'п е Л'.

Для приведения системы в заданное множество состояний Ц0 требуется найти такое управление, которое максимизирует вероятность приведения системы из текущего состояния ш. е Ц0 через заданное

число шагов п в заданное множество состояний Ц0 сЦ.

Данная задача сводится к определению оптимального управления произвольной цепью с доходами при конечном горизонте управления.

Рекуррентное соотношение динамического программирования для полного ожидаемого дохода имеет вид:

Д * (п) = тах[у' + £ р]' Д *(п -1)],

где Д*(п -1)- средний ожидаемый доход, который системы «принесет», двигаясь из состояния ', а вектор столбец ух'" - средний одношаговый доход состояния, получаемый из состояния . При этом положим:

11, если / еП. Д* (0) = \ '

[0, если у еП0.

Все элементы вектора у у положим равными нулю у^ = 0 для всех у и Xп, тогда получим:

Д* (") = шах[£ рД* (" -1)].

'" /еП

Обозначим X *" оптимальной стратегией в у состоянии на п шаге, а X * оптимальной политикой на п шаге.

Таким образом, управление сложным технологическим комплексом может быть описано следующим образом: если текущее состояние юу еП0, то необходимо начинать процедуру управления процессом, максимизируя вероятность перехода объекта из нежелательного состояния ю. еП0 в состояние

у 0

юу е П0 до тех пор, пока ю ?П0. Как только объект переходит в одно из состояний множества П 0, то управление можно считать завершенным.

Предполагаем, что для завершения процесса управления объектом потребуется некоторое конечное число шагов птах < да. Как только текущее состояние объекта вновь переходит из множества П0 во множество П 0, то процедура управления вновь активируется.

В результате оптимальное управление объектом заключается в поиске на каждом шаге оптимальной политики X *, а результатом является оптимальное

управление Г = (X,...,X..,..., 1"тах).

Оптимальное управление квази-Марковскими цепями п орядка на примере управления процессом зажигания аглошихты. В данном разделе дается постановка задачи оптимального управления ква-зи-Марковскими цепями п порядка на примере управления процессом зажигания агломерационной шихты. Для начала необходимо ввести понятие ква-зи-Марковской цепи, с этой целью приведем определение «классической» Марковской цепи п порядка. Марковский процесс - это процесс, для которого вероятность находится в данном состоянии в данный момент, его можно вывести из сведений о предшествующем состоянии.

Цепью Маркова первого порядка называется одна из форм Марковских процессов, для которой каждое конкретное состояние зависит только от непосредственно предшествующего. Цепью второго порядка называют такую, в которой вероятность перехода в последующее состояние зависит как от двух предшествующих, так и от той последовательности, в которой эти состояния наступают.

Таким образом, прогнозирование состояния сложного технологического комплекса Марковской

цепью п порядка представляет собой зависимость вида:

рт- = у(ю.

ю,.

Л-к\

где р

вероятность перехода в состояние у в мо-

мент времени t +1, аЮ есть состояние, в котором

находился технологический комплекс в момент времени t. На практике же состояние технологического комплекса ю.+1 можно описать следующей зависимостью:

Рю+. = f «И,..., ),(0.,..., К"),...,(у у,..., УГ"))

(1)

где (0у,..., ),...,(у у,..., у)- есть переменные, влияющие на состояние процесса юу+1. Будем называть процесс, описываемый зависимостью (1), квазиМарковским процессом. Рассмотрим задачу оптимального управления для квази-Марковской цепи.

Предположим, что множества П 0 и П0 заданы, при этом рассмотрим случай, когда:

|п„| > 1, |П„| = 1.

То есть множество допустимых состояний П0 состоит из одного элемента. Обозначим это допустимое состояние у е П0. Для п-мерного случая оптимальное управление заключается в поиске такой стратегии X ]п, которая максимизирует вероятность

перехода в состояние у, минимизируя при этом необходимое количество шагов п, так как в общем случае вероятность перехода из состояния ю у в состояние у за п шагов, будет больше вероятности перехода за п -1 шаг.

При этом необходимо учитывать достоверность вероятности перехода ру , которая до этого момента

не упоминалась.

Обозначим число переменных, используемых для оценки вероятности перехода в состояние у, символом I, а многомерную функцию условной вероятности у*^!^ г^..^ г).

Обозначим максимальный используемый порядок модели т, тогда выражение для /.(у^,^2,...,^) запишем в следующем виде

¿(^Г,..., гг,..., гг-1,..., гг-1,..., гг-+1,..., гг-+1)

или сокращенно

Обозначим эмпирическую функцию

/,(у|Е,1-',...,...), построенную на основе экспериментальных данных процесса зажигания аглошихты следующим образом:

/.(^Г,...,...).

Управление происходит при изменении текущего состояния Ш' (изменение температуры в зажигательном горне). Число теоретически возможных переходов определяется всевозможными комбинациями элементов и количеством состояний каждого элемента.

S — Sj X S 2

C — (S x Sx ... x S)p

где S - количество комбинаций состояний p векторов, Sj - количество состояний j-го элемента, а C -количество всевозможных комбинаций векторов относительно друг друга. Число всевозможных комбинаций C даже при небольших значениях p и Sj велико.

Однако на практике нелинейность порождает своего рода квантовый эффект - дискретность путей эволюции. В нелинейной среде возможен не любой путь развития, а лишь определенный набор этих путей, определенный спектр устойчивых состояний [1].

Поэтому функция /,(;|Ц,...,...) является подмножеством функции /,(;\"Q-',...,.. ), так как в связи

с вышесказанным объект имеет определенный спектр устойчивых состояний

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/.(;|£,...,...) с ,...,...).

Если предположить, что на интервале управления состояние процесса спекания аглошихты не изменяется, то задача управления сводится к поиску наиболее вероятной одношаговой стратегии:

X; — max[m|xmax[K( /.(;|£-',...,...))-Д; (n -1)]].

При этом текущее состояние i, е {ю1,..,о,,...,;} должно полностью совпадать с состояниями ЙГ'-1,..., ^^-'-1),...,(^1-'-'+1,..., IT-+1), а состояние (51 ',..., 5J-') используется как управляющие воздействия для достижения состояния у.

Для данного случая понятие стратегия X*n совпадает с понятием политика X П . Если это не так, то рассматриваемая задача решается относительно состояний {ю1,..,о,,...,;} е Q :

ДС (n) — inax[^ max max[K(/.(ro11^,...i,,...))] - Д^ (n - 1)]

X°1n ieQ /* ^

Д1 (n) = max[^ max max[K(/.(i214Г',...i,,...))] - Д^ (n - 1)]

Xl2n ieQ /* ^

Д; (n) — max[£ maxmax[R( /,(1,|5Г,..1,...))] - ДО, (« -1)]

Д; (n) — m ax[^ maxmax[R( f,(;K' ,...ii,...))] -Д; (n -1)],

ieQ ^ ^

где М(«) - есть функция, возвращающая для данной вероятности нижнюю границу ее достоверности.

Таким образом, решается задача максимизации вероятности /,(ю Ц-',...,...) на каждом шаге

ДШ (п -1) для допустимых стратегий.

Для состояний из множества {ю1,..,».,...,у}еЦ

выбирается максимальная вероятность из множества достоверных вероятностей Т, а из наиболее достоверных оценок выбираются максимальные вероятности переходов / . В результате, после того, как поступает информация об изменении состояния процесса спекания, выбирается стратегия оптимального управления в соответствии с Д» (п).

Если достоверность любой стратегии управления слишком мала Ж(Х п) <£,, то применяются другие

средства управления процессом, например, основанные на применении методов классического управления, нечеткого управления и других.

Выбор оптимальной траектории с поправкой на достоверность правила. Обучение на основе экспериментальных данных приводит к получению вероятностей переходов. Так как экспериментальные данные обычно зашумлены и обладают конечной длиной, то вероятности, полученные таким образом, будут отличаться от реальных вероятностей переходов. Поэтому для принятия оптимальных решений необходимо учитывать достоверность вероятностных правил, получаемых в результате обучения. Каждое правило по результатам обучения может быть оценено следующими параметрами: N - число траекторий совпадающих с данной, £ - число траекторий ведущих к состоянию ' , (И - £) - число траекторий, ведущих к другим состояниям.

Положим, что вероятность / распределена по биномиальному закону, тогда доверительные границы для / могут быть аппроксимированы выражениями:

S + 2 U2 + U2

и 2

fU —

ft —

S 1 2

— (N - S) +-U2

N 4 а

n+и2

S+2 U 2 - и 2

—(N - S)+1 и 2

N 4 2

N + U2

где иа - квантиль нормального распределения для заданного уровня значимости а. То есть величина / будет ограничена сверху и снизу:

у*1 * у* * /*и.

Тогда функция М(«) примет вид:

К(/*) = // (Л).

Видно, что при Ж > 80 можно считать правило статистически достоверным. Сходимость в общем случае для разных величин /* различается значительно. Это может быть связано с отклонениями для /* = 1, /* = 0 (граничные значения).

Выводы.

Качество зажигания шихты на конвейерной агломерационной машине зависит от большого числа неравнозначных факторов, связанных со свойствами используемого топлива и режимом его сжигания, свойствами шихты и параметрами работы машины.

В данной статье предлагается подход управления процессом зажигания агломерационной шихты с использованием квази-Марковских цепей. Рассмотренная методика позволяют производить управление сложным технологическим комплексами динамика, которое описывается нелинейными дифференциальными уравнениями.

Разработанные модели были использованы при реализации систем управления зажиганием на агло-производстве ОАО «ММК» (г. Магнитогорск) в 2013 г.

Литература

1. Князева, Е. Н. Синергетика как новое мировидение: диалог с И. Пригожиным / Е. Н. Князева, С. П. Курдюмов // Вопросы философии. - 1992. - №12.

2. Соколов, Г. А. Теория вероятностей. Управляемые цепи Маркова в экономике / Г. А. Соколов, Н. А. Чистякова. - М., 2005.

УДК 519.711.2

М. Н. Рыжкова

Муромский институт (филиал) Владимирского государственного университета им. Александра Григорьевича и Николая Григорьевича Столетовых

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ПРОЦЕССА УПРАВЛЕНИЯ ОБУЧЕНИЕМ

В статье приводится математическая модель процесса обучения. Приведена разработанная диаграмма процессов, протекающих в системе обучения с указанием отдельных компонентов системы и взаимосвязей между ними. В основу математической модели положена функциональная схема процесса обучения, определены входные и выходные элементы каждого блока схемы. Такой подход к описанию процесса обучения позволил выявить элементы, управление которыми позволит повысить качество процесса обучения в рамках дистанционного или электронного обучения.

Математическая модель, процесс обучения, управление, диаграмма процесса, функциональная схема.

The article presents a mathematical model of the learning process. The developed diagram of processes taking place in the education system with the individual components of the system and the relationships between them is given. The functional scheme of the learning process is taken as a basis of the mathematical model; inputs and outputs elements of each circuit block are defined. Such an approach to the description of the learning process has revealed the elements; its control will improve the quality of the learning process within the framework of distance or e-learning.

Mathematical model, learning process, management, process diagram, function diagram.

Введение.

Образовательная система является сложной системой, с большим количеством протекающих в ней процессов и связей. Оптимизировать работу образовательной системы возможно, управляя отдельными процессами и компонентами. Современная литература по теории управления образовательными системами выделяет три разнообразных подхода:

- организационное управление,

- педагогическое управление,

- управление процессом обучения.

Организационное управление подразумевает

управление структурой и составом образовательной организации или сети организаций, ресурсами орга-

низации, в том числе кадровым составом, а также экономической и хозяйственной деятельностью учреждения образования [1]. Педагогическое управление, согласно Л. Н. Павловой, - целенаправленное педагогическое воздействие с целью качественных изменений ученического коллектива [2]. Педагогическое управление в своей основе содержит непосредственный контакт ученика и педагога. Однако в современном мире информационных технологий все большее место отводится дистанционному или электронному обучению. Компьютер берет на себя часть функций педагога, разумеется, не заменяя его полностью. При этом качество обучения возможно повысить, управляя структурой и содержанием учебного

i Надоели баннеры? Вы всегда можете отключить рекламу.