Научная статья на тему 'Применение муравьиного алгоритма для формирования выборки при статистической обработке данных'

Применение муравьиного алгоритма для формирования выборки при статистической обработке данных Текст научной статьи по специальности «Математика»

CC BY
183
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУРАВЬИНЫЙ АЛГОРИТМ / СТАТИСТИЧЕСКИЙ КОНТРОЛЬ ПРОЦЕССОВ / РЕГРЕССИОННЫЙ АНАЛИЗ / ЭВРИСТИКА / МУЛЬТИКОЛЛИНЕАРНОСТЬ / ANT COLONY ALGORITHM / STATISTICAL PROCESS CONTROL / REGRESSION ANALYSIS / HEURISTIC / MULTICOLLINEARITY

Аннотация научной статьи по математике, автор научной работы — Храмешин Дмитрий Викторович, Кабаков Зотей Константинович, Аншелес Валерий Рудольфович, Славов Владимир Ионович, Окунева Татьяна Александровна

Статья посвящена использованию эвристического муравьиного алгоритма для нужд статистического контроля процессов. Указанный алгоритм применяется для быстрого поиска и исключения из исходного набора данных записей, снижающих качество рассчитываемых на наборе регрессионных уравнений, но формально не являющихся выпадами и поэтому не обнаруженные стандартными статистическими методами при первоначальной подготовке данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Храмешин Дмитрий Викторович, Кабаков Зотей Константинович, Аншелес Валерий Рудольфович, Славов Владимир Ионович, Окунева Татьяна Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение муравьиного алгоритма для формирования выборки при статистической обработке данных»

Метка 1 Метка 2 Метка 3

Рис. 11. Перемещение продукции между стеллажами

Выводы

Разработан алгоритм обработки данных считывания КРГО-меток для контроля перемещения продукции на производственных предприятиях. Решена задача повышения достоверности автоматической идентификации за счет алгоритма обработки накопленных данных в период перемещения промышленной продукции. Предложен универсальный прибор для крепежа на траверсу, позволяющий автоматически считывать ИРГО-метки. Проведены эксперименты, доказывающие работоспособность и эффективность метода решения данной задачи.

References

1. Muhammad Shahzad Alex X. Liu Identification of Active RFID Tags with Statistically Guaranteed Fairness[2015 IEEE 23rd International Conference on Network Protocols (ICNP)], 2015, 279-290 p., DOI: 10.1109/ICNP.2015.23

2. Muhammad Shahzad Alex X. Liu Probabilistic Optimal Tree Hopping for RFID Identification [IEEE/ACM Transactions on Networking], 2015, 796 - 809 p., DOI: 10.1109/TNET. 2014. 2308873

3. Alberto Isasi Sergio Rodriguez Location, tracking and identification with RFID and vision data fusion [Smart Objects: Systems, Technologies and Applications (RFID Sys Tech), 2010 European Workshop on], 2010, p. 1-6.

УДК 004.023

Д.В. Храмешин

Выксунский металлургический завод (г. Выкса), З.К. Кабаков, Т.А. Окунева, В.Р. Аншелес Череповецкий государственный университет

В.И. Славов

Череповецкое высшее военное инженерное училище радиоэлектроники

ПРИМЕНЕНИЕ МУРАВЬИНОГО АЛГОРИТМА ДЛЯ ФОРМИРОВАНИЯ ВЫБОРКИ ПРИ СТАТИСТИЧЕСКОЙ ОБРАБОТКЕ ДАННЫХ

Статья посвящена использованию эвристического муравьиного алгоритма для нужд статистического контроля процессов. Указанный алгоритм применяется для быстрого поиска и исключения из исходного набора данных записей, снижающих качество рассчитываемых на наборе регрессионных уравнений, но формально не являющихся выпадами и поэтому не обнаруженные стандартными статистическими методами при первоначальной подготовке данных.

Муравьиный алгоритм, статистический контроль процессов, регрессионный анализ, эвристика, мультиколлинеарность.

The article deals with usage of heuristic ant colony algorithm for searching rows within initial data set, which affect regression calculations in a bad way. It removes such rows from data set, even if they were not considered as outlays when the set was treated with default statistical analysis. That helps to calculate multiple regression for further prediction of product's mechanical properties.

Ant colony algorithm, Statistical process control, regression analysis, heuristic, multicollinearity.

Введение

В условиях стабильности технологического процесса производства горячекатаного металла снижение издержек на прямые испытания готовой металлопродукции может быть осуществлено за счет внедрения статистического неразрушающего контроля качества. Отраслевой стандарт, позволяющий осуществлять контроль механических свойств рулонного проката через корреляционную зависимость технологических параметров, накладывает жесткие ограничения на значимость регрессионных уравнений.

Для удержания риска потребителя в заданных рамках к исходной выборке, используемой для построения регрессионных уравнений, предъявляются повышенные требования. Подготовка выборки с большим объемом данных и анализ имеющихся в ней выпадов становится нетривиальной задачей.

В данной работе представлен метод подготовки исходной выборки при использовании муравьиного алгоритма и опыт его применения на заводе «Литей-но-прокатный комплекс» (ЛПК г. Выкса) для расчета относительного удлинения стали марки «20». Пока-

зана возможность использования метода для получения регрессионных зависимостей, удовлетворяющих критериям отраслевого стандарта ОСТ 14-1-34-90 «Статистический приемочный контроль качества металлопродукции по корреляционной связи между параметрами» в случаях, когда обычные методы оптимизации выборки данных приводят к неудовлетворительным результатам или не могут быть применены из-за длительности расчета.

Основная часть

На ЛПК введена в эксплуатацию система статистического неразрушающего контроля механических свойств горячекатаного проката рядовых марок стали. Механические свойства оцениваются при помощи уравнений множественной линейной регрессии, описывающих взаимосвязь таких свойств, как предел прочности, временное сопротивление, относительное удлинение, ударная вязкость и проч. с технологическими параметрами процесса производства. Микроструктура отдельных горячекатаных полос партии может варьироваться в некоторых пределах из-за небольших отличий в химическом составе, разницы в градиенте температур при охлаждении и отличий в режиме работы оборудования. Статистический не-разрушающий контроль гарантирует соответствие механических и других свойств металла их средним значениям за счет случайности отбора образцов для проведения контрольных испытаний [3, с. 12].

Благодаря широкому внедрению информационных систем на ЛПК на каждом этапе металлургического передела, начиная от выплавки стали в дуговой печи и до смотки готового рулона, собирается несколько сотен параметров. Технологами комплекса был составлен перечень из нескольких сотен параметров, оказывающих влияние на механические свойства металла. При помощи статистического анализа из этого перечня было выделено около 40 параметров, чей вклад в эти свойства является значительным. До 2014 г. подготовка данных для расчета корреляционных зависимостей между параметрами процесса велась в ручном режиме. С 2014 г. в эксплуатацию была введена система статистического анализа и сортировки, которая позволила ускорить расчет новых уравнений и проводить аттестацию для большего числа марок сталей и по большему числу испытаний. Математической формой данного анализа является совокупность линейных регрессионных уравнений, которые должны наиболее полно описывать поведение механических свойств в зависимости от применяемой технологии производства [1, с. 25].

Для расчета уравнения множественной линейной регрессии согласно ОСТ 14-1-34-90 требуется включить в исходную выборку не менее 200 партий (плавок), произведенных за последние два года. В большинстве случаев этого оказывается достаточно для расчета уравнения, удовлетворяющего /-критерию на уровне значимости 0,05 при величине множественного коэффициента корреляции не менее 0,4. Поскольку отраслевой стандарт явно указывает, что не-разрушающий контроль следует вводить только для статистически управляемого, устоявшегося во времени процесса, перед каждым расчетом нового урав-

нения должна производиться тщательная подготовка исходной выборки. Эта подготовка включает отсев выпадов по каждому исследуемому параметру до достижения статистической однородности по t-критерию на уровне значимости 0,05.

Технология производства ряда марок на Литейно-прокатном комплексе с течением времени изменяется. При этом изменяются температурные режимы, химический состав, обжатия в клетях прокатного стана, стратегии охлаждения, методики отбора образцов для проведения механических испытаний и др. Для проверки значительности влияния этих изменений проводят экспериментальные плавки. Если изменения приводят к улучшению качества, то эти изменения становится постоянной практикой. Изменения, не выходящие за пределы допусков действующих технических регламентов, зачастую не имеют специальных отметок в электронных системах. Такие плавки сложно опознать и исключить из исходной выборки в случаях, когда измененный параметр не является ключевым (не попадает в выборку), или стандартные методы обнаружения выпадов, такие как контрольные карты Шухарта и Хотелинга, оказываются нечувствительны к его изменениям.

На практике многие предположения классического регрессионного анализа не соблюдаются [2, с. 131]. Так, большая часть технологических параметров взаимно коррелирована, поэтому даже небольшое целенаправленное изменение одного из них приводит к изменению остальных связанных параметров, что оказывает мультипликативный эффект на суммарную ошибку регрессии. Наличие в исходной выборке подобных плавок приводит к невозможности установить адекватный вид зависимости между параметрами и исследуемым свойством, снижая коэффициент корреляции полученного уравнения или приводя к полной невозможности его расчета. Анализ остатков не позволяет обнаружить такие плавки, поскольку формально они не являются «выпадами». Наличие таких плавок в выборке увеличивает отклонение линии регрессии от ее истинного положения, повышая суммарную ошибку и маскируя существенные отклонения между фактическими и расчетными значениями в дополнительном шуме.

Подобная ситуация возникла при попытке расчета уравнения для свойства «относительное удлинение» марки стали «20». Множественная регрессия вычислялась методом наименьших квадратов, реализованном в виде программного пакета PL/SQL базы данных Oracle. Поскольку максимальная размерность матриц, обрабатываемых Oracle версии 11g, составляет 1 млн элементов (здесь и далее «записей»), то в исходную выборку включалось не более 1000 записей, что для стали «20» было меньше накопленного объема информации (8400 записей после исключения всех обнаруженных выпадов), но многократно превышало нижний предел, установленный отраслевым стандартом.

Предварительные расчеты показали, что при отборе в исходную выборку записей, которые содержат последовательно произведенные плавки, уравнение имело коэффициент множественной корреляции больше 0,4, однако прогнозирование новых наблю-

дений с их помощью было невозможно, поскольку на контрольной выборке величина коэффициента корреляции составляла ниже 0,1. Для исключения влияния временного фактора записи в исходном наборе подверглись случайному перемешиванию. Однако отбор 1000 случайных записей позволил вычислить регрессионное уравнение с коэффициентом корреляции не более 0,3.

Полный перебор состава исходной выборки не представлялся возможным в связи с большим числом вариантов.

р1000 _ С8400 =

8400!

1000! (8400 -1000)!

:5,75 • 101

Отсюда возникла задача оптимизации выбора плавок из общего числа для исходного набора, который обеспечил бы высокий коэффициент корреляции в исходной и проверочной выборках. Для улучшения исходной выборки был применен эвристический метод, известный как муравьиный алгоритм.

Муравьиный алгоритм представляет собой вероятностную эвристику, определяющую наиболее выгодный способ прокладывания маршрута между отдельными точками, для удобства представляемыми в виде узлов двумерного двунаправленного графа [4]. При переходе между точками муравей отмечает выбранный им маршрут, оставляя на нем пахучее вещество - феромон - и повышая тем самым вероятность перехода по нему следующего муравья. Количество феромона зависит от общей эффективности пройденного маршрута, и вычисляется в конце каждого прохода. Помимо феромона на вероятность перехода оказывает влияние длина ребра между соседними узлами графа. Вероятность перехода муравья на определенном проходе из узла / в узел у, согласно классической формуле вероятности перехода, описывает-

ся уравнением Рук =

[т ук Т [П ]

N

к I ["" ]ь

где а - коэф-

фициент влияния на вероятность перехода количества присутствующего на ребре феромона (коэффициент стадности), Ь - коэффициент влияния на вероятность перехода длины ребра (коэффициент жадности), т у, к - количество феромона на ребре / у после к-го прохода, зависящий от количества муравьев, ранее прошедших этим же ребром и от скорости испарения феромона, п у - длина ребра, определяющая эвристическую эффективность перехода муравья по ребру I], N - число возможных переходов из узла / .

Поскольку на качество множественной регрессии влияет не порядок следования записей, а сам факт их наличия в исходной выборке, учет длин ребер между отдельными узлами для текущей задачи был опущен, и вероятность перехода определялась исключительно через количество феромона на ребрах.

Р..,. =

У J

у,к N

Е[хй,к I

Суммарное число проходов муравьиного алгоритма обычно лимитируется достижением оптимизируемой функцией удовлетворительного результата либо превышением заранее установленного числа проходов. Найденный муравьями маршрут необязательно является лучшим из всех возможных, однако опыт применения эвристических алгоритмов говорит о том, что на графе большой размерности они с высокой вероятностью находят самый короткий маршрут за относительно небольшое время.

Для задачи построения регрессионного уравнения в узлах графа были размещены отдельные записи, из которых муравьи должны были составить исходную выборку. В качестве оптимизируемой функции был выбран коэффициент множественной детерминации Я2 для исходной и проверочной частей выборки. Количество феромона т, оставляемое муравьем на ребре ц, определялось согласно формуле

Ту,к-1 + Я2 ч хук =-2-(1 - Р), где к - порядковый номер

прохода, Тукк-1 - количество феромона на ребре между узлами / и Ц на предыдущем проходе к - 1, р -коэффициент испарения феромона. Каждый проход завершался после посещения муравьем 1000 узлов графа. Условием остановки было достижение оптимизируемой функцией значения равного или больше

0.4.

Поскольку в рассматриваемой задаче качество уравнения множественной регрессии зависит исключительно от состава исходной выборки, а не от порядка расположения находящихся в ней записей, было принято решение модифицировать алгоритм таким образом, чтобы значение феромона для каждого ребра не сохранялось, а вычислялось каждый раз таким образом, чтобы Ту не зависело от узла выхода муравья /, а целиком определялось узлом назначения Ц, согласно формуле Ту = т^, где т^ - количество

феромона для каждого ребра, завершающегося узлом Ц . Первоначальное количество феромона всех узлов было установлено равным 1. Поскольку Я2 меньше

1, то эффективность узлов, посещенных на определенном проходе, становилась меньше изначальной тк < т0, что повышало вероятность посещения муравьями узлов графа, через которые еще не было проложено ни одного маршрута. Для ускорения посещения муравьями таких узлов в них количество феромона не изменялось до первого посещения. Экспериментально было установлено, что оптимальный результат работы алгоритма достигнут при коэффициенте испарения р = 0,01 и коэффициенте «стадности» а = 1. Узел, из которого муравей начинал обход графа, выбирался случайным образом для каждого прохода.

При использовании описанного муравьиного алгоритма была сформирована выборка, статистическая обработка которой позволила получить уравнение множественной регрессии для параметра «относительное удлинение» стали марки «20», с учетом всех требований ОСТ 14-1-34-9 и получить коэффициент множественной корреляции больше 0,4.

I=1

Выводы

Таким образом, предложен метод подготовки исходной выборки для расчета линейной регрессии с использованием муравьиного алгоритма. Применение этого метода позволяет ускорить процесс поиска в общем массиве записей, снижающих коэффициент множественной корреляции, и исключить их при формирования исходной выборки.

Литература

1. Генкин А.Л. Моделирование и оптимизация процесса горячей прокатки полос. М., 2012. 168 с.

2. Клячкин В.Н. Модели и методы статистического контроля многопараметрического технологического процесса. М., 2011. 196 с.

3. Коновалов Ю.В. Справочник прокатчика. Кн. 1. Производство горячекатаных листов и полос. М., 2008. 640 с.

4. Штовба С.Д. Муравьиные алгоритмы // Математика в приложениях. 2003. №4. C. 70-75.

References

1. Genkin A.L. Modelirovanie i optimizaciia processa gorjachei prokatki polos [Optimization and modernization of hot strip mill rolling]. Moscow, 2012, 168 p.

2. Kliachkin V.N. Modeli i metody statisticheskogo kon-trolia mnogoparametricheskogo tehnologicheskogo processa [Models and methods of multiparametrical statistical control of technological process]. Moscow, 2011, 196 p.

3. Konovalov Ju.V. Spravochnik prokatchika. Spravoch-noe izdanie v 2-h knigah. Kniga 1. Proizvodstvo goriacheka-tanyh listov i polos [Refernce book of rolling mill operator. Vol 1 of 2. Producing hot strips and rolls]. Moscow, 2008, 640 p.

4. Shtovba S.D. Murav'inye algoritmy [Ant colony algorithms]. Matematika v prilozheniiah [Useful mathematic], 2003, №4, pp. 70-75.

УДК 662. 957

Ю.В. Цымбалюк

Астраханский государственный архитектурно-строительный университет

АНАЛИЗ ЭНЕРГЕТИЧЕСКОЙ ЭФФЕКТИВНОСТИ ТЕПЛОВЫХ АККУМУЛЯТОРОВ С ТЕПЛОАККУМУЛИРУЮЩИМИ МАТЕРИАЛАМИ ФАЗОВОГО ПЕРЕХОДА

Проведенные автором исследования тепловых аккумуляторов с фазопереходным теплоаккумулирующим материалом и высокотеплопроводными инклюзивами различной формы позволили разработать методику расчета основных параметров тепловых аккумуляторов такого типа. Произведена оценка условий применения и размещения тепловых аккумуляторов, вида и свойств фазопереходного теплоаккумулирующего материала и его режимные параметры. Задаваясь значением полезно используемого количества теплоты, получаемого в период разрядки аккумулятора, можно определить объем теплового аккумулятора. Определен объем теплового аккумулятора с фазопереходным теплоаккумулирующим материалом в зависимости от различных режимных параметров, в том числе: от коэффициента теплопередачи через стенки аккумулятора, периода разрядки, коэффициента формы аккумулятора при различных значениях полезно использованного количества тепла, полученного во время разрядки. С повышением количества накопленного тепла и периода разрядки необходимый объем теплоаккумулятора возрастает, при этом большее влияние оказывает изменение количества саккумулированного тепла.

Теплоаккумулирующий материал фазового перехода, тепловой аккумулятор, плотность теплового потока, режим разрядки теплового аккумулятора, толщина образования новой фазы, высокотеплопроводные инклюзивы.

On the basis of studies of heat accumulators with phase-transitive material of high heat conductivity and inclusive of various forms we developed a method of calculation of main parameters of heat accumulators of this type. Conditions and placement of heat accumulators, the type and properties of the heat accumulating phase transitive material and its operating parameters were assessed. Assigning the value of the useful amount of heat produced during discharge of the battery, you can determine the amount of the heat accumulator. The volume of the heat accumulator with a heat storage phase-transitive material, depending on the coefficient of heat transfer through the wall of the battery, discharge period, and the shape factor of the battery at different values of absorbed amount of heat generated during discharge were determined. With the increase in the amount of accumulated heat and discharge period the required volume of the heat accumulator increases, with more impact of the change in the amount of accumulated heat.

Heat storage material in phase transition, heat storage, the thickness of the new phase formation, the high heat inclusive.

Введение

В современных системах автономного теплоснабжения кроме источников, работающих на традиционных видах топливных ресурсов, могут использоваться и альтернативные теплоисточники на основе солнечной и ветровой энергии [1], [2]. В то же время их использование затрудняется неравномерностью поступления, поэтому для обеспечения стабильного функционирования систем с возобновляе-

density of the heat flow, the thermal discharge accumulators, the

мыми источниками энергии (ВИЭ) целесообразно применение теплоаккумуляторов с теплоаккумули-рующим материалом фазового перехода (ТАМФП). На рис. 1 показана установка фазопереходного теп-лоаккумулятора в компоновке с гелиоустановкой и теплогенератором индивидуального типа (к примеру, газовым водонагревателем). Холодная вода из бака запаса холодной воды 1, пройдя через гелиоколлек-тор, поступает в бак - аккумулятор теплоты с ТАМ

i Надоели баннеры? Вы всегда можете отключить рекламу.