Научная статья на тему 'Моделирование процесса сушки полимерного покрытия оцинкованной полосы на основе физически обоснованной модели машинного обучения и анализа данных'

Моделирование процесса сушки полимерного покрытия оцинкованной полосы на основе физически обоснованной модели машинного обучения и анализа данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
102
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИЗИЧЕСКИ ОБОСНОВАННАЯ МОДЕЛЬ МАШИННОГО ОБУЧЕНИЯ / МОДЕЛИРОВАНИЕ / МОДЕЛЬ / СУШКА ПОЛИМЕРНОГО ПОКРЫТИЯ / МАШИННОЕ ОБУЧЕНИЕ / АНАЛИЗ ДАННЫХ / ФУНКЦИЯ ПОТЕРЬ / ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ / МЕТОД ОПТИМИЗАЦИИ / PHYSICALLY BASED MODEL OF MACHINE LEARNING / MODELING / MODEL / POLYMER COATING DRYING / MACHINE LEARNING / DATA ANALYSIS / LOSS FUNCTION / PARAMETRIC IDENTIFICATION / OPTIMIZATION METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Осколков Василий Михайлович, Варфоломеев Игорь Андреевич, Ершов Евгений Валентинович

В статье рассмотрены подходы к построению модели процесса сушки полимерного покрытия при производстве окрашенного проката. Авторами предложен новый подход к модификации функции потерь, используемой при построении моделей с помощью алгоритмов машинного обучения. Для этого введено понятие физически обоснованной модели, которая реализуется путем корректировки процесса ее обучения на основе известных физических закономерностей. Данный подход позволяет повысить точность полученной модели машинного обучения за счет улучшения ее обобщающей способности и получения физически непротиворечивых прогнозов. Для рассматриваемой модели процесса сушки полимерного покрытия этот подход обеспечивает повышение точности прогнозирования температуры на поверхности полосы в печах сушки полимерного покрытия и снизить ошибку модели с 14 ˚С до 2,5 ˚С.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Осколков Василий Михайлович, Варфоломеев Игорь Андреевич, Ершов Евгений Валентинович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELING THE DRYING PROCESS OF POLYMER COATING ON A GALVANIZED STRIP BASED ON A PHYSICALLY JUSTIFIED MODEL OF MACHINE LEARNING AND DATA ANALYSIS

The article discusses approaches to building a model for the process of drying a polymer coating in the manufacture of colored steel. The authors proposed a new approach to modifying the loss function used in constructing models applying machine-learning algorithms. For this, the concept of a physically sound model is introduced. This model is implemented by adjusting the learning process of the model based on the known physical laws. This approach allows increasing the accuracy of the obtained machine learning model by improving its generalizing ability and obtaining physically consistent forecasts. For the model of the polymer coating drying process considered, this approach made it possible to increase the accuracy of predicting the temperature on the strip surface in polymer coating drying ovens and reduce the model error from 14 ˚С to 2,5 ˚С.

Текст научной работы на тему «Моделирование процесса сушки полимерного покрытия оцинкованной полосы на основе физически обоснованной модели машинного обучения и анализа данных»

ТЕХНИЧЕСКИЕ НАУКИ

DOI 10.23859/1994-0637-2020-2-95-1 УДК 667.6

© Осколков В. М., Варфоломеев И. А., Ершов Е. В., 2020

Осколков Василий Михайлович Oskolkov Vasilii Mikhailovich

Аспирант, Postgraduate student,

Череповецкий государственный университет Cherepovets State University

(Череповец, Россия) (Cherepovets, Russia)

E-mail: vm.oskolkov@outlook.com E-mail: vm.oskolkov@outlook.com

Варфоломеев Игорь Андреевич

Кандидат технических наук, доцент, Череповецкий государственный университет (Череповец, Россия) E-mail: igor.varf@gmail.com

Ершов Евгений Валентинович

Доктор технических наук, профессор, Череповецкий государственный университет (Череповец, Россия) ORCID 0000-0003-2888-4242 E-mail: ershov_ev@mail.ru

МОДЕЛИРОВАНИЕ ПРОЦЕССА СУШКИ ПОЛИМЕРНОГО ПОКРЫТИЯ ОЦИНКОВАННОЙ ПОЛОСЫ НА ОСНОВЕ ФИЗИЧЕСКИ ОБОСНОВАННОЙ МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ И АНАЛИЗА ДАННЫХ

Varfolomeev Igor Andreevich

PhD in Technology, Associate Professor, Cherepovets State University (Cherepovets, Russia) E-mail: igor.varf@gmail.com

Ershov Evgeny Valentinovich

Doctor of Technology, Professor, Cherepovets State University (Cherepovets, Russia) ORCID 0000-0003-2888-4242 E-mail: ershov_ev@mail.ru

MODELING THE DRYING PROCESS OF POLYMER COATING ON A GALVANIZED STRIP BASED ON A PHYSICALLY JUSTIFIED MODEL OF MACHINE LEARNING AND DATA ANALYSIS

Аннотация. В статье рассмотрены подходы к построению модели процесса сушки полимерного покрытия при производстве окрашенного проката. Авторами предложен новый подход к модификации функции потерь, используемой при построении моделей с помощью алгоритмов машинного обучения. Для этого введено понятие физически обоснованной модели, которая реализуется путем корректировки процесса ее обучения на основе известных физических закономерностей. Данный подход позволяет повысить точность полученной модели машинного обучения за счет улучшения ее обобщающей способности и получения физически непротиворечивых прогнозов. Для рассматриваемой модели процесса сушки полимерного покрытия этот подход обеспечивает повышение точности прогнозирования температуры на поверхности по-

Abstract. The article discusses approaches to building a model for the process of drying a polymer coating in the manufacture of colored steel. The authors proposed a new approach to modifying the loss function used in constructing models applying machine-learning algorithms. For this, the concept of a physically sound model is introduced. This model is implemented by adjusting the learning process of the model based on the known physical laws. This approach allows increasing the accuracy of the obtained machine learning model by improving its generalizing ability and obtaining physically consistent forecasts. For the model of the polymer coating drying process considered, this approach made it possible to increase the accuracy of predicting the temperature on the strip surface in polymer coating drying ovens and reduce the model error from 14 °C to 2,5 °C.

лосы в печах сушки полимерного покрытия и снизить ошибку модели с 14 °С до 2,5 °С.

Ключевые слова: физически обоснованная модель машинного обучения, моделирование, модель, сушка полимерного покрытия, машинное обучение, анализ данных, функция потерь, параметрическая идентификация, метод оптимизации

Keywords: physically based model of machine learning, modeling, model, polymer coating drying, machine learning, data analysis, loss function, parametric identification, optimization method

Введение

Одним из видов продукции, производимой металлургическими предприятиями, является горячеоцинкованный предварительно окрашенный прокат. Данный сортамент имеет высокую добавленную стоимость, что обеспечивает значительную прибыльность линий полимерных покрытий металла. Согласно прогнозам ключевых производителей окрашенного проката к 2021 г. стоит ожидать увеличение спроса примерно в 2 раза по сравнению с показателями 2014 г.1 Из-за высокой востребованности окрашенного оцинкованного проката на внутреннем рынке и за рубежом металлургические компании интенсивно наращивают производственные мощности своих предприятий. Основным инструментом конкурентной борьбы в текущих условиях рынка является повышение качества продукции, которое зависит от множества факторов технологического процесса: скорости движения металлической полосы, работы прижимных роликов, толщины наносимого лакокрасочного материала (ЛКМ). При этом самый важный фактор, влияющий на показатели качества готовой продукции, - температурный режим сушки полимерного покрытия на поверхности оцинкованной полосы. Неправильно выбранный температурный режим не позволяет получить требуемую температуру на поверхности полосы на выходе из печи, которую также называют пиковой температурой металла (ПТМ). Это, в свою очередь, может привести к дефектам поверхности, отслоению и возникновению цветового отклонения ЛКМ. Данный процесс является многосвязанным, протекает в условиях нестационарности параметров и распределен по времени и координате. Все это, а также нелинейное изменение внешних и внутренних факторов, накладывает множество ограничений, которые значительно усложняют управление процессом сушки полимерного покрытия. Это приводит к необходимости автоматизации управления технологическими параметрами процесса. По данной причине разработка модели процесса сушки полимерного покрытия представляется актуальной научно-технической задачей.

Существующие исследования по моделированию тепловых процессов сталкиваются с рядом проблем. Такое моделирование учитывает конечное число физических величин, и при этом в большинстве случаев нет возможности принять во внимание все протекающие подпроцессы, что не позволяет получить необходимую точность

1 Молчанова А. А. Оцинкованный и окрашенный прокат: тенденции производства и потребления // Снабжение и контракты. - 2013. - № 4. - С. 4-7.

модели1. Кроме того, математические модели физических процессов описывают идеальные условия, это не релевантно для практического применения. По данной причине такие модели, дающие возможность хорошо понимать природу протекающих процессов, могут быть использованы только после сложной процедуры их адаптации к реальным условиям2. Один из подходов к адаптации - параметрическая идентификация с помощью методов оптимизации3. Альтернативным вариантом построения моделей тепловых процессов является использование методов машинного обучения. Такой подход позволяет получить модель, которая хорошо адаптирована под условия конкретно взятого процесса, поскольку строится на основе статистических данных. Но при этом интерпретация данной модели в большинстве случаев невозможна. В таких условиях хорошей практикой является объединение сильных сторон обоих подходов, в рамках которых алгоритмы машинного обучения используются для адаптации физической модели4.

Основная часть

Математическая модель процесса сушки полимерного покрытия

Процесс окраски оцинкованной полосы по технологии "Coil Coating" включает следующие этапы: обработка поверхности полосы хроматирующим раствором, нанесение грунтовочного слоя, сушка грунтовочного слоя, нанесение эмали (отделочного слоя) окрасочными валами, сушка отделочного слоя, смотка полосы в рулоны.

Нанесение покрытий осуществляется с помощью грунтовочного и отделочного коутеров, которые состоят из наносящего валка, заборного валка и ванны с краской. Цвет ЛКМ определяется согласно каталогу цветовых гамм RAL в соответствии со стандартными образцами.

Сушка полимерных покрытий осуществляется в специальных печах (грунтовочного слоя и отделочного слоя). В данных печах, имеющих одинаковую конструк-

1 Менин Б. М. Оптимальная математическая модель для описания физических явлений и процессов // Научно-технический вестник информационных технологий, механики и оптики. - 2018. - Т. 18. - № 2. - С. 322-330.

2 Шестаков С. Д. Многопузырьковая акустическая кавитация: математическая модель и физическое подобие // Электронный журнал «Техническая акустика». - 2010. - Т. 10. - URL: http://www.ejta.org/ru/shestakov2 (дата обращения: 26.01.2019); Krishnamurthy B., Bylya O., Davey K. Physical modelling for metal forming processes // Procedia Engineering. - 2017. -Vol. 207. - P. 1075-1080; Stavropoulos P., Alexopoulos H., Papacharalampopoulos A., Mourtzis D. Automotive weather strip manufacturing: Process modeling and extrudate dimensional accuracy evaluation // Procedia CIRP. - 2018. - Vol. 72. - P. 375-380; Ильичев В. Г. Адаптация параметров в моделях экологии // Автоматика и телемеханика. - 2005. - № 2. - С. 124-137; Nikitin D. A. Adaptive Quaternion-Based Quadrotor Control System // Automation and Remote Control. - 2019. - Vol. 80. - № 9. - P. 1717-1733.

3 Silaev A. V. Parametric Adaptation Algorithm for the Basic Law Used to Control Orientation of a Large Space Structure on the Base of Flexible Modes Envelope Estimation // Automation and Remote Control. - 2010. - Vol. 71. - № 5. - P. 911-919.

4 Bertrand B., Florian C., Vincent L. A statistical physics approach to perform fast highly-resolved air quality simulations - A new step towards the meta-modelling of chemistry transport models // Environmental Modelling & Software. - 2019. - Vol. 116. - P. 100-109.

цию, процесс сушки проходит идентично; они включают в себя 7 зон, каждая из которых оснащена отдельной горелкой и системой регулирования. Единственным различием между ними является температурный режим, необходимый для сушки грунтовочного и отделочного слоев.

На рис. 1 показано схематическое изображение линии по окраске оцинкованной полосы. Такую линию называют агрегатом полимерных покрытий (А1III).

На первом этапе необходимо создать математическую модель процесса на основе известных физических закономерностей. Для управления температурным режимом сушки полимерного покрытия требуется максимально точно рассчитывать температуру металлической полосы с покрытием в каждый момент времени. Для этого необходимо вычислить тепловой поток для каждой печной зоны, характеризующий интенсивность передачи тепла между печью и поверхностью полосы в единицу времени. При этом стоит учитывать, что передача тепла к поверхности нагреваемого металла осуществляется двумя способами: с помощью лучистого и конвективного теплообмена1.

Рис. 1. Схема агрегата полимерных покрытий металла: 1, 7 - ленточный накопитель; 2 - подготовка полосы; 3 - нанесение грунтовочного покрытия; 4 - сушка грунтовочного покрытия; 5 - нанесение отделочного покрытия;

6 - сушка отделочного покрытия; 8 - смотка рулонов

Тепловой поток, передаваемый излучением, зависит от разности температур излучающего тела Тпечи и нагреваемого тела Тполосы (в данном случае печной зоной и металлической полосой соответственно). Процесс передачи тепла излучением сложный и состоит из множества взаимных излучений, отражений и поглощений. Тем не менее существует формула, которая позволяет рассчитать значение теплового потока:

Рл СТо8прф1,2 (^печи ^полосы) ,

(1)

где сто = 5,673Вт/м2К4 - коэффициент излучения абсолютно черного тела; Б пр -приведенная степень черноты поверхностей тел, участвующих в теплообмене; Ф12 - коэффициент взаимной облученности тел.

1 Варфоломеев И. А. Метод и алгоритмы нейро-нечеткого управления многосвязными тепловыми объектами агрегата полимерных покрытий металла: дис. ... канд. техн. наук. - Череповец: [б. и.], 2013. - 164 с.

При конвективном теплообмене перенос теплоты осуществляется при перемещении частиц газа в пространстве печной зоны к нагреваемой полосе. Тепловой поток, передаваемый конвекцией, вычисляется по формуле:

Рк = ^к печи —полосы) ' (2)

где ак - коэффициент конвективного теплообмена. Этот коэффициент представляет собой тепловой поток между единицей поверхности твердого тела при разности температур между телом и средой в один градус и зависит от ряда физических параметров среды: коэффициента объемного расширения среды, коэффициента теплопроводности среды, удельной теплоемкости среды при определенном давлении, коэффициента кинематической вязкости среды, коэффициента температуропроводности среды, физических параметров формы и поверхности нагреваемого тела.

Для расчета полного теплового потока суммируются лучистый тепловой поток (1) и конвективный тепловой поток (2). Для упрощения записи константы объединим в коэффициенты к^ и кл. Полученная формула полного теплового потока:

Р = к (Т — Т / + к (Т4 — Т4 ^ (3)

кк (Т печи 1 полосы / + кл печи 1 полосы у' (3)

Следующая формула позволяет рассчитать изменение температуры полосы в зависимости от температуры в печной зоне, используя полный тепловой поток (3). При расчете данной формулы для различных моментов времени разным печным зонам соответствуют разные значения Тпечи.

ят к (т —Т / + к (т4 —Т4

0/ „„„ к \ печи ^ полосы ( / л I печи полосы; полосы _ * 1 1 ' \ 1 1

дг сph

(4)

где / - номер печной зоны (от 1 до 7); с - удельная теплоемкость; р - плотность металлической полосы; к - толщина полосы.

При итерационном пересчете формулы 4 осуществляется расчет ПТМ. Более подробно физическая модель описана в работах И. А. Варфоломеева «Метод и алгоритмы нейро-нечеткого управления многосвязными тепловыми объектами агрегата полимерных покрытий металла»1 и В. М. Осколкова, Т. О. Петровой, И. А. Варфоломеева, Л. Н. Виноградовой, Е. В. Ершова «Математическое и алгоритмическое обеспечение модели сушки полосы с полимерным покрытием»2.

Результаты расчета нагрева поверхности полосы с помощью описанной выше физической модели показывают температурный тренд нагрева полосы в печи в лю-

1 Варфоломеев И. А. Метод и алгоритмы нейро-нечеткого управления многосвязными тепловыми объектами агрегата полимерных покрытий металла: дис. ... канд. техн. наук. - Череповец: [б. и.], 2013. - 164 с. Осколков В. М., Петрова Т. О., Варфоломеев И. А., Виноградова Л. Н., Ершов Е. В. Математическое и алгоритмическое обеспечение модели сушки полосы с полимерным покрытием // Вестник Череповецкого государственного университета. - 2018. -№ 6 (87). - С. 19-26.

2 Осколков В. М., Петрова Т. О., Варфоломеев И. А., Виноградова Л. Н., Ершов Е. В. Математическое и алгоритмическое обеспечение модели сушки полосы с полимерным покрытием // Вестник Череповецкого государственного университета. - 2018. - № 6 (87). - С. 19-26.

бой ее точке и в любой момент времени. Тем не менее, несмотря на правильный тренд, фактические значения температуры отличаются от расчетных. Это связано с тем, что физическая модель описывает тепловые процессы для идеального объекта, находящегося в идеальных условиях. По этой причине применение данной модели в условиях реального производства требует ее адаптации.

Адаптация модели для применения в реальных условиях производства

На втором этапе необходимо адаптировать модель к реальным условиям. Для этого могут быть использованы различные подходы. Одним из них является параметрическая идентификация модели с помощью алгоритмов оптимизации. Также достаточно часто применяется практика, заключающаяся в использовании методов машинного обучения с целью адаптации физической модели к реальным условиям производства. При применении этого подхода выходные значения физической модели используются как входные параметры (новые признаки) для модели машинного обучения. Модель машинного обучения в данном случае прогнозирует или компенсирует ошибку физической модели.

К недостаткам названных методов относится низкая обобщающая способность, а также физически противоречивые прогнозы. Под обобщающей способностью алгоритма понимают его способность восстанавливать неизвестную зависимость по конечной выборке данных. Если вероятность ошибки алгоритма на тестовой выборке не сильно отличается от ошибки на обучающей выборке, то такой алгоритм обладает способностью к обобщению1.

Для того чтобы модель АПП была актуальна для различных условий работы, в том числе и для новых режимов работы оборудования, требуется повысить ее обобщающую способность. По этой причине авторами предложен новый подход, позволяющий повысить точность модели в реальных условиях за счет модификации функции потерь (loss function), используемой при построении модели машинного обучения. Для модификации функции потерь используются известные физические закономерности. Далее рассмотрим каждый из этих способов адаптации модели и сравним точность полученных моделей.

Для рассматриваемого процесса сушки полимерного покрытия на поверхности оцинкованной полосы параметрическая идентификация модели заключается в вводе корректирующих коэффициентов a1...a1 для каждой печной зоны в выражение 4 и подборе значений этих коэффициентов:

ят к (т - т W к (т4 - т4 "I

к\ печи полосы; / л\ печи полосы; I полосы _ * 1 '' \ ' ' С1

дг cph '

Для подбора коэффициентов, обеспечивающих максимальную точность модели, использовался алгоритм поисковой оптимизации COBYLA (от англ. сonstrained optimization by linear approximation). Данный алгоритм представляет собой метод численной оптимизации для задач с ограничениями, где производная целевой функции не может быть построена. Он основан на итеративном приближении задачи фактической оптимизации с ограничениями к задаче линейного программирования с

1 Воронцов К. В. Комбинаторная теория надежности обучения по прецедентам: дис. ... д-ра физ.-мат. наук. - Москва: [б. и.], 2010. - 271 с.

целью получения кандидата для оптимального решения. Решение кандидата оценивается с использованием исходных задач и ограничений, что дает новую точку данных в пространстве оптимизации. Эта информация используется для улучшения аппроксимирующей задачи линейного программирования, применяемой для следующей итерации алгоритма. Когда решение больше не может быть улучшено, размер шага уменьшается, уточняя поиск. Когда размер шага становится достаточно малым, алгоритм завершает свою работу1. Суть оптимизации заключается в том, чтобы подобрать такие значения коэффициентов, которые позволят максимально приблизить прогнозируемые значения модели к фактическим. Следовательно, в данном случае целевой функцией выступает среднеквадратическое отклонение температуры поверхности металла или пиковой температуры металла на всем наборе данных, показанное в выражении 5:

где n - количество элементов в наборе данных (выборке); Xj - расчетное значение ПТМ для j-ной записи данных; x - среднеарифметическое значение ПТМ на всем наборе фактических данных.

Перед запуском алгоритма оптимизации каждому из коэффициентов задается начальное значение, а также интервал допустимых значений [a,- min; a, max], где /=1...7. Используя математическую модель на основе физических зависимостей, алгоритм COBYLA рассчитывает прогнозируемые значения Xj для всех данных с учетом поправочных коэффициентов a1...a1. Задачей оптимизации является нахождение локального минимума целевой функции, т. е. S^min.

Для реализации данного подхода было разработано программное обеспечение «ПО параметрической идентификации модели сушки полимерного покрытия на основе алгоритма COBYLA»2. Входными данными являются исторические производственные данные, начальные значения коэффициентов и ограничения для параметров; выходными данными - оптимальные коэффициенты физической модели, подобранные с помощью алгоритма COBYLA, абсолютное отклонение для каждой записи из набора данных, среднеквадратическое отклонение для всего набора данных. В результате работы этого ПО были подобраны такие параметры модели, при которых значение среднеквадратического отклонения ПТМ уменьшилось c 14 °С для неадаптированной модели до 5,1 °С 3.

1 Powell M. J. Direct search algorithms for optimization calculations // Acta Numerica. - 1998. -Vol. 7. - P. 287-336.

2 Лянге С. Г., Варфоломеев И. А., Осколков В. М., Ершов Е. В. ПО параметрической идентификации модели сушки полимерного покрытия на основе алгоритма COBYLA. Патент № 2018617169; дата регистрации 19.06.2018 г.

3 Осколков В. М., Лянге С. Г., Варфоломеев И. А., Виноградова Л. Н., Ершов Е. В. Применение генетического алгоритма для подбора коэффициентов математической модели агрегата нанесения полимерного покрытия // Современные информационные технологии. Теория и практика: материалы IV Всероссийской научно-практической конференции (г. Череповец,

4 декабря 2017 г.). - Череповец: ЧГУ, 2018. - С. 76-79.

(5)

Построение модели с помощью алгоритмов машинного обучения с использованием входных признаков из физической модели

Другим решением задачи адаптации модели является формирование нового признака (feature engineering) и добавление его к входным данным модели машинного обучения. В машинном обучении подход формирования нового признака на основе существующих данных является хорошо зарекомендовавшим себя1.

Стандартный подход построения модели машинного обучения fnn, основанной на имеющихся данных, предполагает прогнозирование целевой переменной Ynn на основе некоторого набора данных D:

fnn• D * Ynn.

Такой подход требует большого количества данных, а также не учитывает физические закономерности. Физическая модель fph точно описывает закономерности физических законов в идеальных условиях и может быть неточна в ряде случаев, когда в модели используются упрощения или отсутствуют известные физические закономерности:

fph: D ^ Yph.

Чтобы устранить недостатки обеих моделей, предлагается использовать результат физической модели Yph в качестве дополнительного входного параметра модели

fnn:

fh: [D, Yph] ^ Yh.

Если набор данных при таком подходе соответствует физической модели, то значения будут идентичны. В случае, если имеются расхождения, то гибридная модель fh будет уточнять физическую модель на основе полученных по набору данных зависимостей (см. рис. 2).

1 Zheng L., Xianfeng M., Hongliang X. Feature engineering of machine-learning chemisorption models for catalyst design // Catalysis Today. - 2017. - Vol. 2. - P. 232-238; Melo de V. V., Ban-zhaf W. Automatic feature engineering for regression models with machine learning: An evolutionary computation and statistics hybrid // Information Sciences. - 2018. - Vol. 430-431. - P. 287-313; Lee J., Kang K. C., Sawyer P., Lee H. A holistic approach to feature modeling for product line requirements engineering // Requirements Engineering. - 2014. - Vol. 19. - Iss. 4. - P. 377-395; Wang X., Yang S., Wang Y., Zhao Y., Ma B. Improved permeability prediction based on the feature engineering of petrophysics and fuzzy logic analysis in low porosity-permeability reservoir // Journal of Petroleum Exploration and Production Technology. - 2019. - Vol. 9. - Iss. 2. - P. 869-887.

Рис. 2. Использование нового признака в качестве входного признака модели

машинного обучения

Для рассматриваемой задачи применение данного подхода позволило снизить среднеквадратическую ошибку до 3,6 °С.

Модификация функции потерь при построении модели с помощью алгоритмов машинного обучения

Суть данного подхода заключается в том, что при построении модели машинного обучения минимизируемая функция потерь (loss-функция) модифицируется таким образом, чтобы она имела максимальное значение на физически противоречивых прогнозах.

ЬоББ-функция - неотрицательная функция х), характеризующая величи-

ну ошибки алгоритма а^ на объекте х. Если ЬоБ5(а^, х)=0, то ответ а^(х) называется корректным. Loss-функции используются в качестве целевых функций для решения задач оптимизации, их разделяют на следующие виды: простая, квадратичная, прямоугольная, экспоненциальная. На выбор функции потерь влияют особенности решаемой задачи1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Стандартный подход к обучению модели с помощью алгоритмов машинного обучения состоит в том, чтобы минимизировать ошибку прогнозируемого результата Ук на обучающей выборке, минимизируя при этом сложность модели:

а^шикЬозз (Урк ,¥к ) + Ш (/), (6)

где Я(/) измеряет сложность модели, а X является компромиссным гиперпараметром. Эффективность процедуры обучения ограничена размером обучающей выборки, которая может быть невелика для различных научных задач. Модель, обученная путем минимизации уравнения 6, может показать результаты, которые будут противоречить существующим физическим представлениям. По этой причине вводится функция потерь, показывающая отклонение от физической модели. Функция потерь используется, чтобы направить обучение модели к физически согласованным решениям.

1 Klebanov L., Rachev S. T., Fabozzi F. Robust and Non-Robust Models in Statistics. - New York: Nova Scientific Publishers, 2009. - 307 p.

argmin: Loss (Yph ,Yh ) + (f) + Xphloss.PH (Yph ), (7)

где Xph - гиперпараметр, который определяет относительную важность минимизации несогласованности между физической моделью (с учетом эмпирических потерь) и сложностью модели.

Поскольку предполагается, что известные законы физики в равной степени справедливы для любого несуществующего экземпляра данных в выборке, обеспечение физической согласованности выходных данных модели в качестве цели обучения в fph nn может помочь в достижении лучших результатов обобщений, даже если обучающие данные малы и не полностью репрезентативны. Кроме того, результаты модели fph nn также могут быть интерпретированы экспертом в рассматриваемой предметной области. Все это позволяет повысить обобщающую способность алгоритма обучения.

Существует несколько алгоритмов оптимизации, которые можно использовать для минимизации уравнения 7, например, алгоритм стохастического градиентного спуска (SGD) и его варианты, успешно используемые при обучении глубоких нейронных сетей.

Для данной задачи понятие физического несоответствия обозначает, что для каждой последовательной пары соседних точек из набора данных нарушается хотя бы одно из условий физического соответствия.

В этой работе использовался набор данных, полученных с агрегата полимерных покрытий металла. Данные были собраны с технологических датчиков оборудования, характеристик обрабатываемого металла, сертификатов ЛКМ, задания на производство, аттестации продукции.

\fPh к ]-и М

f [t, ]- fnn M <Ad , ^ < t2

где fph - физическая модель; fnn - модель машинного обучения; Ad - допустимая погрешность; t - время набора данных. Результаты физической модели и модели машинного обучения для двух соседних точек из набора данных не должны различаться больше, чем допустимая погрешность.

Если ц =и2 и £T1, >£T2, , тоПТЦ > ПТМ2,

где и - скорость движения металлической полосы в агрегате; £1 T - суммарная

температура внутри печных зон; ПТМ - пиковая температура металла. При равных скоростях и более высокой температуре T2 металл получает большее количество теплоты, и соответственно пиковая температура металла ПТМ2 должна быть выше, чем при более низких температурах.

Если £ ]_1 Д =£ ]_i T2,. и Ц > Ц, то ПТМ1 < ПТМ2,

где ^1 Т - суммарная температура внутри печных зон; и - скорость движения металлической полосы в агрегате; ПТМ - пиковая температура металла. При равных температурах нагрева Т1 и Т2 и большей скорости движения и1 металл получает меньшее количество теплоты, и соответственно пиковая температура металла ПТМ1 должна быть ниже, чем при более низкой скорости.

Результаты исследования

В таблице показаны результаты сравнения подходов к построению модели сушки полимерного покрытия при производстве окрашенного проката, из которых видно, что лучшей обобщающей способностью обладает подход к построению модели на основе алгоритма машинного обучения с модификацией ЬоББ-функции.

Таблица

Результаты эксперимента оптимизационных подходов

Подход Параметры оценки

RMSE Физическое несоответствие

PHY 14 0

PHY_OPT 5,1 0

HYB 3,6 0,08

LOSS 2,5 0,03

В таблице даны следующие обозначения:

PHY - физическая модель;

PHY_OPT - физическая модель с параметрической идентификацией;

HYB - модель машинного обучения, где в качестве входного параметра используется физическая модель;

LOSS - модель машинного обучения с использованием модифицированной Loss-функции.

В качестве метрик оценки для сравнения точности моделей, полученных с помощью различных подходов, использовались:

RMSE - среднеквадратическая ошибка модели для тестового набора данных, применяемая для оценки эффективности обобщения.

Физическое несоответствие - доля противоречащих физике прогнозов от общего набора данных.

На рис. 3 показаны результаты оценочных характеристик для сравниваемых подходов моделирования. Ось X на графике представляет физическое несоответствие модели, ось Y - среднеквадратическое отклонение прогнозов модели для набора данных.

Y

X

ФШ11ЧЕСКОЕНВСООТНЕТСГВИЕ

Рис. 3. Результаты сравнения точности подходов

Физическая модель PHY имеет большие значения RMSE из-за недостаточной детализации модели и невозможности точно учесть все факторы реального производства. Использование параметрической идентификации в модели PHY_OPT уменьшает значение среднеквадратической ошибки RMSE за счет подстраивания под данные. Использование гибридной модели HYB позволяет улучшить параметры сред-неквадратического отклонения, одновременно с этим показатель физического несоответствия становится достаточно высоким (8 %). Тем не менее лучшие результаты показала модель на основе физически обоснованного машинного обучения (модель LOSS). Такой результат достигается за счет увеличения обобщающей способности модели, которая обеспечивается непротиворечивостью результатов и фундаментальной физикой теплофизического процесса.

Выводы

В данной работе предложен новый подход к построению и повышению точности моделей технологических процессов за счет объединения сильных сторон физического моделирования и машинного обучения. На примере задачи построения модели сушки полимерного покрытия проведено сравнение данного подхода с другими. По результатам данного сравнения была получена модель с лучшей обобщающей способностью, обеспечивающей более высокую точность. Применение этого подхода может быть тиражировано и для других технологических процессов, для которых возможна разработка физической модели.

Полученная таким образом более точная модель позволяет эффективнее управлять процессом сушки полимерного покрытия оцинкованной полосы. Данный подход позволяет улучшить результат ЯМБЕ с 14 °С до 2,5 °С.

Литература

Варфоломеев И. А. Метод и алгоритмы нейро-нечеткого управления многосвязными тепловыми объектами агрегата полимерных покрытий металла: дис. ... канд. техн. наук. - Череповец: [б. и.], 2013. - 164 с.

Воронцов К. В. Комбинаторная теория надежности обучения по прецедентам: дис. ... д-ра физ.-мат. наук. - Москва: [б. и.], 2010. - 271 с.

Ильичев В. Г. Адаптация параметров в моделях экологии // Автоматика и телемеханика. -2005. - № 2. - С. 124-137.

Лянге С. Г., Варфоломеев И. А., Осколков В. М., Ершов Е. В. ПО параметрической идентификации модели сушки полимерного покрытия на основе алгоритма COBYLA. Патент № 2018617169; дата регистрации 19.06.2018 г.

Менин Б. М. Оптимальная математическая модель для описания физических явлений и процессов // Научно-технический вестник информационных технологий, механики и оптики. - 2018. - Т. 18. - № 2. - С. 322-330.

Молчанова А. А. Оцинкованный и окрашенный прокат: тенденции производства и потребления // Снабжение и контракты. - 2013. - № 4. - С. 4-7.

Осколков В. М., Лянге С. Г., Варфоломеев И. А., Виноградова Л. Н., Ершов Е. В. Применение генетического алгоритма для подбора коэффициентов математической модели агрегата нанесения полимерного покрытия // Современные информационные технологии. Теория и практика: материалы IV Всероссийской научно-практической конференции (г. Череповец, 4 декабря 2017 г.). - Череповец: ЧГУ, 2018. - С. 76-79.

Осколков В. М., Петрова Т. О., Варфоломеев И. А., Виноградова Л. Н., Ершов Е. В. Математическое и алгоритмическое обеспечение модели сушки полосы с полимерным покрытием // Вестник Череповецкого государственного университета. - 2018. - № 6 (87). - С. 19-26.

Шестаков С. Д. Многопузырьковая акустическая кавитация: математическая модель и физическое подобие // Электронный журнал «Техническая акустика». - 2010. - Т. 10. - URL: http://www.ejta.org/ru/shestakov2 (дата обращения: 26.01.2019).

Bertrand B., Florian C., Vincent L. A statistical physics approach to perform fast highly-resolved air quality simulations - A new step towards the meta-modelling of chemistry transport models // Environmental Modelling & Software. - 2019. - Vol. 116. - P. 100-109.

Klebanov L., Rachev S. T., Fabozzi F. Robust and Non-Robust Models in Statistics. - New York: Nova Scientific Publishers, 2009. - 307 p.

Lee J., Kang K. C., Sawyer P., Lee H. A holistic approach to feature modeling for product line requirements engineering // Requirements Engineering. - 2014. - Vol. 19. - Iss. 4. - P. 377-395.

Melo de V. V., Banzhaf W. Automatic feature engineering for regression models with machine learning: An evolutionary computation and statistics hybrid // Information Sciences. - 2018. -Vol. 430-431. - P. 287-313.

Nikitin D. A. Adaptive Quaternion-Based Quadrotor Control System // Automation and Remote Control. - 2019. - Vol. 80. - № 9. - P. 1717-1733.

Powell M. J. Direct search algorithms for optimization calculations // Acta Numerica. - 1998. -Vol. 7. - P. 287-336.

Silaev A. V. Parametric Adaptation Algorithm for the Basic Law Used to Control Orientation of a Large Space Structure on the Base of Flexible Modes Envelope Estimation // Automation and Remote Control. - 2010. - Vol. 71. - № 5. - P. 911-919.

Stavropoulos P., Alexopoulos H., Papacharalampopoulos A., Mourtzis D. Automotive weather strip manufacturing: Process modeling and extrudate dimensional accuracy evaluation // Procedia CIRP. - 2018. - Vol. 72. - P. 375-380.

Krishnamurthy B., Bylya O., Davey K. Physical modelling for metal forming processes // Procedia Engineering. - 2017. - Vol. 207. - P. 1075-1080.

Wang X., Yang S., Wang Y., Zhao Y., Ma B. Improved permeability prediction based on the feature engineering of petrophysics and fuzzy logic analysis in low porosity-permeability reservoir // Journal of Petroleum Exploration and Production Technology. - 2019. - Vol. 9. - Iss. 2. -P. 869-887.

Zheng L., Xianfeng M., Hongliang X. Feature engineering of machine-learning chemisorption models for catalyst design // Catalysis Today. - 2017. - Vol. 2. - P. 232-238.

References

Varfolomeev I. A. Metod i algoritmy neiro-nechetkogo upravleniia mnogosviaznymi teplovymi ob "ektami agregata polimernykh pokrytii metalla [Methods and algorithms for neural-fuzzy control of multilinked thermal objects in polymer coating units: PhD thesis in Technology]. Cherepovets, 2013. 164 p.

Vorontsov K. V. Kombinatornaia teoriia nadezhnosti obucheniia po pretsedentam [Reliability combinatorial theory of learning by precedents: Dr. thesis in Physics and Mathematics]. Moscow, 2010. 271 p.

Il'ichev V. G. Adaptatsiia parametrov v modeliakh ekologii [Adaptation of parameters in ecology models]. Avtomatika i telemekhanika [Automation and Remote Control], 2005, no. 2, pp. 124-137.

Liange S. G., Varfolomeev I. A., Oskolkov V. M., Ershov E. V. PO parametricheskoi identi-fikatsii modeli sushki polimernogo pokrytiia na osnove algoritma COBYLA. Patent № 2018617169; data registratsii 19.06.2018 g. [Parametric identification software of the the polymer coating drying model based on the algorithm COBYLA. Patent, serial number 2018617169; registration date 19.06.2018].

Menin B. M. Optimal'naia matematicheskaia model' dlia opisaniia fizicheskikh iavlenii i tekhno-logicheskikh protsessov [Optimal mathematical model for description of physical phenomena and technological processes]. Nauchno-tekhnicheskii vestnik informatsionnykh tekhnologii, mekhaniki i optiki [Scientific and technical journal of information technologies, mechanics and optics], 2018, vol. 18, no. 2, pp. 322-330.

Molchanova A. A. Otsinkovannyi i okrashennyi prokat: tendentsii proizvodstva i potrebleniia [Galvanized and colored roll stock: production and consumption trends]. Snabzhenie i kontrakty [Supply and contracts], 2013, no. 4, pp. 4-7.

Oskolkov V. M., Liange S. G., Varfolomeev I. A., Vinogradova L. N., Ershov E. V. Primenenie geneticheskogo algoritma dlia podbora koeffitsientov matematicheskoi modeli agregata naneseniia polimernogo pokrytiia [Applying genetic algorithm for coefficients selection in the mathematical model of the polymer coating unit]. Sovremennye informatsionnye tekhnologii. Teoriia i praktika: materialy IV Vserossiiskoi nauchno-prakticheskoi konferentsii (g. Cherepovets, 4 dekabria 2017 g.) [Modern information technologies. Theory and practice: proceedings of IV all-Russian research and practice conference (Cherepovets, 4 December 2017)]. Cherepovets: ChGU, 2018, pp. 76-79.

Oskolkov V. M., Petrova T. O., Varfolomeev I. A., Vinogradova L. N., Ershov E. V. Ma-tematicheskoe i algoritmicheskoe obespechenie modeli sushki polosy s polimernym pokrytiem [Mathematical and algorithmic support for a model of drying a strip with polymeric coating]. Vestnik Cherepovetskogo gosudarstvennogo universiteta [Bulletin of the Cherepovets State University], 2018, no. 6 (87), pp. 19-26.

Shestakov S. D. Mnogopuzyr'kovaia akusticheskaia kavitatsiia: matematicheskaia model' i fizi-cheskoe podobie [Multibubble acoustic cavitation: a mathematical model and physical similarity]. Tekhnicheskaia akustika [Electronic Journal Technical Acoustics], 2010, vol. 10. Available at: http://www.ejta.org/ru/shestakov2 (accessed: 26.01.2019).

Bertrand B., Florian C., Vincent L. A statistical physics approach to perform fast highly-resolved air quality simulations - A new step towards the meta-modelling of chemistry transport models. Environmental Modelling & Software, 2019, vol. 116, pp. 100-109.

Klebanov L., Rachev S. T., Fabozzi F. Robust and Non-Robust Models in Statistics. New York: Nova Scientific Publishers, 2009. 307 p.

Lee J., Kang K. C., Sawyer P., Lee H. A holistic approach to feature modeling for product line requirements engineering. Requirements Engineering, 2014, vol. 19, iss. 4, pp. 377-395.

Melo de V. V., Banzhaf W. Automatic feature engineering for regression models with machine learning: An evolutionary computation and statistics hybrid. Information Sciences, 2018, vol. 430-431, pp. 287-313.

Nikitin D. A. Adaptive Quaternion-Based Quadrotor Control System. Automation and Remote Control, 2019, vol. 80, no. 9, pp. 1717-1733.

Powell M. J. Direct search algorithms for optimization calculations. Acta Numerica, 1998, vol. 7, pp. 287-336.

Silaev A. V. Parametric Adaptation Algorithm for the Basic Law Used to Control Orientation of a Large Space Structure on the Base of Flexible Modes Envelope Estimation. Automation and Remote Control, 2010, vol. 71, no. 5, pp. 911-919.

Stavropoulos P., Alexopoulos H., Papacharalampopoulos A., Mourtzis D. Automotive weather strip manufacturing: Process modeling and extrudate dimensional accuracy evaluation. Procedia CIRP, 2018, vol. 72, pp. 375-380.

Krishnamurthy B., Bylya O., Davey K. Physical modelling for metal forming processes. Procedia Engineering, 2017, vol. 207, pp. 1075-1080.

Wang X., Yang S., Wang Y., Zhao Y., Ma B. Improved permeability prediction based on the feature engineering of petrophysics and fuzzy logic analysis in low porosity-permeability reservoir. Journal of Petroleum Exploration and Production Technology, 2019, vol. 9, iss. 2, pp. 869-887.

Zheng L., Xianfeng M., Hongliang X. Feature engineering of machine-learning chemisorption models for catalyst design. Catalysis Today, 2017, vol. 2, pp. 232-238.

Для цитирования: Осколков В. М., Варфоломеев И. А., Ершов Е. В. Моделирование процесса сушки полимерного покрытия оцинкованной полосы на основе физически обоснованной модели машинного обучения и анализа данных // Вестник Череповецкого государственного университета. - 2020. - № 2 (95). - С. 11-25. DOI: 10.23859/1994-0637-2020-2-95-1

For citation: Oskolkov V. M., Varfolomeev I. A., Ershov E. V. Modeling the drying process of polymer coating on a galvanized strip based on a physically justified model of machine learning and data analysis. Bulletin of the Cherepovets State University, 2020, no. 2 (95), pp. 11-25. DOI: 10.23859/1994-0637-2020-2-95-1

i Надоели баннеры? Вы всегда можете отключить рекламу.