Б01 10.36622/У8Ти.2023.19.3.003 УДК 519.71
ИЕРАРХИЧЕСКАЯ КВАЗИЛИНЕЙНАЯ МОДЕЛЬ ПРОГНОЗИРОВАНИЯ
СВОЙСТВ КЛИНКЕРА
А.П. Щербаков
Липецкий государственный технический университет, г. Липецк, Россия
Аннотация: рассматривается задача построения и оценки адекватности двухуровневой и трехуровневой иерархической регрессионной квазилинейной модели прогнозирования качества клинкера. Клинкер в цементном производстве получают обжигом сырьевой муки. Качество клинкера зависит от химического и минералогического состава сырьевой муки. Основными показателями качества являются модульные характеристики - силикатный модуль, глиноземный модуль и коэффициент насыщения. Показатели качества рассчитываются на основе химического анализа до и после обжига, то есть для исходной сырьевой муки и для клинкера. На основании имеющихся экспериментальных данных можно сделать вывод, что зависимость между показателями до и после обжига является сильно нелинейной. В данной работе нелинейная зависимость глиноземного модуля клинкера от химического состава сырьевой муки описывается с помощью иерархической квазилинейной модели. Схема построения модели имеет некоторое сходство со схемой построения интеграла Лебега, когда вместо разбиения области определения функции (как в интеграле Римана) рассматривается разбиение области значений этой функции. Адекватность построенной модели зависимости свойств клинкера от химического состава сырьевой муки подтверждается значительным снижением суммарной ошибки и приближением автокорреляционной функции остатков модели к уровню белого шума
Ключевые слова: квазилинейные модели, остаточные данные, кластеризация, иерархическое разбиение, схема Лебега
Введение
Производство цемента (например, [1], [2]) является сложным многостадийным процессом, центральным этапом которого является получение клинкера. Клинкер получают обжигом до спекания тонкодисперсной сырьевой муки, состоящей из известняка, глины, шлакового щебня и других материалов [1]. Качество клинкера характеризуется его химическим, минералогическим и фазовым составами.
По имеющимся измерениям химического состава сырья и клинкера рассчитываются так называемые модульные характеристики -п (силикатный модуль), р (глиноземный модуль), КН (коэффициент насыщения):
п =
Б102%
КН =
Д1203% + Ре2 03%
_ А1203% Р = Ре 2 0з%
Са0% - 1,65 • А1203% - 0,35 • Ре203% 2,8 • Б102% '
Параметры пм, рм и КНМ сырьевой муки фиксируются ежедневно и подвержены колеба-
ниям вслед за колебанием химического состава сырьевой муки. Например, график изменения модуля пм сырьевой муки за год (по данным производства) имеет вид
2,70
2,65 -
2,60
2,55 ■
2,50
2,45 ■
2,40
2,35 -
2,30
2,25
2,20
2,15 -
2,10
2,05 ■
2,00
тшщттшштгшпттштпжшппгж
© Щербаков А.П., 2023
||||№!Ми||.||М.|<111111111.!1 НИЩИМИ IMUIIIHHI.IIIIIIIIIIIIHI.il II ИМИ |.|.|1| |,|1ПШ11!1111|1!!М! ИМИ
21 41 61 81 101121141161181201221241261281301321341 номер итерации
Рис. 1. Изменение силикатного модуля пм
Важной задачей является построение математической модели зависимости качества клинкера от изменений химического состава сырьевой муки, то есть модели, позволяющей оценить модульные параметры пк, рк и КН^ клинкера заранее, до (а не после) процесса обжига.
Зависимость модульных характеристик клинкера пк, рк и КНд- от химического состава сырьевой муки, как показывают данные производства, является сильно нелинейной, при этом нелинейность связана, прежде всего, со слож-
ными изменениями химического состава в процессе обжига. Дополнительный вклад в нелинейность вносят колебания химического состава сырьевой муки (рис. 1) в случае использования при обжиге запасов, накопленных за предыдущий период времени (более одного дня).
В данной работе для построения математической зависимости характеристик клинкера от химического состава сырьевой муки применяется иерархическая регрессионная квазилинейная модель, описанная ранее в статье [3] как иерархическая Ь-модель (или модель Лебега).
Ь-схема иерархической идентификации квазилинейной модели
В работах [3], [4] были определены два класса многоуровневых иерархических регрессионных моделей, модели Римана и модели Лебега. Названия этих моделей указывали на некоторое сходство схем построения с определениями интегралов по Риману и Лебегу. Одноуровневые модели такого типа - это обычные линейные регрессионные модели, двухуровневые модели Римана (но не Лебега) имеют некоторое сходство с квазилинейными моделями, определенными в работах [5]-[7].
Иерархичность моделей в работе [3] определяется схемой параметрической идентификации ^-схема для моделей Римана и Ь-схема для моделей Лебега). Таким образом, иерархичность понимается иначе, чем в близкой по терминологии работе [8], в которой иерархичность связана, скорее, со структурной идентификацией (см. по этому поводу комментарии в [3]).
В работе [3] было высказано предположение, что оба класса моделей, и в особенности модель Лебега, могут быть полезны для описания сильно нелинейных зависимостей. Напомним (см. [3]), что в схеме Римана используется априори заданная иерархическая кластеризация в многомерном (в общем случае) пространстве входов.
В схеме Лебега, которую мы будем применять в данной работе, на каждом шаге кластеризуются невязки в одномерном пространстве выходов модели предыдущего уровня. Для каждого кластера находится его прообраз в пространстве входов и идентифицируется уточняющая линейная модель данного уровня (второго, третьего и т.д.).
В результате в многомерном пространстве входов возникает иерархическое разбиение, элементы которого на каждом уровне иерархии могут быть устроены сколь угодно сложно. В
частности, это разбиение, как правило, не является кластеризацией в обычном смысле этого термина [9].
Для моделирования зависимости свойств клинкера от химических характеристик сырьевой муки в данной работе предлагается использовать иерархическую квазилинейную модель Лебега. В работе применялись средства математического пакета Statistica и программа для работы с электронными таблицами Excel.
Построение двухуровневой модели (3 кластера)
Для наглядности, в рамках данной работы, выберем в качестве зависимой переменной значение глиноземного модуля клинкера p (обозначим как Y), а в качестве регрессоров -значения Fe203% и сырьевой муки
(обозначим, соответственно, как х 1 и х2).
В рамках исследования были использованы 300 наблюдений входных кортежей (двух переменных) и выходной зависимой переменной, значения которых снимались ежедневно в течение календарного года (с некоторыми технологическими перерывами). Диаграмма рассеяния совместного 3D-графика всех 3-х переменных (с аппроксимирующей подгонкой поверхности) представлены на рис. 2.
1,6
iP
Рис. 2. 3Б-диаграмма рассеяния данных хь х2, У
Линейная регрессионная модель, построенная по исходным данным имеет вид:
¿^(х) = 0,75 + 0,29х1 - 0,2х2. (1)
Коэффициент множественной корреляции Я = 0,67778, коэффициент детерминации Я2 = 0,459386., сумма квадратов остатков (невязок) равна = 0,745.
Далее проводится кластеризация остатков линейной модели (Ь-схема) по 3 кластерам. Кластер №1 содержит 81 наблюдение, кластер №2 - 134 наблюдения, кластер №3 - 85 наблюдений. Кластеризация производилась по методу к-средних.
Сопоставляя кластеризованным значениям остатков их прообразы, то есть соответствующие значения входной величины X = (%, Х2), получаем разбиение входов. Это разбиение представлено на рис. 3. Точки рассеяния входа для 1, 2 и 3 кластеров показаны соответственно в виде кружков, квадратиков и треугольников.
3,0 2,9 2,8 2,7
Диаграмма рассеяния для кортежей входа по кластерам
/ ■ 4 . "
* "V 1АЛ •
» % • "ж
V • . 1 •
I1 . 1*.
3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,! XI
• 1 с!ив1ег ■ 2 с!ив1ег А 3 с!ив1ег
Рис. 3. Разбиение кортежей входа X, соответствующее кластеризации остатков е выхода У
Далее построим линейные регрессионные модели для остатков (невязок) е в каждом из 3-х кластеров, используя соответствующее этим кластерам разбиение пространства входов. В итоге получаем квазилинейную модель с двухуровневой иерархией разбиения входных данных. Первый уровень - это все данные входов, второй уровень образован прообразами кластеров невязок линейной модели первого уровня.
Модель имеет вид
F(x) = ^(х) + ^2(*)(х)
(2)
где /(х) - выбор слагаемого второго уровня в зависимости от (хх, х2) и разбиения входов (подробнее см. [3]). Т.е. добавочная модель второго уровня ^^(х) «включается» в тот момент, когда значение невязки е выхода У от ли-
нейной модели первого уровня ^(х) попадает в тот или иной кластер.
Линейные добавочные модели второго уровня представлены ниже.
/(х)
1 (х) = 0,3035 - 0,0004х1 - 0,0933Х2
2 ^22(Х) = 0,0409 - 0,0033х1 - 0,0115Х2
3 *2 (х) = -0,0875 - 0,0291х1 + 0,0491х2
Сумма квадратов остатков двухуровневой модели (2) относительно исходных выходов У равна £е2 = 0,132, что уже существенно лучше, чем было у обычной линейной модели первого уровня.
Построение трехуровневой модели (3x2 кластера)
Для построения трехуровневой модели проводится кластеризация остатков квазилинейной модели второго уровня для каждого из трех случаев, то есть для каждой из трех подмоделей второго уровня. Количество кластеров в каждом случае возьмем равным двум, таким образом, общее количество подмоделей третьего уровня в итоговой модели будет равно шести.
В качестве примера, разбиение кортежей X = (хх, х2), соответствующее двум кластерам кластера №1 второго уровня (кружки на рис. 3) представлено на рис. 4 (точки показаны в виде ромбов и звездочек).
Диаграмма рассеяния для кортежей входа по кластерам третьего уровня
*
М/ \Ц/ А М/ ШШ
Ж
жж
*
♦ ж Ш
ж ж *
ж *
♦ ♦
ж
ж ж ж
ж
ж ж ♦ж ♦ *
3,0 3,1 3,2 3,3 3,4 3,5 3,6 XI
3,7 3,8 3,9
Ж 2-1 с!ийег
Рис. 4. Разбиение кортежей входаX, соответствующее последовательной кластеризации остатков е выхода У для 1-го кластера второго уровня
2,6
2,5
2,4
2,3
2,2
2,1
2,8
2,7
2,6
2,5
2,4
2,3
2,2
2,1
Далее идентифицируем 6 линейных моделей, для каждого из 6 наборов данных кортежей входов и остатков двухуровневой модели. В итоге получаем трехуровневую иерархическую квазилинейную модель Лебега
(3)
где у/(х) - выбор кластера и соответствующей модели третьего уровня в зависимости от (х!, х2), /(х) - выбор кластера и соответствующей модели второго уровня в зависимости от , х2). Т.е. добавочные модели третьего уровня ^(х) и второго уровня ^^(х) «включаются» в тот момент, когда значение невязки е выхода У попадает в тот или иной кластер сначала для основной линейной модели, а потом и для двухуровневой модели (2).
Линейные добавочные модели третьего уровня представлены ниже.
]/(х) м
11 ^(х) = 0,0098 + 0,0341%! - 0,0382х2
21 ^(х) = -0,1494 + 0,0008х1 + 0,0513х2
12 ^32(х) = 0,0315 - 0,0214х1 + 0,0095х2
22 ^232(х) = 0,0433 - 0,0055х1 - 0,0039х2
13 ^33(х) = 0,1011 + 0,0073х1 - 0,0438х2
23 ^233 (х) = -0,3077 + 0,0606х1 + 0,0311х2
Сумма квадратов остатков данной квазилинейной трехуровневой модели (3) относительно исходных выходов У равна £е2 = 0,042, что существенно лучше, чем было у линейной модели первого уровня (1), и квазилинейной двухуровневой модели (2).
Уменьшение суммы квадратов ошибки при переходе от линейной модели к двухуровневой квазилинейной и затем к трехуровневой квазилинейной, показано на рис. 5.
Изменение ошибки
Рис. 5. Изменение суммы квадрата остатков £ е2 для последовательных моделей
Анализ остатков линейной модели и квазилинейных моделей второго и третьего уровней
В качестве оценки качества построенной модели, исследуем остатки (невязки) всех трех моделей (обычной линейной, квазилинейной двухуровневой и квазилинейной трехуровневой).
Для этого можно, в частности, использовать автокорреляционную функцию (АКФ), показывающую зависимость ряда данных и ее сдвинутой копией от величины временного сдвига (лага). График изменения АКФ в зависимости от лага т называется коррелограммой. Коррелограммы исследуемого выхода (глиноземного модуля клинкера ркл) и остатков от исходной линейной модели (т = 1...15) представлены на рис. 6. Штриховая линия на рис. 6 и 7 показывает критический уровень (уровень ошибки) распределения Стьюдента, рассчитываемый для данного ряда и лага т, в соответствии с которым можно судить об уровне значимости автокорреляций для сдвига т.
§0 I0'
5 0,
|о< К0
0
0, 0 0
-о, -о, -о, -о,
800 700 600 500 400 300 200
100 000
100 200 300 400
АКФ глиноземного модуля р
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Лаг
а)
§ 0
I 0
§ 0,
-10:
0, 0, 0, -0, -0, -0, -0,
700 600 500 400 300 200 100 000 100 200 300 400
АКФ остатков от линейной
модели
......
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Лаг
б)
Рис. 6. Автокорреляционные функции выхода (а) и остатков от линейной модели (б)
3
4
Коррелограммы остатков квазилинейной модели второго уровня (с 3 кластерами) и остатков от квазилинейной модели третьего уровня (с 6 кластерами) (т = 1...15) представлены на рис. 7.
а)
б)
Рис. 7. Автокорреляционные функции остатков от квазилинейной модели второго уровня (а) и третьего уровня (б)
На данных коррелограммах видно, что квазилинейные модели имеют остатки, АКФ для которых мало отличима от АКФ для равномерного случайного распределения («белого шума»), т.е. не содержат тенденций и сезонных скачков ни для одного лага т. При этом для остатков модели третьего уровня амплитуды автокорреляции в среднем меньше, чем для остатков модели второго уровня (заметим, что масштабы на вертикальных осях рисунков разные).
Заключение
Проведенное в работе исследование на конкретном примере (моделирование зависимости свойств клинкера от химического состава сырьевой муки) и конкретных данных подтвердило высказанное в статье [3] предположении о возможности и эффективности применения иерархической квазилинейной модели типа Лебега для описания сильно нелинейных зависимостей.
Литература
1. Голованова Л.В. Общая технология цемента: Учебник для средних проф.-техн. училищ. М.: Стройиз-дат, 1984. 118 с., ил.
2. Тейлор Х. Химия цемента. Пер. с англ. М.: Мир, 1996. 560 с.
3. Мишачев Н.М., Шмырин А.М., Щербаков А.П. Две схемы иерархической идентификации квазилинейных моделей // Вестник Воронежского государственного технического университета. Т. 19. № 1. 2023. С. 7-13.
4. Щербаков А.П. Генерирование тестовых данных для регрессионной идентификации квазилинейных иерархических моделей // Вестник Липецкого государственного технического университета. 2022. № 3(49) С. 41-47.
5. Канюгина А.С. О задаче управления температурным режимом стадии диффузии производства сахара // Вестник Воронежского государственного технического университета. 2019. Т. 15. № 2. С. 51-63.
6. Семина В.В. Идентификация слабосвязанных ок-рестностных систем // Вестник Воронежского государственного технического университета. 2019. Т.15. № 2. С. 69-76.
7. Takagi T., Sugeno M. Fuzzy identification of systems and its applications to modeling and control // IEEE transactions on systems, man, and cybernetics. 1985. Vol. 15. No. 1. Р. 116-132.
8. Подвальный С.Л., Васильев Е.М. Иерархическая идентификация параметров нелинейных динамических систем // Сборник трудов XIII Всероссийского совещания по проблемам управления ВСПУ-2019. М.: Институт проблем управления им. В.А. Трапезникова РАН. 2019. С. 517-521.
9. Олдендерфер М.С., Блэшфилд Р.К. Факторный, дискриминантный и кластерный анализ / пер. с англ.; под ред. И.С. Енюкова. М.: Финансы и статистика, 1989. 215 с.
§ 0,200
¡S 0,150 ъ
& 0,100 £
0,050 0,000 -0,050 -0,100 -0,150 -0,200
1 ■
1 2 3 II- 1 5 6 7 8 9 10 11 12 13 14 15 16
Лаг
§ 0,150
S 0,100
S
5 0,050
0,000 -0,050 -0,100 -0,150
2 3 4 5 6
7 8 9 10 11
I
12 13 14 15 16
Лаг
1
Поступила 05.04.2023; принята к публикации 16.06.2023 Информация об авторах
Щербаков Артем Петрович - старший преподаватель кафедры высшей математики, Липецкий государственный технический университет (398055, Россия, г. Липецк, ул. Московская, д. 30), e-mail: [email protected]
THREE-LEVEL HIERARCHICAL REGRESSION MODEL OF CLINKER PRODUCTION
PROCESS
A.P. Shcherbakov
Lipetsk State Technical University, Lipetsk, Russia
Abstract: the paper considers the problem of constructing and evaluating the adequacy of a two-level and three-level hierarchical regression quasi-linear model for predicting clinker quality. Clinker in cement production is obtained by firing raw flour. The quality of clinker depends on the chemical and mineralogical composition of the raw flour. The main quality indicators are modular characteristics - silicate module, alumina module and saturation coefficient. Quality indicators are calculated on the basis of chemical analysis before and after firing, that is, for the initial raw flour and for clinker. Based on the available experimental data, it can be concluded that the relationship between the indicators before and after firing is highly nonlinear. In this paper, the nonlinear dependence of the clinker alumina module on the chemical composition of raw flour is described using a hierarchical quasi-linear Lebesgue model. In general, such hierarchical models were defined earlier in the work of the author and co-authors. The scheme of their construction has some similarity with the scheme of constructing the Lebesgue integral, when instead of splitting the domain of definition of a function (as in the Riemann integral), the partition of the domain of values of this function is considered. The adequacy of the constructed model of the dependence of clinker properties on the chemical composition of raw flour is confirmed by a significant reduction in the total error and the approximation of the autocorrelation function of the model residues to the white noise level
Key words: quasi-linear models, residual data, clustering, hierarchical partitioning, Lebesgue scheme
References
1. Golovanova L.V. "General cement technology" ("Obshchaya tekhnologiya tsementa"), Moscow, Stroyizdat, 1984, 118 p.
2. Taylor H. "Chemistry of cement" ("Khimiya tsementa"), Moscow Mir, 1996, 560 p.
3. Mishachev N.M., Shmyrin A.M., Shcherbakov A.P. "Two schemes of hierarchical identification of quasi-linear models", The Bulletin of the Voronezh State Technical University (Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta), vol. 19, no 1, 2023, pp. 7-13.
4. Shcherbakov A.P. "Generating test data for regression identification of quasi-linear hierarchical models", The Bulletin of Lipetsk State Technical University (Vestnik Lipetskogo gosudarstvennogo tekhnicheskogo universiteta), 2022, no 3(49), pp. 41-47.
5. Kanyugina A.S. "On the task of controlling the temperature regime of the diffusion stage of sugar production", The Bulletin of Voronezh State Technical University (Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta), 2019, vol.15, no. 2, pp. 51-63.
6. Semina V.V. "Identification of loosely coupled neighborhood systems", The Bulletin of Voronezh State Technical University (Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta), 2019, Vol, 15, no. 2, pp. 69-76.
7. Takagi T., Sugeno M. "Fuzzy identification of systems and its applications to modeling and control", IEEE transactions on systems, man, and cybernetics, 1985, vol. 15, no. 1, pp. 116-132.
8. Podvalny S.L., Vasiliev E.M. "Hierarchical identification of parameters of nonlinear dynamic systems", Proceedings of the XIII All-Russian Meeting on Management problems of VSPU-2019, Moscow, V.A. Trapeznikov Institute of Management Problems of the Russian Academy of Sciences, 2019, pp. 517-521.
9. Oldenderfer M.S., Blashfield R.K. "Factorial, discriminant and cluster analysis", trans. from Eng., ed. by I.S. Enyukov, Moscow, Finansy i statistika, 1989, 215 p.
Submitted 05.04.2023; revised 16.06.2023 Information about the authors
Artem P. Shcherbakov, Associate Professor, Department of Higher Mathematics, Lipetsk State Technical University (30 Moskovskaya str., 398055 Lipetsk, Russia), e-mail: [email protected]