Научная статья на тему 'ПРОГНОЗИРОВАНИЕ КАЧЕСТВА ФУНКЦИОНИРОВАНИЯ ТЕХНИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ'

ПРОГНОЗИРОВАНИЕ КАЧЕСТВА ФУНКЦИОНИРОВАНИЯ ТЕХНИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
показатели функционирования / регрессионный анализ / машинное обучение / случайный лес / система Statistica / performance indicators / regression analysis / machine learning / random forest / Statistica system

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мария Игоревна Корнилова, Сергей Викторович Бусыгин, Владислав Николаевич Ковальногов, Владимир Николаевич Клячкин

Актуальность и цели. Качество функционирования сложных технических систем определяется множеством характеристик. Прогнозирование значений этих характеристик по результатам мониторинга показателей работы объекта дает возможность выполнить постоянно растущие требования по обеспечению безопасности и надежности. Необходимая точность прогнозирования требует построения качественных математических моделей. В качестве технического объекта рассмотрено горелочное устройство: оценивается качество функционирования таких устройств по одной из основных характеристик – температуре ядра пламени. Цель исследования – разработка методики построения математической модели, которая бы обеспечила достаточно точный прогноз характеристик функционирования технического объекта. Материалы и методы. Для построения моделей по результатам наблюдений за исследуемым объектом используются как классические методы регрессионного анализа, так и методы машинного обучения. В работе проводится сравнение двух подходов: применения линейного регрессионного анализа и композиционного метода «случайный лес (Random Forest)». Результаты и выводы. Разработана технология математического моделирования и прогнозирования характеристик качества функционирования технических объектов с использованием двух подходов: линейной регрессии и метода случайного леса. В рассматриваемом примере оценки качества горелочного устройства по температуре ядра пламени оба подхода дали практически одинаковый и вполне приемлемый результат. Очевидно, что в других задачах эти результаты могут существенно различаться.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мария Игоревна Корнилова, Сергей Викторович Бусыгин, Владислав Николаевич Ковальногов, Владимир Николаевич Клячкин

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING THE QUALITY OF THE TECHNICAL OBJECT’S FUNCTIONING USING MACHINE LEARNING

Background. The quality of functioning of complex technical systems is determined by many characteristics. Forecasting the values of these characteristics based on the results of monitoring the performance of the facility makes it possible to fulfill the ever-growing requirements for safety and reliability. The necessary accuracy of forecasting requires the construction of high-quality mathematical models. As a technical object, the burner device is considered: the quality of operation of such devices is evaluated according to one of the main characteristics – the temperature of the flame core. The purpose of the study is to develop a methodology for building a mathematical model that would provide a fairly accurate forecast of the characteristics of the functioning of a technical object. Materials and methods. To build models based on the results of observations of the object under study, both classical methods of regression analysis and machine learning methods are used. The paper compares two approaches: the use of linear regression analysis and the compositional method "Random Forest". Results and conclusions. The technology of mathematical modeling and forecasting of the characteristics of the quality of functioning of technical objects using two approaches has been developed: linear regression and the random forest method. In the example under consideration, the evaluation of the quality of the burner device from the temperature of the flame core, both approaches gave almost the same and quite acceptable result. Obviously, in other tasks, these results can vary significantly.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ КАЧЕСТВА ФУНКЦИОНИРОВАНИЯ ТЕХНИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ»

УДК 681.518.5

doi: 10.21685/2307-4205-2023-4-14

ПРОГНОЗИРОВАНИЕ КАЧЕСТВА ФУНКЦИОНИРОВАНИЯ ТЕХНИЧЕСКОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ МАШИННОГО ОБУЧЕНИЯ

М. И. Корнилова1, С. В. Бусыгин2, В. Н. Ковальногов3, В. Н. Клячкин4

1, 2, з, 4 Ульяновский государственный технический университет, Ульяновск, Россия 1 masha.kornilova.1995@mail.ru, 2 sergey18.06.95@mail.ru, 3 kvn@ulstu.ru, 4 v_kl@mail.ru

Аннотация. Актуальность и цели. Качество функционирования сложных технических систем определяется множеством характеристик. Прогнозирование значений этих характеристик по результатам мониторинга показателей работы объекта дает возможность выполнить постоянно растущие требования по обеспечению безопасности и надежности. Необходимая точность прогнозирования требует построения качественных математических моделей. В качестве технического объекта рассмотрено горелочное устройство: оценивается качество функционирования таких устройств по одной из основных характеристик - температуре ядра пламени. Цель исследования - разработка методики построения математической модели, которая бы обеспечила достаточно точный прогноз характеристик функционирования технического объекта. Материалы и методы. Для построения моделей по результатам наблюдений за исследуемым объектом используются как классические методы регрессионного анализа, так и методы машинного обучения. В работе проводится сравнение двух подходов: применения линейного регрессионного анализа и композиционного метода «случайный лес (Random Forest)». Результаты и выводы. Разработана технология математического моделирования и прогнозирования характеристик качества функционирования технических объектов с использованием двух подходов: линейной регрессии и метода случайного леса. В рассматриваемом примере оценки качества горелочного устройства по температуре ядра пламени оба подхода дали практически одинаковый и вполне приемлемый результат. Очевидно, что в других задачах эти результаты могут существенно различаться.

Ключевые слова: показатели функционирования, регрессионный анализ, машинное обучение, случайный лес, система Statistica

Финансирование: исследование выполнено при поддержке гранта Президента Российской Федерации, проект НШ-28.2022.4.

Для цитирования: Корнилова М. И., Бусыгин С. В., Ковальногов В. Н., Клячкин В. Н. Прогнозирование качества функционирования технического объекта с использованием машинного обучения // Надежность и качество сложных систем. 2023. № 4. С. 152-158. doi: 10.21685/2307-4205-2023-4-14

FORECASTING THE QUALITY OF THE TECHNICAL OBJECT'S FUNCTIONING USING MACHINE LEARNING

M.I. Kornilova1, S.V. Busygin2, V.N. Kovalnogov3, V.N. Klyachkin4

u 2, 3 4 Ulyanovsk State Technical University, Ulyanovsk, Russia 1 masha.kornilova.1995@mail.ru, 2 sergey18.06.95@mail.ru, 3 kvn@ulstu.ru, 4 v_kl@mail.ru

Abstract. Background. The quality of functioning of complex technical systems is determined by many characteristics. Forecasting the values of these characteristics based on the results of monitoring the performance of the facility makes it possible to fulfill the ever-growing requirements for safety and reliability. The necessary accuracy of forecasting requires the construction of high-quality mathematical models. As a technical object, the burner device is considered: the quality of operation of such devices is evaluated according to one of the main characteristics - the temperature of the flame core. The purpose of the study is to develop a methodology for building a mathematical model that would provide a fairly accurate forecast of the characteristics of the functioning of a technical object. Materials and methods. To build models based on the results of observations of the object under study, both classical methods of regression analysis and machine learning methods are used. The paper compares two approaches: the use of linear regression analysis and the compositional method "Random Forest". Results and conclusions. The technology of mathematical modeling and forecasting of the characteristics of the quality of functioning of technical objects using two approaches

© Корнилова М. И., Бусыгин С. В., Ковальногов В. Н., Клячкин В. Н., 2023. Контент доступен по лицензии Creative Commons Attribution 4.0 License / This work is licensed under a Creative Commons Attribution 4.0 License.

has been developed: linear regression and the random forest method. In the example under consideration, the evaluation of the quality of the burner device from the temperature of the flame core, both approaches gave almost the same and quite acceptable result. Obviously, in other tasks, these results can vary significantly.

Keywords: performance indicators, regression analysis, machine learning, random forest, Statistica system

Financing: the study was supported by a grant from the President of the Russian Federation, project NSH-28.2022.4.

For citation: Kornilova M.I., Busygin S.V., Kovalnogov V.N., Klyachkin V.N. Forecasting the quality of the technical object's functioning using machine learning. Nadezhnost' i kachestvo slozhnykh sistem = Reliability and quality of complex systems. 2023;(4):152-158. (In Russ.). doi: 10.21685/2307-4205-2023-4-14

Качество функционирования сложных технических систем определяется множеством характеристик. Прогнозирование значений этих характеристик по результатам мониторинга показателей работы объекта дает возможность выполнить постоянно растущие требования по обеспечению безопасности и надежности [1-3].

Необходимая точность прогнозирования требует построения качественных математических моделей. Для построения таких моделей по результатам наблюдений за исследуемым объектом используются как классические методы регрессионного анализа, так и методы машинного обучения [4, 5]. Исходные данные могут быть получены различными способами: по результатам эксплуатации объекта, по данным специально поставленных испытаний, по информации, полученной с помощью математического моделирования работы рассматриваемого объекта.

В настоящей работе проводится сравнение двух подходов: применения линейного регрессионного анализа и композиционного метода «случайный лес (Random Forest)». Для численного исследования используются два модуля локализованной версии 13.3 системы Statistica: «Множественная регрессия» и «Случайные леса» [6].

В качестве технического объекта рассмотрено горелочное устройство: оценивается качество функционирования таких устройств по одной из основных характеристик - температуре ядра пламени (в терминологии регрессионного анализа - отклик). Величина этой температуры зависит от нагрузки, расхода воздуха, метана и биогаза, составов топлива и окислителя, и других - всего 17 показателей (регрессоров) [7].

Из методов машинного обучения был выбран метод «случайный лес» как один из наиболее эффективных в задачах классификации и регрессии [8, 9]. Известно, что лучшие результаты в подобных исследованиях дает глубокое обучение нейронных сетей, однако для применения этого подхода необходим достаточно большой объем выборочных данных (сотни тысяч, а лучше миллионы наблюдений [10]), что для технических систем, как правило, нереально: для построения моделей обычно используется несколько десятков или сотен наблюдений.

Выборка исходных данных разбивается на две части: обучающую и тестовую. Обучающая часть предназначена для построения математических моделей: необходимо построить алгоритм, который для заданного набора показателей функционирования обеспечил бы достаточно точный результат о характеристике качества работы объекта. При этом, как и в любых задачах машинного обучения, возможно переобучение.

Тестовая часть выборки предназначена для оценки качества полученной модели: на тестовом наборе показателей функционирования проводится сравнение опытных и прогнозируемых данных, полученных по построенной модели. О качестве модели и отсутствии переобучения можно судить по различным критериям. В данном исследовании использована средняя абсолютная процентная ошибка (Mean Absolute Percentage Error)

где у, - опытное значение отклика в 7-м наблюдении; у - прогнозируемое значение отклика по рассматриваемой модели; ¡т - объем тестовой выборки.

Цель исследования - разработка методики построения математической модели с наименьшим значением ошибки МАРЕ, которая бы обеспечила достаточно точный прогноз характеристик функционирования технического объекта.

Постановка задачи

1 ^ y- y

Линейная регрессионная модель

Модель множественной линейной регрессии имеет вид [4, 5]

Y = ро + р1*1 + £2x2 + ... + вх р + £,

где Y - отклик (случайная величина); Xj (, = 1 ... p) - факторы, оказывающие влияние на отклик (ре-грессоры); р - количество регрессоров (в рассматриваемом примере р = 17); £ - ошибки наблюдений; в,- (здесь j = 0 ... p) - параметры модели, которые необходимо оценить.

Часть файла исходных данных-прецедентов, используемых для оценки параметров, показана на рис. 1.

Х1 Х2 Х3 Х12 Х13 Х14 Х15 Х16 Х17 У

195 22344 2000 0,2315 0,7685 0 0 483 1,14 2030

247 25798,5 2437,5 0,2315 0,7685 0 0 487 1,08 2055

254 26870,375 2562,5 0,2315 0,7685 0 0 491 1,07 2060

299 31064,775 2962,5 0,2315 0,7685 0 0 495 1,07 2078

310 32609,5 3025 0,2315 0,7685 0 0 499 1,1 2095

355 36877,4 3550 0,2315 0,7685 0 0 503 1,06 2105

401 48272,35 4037,5 0,2315 0,7685 0 0 507 1,22 2120

420 45141,25 4187,5 0,2315 0,7685 0 0 511 1,1 2145

425 49017,15 4275 0,2315 0,7685 0 0 515 1,17 2147

430 50715 4312,5 0,2315 0,7685 0 0 519 1,2 2150

400 40358,85 4037,5 0,1956 0,7559 0,0156 0,0329 477 1,02 1891

400 40358,85 4037,5 0,1788 0,7500 0,0229 0,0483 477 1,02 1803

Рис. 1. Часть файла исходных данных-прецедентов

Вектор оценок (5 параметров модели по методу наименьших квадратов определяется по формуле

Р = (ХТХ ) XTY, (3)

где Y - вектор наблюдений, содержащий 1о значений откликов (в рассматриваемом опыте / = 300 наблюдений; выборка разбивалась на обучающую и тестовую части в пропорции 80/20, поэтому объем обучающей части выборки /0 = 240; Х- регрессионная матрица, содержащая элементы х- (ре-грессоры) - результаты 7-го наблюдения (7 = 1 ... /) за ,-й переменной.

Для проверки значимости модели используется критерий Фишера. Если модель оказалась значимой, далее проверяется значимость каждого регрессора по критерию Стьюдента. При незначимости соответствующий регрессор удаляется из модели, и расчет проводится заново. Последовательное удаление незначимых регрессоров из модели представляет алгоритм пошаговой регрессии.

В практических ситуациях иногда возникают проблемы с обращением регрессионной матрицы

(ХТХ) . Это связано с мультиколлинеарностью регрессоров, когда между ними существует корреляционная связь, близкая к линейной: есть коэффициенты корреляции, близкие к единице.

В рассматриваемой выборке исследовалось наличие корреляционных связей между показателями. Сильная корреляция (выборочный коэффициент корреляции г > 0,9) имеет место между парами показателей Х4-Х5, Х4-Х9, Х5-Х9, Х6-Х7, Хб-Хц.

Для случая мультиколлинеарности регрессоров разработаны варианты регуляризации регрессионной модели. Один из них - использование гребневой регрессии (или ридж-регрессии), когда к диагональным элементам матрицы добавляется некоторое малое число:

Р = (ХТХ + Е) XTY ,

Е - единичная матрица. Параметр X обычно меньше 0,1 и может быть подобран по некоторому критерию. Для характеристики качества модели может быть использован коэффициент детерминации -

квадрат коэффициента корреляции между опытными у и прогнозируемыми у1 значениями (показывает, какая доля дисперсии отклика может быть объяснена рассматриваемыми регрессорами):

= - 10У 2 - 1о У2'

Чем ближе коэффициент детерминации к единице, тем более качественной считается модель.

Поскольку регрессионная матрица в рассматриваемом примере имеет множество сильно коррелированных столбцов, по обучающей части выборки в системе 81ай8йса строилась гребневая регрессия, при этом параметр X подбирался так, чтобы обеспечить максимум коэффициента детерминации. Проводился отбор значимых регрессоров методами пошаговой регрессии с исключением.

На рис. 2 приведены результаты расчета. Из таблицы следует, что при принятом значении X = 0,001 коэффициент детерминации оказался равным Я2 = 0,72; модель значима, поскольку значение статистики Фишера ^(7,232) = 85,94 соответствует вероятности ошибкир < 0,05.

Методами пошаговой регрессии программа отобрала семь значимых регрессоров (Х1, Х4, Х7, Х10, Х13, Х14 и Х15) из 17. Их значимость следует из того, что значения критерия Стьюдента ^(232) соответствуют вероятности ошибки р < 0,05.

Итоги Гребневой регрессии для зависимой переменной: У 4 (22-240+60) К00100 К= ,84951932 К2= ,72168308 Скоррект. 1*2 ,71328559 Р(7,232)=85,940 р<0,0000 Станд. ошибка оценки: 66,661 Исключенные наблюдения: 241:300_

N=240 БЕТА Ст.Ош. БЕТА В Ст.Ош. В 1(232) р-знач.

Св.член 1292,158 182,3952 7,0844 0.000000

Х1 0.517522 0,038808 0,709 0,0532 13,3353 0.000000

Х4 -0,524149 0,055388 -0,057 0,0060 -9,4632 0.000000

Х7 0,446110 0,054188 26,937 3,2720 8,2326 0.000000

Х10 0,357107 0,035544 6487,877 645,7684 10,0468 0.000000

Х13 -0,259730 0,041161 -1,530 0,2425 -6,3101 0.000000

Х14 -0,452516 0,042187 -19,338 1,8029 -10,7265 0,000000

Х15 -0,608903 0,035780 -8,247 0,4846 -17,0181 0,000000

Рис. 2. Результаты расчета по линейной регрессионной модели

Регрессионная линейная модель в виде уравнения для расчета прогнозируемых значений температуры ядра пламени может быть представлена в явном виде

yi = 1292,158 + 0,71x1, - 0,057x4 + 26,937x7.- + 6487,88xw. - 1,53x13. - 19,34xWi - 8,247хш.

По этой формуле был проведен расчет прогнозируемых значений для тестовой выборки в Excel (рис. 3) и найдено значение средней абсолютной процентной ошибки MAPE = 3,65 %. Именно это значение и будет сравниваться с результатом по методу «случайный лес».

[|2 - fx =1292,158+0,71^2-0,057*B2+26,937,C2+6487,88,D2-1,53,E2-19,34*F2-8,247(G2

А А В С о Е F G н 1 J к L

1 xl х4 х7 х10 х13 х14 х16 У у-пр

500 0 0 0,2315 527 10 ОД 2190 2148,568 0,018919

3 400 0 0 0,2195 477 10 0,5 2120 2073,067 0,022138

4 400 0 0 0,2315 477 10 1 2185 2146,645 0,017554

5 400 0 0 0,2315 477 10 0,4 2051 2151,593 0,049046

6 400 0 0 0,2315 477 10 0,4 2101 2151,593 0,024081

7 400 0 0 0,2315 477 10 0,4 1710,5 2151,593 0,257896

8 400 0 0 0,2315 477 10 0,4 1622,6 2151,593 0,325987

9 400 4037,5 0 0,2315 477 10 0,4 1980 1921,456 0,029568

10 400 4037,5 0 0,2315 477 10 0,4 2005 1921,456 0,041668

11 400 1211,25 0 0,2315 477 10 0,4 2110 2082,552 0,013008

12 400 1211,25 0 0,2315 477 10 0,4 2097 2082,552 0,00689

13 170 0 0 0,2315 446 15 0,4 1890 1939,023 0,025938

14 300 0 0 0,2315 448 15 0,4 2060 2028,263 0,015406

15 400 0 0 0,2315 450 15 0,4 2160 2096,203 0,029535

16 500 0 0 0,2315 452 15 0,4 2170 2164,143 0,002699

17 170 0 0 0,2315 446 15 0,4 1890 1939,023 0,025938

18 300 0 0 0,2315 448 15 0,4 2021 2028,263 0,003594

19 300 0 0 0,2315 491 14 0,4 1798 1981,813 0,102232

Рис. 3. Прогноз температуры ядра пламени по тестовой выборке

Заметим, что полученный показатель (ошибка 3,65 %) имеет вполне приемлемое значение, несмотря на достаточно низкий коэффициент детерминации R2 = 0,72.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Метод Random Forest для решения задач регрессии

Random Forest, или «случайный лес», - это алгоритм машинного обучения, предложенный Л. Брейманом [11], в нем используется ансамбль решающих деревьев. Алгоритм сочетает в себе бэг-гинг (случайный выбор с возвращением) и метод случайных подпространств. Он состоит из множества независимых деревьев решений, используется случайная выборка наблюдений из обучающего набора и случайный набор показателей при принятии решений о разбиении узлов.

Точность прогнозирования случайного леса зависит от количества показателей в случайном наборе, объема случайной выборки из обучающего набора, количества деревьев, максимальной глубины деревьев, максимального количества узлов в деревьях, минимального числа объектов в листьях, минимального количества объектов в дочернем узле.

Для решения задачи использовался модуль «Случайный лес» локализованной версии 13.3 пакета Statistica. Настройки показаны на рис. 4: приняты доля тестовой выборки - 0,2 (20 % от всего набора данных), доля подвыборки - 0,5; число случайных показателей (предикторов) - 5 и т.д.

Настройки: 22-240+60 ? X

Быстрый Дополнительно j Условие остановки | Параметры

Число Г предикторов: I-

Число деревьев:

100

HS Тестовая выборка выкл.

Пропорция случ.

тестовых данных: Пропорция подвыборки:

Начальное значение Г датчика случайных чисел: Условия остановки

Мин. N R ira Мин. п в

наблюдений: _В дочернем узле:

Макс, п m Макс, п

уровней: |_узлов:

Рис. 4. Настройки случайного леса

На рис. 5 показаны рассчитанные системой прогнозируемые значения отклика для те-

стовой выборки по полученной с помощью «случайного леса» модели.

п «S -

вная Правка

Вид Формат Анализ

^ Нейрон!

1ные сети

Statistica -Добыча Данных ^ ^ Анализ ci

| Процедуры обучения Оптимальное соединение | Аддитивные модели ¡^ Кластерный анализ

Обучение Кластеризация/Группировка

Опрогн. значения (22-240+60) Отклик: Y4

Тестовая выборка; Число деревьев: 100

Наблюд. Предок. Остаток

значение значение значение

g 2147,000 2109,643 37,357

13 1891,000 2019,807 -128,807

16 2112,000 2031,759 80,241

21 2182,000 2031,759 150,241

33 1900,000 1993,576 -93,576

40 1900,000 1979,999 -79,999

50 2145,000 2110,017 34,983

53 1803,000 2048,813 -245,813

58 2092,000 2050,056 41,944

59 2120,000 2070,914 49,086

61 2178,000 2111,735 66,265

62 2171,000 2108,018 62,982

63 2089,000 2072,657 16,343

65 1950,000 2015,712 -65,712

73 2145,000 2055,075 89,925

77 2198,000 2108,690 89,310

81 2098,000 2057,409 40,591

87 2191,000 2115,538 75,462

91 1981,000 2032,188 -51,188

93 2121,000 2032,329 88,671

94 2185,000 2029,899 155,101

95 2095,000 2047,814 47,186

111 1955,000 2030,350 -75,350

Рис. 5. Прогнозируемые значения температуры по методу «случайного леса», найденные системой 81а11811са

По этим данным нетрудно подсчитать значение средней абсолютной процентной ошибки: МАРЕ = 3,64 %. Таким образом, точность полученных моделей оказалась практически одинаковой. Попытки улучшить этот результат путем изменения настроек (см. рис. 4) не дали эффекта.

Заключение

Разработана технология математического моделирования и прогнозирования характеристик качества функционирования технических объектов с использованием двух подходов: линейной регрессии и метода «случайного леса». В рассматриваемом примере оценки качества горелочного устройства по температуре ядра пламени оба подхода дали практически одинаковый и вполне приемлемый результат. Очевидно, что в других задачах эти результаты могут существенно различаться.

Возникает вопрос: какую же из моделей предпочесть? При одинаковой точности предпочтительнее линейная регрессионная модель, поскольку она записана в явном виде. С ее помощью можно анализировать влияние различных факторов на качество работы горелки. Модель «случайного леса» в явном виде не выводится, и проводить такой анализ будет гораздо сложнее.

Список литературы

1. Биргер И. А. Техническая диагностика. 2-е изд. М. : URSS, 2019. 240 с.

2. Северцев Н. А., Бецков А. В., Дарьина А. Н. Методы и модели создания автоматизированных средств контроля для повышения безопасности функционирования технических систем // Надежность и качество сложных систем. 2019. № 2. С. 19-26.

3. Юрков Н. К. Риски отказов сложных систем // Надежность и качество сложных систем. 2014. № 1. С. 18-24.

4. Валеев С. Г. Регрессионное моделирование при обработке наблюдений. М. : Наука, 1991. 272 с.

5. Валеев С. Г., Клячкин В. Н. Практикум по прикладной статистике. Ульяновск : УлГТУ, 2008. 134 с.

6. Боровиков В. П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. 2-е изд. СПб. : Питер, 2003.

7. Kovalnogov V., Fedorov R., Klyachkin V. [et al.]. Applying the Random Forest Method to Improve Burner Efficiency // Mathematics. 2022. № 10. Р. 1-25.

8. Neykov M., Liu J. S., Cai T. On the Characterization of a Class of Fisher-Consistent Loss Functions and its Application to Boosting // Journal of Machine Learning Research. 2016. № 17. P. 1-32.

9. Wyner A. J., Olson M., Bleich J., Mease D. Explaining the Success of AdaBoost and Random Forests as Interpolating Classifiers // Journal of Machine Learning Research. 2017. № 18. P. 1-33.

10. Воронина В. В., Михеев А. В., Ярушкина Н. Г., Святов К. В. Теория и практика машинного обучения: учеб. пособие. Ульяновск : УлГТУ, 2017. 290 с.

11. Breiman L. Random Forests // Machine Learning. 2001. Vol. 45, № 1, P. 5-32.

References

1. Birger I.A. Tekhnicheskaya diagnostika. 2-e izd. = Technical diagnostics. 2nd ed. Moscow: URSS, 2019:240. (In Russ.)

2. Severtsev N.A., Betskov A.V., Dar'ina A.N. Methods and models for creating automated controls to improve the safety of technical systems. Nadezhnost' i kachestvo slozhnykh system = Reliability and quality of complex systems. 2019;(2):19-26. (In Russ.)

3. Yurkov N.K. Risks of failures of complex systems. Nadezhnost' i kachestvo slozhnykh system = Reliability and quality of complex systems. 2014;(1):18-24. (In Russ.)

4. Valeev S.G. Regressionnoe modelirovanie pri obrabotke nablyudeniy = Regression modeling in the processing of observations.. Moscow: Nauka, 1991:272. (In Russ.)

5. Valeev S.G., Klyachkin V.N. Praktikum po prikladnoy statistike = Practical training in applied statistics. Ul'yanovsk: UlGTU, 2008:134. (In Russ.)

6. Borovikov V.P. STATISTICA. Iskusstvo analiza dannykh na komp'yutere: dlya professionalov. 2-e izd. = STATISTICS. The art of data analysis on a computer: for professionals. 2nd ed. Saint Petersburg: Piter, 2003. (In Russ.)

7. Kovalnogov V., Fedorov R., Klyachkin V. et al. Applying the Random Forest Method to Improve Burner Efficiency. Mathematics. 2022;(10):1-25.

8. Neykov M., Liu J.S., Cai T. On the Characterization of a Class of Fisher-Consistent Loss Functions and its Application to Boosting. Journal of Machine Learning Research. 2016;(17):1-32.

9. Wyner A.J., Olson M., Bleich J., Mease D. Explaining the Success of AdaBoost and Random Forests as Interpolating Classifiers. Journal of Machine Learning Research. 2017;(18):1-33.

10. Voronina V.V., Mikheev A.V., Yarushkina N.G., Svyatov K.V. Teoriya ipraktika mashinnogo obucheniya: ucheb. posobie = Theory and practice of machine learning: textbook. Ul'yanovsk: UlGTU, 2017:290. (In Russ.)

11. Breiman L. Random Forests. Machine Learning. 2001;45(1):5-32.

Информация об авторах / Information about the authors

Мария Игоревна Корнилова

аспирант,

Ульяновский государственный технический университет

(Россия, г. Ульяновск, ул. Северный Венец, 32) E-mail: masha.kornilova.1995@mail.ru

Сергей Викторович Бусыгин

аспирант,

Ульяновский государственный технический университет

(Россия, г. Ульяновск, ул. Северный Венец, 32) E-mail: sergey18.06.95@mail.ru

Владислав Николаевич Ковальногов

доктор технических наук, доцент, заведующий кафедрой тепловой и топливной энергетики, Ульяновский государственный технический университет

(Россия, г. Ульяновск, ул. Северный Венец, 32) E-mail: kvn@ulstu.ru

Владимир Николаевич Клячкин

доктор технических наук, профессор, профессор кафедры прикладной математики и информатики, Ульяновский государственный технический университет

(Россия, г. Ульяновск, ул. Северный Венец, 32) E-mail: v_kl@mail.ru

Maria I. Kornilova

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Postgraduate student,

Ulyanovsk State Technical University

(32 Severny Venets street, Ulyanovsk, Russia)

Sergey V. Busygin

Postgraduate student,

Ulyanovsk State Technical University

(32 Severny Venets street, Ulyanovsk, Russia)

Vladislav N. Kovalnogov

Doctor of technical sciences, associate professor,

head of the sub-department

of thermal and fuel energy,

Ulyanovsk State Technical University

(32 Severny Venets street, Ulyanovsk, Russia)

Vladimir N. Klyachkin

Doctor of technical sciences, professor, professor of the sub-department of applied mathematics and informatics, Ulyanovsk State Technical University (32 Severny Venets street, Ulyanovsk, Russia)

Авторы заявляют об отсутствии конфликта интересов / The authors declare no conflicts of interests.

Поступила в редакцию/Received 20.08.2023 Поступила после рецензирования/Revised 30.08.2023 Принята к публикации/Accepted 15.09.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.