Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
Научная статья
УДК 631.354.2-027.45:004.021
DOI 10.48136/2222-0364_2022_2_153
Возможности использования данных электронных систем сельскохозяйственных машин для построения предсказательных моделей
В.М. Помогаев, Г.В. Редреевн, П.И. Ревякин, А.С. Басакина
Омский государственный аграрный университет имени П.А. Столыпина, Омск, Россия
Аннотация. Повышение надежности и безотказности работы техники - важнейшие задачи системы технического обслуживания. Все больше современных сельскохозяйственных машин оснащаются системами и датчиками удаленного контроля, что открывает новые возможности для прогнозирования отказа механизмов. Однако разнообразные данные, поступающие с интеллектуальных систем современных машин, могут иметь неоднородные форматы, быть неструктурированными или структурированными частично, и это не позволяет однозначно определить их полезность для построения моделей и предсказания неисправностей. В статье на примере данных, поступающих с датчиков зерноуборочных комбайнов компании «Ростсельмаш», была проверена гипотеза о возможности их обработки для целей машинного обучения и построения в дальнейшем предсказательных моделей. Для исследования данных применялись основные методы предиктивной аналитики - методы математической статистики, моделирование: произведен описательный статистический анализ, рассчитаны основные статистические оценки; регрессионный и корреляционный анализ имеющихся данных. По результатам регрессионного анализа с учетом значимых параметров построены регрессионные модели, позволяющие предсказывать значение одной переменной при известных значениях зависимых переменных. Определены степени зависимости показателей в изучаемых данных, по результатам корреляционного анализа отмечена высокая теснота взаимосвязи (коэффициент корреляции выше 0,7) между частотами вращения валов и шнеков агрегатов и узлов. Выявлены закономерности в изменениях показателей в предыдущих периодах: при построении графиков распределения частот вращения валов и шнеков агрегатов во времени, по имеющимся данным, наблюдается синхронность распределения значений при условно нормальном режиме работы. Спрогнозированы будущие результаты на основе выявленных закономерностей: тренд отклонения одного из графиков распределения коэффициентов симметрии частот вращения валов и шнеков агрегатов во времени от нормального положения будет сигнализировать об изменении характеристик конкретного рабочего узла. Полученные результаты подтвердили перспективность предиктивной аналитики агромашин на основе данных бортовых систем.
Ключевые слова: надежность, безотказность, зерноуборочный комбайн, предиктивная аналитика, предсказательные модели, структурированные и неструктурированные данные, большие данные, дата-фрейм, статистический анализ
Original article
Possibilities of using the data of electronic systems of agricultural machinery for building predictive models
V.M. Pomogaev, G.V. RedreevH, P.I. Revyakin, A.S. Basakina
Omsk State Agrarian University named after P.A. Stolypin, Omsk, Russia
Abstract. Improving the reliability and non-failure operation of equipment is the most important task of the maintenance system. More and more modern agricultural machines are equipped with remote control systems and sensors, which opens up new opportunities for predicting the failure of mechanisms. However, a variety of
© Помогаев В.М., Редреев Г.В., Ревякин П.И., Басакина А. С., 2022
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
data coming from the intelligent systems of modern machines may have heterogeneous formats, be unstructured or partially structured, which does not allow to unambiguously determine their usefulness for building models and predicting malfunctions. In this article, using the example of data coming from sensors of Rostselmash combine harvesters, the hypothesis about the possibility of their processing for the machine learning purposes and the construction of predictive models in the future was tested. To study the data, the main methods of predictive analytics were used - methods of mathematical statistics, modeling: a descriptive statistical analysis was carried out, the main statistical estimates were calculated, regression and correlation analysis of available data was performed. Based on the results of regression analysis, taking into account significant parameters, regression models were constructed that allow predicting the value of one variable with known values of dependent variables. The degrees of dependence of the indicators in the studied data were determined, according to the results of the correlation analysis, a high closeness of the relationship (the correlation coefficient is higher than 0.7) between the rotation frequencies of the shafts and augers of the aggregates and nodes was noted. Regularities in the changes in indicators in previous periods were revealed: when plotting the distribution of rotation frequencies of the shafts and augers of aggregates over time, according to the available data, synchronicity of the distribution of values in a conditionally normal operating mode was observed. The future results are predicted on the basis of the revealed patterns: the deviation trend of one of the symmetry coefficients distribution graphs of the rotational frequencies of the shafts and screws of the units over time from the normal position will signal a change in the characteristics of a particular working unit. The obtained results confirmed the prospects of predictive analytics of agricultural machines based on data from on-board systems.
Keywords: reliability, combine harvester, predictive analytics, predictive models, structured and unstructured data, big data, data frame, statistical analysis
Введение
Организация обслуживания любой техники имеет целью повышение надежности ее функционирования. В теории надежности выделяют ее вероятностные (математические) и статистические показатели. Математические показатели надежности выводятся из теоретических функций распределения вероятностей отказов. Статистические показатели надежности определяют опытным путем при испытаниях объектов на базе статистических данных эксплуатации [1].
Надежность - функция многих факторов, большинство из которых случайны. Отсюда ясно, что для оценки надежности объекта и выстраивания системы его технического обслуживания необходимо большое количество критериев и данных.
Современный уровень научно-технического прогресса, развитие концепции интернета вещей и внедрение IoT устройств в современную сельскохозяйственную технику открывают новые возможности для развития системы технического обслуживания. Все большее количество машин, узлов и агрегатов оснащается системами и датчиками удаленного контроля технологических процессов, которые в свою очередь генерируют большое количество структурированных и неструктурированных данных. При получении информации уменьшается неопределенность, т.е. энтропия системы. Очевидно, что, чем больше информации получает наблюдатель, тем больше снижается неопределенность, и энтропия системы уменьшается [2].
Как известно, в мире структурированными считаются не более 20% данных, остальные представляют пока разнообразие форм. Поэтому наличие возможности получать данные ни в коем случае не делает возможным их прямое использование. Целью исследования являлась оценка возможности использования неструктурированных данных, поступающих с датчиков зерноуборочных комбайнов, и их обработки для целей машинного обучения и построения в дальнейшем предсказательных моделей. Исходя из этих условий были поставлены задачи: подготовка массивов данных к обработке (произвести классификацию данных, определить структуру данных); оценка массивов данных на их однородность, полноту, плотность распределения; расчет основных статистических оценок для оценивания параметров распределений величины; определе-
Vestnik ofOmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
ние и анализ коэффициентов взаимной корреляции значений показателей; выполнение регрессионного анализ данных; оценка возможности построения предсказательных моделей.
Материалы и методы
В исследовании в качестве источника данных использованы результаты компьютерного мониторинга технико-технологических параметров работы зерноуборочных комбайнов комбайнового завода «Ростсельмаш». Современные комбайны завода оснащаются электронными опциями и благодаря интегрированному в бортовую систему техники оборудованию и программе на базе серверной и передающей архитектуры обеспечена возможность получать информацию о машине в максимально полном объеме. Сегодня доступны функции контроля учета и анализа: определение местонахождения машины или всего парка машин во времени, с фиксацией траектории движения; активность техники - простой, движение, рабочий режим, скорость и отображение этих данных на карте; параметры технологического процесса - скорость вращения ротора или барабанов, шнеков, вентилятора очистки и т.д.; выполняемый технологический процесс; параметры систем, работы узлов и агрегатов: обороты двигателя, температура и уровень охлаждающей жидкости и т.д.; предупредительные и аварийные сообщения бортовой системы, напоминания о необходимости исполнения ТО; использования рабочего времени персоналом; факт заправки и слива топлива; факт выгрузки и место выгрузки и т.д.
Исходными были наборы данных в виде неструктурированных массивов данных. Наборы представляли датасеты в виде таблиц в формате *.csv, содержащие данные в текстовом формате JSON, общим объемом порядка 3 Гб, содержащим листы разного содержания и полноты сведений: навигационный отчет, отчет по уведомлениям бортовой системы, текущая неисправность, данные телеметрии. Проанализированы навигационные отчеты, содержащие динамические и ненулевые значения по параметрам 30 датчиков с привязкой ко времени и местоположению (координаты).
Массивы данных охарактеризованы как неоднородные, содержащие разные статистические совокупности, являющиеся носителями разных признаков: частоты вращения, температуры рабочих жидкостей, давления рабочих жидкостей, зазоров, расходов топлива и т.д.
Для технического описания данных был взят за основу случайный датасет из набора данных, так как при анализе выявлено, что в отношении качественного описания и анализа данных датасеты идентичны. Технический анализ данных проведен в программном обеспечении R-Studio [3].
Рассматриваемый датафрейм (рис. 1) содержит 42172 наблюдения и 56 значений. В данном случаем рассматривается часть датасета как наиболее вариативная, содержащая динамические данные, представляющие интерес для выполнения анализа в соответствии с поставленными задачами.
В структуре датафрейма - табличные данные, разделенные на строки и столбцы в соответствии с наблюдениями и значениями и приведенные к формату временного ряда. Показаны они в числовых, логических и символьных форматах для анализа; в данном случае дальнейшее преобразование форматов данных не требуется. Был проведен поиск пропущенных значений в наблюдениях. Согласно данным функции complete.cases() в текущем датафрейме содержится 42 169 наблюдений из 42 172 с хотя бы одним пропущенным значением. В количественном эквиваленте данный показатель составит 568 096 пропущенных значений.
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
tibble [42,172 х 56] (SB: tb1_( f/tbl/data.frame)
$ timestamp_create posixcc[1:42172], format: "2019-07-07 16:42:00" "2019-07-06 18:41:00" "2019-07-06 18:41:00 "2019-07-09 16:41:00" ...
S params chr [1:42172] "ms gi d: 3 :000000000000001447 52,B18:1:1" "msgi d: 3:00000000000000140590,ell:1:0 "msgi d:3:000000000000001405
92,в22:1:1м "msgid: 3:00000000000000154180,P18 2:0.0,P23:2 36.88,P44:2:0.0,P25:2:2.28,P11:2:0.0,P13:2:0.0,P19:2:0.0,P21:2:0 0"| _truncated_ ...
$ speed num [1:42172] 0 0 0 0 0 2 2 0 2 0 ...
$ data, don logi [1:42172 TRUE TRUE TRUE TRUE TRUE TRUE ...
$ data, mov logi [1:42172 FALSE FALSE FALSE FALSE TRUE TRUE ...
$ data, load num [1:42172] 0 0 0 0 0 0 0 0 0 0 ...
S data, mode chr [1:42172] "m3" "из" "m5" "мз" ...
$ data.speed num [1:42172] 0 0 0 0 6.31 5.53 5.42 0 5.28 0 ...
$ sensors_data. FUEL num [1:42172] 49 67.3 67. 92.3 100 ...
$ sensors_data.ON_NK num [1:42172] 0 0 1 0 0 1 1 0 1 NA ...
$ sensors_data. speed num [1:42172] 0 0 0 0 6.31 5.53 5.42 0 5.28 0 ...
$ sensors_data.active num [1:42172] 1.56e+12 1.56e+12 1.56e+12 1.56e+12 1.56e+12 ...
$ sensors_data.ON_100 num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.0N_lRS num [1:42172] 1110 0 1 1 0 1 NA ...
$ sensors_data. ON_WAY num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data. FR_VIBR num [1:42172] 0 93. 5 93. 5 0 О . . .
$ sensors_data.harvest num [1:42172] 0 408 408 0 0 ...
$ sensors_data.fr_motor num [1:42172] 969 941 941 913 2121 ...
$ sensors_data.fr_shaft num [1:42172] 0 123 123 0 0 . . .
$ sensors_data.LATITUDE num [1:42172] 46.5 46.5 46.5 46.5 46.5 ...
$ sensors_data.ON_BRAK£ num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.ON_EMPTY num [1:42172] 0 0 0 1 0 0 0 0 0 NA ...
$ sensors_data.pr_motor num [1:42172] 2.34 2.28 2 28 2.28 3.61 3.56 3.56 3.28 3. 56 3.17 ...
$ sensors_data. longitude num [1:42172] 38 38 38 38 38 . . .
$ sensors_data.ON_UPLOAD num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.tmp_motor num [1:42172] 86.1 84.2 8<! .2 84.7 84.7 ...
$ sensors_data.BUNKER_CAP num [1:42172] 9 9 9 9 9 9 9 9 9 9...
$ sensors_data. FR_CY1__IRS num [1:42172] 0 1638 1638 0 0...
$ sensors_data.fr_motovil num [1:42172] 0 0 0 0 0 9 11 4.64 0 0 0 ...
$ sensors_data.loss_clean num [1:42172] 0 0 0 0 0 2 93 2.93 0 1.3 NA ...
i sensors_data. loss_rotor num [1:42172] 0 0 0 0 0 8 63 8.63 0 0.42 NA ...
$ s ensors_data.ON_IRS_IZM num [1:42172] 111111 1 1 1 NA ...
$ sensors_data.ON_MOTOVIL num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.ON_viBRATOR num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.fr_cyl_molot num [1:42172] 0 408 408 0 0 ...
$ sensors_data.FR_SCREW_EAR num [1:42172] 0 166 166 0 0 . . .
$ sensors_data.ON_iRS_VALOtc num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.ON_NK_REVERS num [1:42172] 0 0 0 0 0 0 0 0 0 NA ...
$ sensors_data.TMP_GST_MOVE num [1:42172] 51 45. 5 45. 36.9 61. 2 ...
$ SenSOrS_data. GAR_CYLJ«OLOT num [1:42172] 6.76 6.32 6 32 6.69 6.3 6.3 6.3 6.31 6.3 NA ...
$ sensors_data. FR_SCREW_GRAIN num [1:42172] 0 167 167 0 0 . . .
$ sensors_data.gap_up num [1:42172] NA NA NA NA NA 12 12 NA NA NA ...
$ sensors_data.ADAPTER num [1:42172] NA NA NA NA NA 6.93 6.93 NA NA NA ...
$ sensors_data.GAP_EXT num [1:42172] NA NA NA NA NA 10 10 NA NA NA ...
$ sensors_data.VOLTAGE t spnsnrn data, gap down num [1:42172] num Г1:4?1771 NA NA NA NA NA NA NA ISIA NA 27.7 27.7 NA NA NA ... NA 8 8 NA NA NA ...
Рис. 1. Структура датафрейма
, J
1 I
« ^ A
S- 1
'LI
о
CO
E to ra
СL
Рис. 2. Графики пропущенных значений датафрейма
В графике на рис. 2 видно, каких переменных пропущенных значений больше всего и как выглядит таблица с пропущенными значениями (паттерны пропущенных значений). На графике слева (рис. 2) показано, с какой частотой встречаются пропущенные значения в той или иной переменной (имена переменных из-за множества не показаны на графике, в данный момент рассматриваем общую картину). По графику справа (рис. 2): в каких комбинациях эти пропущенные значения встречаются.
Vestnik ofOmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
CD
cd
о —1 о
о о
CD — CD
СЧ
OJ CD "О CD SU CD -— CD CM
CD CD
CD — CD
CD —1
Рис. 3. Общая наполненность наблюдений датафрейма
На следующем графике (рис. 3) показана наполненность наблюдений (красным цветом отмечены пропущенные значения, остальное - заполненные значения; чем темнее цвет, тем больше значение). По вертикальной оси - номер строки в датафрейме, id наблюдения.
Данные приведены к единому формату без пропусков для дальнейшего анализа. Первый массив данных, структурированный навигационный отчет, проработан в части пропусков данных по методу удаления строк и столбцов, содержащих пропуски. Выбор метода обоснован объемом пропусков значений параметров (более 30%) [4].
В результате структурирования получен массив данных из порядка 40 тыс. наблюдений и 13 значений:
• скорость движения комбайна, км/ч;
• частота вращения молотильного барабана, об./мин;
• частота вращения вентилятора очистки, об./мин;
• частота вращения вала привода очистки, об./мин;
• частота вращения шнека зернового, об./мин;
• частота вращения шнека колосового, об./мин;
• температура охлаждающей жидкости двигателя, °С;
• температура масла в ГСТ хода, °С;
• давление масла в системе смазки двигателя, бар;
• уровень топлива в баке, %;
• текущее положение НК, %;
• частота вращения вала соломотряса, об./мин;
• частота вращения коленчатого вала двигателя, об./мин.
m С "D
F О Л!
го о
Ш (С
Vestnik of Omsk SAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
По каждому динамическому параметру построена гистограмма распределения данных, позволяющая оценить частоту появления измеренных значений параметров. На рис. 4 в качестве примера приведена гистограмма распределения данных по параметру «частота вращения молотильного барабана».
Рис. 4. Пример гистограммы распределения данных
Как видно из данных гистограммы, частота появления значения «0» доминирующая (20% от общего числа). Для повышения репрезентативности выборки были рассмотрены массивы данных с большим количеством значащих членов выборочной совокупности.
Произведен описательный статистический анализ данных, просчитаны основные статистические оценки (среднее значение по параметру, медиана, мода, стандартное отклонение, дисперсия выборки, эксцесс, асимметричность, интервал, минимум, максимум), которые дают краткую характеристику выборки по каждому параметру. Результаты расчета представлены в табл. 1.
По результатам расчета: значения параметров частот вращений валов и шнеков и скорость движения не подчиняются закону нормального распределения (значения моды, медианы и среднего арифметического имеют значительное расхождение), значения параметров температур рабочих жидкостей, текущее положение НК близки к нормальному распределению. По значениям моды можно судить о репрезентативности выборки.
Регрессия позволяет прогнозировать зависимую переменную на основании значений факторов, в данном случае в качестве факторов рассматриваются остальные параметры массива данных. Регрессионный анализ проведен с помощью программного продукта RStudio и дополнительной надстройки программного продукта MS Excel [5; 6].
Для построения регрессий дополнительно подготовлен массив данных согласно требованиям сценария надстройки: неразрывность входного интервала, разделительные знаки.
В результате построены 13 регрессионных моделей по 13 параметрам, выявлены значимые для каждой из регрессий, определены коэффициенты детерминации, рассчитаны критерии Фишера, позволяющие судить о значимости модели. Итог представлен в табличном виде, интерпретирован итоговый результат регрессии и расписаны уравнения регрессии. На рис. 5 представлен итог расчетов регрессии по одному из признаков -скорости движения.
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
ншм/*до 'вэкс1101Ч01Г0э EifEa KHiotnBdfl BioxoBh г 1 SO if". ос m о" г*1 ОС о гч 0,00 1 ГЧ У]" Г-- 5673,74 ОС о о ч- Л "Т 209,18 I 0,00 209,18 ОС ОС я ОС S \о о Or ОС ОС OS OS m
% 'Ш ЭИНЭЖ01Г0И ээШ/Еяэ^ го v© о" о о о" 'П о т IJ-, о о" IN о" ? IN о о о о о" о о IN ос" я ш CJ о о ос" ОС OS as ГО
% 'эявд я BHHiriiQi чноаосЗд m ю" Г-- о" т л о" ОС о о о о m IN IN ч- VO f •ч- ОС d гч о" 1 ю as *п OS о о о о о р •sC S м о Or ОС ОС OS OS m
dEg 'BiraiEJUHtf ИНЕЕ1ЧЭ эшхэиэ a Е1ГЭЕ1М ЭИНЭМВ^ ч-ч- го о о о" о so съ so IJ-, го IN OS о" ОС о" IN OS ■о as ОС 'П о о о" as ОС 'П о Sj ч-' ч- Г-- о о ос" ^ as as ГО
Эо "Е^0^ 10 J й ЕЮЕ1Ч BdAlBd0H)'40J_ с- L-- ч- 3 о ГЧ ю" ч- ГЧ к ч- m ю ОС о" гч Г] з "Т о с; so о о о" о о Г-- 1 790431,53 о ■о ОС ОС OS OS m
Do 'KirajEJHati И1ЭОЭПГЙЖ ИЭШОТЕ1?ЖЕ1ГХ0 BdXxedaumj, ОС о\ "Г ОС ч- о" m MS so" ОС ГЧ г-" ОС as ос" о <ч г- о r^j OS OS i о о 4D ОС кЛ as a^ OS о OS so" / f 1 $ m м о о ос" ^ as as ГО
HHW/'go 'ОЛОЯОЭОНОЯ ЕМЭНТП KHHOtTIEda EJ.0J.3Eh 00 IN ОС IN Г--VC о" О о" о о о о" ч- VD •т Ы' гч ОС ОС о" ч- го 7 о ■о с--" as м о о о" о ■о as м 1 о о ос" ^ as as ГО
ншм/*до 'ojoaoHdae Емонш KHiotnEda BioxoBh ОС IN О ОС ГЧ SO о" ч-ч- г-" ю m о о о ОС т. m (N ■sc ОС г-- о о ч- Л "Т кЛ ОС С: т о о о ОС ог m 1 'ОС о <э ОС ОС OS OS m
HHIV/'QO 'roiJOThO Etroandll Е1ГЕЯ KHiotnEda BioxoBh m vo so" о IN Os ч- о" ч- VD го с IN о о о" 't ос" Os m (N ог о OS С-- о" ч- го 7 OS ОС гч" L--IN о о о" OS ОС IN L--IN г- r^i р OJ S3- гч ОС о о ос" ^ as as ГО
ншм/*до 'ияхоиьо ескшпгихнэа ви наше da eioioeh ОС ю" ю ю ГЧ ГП ч; ос с-ф о о о" •я-" ■о гч »Л Г-- г- OS ■sC OS о о" ч- Л "Т OS Т. ОС ОС о о ог OS т. ОС ОС 22216473,12 о <э ОС ОС OS OS m
Hnwrgo 'EHEgEdEg ojoH4imjoiroiv KHiotnEda BioxoBh ГЧ so" Г--1N so VO о" ч- о о' 1Л о о о" (N гл Ifl IN Г-- ОС о" ч- го 7 гч VC ОС ОС м о о о" гч VC ОС ОС го £ m s о о ос" ^ as as ГО
ншм/*до 'KirajEJHati Е1гванэ1гол KHiotnEda вхоховь с- Os о" Г-- Гч" OS о о" m о IN о о о' IN «Т, о *п 251 523,00 5 ■so 7 0^ го о" ю IN о о о" OS fO о" ю IN 70817555,03 о ■о ОС ОС OS OS m
ь/ня 'внивдтмоя кинэживЯ 4J3odoM^ 1N о^ о" IN о^ о ■о о" <ч 1/-J ОС ГЛ (N 00 as IN чо гч о о о" •чС 200 589,97 о о ос" ОС OS as ГО
ЕМНЭПО ВНЯ0ЭЫ110И1В1Э и о 4 о a О Стандартная ошибка | Медиана а о 2 Стандартное отклонение Дисперсия выборки о '■J о Я" 'J а Г) Асимметричность (Интервал (Минимум (Максимум i: d н о г и
Vestnik of Omsk SAU, 2022, no. 2(46)
PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
Регрессионн ая cm am ист ила
Множественный R 0,856964835
ft- квадрат 0,734371589
Нормированный R-квадрат 0,73429165
Стандартная ошибка 2,68607296
Наблюдения 39SSS
Дисперсионный анализ
df MS F Значимость F
Регреосия 12 795385,4606 66282Д2172 9186,726603 0
Остаток 39875 287697,6444 7,214987948
Итого 39887 1083083,105
Не ъффициенты Ctv ан дартн ая оши бка t-cm пm истина Р-Значение Нижние Верхние 55%, Нижние 95,0% Верхние 35,0%
Y-пересечение -3,815795373 0,202811357 -18,81450539 1,25988Е-78 -4,213310395 -3,418280351 -4,213310396 -3,418280351
Частота вращения колен вал а двигателя, об/мин 0,014490687 7,36722Е- 05 196,6913232 0 0,014346288 0,014635087 0,014346288 0,014635087
Частота вращения молотильного барабана, об/мин -0,064789374 0,003581843 -18,08827987 7,7159Е-73 -Q 071809869 -0,057768878 -0,071809869 -0,057768878
Частота вращения вентилятора счистки, о б/мин 0,015690427 0,000920466 17,04617379 б,342б9Е-65 Q013886291 0,017494562 0,013886291 0,017494562
Частота вращения вала привода очиегм, об/мин - 0,056239508 0,006004365 -9,366436907 7,88119Е-21 -Q 068008205 -0,044470811 -0,068008205 -0,044470811
Частота вращения шнека зернового, об/мин 0,014733428 0,005325605 2,76652641 0,005668308 Q004295116 0,025171739 0,004295116 0,025171739
Частота вращения шнека коло оо во го, об/мин 0,012317364 0,004708415 2,616032116 0,008899171 Q003088761 0,021545967 0,003088761 0,021545967
Темпера(турао>1лсигающей наддкости двигателя, гра -0,098856969 0,002397724 -41,22949885 0 -Q103556565 -0,094157373 -0,103556565 -0,094157373
ТемпеpaíTypaMaaia вГСГхода, трэд С 0,103259393 0,002910532 35,48128151 1,6357Е-271 Q097564682 0,108974103 0,097564682 0,108974103
Давление масла в системе смазки двигателя, бар -1,098472887 0,032411111 -33,89186155 2,9833Е-248 -1,161999426 -1,034946349 -1,161999426 -1,034946349
Уровень топлива в баке, % -0,014851581 0,000735265 -20,19893951 2,8345бЕ-90 -Q 016292718 -0,013410443 -0,016292718 -0,013410443
Текущее положение НК, % 3,399247763 0,138059822 24,62155693 7,3212Е-133 3128647271 3,669848256 3,1286472Л 3,669848256
Частота вращения вала ооломотряса, об/мин 0,018250637 0,014281084 1,278659062 0,201024583 -Q 009730622 0,046251896 -0,009730622 0,046251896
Построенная модель статистически значима
Наличие выоокого
коэффициента детерминации указывает на статистическую
значимость построенной модели.
Приэтом интерпритируя коэффициент детерминации можно сказать, что раз б рос результативного признакам он« т изменять
Параметр в среднем увеличится на 0,014490687 если Ч асгота вр аще н ия коле н вал а д ви гателя, об/мин увеличится на 1
уменьшится на -0,064789374 если Частота вращения молотильного барабана, об/мин увеличится на1
увеличится на 0,015690427 если Ч асгота вращениявенгилятораочи егки, об/мин увеличится на1
уменьшится на -0,056239508 если Частота вращения вала привода очистки, об/мин увеличится на1
увеличится на 0,014733428 если Частота вращения шнеказернового, об/мин увеличится на1
увеличится на 0,012317364 если Ч асгота вр аще н ия ш н е ка ко л о оово го, об/мин увеличится на1
уменьшится на -0,098856969 если Температура охланодающей жидкости двигателя, град С увеличится на1
увеличится на 0,103269393 если Температура масла в ГСТхода, трэд С увеличится на1
уменьшится на -1,098472887 если Давление масла в системе смазки двигателя, бар увеличится на1
уменьшится на -0,014851581 если Уровеньтоплива в баке, % увеличится на1
увеличится на 3,399247763 если Текущее положение НК, % увеличится на1
незначим 0,018260637 если Частота вращения вала соломотряса, об/мин увеличится на1
ЗнэнимостьР
значит значим значим значим значим значим значим значим значим значим значим незначим
Рис. 5. Итог расчетов регрессии одной из моделей
Оценена теснота связи между факторами (каждый параметр) и результатом Y (скорость движения) в данной выборке. Анализ тесноты связи представлен в табл. 2.
Таблица 2
Анализ тесноты связи анализируемых показателей
Значение множественного коэффициента корреляции Теснота связи
0 < R < 0,3 Слабая или отсутствует
0,3 < R < 0,7 Связь средняя
0,7 < R < 1 Связь тесная
Множественный коэффициент корреляции R = 0.856954835, т.е. связь между признаками (параметрами), тесная. Оценено качество регрессионной модели: коэффициент детерминации R2 = 0.734371589. При оценке силы связи коэффициентов детерминации используется шкала Чеддока (табл. 3) [7]. Связь высокая, можно судить о значимости регрессионной модели.
В таблице «Дисперсионный анализ» на рис. 5 на пересечении столбца «SS» и строки «Регрессия» находится значение объясненной дисперсии (RSS = 795385.4606), на пересечении столбца «SS» и строки «Остаток» - значение остаточной дисперсии (ESS = 287697.6444), на пересечении столбца «SS» и строки «Итого» - значение общей дисперсии (TSS = 1083083.105).
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
Таблица 3
Анализ силы связи между переменными
Количественная мера тесноты связи Качественная мера тесноты связи
прямой связи обратной связи
от 0 до 0,3 от -0,3 до 0 Очень слабая
от 0,3 до 0,5 от -0,5 до -0,3 Слабая
от 0,5 до 0,7 от -0,7 до -0,5 Средняя
от 0,7 до 0,9 от -0,9 до -0,7 Высокая
от 0,9 до 1 от -1 до -0,9 Очень высокая
Коэффициенты корреляции и детерминации, свидетельствующие о наличии связи между показателями (параметрами), рассчитаны по выборке. Возможно, что обнаруженная взаимосвязь присутствует в данных только этой выборки и не будет характерной для всей генеральной совокупности. Выдвигается нулевая гипотеза, которая утверждает, что для всей генеральной совокупности значение коэффициента детерминации R2 = 0 (следовательно, и коэффициент корреляции R = 0), т.е. между Xi и Y никакой взаимосвязи нет и выявленная взаимосвязь данных - не что иное как продукт случайного сочетания определенных пар значений Xi и Y.
Значимость F (рис. 5) - вероятность выполнения нулевой гипотезы для коэффициента детерминации R2. При этом, если значимость F < 5%, то R2 статистически значим с надежностью 95%. Другими словами, по крайней мере, для 95 выборок из 100 рассчитанные коэффициенты детерминации будут значимо отличны от нуля; если значимость F > 5%, то R статистически незначим с надежностью 95%.
F = 0%, т.е. R и уравнение регрессии в целом статистически значимы с надежностью 95%.
Проведен анализ коэффициентов регрессионной модели. Строка Y-пересечение (рис. 5) содержит все характеристики для анализа свободного члена уравнения регрессии.
Строка с названием фактора (признака) содержит все характеристики для анализа коэффициентов Ь - коэффициента уравнения при рассматриваемом факторе. Ь0 = -3.815795373; Ь1 = 0.014490687; Ь2 = -0.064789374; Ь3 = 0.015690427; Ь4 = -0.056239508; Ь5 = 0.014733428; Ьб = 0.012317364; Ь = -0.098856969; Ь8 = 0.103269393; Ь9 = -1.098472887; Ь10 = -0.014851581; Ь11 = 3.399247763; Ь12 = 0.018260637.
Значения коэффициентов регрессии рассчитаны по данным выборки. Необходимо убедиться, что рассчитанные коэффициенты будут статистически значимы (т.е. отличны от нуля для значительной части выборок из рассматриваемой генеральной совокупности) и войдут в модель.
Для оценки статистической значимости коэффициента регрессии выдвигается нулевая гипотеза о равенстве коэффициентов регрессии нулю. Для коэффициента Ь; математическая форма записи нуль-гипотезы и альтернативной ей гипотезы следующая:
H0: bi = 0 - коэффициент незначим;
H1: bi Ф 0 - коэффициент значимый.
Р-значение (рис. 5) - вероятность выполнения нулевой гипотезы для соответствующего коэффициента:
если Р-значение < 0,05 (5%), то коэффициент статистически значим с надежностью 95% и включается в модель;
если Р-значение > 0,05 (5%), то коэффициент статистически незначим с надежностью 95%.
• Р(0.014490687) = 0% (коэффициент статистически значим);
Vestnik of Omsk SAU, 2022, no. 2(46)
PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
• P(-0.064789374) = 7.7159E-73% (коэффициент статистически значим);
• P(0.015690427) = 6.34269E-65% (коэффициент статистически значим);
• P(-0.056239508) = 7.88119E-21% (коэффициент статистически значим);
• р(0.014733428) = 0.005668308% (коэффициент статистически значим);
• P(0.012317364) = 0.008899171% (коэффициент статистически значим);
• P(-0.098856969) = 0% (коэффициент статистически значим);
• P(0.103269393) = 1.6357E-271% (коэффициент статистически значим);
• p(-1.098472887) = 2.9833E-248% (коэффициент статистически значим);
• P(—0.014851581) = 2.83456E-90% (коэффициент статистически значим);
• P(3.399247763) = 7.3212E-133% (коэффициент статистически значим);
• Р(0.018260637) = 0.201024583% (коэффициент статистически незначим). Уравнение регрессии имеет вид:
Y = -3,815795373 + 0,014490687X1 -0,064789374X2 + 0,015690427X3 - 0,056239508X4 + + 0,014733428X5 + 0,012317364X6- 0,098856969X7 + 0,103269393X8 -1,098472887X9 -
- 0,014851581X10 + 3,399247763X11 По результатам регрессионного анализа построена матрица значимости параметров, наглядно демонстрирующая значимость того или иного параметра в каждой из 13 регрессионных моделей (рис. 6), зеленым цветом обозначены значимые параметры, желтым - незначимые, которые не учитываются в уравнении регрессии.
Рис. 6. Матрица значимости параметров
Для показателей определены значения взаимной корреляции по формуле
кк = ,
где XI, Yi - значения сравниваемых величин параметра; Х, У - математическое ожидание величин; п - число сравниваемых наблюдений;
SX, SY - среднеквадратические отклонения в сопоставляемых рядах.
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
По результатам расчета построена корреляционная матрица (рис. 7) [8; 9].
s s 0 1 1 ё О ЁУ астота вращения коленвала эигателя об^ин о | о § 5 К X II в га* S я 11 зстота вращения вентилятора метки об._мин )стота вращения вала привода !' 0 я* 1 1; II' 1 £' Р s i 1 ¡I i§ ES I s I 1 i с g a. в' ex s о & 1 H ffl 5 i 1 1 c 1 s Щ n s 1 В 5 a 5 g-i ю a> 1 1 1 & ra = 9i n ю a л X 3- X i 1 e V 1 i R 1 a. о г | I i f S
(_> X з- с х ю X о X о X m X - £ i £ & > £ X 8
Скорость движения комбайна, км/ч 1
Частота вращения коленвэла двигателя, об/мин 0,479739 1
Частота вращения молотильного барабана, об/мин -0,10288 0,746894276 1
Частота вращения вентилятора очистки, об/мин -0,10256 0,744490202 0,998205875 1
Частота вращения вала привода очистки, об/мин -0,10178 0,747844436 0,999237435 0,9980593
Частота вращения шнека зернового, об/мин -0,10188 0,747370839 0,999318846 0,9981733 0,999617 1
Частота вращения шнека колосового, об/мин -0,10201 0,747180865 0,999274997 0,9981597 0,999552 0,999657 1
Температураохлаждающей жидкости двигателя, град С 0,069659 0,390130563 0,396339864 0,397134 0,394644 0,394878 0,395002 l
Температура масла в ГСТхода, град С 0,329399 0,46349378 0,302054964 0,2966698 0,296031 0,295712 0,295492 01663413 i
Давление масла в системе смазки двигателя, бар 0,39429 0,821305377 0,576277183 0,574502 0,574923 0,574641 0,574401 0^106239 0,138961 1
Уровень топлива в баке, % -0,02449 -0,055100806 -0,043260101 -0,035038 -0,037025 -0,03799 -0,03848 -0,0349 0,031364 -0,2599 1
Текущее положение НК, % 0,121265 -0,531062912 -0,729982539 -0,727763 -0,730699 -0,73103 -0,73096 -0,13674 -0,17544 -0,38725 -0,04224 1
Частота вращения вала соломотряса, об/мин -0,1018 0,747626377 0,999518882 0,9983643 0,999731 0,99981 0,999764 n,:fiM 0,296089 0,574774 -0,03832 -0,73112 l
Рис. 7. Корреляционная матрица
При оценке силы связи коэффициентов корреляции используется шкала Чеддока.
На рис. 7 видно, что высокой и очень высокой теснотой связи взаимообладают частоты вращения валов и шнеков агрегатов и узлов, а также текущее положение НК, %.
В качестве примера для понимания возможности в дальнейшем построения предсказательных моделей рассмотрим одну из зависимостей. Анализ частот вращения валов и шнеков агрегатов показал, что согласно корреляционному анализу высокой и очень высокой теснотой связи взаимообладают частоты вращения валов и шнеков агрегатов и узлов (рис. 7). По данным параметрам построены кривые распределения частот вращения во времени (рис. 8).
iu i Ti
-4
б арабана, об/мин -ЧВ вентилятора очистки, об/мин
ЧВ вала привода
I L- -ЧВ шнека зернового, об/мин
— ■ -Г 1 -ЧВ вала соломотряса.
1 -ЧВ коленвала двигателя,
_ - Е
h ! 1 F
я s 5 s I я Ssla | Й 3 £ ^ 1 i s; 5 11111 s 3 § я 3 8 g 8 1111 all s 1 s ¡III 4210 42791 1 И III 11 I
Рис. 8. Графики распределения частот вращения валов и шнеков агрегатов во времени (4 ч работы комбайна)
Согласно рис. 8 прослеживается закономерность: графики частот вращения в рассматриваемых агрегатах распределены синхронно при условно нормальном режиме работы. На рис. 9 приведен график за меньший период времени для более подробного рассмотрения момента синхронности.
Vestnik of Omsk SAU, 2022, no. 2(46)
PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
Рис. 9. Графики распределения частот вращения валов и шнеков агрегатов во времени
(12 мин работы комбайна)
На рис. 9 отмечено несколько выраженных периодов работы агрегатов, прослеживается синхронность распределения графиков. Однако для большей наглядности по имеющимся значениям частот вращения рассчитаны коэффициенты синхронности, которые являются отношением частот вращения. Построены графики распределения коэффициентов синхронности (рис. 10), позволяющие визуально определить синхронность и асинхронность в работе валов и шнеков агрегатов.
1 s
Рис. 10. Графики распределения коэффициентов синхронности во времени
По рис. 10: кривые распределения коэффициентов синхронности параллельны, лишь в некоторых точках наблюдаются выбросы. При подробном рассмотрении периодов с выбросами (для примера рис. 11, 12) делаем вывод о всплесках значений при переходе на новый режим работы, т.е. в период остановки или пуска агрегата наблюдается асинхронность в распределении - это критические режимы работы агрегатов.
Рис. 11. Графики распределения коэффициентов синхронности во времени
(3 мин работы)
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
I
\
Рис. 12. Графики распределения коэффициентов синхронности во времени
(10 мин работы)
Результаты исследований
На данном этапе исследования сформулирована гипотеза: тренд отклонения одного из графиков распределения коэффициентов симметрии от нормального положения будет сигнализировать об изменении длины ремня (о растяжении) в конкретном агрегате. Для проверки данной гипотезы и построения предсказательной модели для ремней предполагается проанализировать частоты вращения по комбайнам, в работе которых была зафиксирована данная неисправность, также данные должны содержать сведения по условно нормальным и критическим режимам работы, периоды пуска и остановки оборудования.
Таким образом можно заключить, что электронные опции, интегрированные в бортовую систему современных комбайнов, обеспечивают возможность получать информацию о машине в максимально полном объеме и соответствуют критерию «больших данных» [10]; данные регулярно обновляются, это позволяет выстраивать систему их постоянной обработки и качественного обучения моделей; математическая и статистическая обработка сырых данных позволяет их структурировать, определять степень корреляции между параметрами; на примере режимов эксплуатации динамического оборудования выявлена возможность использования инструментов предиктивной аналитики для достоверного прогнозирования горизонта работоспособности узлов, агрегатов и деталей комбайнов.
Заключение
Предиктивная аналитика для производителей сельскохозяйственной техники, дилеров, лизинговых и страховых компаний, банков и самих сельских товаропроизводителей открывает новые технические и экономические возможности. Заблаговременное предсказание отказов узлов, агрегатов и деталей машин позволяет построить более эффективную логистику, будет способствовать снижению складских запасов, высвобождению оборотного капитала, контролю качества эксплуатации машин, повышению удовлетворенности потребителей качеством техники и уровнем эксплуатационного сервиса.
Список источников
1. Андреев А.В. Теоретические основы надежности технических систем : учебное пособие. СПб. : Изд-во Политехн. ун-та, 2018. 164 с.
2. Замятин А.В. Интеллектуальный анализ данных : учебное пособие / Нац. исслед. Том. гос. ун-та. Томск : Издательский дом Томского государственного университета, 2020. 196 с.
3. Домингос П. Верховный алгоритм. Как машинное обучение изменит наш мир? Москва : Манн, Иванов и Фербер, 2016. 424 с.
References
1. Andreev A.V. Theoretical foundations of reliability of technical systems. St. Petersburg: Publishing House of the Polytechnic University. un-ta, 2018. 164 s.
2. Zamyatin A.V. Intellectual data analysis. National research Volume of the State University. Tomsk: Publishing House of Tomsk State University, 2020. 196 p.
3. Domingos P. Supreme Algorithm. How machine learning will change our world? Moscow: Mann, Ivanov and Ferber, 2016. 424 p.
Vestnik of OmskSAU, 2022, no. 2(46) PROCESSES AND MACHINES OF AGROENGINEERING SYSTEMS
4. Марц Натан Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени / Натан Марц, Джеймс Уоррен. Москва : Вильямс, 2016. 368 с.
5. Майер-Шенбергер В. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим. Москва : Манн, Иванов и Фербер, 2014. 425 c.
6. Лутц М. Программирование на Python. Т. 1. Москва : Символ, 2016. 992 с.
7. Бабенко М.А., Левин М. В. Введение в теорию алгоритмов и структур данных. Москва : МЦНМО. 2020. 144 с.
8. Кулаичев А.П. Методы и средства комплексного анализа данных : учебное пособие. Москва : Форум, 2018. 160 с.;
9. Чашкин Ю.Р. Математическая статистика. Анализ и обработка данных : учебное пособие. Ростов на Дону : Феникс, 2017. 236 с.
10. Платформа агроменеджмента. URL: https://rostselmash.com/agrotronic/. Доступ для зарегистрированных пользователей (дата обращения: 15.03.2022 г.).
4. Martz Nathan Big Data. Principles and practice of building scalable real-time data processing systems. Nathan Martz, James Warren. Moscow: Williams, 2016. 368 p.
5. Mayer-Schoenberger V. Big Data. A revolution that will change the way we live, work and think. Moscow: Mann, Ivanov and Ferber, 2014. 425 p.
6. Lutz M. Programming in Python. Vol. 1. Moscow: Symbol, 2016. 992 p.
7. Babenko M. A., Levin M. V. Introduction to the theory of algorithms and data structures. Moscow: ICNMO. 2020. 144 p.
8. Kulaichev A.P. Methods and means of complex data analysis. Moscow: Forum, 2018. 160 p.
9. Chashkin Y.R. Mathematical statistics. Data analysis and processing. Rostov on Don: Phoenix, 2017. 236 p.
10. Agromanagement platform [Internet]. Available from: https://rostselmash.com/agrotronic/. Access for registered users (date of request: 15.03.2022).
Для цитирования: Помогаев В.М., Редре-ев Г.В., Ревякин П.И., Басакина А.С. Возможности использования данных электронных систем сельскохозяйственных машин для построения предсказательных моделей // Вестник Омского ГАУ. 2022. № 2 (46). С. 153-166. DOI 10.48136/22220364 2022 2 153.
For citation: Pomogaev V.M., Redreev G.V., Revyakin P.I., Basakina A.S. Possibilities of using the data of electronic systems of agricultural machinery for building predictive models. Vestnik of Omsk SA U. 2022;2(46): 153-166, DOI 10.48136/2222-0364_2022_ 2 153.
Информация об авторах
Помогаев Виталий Михайлович, канд. экон. наук, доц., [email protected];
Редреев Григорий Васильевич, д-р техн. наук, доц., [email protected]н;
Ревякин Павел Игоревич, начальник управления информационных технологий, руководитель цифрового ситуационного центра, [email protected];
Басакина Анна Сергеевна, руководитель отдела цифровой трансформации, [email protected].
Статья поступила в редакцию 18.03.2022.
Information about the authors
Pomogaev Vitalij M., Cand. of Econ. Sci., Ass. Prof., [email protected];
Redreev Grigorij V., Doc. of Techn. Sci., Ass. Prof., [email protected];
Revjakin Pavel I., Head of information technology department, Head of Digital Situation Center, pi.revyakin@omgau. org;
Basakina Anna S., Head of Digital Transformation Department, [email protected].
The article was submitted 18.03.2022.