УДК 665.753.4
Р. Г. Романова, Р. Р. Ситдиков
МНОГОФАКТОРНЫЕ МОДЕЛИ ДЛЯ ОПРЕДЕЛЕНИЯ ОКТАНОВОГО ЧИСЛА БЕНЗИНОВ
Ключевые слова: многомерное моделирование, множественная линейная регрессия (МЛР), проекция на латентные структуры (ПЛС), бензин, октановое число, спектральные характеристики, физико-химические показатели.
Методами множественной линейной регрессии (МЛР) и проекции на латентные структуры (ПЛС) получены калибровочные модели для определения октанового числа бензинов. В основу моделей положены физико-химические свойства бензинов и их спектральные характеристики в области 850-95 нм. Проведена валидация моделей с использованием тестовых и стандартных образцов бензинов.
Keywords: multidimensional modeling, multiple linear regression (MLR), projection on latent structures (PLS), gasoline, octane number, spectral characteristics, physicochemical.
The calibration models for determining the octane number of gasoline have been obtained by the methods of MLR and PLS . The models are based on the physico-chemical properties of gasolines and their spectral characteristics in the 850-950 nm region. The models were validated using test and standard gasoline samples.
Важнейшей характеристикой бензина, определяющей его эксплуатационные показатели, является значение октанового числа. Октановое число представляет собой сложное свойство, которое зависит от количественного содержания углеводородов различного строения: алканов, изоалканов, ароматических, кислородсодержащих соединений и др. [1-4]. Учитывая, что в состав бензинов входит более 300 различных углеводородов [1,4], можно утверждать, что невозможно найти прямую функциональную зависимость между значением октанового числа и содержанием какого-либо компонента или свойством бензина.
Измерение величины октанового числа бензинов стандартизованным методом [5-6] проводят с использованием установки типа УИТ-65, УИТ -85. или др., имитирующей двигатель автомобиля. Установка состоит из стационарного одноцилиндрового поршневого двигателя внутреннего сгорания с переменной степенью сжатия, двухскоростного синхронного электромотора с переключателем скоростей, пульта управления с контрольно-измерительными приборами и вспомогательным оборудованием, смонтированном на общей фундаментной плите.
Определение октанового числа бензинов указанным моторным методом имеет ряд недостатков: громоздкость установок, значительная длительность подготовительного периода, необходимость большого количества расходных материалов, таких как эталонный н-гептан и изооктан.
В связи с этим, поиск альтернативных ме-
тодов определения октанового числа бензинов является в настоящее время актуальным и практически востребованным как потребителями, так и производителями бензинов.
Одним из перспективных методов оценки эксплуатационных качеств бензина представляется многомерное моделирование, позволяющее с помощью множества экспериментально измеренных значений параметров определить искомое значение отклика [7-10].
Целью настоящего исследования являлась разработка многомерных калибровочных моделей для определения значения октанового числа с использо-
ванием данных молекулярно-абсорбционной спектроскопии и физико-химических свойств бензинов.
Объектами исследования являлись образцы бензинов из разных компаний поставщиков, различных марок с октановыми числами от 92 до 98 о.е.. Общее количество образцов составило 41, при этом для создания калибровочной зависимости было использовано 33 образца, 5 образцов составили тестовый набор, предназначенный для определения погрешности модели.
Для проверки точности калибровочных моделей были использованы три стандартных образца состава и свойств автомобильного бензина, разработанные ЗАО «Сибтехнология» (г. Тюмень).
С применением стандартизованных методов для всех образцов были определены значения октанового числа по исследовательскому методу, а также физико-химические характеристики:
плотность, концентрация смол, серы, фракционный состав.
Спектры поглощения бензинов снимали в диапазоне от 700 нм до 1020 нм с шагом 0.2 нм на спектрофотометре марки «В-1200 спектрофотометр ECOVEIW». Пределы допускаемой абсолютной погрешности спектрофотометра при измерении коэффициентов пропускания составляет ±0,5%; в спектральном диапазоне от 400 до 800 нм, а в остальном спектральном диапазоне ±1,0% .
Обработку статистических данных проводили с использованием пакета программ «STATISTICA 10» и персонального компьютера.
На рисунке 1 приведены спектры типичных образцов, отличающихся значениями октанового числа, измеренного исследовательским методом. Как видно из рисунка, в области 820-980 нм спектры бензинов различаются, причем наиболее сильные отличия наблюдаются при 920 и 950 нм. Очевидно, что в рассмотренной области спектра, несмотря на то, что спектральные данные отражают состав бензина, невозможно выявить прямой зависимости между значением оптической плотности при определенной длине волны и величиной октанового числа. Применение многофакторных моделей, включающих все множество спектральных данных позволяет выявить эту связь.
0,35
0,25 \ \ Образец №;1,
ОЧИ 92
;s Образец №23,
* 02 ОЧИ 98
1 \ \ Образец№;7,
* ОЧИ %
j 0,15
0 0,1
0,05
80 0 820 840 860 880 900 920 940 960
Длина волны (nm)
Рис. 1 - Спектры поглощения различных марок
бензинов
В основе многомерного моделирования лежит получение регрессионной зависимости между экспериментальными значениями матриц X и Y, или, иначе говоря, проведение многомерной калибровки [7]. Матрица Yсостоит из зависимых переменных, откликов, а матрица Х - из независимых переменных, называемых предикторами. Существует два альтернативных метода создания многофакторных моделей (рис.2): метод множественной линейной регрессии (МЛР) и проекция на латентные структуры (ПЛС).
торного анализа. Данный анализ поможет выделить наиболее коррелируемые длины волн с октановым числом для последующего построения регрессионной модели.
Для проведения факторного анализа все данные спектральных характеристик были внесены в таблицу исходных данных в программе «STATISTICA 10». Переменной являлось значение оптической плотности при 850 - 950 нм, так как именно в этой области наблюдались наиболее существенные различия в спектрах поглощения. Общее количество переменных составило 502. В результате факторного анализа были выделены длины волн, которые наиболее тесно связаны с величиной октанового числа. В первом факторе выделилась спектральная область в диапазоне 882878 нм, при этом наибольшие нагрузки соответствуют 882 нм, 881 нм, 878 нм (рис.3). Во втором факторе выделился диапазон от 938-934 нм, наибольшая нагрузка соответствует длине волны равной 934 нм. В третьем факторе выделился диапазон от 909-904 нм, наибольшие нагрузки соответствуют длинам волн равным 909 нм, 904 нм.
Как следует из рисунка 3, на графике счетов эти группы длин волн находятся в разных областях по отношению к показателю октанового числа. Можно предположить, что выделенные группы отражают разные классы углеводородов: алканов, изоалканов и ароматических углеводородов.
Projection of the variables on the factor-plane ( 1 x 2)
Рис. 2 - Основные этапы разработки многофакторных калибровочных моделей
-0,5 0,0 0,5
Factor 1 : 45,51%
Projection of the cases on the factor-plane ( 1 x 2) Cases with sum of cosine square >= 0,00
6 о
25 19 321
• о 31 ^10 О
15 О 28 О 2411 о О 5 3 2 о 3
126 27 \ 0 о 30 224 9 18 о ,/
CP 1« 4 -.... о 21 29 о 23 33 о у
о 20 о
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5
Factor 1: 45,51% ° Active
При получении модели методом множественной регрессии первым этапом является проведение фак-
Рис. 3 - Графики счетов и нагрузок для факторов 1 и 2
1,0
0,5
0,0
-0,5
-1,0
-1,0
1,0
5
4
3
2
0
-1
Анализ графика нагрузок (рис.3) показывает, что образцы №16, №17, №26, №15, № 20, и №6 отличаются от общей массы расположения образцов. Возможно, они являются выбросами, и их будет необходимо в дальнейшем исключить.
Показателем степени подгонки модели к данным является значение коэффициента детерминации R2. При построении множественной регрессионной модели стремятся достичь высокого коэффициента детерминации. Применив метод главных компонент, основываясь на графике счетов можно построить регрессионную модель, используя разные комбинации образцов с последующим исключением некоторых из них, для достижения наибольшей регрессионной корреляции.
Стандартное отклонение (СКО) для оценки уравнения регрессии является показателем качества аппроксимации результатов наблюдений. СКО интерпретируется как дисперсия остатков, представляющая ошибку измерения, с которой любое измеренное значение Y предсказывается для данного значения X по известному уравнению (если уравнение регрессии оценивается из неопределенно большого числа наблюдений). При поиске лучшей модели необходимо минимизировать СКО.
Таблица 1 - Характеристики многомерных моделей
Модель № Метод анализа Число образцов Характеристики модели Примечания
R2 СКО калиб-либ-ровки
1 МЛР 33 0,91 0,58 -
2 МЛР 32 0,84 0,78 Исключен образец №16
3 МЛР 32 0,92 0,57 Исключен образец №6
4 МЛР 32 0,91 0,57 Исключен образец №26
5 МЛР 32 0,91 0,58 Исключен образец №17
6 МЛР 30 0,84 0,76 Исключены образцы №6, №15, №16
7 МЛР 32 0,92 0,57 Исключен образец №15
8 МЛР 27 0,94 0,49 Исключены образцы №6, №15-17, №2021, №26,
9 ПЛС* 33 0.99 0.10 -
10 ПЛС 33 0.99 0.17 -
* - кроме спектральных данных, включены физико-химические характеристики бензинов
В таблице 1 приведены характеристики разработанных многомерных моделей, разработанных с применением методов МЛР и ПЛС.
Из данных таблицы 1 видно, что для моделей, созданных методом МЛР, наилучшими характеристиками и минимальной погрешностью градуировки обладают модели №№ 3,7,8. В дальнейшем были рассмотрены модели №№7,8. Итоговое уравнение регрессии для модели №7 будет иметь вид:
ОЧИ=91,99+293,3ХА(904)+990,0ХА(878)-73,96хА(934)-126,6хА(909)-2992(А881)
Модель №8 будет описываться следующим уравнением:
ОЧИ=88,83+373,6хА(904)+3859хА(882)-56,98хА(934)-176,6хА(909)-9851(А881)
где А(904), А(878) и т.д. - значения оптической плотности при соответствующей длине волны. Следующим этапом после получения модели является валидация модели (рис.1).
Оценку работоспособности модели можно проводить несколькими методами: перекрестной проверкой, проверкой с помощью тестовых и стандартных образцов.
С целью определения характеристик прецизионности и точности МЛР-модели были проверены с помощью тестовых и стандартных образцов бензинов. Результаты определения значений октановых чисел с использованием моделей №7 и №8 приведены в таблице 2, из данных которой можно сделать заключение о том, что, несмотря на более высокий коэффициент детерминации модель №8 показала результаты предсказания хуже, чем модель №7.
Следует отметить, что все построенные методом МЛР калибровочные регрессионные модели недостаточно эффективны. Причин этому может быть две: во-первых, такое может случиться, если число переменных больше чем число образцов, взятых для калибровки. Второй причиной может быть сильная коллинеарность между зависимой переменной и предикторами.
С целью охвата большего числа данных и получения удовлетворительной модели в дальнейшем был проведен ПЛС - анализ. Проекции на латентные структуры, или ПЛС регрессия, является альтернативой методу множественной регрессии. ПЛС регрессия выделяет небольшое количество латентных переменных, в пространстве которых связь между зависимой переменной и предикторами достигает максимального значения.
Исходная матрица данных, по которой строится PLS модель, состоит из 33 образцов, для которых имеются данные по физико-химическим характеристикам и значениям оптических плотностей при 502 длинах волн. Количество образцов, необходимых для калибровки многомерной модели, зависит от сложности анализируемых образцов. Если анализируемые образцы содержат только несколько компонентов, концентрации которых различаются, тогда будет небольшое количество спектральных переменных, и для определения взаимозависимости
между переменными и концентрациями или свойств будет достаточно небольшого количество спектральных переменных, и для определения взаимозависимости между переменными и концентрациями или свойствами будет достаточно сравнительно небольшого калибровочного ряда. Если в анализируемом образце различается большее количество компонентов, тогда для разработки модели потребуется большее число калибровочных образцов. Определить достаточен или нет ряд калибровочных образцов можно только после создания модели [10].
С использованием ПЛС - анализа были получены модели №9 и №10. В модели № 9 в качестве
предикторов были взяты физико-химические характеристики: плотность, концентрация смол, серы, фракционный состав (доля фракции, отгоняемой при температуре 70, 100 и 150 0С) а также спектральные характеристики 33 образцов бензина. В модель №10 были заложены только спектральные характеристики.
По результатам моделирования получено, что в модели №9 данные описываются 19, а в модели №10 - 17 латентными переменными. При этом для описания 99,9 % характеристик октанового числа используется 100 % спектральных данных.
Таблица 2 - Результаты определения октанового числа тестовых и стандартных образцов бензинов с использованием МЛР-моделей
Номер образца Модель №7, ОЧИ, о. ед Модель №8, ОЧИ, о. ед.
измерено получено СКО прогноза измерено получено СКО прогноза
34 93.2 93,4 1,7 93.2 91,7 3,7
35 96.1 96,0 96.1 90,1
36 92.4 92,6 92.4 95,6
37 93.6 93,5 93.6 91,4
38 96.0 99,9 96.0 100,9
39* 93,4 94,2 1,1 93,4 97,0 2,8
40* 95,5 97,1 95,5 97,8
41* 98,4 98,8 98,4 101,0
*- стандартные образцы бензинов
На рисунке 4 приведены результаты перекрестной проверки моделей.
а
б
Рис. 4 - Зависимость между измеренными и полученными с использованием модели №9 (а) и №10 (б) значениями октанового числа.
Кросс-валидация, или перекрестная проверка предполагает поочередное исключение из модели одного образца и создание новой модели из оставшихся образцов. Далее, характеристики Х исключенного образца вводятся в программу и вычисляется параметр Y. Как видно из рисунка, калибровка характеризуется высоким коэффициентом детерминации, близким к единице. Вычисленные значения СКО градуировки для модели №9 и №10 составили 0,10 и 0,17 о.ед. соответственно.
Валидация моделей была проведена также с помощью тестовых и стандартных образцов бензинов. Результаты определения октанового числа бензинов с использованием ПЛС - моделей приведены в таблице 3, из которой видно, что СКО прогноза октанового числа тестовых образцов для модели № 10 составило 1,0 о.ед., а СКО прогноза ОЧИ стандартных образцов для моделей №9 и №10 составило 0,39 и 1,0 соответственно. Следует отметить, что прогностические характеристики ПЛС-моделей существенно улучшились по сравнению с аналогичными МЛР -моделями. Полученное значение можно сравнить со стандартным отклонением повторяемости сравнительного метода.
Таблица 3 - Результаты определения октанового числа тестовых и стандартных образцов бензинов с использованием ПЛС-моделей
Номер образца Модель №9, ОЧИ, о. ед Модель №10 ОЧИ, о. ед.
измерено получено СКО прогноза измерено получено СКО прогноза
34 - - - 93.2 92,4 1,0
35 - - 96.1 95,9
36 - - 92.4 94,3
37 - - 93.6 94,6
38 - - 96.0 96,4
39* 93,4 93,5 0,39 93,4 94,3 1,0
40* 95,5 95,2 95,5 95,0
41* 98,4 99,0 98,4 99,8
В соответствии с нормативными документами [6] при определении октанового числа по исследовательскому методу предел сходимости составляет 0,5 о. ед., а предел воспроизводимости равен 1,0
0.ед.. Стандартное отклонение прогноза при ПЛС моделировании входит в границы пределов сходимости и воспроизводимости сравнительного метода. ПЛС-модель, включающая совокупность физико-химических и спектральных характеристик, обладает лучшими прогностическими свойствами.
Литература
1. Гуреев, А.А. Применение автомобильных бензинов / А.А. Гуреев - М.: Химия, 1972. - 368 с.
2. Кириченко Н.Б. Автомобильные эксплуатационные материалы. - М.: Издательский центр "Академия", 2003. - 208 с.
3. Школьникова В.М. Топлива, смазочные материалы, технические жидкости. Ассортимент и применение , М.: Техинформ, 1999. - 596 с.
4. Гуреев А.А., Азев В.С., Автомобильные бензины. Свойства и применение. Учебное пособие для вузов. — М.: Нефть и газ, 1996. — 444 с., с.-5.
5. ГОСТ Р 52946-2008 (ЕН ИСО 5163:2005) «Нефтепродукты. Определение детонационных характеристик моторных и авиационных топлив. Моторный метод».
6. ГОСТ 8226-2015 Топливо для двигателей. Исследовательский метод определения октанового числа
7. Эсбенсен К. Анализ многомерных данных, сокр. пер. с англ. под ред. / К. Эсбенсен, О. Родионовой. - И ПХФ РАН. 2005.
8. Pomerantsev A. L. Confidence Intervals for Non-linear Regression Extrapolation. / A. L. Pomerantsev // Chemom. Intell. Lab. Syst., №49, 1999. С. 41.
9. Rodionova O.Ye. Application of SIC (Simple Interval Calculation) for object status classification and outlier detection - comparison with PLS/PCR. O.Ye. Rodionova / K.H. Esbensen // A.L. Pomerantsev // J. Chemom., 18. 2004. C. 402.
10. Халафян A.A.STATISTICA 6. Статистический анализ данных. 3 - е изд. Учебник - М.: ООО «Бином - Пресс», 2007 . - 512 с.
© Р. Г. Романова, канд. хим. наук, доцент кафедры аналитической химии, сертификации и менеджмента качества КНИТУ, romanova_rg@mail.ru; Р. Р. Ситдиков, магистр той же кафедры.
© R. G. Romanova, candidate of chemical Sciences, associate Professor of the Department of Analytical Chemistry, Certification and Quality Managemen of KNRTU, romanova_rg@mail.ru; R. R. Sitdikov, Master's student, department of Analytical Chemistry, Certification and Quality Management, KNRTU.