Доломатов М. Ю. Коледин О. С.
Dolomatov Ы. Yu. Ко^т O. S.
доктор химических наук, кандидат аспирант кафедры
технических наук, профессор кафедры «Технология нефти и газа»,
«Технология нефти и газа», ФГБОУВО «Уфимский государственный
ФГБОУ ВО «Уфимский государственный нефтяной технический университет»,
нефтяной технический университет», г. Уфа, Российская Федерация г. Уфа, Российская Федерация
Ковалева Э. А. Kovaleva Е. А.
кандидат химических наук, доцент кафедры «Математика», ФГБОУ ВО «Уфимский государственный нефтяной технический университет», г. Уфа, Российская Федерация
УДК 547.21
Ахтямова К. Р. Akhtyamova К. R.
магистрант кафедры «Технология нефти и газа», ФГБОУ ВО «Уфимский государственный нефтяной технический университет», г. Уфа, Российская Федерация
DOI: 10.17122/1999-5458-2020-16-2-127-133
ПРОГНОЗ ЦЕТАНОВЫХ ЧИСЕЛ АЛКАНОВ ПО ТОПОЛОГИЧЕСКИМ ХАРАКТЕРИСТИКАМ МОЛЕКУЛ
Для прогноза цетанового числа нормальных и замещенных алканов — компонентов дизельных топлив предложена нелинейная многомерная регрессионная модель Quantitative Structure-Property Relationship (QSPR). Объектами исследования стали 27 углеводородов ряда алканов, отбор в базовую и тестовую выборки сделан случайным образом с использованием компьютерной базы данных физико-химических свойств. Модель связывает с цета-новыми числами (ЦЧ) набор дескрипторов — топологических характеристик их молекулярных графов: индекс Рандича, индекс Винера, а также функции собственных значений топологической матрицы молекулы, влияющих на цетановые числа и отражающих основные структурно-химические факторы, такие как разветвленность и протяженность углеродного скелета, и энергетические параметры молекул. Адекватность моделей подтверждена статистической обработкой данных, так коэффициент детерминации модели равен 0.966. Для характеристики качества модели QSPR был вычислен коэффициент множественной корреляции r=0.983, что подтверждает сильную связь предложенных топологических характеристик молекул углеводородов с их ЦЧ. Для оценки статистической достоверности модели была рассчитана и использована корреляционная поправка. Максимальные абсолютная и
относительная ошибка для тестовой выборки ЦЧ составляют 3.26 ед. и 3.96 % соответственно. Статистическим показателем, позволяющим судить об адекватности прогнозируемых значений, об их соответствии справочным данным, является стандартная ошибка регрессии ед. Небольшое значение стандартной ошибки регрессии по сравнению со значениями зависимой переменной подтверждает адекватность предложенной модели. Модель адекватно описывает цетановые числа алканов линейного и разветвлённого строения и может быть использована для прогноза цетановых чисел компонентов дизельных топлив. Предложенная модель может применяться при моделировании и проектировании процессов и аппаратов в химической технологии и нефтехимии.
Ключевые слова: алканы, цетановое число, топологические индексы, собственные значения топологической матрицы, модель QSPR.
PREDICTION OF CETANIC NUMBERS OF ALKANES ON THE TOPOLOGICAL CHARACTERISTICS OF MOLECULES
To predict the cetane number of normal and substituted alkanes, components of diesel fuels, a nonlinear multidimensional regression model of Quantitative Structure-Property Relationship (QSPR) is proposed. The objects of study were 27 hydrocarbons of a number of alkanes, the selection in the base and test samples was made randomly using a computer database of physical and chemical properties. The model associates a set of descriptors with cetane numbers - the topological characteristics of molecular graphs: the Randic index, the Wiener index, and also the functions of the eigenvalues of the topological matrix of the molecule, which affect the cetane numbers and reflect the main structural and chemical factors, such as the branching and length of the carbon skeleton and energy parameters molecules. The adequacy of the models is confirmed by statistical data processing, so the coefficient of determination of the model is 0.966. To characterize the quality of the QSPR model, a multiple correlation coefficient r=0.983 was calculated, which confirms the strong connection of the proposed topological characteristics of hydrocarbon molecules with their central frequency. To assess the statistical reliability of the model, a correlation correction was calculated and used. The maximum absolute and relative error for the test sample of the center frequency is 3.26 units. and 3.96 %, respectively. A statistical indicator that allows us to judge the adequacy of the predicted values, their compliance with the reference data, is the standard regression error, units A small value of the standard regression error in comparison with the values of the dependent variable confirms the adequacy of the proposed model. The model adequately describes the cetane numbers of alkanes of a linear and branched structure and can be used to predict the cetane numbers of components of diesel fuels. The proposed model can be used in modeling and designing processes and apparatuses in chemical technology and petrochemistry.
Key words: alkanes, cetane number, topological indices, eigenvalues of a topological matrix, QSPR model.
В последнее время дизельные двигатели внутреннего сгорания с воспламенением горючей смеси от неизотермического сжатия воздуха получают широкое распространение. В соответствии с теорией горения в результате неизотермического сжатия воздуха в двигателе до 50-85 атм температура повышается до 500-800 °C [1]. В этих условиях топливо окисляется и воспламеняется по закону цепных разветвленных реакций. Чем меньше время индукции процесса самовоспламенения топлива, тем выше КПД двигателя. Характер самовоспламенения топлив в дизельных двигателях выражается цетано-вым числом (ЦЧ).
128-
Electrical and
Согласно ГОСТ 32508-2013, цетановое число (ЦЧ) — показатель воспламеняемости дизельного топлива, численно равный процентному содержанию цетана (н-гексадекана) в смеси с а-метилнафталином. При этом ЦЧ цетана, имеющего малый период задержки самовоспламенения, принимается за 100 единиц, а а-метилнафталина, имеющего большой период, — за 0.
Известны основные способы определения цетановых чисел в лабораторных условиях [2]: по критической степени сжатия, по периоду запаздывания воспламенения и по совпадению вспышек. Во всех случаях для
data processing facilities and systems. № 2, v. 16, 2020
исследовании используются испытательные стенды.
Сложность моторных методов оценки воспламеняемости дизельных топлив привела к необходимости искать зависимость между ЦЧ и физико-химическими константами этих топлив [3]. В настоящее время несмотря на развитие теории горения определить характеристики сложного физико-химического процесса воспламенения от неизотермического сжатия с учетом всех элементарных стадиИ процесса не представляется возможным. Поэтому, как показали исследования последних лет, для прогноза различных ЦЧ и октановых чисел можно эффективно применять модели «структура — свойство» — Quantitative Structure-Property Relationship (QSPR) [4]. Например, известна группа таких моделей [5-7], использующая топологические индексы (ТИ) и структурные параметры молекул для прогнозирования октанового и ЦЧ топлив. Проверка расчетов этих моделей на контрольной выборке показывает, что погрешности в ряде случаев незначительны. Известно, что в гомологических рядах углеводородов ЦЧ изменяются нелинейно с увеличением числа углеродных атомов в молекуле. Это представляет сложность при использовании линейных моделей прогнозировании.
Цель данной работы — разработка адекватной многофакторной нелинейной QSPR модели прогнозирования цетановых чисел для различных углеводородов ряда алканов.
Экспериментальная часть
Известно, что наибольшими цетановыми числами обладают нормальные парафиновые углеводороды, затем следуют парафиновые углеводороды изостроения [1]. При введении боковых парафиновых цепей в молекулы нафтеновых углеводородов и увеличении их термостабильности ЦЧ снижаются. Поэтому для построения полуэмпирической феноменологической модели QSPR нами предположено использовать топологические индексы, которые отражают разветвленность и протяженность углеродного скелета, а также энергетические характеристики молекул.
В качестве характеристики разветвленно-сти и протяженности углеродного скелета молекулы, используем индекс молекулярной связности (индекс Рандича) и индекс Винера соответственно [4]:
1
Р=1
по всем ребрам
\/vv7 '
(1)
где р — индекс Рандича;
г и ] — номера атомов молекулы, формально связанных рассматриваемой связью;
Vг — число ребер графа, отходящих от /-ой вершины;
vj — число ребер графа, отходящих от j-ой вершины.
Г = 0.5 ¿2Х, (2)
где Ж — индекс Винера;
п — число вершин в соответствующем молекуле графе;
dij — кратчайшее расстояние между вершинами г и /
В качестве энергетических характеристик молекул используем сумму квадратов собственных значений топологической матрицы, характеризующей хюккелевский спектр молекулярного графа, примененный ранее для прогнозирования термодинамических свойств, отражающих свободные энергии образования углеводородов [8]:
¿=!>,2, (3)
г=1
где ег — собственное значение молекулярного графа.
В работе [9] был предложен индекс —, который в соответствии с теорией реакционной способности органических соединений [10] отражает возмущение хюккелевского спектра молекул.
Обозначим: q — ЦЧ и представим полуэмпирическую модель QSPR в виде функции:
1
q = ад + — + &2W + &зр + a^L + L
W WL W 2
+ а5 —+ а6-+а7-—+ а8р
р р L
(4)
где аг, (г=0, ..., 8) — коэффициенты модели QSPR, полученные методом наименьших квадратов.
-129
Электротехнические и информационные комплексы и системы. № 2, т. 16, 2020
Таким образом, ЦЧ по модели (4) является функцией от 8 переменных, каждая из которых отражает соответствующий вклад структурного и энергетического параметра.
Объектами исследования для построения модели (обучающая выборка) стали 27 углеводородов, которые входят в состав фракций дизельных топлив. Эти соединения представляют собой алканы линейного и разветвлённого строения (таблица 1). Информация по ЦЧ выбиралась из базы данных [11]. Отбор углеводородов в базовую (экспериментальную, обучающую) и тестовую (контрольную) выборки проводился случайным образом.
В таблице 1 приведены соответствующие индекс Рандича (р), индекс Винера (Ш) и сумма квадратов собственных значений молекулярного графа (Г) для исследуемого ряда 27 углеводородов.
В таблице 2 приведены результаты обработки данных методом наименьших квадра-
Таблица 1. Топологические индексы для алканов
тов и соответствующие значения коэффициентов модели (4).
Обсуждение результатов
Для того чтобы определить, с какой степенью точности регрессионное уравнение (4) аппроксимирует исходные данные, нами был вычислен коэффициент детерминации Я2=0.966. Поскольку Я2 > 0.9, можно утверждать, что модель в целом адекватно позволяет прогнозировать ЦЧ. Для характеристики качества модели QSPR был вычислен коэффициент множественной корреляции г=0.983, подтверждающий сильную связь предложенных топологических характеристик молекул углеводородов с их ЦЧ. Для оценки статистической достоверности модели РБРК использовали корреляционную поправку (среднеквадратическую ошибку коэффициента корреляции):
1-
Vn^T'
(5)
Вещество Формула L W P
Пентан C5H12 8 20 2.414
Гексан C6H14 10 35 2.914
Гептан C7H16 12 56 3.414
Октан C8H18 14 84 3.914
Нонан C9H20 16 120 4.414
Декан C10H22 18 165 4.914
Ундекан C11H24 20 220 5.414
2-метилпентан C6H14 10 32 2.77
2-метилгексан C7H16 12 52 3.27
2-метилгептан C8H18 14 79 3.77
3-метилгептан C8H18 14 76 3.808
4-метилгептан C8H18 14 75 3.808
2,2-диметилгексан C8H18 14 71 3.516
2,3-диметилгексан C8H18 14 70 3.618
2,4-диметилгексан C8H18 14 71 3.664
2,5-диметилгексан C8H18 14 74 3.626
2-метил-3-этилпентан C8H18 14 67 3.719
2-метилоктан C9H20 16 114 4.27
3-метилоктан C9H20 16 110 4.308
4-метилоктан C9H20 16 108 4.308
2-метилнонан C10H22 18 158 4.77
3-метилнонан C10H22 18 153 4.808
4-метилнонан C10H22 18 150 4.808
5-метилнонан C10H22 18 149 4.808
2,2-диметилоктан C10H22 18 146 4.561
2,3-диметилоктан C10H22 18 143 4.681
4,5-диэтилоктан C12H26 22 214 5.794
Таблица 2. Коэффициенты модели (4)
an ao a! а2 а3 а4 а5 а6 а7 а8
an 49.85 -1613.19 394.27 -44.83 -426.61 11.38 1672.71 1136.58 12.50
130-
Electrical and data processing facilities and systems. № 2, v. 16, 2020
где Sr — корреляционная поправка;
г — коэффициент множественной корреляции;
п — число исследуемых соединений. В нашем случае п=27, г=0.983, получаем ¿•, = 0.0066 и для цетанового числа, следовательно, связь нельзя считать случайной, и
Таблица 3. Сравнение справочных и расчетных значений цетановых чисел для алканов
Вещество Формула ЦЧ (спр.), ед. ЦЧ (расч.), ед. Аабс, ед. Аотн, %
Пентан С5Н12 30.00 30.00 0.00 0.00
Гептан С7Н16 56.30 55.26 1.04 1.85
Октан С8Н18 63.80 63.97 0.17 0.27
Нонан С9Н20 73.00 70.62 2.38 3.26
Декан С10Н22 76.90 77.41 0.51 0.66
2-метилгексан С7Н16 35.10 44.54 2.14 5.05
3-метилгептан С8Н18 26.90 24.81 2.09 7.78
2,2-диметилгексан С8Н18 42.40 33.33 2.23 7.17
2-метил-3-этилпентан С8Н18 12.90 50.04 1.34 2.76
3-метилоктан С9Н20 35.40 32.55 2.85 8.06
4-метилоктан С9Н20 35.40 56.19 1.99 3.66
3-метилнонан С10Н22 42.60 41.52 1.08 2.53
4-метилнонан С10Н22 42.60 39.53 3.07 7.21
5-метилнонан С10Н22 42.60 38.53 0.73 1.94
2,2-диметилоктан С10Н22 37.80 38.50 0.10 0.26
2,3-диметилоктан С10Н22 38.60 79.33 1.77 2.19
4,5-диэтилоктан С12Н26 20.00 20.08 0.08 0.39
Небольшое значение стандартной ошибки регрессии по сравнению со значениями зависимой переменной подтверждает адекватность предложенной модели (4).
Прогноз для веществ, не входящих в базовый ряд, представлен контрольной выборкой в таблице 4.
Из таблицы 4 следует, что абсолютные ошибки для контрольной выборки находятся в интервале 0.19 < Дабс < 3.26 ед, относительные — в интервале 0.28 < Аотн < 3.96. Это означает, что модель (4) позволяет осуществлять прогноз цетановых чисел углеводородов ряда алканов, входящих в состав дизельных фракций нефти.
Таблица 4. Сравнение справочных и расчетных значений цетановых чисел для алканов, не входящих в базовый ряд
Вещество Формула ЦЧ (спр.), ед. ЦЧ (расч), ед. Аабс, ед. Аотн, %
3-этилдекан С12Н26 47.00 48.13 1.13 2.40
4-пропилдекан С13Н28 39.50 37.93 1.57 3.96
7-бутилтридекан С17Н36 70.00 69.57 0.43 0.62
9-метилгептадекан С18Н38 66.00 66.19 0.19 0.28
2,4-диметилпентан с7н16 29.00 27.92 1.08 3.73
Додекан С12Н26 87.60 84.34 3.26 3.73
Тридекан С13Н28 90.00 92.78 2.78 3.09
2,6-диметилгептан С9Н20 32.60 33.30 0.70 2.14
линия регрессии проходит через центр облака исходных точек.
В таблице 3 приведено сравнение справочных [12] и рассчитанных значений ЦЧ алканов, а также абсолютная и относительная погрешности.
Статистическим показателем, позволяющим судить об адекватности прогнозируемых значений, об их соответствии справочным данным, является стандартная ошибка регрессии, определяемая по формуле:
, 2
^ге^еввюп _ А " ^ 1 ' (6)
|Х(дса1с.-дГе£.) п-к-1
где — справочное значение цетанового числа;
Яса1с — расчетное (полученное в результате прогноза) значение переменной; п — число наблюдений (алканов); к — число членов уравнения регрессии. В нашем случае '^гегге^оп=3.64 ед.
Вывод
Получена полуэмпирическая нелинейная многофакторная регрессионная модель «структура — свойство», которая позволяет адекватно прогнозировать цетановые числа основных компонентов дизельных топлив от топологических параметров молекул.
Предложенные топологические параметры отражают разветвленность, протяженность углеродного скелета и энергетические параметры молекул.
Адекватность моделей подтверждена статистической обработкой данных, так коэффициент детерминации модели равен 0.966.
Список литературы
1. Емельянов В.Е., Скворцов В.Н. Моторные топлива: антидетонационные свойства и воспламеняемость. М.: Техника, Тума Групп, 2006. 192 с.
2. Ахметов С.А. Технология глубокой переработки нефти и газа. Уфа: Гилем, 2002. 672 с.
3. Копыльцова А.Б., Тарасов Б.П., Клим О.В. Современная практика и проблемы применения промышленных и лабораторных спетрофотометрических анализаторов физико-химических свойств нефти и нефтепродуктов // Измерительная техника. 2013. № 6. С. 51-55.
4. Станкевич М.И., Станкевич И.В., Зефиров Н.С. Топологические индексы в органической химии // Успехи химии. 1988. Т. 57. № 3. С. 337-366.
5. Смоленский Е.А., Бавыкин В.М., Рыжов А.Н., Словохотова О.Л., Чуваева И.В., Лапидус А.Л. Расчеты цетановых чисел углеводородов с помощью оптимальных топологических индексов // Изв. АН. Сер. хим. 2008. № 3. С. 451-457.
6. Лапидус А.Л., Бавыкин В.М., Смоленский Е.А., Чуваева И.В. Зависимость цетановых чисел углеводородов от строения молекул // Доклады академии наук. 2008. Т. 420. № 6. С. 771-776.
7. Лапидус А.Л., Смоленский Е.А., Ба-выкин В.М., Мышенкова Т.Н., Кондратьев Л.Т. Модели для расчета и прогнозирования октановых и цетановых чисел индивидуальных углеводородов // Нефтехимия. 2008. Т. 48. № 4. С. 277-286.
Максимальные абсолютная и относительная ошибки для тестовой выборки ЦЧ составляют 3.26 ед. и 3.96 % соответственно. Разработанная модель может быть использована при проведении инженерных и научных прогнозов цетановых чисел различных алка-нов, компонентов дизельного топлива.
э
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-38-90085 «Прогнозирование физико-химических свойств углеводородных и гетероатомных компонентов нефтяных систем и моторных топлив».
8. Доломатов М.Ю., Аубекеров Т.М. Взаимосвязь стандартной энтальпии и энтропии образования и топологических характеристик структуры предельных углеводородов // Журнал физической химии. 2018. Т. 92. № 3. С. 355-361.
9. Доломатов М.Ю., Коледин О.С., Ковалева Э.А., Арсланбекова С.А. Прогноз октановых чисел замещенных алканов по топологическим характеристикам молекул // Бутлеровские сообщения. 2019. Т. 59. № 7. С. 69-75.
10. Дьюар М., Догерти Р. Теория возмущений молекулярных орбиталей в органической химии. М.: Мир, 1977. 695 с.
11. Свид. 201862459 Российская Федерация. Свидетельство об официальной регистрации базы данных для ЭВМ. База данных физико-химических свойств органических соединений / М.Ю. Доломатов, Т.И. Павлов, Т.М. Аубекеров; заявитель и правообладатель ФГБОУ ВО УГНТУ (RU). № 201762 0709/69; заявл. 05.06.2017; опубл. 21.03.2018.
12. Лапидус А.Л., Бавыкин В.М., Смоленский Е.А., Чуваева И.В. Зависимость цетановых чисел углеводородов от строения молекул // Доклады академии наук. 2008. Т. 420. № 6. С. 771-776.
References
1. Emel'yanov V.E., Skvortsov V.N. Motor-nye topliva: antidetonatsionnye svoistva i vosplamenyaemost' [Motor Fuels: Antiknock Properties and Flammability]. Moscow, Tekh-nika Publ., Tuma Grupp, 2006. 192 p. [in Russian].
Electrical and data processing facilities and systems. № 2, v. 16, 2020
2. Akhmetov S.A. Tekhnologiya glubokoi pererabotki nefti i gaza [Technology of Deep Processing of Oil and Gas]. Ufa, Gilem Publ., 2002. 672 p. [in Russian].
3. Kopyl'tsova A.B., Tarasov B.P., Klim O.V. Sovremennaya praktika i problemy primeneniya promyshlennykh i laboratornykh spetrofoto-metricheskikh analizatorov fiziko-khimi-cheskikh svoistv nefti i nefteproduktov [Modern Practice and Problems of Using Industrial and Laboratory Spectrophotometric Analyzers of the Physicochemical Properties of Oil and Oil Products]. Izmeritel'naya tekhnika — Measuring Technique, 2013, No. 6, pp. 51-55. [in Russian].
4. Stankevich M.I., Stankevich I.V., Zefi-rov N.S. Topologicheskie indeksy v organi-cheskoi khimii [Topological Indices in Organic Chemistry]. Uspekhi khimii — Advances in Chemistry, 1988, Vol. 57, No. 3, pp. 337-366. [in Russian].
5. Smolenskii E.A., Bavykin V.M., Ry-zhov A.N., Slovokhotova O.L., Chuvaeva I.V., Lapidus A.L. Raschety tsetanovykh chisel uglevodorodov s pomoshch'yu optimal'nykh topologicheskikh indeksov [Calculations of Cetane Numbers of Hydrocarbons Using Optimal Topological Indices]. Izv. AN. Ser. khim. — Izv. AN Ser. Chem., 2008, No. 3, pp. 451-457. [in Russian].
6. Lapidus A.L., Bavykin V.M., Smolenskii E.A., Chuvaeva I.V. Zavisimost' tsetanovykh chisel uglevodorodov ot stroeniya molekul [Dependence of Cetane Numbers of Hydrocarbons on the Structure of Molecules]. Doklady akademii nauk — Reports of the Academy of Sciences, 2008. T. 420. № 6. S. 771-776. [in Russian].
7. Lapidus A.L., Smolenskii E.A., Bavykin V.M., Myshenkova T.N., Kondrat'ev L.T. Modeli dlya rascheta i prognozirovaniya oktanovykh i tsetanovykh chisel individual'nykh uglevodorodov [Models for Calculating and
Predicting Octane and Cetane Numbers of Individual Hydrocarbons]. Neftekhimiya — Petrochemistry, 2008, Vol. 48, No. 4, pp. 277286. [in Russian].
8. Dolomatov M.Yu., Aubekerov T.M. Vzaimosvyaz' standartnoi ental'pii i entropii obrazovaniya i topologicheskikh kharakteristik struktury predel'nykh uglevodorodov [The Relationship of the Standard Enthalpy and Entropy of Formation and Topological Characteristics of the Structure of Saturated Hydrocarbons]. Zhurnalfizicheskoi khimii — Journal of Physical Chemistry, 2018, Vol. 92, No. 3, pp. 355-361. [in Russian].
9. Dolomatov M.Yu., Koledin O.S., Kova-leva E.A., Arslanbekova S.A. Prognoz okta-novykh chisel zameshchennykh alkanov po topologicheskim kharakteristikam molekul [Forecast of Octane Numbers of Substituted Alkanes according to the Topological Characteristics of Molecules]. Butlerovskie soob-shcheniya — Butlerov Communications, 2019, Vol. 59, No. 7, pp. 69-75. [in Russian].
10. D'yuar M., Dogerti R. Teoriya vozmu-shchenii molekulyarnykh orbitalei v organicheskoi khimii [Theory of Perturbations of Molecular Orbitals in Organic Chemistry]. Moscow, Mir Publ., 1977. 695 p. [in Russian].
11. Dolomatov M.Yu., Pavlov T.I., Aubekerov T.M. Svidetel'stvo 201862459. Baza dannykh fiziko-khimicheskikh svoistv organicheskikh soedinenii [Database of Physicochemical Properties of Organic Compounds]. No. 2017620709/69, 2018. [in Russian].
12. Lapidus A.L., Bavykin V.M., Smolenskii E.A., Chuvaeva I.V. Zavisimost' tsetanovykh chisel uglevodorodov ot stroeniya molekul [The Dependence of Cetane Numbers of Hydrocarbons on the Structure of Molecules]. Doklady akademii nauk — Reports of the Academy of Sciences, 2008, Vol. 420, No. 6, pp. 771-776. [in Russian].