удк 544.18
И. В. Вакулин, Р. Р. Сырлыбаева, Р. Ф. Талипов
Использование принципа аддитивности для повышения эффективности квантово химического моделирования
Башкирский государственный университет 450074, Уфа, Фрунзе, 32; тел.: (3472) 22-61-05
По аналогии с процедурой G2 рассмотрены различные варианты комбинированного расчета полной энергии, соответствующие прямому расчету в приближении MP4/6-311+G(fd,p)//MP2/6-31G(d,p). Схемы опробованы на тестовом наборе из 65 органических молекул и интермедиатов, не содержащих неспаренные электроны. Для наиболее точного варианта, в котором самым сложным является расчет в приближении MP2/6-311+G(fd,p)//MP2/6-31G(d,p), среднее абсолютное отклонение расчета полной энергии относительно данных прямого расчета составляет 2,6 кДж/моль, а наибольшее максимальное отклонение 12,9 кДж/моль. Предлагаемый способ позволяет сократить время расчета до 10 раз. Ключевые слова: комбинированные методы расчета, расчет полной энергии, неэмпирические методы.
Введение
Основным способом повышения точности расчетов является усложнение используемого приближения *. Однако при этом значительно возрастают затраты машинных ресурсов и времени. Одним из способов преодоления указанных недостатков является использование комбинированных методов расчета (КМР) 2. В этом случае для нахождения энергетических параметров с химической точностью вместо одного расчета осуществляется серия расчетов, но в существенно более простых приближениях. Этот подход является основой метода «Gaussian theory», предложенного Поплом в различных вариантах G13 3 4, G2 5, G2(MP2) 6, G2(MP2,SVP) 7, и метода «Complete Basis Set» (CBS), предложенного Петерссоном также в нескольких модификациях - CBS-4, CBS-Q, CBS-APNO 8, CBS-q 9, CBS-Q//B3. Например, метод G2(MP2) с использованием данных расчетов полной энергии в более простых приближениях QCISD(T)/6-311G(d,p)//MP2/6-31G(d) и MP2/6-311+G(3df,2p)//MP2/ 6-31G(d) позволяет получить результат аналогичный расчету в приближении QCISD(T)/ 6-311+G(3df,2p)// MP2/6-31G(d). При этом в методе G2(MP2) расчет QCISD(T)/6-311G(d,p)//MP2/6-31G(d) является самым сложным и малодоступным для исследования сложных моделей, Дата поступления 06.12.05
так как даже в этом случае вычислительные затраты определяются как степенная функция от размеров системы со степенью 7.
Очевидно, что для изучения сложных молекул с большим количеством тяжелых атомов требуется дальнейшее усовершенствование КМР. Поэтому целью данной работы стало создание КМР, позволяющего исследовать органические соединения и интермедиаты содержащие более 10 тяжелых атомов 2 и 3 периодов.
Методика проведения расчетов
В качестве КМР нами предложено три варианта, соответствующих прямому расчету полной энергии в приближении МР4/6-
з11+аш,р)//мР2/в-з1а(а,р).
МР4Л(+\311 Е[МР4/6-311+ОДр)] =
= Е[МР4/6-31Ю(а,р)] + Л (+0 + А Л(+^ = Б[МР2/6-3110+(£а,р)] -
- Б[МР2/6-31Ю(а,р)],
где БЕ( + ,0 инкремент, учитывающий расширение базисного набора для тяжелых атомов за счет дополнительной поляризационной функции { и диффузной функции.
МР4Л(+)Л®6-31 Е[МР4/6-311+С(£а,р)]=
= Е[МР4/6-311С(а,р)]+ Л (+)+Л (0+ +А Л (+) =Б[МР2/6-31+С(а,р)] -
- Б[МР2/6-31С(а,р))
Л (£)=Б[МР2/6-31С(£а,р)] -
- Б[МР2/6-31С(а,р)],
где БЕ(+) инкремент, учитывающий расширение базисного набора за счет дополнительной диффузной функции, БЕ(0 — инкремент, учитывающий расширение базисного набора за счет дополнительной поляризационной функции £.
МР4Л (+\31 Е[МР4/6-311+0(£а,р)] =
= Е[МР4/6-31Ю(а,р)]+ Л (+£) +А Л (+,0=Е[МР2/6-31О+(£а,р)] -- Б[МР2/6-3Ю(а,р)],
где БЕ(+0 — инкремент, учитывающий расширение базисного набора для тяжелых атомов за счет дополнительной поляризационной функции { и диффузной функции.
С целью повышения точности расчетов полной энергии по указанным схемам, нами использовался эмпирический инкремент А, определяемый как функция погрешности от числа электронов.
Таблица 1
Набор модельных соединении
Углеводороды СЫ4, С9Ы6, СЫ3СЫ2СЫ3, С9Н4, СЫ3СЫСЫ2, С9Н9, СзЫ6
Кислородсодержащие СН20, СЫ3СЫО, СЫ3СЫ2СЫО, СЫ3СОСЫ3, СЫ3ОЫ, СЫ3СЫ2ОЫ, СЫ3СЫ2СЫ20Ы, СЫ3СЫОЫСЫ3, ЫСООЫ, СЫ3СООЫ, СЫ3СЫ2СООЫ, СЫ3ОСЫ3, ЫСООСЫ3, СЫ3СООСЫ3, СЫ2СЫ2О, СЫ2СЫ2СЫ2О, (СЫ2)4О, СЫ2СЫ2ОСЫ2О
Азотсодержащие СЫ3Ш2, СЫ3СЫ2КЫ2, СЫ3КЫСЫ3, СЫ2ОКЫ2,СЫ3СОКЫ2, СЫ2СЫ2КЫ, СЫ2СЫ2СЫ2КЫ, (СЫ2)4Ш
Фторсодержащие СЫ3Р, СЫ2Р2, СЫР3, СР4, СЫ3СЫ2Р, СЫ3СЫР2, СЫ2РСЫ2Р
Хлорсодержащие СЫ3С1, СЫ2С12, СЫС13, СЫ2СЫ2С1, СЫ3СЫС12
Карбкатионы СЫ3+, С2Ы5+, СЫ2КЫ2+, СЫ2Р+, С3Ы7+, СЫ3СЫСЫ3+, СЫ3СЫОЫ+, (СЫ3)3С+
Другие Ы2О2, СО2, Р2, ЫД СЫ38Ы, Ш3, Ы2О, ЫСЧ ЫР, N112\1
Для определения точности предложенных методов нами использовался специально подобранный тестовый набор соединений (табл. 1). В отличие от набора, используемого в методе 02 5, в данном наборе представлены молекулы, содержащие до 5 тяжелых атомов и относящиеся к различным классам органических соединений. Он включает также ряд карбока-тионов. Точность расчетов проверялась путем сравнения полученных данных с данными прямого расчета в приближении МР4/6-311+СШ,р).
Равновесная геометрия для всех соединений находилась в приближении МР2/6-310(ё,р). Для нахождения значений инкрементов расчет полных энергий проводился в приближениях МР4/6-311+0Ш,р), МР4/6-зиа(а,р), мР2/б-зиа(а,р), МР2/6-зш^а,р), мР2/6-з1+а(а,р), МР2/6-31+0^ё,р). Значения полной энергии МР2/6-311+0^ё,р) определялись из расчетов МР4/ 6-311+0Ш,р).
Инкремент А определялся по формуле:
А = а • N + Ь, (1)
где N — количество учитываемых электронов. Значения коэффициентов а и Ь определялись методом наименьших квадратов с использованием зависимости значений погрешностей от количества электронов в соединении. Инкремент А вычислялся в двух вариантах: с учетом количества всех электронов (ЛУ) или с учетом количества только валентных электронов (Лу). Расчеты осуществлялись в программах РС 0аше88 10.
Обсуждение результатов
Значения отклонений вычисления полной энергии в предлагаемых методах относительно данных расчета в приближении МР4/6-311+ааа,р)//МР2/6-31а(а,р) представлены в табл. 2.
Анализ значений отклонений, вычисленных без учета инкремента А, показывает, что увеличение количества атомов в соединении приводит к росту ошибки расчета. Этот эффект наиболее заметен для галогенсодержа-щих соединений и соединений с гетероатомами и, по-видимому, в первую очередь связан с ростом числа неподеленных электронных пар.
Точность методов МР4Д(+),Д(^6-31 и МР4д(+^6-31, являющихся более простыми, чем МР4Д(+^6-311, представляется неудовлетворительной, т. к. максимальные отклонения достигают 116—124 кДж/моль. Это, очевидно, связано с различием базисных наборов, используемых для расчета базового значения полной энергии и для нахождения инкрементов Д(+0 или Д(+), д(0.
В методе МР4Д(+^6-311 этот недостаток отсутствует, что позволяет значительно улучшить точность расчета. В этом случае максимальное отклонение не превышает 33,8 кДж/моль, а средняя ошибка не превышает 13,7 кДж/моль.
С целью повышения точности предлагаемых методов нами были определены значения инкремента А. Полученные значения коэффициентов а и Ь для определения инкрементов А
Таблица 2
Абсолютные значения погрешностей (кДж/моль) расчетов энергии, полученных
по различным схемам
Соединение МР4 (+\3 1 МР4 <+)' <£)6-31 МР4 (+\31
без А АСУ Ау без А АСУ Ау без А Асу Ау
1 2 3 4 5 6 7 8 9 10
СЫ4 3,4 1,6 1,7 0,9 5,7 15,9 1,4 7,0 14,4
С2Ы6 6,7 0,9 3,4 0,6 4,2 15,0 1,7 2,2 12,8
СЫ3СЫ2СЫ3 10,0 3,3 5,0 1,0 14,7 14,9 2,7 12,0 11,8
С2Ы4 5,4 0,6 2,9 8,9 7,9 5,8 5,8 7,6 5,9
СЫ3СЫСЫ2 9,0 2,9 4,4 7,9 3,2 6,2 4,3 2,8 5,5
1 2 3 4 5 6 7 8 9 10
С9Н9 4,5 0,1 2,2 25,1 26,6 10,3 20,8 24,8 8,5
С,Нб 9,0 2,9 4,4 7,9 3,3 6,2 4,9 2,2 4,9
си,о 7,6 1,5 0,8 4,9 3,8 9,8 0,8 2,5 10,9
СН3СНО 11,4 0,5 1,1 5,6 5,6 8,6 0,6 6,5 9,5
СН3СН2СНО 14,8 2,9 3,5 4,6 16,7 8,9 1,0 16,9 8,8
СН3СОСН3 15,1 2,6 3,2 5,1 16,1 8,4 1,0 16,9 8,8
СН3ОН 8,4 0,9 1,6 3,7 0,1 10,8 0,3 0,1 10,8
СН3СН2ОН 12,1 1,3 2,9 4,5 9,1 9,3 0,6 8,8 8,6
СН3СН,СН,ОН 15,4 3,7 4,5 4,3 19,5 9,0 0,5 18,7 7,7
СН3СН(ОН)СН3 15,6 3,6 4,4 4,5 19,3 8,8 0,2 18,3 7,3
НСООН 13,9 2,0 0,5 5,5 5,7 8,6 0,5 7,6 10,3
СН3СООН 17,7 0,0 0,6 5,0 16,2 8,5 2,0 18,0 9,8
СН3СН2СООН 21,1 2,4 2,2 4,5 26,9 8,5 3,2 28,1 9,1
СН3ОСН3 11,1 2,2 3,9 19,1 5,4 5,2 15,4 6,1 6,2
НСООСН3 17,2 0,5 1,1 0,9 22,1 14,4 7,8 23,7 15,6
СН3СООСН3 21,0 2,5 2,3 1,8 33,1 14,7 9,8 34,6 15,7
СН,СН,О 11,1 0,8 2,2 1,2 10,0 12,9 2,8 9,9 12,6
СН9СН9СН9О 14,7 3,0 3,6 0,9 20,3 12,6 4,2 20,1 12,0
(СН,)ДО 18,5 5,1 4,8 1,4 32,7 14,3 7,5 32,3 13,4
СН,СН,ОСН,О 20,8 2,7 2,5 6,1 37,4 19,0 13,7 38,6 19,6
СН3Ш, 7,4 0,2 2,6 0,9 2,7 13,6 2,4 2,9 13,5
СН3СН,Ш, 10,8 2,5 4,2 1,7 12,0 12,2 2,2 11,5 11,3
СН3ШСН3 10,7 2,6 4,3 0,3 14,0 14,2 4,3 13,6 13,4
СН,ОШ, 12,6 0,7 1,6 6,0 5,1 8,0 0,8 7,9 10,2
СН3СОШ, 16,3 1,4 2,0 6,7 14,6 6,8 1,2 17,1 9,0
СН,СН,Ш 9,8 2,1 0,2 4,5 6,6 9,9 0,2 6,9 10,8
СН,СН,СН,КН 13,5 4,2 4,8 5,5 15,8 8,0 0,0 16,0 7,8
(СН-^Ш 17,1 6,4 6,2 2,7 28,7 10,2 3,5 28,3 9,4
СНзБ 9,5 2,0 0,5 13,5 9,9 1,0 10,1 9,7 0,9
СН9Р9 16,4 3,0 1,4 18,0 4,3 4,1 12,8 3,5 3,7
СНБ3 23,8 4,6 3,8 10,2 13,6 3,1 3,8 14,3 3,4
СБ4 31,2 6,3 6,3 3,7 37,6 16,4 11,7 38,8 17,0
СНзСН9Р 13,1 0,3 1,9 12,7 1,0 1,2 8,5 0,8 0,7
СНзСНР9 20,1 0,9 0,1 14,9 8,9 1,6 8,5 9,6 1,3
СН,РСН,Р 19,5 0,4 0,5 23,2 0,6 9,9 15,7 2,4 8,5
СН3С1 18,4 5,1 8,4 42,9 29,2 28,4 40,1 30,8 29,1
СН9С19 33,8 8,9 18,9 87,7 53,8 73,8 82,5 55,5 73,4
СНС13 49,5 12,9 29,6 131,8 77,7 118,5 124,1 79,4 116,9
СН9СН9С1 22,1 2,9 7,1 43,1 19,3 29,2 39,7 21,6 30,6
СН3СНС19 37,7 7,0 17,8 87,1 43,1 73,8 81,2 45,3 74,0
СНЯ+ 2,8 2,6 0,5 4,0 5,0 19,2 4,3 6,3 18,0
С2Н5+ 6,2 0,1 2,1 6,6 7,6 21,2 7,3 5,5 19,0
СН,Ш,+ 7,0 0,9 1,3 8,6 9,6 23,2 9,8 8,0 21,5
СН,Р+ 8,7 2,6 0,4 5,6 6,6 20,2 7,4 5,6 19,1
С3Н7+ 9,6 2,3 3,8 4,7 15,9 18,8 6,1 13,2 15,9
СН3СНСН3 10,4 1,5 2,9 9,3 20,5 23,4 10,6 17,7 20,3
СН3СНОН+ 11,9 0,0 1,5 8,4 19,6 22,5 10,8 17,9 20,6
(СН3)3С+ 14,1 3,6 4,3 12,0 2,9 27,2 13,9 3,3 27,6
КН3 4,0 2,3 1,0 1,3 0,2 13,4 1,5 0,3 13,2
Н2О 4,7 3,0 0,3 8,8 7,7 5,9 5,4 7,2 6,3
НСК 5,6 0,9 1,1 13,7 12,7 1,0 10,0 11,8 1,7
1 2 3 4 5 6 7 8 9 10
LiF 6,4 3,2 1,4 47,2 36,1 33,2 39,5 32,4 29,7
nh2nh2 8,0 0,5 2,0 3,4 7,8 10,7 1,0 8,1 10,8
H,O, 10,7 3,2 0,7 16,7 13,1 2,3 11,9 11,5 0,9
CO2 12,7 2,3 1,0 5,8 2,9 8,5 1,6 6,4 12,0
F, 12,9 5,4 2,9 32,3 28,7 17,8 28,8 28,3 17,7
PH3 6,3 1,2 1,3 26,5 22,9 11,5 24,1 23,6 11,1
H,S 10,5 2,9 5,5 36,5 32,9 21,5 34,1 33,7 21,1
CH3SH 14,1 0,8 4,1 32,9 19,2 18,5 30,2 20,9 19,1
Среднее значение Мах отклонение 13.7 33.8 2,6 12,9 3,7 29,6 16,3 115,6 17,3 91,9 17,3 100,6 14,5 124,1 17.4 90.5 16,9 116,9
Таблица 3
Коэффициенты а и b для различных схем
Коэф. Acv Av
MP4A<+f)6-311 MP4A<+)A (f)6-31 MP4A<+f)6-3! MP4a<+\m1 MP4A(+)' A(f)6-31 MP4A<+f)6-3!
a -0,7259 1,2629 1,1079 -0,8304 -0,0958 -0,3221
b 5,5334 -19,1661 -19,5072 1,6246 15,7850 15,5556
по уравнению (1) с учетом различного числа электронов в соединениях приведены в табл. 3.
Несоответствие базисных наборов в методах МР4д(+), д<°6-31 и МР4д(+°6-31, отмеченное выше, не позволяет улучшить точность расчетов даже с учетом инкрементов Асу и Ау. Значения средних отклонений практически не изменяются (табл. 2). Нами только отмечено некоторое уменьшение максимальных отклонений до 90—92 кДж/моль в случае использования инкремента Аот.
В случае метода МР4д(+^6-311 использование эмпирического инкремента Аот позволяет значительно улучшить точность, среднее абсолютное отклонение составляет 2.6 кДж/моль. Судя по значениям средних абсолютных отклонений, учет всех или только валентных электронов при нахождении инкремента А дает примерно сходные результаты, разность средних ошибок найденных с его использованием составляет 1.1 кДж/моль. Однако применение инкремента Аот позволяет уменьшить максимальное отклонение до 12.9 кДж/моль.
С учетом вышеизложенного очевидно, что применимость принципа аддитивности ограничена рамками одного базисного набора и совместное использование двух и трехкратнорасщеп-ленных базисных наборов при нахождении инкрементов подобных Д(+^), Д(+), Д(0 нецелесообразно. Расчетные данные показывают, что все схемы позволяют значительно уменьшить время расчетов (в 3—10 раза). Наибольший выигрыш во времени наблюдался для тех молекул, в состав которых входило наибольшее число тяжелых атомов. Для самых сложных соединений модельного ряда время вычислений уменьшалось до 10 раз.
Выводы
С использованием принципа аддитивности предложен новый комбинированный метод расчета MP4 A(+f)6-311 соответствующий прямому расчету в приближении MP4/6-311+G(fd,p)// MP2/6-31G(d,p) и являющийся эффективным при определении полной энергии сложных органических молекул и интермедиатов.
На тестовом наборе из 65 органических соединений показано, что среднее абсолютное отклонение при вычислении полной энергии в методе MP4A(+f)6-311 с использованием поправочного инкремента, зависящего от числа всех электронов в соединении, составляет 2.6 кДж/ моль при выигрыше по времени до 10 раз.
Литература
1. Jensen F. J. Introduction to computational chemistry. Chichester: John Wiley&Sons, 2001. - 429 p.
2. Foresman J. B. Exploring chemistry with electronic structure methods. Pittsburgh: Gaussian, Inc, 2000. — 303 p.
3. Pople J. A., Head-Gordon M., Fox D. J., Raghavachari K., Curtiss L. A. // J. Chem. Phys.
1989. — 90. — P. 5622.
4. Curtiss L. A., Jones C., Trucks G. W., Raghavachari K., Pople J. A. //J. Chem. Phys.
1990. — 93. — P. 2537.
5. Curtiss L. A., Raghavachari K., Trucks G. W., Pople J. A. // J. Chem. Phys. 1991. — 94. — P. 7221.
6. Curtiss L. A., Raghavachari K., Pople J. A. // J. Chem. Phys. 1993. — 98. — P. 1293.
7. Nyden M. R., Petersson G. A. // J. Chem. Phys. 1981. — 75. — P.1843.
8. Ochterski J. W., Petersson G. A., Montgomery Jr. J. A. // J. Chem. Phys. 1996. — 104. — P. 2598.
9. Petersson G. A., Tensfeldt T. G., Montgomery Jr. J. A. // J. Chem. Phys. 1991. — 94. — P. 6091.
10. Alex A. Granovsky, http:// classic.chem.msu.su/ gran/games/index.html.