Научная статья на тему 'РАСЧЕТ СТАБИЛЬНОСТИ КОМПЛЕКСОВ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С β-ЦИКЛОДЕКСТРИНОМ МЕТОДОМ QSPR'

РАСЧЕТ СТАБИЛЬНОСТИ КОМПЛЕКСОВ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С β-ЦИКЛОДЕКСТРИНОМ МЕТОДОМ QSPR Текст научной статьи по специальности «Химические науки»

CC BY
106
22
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по химическим наукам, автор научной работы — Жохова Н.И., Бобков Е.В., Баскин И.И., Палюлин В.А., Зефиров А.Н.

Методом множественной линейной регрессии с использованием процедуры двойного скользящего контроля построена QSPR-модель для расчета изменения свободной энергии Гиббса при образовании комплексов органических соединений различных классов с β-циклодекстрином. Модель обладает хорошими прогнозирующими свойствами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по химическим наукам , автор научной работы — Жохова Н.И., Бобков Е.В., Баскин И.И., Палюлин В.А., Зефиров А.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «РАСЧЕТ СТАБИЛЬНОСТИ КОМПЛЕКСОВ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С β-ЦИКЛОДЕКСТРИНОМ МЕТОДОМ QSPR»

УДК 541.6

РАСЧЕТ СТАБИЛЬНОСТИ КОМПЛЕКСОВ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ С ß-ЦИКЛОДЕКСТРИНОМ МЕТОДОМ QSPR

Н.И. Жохова, Е.В. Бобков, И.И. Бассейн, В.А. Палюлин, А.Н. Зефиров, Н.С. Зефиров

(кафедра органической химии: e-mail: zhokhova@org.chem.msu.ru )

Методом множественной линейной регрессии с использованием процедуры двои hoi оеколь-зящего контроля noc í роема QSPR-модель для расчета изменения свободной жергпн Гнббса при образовании комплексов органических соединении различных классов с ß-ннклодекст-рином. Модель обладает хорошими прогнозирующими свойствами.

Разработка фармакологических форм с желаемыми фармакокинетическими и терапевтическими свойствами на основе включения молекул лекарственного вещества в полость циклодекстринов (ЦД) является перспективным направлением в решении проблемы транспорта лекарств к биологической мишени. Комп-лексообразование с ЦД препятствует биоразложению органического соединения, уменьшает его летучесть, улучшает растворимость и биодоступность, снижает риск нежелательных побочных эффектов [1-4]. Принципиальными преимуществами природных ЦД как носителей молекул лекарственных препаратов являются хорошо идентифицируемая структу ра, возможность химической модификации, низкая токсичность и фармакологическая активность [1|. Вследствие относительной доступности и дешевизны наибольшие перспективы для практического использования имеют [3-ЦД и его производные

Актуальность разработки надежного теоретического метода расчета и прогнозирования стабильности комплексов органических соединений с ЦД обусловлена. в частности, сложностями экспериментального определения соответствующих параметров из-за низкой растворимости "молекул-гостей" в водных растворах. Расчетные методы квантовой химии и молекулярной динамики имеют ряд ограничений, связанных с большими размерами и шнформационной подвижностью молекул ЦД в водном растворе [5]. Альтернативу этим методам представляет методология (ОиапШаНуе Я/г не! и ге -РгореПу НеШИотЫря), которая успешно используется для прогнозирования свойств химических соединений [6, 7]. Дтя расчета термодинамической стабильности комплексов органических соединений различных классов с ЦД ранее был предложен ряд (^РЯ-моделей [8-11]. Общий недостаток эт!-[х моделей связан с завышенной оценкой их прогнозирующих свойств. Традиционные приемы, применяемые с этой целью в большинстве ис-

следований, заключаются либо в использовании для независимого прогноза одного фиксированного набора соединений, либо в проведении после отбора дескрипторов процедуры обычного скользящего контроля, что часто приводит к завышению прогнозирующей способности моделей, поскольку информация из контрольной выборки может быть косвенным образом учтена при построении моделей. Этого недостатка позволяет избежать процедура двойного скользящего контроля. Ранее мы успешно использовали эту процедуру при построении моделей с помощью метода линейной регрессии и искусственных нейронных сетей для прогнозирования физико-химических свойств и биологической активности органических соединений [12]. В данной работе мы использовати метод множественной линейной регрессии и процедуру двойного скользящего контроля для расчета стабильности комплексов "гость-хозяин" органических соединений различных классов с р-циктодекстрином.

В работе использовали экспериментальные данные по изменению свободной энергии (Д6\ кДж/моль) при образовании комплексов 218 органических соединений (ароматические углеводороды, спирты, фенолы, простые и сложные эфиры, альдегиды, кегоны. кислоты, серосодержащие соединения, нитрилы, анилины, гетероциклические соединения, стероиды и барбитураты) с Р-ЦД в воде при температуре 25 °С [8]. Построение (^РЯ-моделей и расчет дескрипторов (физико-химических, топологических, зарядовых, стерических и др.) осу ществляли с помощью программного комплекса ЫА5АШГЫ. разработанного на химическом факультете МГУ [13-16]. Для генерации фрагмент-ных дескрипторов использовали алгоритм, реализующий схему иерархической классификации структурных фрагментов и атомов [15]. Схема позволяет генерировать большое число наборов фрагментов химических структур и обеспечивает гибкую классификацию типов атомов. При построении многомерных (т.е.

включающих множество дескрипторов) линейных ¡)ег-рессионных моделей с использованием процедуры двойного скользящего контроля исходная база химических соединений разбивается на 3 части, обучающую, внутреннюю контрольную и внешнюю контрольную выборки в соотношении 3:1:1. Каждое соединение последовательно включается во все три выборки. Информация внутренней контрольной выборки используется для контроля и оптимизации прогнозирующих свойств моделей: процесс пошагового отбора дескрипторов и построение моделей останавливается по достижении наименьшей ошибки прогнозирования на этой выборке. Информация внешней контрольной выборки не используется при построении и отборе моделей и служит для независимой оценки прогнозирующей способности результирующей линей-но-регрессионной модели. Предсказанное значение свойства для каждого соединения вычисляется как среднее из предсказанных значений при всех разбивках, при которых оно попадает во внешнюю контрольную выборку, На выходе на основе усреднения статистических параметров множества (в данной работе 20) частных линейно-регрессионных моделей быта получена многомерная модель, включающая: 1) информацию о статистических параметрах 20 ли-нейно-регрессионных моделях и усредненной многомерной модели; 2) данные независимого прогноза свойства для каждого из соединений базы; 3) данные о типе и вкладе каждого дескриптора, включенного в многомерную модель. Такая методология обеспечивает корректную оценку прогнозирующей способности многомерной линейной модели.

Обсуждение результатов

На первом этапе работы для построения QSPR-моделей мы использовали дескрипторы, учитывающие чисто вхождений структурных фрагментов в химическую структуру 'молекул-гостей". Ранее мы успешно использовати фрагментиый подход дтя оценки физико-химических свойств органических соединений. в частности, хроматограф и чес к их индексов удерживания [17|. температуры кипения |17|, температурь! вспышки 118], магнитной восприимчивости 119], поляризуемости 120], плотности (для жидких вешеств), вязкости и давления насыщенного пара органических соединений [16] и др. Достоинством фрагментных дескрипторов является прозрачный смысл каждого дескриптора и возможность их быстрой автоматической генерации на основе одной лишь структурной формулы соединения без учета информации о пространственном строении или электронной структуре моле-

кул [15]. С целью выбора фрагментов, наиболее адекватно описывающих геометрию и топологию исследуемых органических структур, мы рассчитывай и число вхождений в структуру следующих фрагментов: цепочек длиной от 1 до 15 неводородных атомов; циклов размером от 3 до 15; разветвленных фрагментов, включающих от 4 до 6 неводородных атомов; бициклов, включающих от 6 до 15 атомов; трициклов. включающих от 12 до 15 атомов.

Наилучшими прогнозирующими характеристиками обладала Многомерная модель, основанная на учете фрагментов размером от одного до четырех неводородных атомов:

для внешних контрольных выборок параметр О для двойного скользящего контроля пироги = 0,704,

среднеквадратичное отклонение АШ£мрогн. = 2.87 кДж/моль, средняя абсолютная ошибка

Л Л 1Л . ро, Н = >>98 кДж/модъ;

для обучающей выборки

усредненный квадрат коэффициента

корреляции

й2^ = 0,876,

среднеквадратичное отклонение АШ£обуч = !-50 кДж/моль. средняя абсолютная ошибка

ШЕобуч. = ! !! кДж/моль.

С целью повышения качества полученных нами моделей, основанных только на фрагментных дескрипторах, представляло интерес включение в эти модели других типов дескрипторов, которые могут охарактеризовать моделируемое свойство. Известно, что по условиям термодинамического равновесия гидрофобные молекулы органических соединений, способные по своим геометрическим размерам проникать во внутреннее пространство кольца ЦД при добавлении в водный раствор ЦД образуют комплексы включения. Изменение свободной энергии связано с "выталкиванием" гидрофобной молекулы из водной среды и образованием дополнительных водородных связей между молекулами воды, находившимися в контакте с гидрофобной молекулой [1|. К факторам, оказывающим влияние на образование комплексов, относят, в частности, гидрофобные взаимодействия, образование водородных связей между полярными гру ппами "гостя" и гидроксильными гру ппами "хозяина", стерические затруднения, конформационные изменения аддукта ЦД-вода. изменение (высвобожде-

Схема 1

.У"

С н

л,

врз ^с

ние) свободной энергии в процессе включения субстрата в полость ЦД и вытеснения воды. Поэтому при дальнейшем построении моделей в комплексе с фрагментными дескрипторами мы использовали различные варианты наборов следующих дескрипторов: 1) липофильность (\%Р), 2) дескрипторы водородных связей, характеризу ющие способность органического соединения выступать в качестве донора либо акцептора водородной связи, 3) дескрипторы, описывающие стерические факторы, характеризующие молекулярный объем и площадь молекулярной поверхности, 4) дескрипторы, характеризующие распределение зарядов внутри молекул, 5) дескрипторы, связанные с распределением свойств атомов внутри фрагментов, (цепочки от 1 до 5 атомов) и характеризующие число электронов, атомный радиус, электроотрицательность, потенциал ионизации и др. Было построено более 500 линейно-регрессионных моделей па основе комбинаций различных типов дескрипторов. Выбор дескрипторов в процессе построения многомерной модели осуществлялся по следующим критериям: улучшение коэффициента корреляции на прогнозе и высокий индекс вхождения в частные линейные модели. Наилучшие результаты были получены при добавлении к фраг-менгным дескрипторам параметра липофильности и дескрипторов, характеризующих распределение свойств атомов внутри структурных фрагментов. Следует отметить, что параметр липофильности имеет наибольшую статистическую значимость практически для всех моделей, в построении которых он участвует. Это свидетельствует о важности учета гидрофобной составляющей свободной энергии взаимодействия органической молекулы с ЦД, что обусловлено наличием в последнем гидрофобной полости. Наименьший вклад в совокупности с фрагментными дескрипторами вносят дескрипторы, характеризующие стерические особенности "молекул-гостей" и дескрипторы водородных связей. В результате была получена многомерная модель, построенная на основе фрагментных дескрипторов, липофильности и дескрипторов, характеризующих свойства атомов фрагментов. Эта модель имеет следующие статистические характеристики:

для внешних контрольных выборок

параметр О для двойного скользящего контроля

среднеквадратичное отклонение ЯА^ршн = 2 !6 кДж/моль, средняя абсолютная ошибка ШЕ про™ = 1.56 кДж/моль; для обучающей выборки усредненный квадрат коэффициента корреляции

^обун = 0'936-

среднеквадратичное отклонение

= 1Л9 кДж/моль, средняя абсолютная ошибка

МАЕ^ = 0,91 кДж/моль.

Наибольшую значимость для данной комбинированной модели имеют следующие дескрипторы (по степени убывания вклада): липофильность, среднее значение произведений атомных радиусов в положениях 1-5 по всем 5-атомным цепочкам, число вхождений фрагментов типа I, 2 и 3 (схема 1), а также сумма разностей электроотрицательностей для всех связей Х-Н (где X - любой неводородный атом) в молекуле. Дескрипторы, характеризующие фрагмент-ный состав "молекул-гостей", необходимы для построения прогнозирующих моделей и позволяют компенсировать ограниченность других типов дескрипторов. Дтя данной модели наибольшие ошибки при независимом прогнозе исследуемого свойства (АОт) имеют комплексы р-ЦД со следующими соединениями: стрептоцидом (разница между экспериментальной и предсказанной величинами АСэксп-АСрасч = -8,22 кДж/моль) и 2-норборн ил ацетатом (—10,21 кДж/моль), соответственно структуры 4 и 5 (схема 2). Исключение из базы этих соединений не приводит к существенному7 изменению статистических характеристик модели. Ниже представлена диаграмма разброса данных независимого прогноза АО (кДж/моль) образования комплексов исследованных органических соединений с р-ЦД. полученных согласно этой модели, и эксперимента! ьных данных (рисунок).

Схема 2 ^СН,

разования комплексов р-циклодекстрина с органическими соединениями различных классов. Использование процеду ры двойного скшьзящеш контроля при построении модели обеспечивает надежную и беспристрастную оценку' ее прогнозирующих свойств.

Таким образом, с использованием метода пошагового построения множественной линейной регрессии и процедуры двойного скользящего контроля нами была получена многомерная (^РЯ-модель на основе фраг-ментных дескрипторов, учитьгаающих число вхождений фрагментов размером до 4 неводородных атомов, а также параметра липофильности и дескрипторов, характеризующих свойства агоуюв внутри фрагментов. Модель обладает высокой прогнозиру ющей способностью в отношении изменения свободной энергии ДС об-

R1 = 0,8257

10 15 20

Эксперимент

31)

Диаграмма разброса данных независимого прогноза AG (кДж/моль) образования комплексов исследованных органических соединений с ß-11Д, полученных согласно модели, и экспериментальных данных

СПИСОК ЛИТЕРАТУРЫ

1. UekamaK., HirqyamaF., Irie 7.7/Chem. Rev. 1998.98. P. 2045.

2. Астахова A.B., Демина Н.Б. //Хим.-фарм. журнал. 2004.38.

№2. С. 46.

3. Сус lode х tri lis and their industrial uses / Ed. bv D. Duchene.

Paris, 1987.

4. Cyclodextrins inpharmacy. Dordrccht. 1994.

5.LipkowitzK.B.l/Chcm.Rcv. 1998.98.P. 1829.

6. Mansch С., Leo A. Exploring QSAR. Fundamentals and

applications in chemistry and biology. V. 1. ACS Professional Ref. Book, 1995.

7. ZefirovN.S., Palyulin V. //J. Chem. Inf. Comput Sei. 2002.42.

P. 1112.

8. Katrizky AJL, Farn Ü.C., Yang II., Kare Ison M, Suzuki Т.,

Solov'ev VP., VarnekA.Il J. Chem. Inf. Comput. Sei. 2004.44. P, 529.

9. Klein C.Th., PolheimD., Viernstein II., WolseharmP. Hi. Incl.

Phe. Macr. Chem. 2000.36. N 4. P. 409.

10. Suzuki Т. А. // j. Chem. inf. Comput Sei. 2001.41. P.l266.

11. Suzuki Т., IshidaM., Fabian W. M. Hi. Comput.-Aided Mol. Design. 2000.14. P. 669.

12. Kaskin 1.1., Zhokhova N.I., Palyulin VA., Ivanova A.A.: Zeflrov A.N., Zeflrov N.S. II XVI European Symposium on Quantitative Structure-Activity Relationships and Molecular Modeling. Mediterranean Sea, Italv. September 10-17.2006. P. 206.

13. Baskin 1.1., Palyulin VA., Zefirov N.S. // QSAR and Molecular Modelling: Concepts. Computational Tools and Biological Applications/Eds. F. Sanz, J. Giraldo, F. Manaut. Barcelona, 1995. P. 30

14. BasfánLL, Palyulin VA., ZefirovN.S. // j. Chem. Inf. Comput. Sei. 1997.37. P. 715.

15. АртеменкоN.B., БаскинИ.И., Палюлин В.А., Зефиров II.C. П Докл. РАН. 2001.381. N 2. С. 203.

16. Артеменко Н.В., Баскин II.IL, ПалюлинВА., Зефиров U.C. //Изв. РАН. Сер. хим. 2003.№ 1. С. 19.

17. ZefirovN.S., Palyulin VA. Hi. Chem. Inf. Comput. Sei. 2001. 41. P. 1022

18. Жохова H.H., Баскин H.H., Падюяин В.А., Зефиров A.H., Зефиров U.C. //Изв. РАН. Сер. хим. 2003. № 9. С. 1787.

19. Жохова ff.И., Баскин И.И., Палюлин В.А., Зефиров А. ff., Зефиров КС. //Жур. структ. хим. 2004. 45. N4. С. 660.

20. Жохова H.H., Баскин И.И., Палюлин В.А., Зефиров А. Н., ЗефировН.С. //Изв. РАН. Сер. хим. 2003. № 5. С. 1005.

Поступила и редакцию 09.04.07

CALCULATION OF STABILITY OF p-CYCLODEXTRIN COMPLEXES OF ORGANIC COMPOUNDS USING QSPR APPROACH

N.I. Zhokhova, E.V. Bobkov, I.I. Baskin, V.A. Palyulin, A.N. Zefirov, N.S. Zefirov

(Division of Organic Chemistry)

The QSPR-model for predicting the free energies of complexation of organic compounds of various classes with P-cyciodextrin was constructed using multiple linear regression and double cross-validation procedure. The model possesses good predictive ability.

i Надоели баннеры? Вы всегда можете отключить рекламу.