вкстник
ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО МНД ИЦИI1СКОГО УIШНКРСИТКТА
ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
Научная статья
УДК 615.015.11:544.165:575.112 ::[544.187.2+004.032.26] doi: 10.19163/1994-9480-2022-19-4-88-93
нейросетевое моделирование зависимости ГАМКа-АГОНИСТИЧЕСКОй активности химических соединений от спектра энергий множественного докинга
Павел Михайлович ВасильевАндрей Николаевич Кочетков 2, Максим Алексеевич Перфильев 3
1,2,3Волгоградский государственный медицинский университет, Волгоград, Россия
[email protected] [email protected] [email protected]
Аннотация. Выполнен простой и множественный докинг в ГАМКд-рецептор его известных агонистов. Для указанных соединений рассчитаны энергии простого докинга в ГАМК-связывающий сайт и спектры энергий множественного докинга по всему объему ГАМКд-рецептора. Сформирована модель зависимости уровня ГАМКд-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт. Построена нейросетевая модель зависимости уровня ГАМКд-агонистической активности от спектра энергий множественного докинга химических соединений. Показано, что прогностическая точность нейросетевой модели на основе множественного докинга существенно превышает прогностическую точность модели на основе простого докинга.
Ключевые слова: in silico, простой докинг, множественный докинг, спектр энергий, искусственные нейронные сети, зависимости «структура - активность», прогностическая способность
Финансирование. Работа выполнена в рамках государственного задания Министерства здравоохранения Российской Федерации № 121060700050-2 «Разработка методологии компьютерного поиска фармакологически активных соединений на основе множественного докинга и технологии искусственных нейронных сетей».
ORIGINAL RESEARCHES
Original article
neural network modeling of the dependence of gaba-agonistic activity of chemical compounds on the energy spectrum of multiple docing
Pavel M. Vasiliev1Andrey N. Kochetkov 2, Maxim A. Perfiliev 3
1,2,3 Volgograd State Medical University, Volgograd, Russia [email protected] [email protected] [email protected]
Abstract. Simple and multiple docking into the GABAa receptor of its known agonists has been carried out. For these compounds, the energies of simple docking into the GABA binding site and the energy spectra of multiple docking throughout the entire volume of the GABAa receptor were calculated. A model of the dependence of the level of GABAa agonistic activity of chemical compounds on the energy of their simple docking into the GABA binding site has been formed. A neural network model of the dependence of the level of GABAa agonistic activity on the energy spectrum of multiple docking of chemical
© Васильев П.М., Кочетков А.Н., Перфильев М.А., 2022
ВЕСТНИК JOURNAL
ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО ^ OF VOLGOGRAD STATE i
МЕДИЦИНСКОГО УНИВЕРСИТЕТА MEDICAL UNIVERSITY
compounds has been constructed. It is shown that the predictive accuracy of the neural network model based on multiple docking significantly exceeds the predictive accuracy of the model based on simple docking.
Keywords: in silico, simple docking, multiple docking, energy spectrum, artificial neural networks, structure-activity relationships, predictive ability
Funding. The work was carried out within the framework of the state task of the Ministry of Health of the Russian Federation No. 121060700050-2 "Development of a methodology for computer search of pharmacologically active compounds based on multiple docking and artificial neural network technology".
В нашей предыдущей работе [1] было показано, что спектр энергий докинга химических соединений в множество пространств релевантного белка является намного более достоверной метрикой аффинности лигандов к биомишеням, в сравнении с единичной энергией их докинга в специфический сайт. При этом использование множественного докинга для расчета аффинности соединений не требует определения в белке-мишени местоположения специфического сайта связывания.
Известно также, что, в соответствии с теоремой Колмогорова [2], с помощью двухслойной искусственной нейронной сети может быть аппроксимирована зависимость любой сложности.
Таким образом, разработка на основе указанной технологии искусственного интеллекта новой методологии построения ¡п бШсо высокоточных моделей зависимости фармакологической активности химических соединений от спектра их множественной аффинности к релевантным белкам-мишеням, включающая учет взаимодействия лиганда со всей поверхностью белка, является востребованной и весьма актуальной задачей.
ЦЕЛЬ РАБОТЫ
Построение методом искусственных нейронных сетей модели зависимости уровня ГАМКд-агонисти-ческой активности от спектра энергий множественного докинга химических соединений и оценка ее прогностической способности, в сравнении с точностью прогноза с использованием энергии простого докинга.
МЕТОДИКА ИССЛЕДОВАНИЯ
Исходное допущение
На данном этапе разработки новой методологии прогноза в качестве модельной фармакологической активности была выбрана ГАМКд-агонистическая активность, по следующим основаниям: 1) ГАМК-ергические соединения обычно проявляют психотропные свойства и в связи с этим рассматриваются как перспективные кандидаты для создания новых лекарственных средств; 2) имеются достоверные
данные по химической структуре и экспериментальным значениям ГАМКА-агонистической активности уже синтезированных известных веществ; 3) доступны валидные экспериментальные рентгеноструктурные bD-модели ГАМКд-рецептора и информация о локализации его специфических сайтов связывания.
Задачи исследования
Для достижения поставленной цели необходимо было решить следующие задачи.
1. Сформировать верифицированную выборку по структуре и уровню активности известных соединений, испытанных на ГАМКА-агонистическую активность.
2. Построить и оптимизировать 3D-модели этих соединений.
3. Выполнить для указанных соединений простой докинг в ГАМК-связывающий сайт ГАМКа-рецептора и множественный докинг во все сформированные для этого пространства данного рецептора.
4. Рассчитать энергии простого докинга и спектры энергий множественного докинга указанных известных соединений.
5. Сформировать модель зависимости уровня ГАМКА-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт, оценить ее точность.
6. Построить нейросетевую модель зависимости уровня ГАМКА-агонистической активности от спектра энергий множественного докинга химических соединений, оценить ее точность.
Выборка по структуре и активности ГАМКа-агонистов
Верифицированные данные по химической структуре и уровню ГАМКА-агонистической активности 191 известного вещества в отношении a1-p2-Y2 подтипа ГАМКА-рецептора были взяты из оригинальной OSAR-базы системы Microcosm BioS v20.6.6 [3], содержащей структурированную и обработанную информацию по химической структуре и уровню активности 625888 известных соединений, изученных мировым научным сообществом на 11509 различных видов таргетной биологической активности. С помощью программы Statistica 7 [4] методом k-средних был
bectiiiik
ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО ^
МЕДИЦИ11СКОГО УIШВЕРСИТЕТА
выполнен кластерный анализ количественных значений ГАМКА-агонистической активности с разделением на 2 группы активности: high (24 соединения) и moderate (167 соединений).
Оптимизированные SD-модели соединений
В соответствии с методикой [5], для всех 191 соединений методами молекулярной механики с помощью программы MarvinSketch 17.1.23 [6], отдельно для каждого соединения, были построены по 10 конфор-меров с наименьшей энергией. Построенные кон-формеры были оптимизированы с помощью программы MOPAC2012 [7] с использованием полуэмпирического квантово-химического метода PM7. Среди оптимизированных конформеров были отобраны для каждого соединения по одному конформеру с наименьшей общей энергией.
Простой и множественный докинг
В расчетах использовалась экспериментальная 3D-модель ГАМКА-рецептора 6D6T [8] - наиболее полная и точная из 14 моделей, найденных в банке данных RCSB PDB [9]. Координаты ГАМК-связывающего сайта были определены с помощью программы LigPlot+ 2.2.5 [10]. Кроме того, на указанной модели 6D6T с помощью программы MSite v21.04.22, в соответствии с алгоритмом, подробно описанным в нашей предыдущей работе [1], были построены 27 пространств для множественного докинга.
Ансамблевый докинг проводили с помощью программы AutoDock Vina 1.1.1 [11], каждое соединение в 10 конформерах по 5 раз в каждое пространство докинга, с вычислением по 50 полученным значениям минимальных энергий связывания ДБ, как это описано в [5]. Докинг выполняли отдельно в ГАМК-связывающий сайт ГАМКА-рецептора и отдельно в каждое из 27 пространств, сформированных для множественного докинга.
Полученная в результате расчетов сводная таблица для последующего моделирования включала в себя 30 колонок: шифры соединений; метка уровня ГАМКА-агонистической активности Ind; энергия докинга в специфический ГАМК-связывающий сайт ДЕ0 и энергии множественного докинга в 27 пространств ДЕ1...ДЕ27 ГАМКА-рецептора.
Модель зависимости активности от энергии простого докинга
Для построения модели зависимости уровня ГАМКА-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт ДЕ0 все значения этого показателя
JOURNAL OF VOLGOGRAD STATE j MEDICAL UNIVERSITY
для 191 известного ГАМКА-агониста с помощью программы Statistica 7 [4] были подвергнуты кластерному анализу методом k-средних, с определением граничного значения ДЁ0, разделяющего соединения с высокой энергией докинга ДЕ0 и соединения с умеренной или низкой величиной ДЕ0.
Парадигма традиционного докинга постулирует, что высокая расчетная энергия взаимодействия со специфическим сайтом биомишени ДЕ0 соответствует высокому значению фармакологической активности [12]. Таким образом, основанное на простом докинге решающее правило определяется следующими неравенствами:
1) если ДЕ0 < ДЁ0, то прогнозируемое соединение принадлежит к классу соединений с высокой ГА МКА-агонистической активностью;
2) если же ДЕ0 £ ДЁ0, то прогнозируемое соединение принадлежит к классу соединений с умеренной или низкой ГАМКА-агонистической активностью.
С использованием сформированной модели рассчитаны общая точность прогноза Fo, точность прогноза высоко активных соединений Fa (чувствительность) и точность прогноза не высоко активных соединений Fn (специфичность). С помощью биномиального критерия z [13] оценена статистическая достоверность p показателей точности прогноза.
Нейросетевая модель зависимости активности от энергии множественного докинга
Для построения модели зависимости уровня ГАМКА-агонистической активности от спектра энергий множественного докинга химических соединений ДЕ1...ДЕ27 была использована технология искусственных нейронных сетей [14]. В соответствии с теоремой Колмогорова [2], в настоящем исследовании использовалась архитектура сети в виде двухслойного пер-цептрона MLP k-m-2 с узким горлом. Здесь k - число входных нейронов, в данном случае 27 (ДЕ1...ДЕ27); m - число скрытых нейронов, устанавливается программой от 3 до 26, поскольку 2 < m < k. В модуле Statistica Neural Networks [14] программы Statistica [4] при построении перцептронных сетей для скрытого и выходного слоев используются пять наиболее распространенных активационных функций (Identity, Logictic, Tanh, Exponential, Softmax) [14], попарный перебор которых также осуществляется программой.
Обучение нейросетей в программе Statistica проводится с использованием алгоритма обратного распространения ошибок. С целью достижения наилучшего результата обучения, число сетей для обучения было увеличено с 20 до 400, а число наилучших автоматически отбираемых сетей - с 5 до 100. После окончания обучения для заданного уровня активности из 100 лучших отобранных программой нейросетей
ВЕСТНИК
ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО ^
МЕДИЦИНСКОГО УНИВЕРСИТЕТА
по совокупности характеристик точности обучения и тестирования вручную отбирали лучшую.
С использованием построенной модели рассчитаны общая точность прогноза Г0, точность прогноза высоко активных соединений (чувствительность) и точность прогноза не высоко активных соединений Еп (специфичность). С помощью биномиального критерия 2 [13] оценена статистическая достоверность р показателей точности прогноза.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
И ИХ ОБСУЖДЕНИЕ
Для модели зависимости уровня ГАМКд-агонисти-ческой активности химических соединений от энергии
JOURNAL OF VOLGOGRAD STATE I MEDICAL UNIVERSITY
и х простого докинга в ГАМК-связывающий сайт ДЕ0 получено граничное значение ДЁ0 = 6,0 Ккал/моль, разделяющее высоко активные и не высоко активные соединения.
В случае нейросетевой модели зависимости уровня ГАМКд-агонистической активности от спектра энергий множественного докинга химических соединений ДЕ1...ДЕ27 получена нейронная сеть следующих характеристик: MLP 27-16-2 (Tanh, Softmax), точность обучения 99,3 %, тестирования 100 %, валидации 67,9 %, также классифицирующая высоко активные и не высоко активные соединения.
В табл. приведены результаты сравнительной оценки на объединенной выборке точности указанных двух моделей.
Точность прогноза уровня ГАМКд-агонистической активности на основе энергий простого и множественного докинга
Показатель точности прогноза Значения для модели прогноза с использованием
AEo AE1...AE27
Fo, % 51,3 94,8
Fa, % 66,7 83,3
Fn, % 49,1 96,4
zo 0,58 8,73
Za 1,08 2,23
Zn 0,14 8,45
Po 0,281 <110-15
Pa 0,139 0,0127
Pn 0,555 <110-15
Примечание.
Я>, Ро, Еп - общая точность прогноза, точность прогноза высоко активных соединений, точность прогноза не высоко активных соединений. 20, 2 о, 2 п - биномиальный критерий для Ро, Ро, Рп. ро, ро, рп - значимость Ро, Ро, Рп.
Точность прогноза ГАМКд-агонистической активности с использованием модели на основе энергии докинга в специфический сайт АЕо является статистически незначимой по всем показателям.
В случае прогноза не высоко активных соединений вычисленная оценка даже меньше точности случайного угадывания, составляющей 50 %.
В то же время при использовании нейросетевой модели на основе энергий множественного докинга АЕ1...АЕ27 все оценки точности прогноза являются статистически высоко достоверными. При этом значения всех показателей Го, Ро, Рп значительно превышают точность случайного угадывания.
Таким образом, на примере ГАМКд-агонис-тической активности доказано, что нейросетевая модель на основе спектра энергий докинга химических соединений в множество пространств ГАМКд-рецептора является намного более точной, чем
модель, полученная на основе единичной энергии их докинга в специфический ГАМК-связывающий сайт.
ЗАКЛЮЧЕНИЕ
1. С использованием кластерного анализа построена модель зависимости уровня ГАМКд-агонистической активности химических соединений от энергии их простого докинга в ГАМК-связывающий сайт.
2. С использованием технологии искусственных нейронных сетей построена модель зависимости уровня ГАМКд-агонистической активности от спектра энергий множественного докинга химических соединений по всему пространству ГАМКд-рецептора.
3. Статистическая достоверность и точность прогноза уровня ГАМКд-агонистической активности химических соединений с использованием нейро-сетевой модели на основе спектра значений энергий множественного докинга существенно превышает
JOURNAL MEDICAL UNIVERSITY
ВЕСТНИК
ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО MЕДИНИ11СКОГО УIШВЕРСИТЕТА
аналогичные показатели, полученные с применением модели на основе единичного значения энергии докинга в специфический ГАМК-связывающий сайт ГАМКА-рецептора.
СПИСОК ИСТОЧНИКОВ
1. Васильев П.М., Кочетков А.Н., Спасов А.А., Перфильев М.А. Спектр энергий множественного докинга как многомерная метрика аффинности химических соединений к фармакологически релевантным биомишеням // Волгоградский научно-медицинский журнал. 2021. № 3. С. 57-61.
2. Колмогоров А.Н. О представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного // Доклады АН СССР. 1957. Т. 114, № 5. С. 953-956.
3. Studying Dependences Between the Chemotype Structure of Some Natural Compounds and the Spectrum of Their Targeted Activities Correlated with the Hypoglycemic Effect / P.M. Vasilyev, O.A. Luzina, D.A. Babkov [et al.] // Journal of Structural Chemistry. 2019. Vol. 60, iss. 11. P. 1827-1832.
4. Hilbe J.M. Statistica 7: an overview // The American Statistician. 2007. Vol. 61, no. 1. P. 91-94.
5. Neural network modeling of multitarget RAGE inhibitory activity / P.M. Vassiliev, A.A. Spasov, L.R. Yanaliyeva [et al.] // Biochemistry (Moscow) Supplement Series B: Biomedical Chemistry. 2019. Vol. 13, no. 3. P. 256-263.
6. Marvin Pro. URL: https://chemaxon.com/products/ marvin.
7. MOPAC, Stewart Computational Chemistry. URL: http://openmopac.net/.
8. Structure of a human synaptic GABAa receptor / S. Zhu, C.M. Noviello, J. Teng [et al.] // Nature. 2018. Vol. 559 (7712). P. 67-72.
9. RCSB PDB, Research Collaboratory for Structural Bioinformatics Protein Data Bank. URL: https://www.rcsb.org/.
10. Laskowski R.A., Swindells M.B. LigPlot+: multiple ligand-protein interaction diagrams for drug discovery // Journal of Chemical Information and Modeling. 2011. Vol. 51, iss. 10. P. 2778-2786.
11. Trott O., Olson A.J. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading // Journal of Computational Chemistry. 2010. Vol. 31, iss. 2. P. 455-461.
12. Gupta M., Sharma R., Kumar A. Docking techniques in pharmacology: How much promising? // Comput Biol Chem. 2018. Vol. 76. P. 210-217.
13. Глотов Н.В., Животовский Л.А., Хованов Н.В., Хромов-Борисов Н.Н. Биометрия. Л.: Изд-во Ленингр. ун-та, 1982. 264 с.
14. Нейронные сети. Statistica Neural Networks: Методология и технология современного анализа данных. М.: Горячая линия - Телеком, 2008. 392 с.
REFERENCES
1. Vassiliev P.M., Kochetkov A.N., Spasov A.A., Perfilev M.A. The energy spectrum of multiple docking as a multidimensional metric of the affinity of chemical compounds to pharmacologically relevant biotargets. Volgogradskiy nauchno-meditsinskiy zhurnal = Volgograd Journal of Medical Research. 2021;3:57-61. (In Russ.).
2. Kolmogorov A.N. On the representation of continuous functions of several variables as a superposition of continuous functions of one variable. Doklady AN SSSR = Reports of the Academy of Sciences of the USSR. 1957;114(5):953-956. (In Russ.).
3. Vasilyev P.M., Luzina O.A., Babkov D.A., Appazova D.T., Salakhutdinov N.F., Spasov A.A. Studying Dependences Between the Chemotype Structure of Some Natural Compounds and the Spectrum of Their Targeted Activities Correlated with the Hypoglycemic Effect. Journal of Structural Chemistry. 2019;60(11):1827-1832.
4. Hilbe J.M. Statistica 7: an overview. The American Statistician. 2007;61(1):91-94.
5. Vassiliev P.M., Spasov A.A., Yanaliyeva L.R. et al. Neural network modeling of multitarget RAGE inhibitory activity. Biochemistry (Moscow) Supplement Series B: Biomedical Chemistry. 2019;13(3):256-263.
6. Marvin Pro. URL: https://chemaxon.com/products/marvin.
7. MOPAC, Stewart Computational Chemistry. URL: http://openmopac.net/.
8. Zhu S., Noviello C.M., Teng J. et al. Structure of a human synaptic GABAa receptor. Nature. 2018; 559(7712):67-72.
9. RCSB PDB, Research Collaboratory for Structural Bio-informatics Protein Data Bank. URL: https://www.rcsb.org/.
10. Laskowski R.A., Swindells M.B. LigPlot+: multiple ligand-protein interaction diagrams for drug discovery. Journal of Chemical Information and Modeling. 2011;51(10):2778-2786.
11. Trott O., Olson AJ. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization and multithreading. Journal of Computational Chemistry. 2010;31(2):455-461.
12. Gupta M., Sharma R., Kumar A. Docking techniques in pharmacology: How much promising? Comput Biol Chem. 2018;76:210-217.
13. Glotov N.V., Zhivotovskiy L.A., Khovanov N.V., Khro-mov-Borisov N.N. Biometrics. Leningrad; Leningrad University Publishing House, 1982. 264 p. (In Russ.).
14. Neural networks. Statistica Neural Networks: Methodology and technology for modern data analysis. Moscow: Hot line - Telecom, 2008. 392 p. (In Russ.).
Авторы заявляют об отсутствии конфликта интересов.
Информация об авторах
П.М. Васильев - доктор биологических наук, заведующий лабораторией информационных технологий в фармакологии и компьютерного моделирования лекарств, Научный центр инновационных лекарственных
ВЕСТНИК
: ВОЛГОГРАДСКОГО ГОСУДАРСТВЕННОГО МЕДИЦИНСКОГО УНИВЕРСИТЕТА
средств с опытно-промышленным производством, профессор кафедры фармакологии и биоинформатики, Волгоградский государственный медицинский университет, Волгоград, Россия;
А.Н. Кочетков - системный администратор, инженер-программист лаборатории информационных технологий в фармакологии и компьютерного моделирования лекарств, Научный центр инновационных лекарственных средств с опытно-промышленным производством, Волгоградский государственный медицинский университет, Волгоград, Россия;
М.А. Перфильев - старший лаборант лаборатории информационных технологий в фармакологии и компьютерного моделирования лекарств, Научный центр инновационных лекарственных средств с опытно-промышленным производством; ассистент, аспирант кафедры фармакологии и биоинформатики, Волгоградский государственный медицинский университет, Волгоград, Россия.
Статья поступила в редакцию 02.10.2022; одобрена после рецензирования 18.11.2022; принята к публикации 06.12.2022.
The authors declare no conflicts of interests.
Information about the authors
P.M. Vasiliev - Doctor of Biological Sciences, Head of the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Drugs, Research Center for Innovative Medicines with Pilot Production, Professor of the Department of Pharmacology and Bioinformatics, Volgograd State Medical University, Volgograd, Russia;
A.N. Kochetkov - System Administrator, Software Engineer of the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Medicines, Scientific Center for Innovative Medicines with Pilot Production, Volgograd State Medical University, Volgograd, Russia;
M.A. Perfiliev - senior laboratory assistant at the Laboratory of Information Technologies in Pharmacology and Computer Modeling of Medicines, Scientific Center for Innovative Medicines with Pilot Production; Assistant, postgraduate student of the Department of Pharmacology and Bioinformatics, Volgograd State Medical University, Volgograd, Russia.
The article was submitted 02.10.2022; approved after reviewing 18.11.2022; accepted for publication 06.12.2022.
JOURNAL OF VOLGOGRAD STATE MEDICAL UNIVERSITY