Научная статья на тему 'ВИРТУАЛЬНЫЙ СКРИНИНГ И МОЛЕКУЛЯРНЫЙ ДИЗАЙН ПОТЕНЦИАЛЬНЫХ ИНГИБИТОРОВ SARS-COV-2'

ВИРТУАЛЬНЫЙ СКРИНИНГ И МОЛЕКУЛЯРНЫЙ ДИЗАЙН ПОТЕНЦИАЛЬНЫХ ИНГИБИТОРОВ SARS-COV-2 Текст научной статьи по специальности «Фундаментальная медицина»

CC BY
106
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОТЕАЗА M PRO / QSAR / МОЛЕКУЛЯРНЫЕ ДЕСКРИПТОРЫ / МАШИННОЕ ОБУЧЕНИЕ / СТРУКТУРНАЯ ИНТЕРПРЕТАЦИЯ

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Тиньков Олег Викторович, Григорьев Вениамин Юрьевич, Григорьева Людмила Дмитриевна

Согласно недавно проведенным исследованиям, главная протеаза M pro вируса SARS-CoV-2, которая является важнейшей мишенью при разработке перспективных лекарственных средств для лечения COVID-19, эволюционно консервативна и не претерпела значительных изменений по сравнению с главной протеазой M pro вируса SARS-CoV. Многие исследователи отмечают высокую схожесть сайтов связывания главной протеазы M pro вирусов SARS-CoV и SARS-CoV-2, поэтому в условиях нарастающей эпидемии выглядят логичными дальнейшие исследования ингибиторов главной протеазы M pro вируса SARS-CoV для борьбы с COVID-19. В ходе исследования с применением симплексных, фрактальных, HYBOT- дескрипторов , методов частичных наименьших квадратов, случайного леса, опорных векторов, градиентного бустинга, а также интернет - платформы OCHEM (https://ochem.eu), в которой реализованы различные типы молекулярных дескрипторов и методы машинного обучения, построены удовлетворительные QSAR- модели. Для полученных моделей проведена структурная интерпретация, позволившая выделить молекулярные фрагменты, повышающие и понижающие активность ингибиторов SARS-CoV. Результаты структурной интерпретации использованы для рационального молекулярного дизайна потенциальных ингибиторов SARS-CoV-2. Полученные QSAR- модели использованы для виртуального скрининга 2087 одобренных FDA лекарственных средств.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по фундаментальной медицине , автор научной работы — Тиньков Олег Викторович, Григорьев Вениамин Юрьевич, Григорьева Людмила Дмитриевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VIRTUAL SCREENING AND MOLECULAR DESIGN OF POTENTIAL SARS-COV-2 INHIBITORS

According to recent studies, the main M pro protease of the SARS-CoV-2 virus, which is the most important target in the development of promising drugs for the treatment of COVID-19, is evolutionarily conservative and has not undergone signi f cant changes compared to the main M pro protease of the SARS-CoV virus. Many researchers have noted a high similarity between the binding sites of the main M pro protease of the SARS-CoV and SARS-CoV-2 viruses, so in the context of an increasing epidemic, further research of inhibitors of the main mpro protease of the SARS-CoV virus to f ght COVID-19 seems logical. QSAR methods (Quantitative Structure - Activity Relationship), which were applied in this paper in the analysis of inhibitors of SARS-CoV main M pro protease, can signi f cantly help in reducing time and f nancial costs for repositioning and developing new drugs. In the study using simplex, fractal, HYBOT descriptors, methods Partial Least Squares (PLS), Random Forest (RF), Support Vectors, Gradient Boosting (GBM), as well as the OCHEM Internet platform (https://ochem.eu), where different types of molecular descriptors, machine learning methods are implemented, QSAR models were built. For the obtained models, a structural interpretation was performed, which allowed us to identify molecular fragments that increase and decrease the activity of SARS-CoV inhibitors. The structural interpretation results were used for the rational molecular design of potential SARS-CoV-2 inhibitors. The QSAR models were also used for a virtual screening of 2087 FDA-approved drugs.

Текст научной работы на тему «ВИРТУАЛЬНЫЙ СКРИНИНГ И МОЛЕКУЛЯРНЫЙ ДИЗАЙН ПОТЕНЦИАЛЬНЫХ ИНГИБИТОРОВ SARS-COV-2»

УДК 544.165:615.917

ВИРТУАЛЬНЫЙ СКРИНИНГ И МОЛЕКУЛЯРНЫЙ ДИЗАЙН ПОТЕНЦИАЛЬНЫХ ИНГИБИТОРОВ SARS-COV-2

О.В. Тиньков12*, В.Ю. Григорьев3, Л.Д. Григорьева4

Кафедра фармакологии и фармацевтической химии медицинского факультета Приднестровского государственного университета имени Т.Г. Шевченко, Тирасполь, Приднестровье, Молдова; 2 Военный институт Министерства обороны, Тирасполь, Приднестровье, Молдова; 3 Институт физиологически активных веществ РАН, Черноголовка, Россия; 4Факультет фундаментальной физико-химической инженерии МГУ имени М.В. Ломоносова, Москва, Россия; e-mail: oleg.tinkov.chem@mail.ru)

Согласно недавно проведенным исследованиям, главная протеаза Mpro вируса SARS-CoV-2, которая является важнейшей мишенью при разработке перспективных лекарственных средств для лечения COVID-19, эволюционно консервативна и не претерпела значительных изменений по сравнению с главной протеазой Mpro вируса SARS-CoV. Многие исследователи отмечают высокую схожесть сайтов связывания главной протеазы Mpro вирусов SARS-CoV и SARS-CoV-2, поэтому в условиях нарастающей эпидемии выглядят логичными дальнейшие исследования ингибиторов главной протеазы Mpro вируса SARS-CoV для борьбы с COVID-19. В ходе исследования с применением симплексных, фрактальных, HYBOT-дескрипторов, методов частичных наименьших квадратов, случайного леса, опорных векторов, градиентного бустинга, а также интернет-платформы OCHEM (https://ochem.eu), в которой реализованы различные типы молекулярных дескрипторов и методы машинного обучения, построены удовлетворительные QSAR-модели. Для полученных моделей проведена структурная интерпретация, позволившая выделить молекулярные фрагменты, повышающие и понижающие активность ингибиторов SARS-CoV. Результаты структурной интерпретации использованы для рационального молекулярного дизайна потенциальных ингибиторов SARS-CoV-2. Полученные QSAR-модели использованы для виртуального скрининга 2087 одобренных FDA лекарственных средств.

Ключевые слова: протеаза Mpro, QSAR, молекулярные дескрипторы, машинное обучение, структурная интерпретация.

В 2002 г. мировое сообщество столкнулось с коронавирусом 8ЛЯ8-СоУ, который вызвал эпидемию атипичной пневмонии (тяжелый острый респираторный синдром). Первые случаи заражения коронавирусом 8ЛЯ8-СоУ были отмечены в южном Китае, далее эпидемия распространилась на 29 стран, в результате чего было заражено более 8 тыс. человек, при этом 916 человек погибли [1]. В 2012 г. в Саудовской Аравии была зафиксирована вторая эпидемия, вызванная распространением коронавируса, в данном случае вируса МБЯ8-СоУ, для которого характерна более высокая летальность. К концу августа 2015 г. из общего числа зараженных (1511 пациентов) погибли 574 человека [2], т.е. летальность от коронавируса МБЯ8-СоУ составила более 37%, в отличие от 8ЛЯ8-СоУ, для которого летальность оценивается примерно в 10%.

Ряд экспертов спрогнозировали возникновение угрозы для человечества, которая будет вызвана новым типом коронавируса [3]. Авторы настояще-

го исследования предположили, что новый коро-навирус, циркулирующий в популяциях китайских подковоносых летучих мышей, будет связываться с человеческим ангиотензинпревращающим ферментом 2 (angiotensin converting enzyme II, ACE2) с последующей эффективной репликацией в клетках дыхательной системы.

К сожалению, прогнозы вышеуказанных экспертов оказались верными и 8 декабря 2019 г китайские органы здравоохранения зафиксировали первый случай заражения новым коронавирусом SARS-CoV-2 [4]. Уровень летальности от нового коронавируса SARS-CoV-2 по оценкам меньше, чем у SARS-CoV и MERS-CoV (примерно 7%), однако было показано, что для заражения первых 1000 пациентов коронавирусом SARS-CoV-2 необходимо всего 48 дней, в то время как для заражения SARS-CoV требуется 130 дней, для MERS-CoV - два с половиной года [5].

В настоящее время пандемия, вызванная новым коронавирусом SARS-CoV-2, представляет серьез-

ную медицинскую и социально-экономическую проблему для всего человечества.

Рекомендованный в Российской Федерации препарат «Фавипиравир» для лечения СОУГО-19 [6], по мнению ряда исследователей, имеет тератогенный эффект [7]. Таким образом, поиск и разработка высокоэффективных, безопасных лекарственных средств, способных остановить распространение пандемии СОУГО-19, является актуальной задачей.

Существенную помощь в снижении временных и финансовых затрат при репозиционировании и разработке новых лекарственных средств могут оказать методы хемоинформатики [8-10]. В этом направлении с момента появления нового корона-вируса 8ЛЯ8-СоУ-2 проведено достаточно много исследований с использованием методов молекулярного докинга, молекулярной динамики и фар-макофорного анализа [11-22].

В настоящее время молекулярную структуру потенциальных ингибиторов 8ЛЯ8-СоУ-2 рассматривают с разных точек зрения. Получаемая при этом разноплановая информация представляет значительный интерес для мирового научного и медицинского сообщества. В проведенных исследованиях наиболее значимой мишенью для разрабатываемых лекарственных средств служит главная протеаза вируса Мрго, также известная как 3-химотрипсиноподобная протеаза (3СЬрго), которая играет ключевую роль в репликации ко-ронавирусов. Установлено, что данный фермент, будучи эволюционно консервативным, не претерпел значительных изменений, в отличие от главной протеазы Мрго вируса 8ЛЯ8-СоУ, который вызвал вспышку острого респираторного синдрома в 2002-2003 гг. [23-27]. Исследования, проведенные ранее, также указывают на консервативность последовательностей и пространственных структур Мрго разных видов коронавирусов [28]. При этом в организме человека близкие гомологи данного фермента не выявлены, что положительно влияет на специфичность и снижение числа потенциальных побочных эффектов ингибиторов главной протеазы Мрго [29].

Так, в работе [25] на основании схожести сайтов связывания главной протеазы Мрго вирусов 8ЛЯ8-СоУ и 8ЛЯ8-СоУ-2 с применением метода молекулярного докинга проведен виртуальный скрининг библиотеки химических соединений Бг^Вапк [30]. В результате предложен список из десяти потенциальных ингибиторов главной протеазы Мрго, которые, по мнению авторов [25], наиболее перспективны для борьбы с 8ЛЯ8-СоУ-2.

В исследовании [31] первоначально были отобраны соединения, входящие в список лекарственных средств традиционной китайской медицины. Для этих соединений дана оценка таких фармакокинетических характеристик, как адсорбция, распределение, метаболизм и выведение. Наиболее перспективные соединения изучены с помощью молекулярного докинга. Следующим этапом стал отбор лекарственных трав, которые содержат, как минимум, два соединения, предложенных в ходе молекулярного до-кинга. В результате проведенного исследования авторами [31] определены 26 лекарственных трав китайской медицины, потенциально перспективных для лечения заболевания COVID-19, вызванного коронавирусом SARS-CoV-2.

Заслуживает особого внимания публикация [23], в которой приведены результаты консенсус-ного in vitro и in silico скрининга. Авторы исследовали базу, представленную более чем 10 тыс. соединений, для которых экспериментально измеряли связывание c Mpro коронавируса SARS-CoV-2 методом флуоресцентного резонансного переноса энергии. Наиболее перспективными оказались семь соединений, которые дополнительно исследовали на способность предотвращать инфицирование клеток вирусом SARS-CoV-2. Скрининг In silico для этих 10 тыс. соединений был выполнен с помощью программ Glide v8.2 и Maestro (Schrodinger). Согласно консенсусным результатам, наиболее перспективными оказались эбселен (2-фенил-1,2-бензоселеназол-3-он, CAS номер 60940-34-3), кар-мофур (1-гексилкарбамоил-5-фторурацил, CAS номер 61422-45-5), соединение TDZD-8 (2-метил-4-(фенилметил)-1,2-атиадиазолидин-3,5-дион, CAS номер 327036-89-5), а также предложенный ранее ингибитор SARS-CoV - пепдитомиметик N3, который по реакции Михаэля ковалентно связывается с Mpro.

Авторы [32] провели виртуальный скрининг 1,3 млрд молекул в целях выявления наиболее активных ингибиторов главной протеазы Mpro вируса SARS-CoV-2. В данном исследовании был использован недавно разработанный алгоритм глубокого докинга (Deep Docking), который интегрировал классический докинг и методические основы построения моделей QSAR (количественное соотношение структура - активность; Quantitative Structure - Activity Relationship), что позволило увеличить производительность скрининга по сравнению с традиционными методами докин-га. Авторы отмечают, что оценочные функции определяются используемыми методами докинга, а модели QSAR применяются для оптимизации

виртуального скрининга. По результатам виртуального скрининга предложен хит-лист из 1000 соединений, который доступен к свободному скачиванию по ссылке https://drive.google.com/drive/ folders/1xgA8ScPRqIunxEAXFrUEkavS7y3tLIMN.

С использованием глубокого обучения проведено исследование [33], в котором разработаны модели, описывающие структуру соединений с помощью строк символов, составленных по правилам SMILES [34]. Принцип использованного метода прогнозирования основан на технологии под названием «Обработка естественного языка»

[35], применяемой при анализе человеческой речи компьютером, только в данном случае в качестве языка выступает строка символов, записанная по правилам SMILES, и последовательность целевого протеина. Для выявления и анализа закономерностей использовали сверточные нейронные сети

[36]. В ходе исследования была спрогнозирована активность ингибиторов главной протеазы Mpro, РНК репликазы (RNA-dependent RNA-polymerase, RdRP), хеликазы и ряда других ферментов вируса SARS-CoV-2. Для сравнительного исследования применяли молекулярный докинг (в частности, программу AutoDock Vina v. 1.1.2). В результате авторы выделили три препарата против ВИЧ (ри-тонавир, атазанавир, эфавиренц), а также противовирусное средство ганцикловир.

Другой мишенью для борьбы с коронавиру-сом служит TMPRSS2-протеаза (Transmembrane protease, serine 2, мембрано-связанная сериновая протеаза), ингибиторы которой могут предотвращать проникновение вириона в клетку [37]. Однако исследований, посвященных компьютерному моделированию ингибиторов TMPRSS2-протеазы, значительно меньше, чем главной протеазы Mpro. Так, можно отметить публикацию [38], в которой с помощью молекулярного докинга и фармакофорного анализа был проведен виртуальный скрининг базы данных, содержащей более 30 тыс. природных соединений. Для отобранных 12 соединений авторы оценили адсорбцию, распределение, метаболизм, выведение и токсичность. Наиболее перспективным оказалось низкомолекулярное соединение гени-позид (CAS номер 24512-63-8).

Таким образом, большинство работ выполнены с использованием метода молекулярного докин-га, который, как любой метод исследования, имеет ограничения. В частности, методологические трудности докинга связаны с учетом конформаций лиганда, выбором методов построения оценочной функции и гибкостью рецепторов. Основные методы молекулярного докинга, а также присущие

им ограничения подробно освещены в обзорных публикациях [39-41].

Альтернативным методом компьютерной разработки лекарственных средств является QSAR, который успешно себя зарекомендовал при решении различных задач [42]. В литературе имеются сведения о схожести сайтов связывания главной протеазы Mpro вирусов SARS-CoV и SARS-CoV-2, подтвержденные в ходе независимых исследований [23-27]. В связи с этим мы предположили, что оценка потенциальных ингибиторов SARS-CoV-2 при разработке лекарственных средств может быть реализована с помощью QSAR-моделей ингибиторов SARS-CoV.

Авторы [43] разработали QSAR-модель ингибиторов SARS-CoV с использованием методов 3D-QSAR (CoMFA, CoMSIA), ограничительной особенностью которых является неоднозначность трехмерного выравнивания структур исследуемых соединений [44]. В другом исследовании [45] были разработаны 33 QSAR-модели ингибиторов SARS-CoV, однако авторами не приведены показатели прогнозирующей способности, оцененные с помощью соединений тестовой выборки.

В соответствии с пятым принципом QSAR-моделирования, разработанным экспертной группой OECD [46], желательна интерпретация полученных моделей. В рассмотренных публикациях [43, 45] отсутствует структурная интерпретация QSAR-моделей, что не позволяет проводить молекулярный дизайн и ограничивает применение результатов моделирования для исследования механизмов биологических реакций [47].

Недавно опубликовано исследование [48], в котором в рамках поиска эффективных лекарственных средств против COVID-19 предложены приемлемые QSAR-модели ингибиторов главной протеазы Mpro вируса SARS-CoV, которые разработаны с помощью PaDEL- и Dragon-дескрипторов, а также метода множественной линейной регрессии (Multiple Linear Regression, MLR). Используя разработанные QSAR-модели, авторы провели виртуальный скрининг более 50 тыс. различных соединений в целях выявления наиболее активных ингибиторов главной протеазы Mpro вируса. Исходя из предложенных регрессионных уравнений, а именно вкладов некоторых значимых дескрипторов, авторы [48] проанализировали влияние структурных особенностей изучаемых соединений на изменение ингибирующей активности.

В работе [49] для 54 пептидомиметиков разработаны адекватные QSAR-модели ингибито-

ров SARS-CoV, в ходе структурной интерпретации которых определены молекулярные фрагменты, понижающие и повышающие данный вид активности. Для построения моделей авторы [49] также использовали метод MLR.

Примененный в [48, 49] регрессионный метод анализа данных MLR может давать адекватные результаты только при наличии линейной связи между структурой и активностью [50]. Одним из способов преодоления вышеуказанного недостатка может быть использование непараметрических методов, в частности различных методов машинного обучения (machine learning, ML).

Особого внимания заслуживает исследование [27], в ходе которого разработаны высококачественные классификационные QSAR-модели ингибиторов SARS-CoV. Достоверность сконструированных QSAR-моделей была подтверждена последующими экспериментальными исследованиями, в результате которых некоторые соединения продемонстрировали высокую активность и были рекомендованы для дальнейшего изучения. Параллельно QSAR-анализу авторы [27] проводили исследование методами молекулярного докинга, при этом выявленный неприемлемо низкий уровень предсказательной способности не позволил принимать во внимание результаты изучения ингибиторов SARS-CoV методами молекулярного докинга. Несомненно, работа [27] очень успешна, однако в ней отсутствует структурная интерпретация QSAR-моделей.

Настоящее исследование состояло из следующих этапов:

1) построение QSAR-моделей ингибиторов главной протеазы Mpro SARS-CoV;

2) проведение виртуального скрининга наибо-

лее перспективных соединений - потенциальных лекарственных средств для лечения СОУГО-19;

3) структурная интерпретация р8ЛЯ-моделей и рациональный молекулярный дизайн ингибиторов главной протеазы Мрго.

Методы исследований

Источником формирования выборки для Р8ЛЯ-моделирования послужила общеизвестная база данных СИБМВЬ (ГО: СИБМВЬ3927) [51]. Из полученной выборки были удалены неорганические соединения, полимеры, смеси, соединения в солевой форме. Окончательный набор ингибиторов главной протеазы Мрго 8ЛЯ8-СоУ содержал 65 соединений.

Приведенные в первоисточниках экспериментальные значения активности ингибиторов главной протеазы Мрго 8ЛЯ8-СоУ, выраженные с помощью концентрации полумаксимального инги-бирования (1С50, пМ или цМ), были сконвертиро-ваны (1) в отрицательный десятичный логарифм величины р1С50, который общепринят в Р8ЛЯ-исследованиях и используется в тех случаях, когда линейный рост концентрации вызывает экспоненциальный рост эффекта:

PIC50 = -l°glo(IC5o).

(1)

Экспортированные экспериментальные значения и структуры соединений приведены в Приложении (табл. 1 П).

Для описания молекулярной структуры использовали 2Э-симплексные дескрипторы, которые рассчитываются в рамках симплексного представления молекулярной структуры (СПМС, Simplex representation of molecular structure, SIRMS) [52]. В рамках SIRMS молекула рассматривается как система различных симплексов -

Рис. 1. Пример 2Б-генерации симплексных дескрипторов для аланина на 2Б-уровне при использовании дифференциации атомов по их парциальным зарядам

С о А OB

W(C) = Х(А) - Х(В)

Рис. 2. Использованный принцип структурной интерпретации."ЩС) - вклад фрагмента (С), Х(А) - предсказанное значение активности родительской структуры (А); Х(В) - предсказанное значение активности для гипотетической

структуры (В)

четырехатомных молекулярных фрагментов фиксированной структуры (рис. 1).

Дескриптором в данном случае служит число симплексов определенного вида. На 2Э-уровне атомы (вершины симплекса) дифференцируют не только по природе «метке» атома, но и с учетом различных физико-химических свойств (частичного заряда на атоме, липофильности, рефракции, способности выступать донором или акцептором водорода при образовании водородной связи).

Структурную интерпретацию проводили в соответствии с подходом [53], при котором вклад исследуемого фрагмента (С) рассчитывали путем нахождения разницы между рассчитанными значениями активности для родительской структуры (А) и гипотетической структуры (В), полученной удалением исследуемого фрагмента (С) из родительской структуры (А) (рис. 2).

При моделировании с использованием симплексных дескрипторов применяли пакет «Scikit-learn» [54] для языка программирования Python, в котором реализованы методы частичных наименьших квадратов (Partial Least Squares, PLS), случайного леса (Random Forest, RF), опорных векторов (Support Vector Machine, SVM), градиентного бу-стинга (Gradient Boosting Method, GBM).

Ввиду небольшого числа изучаемых соединений и их структурного разнообразия была проведена пятикратная внутренняя кросс-валидация (CV, 5-fold cross validation). Для этого все соединения обучающей выборки случайным образом разделяются на пять частей. Затем на четырех частях данных, объединенных в обучающую выборку, производят построение (обучение) QSAR-модели, а оставшуюся часть данных используют как внешнюю тестовую выборку, т.е. на соединениях этой группы проверяют предсказательную способность модели. Эта процедура повторяется 5 раз, в результате чего каждая из пяти частей данных последо-

вательно используется для тестирования. Важно подчеркнуть, что исследуемые соединения никогда не являются одновременно частью как обучающей, так и внешней тестовой выборки.

При QSAR-моделировании для тестовых выборок учитывали вхождение соединений в область применимости (applicability domain, AD) [55], при этом если значение хотя бы одного дескриптора выходило за пределы его минимального или максимального значения для обучающей выборки, то соединение тестовой выборки, содержащее этот дескриптор, не входило в область применимости (bounding box). Вышеописанный подход для QSAR-моделирования с использованием симплексных дескрипторов реализован в виде программного обеспечения «SPCI», которое находится в свободном доступе по адресу http://qsar4u. com/pages/sirms_qsar.php.

Помимо этого, для QSAR-анализа мы использовали интернет-платформу «OCHEM» (https:// ochem.eu). Наилучшие результаты при моделировании были достигнуты с использованием ряда дескрипторов (ALogPS, OEstate, Dragon, CDK, ISIDA Fragments, StructuralAlerts, alvaDesc), а также методов случайного леса и ассоциативных нейронных сетей (Associative Neural Networks, ASNN). Построение консенсусной модели проводили путем усреднения прогнозов лучших индивидуальных моделей. При этом область применимости оценивалась с помощью концепции «расстояние до модели» (в частности, подхода «CLASS-LAG»). Краткое описание использованных методов, дескрипторов, а также ссылки на оригинальные работы приведены в руководстве пользователя «OCHEM» [56].

В интернет-ресурсе «OCHEM» реализован метод молекулярных пар [57], который также позволяет проводить интерпретацию моделей, построенных на любых дескрипторах.

Оценку точности и прогностической способности предложенных в работе моделей и их сравнение с другими р8ЛЯ-моделями выполняли на основе следующих критериев.

1. Коэффициента детерминации (R ):

R2 = 1 -

т / ^ \2 2 (yt - У,)2 , 1_

/ \2 2 (у - У )2

, V i у i mean '

(2)

где у1 - вычисленное значение свойства для 1-й молекулы, у - наблюдаемое (экспериментальное) значение свойства для 1-й молекулы, т - число молекул в выборке, у1 теап - среднее значение наблюдаемого свойства.

2. Среднеквадратичной ошибки (ЯМ8Б):

RMSE =

2(У, -yt)2

I =1

т

(3)

С учетом того, что рассмотренное выше Р8ЛЯ-моделирование требует привлечения большого числа дескрипторов (сотни и тысячи), для сравнения были сконструированы с применением метода ЯБ [58] регрессионные модели, содержащие небольшое число ИУВОТ-переменных [59] с добавлением ряда топологических и фрактальных

характеристик [60]. В этом случае оценку AD осуществляли с помощью интервального метода.

Для виртуального скрининга мы использовали базу данных DrugBank [30], представленную одобренными FDA лекарственными средствами. Из экспортированной базы данных DrugBank были удалены неорганические соединения, полимеры, смеси и соединения в солевой форме. Окончательная выборка для виртуального скрининга содержала 2087 одобренных FDA лекарственных средств.

Результаты и обсуждение

Результаты QSAR-моделирования приведены в табл. 1-3. Консенсусная модель находится в свободном доступе по ссылке, приведенной в табл. 1. Все сконструированные модели имеют удовлетворительные статистические характеристики и обладают сопоставимой предсказательной способностью.

Для полученных консенсусных QSAR-моделей (табл. 1, 2) была проведена структурная интерпретация. При интерпретации консенсусной модели, построенной с помощью симплексных дескрипторов (табл. 2), были определены вклады молекулярных фрагментов в величину активности ингибиторов главной протеазы Mpro SARS-CoV (рис. 3).

Т а б л и ц а 1

Статистические характеристики QSAR-моделей, разработанных с помощью интернет-

ресурса «OCHEM»

Метод Дескриптор R2cv RMSEcv

ASNN ISIDA Fragments 0,67 0,50

ALogPS, OEstate 0,68 0,49

Dragon 0,66 0,50

CDK 0,60 0,53

alvaDesc 0,65 0,51

RF StructuralAlerts 0,63 0,52

ISIDA Fragments 0,67 0,49

Консенсусная модель (https://ochem,eu/model/43078789) 0,70 0,47

Т а б л и ц а 2

Статистические характеристики QSAR-моделей, разработанных с использованием

2Б-симплексных дескрипторов

Метод Дескрипторы R2 cv RMSE cv

GBM SIRMS 0,57 0,57

RF 0,65 0,51

SVM 0,52 0,60

PLS 0,64 0,52

Консенсусная модель 0,64 0,51

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т а б л и ц а 3

Статистические характеристики 08ЛЯ-модели, разработанной с использованием ИУБОТ, топологических и фрактальных дескрипторов

Метод Дескриптор R2cv RMSEcv

RF * MaxEa; MaxCa;Nv2; IC0; D mb 0,62 0,53

П р и м е ч а н и е. MaxEa - максимальный энтальпийный Н-акцепторный дескриптор; MaxCa - максимальный свободноэнергетический Н-акцепторный дескриптор; Nv2 - число вершин со степенью 2;

IC0 - среднее информационное содержание 0-го порядка; D unb - фрактальная плотность несвязанных атомов. Использованные дескрипторы рассмотрены в работах [59, 60].

Данный набор молекулярных фрагментов сформирован из стандартных функциональных групп (51 фрагмент) и шести молекулярных фрагментов, полученных в ходе автоматической фрагментации соединений обучающей выборки с помощью программы «SPCI» при использовании SMART-шаблона [#6+0;!$(*=,#[!#6])]!@!=!#[*], кодирующего разрываемые связи [53]. Интерпретации подверглись только те молекулярные фрагменты, которые были обнаружены в трех и более соединениях, что, с нашей точки зрения, позволило сконцентрировать внимание на фрагментах, устойчиво влияющих на ингибирующую активность и избежать в некоторой степени влияния случайных факторов, например ошибок в экспериментальных данных или предсказанных значениях активности и вкладах фрагментов. Полный список идентифицированных молекулярных фрагментов, записанных в виде SMARTS, с рассчитанными средними вкладами в активность приведен (Приложение, табл. 2 П).

Проведенная интерпретация позволила количественно описать и ранжировать влияние моле-

кулярных фрагментов на изменение активности ингибиторов Мрго 8АЯ8-СоУ, детализировать молекулярное окружение известных функциональных групп, выделив производные фрагменты, повышающие и понижающие вклады в указанный вид активности. Например, при детализации пиримидина выделен молекулярный фрагмент 2-сульфанилпиримидин-4-ол (Г9 на рис. 3), ко -торый в значительной степени уменьшает активность ингибиторов Мрго 8АЯ8-СоУ. При этом карбоксильные производные фурана и пиридина (фрагменты и Г2 на рис. 3), наоборот, увеличивают активность ингибиторов Мрго 8АЯ8-СоУ.

Интерпретация была также проведена для кон -сенсусной модели (табл. 1), построенной с помощью интернет-ресурса «ОСНЕМ». В табл. 4 приведены результаты интерпретации, согласно которым при замене атомов водорода на хлор или метильную группу возрастает ингибирующая активность. Рост активности ингибиторов Мрго 8АЯ8-СоУ наблюдается также при замене фе-нильных, н-пропильных радикалов на нафтило-вые. Результаты интерпретаций рассмотренных

Г1

(М = 4, N = 4)

.А {2

А (М = 8, N = 8)

Ш:

и

А--Р ГЗ(М = 6^ = 6)

О

А

А 1МН.,

(М = 5, N = 5)

н х

1 1-Аг Г 5 (М = 9, N = 9) ь

03

е. ©

N

(М = 9, N = 10)

XI (М= 10, N = 10)

Г 8 (М = 6,\ = 8)

(М = 6,К = 6)

0 1 2 Вклад фрагмента

Рис. 3. Вклады молекулярных фрагментов в способность соединений ингибировать главную протеазу Mpгo 8ЛЯ8-СоУ Л - место присоединения фрагмента к остальной части молекулы, f - порядковый номер фрагмента, М - количество соединений, содержащих данный фрагмент, N - количество обнаружений соответствующего фрагмента

в выборке

выше консенсусных моделей согласованно указывают на повышение активности ингибиторов Мрго 8ЛЯ8-СоУ при замене фрагментов, содержащих иод (Г 5), на карбамоил группу (Г 4).

С учетом тенденций влияния на изменение активности структуры соединений, выявленных в ходе интерпретации, был проведен рациональный молекулярный дизайн и предложен ряд перспективных агентов против СОУГО-19. При этом была выполнена замена молекулярных фрагментов, уменьшающих активность, на фрагменты, которые, согласно результатам интерпретации, повышают активность ингибито-

ров Мрго. В результате были предложены гипотетические соединения (табл. 5, вещества 2, 4, 6), обладающие значительной рассчитанной ин-гибирующей активностью и входящие в область применимости консенсусной р8ЛЯ-модели, разработанной с помощью «ОСНЕМ». Например, при замене остатка 6-метил-2-сульфанилпиридин-4-ола (соединение 1, табл. 5) на карбоксильное производное пиридина (соединение 2, табл. 5) отмечается значительный рост активности ингибиторов главной протеазы Мрго 8ЛЯ8-СоУ. Также характерно увеличение активности при замене фрагмента, содержащего нитрил (соединение 3)

Т а б л и ц а 4

Результаты интерпретации консенсусной модели, разработанной с помощью интернет-ресурса «OCHEM»

Молекулярная трансформация Пары соединений и их экспериментальные характеристики N Дтеап SMIRKS

I-Н->|-С1 Ссц р о С1 -log10(IC50) = 4,88 —logi0(IC50) = 4,95 2 0,035 ±0,049 *[H] — *C1

[-н — сн3 о р / NH2 н,с Г -log,o(ICjo) = 4,60 log,,) (IC50) = 4,72 2 0,06 ± 0,085 *[H] ->■ C*

о о ^лУ CrO 3 0,54 ± 0,065 *I NC(*)=0

-logio(ICso) - 5,96 -logio(ICso) = 6,43

¿^00 Or" -logio(IC5o) = 4,30 -1o8io(IC5o) = 5,96 2 1,6 ±0,092 *clcccccl —> —>*clccc2ccccc2 cl

У ОУ -log10(IC50) = 5,96 -log10(IC50) =4,18 CCC*-> —>*clccc2ccccc2 cl

2 1,7 ±0,049

П р и м е ч а н и я. N - Количество молекулярных пар, для которых выполняется молекулярная трансформация; Amean - средняя разница значений - log10(IC50) при проведении молекулярной трансформации; SMIRKS - формат записи молекулярной трансформации (https://www.daylight.com/dayhtml/doc/theory/theory.smirks.html).

на трифторметил (соединение 4) или же остатка 4-(1,3-тиазол-4-ил)пиримидин-2-тиола (соединение 5, таблица 5) на упомянутое выше карбоксильное производное пиридина (соединение 6). Необходимо отметить, что при молекулярном дизайне в данных примерах учитывались результаты интерпретации QSAR-модели, построенной с помощью симплексных дескрипторов, в то время как прогнозирование активности ингибиторов проводили с помощью QSAR-модели, построенной интернет-ресурсом «OCHEM».

При определении стратегии синтеза и испытаний помимо целевого свойства (активности) важно оценивать различные виды токсичности и липофильность, которые являются существенными факторами при принятии решения о рекомендации к использованию соединения в качестве действующего вещества лекарственного средства. В этих целях для соединений 1-9 была проведена оценка острой токсичности (LD50) при перораль-ном введении крысам и вероятности проявления мутагенности (тест Эймса) с помощью программы «T.E.S.T. v.4.2.», разработанной специалистами Агентства по охране окружающей среды США [61]. Также для данных соединений с помощью интернет-платформы швейцарского Института биоинформатики «swissADME» (http://www. swissadme.ch/) [62] оценивали липофильность (Log Po/w), соответствие правилам Липински [63], присутствие PAINS фрагментов [64], синтетическую доступность по десятибалльной шкале (0 - максимальная степень синтетической доступности, 10 - минимальная степень синтетической доступности) [65], что крайне важно для предложенных, но еще не синтезированных соединений. Результаты прогнозирования приведены в табл. 6, из которой видно, что предложенные в ходе молекулярного дизайна соединения 2, 4, 6, 8, 9 обладают сопоставимой синтетической доступностью по сравнению с уже синтезированными веществами 1, 3, 5, 7. За исключением соединения 4 все вещества удовлетворяют правилам пяти Липински и не содержат PAINS-фрагментов. Для изучаемых соединений характерен широкий диапазон значений липофильности, что должно учитываться при исследовании фармакокинетики и выборе лекарственных форм. Согласно проведенным расчетам, соединение 7 обладает ненулевой вероятностью проявления мутагенности, что может снизить его привлекательность как соединения-лидера, даже несмотря на то, что оно обладает максимальной экспериментально измеренной ингибирующей активностью (табл. 5) среди соединений экспорти-

рованной выборки из базы данных CHEMBL (ID: CHEMBL3927). При модификации соединения 7 предложено гипотетическое соединение 9, которое согласно расчетным данным не обладает вероятностью проявления мутагенности, при этом показатели LD50 и ингибирующей активности сопоставимы с исходным соединением 7. Кроме того, модификация соединения 1 в соединение 2 позволила не только увеличить ингибирующую активность почти на два порядка, достигнув сопоставимых значений с наиболее активными веществами в экспортируемой выборке, но и уменьшить токсичность (LD50) почти в 2,7 раза. Таким образом, к синтезу и дальнейшим испытаниям может быть рекомендовано соединение 2.

Поскольку синтез новых соединений и их клинические испытания занимают достаточно много времени, важнейшим средством борьбы с новой, быстро распространяющейся пандемией является репозиционирование уже одобренных лекарственных средств, которые прошли все необходимые клинические исследования. В целях выявления перспективных ингибиторов главной протеазы Mpro SARS-CoV-2 был проведен скрининг 2087 одобренных FDA лекарственных средств. Для скрининга использовали консенсусную модель, построенную экспертной системой «OCHEM», поскольку она обладает более высокими статистическими характеристиками и может быть использована всеми заинтересованными лицами для виртуального скрининга собственных наборов соединений. QSAR-модель, полученную с помощью симплексных дескрипторов не использовали, ввиду особенностей вышеописанного метода определения области применимости, сильно ограничивающего структурное пространство модели.

В ходе проведения виртуального скрининга предложено 10 соединений (табл. 7), входящих в область применимости консенсусной QSAR-модели, разработанной с помощью «OCHEM» и обладающих наибольшей рассчитанной ингиби-рующей активностью. Среди данных соединений встречаются противоопухолевые, антипротозой-ные, противогрибковые, антибактериальные, ан-тигипертензивные и противовоспалительные лекарственные средства. Особое внимание привлекают Тилброхинол, Хлороксин, Хлорхинальдол, которые являются галогенпроизводными хиноли-на, как и широко известные хлорохин и гидрокси-хлорохин, которые уже применяются при лечении COVID-19 [66].

Согласно данным виртуального скрининга, наибольшей ингибирующей активностью сре-

ди одобренных FDA лекарственных средств обладает Пексидартиниб, который является противоопухолевым средством, ингибитором тирозинкиназы. В исследовании [12], проведенном с использованием молекулярного докинга и молекулярной динамики, противоопухолевое средство Нератиниб (Neratinib), блокирующее

работу рецепторных тирозинкиназ, также предложено в качестве перспективного ингибитора главной протеазы Мрго 8ЛЯ8-СоУ-2. Выводы авторов [12] основаны на предположении об аналогичном связывании данного противоопухолевого средства с остатком цистеина в активных центрах киназных доменов рецеп-

Т а б л и ц а 5

Результаты молекулярного дизайна

Окончание табл. 5

Т а б л и ц а 6

Оценка некоторых физико-химических свойств, видов токсичности и синтетической доступности соединений, исследуемых в рамках молекулярного дизайна (структуры соединений представлены в табл. 5)

Соединение Log Po/w Число несоответствий правилам Липински Число фрагментов PAINS Синтетиче ская доступность LD50 крысы при пероральном введении, мг/кг Вероятность проявления мутагенности* *

1 3,75 0 0 2,86 1382,28 0

2* 3,71 0 0 2,94 3788,68 0

3 3,35 0 0 3,76 956,51 0

4* 4,45 1 (Молекулярная масса свыше 500) 0 3,89 - 0

5 4,98 0 0 3,33 663,22 0

6* 4,33 0 0 2,78 772,67 0

7 2,18 0 0 2,5 581,59 1

8* 3,28 0 0 2,81 193,04 0

9* 4,58 0 0 3,26 561,22 0

*Гипотетические соединения, предложенные в результате молекулярного дизайна; ** 0 - отрицательная, 1 - положительная; «-» соединение не входит в область применимости Р8ЛЯ модели.

торных тирозинкиназ и главной протеазы Мрго 8ЛЯ8-СоУ-2. Другое противоопухолевое средство кармофур по результатам высокопроизводительного скрининга в упомянутом выше исследовании [23] также было выделено в качестве перспективного ингибитора главной про-теазы Мрго 8ЛЯ8-СоУ-2. Проведенные недавно дополнительные исследования с использованием метода рентгеноструктурного анализа [67] описывают механизм ингибирования главной протеазы Мрго 8ЛЯ8-СоУ-2 кармофуром через ковалентное связывание с остатком цисте-ина Су8145 в активном центре. На основании вышесказанного логичным выглядит предложение о перепрофилировании выявленного в ходе виртуального скрининга пексидартиниба для лечения СОУГО-19. Необходимо отметить, что подтверждение эффективности в борьбе с СОУГО-19 предложенных для перепрофилирования лекарственных средств требует значительных дополнительных экспериментальных исследований. Прием лекарственных средств должен проводиться только по назначению лечащего врача.

Таким образов, в ходе проведения вычислительных экспериментов с применением кон -цептуально различающихся дескрипторов и методов машинного обучения были разработаны приемлемые QSAR-модели ингибиторов главной протеазы Mpro.

Проведенная структурная интерпретация QSAR-моделей позволила выявить общие закономерности влияния структуры химических соединений на их ингибирующую активность путем выделения молекулярных фрагментов и трансформаций, повышающих и понижающих активность ингибиторов SARS-COV. Результаты структурной интерпретации использованы при проведении рационального молекулярного дизайна, в ходе которого предложен ряд перспективных соединений для борьбы с COVID-19.

В процессе виртуального скрининга одобренных FDA лекарственных средств выделено 10 веществ, которые могут быть рекомендованы для перепрофилирования в качестве лекарств против новой коронавирусной инфекции.

Результаты проведенного исследования могут способствовать снижению финансовых,

Т а б л и ц а 7

Одобренные FDA лекарственные средства, которые согласно результатам виртуального скрининга наиболее

перспективны для ингибирования репликации SARS-^V-2

Продолжение табл. 7

Окончание табл. 7

-log,o(IC5o) Название Химическая структура Описание

N II CI Г 0

5,51 Рофлумиласт (Roflumilast) V CI Ч^-^Х/Ч, F Н I J 1 О 1 противовоспалительное средство, представляющее ингибитор фосфодиэстеразы-4 (ФДЭ4)

временных и трудовых затрат при определении стратегии разработки новых лекарственных средств, а также при репозиционировании существующих лекарственных средств - ингибиторов 8ЛЯ8-СоУ-2.

Часть работы выполнена в рамках Государственного задания ИФАВ РАН 2020 года (тема № 0090-2020-0004). Конфликта интересов нет. Имеются дополнительные материалы.

СПИСОК ЛИТЕРАТУРЫ

1. EnserinkM. // Science. 2013. Vol. 339. N 6125. P. 1266 (doi:10.1126/science.339.6125.1266).

2. WHO. Middle East respiratory syndrome Coronavirus (MERS-CoV) — Republic of Korea. Global Alert and Response (GAR). Available from: https://www.who. int/csr/don/01-june-2015-mers-korea/en/ (accessed: 28.09.2020).

3. Menachery V.D., Yount B.L., Jr, Debbink K., Agnihoth-ram S., Gralinski L.E., Plante J.A., Graham R.L., Scobey T., Ge X.Y., Donaldson E.F., Randell S.H., Lanzavecchia A., Marasco W.A., Shi Z.L., Baric R.S. // Nature medicine. 2015. Vol. 21. N 12. P. 1508 (doi:10.1038/nm.3985)

4. Chen N., Zhou M., Dong X., Qu J., Gong F., Han Y., Qiu Y., Wang J., Liu Y., Wei Y., Xia J., Yu T., Zhang X., ZhangL. // Lancet. 2020. Vol. 395. N 10223. P. 507 (doi: 10.1016/S0140-6736(20)30211-7).

5. Comparing the Wuhan coronavirus outbreak with SARS and MERS. Available from: https://graph-ics.reuters.com/CHINA-HEALTH-VIRUS-C0MPARIS0N/0100B5BY3CY/index.html (accessed: 28.09.2020).

6. Минздрав России зарегистрировал первый препарат от коронавируса. Сообщение на официальном сайте Министерства здравоохранения РФ от 01 июня 2020 г. Available from: https://www.rosminzdrav. ru/news/2020/06/01/14086-minzdrav-rossii-zaregis-triroval-pervyy-preparat-ot-koronavirusa (accessed: 28.09.2020).

7. Shiraki K., Daikoku T. // Pharmacology & therapeutics. 2020. Vol. 209, P. 107512 (doi:10.1016/j.phar-mthera.2020.107512).

8. Xu J., Hagler A. // Molecules. 2002. Vol. 7. N 8. P. 566 (doi:10.3390/70800566).

9. Lo Y.C., Rensi S.E., Torng W., Altman R.B. // Drug Dis-cov Today. 2018. Vol. 23. N 8. P. 1538 (doi:10.1016/j. drudis.2018.05.010).

10. Yu W., MacKerell A.D. Jr. // Methods Mol Biol. 2017. Vol. 1520. P. 85 (doi: 10.1007/978-1-4939-6634-9_5).

11. Pant S., Singh M., Ravichandiran V, Murty U., Srivas-tava H.K. // J Biomol Struct Dyn. 2020. Advance online publication. P. 1 (doi: 10.1080/07391102.2020.1757510).

12. Skvortsov V.S., Druzhilovskiy D.S., Veselovsky A.V. // Biomedical Chemistry: Research and Methods. 2020. Vol. 3. N 1. P. e00124 (doi: 10.18097/BMCRM00124).

13. Wang J. // J Chem Inf Model. 2020. Vol. 60. N 6. P. 3277 (doi:10.1021/acs.jcim.0c00179).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14.Mittal L, Kumari A, Srivastava M, Singh M, Ast-hana S. // J Biomol Struct Dyn. 2020. Advance online publication. 1-19 (doi:10.1080/07391102. 2020.1768151).

15.Gyebi G.A., Ogunro O.B., Adegunloye A.P., Oguny-emi O.M., Afolabi S.O. // J Biomol Struct Dyn. 2020. Advance online publication. 1-13 (doi:10.1080/0739110. 2020.1764868).

16. Enmozhi S.K., Raja K., Sebastine I., Joseph J. // J Biomol Struct Dyn. 2020. Advance online publication. 1-7 (doi:10.1080/07391102.2020.1760136).

17. Elmezayen A.D., Al-Obaidi A., §ahin A.T., Yelekgi K. // J Biomol Struct Dyn. 2020. Advance online publication. 1-13 (doi:10.1080/07391102.2020.1758791)

18. Mahanta S., Chowdhury P., Gogoi N., Goswami N., Borah D., Kumar R., Chetia D., Borah P., Buragohain A. K., Gogoi B. // J Biomol Struct Dyn. 2020. Advance online publication. 1-10 (doi:10.1080/07391102.2020.1768902)

19. KandeelM., Al-Nazawi M. // Life Sci. 2020. Vol. 251. P. 117627 (doi:10.1016/j.lfs.2020.117627).

20. Gentile D., Patamia V., Scala A., Sciortino M.T., Piperno A., Rescifina A. // Mar Drugs. 2020. Vol. 18. N 4. P. 225 (doi:10.3390/md18040225).

21. Sepay N., Sepay N., Al Hoque A., Mondal R., Halder U. C., Muddassir M. // Struct Chem. 2020. Vol. 31. P. 1831 (doi:10.1007/s11224-020-01537-5).

22. Shamsi A., Mohammad T., Anwar S., AlAjmi M.F., Hussain A., Rehman M.T., Islam A., Hassan M.I. // Bioscience reports. 2020. Vol. 40. N 6. P. BSR20201256 (doi:10.1042/BSR20201256).

23. Jin Z., Du X., Xu Y., Deng Y., Liu M., Zhao Y., Zhang B., LiX., ZhangL., Peng C., Duan Y., Yu J., WangL., YangK., Liu F., Jiang R., YangX., You T., Liu X., YangX., Yang H. // Nature. 2020. Vol. 582. N 7811. P. 289 (doi: 10.1038/ s41586-020-2223-y).

24. Chen Y.W., Yiu, C.B., Wong, K.Y. // F1000Re-search. 2020, Vol. 9, P. 129 (doi:10.12688/f1000re-search.22457.2).

25. Liu X, Wang X.J. // J Genet Genomics. 2020. Vol. 47. N 2. P. 119 (doi:10.1016/j.jgg.2020.02.001).

26. Ul Qamar M.T., Alqahtani S.M., AlamriM.A., Chen L.L. // J Pharm Anal. 2020. Vol. 10. N 4. P. 313 (doi:10.1016/j. jpha.2020.03.009).

27. Alves V.M., Bobrowski T., Melo-Filho C.C., Korn D.l, Auerbach S., Schmitt C., Muratov E.N., Tropsha A. // Mol. Inform. 2020. Advance online publication (doi:10.1002/ minf.202000113).

28. Xue X., Yu H., Yang H., Xue F., Wu Z., Shen W., Li J., Zhou Z., Ding Y., Zhao Q., Zhang X.C., Liao M., Bart-lam M., and Rao Z. // J. Virol. 2008. Vol. 82. N 5. P. 2515 (doi: 10.1128/JVI.02114-07).

29. Pillaiyar T., Manickam M., Namasivayam V., Hay-ashi Y., Jung S.H. // J Med Chem. 2016. Vol. 59. N 14. P. 6595 (doi:10.1021/acs.jmedchem.5b01461).

30. The DrugBank database, Available from: https://www. drugbank.ca/ (accessed: 28.09.2020).

31. Zhang D.H., Wu K.L., ZhangX., Deng S.Q., Peng B. // J Integr Med. 2020. Vol. 18. N 2. P. 152 (doi:10.1016/j. joim.2020.02.005).

32. Ton A.T., Gentile F., Hsing M., Ban F., Cherka-sov A. // Mol Inform. 2020. Vol. 39. N 8. P. e2000028 (doi:10.1002/minf.202000028).

33. BeckB.R., Shin B., Choi Y., Park S., Kang K. // Comput Struct Biotechnol J. 2020. Vol.18, P.784 (doi:10.1016/j. csbj.2020.03.025).

34. Weininger D. // J. Chem. Inf. Comput. Sci. 1988. Vol. 28. N 1. P. 31 (doi: 10.1021/ci00057a005).

35. Kreimeyer K., Foster M., Pandey A., Arya N., Hal-ford G., Jones S.F., Forshee R., Walderhaug M., Bot-sis T. // J Biomed Inform. 2017. Vol. 73. P. 14 (doi: 10.1016/j.jbi.2017.07.012).

36. Valueva M.V., Nagornov N.N., Lyakhov P.A., Valu-ev G.V., Chervyakov N.I. // Mathematics and Computers in Simulation. 2020. Vol. 177. P. 232 (doi: 10.1016/j. matcom.2020.04.031).

37. Hoffmann M., Kleine-Weber H., Schroeder S., Krüger N., Herrler T., Erichsen S., Schiergens T.S., Herrler G., Wu N.H., Nitsche A., Müller M.A., Dro-sten C., Pöhlmann S. // Cell. 2020. Vol. 181. N 2. P. 271. (doi: 10.1016/j.cell.2020.02.052).

38. Rahman N., Basharat Z., Yousuf M., Castaldo G., Rasrelli L., Khan H. // Molecules. 2020. Vol. 25. N 10. P. E2271 (doi:10.3390/molecules25102271).

39. Zsoldos Z., Reid D., Simon A., Sadjad S.B., Johnson A.P. // J Mol Graph Model. 2007. Vol. 26. N 1. P. 198 (doi:10.1016/j.jmgm.2006.06.002).

40. Pyrkov T.V., Ozerov I.V., Balitskaya E.D., Efremov R.G. // Russ J Bioorg Chem. 2010. Vol. 36. P. 446-455 (doi: 10.1134/S1068162010040023).

41. Sledz P, Caflisch A. // Curr Opin Struct Biol. 2018. Vol. 48. P. 93 (doi:10.1016/j.sbi.2017.10.010).

42. Muratov E.N., Bajorath J., Sheridan R.P., Tetko I.V., Filimonov D., Poroikov V., Oprea T.I., Baskin I.I., Varnek A., Roitberg A., Isayev O., Curtalolo S., Fourches D., Cohen Y., Aspuru-Guzik A., Winkler D.A., Agrafiotis D., Cher-kasov A., Tropsha A. // Chem Soc Rev. 2020. QSAR without borders. Vol. 49. N 11. P. 3525 (doi:10.1039/d0cs00098a).

43. Tsai K.C., Chen S.Y., Liang P.H., Lu I.L., Ma-hindroo N., Hsieh H.P., Chao Y.S., Liu L., Liu D., Lien W., Lin T.H., Wu S.Y. // J Med Chem 2006. Vol. 49. N 12. P. 3485 (doi:10.1021/jm050852f).

44. Todeschini R, Consonni V., Ballabio D., Grisoni F. (2020) Chemometrics for QSAR Modeling // Comprehensive Chemometrics / Eds Brown S., Tauler R., Walczak B. Elsevier, 2944p (doi:10.1016/B978-0-12-409547-2.14703-1).

45. Adhikari N., Baidya S.K., Saha A., Jha T. // Viral Proteases and Their Inhibitors 2017. Structural Insight Into the Viral 3C-Like Protease Inhibitors: Comparative SAR/QSAR Approaches., Published online, P. 317 (doi: 10.1016/B978-0-12-809712-0.00011-3).

46. OECD. 2014. Guidance Document on the Validation of (Quantitative) Structure-Activity Relationship [(Q)SAR] Models, OECD Series on Testing and Assessment, No. 69, OECD Publishing, Paris (doi: 10.1787/9789264085442-en).

47. Polishchuk P. // J. Chem. Inf. Model. 2017. Vol. 57. N 11. P. 2618 (doi:10.1021/acs.jcim.7b00274).

48. Kumar V., Roy K. // SAR QSAR Environ. Res. 2020. Vol. 31. N 7. P. 511 (doi:10.1080/106293 6X.2020.1776388).

49. Masand V.H., Rastija V., Patil M.K., Gandhi A., Chapolikar A. // SAR QSAR Environ. 2020. Vol. 31. N 9. P. 643 (doi: 10.1080/1062936X.2020.1784271).

50. https://sciencing.com/disadvantages-linear-regres-sion-8562780.html (accessed: 28.09.2020).

51. ChEMBL Database. Available from: https://www. ebi.ac.uk/chembl/g/#browse/activities/filter/target_ chembl_id%3ACHEMBL3927%20AND%20standard_ type%3A(%22IC50%22) (accessed: 28.09.2020).

52. Simplex representation of molecular structure - a che-moinformatic tool for calculation of simplex (fragment) descriptors. Available from: https://github.com/DrrDom/ sirms (accessed: 28.09.2020).

53. Polishchuk P., Tinkov O., Khristova T., Ognichenko L., Kosinskaya A., Varnek A., Kuz'min V. // J. Chem. Inf. Model. 2016. Vol. 56. N 8. P. 1455 (doi: 10.1021/acs. jcim.6b00371).

54. Scikit-learn. Free software machine learning library for the Python programming language. Available from: https://scikit-learn.org/stable/ (accessed: 28.09.2020).

55. Jaworska J., Nikolova-Jeliazkova N., Aldenberg T. // Altern Lab Anim. 2005. Vol. 33. N 5. P. 445 (doi:10.117 7/026119290503300508).

56. Web-based platform OCHEM. OCHEM user's manual. Available from: http://docs.ochem.eu/display/MAN/ OCHEM+Introduction (accessed: 28.09.2020).

57. Sushko Y., Novotarskyi S., Korner R., Vogt J., Abdelaziz, A., Tetko I. // J. Cheminf. 2014. Vol. 6. N 1. P. 48 (doi: 10.1186/s13321-014-0048-0).

58. Breiman L. RRforest software. Available from: http:// www.stat.berkeley.edu/~breiman/RandomForests/reg_ examples/RFR (accessed: 28.09.2020).

59. Raevsky O.A., Grigorev V.Yu., KireevD.B., ZefirovN.S. // Quant. Struct.-Act. Relat. 1992. Vol. 11. N 1. P. 49 (doi: 10.1002/qsar.19920110109).

60. Grigorev V.Yu., Grigoreva L.D. // Moscow Univ. Chem. Bull. 2016. Vol. 71. N 3. P. 199 (doi: 10.3103/ S0027131416030056).

61. Martin T., Harten P., Young D., TEST (Toxicity Estimation Software Tool) V 4.1, US Environmental Protection Agency, Washington DC, USA, 2012; Available from: https://www.epa.gov/chemical-research/ toxicity-estimation-software-tool-test (accessed: 28.09.2020).

62. Daina A., Michielin O., Zoete V. // Sci Rep. 2017. Vol. 7. P. 42717. (doi:10.1038/srep42717).

63. Lipinski C.A., Lombardo F., Dominy B.W., Feeney P.J. // Adv. Drug Deliv. Rev. 2001. Vol. 46. P. 3 (doi:10.1016/ S0169-409X(00)00129-0).

64. Dahlin J.L., Nissink J.W., Strasser J.M., Francis S., Higgins L., Zhou H., Zhang Z., Walters M.A. // J. Med. Chem. 2015. Vol. 58. N 5. P. 2091 (doi:10.1021/ jm5019093).

65. Ertl P., Schuffenhauer A. // J Cheminform. 2009. Vol. 1. N 1. P. 8 (doi:10.1186/1758-2946-1-8).

66. Pastick K.A., Okafor E.C., Wang F., Lofgren S.M., Skipper C.P., Nicol M.R., Pullen M.F., Rajasingham R., McDonald E.G., Lee T.C., Schwartz I.S., Kelly L.E., Lother S.A., Mitja O., Letang E., Abassi M., Boulware D.R. // Open Forum Infect Dis. 2020. Vol. 7. N. 4. P. ofaa130. (doi:10.1093/ofid/ofaa130).

67. Jin Z., Zhao Y., Sun Y., Zhang B., Wang H., Wu Y., Zhu Y., Zhu C., Hu T., Du X., Duan Y., Yu J., Yang X., Yang, K., Liu X., Guddat L.W., Xiao G., Zhang L., Yang H., Rao Z. // Nat Struct Mol Biol. 2020. Vol. 27. N. 6. P. 529 (doi:10.1038/s41594-020-0440-6).

Поступила в редакцию 11.01.2021 Получена после доработки 14.01.2021 Принята к публикации 20.01.2021

VIRTUAL SCREENING AND MOLECULAR DESIGN OF POTENTIAL SARS-COV-2 INHIBITORS

O.V. Tinkov1, 2*, V.Yu. Grigorev3, L.D. Grigoreva4

(1 Department of Pharmacology and Pharmaceutical Chemistry, Medical Faculty, Shevchenko Transnistria State University, Tiraspol, Moldova; 2Military Institute of the Ministry of Defense, Tiraspol, Moldova; 3'Institute of Physiologically Active Compounds of the Russian Academy of Science, Chernogolovka, Russia; 4Department of Fundamental Physical-Chemical Engineering, Lomonosov Moscow State University; *e-mail: oleg.tinkov.chem@mail.ru)

According to recent studies, the main Mpro protease of the SARS-CoV-2 virus, which is the most important target in the development of promising drugs for the treatment of COVID-19, is evolutionarily conservative and has not undergone significant changes compared to the main Mpro protease of the SARS-CoV virus. Many researchers have noted a high similarity between the binding sites of the main Mpro protease of the SARS-CoV and SARS-CoV-2 viruses, so in the context of an increasing epidemic, further research of inhibitors of the main mpro protease of the SARS-CoV virus to fight COVID-19 seems logical. QSAR methods (Quantitative Structure - Activity Relationship), which were applied in this paper in the analysis of inhibitors of SARS-CoV main Mpro protease, can significantly help in reducing time and financial costs for repositioning and developing new drugs. In the study using simplex, fractal, HYBOT descriptors, methods Partial Least Squares (PLS), Random Forest (RF), Support Vectors, Gradient Boosting (GBM), as well as the OCHEM Internet platform (https://ochem.eu), where different types of molecular descriptors, machine learning methods are implemented, QSAR models were built. For the obtained models, a structural interpretation was performed, which allowed us to identify molecular fragments that increase and decrease the activity of SARS-CoV inhibitors. The structural interpretation results were used for the rational molecular design of potential SARS-CoV-2 inhibitors. The QSAR models were also used for a virtual screening of 2087 FDA-approved drugs.

Key words: Mpro protease, QSAR, molecular descriptors, machine learning, structural interpretation.

Сведения об авторах: Тиньков Олег Викторович - доцент кафедры фармакологии и фармацевтической химии медицинского факультета Приднестровского государственного университета; заместитель начальника учебной части Военного института, канд. хим. наук (oleg.tinkov.chem@mail.ru); Григорьев Вениамин Юрьевич - зав. отделом компьютерного молекулярного дизайна ИФАВ РАН, докт. хим. наук (beng@ipac.ac.ru); Григорьева Людмила Дмитриевна - зам. декана по учебной работе, доцент факультета фундаментальной физико-химической инженерии МГУ имени М.В. Ломоносова, канд. физ.-матем. наук (ldg@physchem.msu.ru).

П р и л о ж е н и е

Т а б л и ц а 1 П

Структуры и активности исследуемых соединений

Номер Мо1еси1е СЬЕМВЬ ГО 1С50, пМ рСЬЕМВЬ Уа1ие Босишепг СЬЕМВЬ ГО

1 Вгс1спсс(ОС(=0)с2сссо2)с1 СНЕМВЬ427404 50 7,3 СНЕМВЫ144475

2 С1с1спсс(0С(=0)с2сссо2)с1 СНЕМВЬ426898 60 7,22 СНЕМВЫ144475

3 С1с1ссс(сс1)-с1ссс(о1)С(=0)0с1спсс(С1)с1 СНЕМВЬ426082 63 7,2 СНЕМВЫ 144475

4 С1с1спсс(0С(=0)с2сс3ссссс3[пН]2)с1 СНЕМВЬ384739 65 7,19 СНЕМВЫ 144475

5 С1с1спсс(0С(=0)с2сс3ссссс3в2)с1 СНЕМВЬ383725 95 7,02 СНЕМВЫ 144475

6 С1с1спсс(0С(=0)с2сс3ссссс3о2)с1 СНЕМВЬ380470 170 6,77 СНЕМВЫ 144475

7 С1с1спсс(0С(=0)с2свсп2)с1 СНЕМВЬ380403 270 6,57 СНЕМВЫ 144475

8 Сс1сс(с(С1)сс1С1)8(=0)(=0)с1с(сс(сс1[К+]([0-])=0)С(Р) (Р)Р)[М+]([0-])=0 СНЕМВЬ379727 300 6,52 СНЕМВЫ 145342

9 С0с1сссс(с1)С(=0)0с1спсс(С1)с1 СНЕМВЬ379642 340 6,47 СНЕМВЫ 144475

10 МС(=0)с1ссс2М(Сс3ссс4ссссс4с3)С(=0)С(=0)с2с1 СНЕМВЬ378700 370 6,43 СНЕМВЫ 148529

11 С1С(С1)=С(С1)С(=0)0с1ссс(сс1)8(=0)(=0)с1ссс(0С(=0) С(С1)=С(С1)С1)сс1 СНЕМВЬ378674 900 6,05 СНЕМВЫ 145342

12 1с1ссс2ЩСс3сс4ссссс4§3)С(=0)С(=0)с2с1 СНЕМВЬ378342 950 6,02 СНЕМВЫ 139624

13 Вгс1сссс2С(=0)С(=0)М(Сс3сс4ссссс4в3)с12 СНЕМВЬ377253 980 6,01 СНЕМВЫ 139624

14 1с1ссс2ЩСс3ссс4ссссс4с3)С(=0)С(=0)с2с1 СНЕМВЬ377150 1100 5,96 СНЕМВЫ 148529

15 [0-][М+](=0)с1сссс2С(=0)С(=0)М(Сс3сс4ссссс4§3)с12 СНЕМВЬ375130 2000 5,7 СНЕМВЫ 139624

16 РС(Р)(Р)с1ппс(8С(=0)с2ссс(о2)С#Сс2ссссс2)[пН]1 СНЕМВЬ370923 3000 5,52 СНЕМВЫ 145342

17 С1с1сс(С1)сс(МС(=0)С8с2пссс(п2)-с2с§с(п2)-с2ссссс2)с1 СНЕМВЬ365469 3000 5,52 СНЕМВЫ 148632

18 Рс1ссс2М(Сс3сс4ссссс4§3)С(=0)С(=0)с2с1 СНЕМВЬ365134 4820 5,32 СНЕМВЫ 139624

19 Сс1пос(МС(=0)с2ссф2)-с2сс(пп2С)С(Р)(Р)Р)с1[М+] ([0-])=0 СНЕМВЬ358279 5000 5,3 СНЕМВЫ 145342

20 №;1псс(с(М)п1)8(=0)(=0)с1ссс(С1)сс1 СНЕМВЬ348660 6000 5,22 СНЕМВЫ 145342

21 Сс1пос(С)с1СШС(=0)С(=0)с2сс(ссс12)С#М СНЕМВЬ225515 7200 5,14 СНЕМВЫ 139624

22 Рс1ссс(СШС(=0)С(=0)с3сс(1)ссс23)с(С1)с1 СНЕМВЬ222893 9400 5,03 СНЕМВЫ 139624

23 Сп1пс(сс1С(Р)(Р)Р)-с1ссф1)-с1сспс(8СС(=0)№2ссс(С1) сс2)п1 СНЕМВЬ222840 10000 5 СНЕМВЫ 148632

24 Сс1ос(сс1-с1сс(М8(=0)(=0)с2сссв2)[пН]п1)С(С)(С)С СНЕМВЬ222769 10000 5 СНЕМВЫ 145342

25 С8с1§с(с(С)с1-с1сспс(8СС(=0)Мс2ссс(С1)сс2)п1)-с1пс(С) св1 СНЕМВЬ222735 11000 4,96 СНЕМВЫ 148632

26 С1с1сссс2М(Сс3сс4ссссс4§3)С(=0)С(=0)с12 СНЕМВЬ222628 11200 4,95 СНЕМВЫ 139624

27 [0-][К+](=0)с1сс(ссс18(=0)(=0)с1ссс(С1)сс1)С(Р)(Р)Р СНЕМВЬ222234 12000 4,92 СНЕМВЫ 145342

28 С8с18с(с(С)с1-с1сспс(8СС(=0)№2ссссс2С1)п1)-с1пс(С) св1 СНЕМВЬ215732 12000 4,92 СНЕМВЫ 148632

29 МС(=0)с1ссс2М(Сс3ссссс3)С(=0)С(=0)с2с1 СНЕМВЬ215397 12500 4,9 СНЕМВЫ 148529

30 С1с1ссс(МС(=0)с2ссс(СЮС(=0)С(=0)с4сс(1)ссс34>2)сс1 СНЕМВЬ214372 12570 4,9 СНЕМВЫ 139624

31 Сс1пс(с(С#М)с(С)с1[М+]([0-])=0)8(=0)(=0)с1ссссс1 СНЕМВЬ213581 13000 4,89 СНЕМВЫ 145342

32 Сс1ссс(сс1)8(=0)(=0)с1пс(С)с(с(С)с1С#М)[М+]([0-])=0 СНЕМВЬ212504 13000 4,89 СНЕМВЫ 145342

Окончание табл. 1 П

Номер Мо1еси1е СЬЕМБЬ ГО 1С50, пМ рСЬЕМБЬ Уа1ие Босишепг СЬЕМБЬ ГО

33 0=СШ(Сс2сс3ссссс3в2)с2ссссс2С1=0 СНЕМБЬ212454 13110 4,88 СНЕМБЫ139624

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

34 1с1ссс2М(СС3С0с4ссссс403)С(=0)С(=0)с2с1 СНЕМБЬ212399 13500 4,87 СНЕМБЫ139624

35 Сс1пс(с81)-с1пс(с§1)-с1сспс(8СС(=0)Мс2ссс(С1)сс2)п1 СНЕМБЬ212240 14000 4,85 СНЕМБЫ148632

36 [0-][К+](=0)с1ссс([п+]([0-])с1)8(=0)(=0)с1ссс(С1)сс1 СНЕМБЬ212218 15000 4,82 СНЕМБЫ145342

37 С8с1[пН]пс(МС(=0)с2ссс§2)с18(=0)(=0)с1ссссс1 СНЕМБЬ212190 15000 4,82 СНЕМБЫ145342

38 РС(Р)(Р)с1ссс(МС(=0)С8с2пссс(п2)-с2сс(по2)-с2ссс(С1) сс2С1)сс1 СНЕМБЬ212019 15000 4,82 СНЕМБЫ148632

39 С1с1ссс(МС(=0)С8с2пссс(п2)-с2сс(по2)-с2ссссс2С1)сс1 СНЕМБЬ211969 15000 4,82 СНЕМБЫ148632

40 С1с1ссс(МС(=0)С8с2пссс(п2)-с2сс(по2)-с2ссссс2)сс1 СНЕМБЬ210632 15000 4,82 СНЕМБЫ148632

41 СС(=0)с1ссссс1$(=0)(=0)с1ссссс1С(0)=0 СНЕМБЬ210612 16000 4,8 СНЕМБЫ145342

42 СС0\С(0)=С(\С=№с1ссс(сс1)8(=0)(=0)с1ссс(№С=С(/ С#М)С(=0)0СС)сс1)/С#М СНЕМБЬ210525 16000 4,8 СНЕМБЫ145342

43 0С(=0)с1ссс(сс1)8(=0)(=0)с1сс(Бг)с(0)с(Бг)с1 СНЕМБЬ210497 16000 4,8 СНЕМБЫ145342

44 СС1(С)Сс2фс(МСс3сссо3)с2С(=0)С1)С#М СНЕМБЬ210487 16000 4,8 СНЕМБЫ145342

45 1с1ссс2М(Сс3ссф3)С(=0)ШССССС3)С(=0)С(=0)с2с1 СНЕМБЬ210097 17500 4,76 СНЕМБЫ139624

46 С8с1пп(с(-с2ссс§2)с1С#М)-с1с(с(С)пп1С)[М+]([0-])=0 СНЕМБЬ210092 18000 4,75 СНЕМБЫ145342

47 ССССШС(=0)С(=0)с2сс(ссс12)С(М)=0 СНЕМБЬ209667 19000 4,72 СНЕМБЫ148529

48 Сс1пп(С)с(МСс2ссф2)-с2ссс82)с1[М+]([0-])=0 СНЕМБЬ209287 20000 4,7 СНЕМБЫ145342

49 1с1ссс2М(С\С=С\с3сс4ссссс4§3)С(=0)С(=0)с2с1 СНЕМБЬ209227 23500 4,63 СНЕМБЫ139624

50 [0-][М+](=0)с1ссс(сс1)8(=0)(=0)с1ссс(сс1)[М+]([0-])=0 СНЕМБЬ208763 25000 4,6 СНЕМБЫ145342

51 СССШС(=0)С(=0)с2сс(ссс12)С(М)=0 СНЕМБЬ208732 25000 4,6 СНЕМБЫ148529

52 СССс1сс(0)пс(8СС(=0)№с2ссс(С1)сс2)п1 СНЕМБЬ208584 30000 4,52 СНЕМБЫ148632

53 СС0\С(0)=С(\С=№с1ссс(сс1)8(=0)(=0) с1ссс(МС=С(С(=0)0СС)С(=0)0СС)сс1)/С(=0)0СС СНЕМБЬ207207 32000 4,5 СНЕМБЫ145342

54 0=С(Сс1псс§1)с1псс§1 СНЕМБЫ96635 40000 4,4 СНЕМБЫ145342

55 СС(С)с1ссс(МС(=0)С8с2пссс(п2)-с2сссв2)сс1 СНЕМБЫ94398 40000 4,4 СНЕМБЫ148632

56 С0с1сссс(с1)-с1пс(8СС(=0)№с2ссс(сс2)8(М)(=0)=0)пс(0) с1С#М СНЕМБЫ91575 40000 4,4 СНЕМБЫ148632

57 С0с1ссс(МС(=0)С8с2пс(0)сс(п2)-с2ссссс2)сс10С СНЕМБЫ90743 45000 4,35 СНЕМБЫ148632

58 СС0С(=0)\С=С\[С@Н](С[С@@Н]1ССМС1=0)МС(=0) [С@@Н](СС(=0)[С@@Н](МС(=0)с1сс(С)оп1)С(С)С) Сс1ссссс1 СНЕМБЫ88983 45000 4,35 СНЕМБЫ141032

59 1с1ссс2М(Сс3ссссс3)С(=0)С(=0)с2с1 СНЕМБЫ88487 50000 4,3 СНЕМБЫ148529

60 С0с1сссс(с1)-с1пс(8СС(=0)№2ссс(сс2)С(С)=0)пс(0) с1С#М СНЕМБЫ87717 60000 4,22 СНЕМБЫ148632

61 ССС(8с1пс(0)с(С#М)с(п1)-с1сссс(0С)с1)С(=0) №;1ссс(сс1)С(С)=0 СНЕМБЫ87598 60000 4,22 СНЕМБЫ148632

62 ССССШС(=0)С(=0)с2сс(1)ссс12 СНЕМБЫ87579 66000 4,18 СНЕМБЫ148529

63 СС0С(=0)\С=С\[С@Н](С[С@@Н]1ССМС1=0)МС(=0) [С@Н](СС=С(С)С)СС(=0)[С@@Н](МС(=0)с1сс(С)оп1) С(С)С СНЕМБЫ85698 70000 4,16 СНЕМБЫ141032

64 СШС(=0)С(=0)с2сс(ссс12)С(М)=0 СНЕМБЫ48483 71000 4,15 СНЕМБЫ148529

65 Сс1сс(0)пс(8СС(=0)№с2сс(С1)ссс20с2ссссс2)п1 СНЕМБЫ18596 100000 4 СНЕМБЫ148632

Т а б л и ц а 2 П

Полный список идентифицированных молекулярных фрагментов, записанных в виде SMARTS

SMARTS M N Средний вклад фрагмента

O=C(O[*])c1cc([*])c([*])o1 3 3 2,08424025

O=C(Oc1cc([*])cnc1[*])[*] 8 8 2,0206205

Clc1c([*])ncc([*])c1[*] 7 7 1,8665205

O=C(O[*])[*] 9 9 1,59494225

O=C1C(=O)N(C([*])[*])c2c1cccc2[*] 3 3 0,6641145

c1c([*])cc2cc([*])sc2c1[*] 8 8 0,652451375

Clc1cc(Cl)c([*])c([*])c1[*] 3 3 0,30955275

FC(F)(F)[*] 6 6 0,146696125

NC(=O)[*] 5 5 0,13180325

O=S(=O)(c1cc([*])c(Cl)cc1[*])[*] 4 4 0,1251

c1cc(C[*])c([*])cc1[*] 4 4 0,12120975

c1c([*])sc(C[*])c1[*] 3 3 0,09563475

Cl[*] 25 30 0,04179175

Cn1nc([*])c([*])c1[*] 4 4 0,030965625

F[*] 8 8 0,027254125

N#C[*] 7 7 0,0052065

O=C1C(=O)N([*])c2c([*])cc(I)c([*])c21 9 9 0,00389875

c1cc(-c2cc([*])on2)c([*])cc1[*] 3 3 0,002501

SMARTS M N Средний вклад фрагмента

c1nc([*])nc([*])c1[*] 10 10 0,001548625

O=[N+]([O-])[*] 10 10 0

I[*] 9 9 -0,000999

n1c([*])sc([*])c1[*] 6 8 -0,025514375

O=C(Nc1ccc([*])cc1[*])[*] 12 12 -0,0292055

O=C(N[*])[*] 17 17 -0,1267215

O=C(CS[*])N[*] 14 14 -0,17362825

NC(=O)c1c([*])cc2c(c1[*])C(=O)C(=O)N2[*] 4 4 -0,178003875

O=c1[nH]c(S[*])nc([*])c1[*] 5 5 -0,3823725

О б о з н а ч е н и я: М - количество соединений, содержащих данный фрагмент; N - количество обнаружений соответствующего фрагмента в выборке.

i Надоели баннеры? Вы всегда можете отключить рекламу.