Научная статья на тему 'Моделирование конформационно-зависимых свойств белков для рационального дизайна лекарственных препаратов в среде облачных вычислений CLAVIRE'

Моделирование конформационно-зависимых свойств белков для рационального дизайна лекарственных препаратов в среде облачных вычислений CLAVIRE Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
209
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DRUG SIMULATION / КОНФОРМАЦИОННАЯ ПОДВИЖНОСТЬ / CONFORMATIONAL MOBILITY / ДОКИНГ / DOCKING / МОДЕЛИРОВАНИЕ ЛЕКАРСТВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Спельников Дмитрий Михайлович, Порозов Юрий Борисович, Маслов Владимир Григорьевич, Бухановский Александр Валерьевич

Представлена среда суперкомпьютерного эксперимента для поддержки процессов создания лекарственных препаратов нового поколения на основе рекомбинантных белков, функционирующая на основе облачной платформы CLAVIRE.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Спельников Дмитрий Михайлович, Порозов Юрий Борисович, Маслов Владимир Григорьевич, Бухановский Александр Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SIMULATION OF PROTEINS CONFORMATIONAL-BASED FEATURES FOR RATIONAL DRUG DESIGN BY CLAVIRE CLOUD ENVIRONMENT

CLAVIRE-based cloud simulation environment is announced for computational support of rational drug design on the base of recombinant proteins.

Текст научной работы на тему «Моделирование конформационно-зависимых свойств белков для рационального дизайна лекарственных препаратов в среде облачных вычислений CLAVIRE»

УДК 004.891.2

МОДЕЛИРОВАНИЕ КОНФОРМАЦИОННО-ЗАВИСИМЫХ СВОЙСТВ БЕЛКОВ ДЛЯ РАЦИОНАЛЬНОГО ДИЗАЙНА ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ В СРЕДЕ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ CLAVIRE Д.М. Спельников, Ю.Б. Порозов, В.Г. Маслов, А.В. Бухановский

Представлена среда суперкомпьютерного эксперимента для поддержки процессов создания лекарственных препаратов нового поколения на основе рекомбинантных белков, функционирующая на основе облачной платформы CLAVIRE. Ключевые слова: моделирование лекарств, конформационная подвижность, докинг.

Создание лекарственных препаратов нового поколения на основе рекомбинантных белков связано с применением технологий компьютерного моделирования их конформационно-зависимых свойств: взаимодействующих молекулярных структур, активных центров, интенсивности молекулярного связывания. От скорости и точности такого моделирования зависят итоговая стоимость и результативность лабораторных тестов и фаз клинической стадии, что требует развития соответствующих методов и алгоритмов компьютерного моделирования. Специфика задачи состоит в принципиальной вычислительной сложности моделирования взаимодействия структур с учетом всех характерных для них степеней свободы (подвижности), что на настоящий момент возможно только с использованием высокопроизводительных вычислений. При этом различные этапы моделирования (реализуемые соответствующими алгоритмами и программным обеспечением) требуют применения вычислительных платформ принципиально различной архитектуры. В настоящей работе анонсируется среда вычислительного эксперимента в области моделирования конформационно-зависимых свойств белков на основе неоднородных распределенных вычислительных ресурсов под управлением облачной платформы CLAVIRE [1].

Процесс моделирования конформационно-зависимых свойств состоит из двух последовательных этапов. На первом этапе определяется карта конформационной подвижности белков: посредством эволюционного алгоритма CMA-ES (Covariance Matrix Adaptation Evolution Strategy, эволюционная стратегия с адаптивной корреляционной матрицей) формируется набор всех возможных конформаций основной цепи белка, после чего к ним достраиваются боковые цепи. В этот же этап входит процедура быстрой параллельной минимизации потенциальной энергии конформеров, позволяющая оптимизировать геометрические характеристики боковых цепей. На втором этапе решаются задачи молекулярного до-кинга и скоринга. Для каждой из конформаций определяются активные центры, в которых позиционируется низкомолекулярное соединение (лиганд), и оценивается сила связи с помощью полуэмпирического метода квантовой химии на основе DC-алгоритма (Divide and Conquer, «разделяй-и-властвуй»), который может учитывать влияние растворителя. При этом вычисляется свободная энергия связывания низкомолекулярного лиганда с рецептором, в том числе энтропийный вклад. В итоге проводится ранжирование и выбор конформаций, имеющих наименьшую свободную энергию, как потенциальных кандидатов для проведения доклинических испытаний.

С точки зрения организации параллельных вычислений наибольшей коммуникационной сложностью обладает этап построения набора конформаций, связанный с параллельной реализацией эволюционного алгоритма CMA-ES. Это обусловлено тем, что алгоритм CMA-ES сочетает в себе одновременно особенности классических генетических алгоритмов и алгоритмов случайного поиска. Корреляционная матрица, характеризующая ландшафт пространства поиска, определяется в алгоритме CMA-ES адаптивно, по мере эволюции самой популяции. Потому с целью улучшения сходимости необходим регулярный обмен оценками матриц, полученными на различных вычислительных узлах. В силу существенной ре-сурсоемкости самих вычислений данный алгоритм имеет высокий потенциал масштабируемости (эффективность 50-80%), управляемый за счет выбора частоты обмена оценками корреляционных матриц. После того, как получен набор возможных конформаций, все остальные операции над ними выполняются независимо и не требуют коммуникационных обменов. Как следствие, это позволяет разделить вычислительный эксперимент на две части: моделирование конформационной подвижности выполняется на суперкомпьютере производительностью не менее 10 Тфлопс, а достраивание боковых цепей, оптимизация их геометрии, докинг и оценка степени связи - на менее мощных вычислительных ресурсах распределенной среды (например, грид Национальной нанотехнологической сети (ГридННС)). Такой подход эффективен вследствие того, что алгоритмы, связанные с задачей докинга, обладают гораздо меньшим потенциалом масштабируемости, чем CMA-ES, и не позволяют эффективно использовать коммуникационную сеть суперкомпьютера.

Для реализации среды вычислительного эксперимента использована облачная платформа CLA-VIRE, объединяющая суперкомпьютерные ресурсы (включая самый мощный в России суперкомпьютер «Ломоносов»), кластеры меньшего размера, ресурсы среды ГридННС, частные и публичные облачные ресурсы. Процесс вычислительного эксперимента задается в виде композитного приложения, объединяющего отдельные пакеты, работающие на распределенных ресурсах, включая авторские программы (реализующие CMA-ES), популярные программы Autodock Vina, GROMACS, а также уникальный пакет SEMP расчета сверхбольших (до 100 тыс. атомов) молекулярных структур средствами квантовой химии

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 5 (87)

[2]. Функции планирования и распределения вычислительной нагрузки, подготовки и хранения входных данных и результатов расчетов в облаке, поддержки графического интерфейса пользователя и научной визуализации реализуются средствами облачной платформы CLAVIRE через стандартный браузер. Доступ к данному сервису возможен из корпоративной среды НИУ ИТМО.

Работа выполнена в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы», ГК № 14.514.11.4068.

1. Knyazkov K.V., Kovalchuk S.V., Tchurov T.N., Maryin S.V., Boukhanovsky A.V. CLAVIRE: e-Science infrastructure for data-driven computing // Journal of Computational Science. - 2012. - V. 3. - № 6. -P. 504-510.

2. Васильев В.Н., Бухановский А.В., Козлов С.А., Маслов В.Г., Розанов Н.Н. Высокопроизводительный программный комплекс моделирования наноразмерных атомно-молекулярных систем // Научно-технический вестник СПбГУ ИТМО. - 2008. - № 9 (54). - С. 3-12.

Спельников Дмитрий Михайлович - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, младший научный сотрудник, pilule@ya.ru

Порозов Юрий Борисович - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, доцент, зав. лабораторией, кандидат медицинских наук, porozov@ifc.cnr.it Маслов Владимир Григорьевич - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, ведущий научный сотрудник, доктор физ.-мат. наук; maslov04@bk.ru Бухановский Александр Валерьевич - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, доктор технических наук, профессор, зав. кафедрой, Avb_mail@mail.ru

УДК 004.021

МЕТОД АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ МОЛЕКУЛЯРНО-МЕХАНИЧЕСКИХ ПОТЕНЦИАЛОВ ДЛЯ КРУПНОЗЕРНИСТОГО ПРЕДСТАВЛЕНИЯ МОЛЕКУЛЯРНОЙ

СИСТЕМЫ

А.И. Свитенков, Е.В. Болгова, В.Г. Маслов, А.В. Бухановский

Рассматривается универсальный метод автоматического определения молекулярно-динамических потенциалов методом квантовой химии. Описаны задачи, возникающие перед исследователем при выборе и использовании стандартных молекулярно-динамических потенциалов. Предлагаемый метод целесообразен во всех случаях, когда их решение оказывается трудно выполнимым и потенциально неточным. Он также позволяет повысить сопоставимость результатов молекулярно-динамического моделирования.

Ключевые слова: молекулярная система, молекулярно-динамические потенциалы, квантовая химия.

Применение метода молекулярной динамики (МД) в области нанотехнологий при исследовании свойств наножидкостей, полимерных или композитных материалов распространено чрезвычайно широко. При этом, однако, постановка МД-эксперимента является трудоемкой задачей. Исследователю приходится решать целый ряд технических проблем при подготовке входных данных, обычно включающих координаты атомов молекулярной системы, структуру ее связей и потенциалы взаимодействия. Среди перечисленных данных только первые имеют непосредственное отношение к задаче, решаемой исследователем. Процесс их подготовки хорошо механизирован в молекулярных редакторах и визуализаторах. Вместе с тем не существует универсальных инструментов для определения потенциалов взаимодействия. Наличие большого числа модельных МД-полей (OPLS, AMBER, CHARMM, MMFF94 и др.) упрощает процесс лишь частично, так как для их использования необходимы сведения о типах атомов в соответствии с их положением в молекулярной структуре. Для этого недостаточно знания лишь валентного состояния атома, а в «сложных» потенциалах типа MMFF94 - и их ближайшего окружения. Важно отметить, что неверное определение потенциала практически не выявляется на этапе подготовки входных данных для МД, однако приводит к некорректным результатам моделирования. Это также затрудняет использование для подбора потенциала научных публикаций, так как полные протоколы МД-эксперимента слишком велики и малоинформативны с точки зрения их включения в содержимое научных статей.

Важным аспектом вычислительных нанотехнологий, в котором невозможно применение стандартных систем МД-потенциалов, является использование моделей укрупненных атомов [1]. Они широко применяются при моделировании полимерных и композитных материалов и позволяют в несколько раз сократить трудоемкость расчета [2]. Но так как способ объединения атомов каждый исследователь выбирает самостоятельно, не существует универсального метода определения потенциалов для них. Более того, формы потенциалов для укрупненных атомов существенно сложнее функциональных форм стандартных систем полей и требуют табличного задания в общем случае.

Итак, в настоящее время не существует универсального набора правил типизации атомов и распознавания структур связей лишь на основании данных об их взаимном расположении. Эта задача может быть корректно решена лишь при помощи методов квантовой химии. В данном сообщении анонсируется универсальный метод построения МД-потенциала для конкретной молекулярной системы, основанный на применении линейно-масштабируемых методов квантовой химии.

Научно-технический вестник информационных технологий, механики и оптики,

2013, № 5 (87)

i Надоели баннеры? Вы всегда можете отключить рекламу.