Научная статья на тему 'Решение задачи молекулярного докинга модифицированным методом роя частиц'

Решение задачи молекулярного докинга модифицированным методом роя частиц Текст научной статьи по специальности «Математика»

CC BY
664
167
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ / МЕТОД РОЯ ЧАСТИЦ / МОЛЕКУЛЯРНЫЙ ДОКИНГ / ПРОТЕАЗЫ HIV1 / ДАРУНАВИРОМ 3U7S

Аннотация научной статьи по математике, автор научной работы — Карпенко А. П., Матвеева К. О., Буланов В. А.

В работе представлены две модификации канонического метода роя частиц, имеющие целью повышение эффективности этого метода при решении многоэкстремальных задач оптимизации высокой размерности. Выполнено исследование эффективности метода и его указанных модификаций при решении тестовых задач оптимизации. С помощью одной из предложенных модификаций решена 28-мерная задача докинга для молекул протеазы HIV1 и дарунавиром 3U7S в качестве молекул-рецептора и лиганда соответственно.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Карпенко А. П., Матвеева К. О., Буланов В. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Решение задачи молекулярного докинга модифицированным методом роя частиц»

НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА

НАУКА и ОБРАЗОВАНИЕ

Эл № ФС77 - 4 8211. Государственная регистрация №042 1200025. ISSN 1994-0408

электронный научно-технический журнал

Решение задачи молекулярного докинга модифицированным методом роя частиц # 04, апрель 2014

DOI: 10.7463/0414.0707258

профессор, д.ф.-м.н. Карпенко А. П., Матвеева К. О., Буланов В. А.

УДК 519.6

Россия, МГТУ им. Баумана karpenkoffrk6.bmstu.ni kir ail dial ff gmail.com vbOO Iff rambler.ru

Введение

Википедия определяет молекулярный докинг (молекулярную стыковку) как метод молекулярного моделирования, позволяющий предсказать ориентацию и положение одной молекулы по отношению к другой, которые являются наиболее выгодными с точки зрения образования устойчивого молекулярного комплекса. Докинг молекул играет важную роль в процессе проектирования лекарственных препаратов, поскольку позволяет предсказать энергию связывания (аффинность) небольшой молекулы лекарства (лиганда) по отношению к белку-рецептору и, тем самым, оценить эффективность лекарства на основе белка-лиганда - чем сильнее молекула-лиганд связывается с белком-рецептором, тем эффективнее лекарство. Дорогостоящей альтернативой молекулярному докингу является метод экспериментального перебора потенциальных лигандов

Молекулярный докинг является вычислительно сложной процедурой, так как существует очень большое число вариантов расположения двух молекул относительно друг друга. С ростом чисел атомов во взаимодействующих молекулах число этих вариантов растет экспоненциально, так что исчерпывающий анализ всех вариантов взаимного расположения молекул невозможен.

Основной класс методов молекулярного докинга основан на отыскании такого расположения лиганда относительно молекулы-рецептора, которое минимизирует суммарную потенциальную энергию взаимодействующих молекул. Другими словами, методы докинга, как правило, основаны на решении задачи глобальной условной минимизации целевой функции (скоринг-функции), которая формализует указанную потенциальную

энергию. Для решения этой задачи широко используют различные эвристические методы оптимизации.

Цель работы состоит в исследовании эффективности известного эвристического метода оптимизации роем частиц и его двух авторских модификаций для решения задачи молекулярного докинга.

В зависимости от разрешенных положений и конфигураций взаимодействующих молекул в процессе решения задачи оптимизации различают следующие основные методы докинга.

Жесткий докинг (rigid protein docking) - конформация молекулы-рецептора (пространственное расположение атомов) в процессе процедуры докинга остаётся неизменной.

Гибкий докинг (flexible protein docking) - активный центр белка-рецептора в процессе докинга может изменять свою конформацию.

Полностью гибкий докинг (full protein flexibility) - все степени свободы белка-рецептора и лиганда используются в процессе докинга. Такой вид докинга в настоящее время не используют из-за неприемлемо высоких вычислительных затрат.

В работе применяем метод жесткого докинга, получивший в настоящее время наибольшее распространение.

Одной из основных задач, которую требуется решить для успешного проведения процедуры докинга, является задача выбора эффективного алгоритма глобальной минимизации скоринг-функции. Особенности этой задачи состоят в высокой размерности вектора варьируемых параметров, сложном ландшафте целевой функции, сложной топологии области допустимых значений вектора варьируемых параметров. В качестве указанного алгоритма могут быть использованы многие алгоритмы глобальной оптимизации - алгоритмы перебора, метод Монте-Карло, генетический алгоритм и др.

Наибольшее распространение среди алгоритмов, применяемых в программах докинга, получил генетический алгоритм оптимизации. Генетический подход используется, например, в программах AutoDock [1], GOLD [2], MolDock [3]. Этот же алгоритм используется в программе SOL [4]. Известны также программные комплексы молекулярного докинга, основанные на применении метода роя частиц. Так программа SODOCK [5] использует метод роя частиц с локальной оптимизацией, а программа pso@autodock [6] - метод роя частиц с топологией «клика», изменением коэффициента инерции и локальной оптимизацией.

В работе [6] показано, что в равных условиях при использовании метода роя частиц в программе докинга AutoDock 4.0 можно добиться более близкого положения лиганда к нативному (природному) положению, чем при использовании традиционного для этой программы генетического алгоритма.

Даем математическую постановку задачи молекулярного докинга, приводим схемы канонического метода роя части и двух его модификаций, представляем результаты вычислительного эксперимента по исследованию эффективности указанных методов и мо-

дификаций при решении тестовых задач оптимизации и одной задачи молекулярного докинга.

1. Постановка задачи

С математической точки зрения задача докинга состоит из трех подзадач:

— определить, какими степенями свободы будут наделены белок-рецептор и лиганд;

— составить скоринг-функцию, определяющую энергию связывания лиганда с белком-рецептором;

— выбрать эффективный алгоритм минимизации скоринг-функции.

Числа рассматриваемых степеней свободы лиганда и белка-рецептора определяют размерность пространства поиска. Очевидно, что чем больше число этих степеней свободы допустимо, тем выше размерность пространства поиска.

Энергию связывания лиганда с белком-рецептором можно определить на основе «точных» и приближенных законов взаимодействия между молекулами. Если использовать «точные» законы, то для расчета внутримолекулярных взаимодействий комплекса из нескольких десятков атомов (белки, которые учувствуют в процессе докинга, состоят обычно из тысяч атомов) потребуются сотни часов процессорного времени. Для приближенного описания взаимодействия молекул используют модель силового поля (force field) - набор потенциалов, описывающих взаимодействие атомов и молекул, как классических частиц. Расчет взаимодействий в комплексе из тысяч атомов занимает в этом случае десятки минут. В настоящее время известны такие модели силовых полей, как MMX, MM3, Amber, MMFF94 [7].

Как правило, модели силовых полей используют следующие параметры силового поля, которые определяют на основе экспериментальных данных и расчетов методами квантовой механики:

-- длины связей и величины валентных углов;

-- константы деформации длин связей и величин валентных углов;

-- параметры торсионных потенциалов внутреннего вращения;

-- параметры Ван-дер-Ваальсовых взаимодействий пар атомов;

-- заряды атомов.

Точность описания экспериментальных данных силовыми полями иллюстрирует следующий пример: для модели силового поля MMFF94 [7] ошибка воспроизведения длины связей моделью составляет около 0,014 А, а ошибка воспроизведения валентных углов - около 1,2°.

В работе используем модель силового поля MMFF94 (Merck Molecular Force Field 94). Энергия взаимодействия молекул в рамках этой модели имеет вид

Е(Х) = 2ЕВ,} (X) + 2ЕА'к (X) +ТЕВ4м (X) + ^ЕООР^ы (X) +

/,',к /,_/',/ ,, к,/

2 ЕГг'Л1 (X) + 2 ' (X) + 2 Е^,' (X), (1)

и,к,/ ,,з

где суммирование производится по группам атомов, и слагаемые имеют следующие смысл.

Энергия растяжения связи

ЕВ,' = 143,9325-^ Ат,}

7

1 + 0Л Ат ' Ч--ОЛ2 Ат2'

V ' 12 ' ,7 у

л (0)

где Аг, ' = г, ' — г, ' - рассчитанная и равновесная длины связи соответственно;

кЬ, ', А 2 ккал/моль - силовая постоянная растяжения связи; ол = —2, А 1

Энергия деформации валентного угла

2(0)

ЕА,'к = 0,043844 А*' (1 + оЬ А$г,',к),

где А^ 'к = ' к — ^(/к - рассчитанный и равновесный валентные углы в градусах соответственно, кщ' к - силовая постоянная деформации валентного угла; оЬ =—0,0070 ,град —1.

Энергия, обусловленная одновременным растяжением связи и деформацией валентного угла,

ЕВА'к = 2,51210 АЦ ' к (кЬщ ' к АгК] + кЬаКи Агк ]),

о

где кщ ' к, как ' ,, град"1 А 1 ккал/моль - силовые постоянные для одновременного растяжения связи и деформации валентного угла.

Энергия взаимодействия, обусловленная выходом атома из плоскости

коор, ' к / 9 ЕООр ,', к/ = 0,043844-^ ^ , к ,/,

где X - угол между валентной связью атомов '', / и плоскостью ', к, /; коор, 'к/

, град2 ккал/моль - силовая постоянная деформации угла между валентной связью и

плоскостью.

Энергия вращения вокруг связи

ЕТиы = 0,5 (V (1+со80) + ¥2(1 + сов 2^) + Г3(1 + со83$),

о

о

где V, V, V ,ккал/моль - силовые постоянные вращения вокруг связи, ф - угол вращения (торсионный угол).

Энергия взаимодействия Ван-дер-Вальса

EvdWi, j = Si, j

1,07 Я* j

*

Я v + 0,07 R* v

V г,j г,j J

1,12 (R/2j)

л

2

vRh+0,12(R'.j)7 J

где Я, j , ^ - расстояние между им и у-м атомами; е, j, ккал/моль, Я* j, А - параметры взаимодействия.

Энергия электростатического взаимодействия между атомами с парциальными зарядами д1,

EQ v = 332,0716

д, д]

„ -Я,• Компонентами вектора варьируемых параметров X в модели силового поля ММР^94 являются длины связей, валентные и торсионные углы Вильсона всех атомов, положения которых могут меняться в процессе решения задачи докинга.

Таким образом, ставим задачу докинга в виде задачи нелинейного программирования

min E(X) = E(X ),

X gD

где D ^ Я^ - множество допустимых значений вектора варьируемых параметров;

X - искомый оптимальный вектор X, имеющий размерность X .

2. Метод роя частиц и его модификации

Канонический метод роя частиц. В основу алгоритма оптимизации роем частиц (Particle Swarm Optimization, PSO) положена социально-психологическая поведенческая модель толпы. Существует значительное число алгоритмов роя частиц. В каноническом алгоритме, предложенном в 1995 году Кеннеди (J. Kennedy) и Эберхартом (R. Eberhart),

т

координаты частицы si на итерации t определяет вектор Xi = (x \ ,X 2,- • - X |х|) , а на итерации (t + 1) - вектор Xi = (x^,x'i2, •••Xi|x|)T . Начальные координаты частицы si

равны Xi (0), i G [1:|S ], где |S| - число частиц в рое. Итерации в алгоритме PSO выполняют по схеме

Xi= Xi +V, (2)

V = bjVT+Ux| (0; Ьс ) ®{x* - X* )+ UX| (0; bS) ®{X** - X.). (3)

Здесь использованы следующие обозначения: (0; b) - случайный (|X| х1)" вектор, компоненты которого равномерно распределены в интервале [0; b]; ® - символ прямого произведения векторов; b7, bc, bs - свободные параметры алгоритма;

V = V (t) = (V 1, V 2,... V |х| )Г - (|X X1) -вектор приращения координат частицы;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V = V (t _ 1); X* - вектор координат частицы si, соответствующий ее наилучшему

значению фитнесс-функции р(X) за время поиска [0 : t], то есть

*

min р(X, (г)) = р(X* ); (4)

ге[0: t ]

X * - вектор координат соседней с данной частицы с наилучшим за то же время значением фитнесс-функции, то есть

тт<^{X*) = ^(Х**), (5)

где N - множество номеров частиц, являющихся «соседями» данной частицы si

[8].

Первое слагаемое в формуле (3) получило название инерционной компоненты, второе слагаемое - когнитивной, а третье слагаемое - социальной компоненты. Свободный параметр Ъ7 определяет вес «инерционных» свойств частицы. Рекомендуемое значение

параметра равно Ъ7 =0,7298. Значения параметров Ъс, определяют относительные веса когнитивной и социальной компонентов. Рекомендуемые значения параметров равны Ъс = Ъ8 = 1,49618.

Известно, что эффективность алгоритма Р80 в значительной мере зависит от топологии соседства частиц в рое, определяемой неориентированным графом, вершины которого соответствуют частицам роя, а ребра связывают непосредственных соседей. Чаще всего используются топологии соседства частиц клика (глобально оптимальная топология), кольцо (локально оптимальная топология), двумерный тор (топология фон Неймана), кластерная топология. Известно, что от топологии соседства частиц в значительной мере зависит эффективность метода Р80, особенно при оптимизации многоэкстремальных функций, имеющих сложный ландшафт [8].

Схема алгоритма Р80 имеет следующий вид.

1) Задаем значения свободных параметров алгоритма и инициализируем популяцию. Полагаем счетчик числа итераций

г = 1.

2) Для каждой из частиц популяции s., г е [1: ] по формуле (4) находим лучшую

локальную позицию X * , а по формуле (5) - глобально лучшую позицию X* .

3) По формулам (2), (3) находим новые позиции всех частиц популяции X'.

4) Проверяем выполнение условия окончания итераций. Если это условие выполнено, завершаем итерации, в противном случае полагаем ? = ? +1 и переходим к шагу 2.

Инициализация популяции заключается в задании начальных позиций Х- (0) и скоростей V (0) частиц. Обычно точки Хг (0) принимают случайными, равномерно распределенными в некотором гиперпараллелепипеде. Начальные скорости частиц также инициализируем случайными значениями.

В качестве условий окончания итераций обычно используют достижение максимально допустимого числа итераций ? или стагнацию итерационного процесса, то есть отсутствие улучшений фитнесс-функции на протяжении 81 итераций, где 81 - свободный параметр алгоритма.

Модификация PSO-M1. Для каждой из частиц , / е [1: |И|] введем в рассмотрение

наборы частиц-соседей А1, Ы2. Частицы роя S включаем в эти наборы случайным образом, допуская вхождение одной частицы в оба набора. Вероятность попадания частицы

роя в набор А/ вычисляем по формуле

ехр

1п |5|

Р.! =

И

} = 1.2.

1 2

Схему формирования наборов частиц-соседей N, N иллюстрирует рисунок 1.

Рисунок 1 - Наборы соседей-частиц А^, А2 для частицы с номером 1 (синие овалы): |И| = 12

Формула (3) в алгоритме РЮ-М1 имеет вид

\ = ъ1у- + Цщ (0; Ьс) ® (х* - X )+ Цщ (0; Ьи ) ® (х** - X)+

+ Ц|Х| (0; Ь1) ® (х1 - X) + Цщ (0; Ь2 ) ® (х2 - X), I е [1: |И|]. (6)

1 2

Здесь X1, X2 - координаты лучших, в смысле формул (4), (5), частиц наборов 1 2

N , N , соответственно; ¿1, ¿2 е [0; 1] - свободные параметры алгоритма.

Модификация Р80-Ы1 имеет целью диверсифицировать поиск и тем самым предупредить его преждевременную сходимость.

Модификация Р80-М2. Введем в рассмотрение среднеквадратическое отклонение координат частиц

1

а

XI И- Ч

ХХ(х/, 7 х) )2 2=17=1

где х7 -]-я компонента вектора текущего центра роя:

_ 1 И

х7 = рЕХ,7, 7 е[1: И]•

Модификация Р80-Ы2 метода роя частиц заключается в варьировании в формуле (6) значений «инерционного» параметра Ь} по правилу

Ь1 =

7 а(?)

а Ьт, -—— >у,

1 а(? — Д)

пи а(? — Д) рЬ1, <Г-

Здесь а > 1, Р, у е(0; 1), Д? > 0 - свободные параметры метода. Смысл данного правила заключается в следующем: если относительное значение величины а в течение итераций с ? — Д по I уменьшилась на величину, превышающую у, то параметр Ь} увеличиваем (с целью предотвратить преждевременную сходимость метода); если то же значение величины а увеличилось на указанную величину, то параметр Ь} уменьшаем (с целью интенсифицировать поиск). Рекомендованные значения величин а, Р, у, Д? равны 1,1; 0,9; 0,7 соответственно.

3. Исследование эффективности метода роя частиц и его модификаций

Программная реализация алгоритма выполнена на языке программирования высокого уровня С++, разработка выполнена в среде ОСС.

Принимаем число части в рое (размер популяции) равным 50. Используем метод мультистарта с числом запуском алгоритма т = 30. Эффективность алгоритма оцениваем средним числом вычислений целевой функции п^, а также средней и минимальной

ошибками Б , Бтщ локализации минимума целевой функции.

Сферическая функция. Рассматриваем сферическую целевую функцию

И ,

ф И) = 2

xi i=1

в области генерации популяции

Б = Щ | х-< х < , I е [1: |Щ]}, (6)

где X = 16.

Результаты вычислительного эксперимента представлены в таблице 1. Результаты показывают работоспособность предложенных модификаций канонического метода Р80 и соответствующего программного обеспечения. Отметим преимущества модификации Р80-М2 по сравнению с двумя другими методами по всем трем критериям эффективности.

Таблица 2 - Результаты исследования эффективности метода Р80 и его модификаций: сферическая целевая

функция

Метод PSO Критерий эффективности

Пф S ^rnin

Канонический метод 6971 7,0 -10-5 8,1 -10-6

Модификация PSO-M1 6858 8,2 -10-5 3,5 -10-6

Модификация PSO-M2 4798 6,3 -10-5 3,3 -10-6

Функция Растригина. Исследование эффективности предложенных модификаций метода PSO выполнено для многоэкстремальной функции Растригина (Rastrigin function)

[9]

f(X) = 2(10 + x2 -10 cos (2 n x}),

i=1

области (6) и |X| = 16. Минимум этой функции достигается в точке (0, 0,...,0) и равен нулю.

Результаты вычислительного эксперимента, представленные в таблице 2, показывают близость модификаций PSO-M1, PSO-M2 по критериям S , £"mm и значительное превосходство модификации PSO-M2 над каноническим методом PSO и модификацией PSO-M1 по критерию Пф.

Таблица 2 - Результаты исследования эффективности метода РБО и его модификаций: функция Растригина

Метод PSO Критерий эффективности

Б Бтт

Канонический метод 16371 27,9 8,95

Модификация РБО-М1 9634 20,8 8,95

Модификация РБО-М2 6688 24,6 8,95

Сходимость рассматриваемых методов иллюстрирует рисунок 2.

О - РБО; □ - РБО-М1; А - РБО-М2

Рисунок 2 - К сходимости методов РБО, РБО-М1, РБО-М2: функция Растригина; = 16; = 50

Решение задачи докинга. Рассматриваем задачу докинга для молекул протеазы Н1У1 и дарунавиром 3Ц7Б в качестве молекулы-рецептора и лиганда соответственно [10]. Учитываем взаимодействие указанных молекул с одной молекулой воды. Компоненты вектора варьируемых параметров X, полагаем, имеют следующий смысл: -- углы поворота лиганда вокруг осей 0х, 0у, 02; -- смещения центра лиганда по осям 0х, 0у, 02; -- валентные углы; -- торсионные углы.

Таким образом, размерность вектора варьируемых параметров задачи равна

|Х = 28.

Используем, как более эффективный, метод Р80-М2, в котором рой состоит из 32 частиц (= 32) и свободные параметрами имеют следующие значения:

Ьс = 0,1; bs = 0,3; Ь = 0,1; Ь = 0,1.

Основные результаты вычислительного эксперимента представлены ниже:

- значение энергии лучшей частицы 111,81 ккал/моль;

о

- среднеквадратичное отклонение лиганда от нативного положения 1,86, А;

- среднеквадратическое отклонение координат лиганда 0,000903;

- максимальное число итераций равно 472.

Заметим, что указанное значение среднеквадратического отклонения лиганда от его нативного положения следует считать хорошим результатом.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Полученный в результате вычислительного эксперимента молекулярный комплекс иллюстрирует рисунок 3.

Рисунок 3 - Комплекс, полученный в результате вычислительного эксперимента: = 28; |S = 32; значение энергии лучшей частицы равно 111,81 ккал/моль

Результаты эксперимента показывают, что модификация метода роя частиц Р80-М2 обеспечивает локализацию глобального минимума скоринг-функции с высокой точностью, как по критерию минимума полной потенциальной энергии полученного комплекса, так и по критерию минимума среднеквадратического отклонения лучшей частицы от на-тивного положения лиганда.

Заключение

В работе представлены две модификации канонического метода роя части, имеющие целью повышение эффективности этого метода при решении многоэкстремальных задач оптимизации высокой размерности.

Суть модификации PSO-MI заключается в формировании двух новых точек притяжения для частиц роя (наряду с точками, отвечающими за инерциальную, когнитивную и социальную компоненты канонического метода). Указанные новые точки представляют собой лучшие точки наборов частиц-соседей данной точки. Модификация имеет целью диверсифицировать поиск.

Если все свободные параметры метода PSO-MI (как и канонического метода) являются статическими, то один из таких параметров модификации PSO-M2 является динамическим, так что данная модификация представляет собой пример самоадаптивного метода оптимизации [11]. Модификация имеет целью интенсифицировать поиск.

Выполнена программная реализация канонического методов роя части и двух его указанных модификаций. Вычислительный эксперимент по исследованию эффективности метода и модификаций при решении тестовых задач оптимизации показал преимущества предложенных модификаций по сравнению с каноническим методом, выявил превосходства модификации PSO-M2 как над каноническим методом, так и над модификацией PSO-MI.

С помощью метода PSO-M2 решена 28-мерная задача докинга для молекул протеазы HIV1 и дарунавиром 3U7S в качестве молекул-рецептора и лиганда соответственно. Результаты вычислительного эксперимента показали, что метод PSO-M2 успешно находит положение лиганда, близкое к нативному и может быть рекомендован для решения задач молекулярного докинга как альтернатива генетическому алгоритму.

В развитие работы авторы планируют решение с помощью разработанного алгоритмического и программного обеспечения ряда других задач молекулярного докинга.

Список литературы

1. Ewing T.J., Makino S., Skillman A.G., Kuntz I.D. DOCK 4.0: search strategies for automated molecular docking of flexible molecule databases // Journal of Computer-Aided Molecular Design. 2001. Vol. 15. P. 411-428.

2. Verdonk M.L., Cole J. C., Hartshorn M.J., Murray C. W., Taylor R.D. Improved protein-ligand docking using GOLD // Proteins: Structure, Function and Genetics. 2003. Vol. 52. P. 609-623.

3. Thomsen R., Christensen M.H. MolDock: A New Technique for High-Accuracy Molecular Docking // Journal of Medicinal Chemistry. 2006. Vol. 49, no. 11. P. 3315-3321.

4. Романов А.Н., Кондакова О.А., Григорьев Ф.В., Сулимов А.В., Лущекина С.В., Мартынов Я.Б., Сулимов В.Б. Компьютерный дизайн лекарственных средств: программа докинга SOL // Вычислительные методы и программирование. 2008. Т. 9. C. 213-233.

5. Chen H.-M., Liu B.-F., Huang H.-L., Hwang S.-F., Ho S.-Y. SODOCK: Swarm optimization for highly flexible protein-ligand docking // Journal of Computational Chemistry. 2007. Vol. 28, no. 2. P. 612-623.

6. Namasivayam V., G'unther R. pso@autodock: a fast flexible molecular docking program based on Swarm intelligence // Chemical Biology & Drug Design. 2007. Vol. 70, no. 6. P. 475-484. DOI: 10.1111/j.1747-0285.2007.00588.x

7. Halgren T. Merck Molecular Force Field. I. Basis, Form, Scope, Parameterization, and Performance of MMFF94 // Journal of Computational Chemistry. 1996. Vol. 17. P. 490-519.

8. Карпенко А.П., Селиверстов Е.Ю. Глобальная оптимизация методом роя частиц. Обзор // Информационные технологии. 2010. № 2. С. 25-34.

9. Tang K., Yao X., Suganthan P.N., MacNish C., Chen Y.P., Chen C.M., Yang Z. Benchmark Functions for the CEC'2008 Special Session and Competition on Large Scale Global Optimization: Technical Report // Nature Inspired Computation and Applications Laboratory, USTC, China, 2007. Available at: http://sci2s.ugr.es/eamhco/cec2010 functions.pdf , accessed 01.03.2014.

10. HIV-1 Протеаза // База знаний по биологии человека: сайт. Режим доступа: http://humbio.ru/humbio/peptides/00060494.htm (дата обращения 01.03.2014).

11. Eiben A.E., Michalewicz Z., Schoenauer M., Smith J.E. Parameter Control in Evolutionary Algorithms // Parameter Setting in Evolutionary Algorithms. Springer Berlin Heidelberg, 2007. P. 19-46. DOI: 10.1007/978-3-540-69432-8 2

SCIENTIFIC PERIODICAL OF THH BAUMAN MSTU

SCIENCE and EDUCATION

EL № FS77 - 48211. N»0421200025. ISSN 1994-0408

electronic scientific and technical journal

Solving a molecular docking problem by the modified PSO method

# 04, April 2014

DOI: 10.7463/0414.0707258

A.P. Karpenko, K. O. Matveeva, V.A. Bulanov

Bauman Moscow State Technical University, 105005, Moscow, Russian Federation

karpenko Q rk6.bmstu.ru kirandia 1 ff gm ail, com vbOO 1 'flramblerm

The paper presents an canonical method of the swarm particles in two modifications to raise this method efficiency in solving multi-extreme problems of high dimension optimization. The essence of PSO-M1 modification is to form two new points to attract swarm particles (along with the points which are responsible for inertial, cognitive, and social components of canonical method). These new points represent the best points of sets of particles-neighbours of a given point. The modification aims to diversify search. All free parameters of the PSO-M1 method (as well as an canonical method) are static. In contrast, one of such parameters of PSO-M2 modification is dynamic. So this modification represents an example of a self-adaptive method of optimization. The modification aims to intensify search. A computing experiment to study the method efficiency and its abovementioned modifications at solving the test problems of optimization showed advantages of offered modifications in comparison with canonical method, revealed a superiority of PSO-M2 modification both over canonical method, and over PSO-M1 modification. Using the PSO-M2 method allows us to solve the 28-dimensional molecular docking problem of HIV1 protease and darunaviry 3U7S as the molecules of receptor and a ligand, respectively. Results of computing experiment have shown that the PSO-M2 method successfully finds the position of ligand close to native and can be recommended for solving the molecular docking problems as an alternative to genetic algorithm.

Publications with keywords: global optimization, Method of a plenty of particles, molecular docking, proteases HIV1, darunavir 3U7S

Publications with words: global optimization, Method of a plenty of particles, molecular docking, proteases HIV1, darunavir 3U7S

References

1. Ewing T.J., Makino S., Skillman A.G., Kuntz I.D. DOCK 4.0: search strategies for automated molecular docking of flexible molecule databases. Journal of Computer-Aided Molecular Design, 2001, vol. 15, pp. 411-428.

2. Verdonk M.L., Cole J. C., Hartshorn M.J., Murray C. W., Taylor R.D. Improved protein-ligand docking using GOLD. Proteins: Structure, Function and Genetics, 2003, vol. 52, pp. 609-623.

3. Thomsen R., Christensen M.H. MolDock: A New Technique for High-Accuracy Molecular Docking. Journal of Medicinal Chemistry, 2006, vol. 49, no. 11, pp. 3315-3321.

4. Romanov A.N., Kondakova O.A., Grigor'ev F.V., Sulimov A.V., Lushchekina S.V., Martynov Ya.B., Sulimov V.B. [The SOL docking package for computer-aided drug design]. Vychislitel'nye metody i programmirovanie - Numerical methods and programming, 2008, vol. 9, pp. 213-233. (in Russian).

5. Chen H.-M., Liu B.-F., Huang H.-L., Hwang S.-F., Ho S.-Y. SODOCK: Swarm optimization for highly flexible protein-ligand docking. Journal of Computational Chemistry, 2007, vol. 28, no. 2, pp. 612-623.

6. Namasivayam V., G'unther R. pso@autodock: a fast flexible molecular docking program based on Swarm intelligence. Chemical Biology & Drug Design, 2007, vol. 70, no. 6, pp. 475-484. DOI: 10.1111/j .1747-0285.2007.00588.x

7. Halgren T. Merck Molecular Force Field. I. Basis, Form, Scope, Parameterization, and Performance of MMFF94. Journal of Computational Chemistry, 1996, vol. 17, pp. 490-519.

8. Karpenko A.P., Seliverstov E.Yu. [Global Optimization by the Particle Swarm Optimization Method. Review]. Informatsionnye tekhnologii, 2010, no. 2, pp. 25-34. (in Russian).

9. Tang K., Yao X., Suganthan P.N., MacNish C., Chen Y.P., Chen C.M., Yang Z. Benchmark Functions for the CEC'2008 Special Session and Competition on Large Scale Global Optimization: Technical Report. Nature Inspired Computation and Applications Laboratory, USTC, China, 2007. Available at: http://sci2s.ugr.es/eamhco/cec2010_functions.pdf , accessed 01.03.2014.

10. HIV-1 Proteaza [HIV-1 Protease]. Baza znaniy po biologii cheloveka [Knowledge Base on Human Biology]: website. Available at: http://humbio.ru/humbio/peptides/00060494.htm , accessed 01.03.2014. (in Russian).

11. Eiben A.E., Michalewicz Z., Schoenauer M., Smith J.E. Parameter Control in Evolutionary Algorithms. In: Parameter Setting in Evolutionary Algorithms. Springer Berlin Heidelberg, 2007, pp. 19-46. DOI: 10.1007/978-3-540-69432-8 2

i Надоели баннеры? Вы всегда можете отключить рекламу.