УДК 519.6 517.3
Исследование структуры однослойных везикул DMPC с использованием параллельного алгоритма асинхронной дифференциальной эволюции
Е. И. Жабицкая^, Е. В. Земляная^, М. А. Киселёв*
* Объединённый институт ядерных исследований ул. Жолио-Кюри, д. 6, Дубна, Московская область, Россия, 141980 ^ Международный университет «Дубна», Дубна, Московская область, Россия, 141980
Модель разделённых форм-факторов (Separated Form Factors, SFF), разработанная ранее для обработки спектров малоуглового рассеяния нейтронов, в настоящей работе адаптирована для численного анализа структуры полидисперсной популяции однослойных везикул по данным малоуглового синхротронного рассеяния (Small Angle X-ray Scattering, SAXS). Параметры SFF-модели, определяющие структуру везикулярной системы (средний радиус везикул, полидисперсность, толщина бислоя и др.), вычисляются путём фитирования к экспериментальным данным SAXS. Процедура фитирования основана на использовании алгоритма Асинхронной Дифференциальной Эволюции (АДЭ) — эффективного метода поиска глобального минимума. Разработана параллельная реализация предложенного подхода на базе технологии MPI (Message Passing Interface). Проведено численное исследование структуры полидисперсной везикулярной системы димиристоилфосфатидилхолина (DMPC) в 40% водном растворе сахарозы. Показано, что для согласия правой части спектра рассчитанных SAXS-кривых с имеющимися экспериментальными данными необходим учёт флуктуации толщины бислоя. На основе расчётов с разными моделями внутренней структуры бислоя сделаны заключения о наиболее адекватной форме плотности длины синхротронного рассеяния поперёк мембраны. Представлены результаты расчётов на многопроцессорном кластере ЛИТ ОИЯИ (Дубна), подтверждающие эффективность параллельной реализации метода АДЭ.
Ключевые слова: везикулярные системы, малоугловое синхротронное рассеяние, Асинхронная Дифференциальная Эволюция, глобальная минимизация, параллельные вычисления.
1. Введение и постановка задачи в рамках SFF
Информация о структуре и свойствах однослойных везикул играет важную роль в структурной биологии, биохимии и фармакологии. В работах [1,2] развит и успешно использован метод разделённых форм-факторов (SFF) для анализа структуры полидисперсных везикулярных систем по данным малоуглового рассеяния нейтронов (SANS). В настоящей работе метод SFF адаптирован для моделирования структуры полидисперсной популяции однослойных везикул ди-миристоилфосфатидилхолина (DMPC) в 40% водном растворе сахарозы на основе данных малоуглового синхротронного рассеяния (SAXS), измеренных на установке А2 (DESY, Германия).
В рамках SFF макроскопическое когерентное сечение монодисперсной популяции везикул определяется следующей формулой
1 уч
— (q) = nxFs(q,R)Fb(q, 0Ь), (1)
Ш £ mon
где пх — число везикул в единице объёма, q — вектор рассеяния, Fs(q,R) и Fb(q, @ь) — соответственно формфактор сферы радиуса R и формфактор симметричного липидного бислоя:
Статья поступила в редакцию 30 декабря 2013 г. Работа выполнена при частичной финансовой поддержке РФФИ (гранты 13-01-00060а, 12-01-00396а).
2
/ 2
дЯ )
Ръ(д, 6Ь)
\
р(х, &ъ) соБ(дх)<1х
(2)
N 2
/
Здесь р(х, въ) = рс(х, въ)-рзис(х) — разность плотности длины рассеяния липид-ного бислоя везикулы рс (х, въ) и плотности длины рассеяния раствора сахарозы Азис(ж), называемая контрастом; вь — набор параметров, характеризующих распределение плотности длины рассеяния внутри липидного бислоя.
В силу физических особенностей SAXS, модель плотности, предложенная в [1] и подтвердившая в [1,2] свою эффективность для SANS-анализа структуры везикулярных систем в избытке жидкости, не применима для анализа SAXS-спектров. Поэтому, с целью выбора оптимальной формы функции плотности, мы провели исследования с использованием целого ряда моделей р(х, въ), которые представлены на рис. 1 и упорядочены в табл. 1 по возрастанию числа варьируемых параметров.
2
ро <—d—> рн «-
ро
рь - - Рь
рн
_Р0
а) a-модель
б) Ь1-модель
Ь2 -модель
рн
_Р0
в) с-модель
а-»
Рн <— рн
ро ро
_рм и |— рм
Рь 1 рь
г) ^-модель
г12 -модель
Рис. 1. Исследуемые модели функций плотности длины синхротронного рассеяния на липидном бислое р(х, ©ь).
Таблица 1
Зафиксированные и варьируемые параметры моделей. ©ь — параметры, относящиеся к внутренней структуре бислоя. ©я — параметры, описывающие размер, концентрацию везикул и некогерентный фон.
Модель Зафиксированные параметры, х1012 см-1 Варьируемые па въ фаметры в в8
а ро = 10,94; рЬа = 7,95 d, крл К, т, пх, 1в
&1, &2 ро = 10,94; рь = 4,71; й, Б, кра, рн К, т, пх, 1в
с ро = 10,94; рь =4,71 й, А Ь, крс1, рн К, т, пх, 1в
Ро; рь; Рм = 7,95 й, А Ь, крЛ, рн, К, т, пх, 1в
Полидисперсность радиуса везикул описывается распределением Шульца
- (М=% ш
■т+1
ехр
(т + 1)Д К
(3)
где К — средний радиус везикулы, т — коэффициент полидисперсности, относительное среднеквадратичное отклонение а = л/1/т + 1. Тогда
Rmax / Rmax
Ffoly (q, R,m)= j Fs(q, R)G (R, R) dR j G (r, Rj dR. (4)
^min Rm
Полидисперсность параметров внутренней структуры бислоя учтём, используя усечённое нормальное распределение /(х) = N(0,1):
к , к
Fрoly (q, Оь) = j Fb [q, вь (Оь, kpd, x)~) f (x)dx j f (x)dx, (5)
-к ' -к
где компоненты равны соответственно: д = д + крс<х, Б = Б + крс<х, Ь = Ь -крс<х; д, Б и Ь — средние значения параметров внутренней структуры бислоя везикулы; крс — коэффициент полидисперсности параметров внутренней структуры бислоя везикулы. В расчётах Rmín = 10 нм, Rmax = 100 нм, К = 3.
Макроскопическое сечение полидисперсной везикулярной системы имеет вид:
л у
<^( ч) = 1т(д) = пх Р?о1у (д, Я, т) Рьро1у (д, вь) . (6)
С учётом разрешения спектрометра измеряемое в эксперименте значение макроскопического сечения 1(д) может быть записано как
1( 0) = Ы ч) + \А2 + 1в, (7)
где А2 = 3,6 ■ 1 0-7 см2 — второй момент функции разрешения спектрометра, 1в — величина некогерентного фона.
2. Численные результаты и выводы
Подгонка параметров моделей бислоя осуществлялась минимизацией среднеквадратичного относительного отклонения теоретических сечений Ii (qi, О) от соответствующих экспериментальных значений Ii (qi):
2 ^ (h(qi) - h (gi-, О)\ (8)
х= ¿il —ш )' (8)
где О — вектор варьируемых параметров (см. столбцы 3 и 4 табл. 1).
Число варьируемых параметров в SAXS-расчётах существенно возрастает по сравнению с SANS, что приводит к снижению устойчивости итерационного процесса на основе обобщённого метода наименьших квадратов, успешно применявшегося для обработки SANS-спектров в [1,2].
В нашей работе значения параметров О, обеспечивающие минимум %2-функционала, определяются с помощью параллельного алгоритма Асинхронной Дифференциальной Эволюции (АДЭ) [3-5].
Результаты фитирования для разных моделей плотности длины рассеяния представлены в табл. 2 и на рис. 2. Все модели дают близкие оценки для среднего радиуса везикул R и его относительного отклонения а. Соответственно, отличия
Таблица 2
Результаты оптимизации с целевой функцией (8) (округлены до последней
статистически значащей цифры). Поскольку спектр не нормирован, параметр пх включает в себя нормировочный фактор. Здесь к = п — то, число экспериментальных точек п = 894, число варьируемых параметров то =7 для модели "а", то = 8 для "Ь" и то = 9 для "с" и "й". — результат фитирования без учёта полидисперсности параметров внутренней структуры бислоя
Модель R, нм a d, нм D, нм L, нм kpd Рн, х1010см- nx, -1 х1018 см-3 1в, a.e x2 к
а 20,1 0,230 1,31 — — 0,0 Al=7,95 8,7 7,7 0,078
bi 19,0 0,267 3,53 2,38 — 0,18 17,0 1,6 0,0 0,00715
ь2 18,8 0,272 3,89 3,89 — 0,18 14,4 3,6 9,6 0,0184
с 18,5 0,253 4,59 2,41 1,27 0,0 13,2 2,0 9,5 0,0180
d1 19,1 0,265 3,48 2,72 0,39 0,10 16,3 3,8 6,0 0,00688
di <*> 18,9 0,269 4,12 3,0 0,52 0,0W 12,7 3,6 10,4 0,0180
d2 18,9 0,268 3,97 3,97 1,41 0,0 15,1 2,1 10,5 0,0187
Рис. 2. а) Экспериментальный и теоретические спектры, соответствующие оптимальным параметрам модели 8РЕ с использованием различных функций плотности рс(х, ©ь). б) д> 2,5 нм-1, модели а, Ь2, с и
в) д > 2,5 нм-1, модели Ь1, ¿1 и ¿1 с кра = 0.
в описании спектра рассеяния при малых g несущественны (рис. 2а)). Различия в моделях, связанные с описанием внутренней структуры бислоя оболочки везикул, сказываются в области больших значений д.
Варианты b2, с и d2 (рис. 2 б)) обеспечивают качественное воспроизведение экспериментальной кривой, однако не могут описать всю амплитуду колебаний интенсивности в области больших значений д. Модели Ъ\ и d\ (рис. 2 в)) имеют наилучшее согласие с экспериментальными данными.
Оптимизация модели d\ с кра = 0 (штрихпунктирная кривая на рис. 2 в)) показывает, что именно введение полидисперсности внутренних параметров бислоя (5) позволило описать различия в глубине минимумов на экспериментальной кривой в области больших значений д.
Толщина бислоя и средний радиус везикул в наших расчётах получились ниже по сравнению с оценками, сделанными в [1] на базе SANS для везикул DMPC в D2O. С другой стороны, в работе [6] показано, что значения этих параметров должны уменьшаться с ростом концентрации сахарозы в растворе. Поэтому в целом можно считать, что полученные нами параметры везикулярной системы DMPC в 40% растворе сахарозы не противоречат результатам предыдущих работ. Для уточнения оценки параметров, отвечающих за структуру везикул, необходимы систематические расчёты по SAXS- и SANS-спектрам, измеренным с разной концентрацией сахарозы.
Эффективность параллельной MPI-реализации алгоритма АДЭ тестировалось на LINUX-кластере ЛИТ ОИЯИ. Расчёт для dx-модели, имеющей максимальное число варьируемых параметров m = 9, запускался многократно с одними
Рис. 3. Среднее время (Т}, затраченное на вычисления (а) и ускорение (speed-up = TTA/pOOc ) (б) в зависимости от числа задействованных
процессоров Nproc.
и теми же границами начальных и допустимых значений варьируемых параметров на разном количестве вычислительных узлов: Nproc G [2; 128]. В представленной статистике каждая комбинация запускалась N =10 или 20 раз.
На рис. 3 а) видно, что среднее время, затраченное на вычисления, падает практически линейно при росте числа задействованных вычислительных узлов. Ускорение вычислений (speed-up) с учётом возрастания необходимого количества вычислений функции при Nproc = 128 составило 98 ± 21 раз.
Рис. 3 б) демонстрирует близкое к линейному ускорение вплоть до nproc = 128 параллельно задействованных вычислительных узлов.
Таким образом, численное исследование показало, что модель SFF, модифицированная для учёта полидисперсности параметров внутренней структуры бислоя оболочки везикул, позволила воспроизвести экспериментальные данные в области больших значений q для случая полидисперсной везикулярной системы DMPC в 40% растворе сахарозы. Сравнительный анализ моделей плотности длины рассеяния выявил преимущество модели di. Проведённое тестирование подтвердило эффективность параллельной компьютерной реализации подхода на базе SFF-АДЭ.
Литература
1. What Can We Learn About the Lipid Vesicle Structure from the Small-Angle Neutron Scattering Experiment? / M. A. Kiselev, E. V. Zemlyanaya, V. K. Aswal, R. H. H. Neubert // European Biophysics Journal. — 2006. — Vol. 35, No 6. — Pp. 477-493.
2. Structure of Unilamellar Vesicles: Numerical Analysis Based on Small-Angle Neutron Scattering Data / E. V. Zemlyanaya, M. A. Kiselev, J. Zbytovska et al. // Crystallography Reports. — 2006. — Vol. 51, No 1 Supplement. — Pp. S22-S26.
3. Zhabitskaya E. I., Zhabitsky M. V. Asynchronous Differential Evolution // Lecture Notes in Computer Science. — 2012. — Vol. 7125. — Pp. 328-333.
4. Жабицкая Е. И., Жабицкий М. В. Решение оптимизационных задач на распределенных вычислительных системах с помощью алгоритма асинхронной дифференциальной эволюции // Математическое моделирование. — 2012. — Т. 24, № 12. — С. 33-37. [Zhabitskaya E.I., Zhabitsky M.V. Parallel Solving of Optimization Problems on Distributed Systems by Asynchronous Differential Evolution // Mat. Model. — 2012. — Vol. 24, No 12. — Pp. 33-37. — (in russian). ]
5. Zhabitskaya E. I., Zhabitsky M. V. Asynchronous Differential Evolution with Adaptive Correlation Matrix // Proceedings of the 15th Annual Conference on Genetic and Evolutionary Computation. — 2013. — Pp. 455-462.
6. Sucrose Solutions as Prospective Medium to Study the Vesicle Structure: SAXS and SANS Study / M. A. Kiselev, P. Lesieur, A. M. Kisselev et al. // Journal of Alloys and Compounds. — 2001. — Vol. 328. — Pp. 71-76.
UDC 519.6 517.3
Unilameller DMPC Vesicles Structure Analysis using Parallel Asynchronous Eifferential Evolution
E. I. Zhabitskayat, E. V. Zemlyanaya^ M. A. Kiselev*
* Joint Institute for Nuclear Research 6, Joliot-Curie str., Dubna, Moscow region, Russia, 141980 ^ International university "Dubna" Dubna, Moscow region, Russia, 141980
The Separated Form Factors model (SFF) developed previously for analysis of the small angle neutron scattering data, has been extended for numerical study of structure of polydis-persed population of unilamellar DMPC vesicles using the small angle synchrotron scattering spectra (SAXS). Parameters of vesicle structure (average radius, polidispersity, bilayer thickness etc.) are fitted by means of the parallel Asynchronous Differential Evolution (ADE) method - the effective global minimization algorithm. Parallel computer implementation of our approach has been done using the MPI technique (Message Passing Interface). The numerical investigation of structure of polydispersed population of unilamellar vesicles of DMPC in the 40% water solution of sucrose has been performed. We show that accounting for the fluctuation of the bilayer thickness provides an agreement of our calculations with experimental data in the right part of SAXS spectra. On the basic of calculations with different models of internal bilayer structure, an appropriate form of the X-ray scattering length density across bilayer has been chosen. We present results of methodical calculations on the multiprocessor cluster (LIT, JINR, Dubna) demonstrating efficiency of the MPI-based parallel computer code of ADE.
Key words and phrases: vesicles, small angle X-ray scattering, Asynchronous Differential Evolution, global minimization, parallel computing.