Научная статья на тему 'Компьютерное моделирование в задачах регуляции работы генов и эволюции организмов'

Компьютерное моделирование в задачах регуляции работы генов и эволюции организмов Текст научной статьи по специальности «Математика»

CC BY
153
23
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Любецкий Василий Александрович

В докладе предполагается очертить контуры учебного курса «Модели и алгоритмы в биоинформатике», а также сформулировать и описать научные результаты по высоко актуальным проблемам математической биологии и биоинформатики. Доклад знакомит с тематикой одной из лабораторий Института проблем передачи информации РАН.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Любецкий Василий Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компьютерное моделирование в задачах регуляции работы генов и эволюции организмов»

Любецкий В.А.

Институт проблем передачи информации РАН, Московский государственный университет им. М.В. Ломоносова,

заведующий лабораторией, профессор

lyubetsk@iitp.ru

Компьютерное моделирование в задачах регуляции работы генов и эволюции организмов

Аннотация

В докладе предполагается очертить контуры учебного курса «Модели и алгоритмы в биоинформатике», а также сформулировать и описать научные результаты по высоко актуальным проблемам математической биологии и биоинформатики. Доклад знакомит с тематикой одной из лабораторий Института проблем передачи информации РАН.

Введение

Сравнительно недавно Высшая аттестационная комиссия Министерства образования и науки РФ открыла специальность 03.01.09 «Математическая биология, биоинформатика», по которой можно получить степени физико-математические, биологические и медицинские; и также -родственную специальность 03.01.08 «Биоинженерия», по которой можно получить степени биологические, химические, физико-математические. В решении проблем этой области огромное, часто решающее значение имеют хорошие алгоритмы, хорошие компьютерные программы для многопроцессорных вычислительных устройств и умелый счет по этим программам, так как объемы данных, вовлекаемых соответствующими моделями, находятся на пределе суперкомпьютерных возможностей. Подбор, хранение и сортировка данных в этой области, создание соответствующих баз данных, иногда узко специализированных, также представляют собой нетривиальные задачи.

В мире исследования в области математической биологии и биоинформатики занимают ведущее место, прежде всего, в связи с огромным спектром приложений, непосредственно связанных с человеком и его текущей жизнедеятельностью. Это, в частности, - медицина, фармакология, парфюмерия, пищевая промышленность, ветеринария, очистка среды от любых загрязнений (тяжелыми металлами, радиоактивными изотопами и т.д.).

Трудно переоценить и фундаментальную роль этих исследований. Общая тенденция естественных наук состоит в точном описании происходящих в природе процессов, в создании точно сформулированных теоретических моделей этих процессов. Такое описание должно быть «точно сформулированным», математическим. Биология, которая стоит за

этой специальностью, в значительной мере, - молекулярная биология, биология процессов, происходящих в клетке или между клетками, процессов, связанных с рождением, распадом, преобразованием, воздействием друг на друга биологических молекул (прежде всего, нуклеиновых кислот и белков). В последние десятилетия появились огромные базы данных геномной информации, одна из самых известных -GenBank, [1].

Молекула ДНК, по современным представлениям полный источник жизни, это - просто последовательность в 4х буквенном алфавите с типичной длиной около 3 миллионов букв у одноклеточных организмов (бактерий) и 3 миллиардов букв у многоклеточных организмов (животных). В упомянутой базе данных собрано огромное количество таких последовательностей. Их можно сравнивать между собой и, тем самым, извлекать новое биологическое знание не из эксперимента в традиционном смысле (как говорят, «мокрого опыта», «опыта в пробирке»), а из «компьютерного опыта». Компьютерный сравнительный анализ последовательностей из GenBank и других баз данных уже привел ко многим биологическим открытиям в области функционирования и эволюции клетки.

В последние годы сделан следующий шаг. Появились математические и компьютерные модели функционирования клетки и эволюции организма. Эти модели носят механистический характер, так как подлинная физика поведения биологических молекул описывается по современным представлениям квантовой теорией, слишком сложной для получения реальных решений. Однако и эти модели в основном не допускают пока строго математического решения, их исследование, предсказание на их основе биологических феноменов осуществляются с помощью моделирования, которое также требует многих часов и иногда многих суток работы суперкомпьютера. Мы обычно используем кластер MVS-100K в МСЦ РАН , [2], с использованием 2048 процессоров.

Заметим, что компьютерным моделирование в этой области приобрело нетривиальный характер также только в последние годы.

Мы приведем несколько примеров таких моделей, которые безусловно содержательно описывают биологические явления.

Проблемы и некоторые результаты моделирования

1. Классификация белков

Дано множество всех пластомных белков, например, из водорослей или, более обычно, из группы родственных водорослей. Найти кластеризацию (т.е. разбиение этого множества белков на попарно не пересекающиеся подмножества), так чтобы в один кластер попали «родственные» белки и только они. Образно говоря, «родственными» называют «один и тот же» белок, «две копии» одного белка, находящиеся в пластидах одного или разных видов. Эти кавычки поясняют еще так: эти белки «мало отличаются», как две последовательности, выполняют «одну и

ту же функцию» в клетке, имеют «общее происхождение» от некоторого предкового белка. Такие белки называют гомологичными (или: ортологичными). Итак, задача состоит в нахождении кластеров (семейств) гомологичных белков. Разумеется, кластеризация и различные алгоритмы для ее выполнения давно и широко используются, но эта задача далека от окончательного решения.

Нами предложен удивительно простой алгоритм для нахождения упомянутых кластеров, результаты алгоритма хорошо согласуются с биологическими наблюдениями. Математически говоря, набор семейств гомологичных белков можно определить как результат работы этого алгоритма; и это - типичная цель любой модели.

Эффективная суперкомпьютерная реализация этого и других упоминаемых ниже алгоритмов остается актуальной задачей.

2. Конкурирующие процессы связывания и движения (конкуренция РНК-полимераз)

Дана последовательность в 4-х буквенном алфавите, на которой отмечены направленные участки двух типов: одни называются генами, другие промоторами. Геометрия расположения генов и промоторов может быть произвольной, но она фиксирована. С каждым промотором, если он свободен, связывается молекулярная машина («полимераза») одного из фиксированного конечного числа типов. Полимераза имеет фиксированную длину и движется по направлению промотора, вообще говоря, вдоль всей последовательности. Таким образом, много разных полимераз одновременно связываются с последовательностью и движутся по ней, каждая в своем направлении (из двух возможных). Промотор «свободен» в данный момент, если в его пределах не находится никакой части никакой полимеразы. Ген «считывается», если некоторая полимераза прошла по его направлению от его начала до его конца. Частота считывания гена называется его «уровнем транскрипции». Каждый промотор для каждого типа полимераз характеризуется своей интенсивностью попыток связывания с ним полимераз этого типа. Можно считать, что концентрация любого типа полимераз достаточная, т.е. интенсивность отражает только качество самого промотора для данного типа полимераз. Попытка считается осуществленной, если промотор свободен в момент ее реализации. Для части типов после связывания происходит «абортивный» процесс, состоящий в чередовании движения с конечной скоростью по направлению промотора на случайное расстояние и в мгновенном возвращении в исходное положение. Такие односторонние колебания продолжаются случайное число раз до тех пор, пока полимераза не отойдет на критическое расстояние от промотора. В этот момент полимераза отрывается от промотора и ее длина мгновенно уменьшается на известную величину, и движение в том же направлении продолжается. Для оставшихся типов абортивный процесс отсутствует, движение начинается сразу после связывания, длина полимеразы не меняется.

Допустимо, что попытки образуют пуассоновский процесс, а полимераза движется детерминировано с фиксированной скоростью, своей для каждого типа, вплоть до столкновения с другой полимеразой. После столкновения двух полимераз, движущихся друг за другом в одном направлении, скорость первой не меняется, а скорость второй ограничивается скоростью первой до тех пор, пока первая связана с последовательностью («элонгирует»). В случае встречного движения обе полимеразы покидают последовательность («терминируют»). Здесь биологический интерес представляют многие задачи, например: даны интенсивности попыток связывания всех промоторов, найти уровни транскрипции всех генов. Обратная задача: даны уровни транскрипции всех генов, найти интенсивности попыток связывания, которые приводят к наилучшему приближению этих уровней. Еще задача: даны простые законы изменения во времени уровней транскрипции генов и скоростей всех полимераз (в ситуации значительного изменения температуры), найти в том же смысле интенсивности попыток связывания. Большие проблемы возникают, если отказаться от предположения о детерминированном характере движения полимераз, что биологически более адекватно. Стохастическое движение полимераз строго описано нами, но получается слишком сложная задача даже для моделирования. Предложенное нами компьютерное решение доступно по адресу [3]. Простой случай, хотя биологически мало интересный, возникает, если предположить отсутствие абортивного процесса, равенство между собой всех скоростей полимераз и нулевые размеры всех промоторов и полимераз. Тогда задача сводится к специальному случаю теории встречных потоков с аннигиляцией. Дополнительные трудности возникают, если вместо последовательности рассматривается замкнутая («кольцевая») последовательность (т.е. ее буквы как бы равномерно расположены по некоторой окружности). Например, конкуренция на кольцевой последовательности с длиной в 17 тысяч букв (митохондриальный геном человека). В нем присутствуют полимеразы только одного типа, а три промотора расположены вблизи следующих позиций: 407 против часовой стрелки, 561 и 646 по часовой стрелке. Абортивные процессы отсутствуют. Сначала полимеразы не проходят полный круг, встречные потоки полимераз с трех промоторов сталкиваются и срываются. Поэтому дальние от промоторов гены имеют почти нулевые уровни транскрипции, что не соответствует биологической реальности. Это состояние кажется неустойчивым: в какой-то момент число связываний с одним из промоторов оказывается больше (на 10-20 полимераз), эти «лишние» полимеразы не аннигилируют, проходят полный круг и, в том числе, свой промотор. Последнее создает эффект роста интенсивности связывания с этого промотора, благодаря чему происходит рост числа «круговых» полимераз в одном направлении. Если случайно в достаточной мере возрастет число связываний с другого промотора, то направление процесса может поменяться. Направление редко меняется

несколько раз. Быстро устанавливается преобладающее направление потока полимераз. Как только число «круговых» полимераз в одном направлении превзойдет некоторый порог, интенсивность эффективного связывания с одним из промоторов и уровень транскрипции соответствующих генов будет постоянно увеличиваться. И так вплоть до заполнения полимеразами всей последовательности (с промежутками менее, чем длина полимеразы). Задача: описать эти режимы и бифуркации. Обычно на окружности в определенных местах имеются ещё «протекающие терминаторы». Это - сайты, которые в каждом из направлений пропускают только свою в среднем фиксированную долю полимераз. При мутациях, разрушающих эти сайты, возникают тяжелые заболевания. Какова динамика процесса в этом случае? Здесь геометрия расположения может быть также весьма разной. Такие протекающие промоторы присутствуют и в случае геометрии линейной последовательности. Кроме того, имеется конкуренция другого сорта: если два промотора перекрываются или очень близко расположены, то экспериментально установлено, что полимеразы, пытающиеся связаться с ними, мешают друг другу за счет диффузии в трехмерной окрестности этих промоторов. Здесь много и конкретных вопросов. Например, каковы средняя длина пройденного полимеразой участка и асимптотическое распределение этих длин.

3. Согласование набора деревьев (результат согласования -дерево видов)

Хотя каждый ген вместе с его регуляторной системой развивается внутри вида, эволюция гена, системы и эволюция вида, как правило, далеки друг от друга. Фундаментальная задача состоит в переходе здесь к непрерывному времени и к среде из генов, систем и видов. Мы рассмотрим более обычный подход: гены вместе с их системами эволюционируют в дискретном времени, как бы независимо друг от друга, а потом их нужно согласовать между собой относительно эволюции вида. Эволюция каждого элемента (гена, системы, гена-системы, вида) описывается своим деревом. Пусть эволюция гена задается деревом Gi («деревом гена»). Дан набор генов и соответствующих деревьев Найти дерево 5 («дерево вида»), которое в среднем наиболее близко к набору ^¡}. Программа решения этой задачи такова: каждому Gi сопоставить степень отличия Gi от неизвестного 5,

а затем минимизировать функционал с(^,},5)= с^Б) по переменной 5. Определить как число отличий в эволюционном развитии гена от

эволюционного развития вида. Для этого нужно определить список эволюционных событий и сопоставить дискретное время, текущее по дереву Gi, с дискретным временем, текущим по дереву 5. Последнее требует определить отображение вершин из Gi в вершины и ребра из 5 (получается «сценарий эволюции» гена Gi вдоль дерева видов 5). Нами предложены решения этих задач, причем алгоритмами не более, чем кубической (т.е. очень низкой) сложности, которые доступны по адресу http://lab6.iitp.ru/ru/super3gl/. В них неизвестное дерево видов 5 вместе со

сценариями эволюции генов строится индуктивно по мере возрастания мощности множества V листьев в 5. А именно, на каждом шаге уже известны деревья 51 (с множеством Vl листьев) и 5г (с множеством V2 листьев) и соответствующие им наборы сценариев /1 и /2 . Эти деревья склеиваются в одно большее дерево 51+5г с объединенными сценариями /1+/2 так, чтобы степень с((С,},51+52) была минимальной относительно всевозможных разбиений V на две части V и V2. На той же идее основано построение сценария эволюции гена вдоль известного дерева 5: роль меньших деревьев играют два поддерева в 5. Эти поддеревья должны иметь корни, находящиеся в одном временном слое. Мы предложили алгоритм, который разбивает множество ребер в 5 на временные слои, так что между ребрами из одного слоя возможны одномоментные события. Однако остается проблема обоснования такого разбиения.

4. Реконструкция вторичной структуры вдоль дерева (на примере реконструкции аттенюаторной регуляции)

Нам нужны представления о первичных и вторичных структурах, об аттенюаторной регуляции. Некоторые регуляторные участки («первичные структуры»), будучи скопированы (т.е. оторваны от целого генома) образуют еще и «вторичные структуры» (ВС); каждая ВС состоит в спаривании букв А с Т и G с С (водородной связью пар и специальной связью соседних пар). Биологические ВС содержат в той или иной комбинации до тысячи и более спиралей. Такое спаривание происходит участками («плечами») некоторой длины. Спираль состоит из нескольких «гипоспиралей» - связных спаренных участков: два максимально продолженных без разрывов плеча, соединенные своей петлей. Перед определенными генами важны вторичные структуры только определенного типа. Один из типов называется аттенюаторной регуляцией, ее существенная часть - пара альтернативных спиралей. Итак, дано дерево 5 (видов или белковых регуляторов) и каждому его листу приписана первичная структура. В ряде случаев из экспериментальных данных известны вторичные структуры, образующиеся в этих первичных структурах. Однако эти вторичные структуры не даны в задаче и далеко не всегда известны, их нахождение - цель задачи. Когда они известны, то используются для независимого контроля решения. Нужно найти соответствующее эволюции распределение (конфигурацию) структур: первичных во внутренних вершинах дерева 5 и вторичных во всех его вершинах. Наше решение основано на гиббсовском подходе с функционалом энергии Н(а), глобальные минимумы которого должны описывать варианты искомой конфигурации а'. Точки а' глобального минимума находятся методом аннилинга на основе стохастической динамики Метрополиса-Хастингса. Сам функционал Н(а) является суммой трех слагаемых. Первое слагаемое отражает энергию парного взаимодействия двух первичных структур на концах каждого из ребер в дереве 5. Точнее, оно отражает стандартную динамику первичной

структуры: вероятности замен букв согласно фиксированной матрице замен и вероятности вставок/стираний какого-то слова произвольной длины в произвольной позиции первичной структуры. Для каждой позиции скорость эволюции в ней определяется на основе гамма-распределения. Второе слагаемое отражает консервативность вторичной структуры вдоль каждого ребра и даже вдоль целых путей в дереве 5 с помощью сложного потенциала нелокального взаимодействия. Третье слагаемое отражает присутствие других элементов рассматриваемой регуляции (например, гена «лидерного пептида»). Первое и второе слагаемые требуют парного выравнивания: соответственно первичных и вторичных структур на концах ребра. Для этого мы развили процедуру выравнивания вторичных структур у двух первичных структур. Алгоритм аннилинга реализуется как неоднородная марковская цепь, переходные вероятности которой зависят от текущей конфигурации а(п) и параметра вп, характеризующего условную температуру системы. Пусть последовательность конфигураций ст(п) начинается с любой ст(0) и вп стремиться к бесконечности так, что Нт(^(п/вп)). Тогда доказано, что ст(п) сходится по вероятности к одной из минимальных конфигураций а'; так описывается всё их множество [4].

5. Конкуренция двух процессов (транскрипции и трансляции -аттенюаторная регуляция)

Еще об аттенюаторной регуляции. По последовательности друг за другом движутся две молекулярные машины, одна - полимераза, другая называется рибосомой. Рибосома связывается со своим сайтом (аналогом промотора) перед специальным геном (геном «лидерного пептида») после того, как полимераза уже связалась со своим промотором и ушла вперед на некоторое расстояние. Если рибосома догоняет полимеразу, то рибосома снижает скорость и движется вслед за полимеразой, не влияя на нее. Скорость рибосомы по определенному закону v(с) зависит от концентрации с некоторого вещества (аминокислоты), не превосходя 45 букв/сек. На участке последовательности между полимеразой и рибосомой формируется вторичная структура (ВС) ш с наименьшей энергией среди всех возможных, которая по определенному закону снижает скорость v(ш) полимеразы. При отсутствии ВС ее скорость 42 букв/сек. Если в какой-то момент пониженная скорость полимеразы сочетается с ее нахождением на участке, имеющем много букв Т (тогда связь полимеразы с последовательностью слабеет), то эта связь разрывается, и полимераза покидает последовательность («терминация транскрипции»). Дана последовательность, по которой таким образом движутся полимераза и за ней рибосома. Найти зависимость р(с) частоты терминации транскрипции от величины с. Обычно v(с) определяется по закону Микаэлиса-Ментен, вопрос о выборе v(ш) гораздо более сложный. Предложенное нами компьютерное решение доступно по адресу [5]. Эта задача включает два вопроса, имеющих большое самостоятельное значение. По первому из них мало, что известно: как

определить силу сцепления молекулярной машины (полимеразы, рибосомы и т.п.) с последовательностью, по которой она движется; каково влияние ВС на силу сцепления. Замечено, что эта сила убывает с уменьшением скорости движения полимеразы. Тогда: как ВС уменьшает скорость движения и как уменьшение скорости уменьшает силу. Напротив, по второму вопросу имеется много эмпирических исследований, но отсутствует теория. Как классифицировать ВС, биологически наблюдаются очень сложные ВС с множеством псевоузлов; как приписать энергию данной ВС. Мало, что известно о классификации псевдоузлов и о декомпозиции ВС на какие-то элементарные ВС. Рассмотрим простейший случай, когда ВС состоит из одной спирали. Напомним: спираль состоит из нескольких гипоспиралей. Мы приписывали спирали энергию по

формулам: для энергии связи равную ТТ Xи для энергии петель

и Е1 - энергия /-й гипоспирали, вычисляемая по таблицам водородной связи и связи соседних пар (стекинга); ^ - длина петли у /-й гипоспирали, а в и с - некоторые константы. Следующая трудная проблема: пространство всех ВС слишком велико, желательно разбить его на кластеры («макросостояния») и уже кластеру приписывать энергию. Это разбиение должно быть эффективным и в этой связи поступают следующим образом. Диаграмма - это скобочная структура, в которой каждая пара скобок соответствует гипоспирали и помечена номером соответствующей спирали. Скобочная структура понимается так: последовательная пара пар скобок ( ) 1( )2... соответствует последовательно расположенным гипоспиралям; расположение первой гипоспирали в петле второй гипоспирали представляется вложенной парой пар скобок ((...)02. Так могут быть описаны и простые псевдоузлы: (1(2)1)2. Макросостояние - это множество всех ВС (которые соответствуют «микросостояниям»), соответствующих данной диаграмме; это множество предполагается непустым.

6. Сочетание 3-мерной и 1-мерной диффузий

Промотор имеет небольшую длину (до нескольких десятков букв), а типичная последовательность имеет несколько миллионов букв (у бактерии). Полимераза плавает в клетке, и перед началом ее движения по последовательности должна связаться со своим промотором (сильное, «специфическое» связывание). Как полимераза находит свой промотор? Последовательность (ДНК) расположена в клетке специальным образом, как кривая Жордана в соответствующем квадрате (у бактерий и архей). И ее геометрия играет важную роль. Существует следующее представление: специфическое связывание начинается с того, что полимераза связывается с ближайшим к ней участком последовательности слабой («неспецифической») связью и движется в одном из двух направлений

равную

пробегает все гипоспирали у спирали

(случайно выбираемых) некоторое случайное короткое время. Это -одномерная диффузия полимеразы вдоль кривой. Затем полимераза отрывается (из-за слабой связи или столкновения) от последовательности и снова неспецифически связывается с другим участком кривой, который, если бы продолжать двигаться по кривой, расположен очень далеко от первого участка. Итак, после одномерной диффузии короткое время происходила трехмерная диффузия, а затем опять началась одномерная и т.д. до тех пор, пока полимераза не приблизится к своему промотору. Задача состоит в исследовании такого сочетания двух диффузий с учетом вида или только характеристик кривой. Здесь много экспериментальных данных, но теория, насколько нам известно, ограничена. Взаимодействие спиралей РНК с рибосомой, ещё не начавшей трансляцию, но движущейся вдоль РНК в поисках инициирующего кодона, также связано с диффузией. Хотя сейчас реализовать моделирование диффузии слишком трудно, это позволило бы точнее определять инициирующие кодоны, в том числе, отличающиеся от обычного AТG.

7. Происхождение видов

Рассматривается характеристика генома, определяемая числовой последовательностью х, в которой на ,-м месте находится число ш, разных генов, каждый из которых имеет ровно копий (копия гена - также ген). Числа ш, - неотрицательные и все целые или все вещественные, а с некоторого места в х идут одни нули. Обозначим ш(х)=ш1+ш2+... - число всех типов генов и п(х)=ш1+2ш2+... - число всех генов в геноме с характеристикой х. Пусть V - пространство всех допустимых последовательностей х и Дх,£) -плотность геномов в точке х в момент времени t. Заметим, что в этой модели геномы и гены представлены только через их характеристики. Для точки х разрешены следующие переходы (соответствующие события происходят с генами и геномами).

1) <...,ш/,...>^<...,ш,-1+1,ш,-1,...> потеря одного гена среди ш,, если и ш,>1, и <...,ш,-,...>^<Ш1-1,Ш2,...>, если i=1 и Ш1>1; если ш,=0 или Ш1=0, то этот переход запрещен.

2) <...,ш,-,...>^<Ш1+1,Ш2,...> перенос, т.е. появление нового гена, представленного одной копией.

3) <...,ш,,...>^<...,ш,-1,ш,+1+1,...> дупликация гена среди ш,; при этом ш, >1, иначе переход запрещен.

4) <.,ш,-,.>^<Ш1+1,.,ш,-1+1,ш,-1,.> мутация гена среди ш,, если /*1, и <...,ш,-,...>^<...,ш,■,...>, если ,=1; при этом ш,>1, иначе переход запрещен.

Для каждого из переходов определен свой вектор скорости (интенсивности) перехода, зависящий от точки х. Их сумму обозначим А(х), она задает векторный потенциал. Скалярный потенциал определим как -V(x), где ^х) отражает внутреннюю согласованность («выживаемость») генома в точке х. Оба потенциала зависят от параметров, среди которых выделяются ш(х) и п(х); некоторые параметры неизвестны, и их предполагается варьировать. Пусть ^х) принадлежит классу V функций,

которые отличаются невысокими хаотично расположенными максимумами. Такие V соответствуют представлению: природа заранее не сделала выбора, какие геномы будут жизнеспособными в процессе их эволюции под действием векторного потенциала A(x), но все-таки заложила в V(x) небольшие предпочтения. Скалярный потенциал V(x,t), вообще говоря, зависит еще от времени, т.е. сам подвержен некоторой динамике в пространстве V. Например, можно поставить вопрос так: в моменты времени t,, определенные по пуассоновскому распределению с параметром ß, происходят катаклизмы. Это - достаточно резкие смены выживаемости, когда происходит переход от V(t,) к V(t,+i), состоящий в перемещении и небольшом изменении локальных максимумов в V(t,) согласно некоторому распределения с одним параметром X. Существует ли естественное распределение и значения параметров ß и X, при которых с некоторого момента времени в пространстве V начинают формироваться кластеры (биологически - виды). Поясним последнее. Мы хотим описать область параметров, для которых существует момент времени to, начиная с которого траектории обладают свойством: «почти вся масса M(t) = ^ f (x, t)dx сосредотачивается в нескольких дизъюнктных кластерах»,

(*). Эти кластеры представляют характеристики возникших видов. Число кластеров можно заранее оценить через число известных видов, что послужит условием в задаче. Тогда t0 представляет момент происхождения видов. Из численного моделирования известны значения параметров, при которых имеет место свойство (*). Мы не обсуждаем биологически более адекватную картину, в которой геном представлен более явным образом, как линейная последовательность натуральных чисел с повторениями, в которой каждое число - имя гена. В этом случае динамика генома получает более сложное описание.

7.1. Динамику характеристики x=x(t) можно описать и по-другому. А именно, уравнением x=A(x)+ еЧ, где Ч - шум с некоторым генератором, определяемым потенциалами, и Ч - параметр. Можно предположить, что существует момент времени t0, начиная с которого имеется конечное число массивных кластеров с центрами масс xi,xi..., переходы между которыми требуют экспоненциально долгого времени или невозможны, (**). Тогда эти xj - характеристики возникших видов, а to - момент происхождения видов. В духе теории Вентцель-Фрейдлина можно найти функцию ф (x), для которой равенство ф '(x)=0 является необходимым условием для выполнения (**). Тогда xj можно находить, решая это уравнение.

Литература

1. http://www.ncbi.nlm.nih.gov/

2. http://www.jscc/

3. http://lab6.iitp.ru/ru/rivals/

4. http: //lab6.iitp.ru/ ru/ anneal/

5. http://lab6.iitp.ru/rnamodel/

i Надоели баннеры? Вы всегда можете отключить рекламу.