Научная статья на тему 'Усредненная энтропия как характеристика консервативности участков генома'

Усредненная энтропия как характеристика консервативности участков генома Текст научной статьи по специальности «Математика»

CC BY
141
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭНТРОПИЯ / КОНСЕРВАТИВНЫЕ УЧАСТКИ ГЕНОМА / ПЛАСТОМЫ / ENTROPY / CONSERVED GENOME REGIONS / PLASTOMES

Аннотация научной статьи по математике, автор научной работы — Зверков Олег Анатольевич, Селиверстов Александр Владиславович, Любецкий Василий Александрович

На основе предложенного нами понятия усредненной энтропии проведен широкомасштабный поиск консервативных сайтов в пластидах водорослей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Зверков Олег Анатольевич, Селиверстов Александр Владиславович, Любецкий Василий Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AVERAGED ENTROPY AS CONSERVATIVITY MEASURE OF GENOME REGIONS

The averaged entropy criterion is introduced and used in large-scale searches for conserved sites in plastomes of algae.

Текст научной работы на тему «Усредненная энтропия как характеристика консервативности участков генома»

The sufficient conditions are obtained for global asymptotic stabilization of zero solution for a bilinear discrete-time periodic control system.

Key words: discrete-time dynamical system; bilinear system; periodic system; global asymptotic stability.

УДК 519.234.4

УСРЕДНЕННАЯ ЭНТРОПИЯ КАК ХАРАКТЕРИСТИКА КОНСЕРВАТИВНОСТИ УЧАСТКОВ ГЕНОМА

© О.А. Зверков, А.В. Селиверстов, В.А. Любецкий

Ключевые слова: энтропия; консервативные участки генома; пластомы.

На основе предложенного нами понятия усреднённой энтропии проведён широкомасштабный поиск консервативных сайтов в пластидах водорослей.

Постановка задачи и определение усреднённой энтропии. Главную роль в геноме организма играют два типа участков: гены (кодирующие участки) и регуляторные участки, которые включают и выключают (экспрессируют) работу генов. Эти участки располагаются в лидерных областях (т.е. в областях перед геном, не перекрывающих предшествующий ген). К регуляторным участкам относятся промоторы, сайты связывания рибосомы и других регуляторных белков, боксы регуляторных сайтов и соответствующие им факторы, вторичные структуры, и т.д. Все они характеризуются, в частности, повышенной консервативностью на фоне окружающих областей генома. Нами предложена модель, которая основана на оценке степени консервативности участка с помощью усреднённой энтропии. Это позволяет решать важную задачу поиска консервативных и в т. ч. регуляторных участков в любых геномах. Здесь приводятся результаты поиска, полученные с помощью этой модели, для случая пластомов (геномов пластид) диатомовых и динотомовых водорослей.

Рассматривается множественное выравнивание лидерных областей ортологичных (родственных) генов. Пример выравнивания показан на рис. 1.

ІМС_001713 АААА===Т АААТТ АААТ АТТ АТТТ=ААААТ ДАТ АТ АбТТАСТТТААСАСТТТТАААСТ ААААТ ААСТ ДАТ

ІМС_008588 ===АТАССААСТАСААТАТТААТТ=ААААТААТАТТТТТАСТТТАТТАЄТТТТАААСТАЕААТА6ААААТ

імс_008589 аатататтаттттааатаататттааааатаатататттастттааєааттттааастаєааттататтт

1МС_014267 ===============АТААТААТААААААТААТАТТТТТАСТТТ6ТА6АТТТТАААСТААААТТАТААТТ

МС_014287 ===============АТААТАСТААААААТААТАТТТТТАСТТТАААСАТТТТАААСТААААТТАТААСТ

І\ІС_014808 АААТТСТСАААЄТАААТАТТАТТТАААААТААТАТАТТТАСТТТЄАОААТТТТАААСТАОААТТАТАТТТ ІМС_015403 ААА6АААТААСТААААТАТТТАТТ=ААААТААТАТТТТТАСТТТАЄТААТТТТАААСТААААТТААААТТ 1МС_016731 ===========ТАААТТАТТАТТА=ААААТААТААТТТТТСТТТАСТАТТТТТАААСТААААТТАТААСТ

ІЧС_001713 ААСААТАТААЄТТАТТТТЄТТАТТТАААСТТТСАСТАА=====АААТТ=ТАТАААТТААЄСАТТТТАААА [\IC_008588 ААСАТТАТСОЄТТАТТТТАТТАСТТААААТТТТАТТАА=====АААТТ=аАСААА=ТААВВАТТТААААА 1МС_008589 А6САТТАТАССТТАТТТТСТТАТТТААААТТТТААТАА=====АААТТ=ТАТАААТТАА6САТТТТАААА

ІМС_014267 ААТАТТАТТЄЄТТАТТТТАТТАСТТААААТТТСАТТАА=====АААТТ=ОАТААА=ТААЄСАТТТТСААА 1МС_014287 ААТАТТАТТ66ТТАТТТТАТТАСТТААААТТТСАТТАА=====АААТТ=САТААА=ТАА6САТТТТАААА

МС_014808 А6САТТАТА66ТТАТТТТ6ТТАТТТААААТТТТААТАА=====АААТТ=ТАТАААТТААССАТТТТАААА

МС_015403 ААСАТТАТСССТТАТТТТАТТАСТТААААТТТ=АТТАА=====АААТТ=йАТААА=ТАА6САТТТААААС

МС_016731 ААСАТТАС6ЄСТТАТТТТАТТСАТТААААТТТСАТТААСАТТТАААТТАААТААА=СААЄСАТТТТААА=

Рис. 1. Часть множественного выравнивания лидерных областей перед геном ус/12.

Вначале указаны номера пластомов. Звёздочкой помечены столбцы с нулевой энтропией, точками — столбцы с минимальной ненулевой энтропией, знаком = показана делеция.

2529

Усреднённая энтропия приписывается множественному выравниванию. А именно, в каждом столбце располагаются какие-то знаки из множества {G, C,T, A, =}. Столбцу i приписана энтропия I(i) = — к pk ln(pk), где pk равны долям пяти указанных знаков. Окном назовём I штук соседних столбцов выравнивания (с общей длиной n ), первый столбец располагается в позиции от 1 -й до (n — I + 1) -й. Обозначим x позицию первого столбца окна. Усреднённая энтропия равна (1/1) ^¿=о wi' I (x + i)- Здесь wi —функция от i, достигающая максимума в середине окна и симметрично спадающая до фиксированного малого значения на его концах. На рис. 2 принято: I = 20 или I = 30, wi = 0.54 — 0.46 ■ cos(2ni/(l — — 1)). Сходные вероятностные соображения использованы нами при моделировании и других клеточных и эволюционных процессов [1—5].

Результаты на примере диатомовых и динотомовых водорослей. Исследованы консервативные участки в некодирующих областях пластомов следующих видов: Durinskia baltica (NC 014287), Kryptoperidinium foliaceum (NC 014267), Fistulifera sp. JPCC DA0580 (NC 015403), Odontella sinensis (NC 001713), Phaeodactylum tricornutum (NC 008588), Thalassiosira oceanica (NC 014808), Thalassiosira pseudonana (NC 008589), Synedra acus (NC 016731). Среди них шесть пластомов диатомовых водорослей. Пластиды D. baltica и K. foliaceum близки к пластидам P. tricornutum [6]. Большое число близких пластомов позволяет говорить о достоверном выделении консервативных сайтов в некодирующих областях геномов. Для пар ортологичных генов, позиционно сцепленных хотя бы у 7 из 8 видов были проведены выравнивания лидерных участков. Консервативные участки в составе длинных лидерных областей, неконсервативных в целом, в хлоропластах диатомовых водорослей имеются перед генами rps20, ycf 12, atpA, atpB, atpG, psaB, psaL, psbA, psbE, psbl, psbK, psbN, psbV, psbZ, rbcS, trnG, petF. Из них только ген petF, кодирующий ферредоксин, отсутствует в пластоме T. oceanica (и перенесен в ядро).

Рис. 2. Графики усреднённой энтропии для выравнивания лидерных областей перед генами ус/12. Локальные минимумы в правой части соответствуют участкам, связанным с регуляцией инициации трансляции. Пунктир — для окна шириной 20, сплошная линия

— 30.

ЛИТЕРАТУРА

1. Lyubetsky V.A., Rubanov L.I., Seliverstov A.V. Lack of conservation of bacterial type promoters in plastids of Streptophyta // Biology Direct. 2010. V. 5. № 34.

2. Lyubetsky V.A., Zverkov O.A., Rubanov L.I., Seliverstov A.V. Modeling RNA polymerase competition: the effect of a -subunit knockout and heat shock on gene transcription level // Biology Direct. 2011. V. 6. № 3.

3. Горбунов К.Ю., Любецкий В.А. Дерево, ближайшее в среднем к данному набору деревьев // Проблемы передачи информации. 2011. Т. 47. Вып. 3. С. 64-79.

4. Lyubetsky V.A., Rubanov L.I., Rusin L.Yu., Gorbunov K.Yu. Cubic time algorithms of amalgamating gene trees and building evolutionary scenarios // Biology Direct. 2012. V. 7. № 48.

2530

5. Lyubetsky V.A., Zverkov O.A., Pirogov S.A., Rubanov L.I., Seliverstov A.V. Modeling RNA polymerase interaction: chordates mitochondrial DNA // Biology Direct. 2012. V. 7. № 26.

6. Imanian B., Pombert J.-F., Keeling P.J. The Complete Plastid Genomes of the Two ’Dinotoms’ Durinskia baltica and Kryptoperidinium foliaceum // PLoS ONE. 2010. V. 5. № 5.

БЛАГОДАРНОСТИ: Работа выполнена при частичной финансовой поддержке Министерства образования и науки РФ (госконтракт 14.740.11.1053 и соглашение 8481).

Zverkov 0.А., Seliverstov А/V., Lyubetskiy У.А. AVERAGED ENTROPY AS CONSERVATIVITY MEASURE OF GENOME REGIONS

The averaged entropy criterion is introduced and used in large-scale searches for conserved sites in plastomes of algae.

Key words: entropy; conserved genome regions; plastomes.

УДК 517.938

БИФУРКАЦИИ ВЫНУЖДЕННЫХ КОЛЕБАНИЙ В КОНСЕРВАТИВНЫХ

ДИНАМИЧЕСКИХ СИСТЕМАХ

© Л.С. Ибрагимова

Ключевые слова: бифуркация; консервативные системы; вынужденные колебания.

Изучается задача о бифуркации вынужденных колебаний в консервативных динамических системах. Предложенный метод основан на конструировании вспомогательного двухпараметрического операторного уравнения. Данный способ позволяет определить решения исходной задачи о периодических решениях.

В настоящей работе рассматриваются консервативные [1] и близкие к консервативным системы, заданные дифференциальными уравнениями вида

X = ¥ (х; Ь; л), х € К2, (1)

где л — скалярный или векторный параметр. Предполагается, что функция ¥(х; Ь; л) является непрерывно дифференцируемой по совокупности аргументов и периодической по Ь, то есть ¥(х; Ь + Т; л) = ¥(х; Ь; л); пусть также система (1) имеет точку равновесия х* = 0 при всех значениях л. Изучается задача о бифуркации вынужденных колебаний в окрестности точки равновесия х* = 0.

Обозначим через V(х,л) оператор сдвига по траекториям системы (1) за время от Ь = 0 до Ь = Т> 0. В силу периодичности функции ¥ (х; Ь; л) изучение задачи о Т -периодических решениях системы (1) может быть сведено к изучению отображения V(х, л), неподвижные точки которого определяют начальные значения Т -периодических решений уравнения (1). Систему (1) можно представить в виде

х = А(л,Ь)х + а(х,Ь,л), (2)

где А(л,Ь) = ¥'х(0; Ь; л), а(х; Ь; л) = 0(||х||2) при ||х|| ^ 0. Ниже для простоты будем считать, что А(л,Ь) не зависит от Ь, т. е. А(л) = ¥'х(0; Ь; л). Тогда оператор V может быть

2531

i Надоели баннеры? Вы всегда можете отключить рекламу.