Научная статья на тему 'МИКРОРНК И ИХ МИШЕНИ: ОСНОВЫ БИОИНФОРМАЦИОННОГО ПОИСКА'

МИКРОРНК И ИХ МИШЕНИ: ОСНОВЫ БИОИНФОРМАЦИОННОГО ПОИСКА Текст научной статьи по специальности «Фундаментальная медицина»

CC BY
116
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИКРОРНК / МРНК / БИОИНФОРМАЦИОННЫЙ ПОИСК / TARGETSCAN / DIANA / ЭПИГЕНЕТИКА

Аннотация научной статьи по фундаментальной медицине, автор научной работы — Шестаков Александр Владимирович, Михайлова Арина Алексеевна, Саприна Татьяна Владимировна, Онхонова Октябрина Эрдэмовна

МикроРНК - короткие некодирующие последовательности нуклеотидов, представляют собой ключевой механизм эпигенетической регуляции. Контроль экспрессии генов происходит на посттранскрипционном уровне посредством комплементарного связывания микроРНКс соответствующей ей молекулой мРНК, что приводит к деградации последней и прекращению дальнейшей трансляции. На сегодняшний день появляется все больше данных относительно вовлеченности микроРНК в механизм развития сердечнососудистых, эндокринных, злокачественных и других хронических неинфекционных заболеваний, что позволяет рассматривать микроРНК в качестве перспективной основы создания инновационных диагностических, прогностических и лечебных технологий. Однако, исследования по изучению микроРНК значительно усложняются политаргетными влияниями данных молекул, что подчеркивает необходимость тщательного анализа и прогнозирования эффективных взаимодействий микроРНК:мРНК. С целью преодоления настоящего барьера были созданы бионформационные инструменты, позволяющие с определенной точностью просчитывать потенциальные мишени и эффекты микроРНК, тем самым задавая траекторию движения экспериментальным работам. В настоящем обзоре будут рассмотрены основные принципы молекулярного взаимодействия, лежащие в основе алгоритмов работы инструментов биоинформационного поиска для прогнозирования мишеней и микроРНК:мРНК взаимодействий. Кроме того, будут описаны ключевые параметры и основы их интерпретации для наиболее используемых веб-инструментов: TargetScan и DIANA Tools.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по фундаментальной медицине , автор научной работы — Шестаков Александр Владимирович, Михайлова Арина Алексеевна, Саприна Татьяна Владимировна, Онхонова Октябрина Эрдэмовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MICRORNA AND ITS’ TARGETS: BASICS OF BOIINFORMATIC SEARCH

MicroRNAs are defined as short non-coding molecules that regulate gene expression at the post-transcriptional level through complementary binding to the corresponding mRNA. This pairing leads to inhibiting offurther translation by mRNA degradation, in other words, microRNA is a crucial example of epigenetic regulation. Recent reports have suggested an important role of these signaling molecules in numerous chronic non-infectious diseases development, including different types of cancer. This linking in the onset and progression of various pathological conditions makes it possible to considermicroRNAs as promising candidates for creating effective diagnostic, prognostic and therapeutic technologies. The main problem in the design of research related to miRNA functional studies is the necessity to predict the effective miRNAs: mRNA interaction because of the multi-target effect on corresponding genes. In order to overcome this barrier and to anticipate potential miRNAs targets effects for the further guidance of the experimental stage, a number of bioinformatics research tools have been developed. In this review we will consider the basic molecular principles that underlie the bioinformatics algorithms for predicting targets and miRNAs: mRNA interactions. Furthermore, the key parameters as well as bases of their interpretation for the most used web tools, such as TargetScan and DIANA Tools, will be described.

Текст научной работы на тему «МИКРОРНК И ИХ МИШЕНИ: ОСНОВЫ БИОИНФОРМАЦИОННОГО ПОИСКА»

© Коллектив авторов, 2021 https://doi.org/10.29296/24999490-2021-06-01

МикроРНК И ИХ МИШЕНИ: ОСНОВЫ БИОИНФОРМАЦИОННОГО ПОИСКА

А.В. Шестаков, А.А. Михайлова, Т.В. Саприна, О.Э. Онхонова

ФГБОУВО «Сибирский государственный медицинский университет» Министерства здравоохранения Российской Федерации, Российская Федерация, 634050, Томск, Московский тракт, д. 2 Е-mail: Shestakov1808@gmail.com

СВЕДЕНИЯ ОБ АВТОРАХ

Шестаков Александр Владимирович — аспирант кафедры факультетской терапии с курсом клинической фармакологии ФГБОУ ВО «Сибирский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Тел: +7(929) 302-78-62. E-mail: Shestakov1808@gmail.com ORCID: 0000-0001-9648-8255

Михайлова Арина Алексеевна — студент лечебного факультета ФГБОУ ВО «Сибирский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Тел.: +7 (983) 233-10-58. E-mail: armikhaylova@yandex.ru. ORCID: 0000-0001-6066-3525

Саприна Татьяна Владимировна — заведующий эндокринологической клиникой ФГБОУ ВО «Сибирский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Доктор медицинских наук, профессор кафедры факультетской терапии с курсом клинической фармакологии ФГБОУ ВО СибГМУМинздрава России. Тел.: +7(913) 81858-26. E-mail: tanja.v.saprina@mail.ru. ORCID: 0000-0001-9011-8720

Онхонова Октябрина Эрдэмовна — аспирант кафедры факультетской терапии с курсом клинической фармакологии ФГБОУ ВО «Сибирский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Тел.: +7(983) 343-20-83. E-mail: oktya.2014@mail.ru. ORCID: 0000-0002-7354-184X

МикроРНК — короткие некодирующие последовательности нуклеотидов, представляют собой ключевой механизм эпигенетической регуляции. Контроль экспрессии генов происходит на посттранскрипционном уровне посредством комплементарного связывания микроРНКс соответствующей ей молекулой мРНК, что приводит к деградации последней и прекращению дальнейшей трансляции.

На сегодняшний день появляется все больше данных относительно вовлеченности микроРНК в механизм развития сердечнососудистых, эндокринных, злокачественных и других хронических неинфекционных заболеваний, что позволяет рассматривать микроРНК в качестве перспективной основы создания инновационных диагностических, прогностических и лечебных технологий. Однако, исследования по изучению микроРНК значительно усложняются политаргетными влияниями данных молекул, что подчеркивает необходимость тщательного анализа и прогнозирования эффективных взаимодействий микроРНК:мРНК. С целью преодоления настоящего барьера были созданы бионформационные инструменты, позволяющие с определенной точностью просчитывать потенциальные мишени и эффекты микроРНК, тем самым задавая траекторию движения экспериментальным работам.

В настоящем обзоре будут рассмотрены основные принципы молекулярного взаимодействия, лежащие в основе алгоритмов работы инструментов биоинформационного поиска для прогнозирования мишеней и микроРНК.мРНК взаимодействий. Кроме того, будут описаны ключевые параметры и основы их интерпретации для наиболее используемых веб-инструментов: TargetScan и DIANA Tools.

Ключевые слова: микроРНК, мРНК, биоинформационный поиск, TargetScan, DIANA, эпигенетика

MicroRNA AND ITS' TARGETS: BASICS OFBOIINFORMATIC SEARCH A.V. Shestakov, A.A. Mikhailova, T.V. Saprina, O.E. Onkhonova

Siberian State Medical University at the Ministry of Health of Russia; 2 Moskovskiy Trakt, Tomsk, 634050, Russian Federation

Е-mail: Shestakov1808@gmail.com

INFORMATION ABOUT THE AUTHORS

Shestakov Alexander Vladimirovich — PhD student of the In-patient Department Therapy Division with a Clinical Pharmacology Course in Siberian State Medical University at the Ministry of Health of Russia. Tel.: +7(929) 302-78-62. E-mail: Shestakov1808@gmail. com. ORCID: 0000-0001-9648-8255

Mikhailova Arina Alekseevna — student of general medicine faculty in Siberian State Medical University at the Ministry of Health of Russia. Tel.: +7(983) 233-10-58. E-mail: armikhaylova@yandex.ru. ORCID: 0000-0001-6066-3525

Saprina Tatiana Vladimirovna — MD, PhD, head of the endocrinology clinic in Siberian State Medical University at the Ministry of Health of Russia. Doctor of medical sciences, Professor. Tel.: +7 (913) 818-58-26. E-mail: tanja.v.saprina@mail.ru. ORCID: 0000-00019011-8720

Onkhonova Oktyabrina Erdemovna — PhD student of the In-patient Department Therapy Division with a Clinical Pharmacology Course in Siberian State Medical University at the Ministry of Health of Russia. Tel.: +7(983) 343-20-83. E-mail: oktya.2014@mail.ru. ORCID: 0000-0002-7354-184X

MicroRNAs are defined as short non-coding molecules that regulate gene expression at the post-transcriptional level through complementary binding to the corresponding mRNA.

This pairing leads to inhibiting offurther translation by mRNA degradation, in other words, microRNA is a crucial example of epigenetic regulation.

Recent reports have suggested an important role of these signaling molecules in numerous chronic non-infectious diseases development, including different types of cancer. This linking in the onset and progression of various pathological conditions makes it possible to considermicroRNAs as promising candidates for creating effective diagnostic, prognostic and therapeutic technologies.

The main problem in the design of research related to miRNA functional studies is the necessity to predict the effective miRNAs: mRNA interaction because of the multi-target effect on corresponding genes. In order to overcome this barrier and to anticipate potential miRNAs targets effects for the further guidance of the experimental stage, a number of bioinformatics research tools have been developed. In this review we will consider the basic molecular principles that underlie the bioinformatics algorithms for predicting targets and miRNAs: mRNA interactions. Furthermore, the key parameters as well as bases of their interpretation for the most used web tools, such as TargetScan and DIANA Tools, will be described.

Key words: microRNA, mRNA, bioinformatic search, TargetScan, DIANA, epigenetics

ВВЕДЕНИЕ

МикроРНК представляют собой короткие не-кодирующие молекулы РНК, регулирующие экспрессию широкого спектра генов как клеточных физиологических процессов, так и молекулярных патологических путей. Настоящая их функция реализуется на посттранскрипционном уровне — микроРНК комплементарно связываются с соответствующими мРНК, что ведет к деградации последних и прекращению дальнейшей трансляции. Известно, что настоящим образом микроРНК регулируют более 60% генов человека. [1—3]

Иными словами, данные сигнальные молекулы представляют собой важный инструмент эпигенетического контроля, что позволяет предположить их значительную роль в развитии целого спектра муль-тифакториальных заболеваний. В частности, была описана важность ш1Я-126 в патогенезе разных типов сахарного диабета [4], а микроРНК семейства И8а-1е1-7 ассоциированы с ожирением и связанными с ним метаболическими заболеваниями [5]. Ми-кроРНК также участвуют в развитии заболеваний почек, инициируя их появление и дальнейшую прогрессию, что объясняет повышенный интерес для исследователей с точки зрения применения данных сигнальных молекул в диагностических и лечебных целях [6]. Все чаще в литературе описывается влияние микроРНК на развитие сердечно-сосудистых заболеваний и их осложнений: к примеру, в ряде исследований подчеркивается связь снижения экспрессии ш1Я-21 и возникновения различных видов инсульта [7, 8, 9].

Отдельно следует отметить роль микроРНК в патогенетических каскадах онкологических заболеваний [10], где они могут действовать как супрессо-ры или индукторы. Свое действие онкогенные ми-кроРНК реализуют посредством влияния на мРНК генов апоптоза или на гены с антипролиферативной ролью. Напротив, микроРНК-супрессоры опухолей

подавляют экспрессию онкогенов [11]. Такая универсальность участия в патогенезе различных заболеваний позволяет считать изучение микроРНК одним из наиболее перспективных направлений поиска новых методов лечения и диагностики [12—15].

Тем не менее, влияние микроРНК на их гены-мишени сложно охарактеризовать из-за их поли-таргетного воздействия: каждая микроРНК имеет несколько мишеней мРНК и наоборот; в связи с этим до сих пор проблемным остается правильная идентификация их взаимодействия. Основным путем решения названной проблемы является прогнозирование и экспериментальная валидация данных взаимодействий микроРНК:мРНК. С этой целью были разработаны многочисленные биоинформационные инструменты задачей которых является просчет потенциальных эффективных взаимодействий микроРНК:мРНК для их последующей экспериментальной проверки. Полученные знания позволяют добиться прогресса в выяснении механизмов, с помощью которых микроРНК действуют как в физиологических процессах, так и на уровне патологических внутриклеточных каскадов. Однако алгоритмы и параметры, используемые каждым инструментом, могут быть трудны для понимания, что затрудняет выбор соответствующих микроРНК для последующей проверки и работы.

В данном обзоре мы поставили перед собой задачу описать базовые биологические основы взаимодействия микроРНК:мРНК, лежащие в основе биоинформационных алгоритмов просчета мишеней микроРНК.

Кроме того, мы опишем параметры и основы их интерпретации для наиболее используемых инструментов биоинформационного поиска — TargetScan и DIANA microT, что может быть полезно для исследователей в контексте создания собственного плана биоинформационного поиска и дальнейшей исследовательской работы.

Биологические основы поиска микроРНК и их мишеней

Как уже было упомянуто, микроРНК осуществляют регуляцию экспрессии генов на посттранскрипционном уровне посредством комплементарного взаимодействия с таргетной мРНК, что приводит к деградации последней и блокированию трансляции. Следовательно, первым важнейшим компонентом поиска мишени микроРНК является нуклеотидная последовательность самих микроРНК.

Работа всех алгоритмов по поиску микроРНК и их мишеней основана на разработанных базах данных, содержащих известные нуклеотидные последовательности микроРНК; крупнейшими из них являются miRBase [15] и TarBase [16]. Чем больше последовательностей содержит база, тем более надежным является инструмент для прогнозирования мишеней микроРНК. Например, miRBase содержит по меньшей мере 1917 пре-микроРНК и 2654 зрелых микроРНК человека, а суммарно в ней хранится 48 860 последовательностей зрелых микроРНК для 271 организмов (данные на ноябрь 2018 г.) [1]. Важно отметить, что не все представленные в miRBase последовательности были экспериментально подтверждены, в связи с чем точное количество существующих микроРНК еще достоверно не установлено. Существуют также базы, содержащие исключительно информацию о проверенных микроРНК, например, названная ранее TarBase [16].

Какие критерии положены в основу данного анализа? В первую очередь, учитываются характеристики двух нуклеотидных зон микроРНК: затравочной области и З'-участка микроРНК.

Затравочная область — это зона между 2 и 8 ну-клеотидами микроРНК в направлении от 5' до 3' конца, комплементарная с З'-нетранслируемой областью (3'-untranslated region, 3'UTR) мРНК. Затравочная область микроРНК позволяет классифицировать микроРНК на семейства и виды, в связи с чем многие биоинформационные инструменты включают ее в качестве ключевого элемента для прогнозирования мишеней микроРНК. Кроме того, необходимо учитывать частоту встречаемости нуклеотидных пар Гуанин:Урацил (G:U) в затравочной области, поскольку это может повлиять на репрес-сионную способность микроРНК [17].

З'-участок микроРНК — это нуклеотидный фрагмент в положении 13-16 в направлении от З'-конца. Данная область с одной стороны оказывает влияние на способность микроРНК подавлять активность генов, а с другой стороны может выступать дополнительным участком комплементарного взаимодействия с мРНК. Данный параметр включен в алгоритмы TargetScan [15, 18, 19] и miRanda [20].

Вторым важным компонентом в механизме прогнозирования эффектов микроРНК является ну-клеотидная последовательность целевых мРНК, особенно в их 3'UTR-участке. Большинство алгорит-

мов используют данные о 3'UTR мРНК для поиска целевых микроРНК. Это связано с тем, что данная область наиболее часто является целевой для различных микроРНК. Однако, важно учитывать, что взаимодействие может происходить также и вдоль всей мРНК [21, 22]. Последовательности мРНК и их характеристики (например, данные о начале и окончании 3'UTR-участка) можно получить из существующих баз данных: Ensembl [23], RefSeq [24] или UCSC Genome [25, 26].

Существуют также и другие участки мРНК, выступающие в роли мишеней для микроРНК. К подобным элементам относят 5'-нетранслируемую область (5'-untranslated region, 5'-UTR) [27, 28], открытые рамки считывания (open reading frames, ORFs) [29, 30] и кодирующие последовательности (coding sequences, CDS) мРНК [31]. Все названные дополнительные участники в разной степени используются алгоритмами для прогнозирования мишеней микроРНК. Например, DIANA microT (v5.0) включает в свой процесс поиска CDS фрагменты [22, 32], а miRTar [33] и TargetScan [30] используют все три названных дополнительных региона.

Следующим элементом прогнозирования является консервационный анализ. Степень консервативности — это параметр, отражающий частоту встречаемости признака (нуклеотидной последовательности) среди разных видов: считается, что, если признак (последовательность) распространен среди многих видов, значит эволюционно он является необходимым для выживания.

Консервационный анализ основан на расчете филогенетических и эволюционных расстояний, а конечной его целью является исследование функциональности мишени микроРНК (в связи с тем, что данная мишень была сохранена положительным естественным отбором) [34, 35]. Как можно предположить, более высокая степень консервативности отражает более надежный прогноз влияния микроРНК на экспрессию определенного гена. Зонами высокой консервативности также могут быть участки самих микроРНК, при этом чаще всего наиболее консервативными зонами являются затравочная область и 3'-участок микроРНК. Консервационный анализ является важным этапом биоинформационного анализа и включен в большинство алгоритмов прогнозирования мишеней микроРНК.

Важно также учитывать, что биологические реакции регулируются термодинамическими принципами. Следовательно, предположить силу связи между микроРНК и ее целевой мРНК можно за счет оценки минимальной свободной энергии связывания: чем ниже свободная энергия, тем сильнее связь, что увеличивает вероятность взаимодействия в действительности [36, 37]. Свободная энергия связывания выражается в отрицательном вещественном значении, и ее единица измерения — ккал/моль. Большинство существующих инструментов про-

гнозирования мишеней микроРНК используют пакет Vienna RNA для измерения свободной энергии связывания [38, 39]. Существует также программное оборудование PITA, которое рассчитывает доступность 3'UTR-фрагмента с помощью оценки свободной энергии; программа учитывает вторичную структуру мРНК, при этом сайт связывания с конкретной микроРНК должен быть доступен для связывания [40].

Помимо всего вышеперечисленного существует также ряд дополнительных факторов, которые могут повлиять на результат прогноза мишени микроРНК, среди которых: регуляторные процессы, такие как связывание белков с РНК [40, 41] и метилирование РНК [42]; вариативное таргетирова-ние микроРНК в различных типах клеток и тканях [43]; присутствие длинных некодирующих РНК, выступающих в роли ингибиторных ловушек для микроРНК. Названные и другие контекстные параметры разнятся от одного алгоритма к другому,

но используются в большинстве существующих инструментов прогнозирования мишеней микроРНК. Например, в систему TargetScan включена оценка степени репрессии и кооперативной функция микроРНК [19, 43, 44], в miRTar рассматривается альтернативный сплайсинг [33], а в miRanda и PITA включены параметры доступности вторичной структуры мРНК [21].

Таким образом, каждый из существующих инструментов биоинформационного поиска обладает своим уникальным набором оценочных параметров, что приводит к возникновению больших различий в конечных поисковых результатах, что необходимо принимать во внимание. Использование лишь одного инструмента для прогнозирования мишеней микроРНК и поиска взаимодействий мироРНК:мРНК может ограничить исследователя на этапе планирования эксперимента.

Далее в настоящем обзоре мы опишем практические моменты работы с некоторыми из систем,

Таблица 1

Параметры системы TargetScan

Table 1

TargetScan parameters

Название параметра Диапазон значений Интерпретация

Site type (тип затравочной области микроРНК) 8шег > 7шег-ш8 > 7шег-А1 > бшег Совпадающие сайты в затравочной области микроРНК (нуклеотиды со 2 по 8 от 5'-конца микроРНК, которые имеют идеальную комплементарность с З'иТЯ-участком мРНК) — от наиболее совпадающих до наименее подходящих

Context++ score (показатель контекста) от 1 до -1 Сумма 14 характеристик каждого из четырех типов названных выше сайтов: чем более отрицательный показатель, тем большая репрессивная способность микроРНК

Context++ score percentile (перцентиль показателя контекста) от 0 до 100% Процент фрагментов микроРНК с наименее благоприятным показателем «Context++ score»

Weighted context++ score (взвешенный показатель контекста) от 1 до -1 Более низкое отрицательное значение указывает на более вероятный прогноз репрессии

Cumulative weighted context++ score (кумулятивный взвешенный показатель контекста) Определяется по формуле: С(И) + (1-2С8ф (А1Ш-С(д—1)) Более низкое отрицательное значение указывает на более вероятный прогноз репрессии. Данный показатель отражает суммарную репрессию всех возможных целей одной микроРНК

Conserved branch length (длина консервативной ветви) 8шег: 1.8; 7шег-ш8: 2.8; 7шег-А1: 3.6; бшег: нет Данный показатель представляет собой сумму филогенетических длин ветвей между разными видами для каждого из типов сайтов микроРНК

PCT score (PCT показатель) от 0 до 1 Чем больше показатель, тем выше степень консервативности затравочной области микроРНК, а соответственно тем выше ожидаемая супрессия таргетной мРНК

Aggregate PCT (совокупный показатель PCT) Определяется по формуле: 1 - ((1 - РСТ) Бйе1 х (1 - РСТ) site2 Данный параметр включает в себя таргетные З'иТЯ-участки мРНК человека и мыши

Conserved sites (консервативные сайты) > 0 Количество идентифицированных консервативных участков

а также детализируем основные этапы интерпретации результатов биоинформационного поиска.

TargetScan

TargetScan имеет два варианта поиска: по символу гена или по названию микроРНК. При поиске по названию гена, в результатах поиска отображаются различные транскрипты гена — ранжируются результаты от более к менее распространенным. Для каждого транскрипта отображаются нуклеотидные фрагменты, которые с разной вероятностью могут стать мишенью для микроРНК; данная вероятность оценивается путем анализа всех параметров алгоритма для каждой кандидатной микроРНК. При поиске по названию микроРНК результаты показывают гены-мишени в соответствии со специфическим транскриптом; результаты могут быть ранжированы по интересующему исследователя параметру. Чтобы понять значимость результатов, необходимо остановиться на некоторых из параметров алгоритма системы TargetScan (табл. 1).

Тип затравочной области микроРНК (Site type). Повторим, что затравочной областью микроРНК называется участок со 2 по 8 нуклеотиды от 5'-кон-ца. Данный фрагмент обладает наивысшей ком-плементарностью для 3'UTR-участка мРНК и рассматривается как основная зона взаимодействия микроРНК с мРНК. В настоящий момент все существующие затравочные сайты микроРНК были разделены на 4 типа в зависимости от комплементар-ности с целевым участком мРНК: 8mer, 7mer-m8, 7mer-A1 и 6mer. Вариант 6mer представляет собой полное комплементарное совпадение со 2 по 7 нуклеотиды затравочной области микроРНК с 3'UTR-участком мРНК. 7mer-A1 — ситуация комплементарного совпадения со 2 по 7 нуклеотиды, а также наличие Аденина в позиции первого нуклеотида микроРНК (что повышает степень связи с мРНК). 7mer-m8 — совпадение всей затравочной области микроРНК (со 2 по 8 нуклеотиды). И последний вариант — 8mer — представляет собой совпадение нуклеотидов в позициях со 2 по 8, а также наличие Аденина в качестве первого нуклеотида микроРНК. Таким образом, ранжирование названных четырех вариантов затравочной области (сайта) микроРНК по силе взаимодействия с целевым участком мРНК (3'UTR) происходит следующим образом: 8mer > 7mer-m8 > 7mer-A1 > 6mer [45].

Показатель контекста (Context+ + score). Совпадение зоны затравки и 3'UTR-фрагмента не всегда достаточно для реализации репрессии мРНК. Кроме того, степень репрессии может сильно варьироваться в зависимости от разных дополнительных факторов микроокружения (контекста). Для того, чтобы учесть все возможные варианты отклонений был разработан алгоритм под названием Context++ score, включающих анализ 14 важных дополнительных характеристик: распространенность таргетного 3'UTR-фрагмента, прогнозируемая стабильность

парного взаимодействия затравочной области, тип первого нуклеотида транспортной РНК, тип ну-клеотида в положении 8 транспортной РНК, тип нуклеотида в положении 8 затравочной области микроРНК, количество нуклеотидных пар Аденин + Урацил вблизи затравочной области, добавочное 3'-спаривание, прогнозируемая структурная доступность мРНК, минимальное расстояние сайта от стоп-кодона или участка полиаденилирования, вероятность консервативного таргетирования, длина открытой рамки считывания, длина 3'UTR мРНК, количество смещений 6mer-фрагментов в 3'UTR и число 8mer сайтов в открытой рамке считывания. Возможность учета всех 14 параметров представляется возможным за счет применения модели множественной линейной регрессии к каждому из типов сайтов микроРНК (8mer, 7mer-m8, 7mer-A1 и 6mer). Таким образом, различный «контекст» взаимодействия микроРНК с мРНК предоставляет ценную информацию для прогнозирования цели микроРНК [19].

PCT показатель представляет собой алгоритм преимущественно консервативного нацеливания (preferentially conserved targeting, PCT), иначе говоря, улучшенный метод количественной оценки консервативности сайтов [18]. Этот инструмент объединяет геномы 28 видов позвоночных и оценивает консервационно-специфический фон отдельных участков, совпадающих с затравочными областями, что делает возможным проводить обоснованное сравнение уровней консервации затравочных областей и отдельных участков у разных микроРНК. Так, с помощью данного алгоритма было обнаружено, что существуют так называемые компенсаторные сайты, за счет которых может быть повышено сродство затравочный области с ее целевым фрагментом мРНК при однонуклеотидном несоответствии. PCT рассчитывается для каждого из пяти типов затравочной области (8mer, 7mer-m8, 7mer-A1 и 6mer), и значения находятся в диапазоне от 0 до 1. Кроме того, PCT коррелирует со средним

.....................N N N N N N........Ро1у(А) Несовпадение

NNNNNNNNNNNNNNfVlNNNNN-5' микроРНК

Рис. 1. Типы затравочных областей микроРНК (адаптировано из http://www.targetscan.org/docs/8mer.html Fig. 1. Canonical site types microRNA

уровнем дестабилизации мРНК и предоставляет полезный критерий для оценки функциональной активности выбранной микроРНК (чем выше уровень консервации фрагмента, тем выше PCT и тем больше степень дестабилизации мРНК и выше активность микроРНК) [18].

DIANA Tools

DIANA Tools, другой основной инструмент — веб-сервис, который предоставляет доступ к инструментам и ресурсам для анализа miRNA. Данный набор инструментов прогнозирования мишеней микроРНК использует актуальные версии алгоритмов microT-CDS и microT [45]. В поисковом запросе данных систем можно указать ген или интересующую микроРНК; в обоих случаях можно выбрать их виды и/или включить описание KEGG. Подробная информация включает в себя анализируемую область, тип связывания (k-mer), положение взаимодействия miRNA в транскрипте, специфическую оценку, последовательность области связывания, количество консервативных видов и положение хромосомы.

Инструмент DIANA-microT для прогнозирования микроРНК был разработан в 2004 г. [46]. Данный алгоритм использует анализ так называемых элементов распознавания микроРНК (miRNA-recognition elements, MRE) и находит соответствующие им микроРНК. Поиск MRE осуществляется в 3'-UTR областях мРНК, данные о которых получены из базы данных RefSeq [22]. MRE могут представлять собой сайты нетранслируемых областей длиной 7, 8 или 9 нуклеотидов с последовательным

спариванием оснований мРНК с микроРНК. MRE также включают фрагменты с дополнительным комплементарным спариванием оснований на З'-конце микроРНК и одной свободной парой Гуанин-Ура-цил (т.н. выпуклость микроРНК). Тип связывания MRE и уровень консервации микроРНК были измерены среди 27 разных видов включая человека для оценки всех возможных взаимодействий микроРНК с MRE.

Также в алгоритм DIANA-microT включены оценка уникального показателя miTG, отражающего уровень влияния на таргетные гены, соотношения «сигнал-шум» (Signal-to-noise ratio, SNR), оценка точности прогнозирования и KEGG описание [47]. DIANA-microT рассчитывает микроРНК-специфичное соотношение «сигнал-шум» при различных значениях показателя miTG, что позволяет идентифицировать взаимодействия микроРНК без фонового шума. Алгоритм также поможет оценить точность прогнозирования, которая служит индикатором частоты ложноположительных результатов. Общий балл miTG рассчитывается как усредненная сумма баллов всех идентифицированных MRE на З'-UTR [47].

ЗАКЛЮЧЕНИЕ

В настоящем обзоре мы рассмотрели ключевые биологические принципы работы алгоритмов по поиску микроРНК, а также ряд критериев, положенных в основу данного биоинформационного анализа. Кроме того, мы остановились на практических аспектах использования и интерпретации результатов наиболее часто используемых веб-

Таблица 2

Параметры системы DIANA Tools

Table 2

DIANA Tools parameters

Название параметра Диапазон значений Интерпретация

miTG score от 1 до -1 Это общий балл для прогнозируемого взаимодействия; чем ближе к 1, тем выше достоверность

Also Predicted (Дополнительно спрогнозированы) Красный, синий или зеленый Данный показатель представляет собой сравнение с другими инструментами поиска микроРНК. Разными цветами показаны совпадения результатов с другими системами: с шiRanda красным, с TaгgetScan синим, с TaгBase зеленым

Region (фрагмент) UTR3, CDS Область мРНК, в которой происходит взаимодействие микроРНК и мРНК

Binding Type (тип связи) 6mer; 7mer; 8mer; 9mer; miRNA bugle Совпадающие фрагменты между микроРНК и мРНК

Score (показатель) от 1 до -1 Оценка влияния типа связи на показатель miTG

Conservation (степень консервации) >0 Количество биологических видов, у которых наблюдается прогнозируемое взаимодействие микроРНК и мРНК

Signal-to-noise ratio — SNR (соотношение «сигнал-шум») >0 Отражает влияние «фонового шума» на показатель miTG

Precision от 1 до -1 Показатель ложноположительных взаимодействий микроРНК

инструментов для прогнозирования взаимодействий микроРНК:мРНК, а именно: TargerScan и DIANA Tools. Использование настоящих инструментов на этапе планирования исследования позволяет получить относительно точные результаты, тем не менее, эффективное прогнозирование остается сложной задачей и сопряжено со значительным количеством как ложноположительных, так и лож-ноотрицательных результатов. В большей степени этот факт связан с недостатком фундаментальных знаний о механизмах деградации мРНК под влиянием микроРНК.

Каждый из описанных инструментов имеет свои преимущества и недостатки, определяемые конкретными целями исследователя: так, TargetScan, являясь наиболее точным инструментом, обладает

сравнительно низкой чувствительностью. Напротив, использование DIANA Tools сопряжено с более высоким числом ложноположительных результатов.

Наиболее перспективным без сомнения представляется использование комбинации из нескольких инструментов, что позволяет значительно повысить эффективность прогнозирования на этапе планирования, и, как следствие, минимизировать потери времени и ресурсов на этапе эксперимента [21].

* * *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Conflict of interest

The authors declare no conflict of interest.

ЛИТЕРАТУРА/REFERENCES

1. Kozomara A., Birgaoanu M., Griffiths-Jones S. MiRBase: from microRNA sequences to function. Nucleic Acids Research. 2019; 47: 155-62 https://doi.org/10.1093/nar/ gky1141

2. Shu J., Vieira Resende e Silva B., Gao T., Xu Z., Cui J. Dynamic and Modularized MicroRNA Regulation and Its Implication in Human Cancers. Scientific Report. 2017; 7 (13356): 1-17. https://doi.org/10.1038/ s41598-017-13470-5

3. Sekar D., Venugopal B., Sekar P., Krishnan R. Role of microRNA 21 in diabetes and associated/related diseases. Gene. 2016; 582 (1): 14-8. https://doi.org/10.10Wj. gene.2016.01.039

4. Pishavar E., Behravan J. miR-126 as a Therapeutic Agent for Diabetes Mellitus. Current Pharmaceutical Design. 2017; 23 (22): 3309-14. https://doi.org/10.2174/1381 612823666170424120121.

5. Shi C., Huang F., Gu X., Zhang M., Wen J., You L., Cui X., Ji C., Guo X. Adipogenic miR-NA and Meta-signature miRNAs involved

in human adipocyte differentiation and obesity. Oncotarget. 2016; 7 (26): 40830-45. https://doi.org/10.18632/oncotarget.8518

6. Denby L., Baker A.H. Targeting non-coding RNA for the therapy of renal disease. Current Opinion in Pharmacology.

2016; 27: 70-7. https://doi.org/10.10Wj. coph.2016.02.001.

7. Panagala M., Biruntha M., Vidhyavathi R., Sivagurunathan P., Senthilkumar S., Sekarf D. Dissecting the role of miR-21 in different types of stroke. Gene. 2019; 681: 69-72. https://doi.org/10.10Wj.gene.2018.09.048.

8. Konovalova J., Gerasymchuk D., Parkkinen I., Chmielarz P., Domanskyi A. Interplay between MicroRNAs and Oxidative Stress in Neurodegenerative Diseases. International journal of molecular sciences. 2019; 20 (23): 1-26. https://doi.org/10.3390/ijms20236055

9. Mirzaei H., Momeni F., Saadatpour L., Sahebkar A., Goodarzi M., Masoudifar A., Kouhpayeh S., Salehi H., Mirzaei H.R., Jaafari M.R. MicroRNA: Relevance to stroke diagnosis, prognosis, and therapy. J. of Cell Physiology. 2018; 233 (2): 856-65. https:// doi.org/10.1002/jcp.25787.

10. Akito H., Risa K. Dysregulation of microRNA biogenesis machinery in cancer. J. Critical Reviews in Biochemistry and Molecular Biology. 2016; 51 (3): 121-34. https://doi.org /10.3109/10409238.2015.1117054.

11. Shubin L., Gregory G. MicroRNA biogenesis pathways in cancer. Nature Reviews Cancer. 2015; 15 (6): 321-33. https://doi. org/10.1038/nrc3932.

12. Slaby O., Laga R., Sedlacek O. Therapeutic targeting of non-coding RNAs in cancer. Biochemical J. 2017; 474 (24): 4219-51. https://doi.org/10.1042/BCJ20170079.

13. Luo Y.J., Huang Q.M., Ren Y., Liu Z.L., Xu C.F., Wang H., Xiao J.W. Non-coding RNA in drug resistance of gastric cancer. World J. Gastrointest Oncol. 2019; 11 (11): 957-70. https://doi.org/10.4251/wjgo.v11.i11.957.

14. Poursheikhani A, Bahmanpour Z, Razmara E, Mashouri L, Taheri M, Morshedi Rad D, Yousefi H, Bitaraf A, Babashah S. Non-coding RNAs underlying chemoresistance in gastric cancer. Cell Oncol (Dordr). 2020; 43 (6): 961-88. https://doi.org/10.1007/s13402-020-00528-2.

15. Kozomara A., Griffiths-Jones S. MiRBase: Annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 2014; 42 (1): 68-73. https://doi. org/10.1093/nar/gkt1181.

16. Vlachos I., Paraskevopoulou1 M., Karag-kouni1 D., Georgakilas1 G., Vergoulis T., Kanellos I., Anastasopoulos I.L., Maniou S., Karathanou K., Kalfakakou D., Fevgas A., Dalamagas T., Hatzigeorgiou A. DANA-TarBase v7.0: indexing more than half a million experimentally supported miRNA:mRNA interactions. Nucleic Acids Research. 2015; 43: 153-9. https://doi.org/10.1093/nar/ gku1215.

17. Anneke B., Hausser J. MicroRNA binding sites in the coding region of mRNAs: extending the repertoire of post-transcrip-tional gene regulation. BioEssays. 2014; 36 (6): 617-26. https://doi.org/10.1002/ bies.201300104.

18. Friedman R., Farh K., Burge C., Bartel D. Most mammalian mRNAs are conserved targets of microRNAs. Genome Research. 2009; 19: 92-105. https://doi.org/10.1101/ gr.082701.108.

19. Chipman L., Pasquinelli A. MiRNA Targeting: Growing beyond the Seed. Trends in Genetics. 2019; 35 (3): 215-22. https://doi. org/10.1016/j.tig.2018.12.005.

20. Oulas A., Karathanasis N., Louloupi A., Pavlopoulos G., Poirazi P., Kalantidis K., Ili-opoulos I. Prediction of miRNA targets. RNA Bioinformatics. 2015; 1269: 207-29. https:// doi.org/10.1007/978-1-4939-2291-8_13.

21. Oliveira A., Bovolenta L., Nachtigall P., Herkenhoff M., Lemke N., Pinhall D. Combining Results from Distinct MicroRNA Target Prediction Tools Enhances the Performance of Analyses. Frontiers in Genetics. 2017; 1-10. DOI: 10.3389/ fgene.2017.00059.

22. Liu G., Zhang R., Xu J., Wu C.I., Lu W. Functional conservation of both CDS- and 3'-UTR-located microRNA binding sites between species. Molecular Biology and Evolution. 2015; 32 (3): 623-8. https://doi. org/10.1093/molbev/msu323.

23. Yates A., Akanni W., Amode M.R., Barrell

D., Billis K., Carvalho-Silva D., Cummins C., Clapham P., Fitzgerald S., Gil L., Girön C.G., Gordon L., Hourlier T., Hunt S.E., Janacek S.H., Johnson N., Juettemann T., Keenan, S., Lavidas I., Flicek P. Ensembl 2016. Nucleic Acids Research, 44 (D1): 710-6. https://doi. org/10.1093/nar/gkv1157

24. O'Leary N., Wright M., Brister J., Ciufo S., Haddad D., McVeigh R., Rajput B., Rob-bertse B., Smith-White B., Ako-Adjei D., Astashyn A., Badretdin A., Bao Y., Blinkova O., Brover V., Chetvernin V., Choi J., Cox

E., Ermolaeva O., Pruitt K. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44 (D1), 733-45. https://doi. org/10.1093/nar/gkv1189

25. Karolchik D., Hinrichs A., Kent W.J. The UCSC Genome Browser. Current Protocols in Bioinformatics. 2009; 28 (1): 1.4.1-1.4.26. DOI: 10.1002/0471250953.bi0104s28.

26. Meseguer S., Mudduluru G., Escamilla J.M., Allgayer H. & Barettino D. MicroRNAs-10a and -10b Contribute to Retinoic Acid-induced Differentiation of Neuroblastoma Cells and Target the Alternative Splicing Regulatory Factor SFRS1 (SF2/ASF). J. of Biological Chemistry. 2011; 286 (6): 4150-64. https://doi.org/10.1074/jbc.m110.167817

27. Gu W., Xu Y., Xie X., Wang T., Ko J., Zhou T. The role of RNA structure at 5' untranslated region in microRNA-mediated gene regulation. RNA a publication of RNA society. 2014; 20: 1369-75. https://doi.org/10.1261/ rna.044792.114.

28. Orom U., Nielsen F., Lund A. MicroRNA-10a Binds the 5'UTR of Ribosomal Protein mRNAs and Enhances Their Translation. Molecular Cell. 2008; 30 (4): 460-71. https:// doi.org/ 10.1016/j.molcel.2008.05.001.

29. Mandke P., Wyatt N., Fraser J., Bates B., Berberich S., Markey M. MicroRNA-34a modulates MDM4 expression via a target site in the open reading frame. PLoS ONE. 2012; 7 (8): e42034. https://doi.org/10.1371/ journal.pone.0042034.

30. He B., Xiao Y.F., Tang B., Wu Y.Y., Hu C.J., Xie R., Yang X., Yu S.T., Dong H., Zhao X.Y., Li J.L., Yang S.M. hTERT mediates gastric cancer metastasis partially through the indirect targeting of ITGB1 by microRNA-29a. Scientific Reports. 2016; 6: 1-12. https://doi. org/10.1038/srep21955.

31. Erguna S., Oztuzcub S. Sequence-based analysis of 5'UTR and coding regions of CASP3 in terms of miRSNPs and SNPs in targetting miRNAs. Computational Biology and Chemistry. 2016; 62: 70-4. https://doi. org/10.1016/j.compbiolchem.2016.04.003.

32. lachos I., Hatzigeorgiou A. Functional Analysis of miRNAs Using the DIANA Tools Online Suite. Drug Target miRNA. 2016; 1517: 25-50. https://doi.org/10.1007/978-1-4939-6563-2_2.

33. Sulc M., Marin R., Robins H., Vanicek J. PAC-CMIT/PACCMIT-CDS: identifying microRNA targets in 3' UTRs and coding sequences. Nucleic Acids Research. 2015; 43 (1): 474-9. https://doi.org/10.1093/nar/gkv457.

34. Xu W., San Lucas A., Wang Z., Liu Y. Identifying microRNA targets in different gene regions. BMC Bioinformatics. 2014; 15 (7): 4. https://doi.org/10.1186/1471-2105-15-S7-S4.

35. Friedman R., Burge C. MicroRNA target finding by comparative genomics. RNA Sequence, Structure, and Function: Compu-

tational and Bioinformatic Methods. 2014; 1097: 457-76. https://doi.org/10.1007/978-1-62703-709-9_21.

36. Wightman B., Ha I., Ruvkun G. Posttran-scriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C. elegans. Cell. 1993; 75: 855-62. https://doi.org/10.1016/0092-8674(93)90530-4.

37. Mathews D. Revolutions in RNA Secondary Structure Prediction. Journal of Molecular Biology. 2006; 359 (3): 526-32. https://doi. org/10.1016/j.jmb.2006.01.067.

38. Hofacker I.L., Fontana W., Stadler P.F., Bonhoeffer L.S., Tacker M., Schuster P. Fast folding and comparison of RNA secondary structures. Monatshefte Chemical. 1994; 125: 167-88. https://doi.org/10.1007/ BF00818163.

39. Gruber A., Bernhart S., Lorenz R. The ViennaRNA web services. RNA Bioinfor-matics. 2015; 1269: 307-26. https://doi. org/10.1007/978-1-4939-2291-8_19.

40. Kertesz M., lovino N., Unnerstall U., Gaul U., Segal E. The role of site accessibility in microRNA target recognition. Nature Genetics. 2007; 39: 1278-84. https://doi. org/10.1038/ng2135.

41. Benhalevya D., Mc Farland H., Sarshada A., Hafnera M. PAR-CLIP and streamlined small RNA cDNA library preparation protocol for the identification of RNA binding protein target sites. Methods. 2017; 118-119: 41-9. https://doi.org/10.10Wj.ymeth.2016.11.009.

42. Weng H., Huilin H., Chen J. RNA N 6-Methy-ladenosine Modification in Normal and

Malignant Hematopoiesis. Leukemia Stem Cells in Hematologic Malignancies. 2019; 1143: 75-93. https://doi.org/10.1007/978-981-13-7342-8_4.

43. Deng X., Su R., Hengyu Weng H., Huang H., Li Z., Chen J. RNA N6-methyladenosine modification in cancers: current status and perspectives. Cell Research. 2018; 28 (5): 507-17. https://doi.org/10.1038/s41422-018-0034-6.

44. Hsu J., Chiu C.M., Hsu S.D., Huang W.Y., Chien C.H., Lee T.Y., Huang H.D. MiRTar: An integrated system for identifying miRNA-target interactions in human. BMC Bioinformatics. 2011; 12: 300. https://doi. org/10.1186/1471-2105-12-300.

45. Lewis B., Burge C., Bartel D. Conserved seed pairing, often flanked by adenosines, indicates that thousands of human genes are microRNA targets. Cell. 2005; 120 (1): 15-20. https://doi.org/10.10Wj. cell.2004.12.035.

46. Kanoria S., Rennie W., Liu C., Carmack S., Lu J., Ding Y. STarMir Tools for Prediction of microRNA Binding Sites. RNA Structure Determination. 2016; 1490: 73-82. https:// doi.org/10.1007/978-1-4939-6433-8_6.

47. Maragkakis M., Reczko M., Simossis V., Alexiou P., Papadopoulos G., Dalamagas T., Giannopoulos G., Goumas G., Koukis E., Kourtis K., Vergoulis T., Koziris N., Sellis T., Tsanakas P., Hatzigeorgiou A. DIANA-microT web server: elucidating microRNA functions through target prediction. Nucleic Acids Research. 2009; 37: 273-6. https:// doi.org/10.1093/nar/gkp292.

Для цитирования: Шестаков А.В., Михайлова А.А., Саприна Т.В., Онхонова О.Э. МикроРНК и их мишени: основы биоинформационного поиска. Молекулярная медицина. 2021; 19 (6): 3-10. https://doi.org/10.29296/24999490-2021-06-01

Поступила 30 апреля 2021 г.

For citation: Shestakov A.V., Mikhailova A.A., Saprina T.V., Onkhonova O.E. MicroRNA and its' targets: basics of boiinformatic search. Molekulyarnaya meditsina. 2021; 19 (6): 3-10 (in Russian). https://doi.org/10.29296/24999490-2021-06-01

i Надоели баннеры? Вы всегда можете отключить рекламу.