ОРИГИНАЛЬНАЯ СТАТЬЯ. ОНКОЛОГИЯ
https://doi.org/10.17709/2410-1893-2022-9-1-5
АНАЛИЗ ДАННЫХ ВЫСОКОПРОИЗВОДИТЕЛЬНОГО СЕКВЕНИРОВАНИЯ БАЗЫ GENE EXPRESSION OMNIBUS ДЛЯ ИДЕНТИФИКАЦИИ МИКРОРИБОНУКЛЕИНОВЫХ КИСЛОТ В ПЛАЗМЕ КРОВИ ПАЦИЕНТОВ С ГЛИОБЛАСТОМОЙ
А. А. Пушкин®, Д. Ю. Гвалдин, Н. Н. Тимошкина, Э. Е. Росторгуев, Л. Ю. Владимирова, Е. А. Дженкова
НМИЦ онкологии, г. Ростов-на-Дону, Российская Федерация ® anton.a.pushkin@gmai[.com
Резюме
Цель исследования. Данная работа посвящена исследованию паттернов экспрессии микроРНК в плазме крови пациентов с глиобластомой (ГБ) c использованием данных высокопроизводительного секвенирования базы Gene Expression Omnibus и поиску кандидатных микроРНК-молекул для разработки малоинвазивной диагностической панели. Материалы и методы. На основании открытого набора данных Gene Expression Omnibus NCBI GSE150956 были сформированы группы образцов пациентов с диагнозом глиобластома и условно-здоровых доноров. Для каждого образца была извлечена информация об уровнях экспрессии микроРНК. Определение наиболее значимых микроРНК выполнено с использованием алгоритмов машинного обучения и программной среды R 4.0.4. Для значимых микроРНК были определены гены-мишени, выполнен анализ обогащения по функциональной принадлежности и интерактомный анализ генов-мишеней микроРНК.
Результаты. В исследовании проанализированы данные 131 образца, из них 35 образцов пациентов с глиобластомой, а 96 образцов получено от условно-здоровой группы добровольцев. Данные о дифференциальной экспрессии были получены для 945 микроРНК. Методами машинного обучения сформированы две панели, содержащие общие микроРНК -hsa-miR-3180, hsa-miR-3180-3p, hsa-miR-6782-5p, hsa-miR-182-5p, hsa-miR-133b и hsa-miR-670-3p. Для значимых микроРНК получена информация об экспериментально подтверждённых генах-мишенях, генная онтология которых демонстрирует их участие в связывании ферментов, расположение в ядерной оболочке, участие в регуляции первичных клеточных метаболических процессов, развитии глиобластом и опухолевых заболеваний в целом.
Заключение. В результате послойной фильтрации данных и применения алгоритмов машинного обучения были выявлены значимые микроРНК, которые являются кандидатами для разработки диагностической панели малоинвазивного выявления глиальных опухолей высокой степени злокачественности.
Ключевые слова:
глиобластома, циркулирующая микроРНК, плазма крови, секвенирование следующего поколения, сетевой анализ, биомаркер
Для корреспонденции:
Пушкин Антон Андреевич - научный сотрудник лаборатории молекулярной онкологии ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация.
Адрес: 344037, Российская Федерация, г. Ростов-на-Дону, ул. 14-я линия, д. 63
E-mail: [email protected]
ORCID: https://orcid.org/0000-0003-2385-6285
SPIN: 9223-1871, AuthorID: 975797
ResearcherID: AAA-8887-2020
Scopus Author ID: 57200548010
Финансирование: финансирование данной работы не проводилось. Конфликт интересов: авторы заявляют об отсутствии конфликта интересов.
Для цитирования:
Пушкин А. А., Гвалдин Д. Ю., Тимошкина Н. Н., Росторгуев Э. Е., Владимирова Л. Ю., Дженкова Е. А. Анализ данных высокопроизводительного секвенирования базы Gene Expression Omnibus для идентификации микрорибонуклеиновых кислот в плазме крови пациентов с глиобластомой. Исследования и практика в медицине. 2022; 9(1): 54-64. https://doi.org/10.17709/2410-1893-2022-9-1-5.
Статья поступила в редакцию 13.01.2022; одобрена после рецензирования 02.02.2022; принята к публикации 14.03.2022. © Пушкин А. А., Гвалдин Д. Ю., Тимошкина Н. Н., Росторгуев Э. Е., Владимирова Л. Ю., Дженкова Е. А., 2022
ORIGINAL ARTICLE. ONCOLOGY
https://doi.org/10.17709/2410-1893-2022-9-1-5
ANALYSIS OF GENE EXPRESSION OMNIBUS HIGH-THROUGHPUT SEQUENCING DATA FOR THE DETERMINATION OF MICRORIBONUCLEIC ACIDS IN THE BLOOD PLASMA OF PATIENTS WITH GLIOBLASTOMAS
A. A. Pushkin®, D. Yu. Gvaldin, N. N. Timoshkina, E. E. Rostorguev, L. Yu. Vladimirova, E. A. Dzhenkova
National Medical Research Centre for Oncology, Rostov-on-Don, Russian Federation ® [email protected]
Abstract
Purpose of the study. This work is devoted to the study of blood plasma miRNA patterns in blood plasma using high-throughput sequencing of the Omnibus Gene Expression base and the search for candidate miRNA molecules for the development of a minimally invasive diagnostic panel.
Materials and methods. Basing on the open dataset of Omnibus Expression of the NCBI GSE150956 Gene, groups of samples with glioblastoma and conventionally healthy donors were formed. For each sample, information on the levels of miRNA expression was extracted. Determination of significant miRNAs using machine learning algorithms of the R 4.0.4 project. For significant miR-NAs, target genes have been performed, an analysis of the improvement of functional characteristics and interactome analysis of target genes of miRNA were performed.
Results. The study analyzed the data of 131 samples, where 35 samples with glioblastoma and 96 samples of the conditionally healthy group. Differential expression data were obtained for 945 miRNA. Two panels were obtained using machine learning methods, common miRNA - hsa-miR-3180, hsa-miR-3180-3p, hsa-miR-6782-5p, hsa-miR-182-5p, hsa-miR-133b and hsa-miR-670-3p. For significant miRNAs, information was obtained on experimentally confirmed target genes, a gene ontology demonstrating their participation in enzyme binding, participation in the regulation of primary cellular metabolic processes, and the development of glioblastomas and cancer in general.
Conclusion. As a result of layer-by-layer filtering and application of machine learning algorithms, significant miRNAs were identified that are candidates for a diagnostic panel of a minimally invasive method of high-grade glial tumors.
Keywords:
glioblastoma, circulating miRNA, blood plasma, next-generation sequencing, network analysis, biomarker
For correspondence:
Anton A. Pushkin - Researcher, Laboratory of Molecular Oncology National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation.
Address: 63 14 line str., Rostov-on-Don 344037, Russian Federation
E-mail: [email protected]
ORCID: https://orcid.org/0000-0003-2385-6285
SPIN: 9223-1871, AuthorlD: 975797
ResearcherID: AAA-8887-2020
Scopus Author ID: 57200548010
Funding: this work was not funded.
Conflict of interest: authors report no conflict of interest.
For citation:
Pushkin A. A., Gvaldin D. Yu., Timoshkina N. N., Rostorguev E. E., Vladimirova L. Yu., Dzhenkova E. A. Analysis of Gene Expression Omnibus high-throughput sequencing data for the determination of microribonucleic acids in the blood plasma of patients with glioblastomas. Research and Practical Medicine Journal (Issled. prakt. med.). 2022; 9(1): 54-64. (In Russ.). https://doi.org/10.17709/2410-1893-2022-9-1-5.
The article was submitted 13.01.2022; approved after reviewing 02.02.2022; accepted for publication 14.03.2022.
АКТУАЛЬНОСТЬ
Глиомы - инвазивные опухоли мозга, демонстрирующие высокие уровни рецидивирования и смертности. Глиобластома, характеризующаяся практически 100 %-ным рецидивированием и неблагоприятным прогнозом для пациентов, относится к наиболее опасным видам глиом [1]. Несмотря на прогресс, достигнутый в области нейрохирургии, радиотерапии и химиотерапии, продолжительность жизни пациентов с глиобластомой практически не изменилась и составляет около 18 месяцев после верификации новообразования [2].
На данный момент отсутствуют решения проблемы ранней диагностики глиальных опухолей высокой степени злокачественности. Существует потребность в новых диагностических и прогностических маркерах, как и в новых терапевтических мишенях при этом заболевании [3]. На основании аберрантных профилей экспрессии микроРНК, ассоциированных с онкозаболеваниями, а также характеристик микроРНК, таких как специфичность, чувствительность и стабильность как в парафиновых срезах, так и в жидкостях организма, микроРНК демонстрируют большой потенциал в качестве нового класса биомаркеров [4].
МикроРНК представляют собой эндогенно экспрес-сируемые некодирующие РНК длиной 21-25 нуклео-тидов. Эти молекулы посттранскрипционно подавляют экспрессию белок-кодирующих генов путем связывания 3' нетранслируемой области мРНК гена-мишени. Большое количество накопленных данных отмечает взаимодействие микроРНК с мРНК различных генов, что обеспечивает их участие в регуляции многих биологических процессов, таких как клеточный метаболизм, дифференцировка, пролиферация, гемопоэз, формирование паттернов в нервной системе [5].
Многие микроРНК демонстрируют тканеспеци-фичные паттерны экспрессии и дерегулированы при различных онкозаболеваниях, где они могут выступать как онкогенные молекулы, так и онкосупрес-сорные. Данная классификация усложняется тем, что из-за широкого спектра генов-мишеней, одна и также микроРНК может играть противоположные роли в разных процессах [6]. Опухолевые микроРНК секретируются в мембранных везикулах (экзосомах) или в комплексе с липопротеинами низкой плотности, что демонстрирует их потенциальную роль в межклеточном взаимодействии и коммуникации. Циркулирующие микроРНК, обнаруженные в плазме крови человека, могут представлять стабильные биологические маркеры, так как они не доступны РНКазам [7].
Ряд исследований оценивают диагностический потенциал микроРНК при глиальных опухолях [8].
Панель из семи микроРНК, включая hsa-miR-15b, hsa-miR-23a, hsa-miR-150, hsa-miR-197, и hsa-miR-548b-5p, демонстрируют высокий потенциал дифференци-ровки злокачественных астроцитом от здоровой группы [9]. Мета-анализ Qu S. et al. указывает, что панели, включающие hsa-miR-21 являются более специфичными для глиальных опухолей [10]. Roth P. et al. идентифицировали сигнатуру микроРНК клеток крови пациентов с глиобластомой, демонстрирующую повышение экспрессии hsa-miR-128 и hsa-miR-194 и понижение hsa-miR-342-3p и hsa-miR-628-3p [11]. Несмотря на проводимые исследования, до сих пор отсутствует единая диагностическая панель циркулирующих микроРНК, что актуализирует необходимость развития данного направления.
Технология секвенирования нового поколения может использоваться для глобального профилирования микроРНК в плазме крови пациентов с целью выявления значимых дифференциально-экспрессируемых микроРНК. В нашей работе проведен анализ данных секвенирования нового поколения с целью выявления значимых дифференциально-экспрессируемых микроРНК в плазме крови пациентов, страдающих глиобластомой. С использованием алгоритмов машинного обучения выявлены наиболее значимые микроРНК -кандидаты для валидации методом ПЦР-РВ (ПЦР - по-лимеразная цепная реакция) с целью разработки диагностической тест-системы. В исследовании проведена идентификация генов-мишеней, их генная ассоциация с сигнальными путями. Обнаружение и анализ значимых дифференциально-экспрессированных микроРНК в образцах плазмы может расширить понимание патогенеза глиобластом и выявить диагностические и прогностические маркеры.
Цель исследования: данная работа посвящена исследованию паттернов экспрессии микроРНК в плазме крови пациентов с глиобластомой с использованием данных высокопроизводительного секвенирования базы Gene Expression Omnibus и поиску кандидатных микроРНК-молекул для разработки малоинвазивной диагностической панели.
МАТЕРИАЛЫ И МЕТОДЫ
Сбор и анализ данных.
На основании открытого набора данных Gene Expression Omnibus NCBI GSE150956 была сформирована группа образцов плазмы пациентов с установленным диагнозом глиобластома, подвернутых секвенированию микроРНК (n = 35). В качестве группы сравнения использовали образцы условно-здоровых доноров (n = 96). Сбор и обработку данных проводили с использованием инструмента sRNAde набора sRNAtoolbox. Для анализа дифференциальной экс-
прессии микроРНК использовали пакет «DESeq2». Точками отсечения служили padj < 0,05 и |logFC| > 1 (FC - fold change) [12].
Идентификация значимых микроРНК методом машинного обучения.
Разработка моделей машинного обучения проводилась с использованием пакета «caret» в программной вычислительной среде R версии 4.0.4. Для оценки качества полученных моделей выполняли ROC-анализ с применением пакета «pROC» [13]. После стандартизации данных относительной экспрессии микроРНК были отобраны микроРНК с низкой дисперсией. Среди оставшихся был выбран топ-400, который в дальнейшем использовался для обучения моделей методом случайного леса (random forest) и ближайших соседей (k-nearest neighbor). Для каждой модели в процессе подбора гиперпараметров были выбраны микроРНК, имеющие наибольшую значимость в классификации образцов. Отобранные микроРНК были использованы для обучения финальных моделей. Проверка моделей осуществлялась с использованием алгоритма 10-кратной кросс-валидации [14].
Анализ сигнальных путей, включающих гены-мишени микроРНК.
Гены-мишени значимых микроРНК были отобраны с использованием пакета «multiMIR» с учетом параметра «validated» [15]. Сеть взаимодействий микроРНК-ген была построена с использованием
утилиты «miRTargetLink 2.0» [16]. Анализ онтологии генов выполнен с использованием функции «gost» пакета «gprofiler2» [17].
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ
Экспрессия микроРНК в плазме крови пациентов с глиобластомой и условно-здоровой группы. Данные о дифференциальной экспрессии были получены для 945 микроРНК, среди них демонстрировали статистическую значимость с поправкой на множественные сравнения 502 микроРНК (padj < 0,01). Среди них значения кратного изменения |logFC| > 1 были характерны для 85 микроРНК с повышенным уровнем и 16 микроРНК с пониженным уровнем в плазме крови пациентов с глиобластомой относительно условно-здоровой группы. Наиболее высокие уровни дифференциальной экспрессии демонстрировала микроРНК hsa-miR-5010-3p (log2FC = 3,75, padj = 3e-36), но нормализованные средние показатели чтений на миллион (read per million, RPM) в плазме крови исследуемых групп демонстрировали низкие значения для данной микроРНК - 1,44 RPM среди условно-здоровой группы и 19,5 RPM для группы пациентов с глиобластомой. hsa-miR-26b-5p демонстрирует высокий показатель кратного изменения (log2FC = 2,95, p = 1e-19), и высокие уровни в плазме
О Notaig. X Log (basa 21 FC О padj У p adj A Log |basa 2) FC
hsa-i iiR-3180-3p" h5^miiR-31S0
hsa-miR-1225-5p¿ hsa-miR-182-5p hsa-miR-5o1o-3p hsa^iiR-144-Зр hsa-míR-3037e hsa-miR^4713-3p »a-mi R-^706 Thsa-mi hsa-miR-144-5p £б165 R"75Ö"3P. hsa^ni R-26b-5p hsa-miR-6782-5púhsa-miR-92b-3p ^TljR^745r^hsa-mÍR:5^2::3p,'hsa-rniR-101-3p ^ ?v h^-m¡R-Se 16-3p*tl5a"te,"7("5p V gffiy 7
hsa-miR-36£3-5p j и^Пт^ hsa-jjjiR-210-5p hsa-miR-IZ^W^ hsa-rni R- H6B-3p hsa-rrtR-4428 hsa-mi R-3613-3p *-,{isa-mi R-464^ ^&a-rrHR^874-5p hsa-miR-146e-5p^ ¡. 7-5p 1
■2024
Log? fold change
total = S45 variables
Рис. 1. График рассеивания, показывающий 1с^2-кратное изменение нормализованных количеств в функции средних значений (log2 fold change) экспрессии микроРНК в образцах плазмы пациентов с глиобластомой в сравнении с условно-здоровой группой. Подписанные точки обозначают наиболее интересные микроРНК с большими значениями кратного изменения (ось x) и высокую статистическую значимость (-log 10 значения padj, ось у). Пунктирная серая линия показывает, где padj = 0,05 и log2FC = 1.
Fig. 1. A scatter plot showing a log2 fold change in normalized amounts as a function of the mean values (log2 fold change) of miRNA expression in plasma samples of patients with glioblastoma compared with a conditionally healthy group. The signed dots indicate the most interesting miRNAs with large values of multiple variation (x-axis) and high statistical significance (-log 10 padj values, y-axis). The dotted gray line shows where padj = 0.05 and log2FC = 1.
крови исследуемых групп - 294,89 RPM и 2285,7 RPM. Сниженные уровни относительно условно-здоровой группы характерны для микроРНК 1468-3p (log2FC = -2,01, padj = 5,4e-10), демонстрирующей показатели в группах - 169,34 RPM и 42,16 RPM для исследуемой и контрольной групп. Распределение дифференциальной экспрессии микроРНК показано на рисунке 1.
Идентификация наиболее значимых микроРНК
методом машинного обучения.
После стандартизации данных относительной экспрессии микроРНК, были отфильтрованы мишени с низкой дисперсией. Среди оставшихся был выбран топ-400, который в дальнейшем использовался для тренировки моделей алгоритмами машинного обучения. В результате поиска оптимальных параметров алгоритмом k-nearest neighbors (knn) был получен набор значимых микроРНК, включающий hsa-miR-3180, hsa-miR-3180-5p, hsa-miR-6782-5p, hsa-miR-182-5p, hsa-miR-3184-5p, hsa-miR-1225-3p, hsa-miR-92b-3p, hsa-miR-133b, hsa-miR-6852-3p, hsa-miR-6870-5p, hsa-miR-670-3p, hsa-miR-6720-5p, hsa-miR-3663-5p, hsa-miR-654-5p (табл. 1). На основании оптимального набора 14 микроРНК был построен классификатор, эффективность которого была оценена на обучающей и тестовой выборках. Критерии качества были следую-
щими: 95 % CI - 0,9289-1 и 0,7513-0,9987, p-value -8,882e-16 и 0,0001114, положительная прогностическая ценность - 1 и 0,9, отрицательная прогностическая ценность - 1 и 1. Кривые AUC показали значения обучающего и проверочного набора были > 0,9.
В результате поиска оптимальных параметров алгоритма random forest (rf) был получен набор значимых микроРНК, включающий hsa-miR-5010-5p, hsa-miR-182-5p, hsa-miR-758-3p, hsa-miR-96-5p, hsa-miR-133a-5p, hsa-miR-3180, hsa-miR-3180-3p, hsa-miR-6782-5p, hsa-miR-1304-5p, hsa-miR-3937, hsa-miR-100-5p, hsa-miR-1182-3p, hsa-miR-113b, hsa-miR-670-3p, hsa-miR-4701-5p. На основании оптимального набора 14 микроРНК был построен классификатор, эффективность которого оценена на обучающей и тестовой выборках. Критерии качества были следующими: 95 % ДИ: 0,9289-1 и 0,8316-1, p-value - 8,882e-16 и 9,537e-07, положительная прогностическая ценность - 1 и 1, отрицательная прогностическая ценность - 1 и 1. Кривые AUC обучающего набора и проверочного набора также демонстрировали значения > 0,9.
Полученные панели содержат общие микроРНК (табл. 1) - hsa-miR-3180 (log2FC = 1,66, padj = 6,200862e-45), hsa-miR-3180-3p (log2FC = 1,71, padj
Таблица 1. Наиболее значимые микроРНК, отобранные алгоритмами knn и rf с указанием диагностической значимости Table 1. The most significant miRNAs selected by knn and rf algorithms with indication of diagnostic significance
K-nearest neighbors Random forest
МикроРНК / miRNA Значимость / Significance МикроРНК / miRNA Значимость / Significance
hsa-miR-3180 100 hsa-miR-5010-3p 100
hsa-miR-3180-3p 99 hsa-miR-182-5p 79
hsa-miR-6782-5p 97 hsa-miR-758-3p 62
hsa-miR-182-5p 92 hsa-miR-96-5p 60
hsa-miR-3184-3p 91 hsa-miR-133a-3p 56
hsa-miR-1225-3p 89 hsa-miR-3180 49
hsa-miR-92b-3p 89 hsa-miR-3180-5p 38
hsa-miR-133b 87 hsa-miR-6782-5p 36
hsa-miR-6852-3p 86 hsa-miR-1304-5p 35
hsa-miR-6870-5p 84 hsa-miR-3937 35
hsa-miR-670-3p 83 hsa-miR-100-5p 34
hsa-miR-6720-5p 83 hsa-miR-1180-3p 30
hsa-miR-3663-5p 82 hsa-miR-133b 28
hsa-miR-654-5p 81 hsa-miR-670-3p 26
Примечание: отдельно цветом выделены микроРНК, общие для обеих панелей. Note: the microRNAs common to both panels are highlighted separately in color.
= 1,985913е-49), hsa-miR-6782-5p (log2FC = 1,66, ра^ = 7,181097е-21), hsa-miR-182-5p (log2FC = 2,35, ра^ = 1,47799е-38), Ь^а-т1К-133Ь (log2FC = 2,02, padj = 1,330257е-09) и hsa-miR-670-3p (log2FC = 1,35, padj = 4,204896е-18), которые могут быть перспективными маркерами для разработки диагностической панели на основе ПЦР в реальном времени и требуют дальнейшей валидации.
Анализ мишеней значимых микроРНК.
Точное определение мишеней микроРНК имеет решающее значение для оценки функций дифференци-
ально-экспрессируемых микроРНК. Данные о том, что одна микроРНК взаимодействует с множеством мРНК и трансляция одной мРНК регулируется несколькими микроРНК делают необходимостью сетевой анализ функций микроРНК. В результате такого анализа была построена сеть микроРНК-мРНК и белок-белковых взаимодействий (рис. 2), которая показала, что Ь^а-miR-670-3p имеет наибольшее количество взаимодействий (198), далее следует hsa-miR-182-5p (179) и 1^^^-3180^ (143), что демонстрирует их важное значение в регуляции множества генов.
Рис. 2. Сеть микроРНК-мРНК и белок-белковых взаимодействий целевых генов. Квадратами отмечены микроРНК, размеры пропорциональны количеству взаимодействий. Точками отмечены гены-мишени, интенсивность окрашивания пропорциональна количеству взаимодействий.
Fig. 2. A network of miRNA-mRNA and proteinprotein interactions of target genes. The miRNA are marked with squares, the sizes are proportional to the number of interactions. Target genes are marked with dots, the intensity of staining is proportional to the number of interactions.
Рис. 3. Сеть значимых микроРНК и их мишеней с экспериментальным подтверждением. Цветовой код: синие линии - слабые условия подтверждения, красные линии - строгие условия подтверждения взаимодействий.
Fig. 3. A network of significant miRNAs and their targets with experimental confirmation. Color code: blue lines - weak confirmation conditions, red lines - strict conditions for confirming interactions.
Дополнительно была сконструирована базовая сеть микроРНК-мРНК взаимодействий для значимых микроРНК. Согласно инструменту «miRTargetLink 2.0», среди исследуемых микроРНК, только две имеют мишени в условиях строгой валидации - hsa-miR-133b (мишень FSCN1) и hsa-miR-182-5p (мишень PFN1) (рис. 3). Fascin-1 (ген FSCN) это белок, организующий цитоскелет, с относительной молекулярной массой 55 кДа, может вызывать структурные изменения в клеточных мембранах и влиять на целостность межклеточных взаимодействий, способствуя инвазии опухолевых клеток [18]. Profilin 1 (ген PFN1) известен как участник ангиогенеза при развитии глиобластом [19]. Сигнальные пути с анализом генной онтологии мишеней значимых микроРНК. Для определения патофизиологической роли значимых микроРНК в развитии глиом высокой степени злокачественности и для оценки функций их генов-мишеней был проведен анализ генной онтологии. Всего выявлено 1459 аннотаций с различными базами данных (рис. 4).
Результаты анализа генной онтологии предполагают, что циркулирующие в плазме микроРНК не
высвобождаются из клеток случайным образом, поскольку многие из генов-мишеней участвуют в критически важных путях и биологических процессах, способствующих онкогенезу. В множестве ассоциаций стоит выделить связывание ферментов, расположение в ядерной оболочке, участие в регуляции первичных клеточных метаболических процессов. Отдельно выделяются сигнальные пути развития глиобластом и опухолевых заболеваний в целом (рис. 4).
Для разработки диагностической панели на основе микроРНК, необходимо выявить небольшой пул, что позволит проводить тестирование более доступным и рутинным методом - ПЦР в реальном времени. С целью выявления наиболее значимых микроРНК, нами было проведено машинное обучение с использованием двух алгоритмов - random forest и k-nearest neighbors. В результате анализа были получены две панели микроРНК (табл. 1). В обеих панелях присутствуют смежные микроРНК - hsa-miR-3180, hsa-miR-3180-3p, hsa-miR-6782-5p, hsa-miR-182-5p, hsa-miR-133b и hsa-miR-670-3p. Все эти микроРНК активно исследуются при онкологических заболеваниях. Экзо-сомальная hsa-miR-3180-3p демонстрирует антипро-
Рис. 4. Манхэттэнский график генной онтологии. Ось x представляет функциональные аннотации, которые сгруппированы и окрашены в соответствии с источниками: GO:MF - генная онтология по молекулярным функциям; GO:CC - по клеточному компоненту; GO:BP - по биологическим процессам; KEGG - киотская энциклопедия генов и геномов; REAC - база Reactome; TF - база TRANSFAC; MIRNA - база miRTarBase; HPA - база Human Protein Atlas; база данных CORUM; HP - база Human Phenotype Ontology и WP - база WikiPathways. Ось Y показывает скорректированные значения p в отрицательной шкале log 10. Каждый круг состоит из одной аннотации и имеет размер в соответствии с количеством генов-участников.
Fig. 4. Manhattan plot of gene ontology. The x axis represents functional annotations that are grouped and colored according to the sources: GO:MF - gene ontology by molecular functions, GO:CC - by cellular component, GO:BP - by biological processes, KEGG - Kyoto Encyclopedia of Genes and Genomes, REAC - Reactome database, TF - TRANSFAC database, MIRNA - miRTarBase database, HPA - Human Protein Atlas database, CORUM database, HP - Human Phenotype database Ontology and the WP - base of the WikiPathways. The y-axis shows the adjusted p values in the negative log 10 scale. Each circle consists of one annotation and is sized according to the number of participating genes.
лиферативную и антиметастатическую активность при немелкоклеточном раке легкого [20]. А при раке желудка была выявлена корреляция повышенной активности hsa-miR-3180-3p и резистентности к цис-платину и стадией TNM [21]. Hsa-miR-6782-5p была успешно валидирована при анализе NGS-данных исследования циркулирующих микроРНК плазмы крови пациентов с семеномой яичка, и где демонстрировала снижение в исследуемой группе относительно контрольной [22]. Повышенный уровень ЬБа-1™^182-5р ассоциирован с немелкоклеточным раком легких [23]. Для Ь^а-1^К-133Ь исследовательские группы часто демонстрируют снижение экспрессии при раке легких, колоректальном раке, плоскоклеточной карциноме и раке желудка, есть данные о повышенной активности при раке шейки матки [24].
Вклад данных микроРНК в канцерогенез дополнительно подтверждает функциональное значение 760 генов, которые они таргетируют (рис. 2). Гены-мишени представляют множество ассоциаций с сигнальными
путями, биологическими процессами и молекулярными функциями, такими как связывание ферментов, участие в регуляции первичных клеточных метаболических процессов и высокий уровень ассоциаций с сигналингом развития глиобластом и рака в целом (рис. 4).
ЗАКЛЮЧЕНИЕ
В исследовании проведен анализ данных высокопроизводительного секвенирования циркулирующих микроРНК в образцах плазмы крови пациентов с глиобластомой в сравнении с условно-здоровой группой пациентов. В результате послойной фильтрации данных и применения алгоритмов машинного обучения были выявлены значимые микроРНК, которые могут играть важную патофизиологическую роль в онкогенезе и являются кандидатами для разработки диагностической панели малоинвазивного выявления глиальных опухолей высокой степени злокачественности.
Список источников
1. Кит, О. И., Водолажский, Д. И., Росторгуев, Э. Е., Поркшеян, Д. Х., Панина, С. Б. Роль микро-РНК в регуляции сигнальных путей при глиомах. Биомедицинская химия. 2017;63(6):481-498. https://doi.org/10.18097/PBMC20176306481
2. Злокачественные новообразования в России в 2018 году (заболеваемость и смертность). Под ред. Каприна А. Д., Старин-ского В. В., Петровой Г. В. М., 2019. Доступно по: https://oncology-association.ru/wp-content/uploads/2020/09/2018.pdf. Дата обращения: 28.12.2021.
3. Аллилуев И. А., Пушкин А. А., Кузнецова Н. С., Кавицкий С. Э., Росторгуев Э. Е. Оценка диагностической значимости циркулирующих микроРНК в плазме крови пациентов с глиомами высокой степени злокачественности. Современные проблемы науки и образования. 2020;(6):135-135. https://doi.org/10.17513/spno.30309
4. Шкурат, Т. П., Пушкин, А. А., Козлова, М. Ю., Колина, Е. А., Покудина, И. О. Биоинформационное исследование миРНК-регулято-ров генов-супрессоров опухолей. Материалы VI конференции Актуальные проблемы биологии, нанотехнологий и медицины. Ростов-на-Дону, 2015, 64-65 с. Доступно по: https://hub.sfedu.ru/repository/material/800820188/. Дата обращения: 28.12.2021.
5. Gvaldin D Y, Pushkin A A, Timoshkina N N, Rostorguev E E, Nalgiev A M, Kit O I. Integrative analysis of mRNA and miRNA sequencing data for gliomas of various grades. Egyptian Journal of Medical Human Genetics. 2020;21(1):1-17. https://doi.org/10.1186/s43042-020-00119-8
6. Кит О. И., Водолажский Д. И., Росторгуев Э. Е., Франциянц Е. М., Панина С. Б. Молекулярно-генетические маркеры глиом. Молекулярная генетика, микробиология и вирусология. 2017;35(4):132-140. https://doi.org/10.18821/0208-0613-2017-35-4-132-140
7. Xu S, Wang J, Ding N, Hu W, Zhang X, Wang B, et al. Exosome-mediated microRNA transfer plays a role in radiation-induced bystander effect. RNA Biol. 2015;12(12):1355-1363. https://doi.org/10.1080/15476286.2015.1100795
8. Кит О. И., Росторгуев Э. Е., Тимошкина Н. Н., Пушкин А. А., Аллилуев И. А., Кузнецова Н. С. и др. Способ диагностики глиальных опухолей головного мозга высокой степени злокачественности. Патент RU 2742413 C1. Доступно по: https://patents.s3.yandex.net/RU2742413C1_20210205.pdf. Дата обращения: 01.02.2022.
9. Yang C, Wang C, Chen X, Chen S, Zhang Y, Zhi F, et al. Identification of seven serum microRNAs from a genome-wide serum microRNA expression profile as potential noninvasive biomarkers for malignant astrocytomas. Int J Cancer. 2013 Jan 1;132(1):116-127. https://doi.org/10.1002/ijc.27657
10. Qu S, Guan J, Liu Y. Identification of microRNAs as novel biomarkers for glioma detection: a meta-analysis based on 11 articles. J Neurol Sci. 2015 Jan 15;348(1-2):181-187. https://doi.org/10.1016/j.jns.2014.11.036
11. Roth P, Wischhusen J, Happold C, Chandran PA, Hofer S, Eisele G, et al. A specific miRNA signature in the peripheral blood of glioblastoma patients. J Neurochem. 2011 Aug;118(3):449-457. https://doi.org/10.1111/j.1471-4159.2011.07307.x
12. Aparicio-Puerta E, Lebrón R, Rueda A, Gómez-Martín C, Giannoukakos S, Jaspez D, et al. sRNAbench and sRNAtoolbox 2019: intuitive fast small RNA profiling and differential expression. Nucleic Acids Res. 2019 Jul 2;47(W1):W530-W535. https://doi.org/10.1093/nar/gkz415
13. Robin X, Turck N, Hainard A, Tiberti N, Lisacek F, Sanchez J-C, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. BMC Bioinformatics. 2011 Mar 17;12:77. https://doi.org/10.1186/1471-2105-12-77
14. Kuhn M. A Short Introduction to the caret Package. R Found Stat Comput, 2015, 1-10 p.
15. Ru Y, Kechris KJ, Tabakoff B, Hoffman P, Radcliffe RA, Bowler R, et al. The multiMiR R package and database: integration of microRNA-tar-get interactions along with their disease and drug associations. Nucleic Acids Res. 2014;42(17):e133. https://doi.org/10.1093/nar/gku631
16. Hamberg M, Backes C, Fehlmann T, Hart M, Meder B, Meese E, et al. MiRTargetLink-miRNAs, Genes and Interaction Networks. Int J Mol Sci. 2016 Apr 14;17(4):564. https://doi.org/10.3390/ijms17040564
17. Kolberg L, Raudvere U, Kuzmin I, Vilo J, Peterson H. gprofiler2 -- an R package for gene list functional enrichment analysis and namespace conversion toolset g:Profiler. F1000Res. 2020;9:ELIXIR-709. https://doi.org/10.12688/f1000research.24956.2
18. Zhang H, Cong Q-X, Zhang S-G, Zhai X-W, Li H-F, Li S-Q. High Expression Levels of Fascin-1 Protein in Human Gliomas and its Clinical Relevance. Open Med (Wars). 2018;13:544-550. https://doi.org/10.1515/med-2018-0080
19. Fan Y, Potdar AA, Gong Y, Eswarappa SM, Donnola S, Lathia JD, et al. Profilin-1 phosphorylation directs angiocrine expression and glioblastoma progression through HIF-1a accumulation. Nat Cell Biol. 2014 May;16(5):445-456. https://doi.org/10.1038/ncb2954
20. Chen T, Liu Y, Chen J, Zheng H, Chen Q, Zhao J. Exosomal miR-3180-3p inhibits proliferation and metastasis of non-small cell lung cancer by downregulating FOXP4. Thorac Cancer. 2021 Feb;12(3):372-381. https://doi.org/10.1111/1759-7714.13759
21. Jin L, Zhang Z. Serum miR-3180-3p and miR-124-3p may Function as Noninvasive Biomarkers of Cisplatin Resistance in Gastric Cancer. Clin Lab. 2020 Dec 1;66(12). https://doi.org/10.7754/Clin.Lab.2020.200302
22. M0rup N, Stakaitis R, Golubickaite I, Riera M, Dalgaard MD, Schierup MH, et al. Small RNAs in Seminal Plasma as Novel Biomarkers for Germ Cell Tumors. Cancers (Basel). 2021 May 13;13(10):2346. https://doi.org/10.3390/cancers13102346
23. Gao L, Yan S-B, Yang J, Kong J-L, Shi K, Ma F-C, et al. MiR-182-5p and its target HOXA9 in non-small cell lung cancer: a clinical and in-silico exploration with the combination of RT-qPCR, miRNA-seq and miRNA-chip. BMC Med Genomics. 2020 Jan 6;13(1):3. https://doi.org/10.1186/s12920-019-0648-7
24. Wen D, Li S, Ji F, Cao H, Jiang W, Zhu J, et al. miR-133b acts as a tumor suppressor and negatively regulates FGFR1 in gastric cancer. Tumour Biol. 2013 Apr;34(2):793-803. https://doi.org/10.1007/s13277-012-0609-7
References
1. Kit O I, Vodolazhsky D I, Rostorguev E E, Porksheyan D H, Panina S B. The role of micro-RNA in the regulation of signal pathways in gliomas. Biomeditsinskaya Khimiya. 2017;63(6):481-498. (In Russ.). https://doi.org/10.18097/PBMC20176306481
2. Malignant neoplasms in Russia in 2018 (morbidity and mortality). Ed. by Kaprina AD, Starinskogo VV, Petrova GV. Moscow, 2019. Available at: https://oncology-association.ru/wp-content/uploads/2020/09/2018.pdf. Accessed: 28.12.2021. (In Russ.).
3. Alliluyev I A, Pushkin A A, Kuznetsova N S, Kavitsky S E, Rostorguev E E. Estimation of the diagnostic significance of circulating mi-crornas in blood plasma of patients with high grade gliomas. Modern Problems of Science and Education. 2020;(6):135-135. (In Russ.). https://doi.org/10.17513/spno.30309
4. Shkurat T P, Pushkin A A, Kozlova M Yu, Kalina E A, Prokudina I O. Bioinformatic research of miRNA regulators of tumor suppressor genes. Materials of the VI conference Actual problems of biology, nanotechnology and medicine. Rostov-on-Don, 2015, 64-65 p. Available at: https://hub.sfedu.ru/repository/material/800820188/. Accessed: 28.12.2021. (In Russ.).
5. Gvaldin D Y, Pushkin A A, Timoshkina N N, Rostorguev E E, Nalgiev A M, Kit O I. Integrative analysis of mRNA and miRNA sequencing data for gliomas of various grades. Egyptian Journal of Medical Human Genetics. 2020;21(1):1-17. (In Russ.). https://doi.org/10.1186/s43042-020-00119-8
6. Kit OI, Vodolazhsky DI, Rostorguev EE, Frantsyants EM, Panina SB. Molecular genetic markers of gliomas. Molecular genetics, microbiology and virology. 2017;35(4):132-140. (In Russ.). https://doi.org/10.18821/0208-0613-2017-35-4-132-140
7. Xu S, Wang J, Ding N, Hu W, Zhang X, Wang B, et al. Exosome-mediated microRNA transfer plays a role in radiation-induced bystander effect. RNA Biol. 2015;12(12):1355-1363. https://doi.org/10.1080/15476286.2015.1100795
8. Kit O I, Rastorguev E E, Timoshkina N N, Pushkin A A, Alliluyev I A, Kuznetsova N S, etc. A method for diagnosing glial brain tumors of a high degree of malignancy. Patent RU 2742413 C1. Available at: https://patents.s3.yandex.net/RU2742413C1_20210205.pdf. Accessed: 01.02.2022. (In Russ.).
9. Yang C, Wang C, Chen X, Chen S, Zhang Y, Zhi F, et al. Identification of seven serum microRNAs from a genome-wide serum microRNA expression profile as potential noninvasive biomarkers for malignant astrocytomas. Int J Cancer. 2013 Jan 1;132(1):116-127. https://doi.org/10.1002/ijc.27657
10. Qu S, Guan J, Liu Y. Identification of microRNAs as novel biomarkers for glioma detection: a meta-analysis based on 11 articles. J Neurol Sci. 2015 Jan 15;348(1-2):181-187. https://doi.org/10.1016/jjns.2014.11.036
11. Roth P, Wischhusen J, Happold C, Chandran PA, Hofer S, Eisele G, et al. A specific miRNA signature in the peripheral blood of glioblastoma patients. J Neurochem. 2011 Aug;118(3):449-457. https://doi.org/10.1111/j.1471-4159.2011.07307.x
12. Aparicio-Puerta E, Lebrón R, Rueda A, Gómez-Martín C, Giannoukakos S, Jaspez D, et al. sRNAbench and sRNAtoolbox 2019: intuitive fast small RNA profiling and differential expression. Nucleic Acids Res. 2019 Jul 2;47(W1):W530-W535. https://doi.org/10.1093/nar/gkz415
13. Robin X, Turck N, Hainard A, Tiberti N, Lisacek F, Sanchez J-C, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. BMC Bioinformatics. 2011 Mar 17;12:77. https://doi.org/10.1186/1471-2105-12-77
14. Kuhn M. A Short Introduction to the caret Package. R Found Stat Comput, 2015, 1-10 p.
15. Ru Y, Kechris KJ, Tabakoff B, Hoffman P, Radcliffe RA, Bowler R, et al. The multiMiR R package and database: integration of microRNA-tar-get interactions along with their disease and drug associations. Nucleic Acids Res. 2014;42(17):e133. https://doi.org/10.1093/nar/gku631
16. Hamberg M, Backes C, Fehlmann T, Hart M, Meder B, Meese E, et al. MiRTargetLink-miRNAs, Genes and Interaction Networks. Int J Mol Sci. 2016 Apr 14;17(4):564. https://doi.org/10.3390/ijms17040564
17. Kolberg L, Raudvere U, Kuzmin I, Vilo J, Peterson H. gprofiler2 -- an R package for gene list functional enrichment analysis and namespace conversion toolset g:Profiler. F1000Res. 2020;9:ELIXIR-709. https://doi.org/10.12688/f1000research.24956.2
18. Zhang H, Cong Q-X, Zhang S-G, Zhai X-W, Li H-F, Li S-Q. High Expression Levels of Fascin-1 Protein in Human Gliomas and its Clinical Relevance. Open Med (Wars). 2018;13:544-550. https://doi.org/10.1515/med-2018-0080
19. Fan Y, Potdar AA, Gong Y, Eswarappa SM, Donnola S, Lathia JD, et al. Profilin-1 phosphorylation directs angiocrine expression and glioblastoma progression through HIF-1a accumulation. Nat Cell Biol. 2014 May;16(5):445-456. https://doi.org/10.1038/ncb2954
20. Chen T, Liu Y, Chen J, Zheng H, Chen Q, Zhao J. Exosomal miR-3180-3p inhibits proliferation and metastasis of non-small cell lung cancer by downregulating FOXP4. Thorac Cancer. 2021 Feb;12(3):372-381. https://doi.org/10.1111/1759-7714.13759
21. Jin L, Zhang Z. Serum miR-3180-3p and miR-124-3p may Function as Noninvasive Biomarkers of Cisplatin Resistance in Gastric Cancer. Clin Lab. 2020 Dec 1;66(12). https://doi.org/10.7754/Clin.Lab.2020.200302
22. M0rup N, Stakaitis R, Golubickaite I, Riera M, Dalgaard MD, Schierup MH, et al. Small RNAs in Seminal Plasma as Novel Biomarkers for Germ Cell Tumors. Cancers (Basel). 2021 May 13;13(10):2346. https://doi.org/10.3390/cancers13102346
23. Gao L, Yan S-B, Yang J, Kong J-L, Shi K, Ma F-C, et al. MiR-182-5p and its target HOXA9 in non-small cell lung cancer: a clinical and in-silico exploration with the combination of RT-qPCR, miRNA-seq and miRNA-chip. BMC Med Genomics. 2020 Jan 6;13(1):3. https://doi.org/10.1186/s12920-019-0648-7
24. Wen D, Li S, Ji F, Cao H, Jiang W, Zhu J, et al. miR-133b acts as a tumor suppressor and negatively regulates FGFR1 in gastric cancer. Tumour Biol. 2013 Apr;34(2):793-803. https://doi.org/10.1007/s13277-012-0609-7
Информация об авторах:
Пушкин Антон Андреевич н - научный сотрудник лаборатории молекулярной онкологии ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0003-2385-6285, SPIN: 9223-1871, AuthorlD: 975797, ResearcherlD: AAA-8887-2020, Scopus Author ID: 57200548010
Гвалдин Дмитрий Юрьевич - к.б.н., научный сотрудник лаборатории молекулярной онкологии ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0001-8633-2660, SPIN: 8426-9283, AuthorlD: 1010353, ResearcherlD: AAA-9894-2020, Scopus Author ID: 57195716861
Тимошкина Наталья Николаевна - к.б.н., руководитель лаборатории молекулярной онкологии ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0001-6358-7361, SPIN: 9483-4330, AuthorID: 633651, ResearcherID: D-3876-2018, Scopus Author ID:24077206000
Росторгуев Эдуард Евгеньевич - д.м.н., заведующий отделением нейроонкологии, ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0003-2937-0470, SPIN: 8487-9157, AuthorID: 794808, ResearcherID: AAK-6852-2020, Scopus Author ID:57196005138
Владимирова Любовь Юрьевна - д.м.н., профессор, заведующая отделением противоопухолевой лекарственной терапии № 1, руководитель отдела лекарственного лечения опухолей ФГБУ «НМИЦ онкологии» Минздрава России, Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0003-4236-6476, SPIN: 4857-6202, AuthorID: 289090, ResearcherID: U-8132-2019, Scopus Author ID: 7004401 163
Дженкова Елена Алексеевна - д.б.н., доцент, ученый секретарь ФГБУ «НМИЦ онкологии» Минздрава России, г. Ростов-на-Дону, Российская Федерация. ORCID: https://orcid.org/0000-0002-3561-098X, SPIN: 6206-6222, AuthorID: 697354, ResearcherID: K-9622-2014, Scopus Author ID: 6507889745
Information about authors:
Anton A. Pushkin н - Researcher, Laboratory of Molecular Oncology National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0003-2385-6285, SPIN: 9223-1871, AuthorID: 975797, ResearcherID: AAA-8887-2020, Scopus Author ID: 57200548010 Dmitry Yu. Gvaldin - Cand. Sci. (Biol.), Researcher, Laboratory of Molecular Oncology National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0001-8633-2660, SPIN: 8426-9283, AuthorID: 1010353, ResearcherID: AAA-9894-2020, Scopus Author ID: 57195716861 Natalya N. Timoshkina - Cand. Sci. (Biol.), Head of the Laboratory Molecular Oncology National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0001-6358-7361, SPIN: 9483-4330, AuthorID: 633651, ResearcherID: D-3876-2018, Scopus Author ID: 24077206000 Eduard E. Rostorguev - Dr. Sci. (Med.), head of Neurooncology Department, National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0003-2937-0470, SPIN: 8487-9157, Author ID: 794808, Researcher ID: AAK-6852-2020, Scopus Author ID: 57196005138
Lubov Yu. Vladimirova - Dr. Sci. (Med.), professor, head of the department of antitumor Drug Therapy No. 1, Head of Tumor drug Therapy Department, National Medical Research Centre for Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0003-4236-6476, SPIN: 4857-6202, AuthorID: 289090, ResearcherID: U-8132-2019, Scopus Author ID: 7004401 163
Elena A. Dzhenkova - Dr. Sci. (Biol.), Associate Professor, academic secretary National Medical Research Centre of Oncology, Rostov-on-Don, Russian Federation. ORCID: https://orcid.org/0000-0002-3561-098X, SPIN: 6206-6222, AuthorID: 697354, ResearcherID: K-9622-2014, Scopus Author ID: 6507889745
Вклад авторов:
Пушкин А. А.- концепция исследования, написание исходного текста,
итоговые выводы, доработка текста;
Гвалдин Д. Ю.- развитие методологии, доработка текста;
Тимошкина Н. Н.- научное руководство;
Росторгуев Э. Е.- научное руководство, доработка текста;
Владимирова Л. Ю.- научное руководство;
Дженкова Е. А.- научное руководство, доработка текста.
Все авторы сделали эквивалентный вклад в подготовку публикации.
Authors contribution:
Pushkin A. A.- research concept, writing the draft, final conclusions, follow on a revision of the text;
Gvaldin D. Yu.- methodology development, follow on a revision of the text; Timoshkina N. N.- scientific management;
Rostorguev E. E.- scientific management, follow on a revision of the text; Vladimirova L. Yu.- scientific management;
Dzhenkova E. A.- scientific management, follow on a revision of the text. The authors contributed equally to this article.