Научная статья на тему 'Автоматическое извлечение знаний из текстов научных публикаций и баз данных в области биологии и биомедицины'

Автоматическое извлечение знаний из текстов научных публикаций и баз данных в области биологии и биомедицины Текст научной статьи по специальности «Химические науки»

CC BY
74
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по химическим наукам , автор научной работы — В. А. Иванисенко, Е. С. Тийс, Т. В. Иванисенко, П. С. Деменков

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматическое извлечение знаний из текстов научных публикаций и баз данных в области биологии и биомедицины»

152 Секция 9

ячейка которой соответствует фрагменту листа и может быть сопоставлена с одним или несколькими пикселями на изображениях. Состояния ячеек и правила переходов описывают развитие заболевания с учетом процессов латентной и явной стадий.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (код проекта 17-29-08028).

Список литературы

1. Николаев С.В., Зубаирова УС., Сколотнева Е.С., Орлова Е.А., Афонников Д.А. Системный подход к моделированию развития листостебельных грибных инфекций пшеницы. Вавиловский журнал генетики и селекции. 2019;23(1):100-109. DOI 10.18699/VJ19.468

Автоматическое извлечение знаний из текстов научных публикаций и баз данных в области биологии и биомедицины

В. А. Иванисенко1,2 Е. С. Тийс1, Т. В. Иванисенко1, П. С. Деменков1

'Институт цитологии и генетики СО РАН

2Новосибирский государственный университет

Email: salix@bionet.nsc.ru

DOI: 10.24411/9999-017A-2019-10308

Реконструкция и анализ генных сетей является в настоящее время широко распространеным методом описания молекулярных механизмов функционирования биологических систем в норме и при патологии. Однако процесс реконструкции, основанный на ручном анализе экспертов, требует больших временных затрат. Как правило, для реконструкции даже небольших сетей требуется изучение многих тысяч научных публикаций и работа с большим количеством баз данных. Разработана компютерная система ANDSystem, предназначенная для автоматического извлечения знаний из текстов научных публикаций и баз данных на основе методов интеллектуального анализа данных [1]. С использованием этой системы проведен анализ более 25 млн. научных публикаций PubMed и нескольких десятков баз данных. База знаний ANDSystem, содержащая результаты этого анализа, включает в себя информацию о более 30 млн. фактах о молекулярно-генетических взаимодействиях, регуляции экспрессии, активности, транспорта, каталитических реакциях, а также ассоциациях генов с заболеваниями. Все взаимодействия описываются на уровне организма, а также клетки и ткани. Доступ к базе знаний осуществляется с помощью инструмента ANDVisio, обеспечивающего возможность реконструкции и анализа генных сетей. Представлена возможность реконструкции генных сетей, специфически связанных с изучаемым процессом, с учетом различных свойств вершин графа, включая центральность и специфичность. Максимизация величины этих свойств в процессе реконструкции обеспечивает увеличение связности генов внутри генной сети. Функциональность таких сетей подтверждается фактом, что генные сети процессов Gene Ontology обладают большей связностью по сравнению со случайными сетями.

Работа выполнена при финансовой поддержке проекта "Исследование, анализ и комплексная независимая экспертиза проектов Национальных технологических инициатив, в том числе сопровождение проектов "дорожной карты""№шо№1"", выполняемого в рамках государственного задания № 28.12487.2018/12.1 Министерства науки и высшего образования Российской Федерации.

Список литературы

1. Ivanisenko V.A., Demenkov P.S., Ivanisenko T.V, Mishchenko E.L., Saik O.V, A new version of the ANDSystem tool for automatic extraction of knowledge from scientific publications with expanded functionality for reconstruction of associative gene networks by considering tissue-specific gene expression. BMC Bioinformatics. 2019. V.20(Suppl 1), P.34.

i Надоели баннеры? Вы всегда можете отключить рекламу.