DYNMICROBIOTECH: A SOFTWARE MODULE FOR AUTOMATIC RECONSTRUCTION OF FRAME-BASED DYNAMIC MODELS OF MICROBIAL GENE NETWORKS
S. Lashin, F. Kazantsev, T. Lakhova, Yu. Matushkin
Kurchatov Genomic Center of the Institute of Cytology and Genetics SB RAS,
630090, Novosibirsk, Russia Institute of Cytology and Genetics SB RAS, 630090, Novosibirsk, Russia Novosibirsk State University, 630090, Novosibirsk, Russia
DOI: 10.24412/2073-0667-2024-4-56-68 EDN: QVDKVH
Modern genetic technologies are used in industrial biotechnology to design microbial strains-producers with target characteristics for based on close integration of experimental and informationcomputer approaches. The increasing availability of genomic data and methods of their functional annotation requires the development of new methods of systems biology, in particular, methods of reconstruction of gene networks and metabolic pathways controlling target processes and characteristics of microorganisms based on information about sequenced genomes, as well as methods of building mathematical models of these networks and pathways. This paper presents the DynMicrobiotech software module for automatic reconstruction of frame-based mathematical models based on the generalized chemical-kinetic modeling method. The input data for the module are the annotation and markup of the genome, while the output data are the generated model in the form of a system of ordinary differential equations written in SBML format.
Key words: generalized chemical-kinetic method of modeling, differential equations, gene networks.
References
1. Goodwin S., McPiiersox J.D., McCombie W.R. Coming of age: ten years of next-generation sequencing technologies /7 Nat. Rev. Genet. 2016. V. 17. N 6. P. 333 351.
2. Quail M. et al. A tale of three next generation sequencing platforms: comparison of Ion torrent, pacific biosciences and illumina MiSeq sequencers /7 BMC Genomics. 2012. V. 13. N 1. P. 341.
3. Co wax A.E., Mexdes P., Blixov M.L. ModelBrieks modules for reproducible modeling improving model annotation and provenance /7 npj Svst. Biol. Appl. 2019. V. 5. N 1.
4. Gilbert D. et al. Towards dynamic genome-scale models /7 Brief. Bioinform. 2019. V. 20. N 4. P. 1167 1180.
5. Karr J. R. et al. A Whole-Cell Computational Model Predicts Phenotvpe from Genotype /7 Cell. 2012. V. 150. N 2. P. 389 401.
The study is supported by the budget project of Institute of Cytology arid Genetics SB RAS No FWNR-2022-0020.
(c) S. Lashin, F. Kazantsev, T. Lakhova, Yu. Matushkin, 2024
6. Kim W. J., Kim H.U., Lee S.Y. Current state and applications of microbial genome-scale metabolic models // Curr. Opin. Svst. Biol. 2017. V. 2. P. 10-18.
7. Akberdin I.R. et al. In Silico Cell: Challenges and Perspectives // Math. Biol. Bioinforma. 2013. V. 8. N 1.
8. Demin O., Goryanin I. Kinetic Modelling in Systems Biology. 2008.
9. Hellerstein J.L. et al. Recent advances in biomedical simulations: a manifesto for model engineering // FlOOOResearch. 2019. V. 8. P. 261.
10. Ocone A., Millar A. J., Sanguinetti G. Hybrid regulatory models: a statistically tractable approach to model regulatory network dynamics // Bioinformatics. 2013. V. 29. N 7. P. 910-916.
11. Funahashi A. et al. CellDesigner 3.5: A Versatile Modeling Tool for Biochemical Networks // Proc. IEEE. 2008. V. 96. N 8. P. 1254-1265.
12. King Z. A. et al. BiGG Models: A platform for integrating, standardizing and sharing genome-scale models // Nucleic Acids Res. 2016. V. 44. N Dl. P. D515-D522.
13. Lloyd C.M. et al. The CellML Model Repository // Bioinformatics. 2008. V. 24. N 18. P. 2122-2123.
14. Malik-Sheriff R. S. et al. BioModels^l5 years of sharing computational models in life science // Nucleic Acids Res. 2019.
15. Henkel R., Wolkenhauer O., Waltemath D. Combining computational models, semantic annotations and simulation experiments in a graph database // Database. 2015. V. 2015. P. 1-16.
16. Kirk P.D.W., Babtie A.C., Stumpp M.P.H. Systems biology (un)certainties // Science (80-, ). 2015. V. 350. N 6259. P. 386-388.
17. Stanford N. J. et al. The evolution of standards and data management practices in systems biology // Mol. Svst. Biol. 2015. V. 11. N 12. P. 851-851.
18. Beal J. et al. Communicating Structure and Function in Synthetic Biology Diagrams // ACS Synth. Biol. 2019. V. 8. N 8. P. 1818-1825.
19. bruggeman F. J., Westerhopp H. V. The nature of systems biology // Trends Microbiol. 2007. V. 15. N 1. P. 45-50.
20. llkhoshval V. A. et al. Generalized chemokinetic method for gene network simulation // Mol. Biol. 2001. V. 35. N 6. P. 919-925.
21. palsson B. The challenges of in silico biology Moving from a reductionist paradigm to one that views cells as systems will necessitate // 2000. V. 18. p. 1147-1150.
22. kljrata H. et al. BioFNet: Biological functional network database for analysis and synthesis of biological systems // Brief. Bioinform. 2013. V. 15. N 5. P. 699-709.
23. Ratner V. A. A molecular genetic control system // Priroda = Nature. 2001. V. 3. P. 16-22.
24. Moodie S. et al. Systems Biology Graphical Notation: Process Description language Level 1 Version 1.3 //J. Integr. Bioinform. 2015. V. 12. N 2.
25. Norsigian C. J. et al. BiGG Models 2020: multi-strain genome-scale models and expansion across the phvlogenetic tree // Nucleic Acids Res. 2019. V. 48. N Dl. P. D402-D406.
26. Zhang F. et al. Systems biology markup language (SBML) level 3 package: multistate, multicomponent and multicompartment species, version 1, release 2 // J. Integr. Bioinform. 2020. V. 17. N 2-3. P. 0-74.
27. LlKHOSHVAl V.A. et al. A generalized chemical-kinetic method for modeling complex biological systems. Computer model of bacteriophage Lambda ontogenesis // Vvchislitelnve texnologii = Journal of Computational Technologies. 2000. V. 5. N Special issue dedicated to the 10th anniversary of the Laboratory of Theoretical Genetics of the Institute of Cytology and Genetics SB RAS. P. 87-99.
28. Kazantsev F.V. et al. System of automated generation of mathematical models of gene networks // Informatsionnvj vestnik YOGIS. 2009. V. 13. N 1. P. 163-169.
29. Akberdin LR. et al. "Electronic cell": problems and perspectives // Mathematicheskaya Biologiva i Bioinformatika Mathematical Biology and Bioinformatics. 2013. V. 8. N 1. P. 287-307.
30. zhabotinsky A.M. Concentration auto oscillations., 1974. P. 1-179. M.: Navka.
31. hljcka M. et al. The Systems Biology Markup Language (SBML): Language Specification for Level 3 Version 1 Core //J. Integr. Bioinforma. 2015. V. 12. N 2. P. 382-549.
32. Lakhova T.N. et al. Algorithm for the Reconstruction of Mathematical Frame Models of Bacterial Transcription Regulation // Mathematics. 2022. V. 10. N 23. P. 4480.
33. Kanehisa M. Enzyme Annotation and Metabolic Reconstruction Using KEGG., 2017. P. 135145.
34. McDonald A. G., Boyce S., Tipton K.F. ExplorEnz: the primary source of the IUBMB enzyme list // Nucleic Acids Res. 2009. V. 37. N Database. P. D593-D597.
35. Wittig U. et al. SABIO-RK-database for biochemical reaction kinetics // Nucleic Acids Res. 2012. V. 40. N Dl. P. D790-D796.
36. Kazantsev F. V. et al. MAMMOTh: A new database for curated mathematical models of biomolecular systems //J. Bioinform. Comput. Biol. 2018. V. 16. N 01. P. 1740010 (16 pages).
37. Otasek D. et al. Cvtoscape Automation: empowering workflow-based network analysis // Genome Biol. 2019. V. 20. N 1. P. 185.
38. hoops S. et al. COPASI-a COmplex PAthwav Simulator // Bioinformatics. 2006. V. 22. N 24. P. 3067-3074.
39. Cock P. J. A. et al. Biopvthon: freely available Python tools for computational molecular biology and bioinformatics // Bioinformatics. 2009. V. 25. N11. P. 1422-1423.
DYNMICROBIOTECH: ПРОГРАММНЫЙ МОДУЛЬ ДЛЯ АВТОМАТИЧЕСКОЙ РЕКОНСТРУКЦИИ ФРЕЙМОВЫХ ДИНАМИЧЕСКИХ МОДЕЛЕЙ ГЕННЫХ СЕТЕЙ МИКРООРГАНИЗМОВ
С. А. Лашин, Ф.В. Казанцев, Т.Н. Л ахова, Ю.Г. Матушкин
Курчатовский геномный центр Института цитологии и генетики СО РАН,
630090, Новосибирск, Россия Институт цитологии и генетики СО РАН, 630090, Новосибирск, Россия Новосибирский государственный университет, 630090, Новосибирск, Россия
УДК 573.22, 57.052
Б01: 10.24412/2073-0667-2024-4-56-68
ЕБХ: дУБКУН
Современные генетические технологии используются в промышленной биотехнологии для конструирования микробиологических штаммов-продуцентов с целевыми характеристиками на основе тесной интеграции экспериментальных и информационно-компьютерных подходов. Все большая доступность геномных данных и методов их функциональной аннотации требует разработки новых методов системной биологии, в частности, методов реконструкции генных сетей и метаболических путей, контролирующих целевые процессы и характеристики микроорганизмов, на основе информации о секвенированных геномах, а также методов построения математических моделей этих сетей и путей. В данной работе представлен программный модуль ВупКШтоЬкЛееЬ для автоматической реконструкции фреймовых математических моделей на основе метода обобщенжих) химико-кинетическслх) моделирования. Входными данными для модуля являются аннотация и разметка генома, выходными сгенерированная модель в виде системы обыкновенных дифференциальных уравнений, записанная в формате БВМЬ.
Ключевые слова: обобщенный химико-кинетический метод моделирования, дифференциальные уравнения, геннные сети.
Введение. Современные генетические технологии используются в промышленной биотехнологии для конструирования микробиологических штаммов-продуцентов с целевыми характеристиками на основе тесной интеграции экспериментальных и информационно-компьютерных подходов.
Прогресс в развитии экспериментальных технологий соверши.:: революцию в биологии и позволил исследователям генерировать огромное количество многофакторных данных с высокой степенью детализации |1, 2|, Развитие и доступность высокопроизводительных
Исследование выполнено за счет средств бюджетного проекта ФИЦ ИЦиГ СО РАН «Системная биология и биоинформатика: реконструкция, анализ и моделирование структурно-функциональной организации и эволюции генных сетей человека, животных, растений и микроорганизмов» № Г"\¥^Ш-2022-0020.
(с) С. А. Лашин, Ф.В. Казанцев, Т.Н. Лахова, Ю.Г. Матушкин, 2024
вычислительных ресурсов и технологий хранения данных дали новый толчок в развитии математического моделирования биологических систем [3-6], Сегодня математическое моделирование все чаще рассматривается как основной инструмент для интеграции и анализа экспериментальных данных и системного исследования динамических биологических систем [7-9], Математические модели динамических биологических систем могут быть сформулированы в терминах систем обыкновенных дифференциальных уравнений (ОДУ), уравнений в частных производных или дифференциальных уравнений с запаздывающим аргументом, стохастических моделей, а также в терминах дискретных операций и, наконец, сочетая перечисленные выше техники, в терминах т, н, гибридных подходов [5, 10], Выбор подходящего формализма обычно зависит от сложности рассматриваемой биологической системы в смысле точности и доступности экспериментальных данных.
На текущий момент доступно более 1000 различных опубликованных моделей комплексных биомолекулярных систем, которые разработаны для нескольких организмов [6, 11-14], Количество таких моделей постоянно растет, однако повторное использование, расширение или модификация таких готовых математических моделей довольно нетривиальная задача [15-17], Модель часто представлена в виде законченной, жестко структурированной в некотором формализме системы (например, в виде системы уравнений или кода программы на языке высокого уровня). Для таких моделей отсутствуют средства, позволяющие модифицировать их структурное и/или функциональное содержание в автоматическом или полуавтоматическом режиме. Однако, декомпозиция моделей на отдельные «элементарные» подсистемы является альтернативным решением озвученной проблемы. Такие подсистемы могут рассматриваться как «строительные блоки», которые используются для описания/представления конкретных биомолекулярных функций и/или элементарных процессов биологических систем [3, 18-21], Моделью элементарной подсистемы (МЭП) мы будем называть минимальную модель подсистемы, которой достаточно для осуществления заданной функции [22-23],
Подход представления моделей в виде комбинации элементарных подсистем является естественным в силу самой природы организации биологических систем. Имеются естественные уровни иерархии в организации организмов — естественное разбиение на функциональные подсистемы. Именно такой подход является перспективным в создании комплексных многоуровневых моделей систем живой природы, поддерживающий методы размещения подсистем по компартментам, организации модельных структур в органел-лы и ткани. Такой подход в декомпозиции, каталогизации, интеграции, реконструкции и исследовании моделей приводит к вовлечению в работу современных информационно-вычислительных технологий по хранению и доступу к данным (реляционным, объектным и NO-SQL СУБД) и технологий высокопроизводительного вычислительного анализа, Практический интерес к такому подходу обусловлен тем, что с его помощью возможно формировать коллекцию моделей элементарных подсистем, играющих роль «строительных блоков» для последующего использования в новых составных моделях, а также разрабатывать инструменты, которые становятся стандартами в обмене информацией, инструментах анализа и представления данных [24-26],
В данной работе мы описываем программный модуль DvnMierobioteeh для автоматической реконструкции фреймовых математических моделей на основе обобщенного метода химико-кинетического моделирования [27], DvnMierobioteeh представляет развитие MGSgenerator, ранее разработанного авторами [28], В основе подхода лежат декомпозиция графа генной сети на подсистемы и независимая генерация формального математическо-
го описания для каждого процесса, представленного в генной сети. Входными данными для модуля являются аннотация и разметка генома, выходными — сгенерированная модель в виде системы обыкновенных дифференциальных уравнений, записанная в формате SBML,
1. Алгоритм реконструкции математических моделей генных сетей. Реконструкция математических моделей на основе информации из аннотированного генома проводится в несколько этапов, В рамках процесса реконструкции естественным подходом организации моделей является блочно-модульный подход моделирования биологических систем [20, 22], Одним из эффективных методов, реализующих этот подход, является обобщенный химико-кинетический метод моделирования (ОХКММ), когда модель исследуемого явления представляется комбинацией из самостоятельных моделей ее подсистем. Такими подсистемами могут быть метаболические пути, их комбинации или отдельные процессы (ферментативный синтез, транспортные процессы молекул и др.).
Модель молекулярно-генетичеекой системы (МГС) строится на основе уравнения химической кинетики вида (1) и представляет собой различные способы представления кинетического закона действующих масс и обобщенного химико-кинетического метода моделирования (ОХКММ), предложенного В, А, Лихошваем [27]:
f = ^(YK >• (1)
где X — вектор (список) управляемых переменных, Y — вектор (список) управляющих переменных, К — список параметров.
Допускается вхождение одних и тех же переменных в оба списка, но, в общем случае, списки X и Y не совпадают и могут вообще не пересекаться. Переменные обычно имеют смысл концентраций веществ или вероятностей реализации выделенных состояний веществ. Переменные из списка Y, те входящие в список X, являются параметрами для текущей элементарной модели. Функционал У описывает закон скоростей изменения концентраций веществ из списка X.
Кинетический закон действующих масс выводится на основе теории соударений. Пусть имеется биохимическая реакция:
А + В о С (2)
Тогда скорость Уа+в^с формирования комплекса С в текущий момент времени Ь равна Уа+в^с (¿) = к\ [А][В], а скоро стьУа+в^с распада компл екса С на составляющие ^Вв текущий момент времени Ь равна Ус^а+в(¿) = к2[С],
Если имеется конкретная биохимическая схема реакций вида (2), то мгновенная скорость изменения концентрации любого вещества равняется сумме локальных скоростей изменения концентрации данного вещества в каждой реакции, в которой данное вещество участвует [28-29], Это простое правило позволяет легко выписать итоговую систему дифференциальных уравнений, описывающих целевую биохимическую схему, используя при этом в качестве правых частей уравнений системы (1) только полиномы первого и второго порядка.
Теоретической основой для этого служит важнейшая для моделирования химической кинетики теорема Корзухина, которая утверждает: «Для любой совокупности неотрицательных кривых, заданных на конечном интервале времени, и любой заданной точности,
Таблица 1
Некоторые формальные блоки ОХ К" ММ (по: [27])
Обратимая биомолекулярная реакция: Х\ +Х2 ^ Х3 X — (Х1,Х2,Хз), Р — (к\,к2), р . — ко . Тъ —кл • Тл • То ^ — — — ¿хз Г . л — к2 Хз к Х1 тъ М — м — М ■
Необратимая мономолекулярная реакция: Х " У1+ У2 + ... + Уп X — (х, у\, У2,..., Уп), Р — (к), р .ах — <1у! — ¿У2 — — йуп — к . Х п > 0 Г . а — л — л — ... — а — к Х,п >
Конститутивный синтез: " Х\ + ... + Хп X — (х,хъ ...,хп), Р — (к), Г : ^ — к,г — \,..,п,п > 0.
Обобщенная схема 1 М ихаэ лис а- М ентен X — (Х2, ...,Хт,у1, ..., Уп), Р — (т1,кг,ка,^,...,ат,Ь1,..., Ьп), Г : — а3 •гл — 1,...,т, ^ — ^ • г,1 — 1,...,п, где г ^ ^-,т > 2, п > 0.
Обобщенная схема 2 М ихаэ лис а- М ентен X — (е,Х1,...,Хт,У1,..., Уп), Р — (т, к, в\,...,8гп,а0,а1,...,агп,ъ1,..., Ьп), т > 1,п > 0, Р : Ж — "а° г ~сХ — —аз •г,3 — 1,...,т, ^ — Ь •к •г,1 — 1,...,п, где г — квех1...хт м (в+е)...(вх+ х1)..(вт+ хт)-ех\...хт ' 1 1 Вт_ „ Х1 +...+ хт Ь — 1 1 . —+...+— Х1 хт
Обобщенная схема 3 М ихаэ лис а- М ентен X — (е!,..., е\ ,Х1,...,Хт,У1,..., Уп), Р — (1 ,т,к,в1,..., Зт,а0,а1,...,ат,Ь1,..., Ъп),т > 1,п > 0, р: ж — —ао г, — —аз •г,з — 1,...,т аУ1 — }„ к г 1 — 1 п г — ке1...е1х1...хт
«реакция» Х\ + ... +Хт -&У1 + ... + Уп XX — (х1,...,Тт,У1,..., Уп), Р — (т, кl,к2, а1, вхц , ву1 ,...,ат, вхт , вут ,Ъl, ГхЛ , Г У1 ,...,Ьп, Т хп , Г Уп ), Г : — - ^к 1Х?1 ...хт + зугк2У I1... Уп Л — 1,...,т, — Гх3к1Х1 — Тугк2У 1 ...У^Т ^ — 1,...,п-
Суммирование: Х — Х\ + ... + Хп -X (х, х1,..., Хп), Г : х — Х\ + ... + Хп-
Пороговый автомат X — (х,х\,х2), Г : х — Х1, если Х\ > Х2-
Стохастический автомат XX — (Х,Х1,У1, У2), Г : х — ХЬ если у1 > у2, где у\ — случайная величина, равномерно распределенная на отрезке [0,1], У2 — число из интервала [0,1].
существует такая (может быть не одна) биохимическая схема, составленная только из бимолекулярных и мономолекулярных реакций, что математическая модель, построенная по данной биохимической схеме, приближает заданную совокупность кривых с заданной точностью» [30],
Важнейшим элементом построения более сложных моделей МГС с помощью ОХКММ [27] является правило суммирования локальных скоростей протекания биохимических реакций: общая скорость изменения концентраций компонентов системы является суммой скоростей изменения концентрации данного компонента во всех элементарных процессах, подробнее см, табл. 1,
Рис. 1. Схема технологии реконструкции математических моделей по аннотированному геному
Опираясь па принципы ОХКММ, развиваются стандарты представления математических моделей молекулярно-генетических систем. В частности, подход к блочпо-модулыюй организации математических моделей реализован в формате БВМЬ |31|, ставшим де-факто стандартом в сообществе системных биологов. Этот формат поддерживает более 200 программных инструментов анализа разных аспектов функционирования биологических систем.
2. Вычислительный конвейер. В рамках работы, опираясь па описаппую выше теоретическую и алгоритмическую базу, разработан конвейер обработки данных, который, анализируя входной список гонов и их продуктов, восстанавливает 1) структурную модель геппой сети организма и 2) строит рамочные математические модели но этой структуре. Принципиальная схема решения задачи реконструкции математических моделей но аннотированному геному представ л сна на рис. 1.
На первом этапе идет формирование структурной (т. е. графовой) модели дня всех процессов, связанных с геномом. В рамках этого этана формируются список участников моделирования и их роли в процессах. На входе имеется список генов и их продуктов с указанными идентификаторами в публичных базах данных (таких как ХСВ1, Б^тзвРиЛ и др.). Поэтапно генерируются:
— Реакции транскрипции/трансляции — реакция синтеза белка, где выбранный ген является запускающим условием синтеза, причем в реакции не расходуется. Если имеется информация но позициям транскрипционных факторов дня этого гена, то, с применением инструментария Operon_Equations |32|, генерируется более подробная структурная и математическая модель подсистемы. При наличии дополнительных регуляторных участников процесса математический закон генерируется с использованием инструмента MGSgenerator |28|,
— Если продукт выбранного гена является ферментом — модель дополняется подсистемой ферментативного синтеза на основе информации, извлеченной из базы ферментативных реакций Enzyme Database [33-34],
Второй этап реконструкции модели — анализ полученных процессов, В этот анализ входят:
— Сравнение элементов модели по синонимам для выявления дублей. Используются публичные базы данных и их API (Enzyme Database и CHEBI), Расширение аннотации элементов модели через кросс-ссылки на сторонние профильные базы данных,
— Анализ процессов на вхождение в известные метаболические пути (используется БД KEGG и ее API),
— Анализ модели на наличие транспортных подсистем для молекул, находящихся в разных компартментах. Дополнительное описание процессов транспорта между компарт-ментами (если необходимо),
— Дополнение модели подсистемами деградации молекул и процессами притока молекул в модель (если они не синтезируются в самой модели),
— Для каждого связанного подграфа генерируется отдельная математическая модель. Для анализа графа используется библиотека networkX,
— При необходимости извлекается информация из открытых баз данных по кинетике процессов, таких как SabioRk [35] и Mammoth [36],
Результирующие модели оформляются в следующих форматах:
— SBML — международный формат представления моделей биологических систем,
— GML — формат представления данных в виде графа, в котором каждая вершина и связь между вершинами специфицирована набором собственных атрибутов. Данный формат поддерживается многими инструментами визуализации и анализа графов (например, Cytoskape и yEd).
— CSV — представления данных в виде структурированных текстовых таблиц с фиксированным разделителем, С таким форматом можно работать в инструментах, входящих в офисные пакеты работы с данными, такие как MS Excel и Open Office CALC, Такого рода данные могут быть использованы в инструменте построения графов генных сетей Cvtoseape [37],
Так как экспорт модели осуществляется в формате SBML, проведение вычислительных экспериментов можно проводить в любом инструменте, поддерживающем импорт в этом формате, К таким инструментам относятся Copasi [38], CellDesigner [11] и библиотеки моделирования Systems Biology Toolkit для среды моделирования Mal lab и библиотека BioPvthon [39] для языка Python,
3. Пример работы алгоритма генерации фреймовых моделей. Описанный выше протокол реконструкции математических моделей был применен для анализа 150 геномов микроорганизмов, секвеиироваипых в ходе выполнения проекта, В данном разделе приведены результаты по реконструкции полногеномной математической модели бактерии Corynebacterium glutamicum В-2403, На рис, 2 представлена структурная модель, визуализированная в рамках стандарта SBGN в инструменте vEd (https://www.yworks.com/ products/yed). Граф является двудольным с количеством узлов 8332 и 9770 связей на 1030 исходных генов ферментов в аннотации. Отдельной актуальной задачей в этой области стоит вопрос планарной раскладки таких графов в условии игнорирования связей ряда простых метаболитов, которые участвуют в большом количестве реакций. Причем
Рис. 2. Реконструированная расширенная структурная модель генной сети, построенная на данных аннотации генома С. glutaniicurn (В-2403). с учетом информации о наличии ферментов. Визуализация выполнена с помощью программы yEd в нотации SBGN
раскладка таких графов, желательно, должна соответствовать стандартным картам метабол и ческих путей.
Итоговая система содержит более 3500 обыкновенных дифференциальных уравнений с более 4500 параметров. В силу блочно-модулыюй организации модели управление параметрами осуществляется в рамках именно этих блоков, без необходимости выискивания соответствия в векторах параметров.
Заключение. Разработанный программный модуль объединяет в себе цикл задач но созданию модели метаболизма бактерии, включая учет схемы взаимодействия биохимических реакций. Результирующие модели могут быть числошю исследованы с использованием стандартного инструментария как широкого профиля (Matlab/Octave, Mathematica и др.), так и узкоспециализированного (среды дня моделирования биологических систем COPASI). Модуль был успешно апробирован при анализе 500 геномов микроорганизмов из коллекции Курчатовского геномного центра ИЦиГ СО РАН.
Список литературы
1. Goodwin S., McPiiersox J.D., McGombie W.R. Coming of age: ten years of next-generation sequencing technologies /7 Nat. Rev. Genet. 2016. T. 17. № 6. C. 333 351.
2. Quail M. и др. A tale of three next generation sequencing platforms: comparison of Ion torrent, pacific biosciences and illumina MiScq sequencers /7 BMC Genomics. 2012. T. 13. № 1. C. 341.
3. С о wax A.E., Mexdes P., Blixov M.L. ModelBricks modules for reproducible modeling improving model annotation and provenance /7 npj Svst. Biol. Appl. 2019. T. 5. № 1.
4. Gilbert D. и др. Towards dynamic genome-scale models // Brief. Bioinform. 2019. T. 20. № 4. C. 1167-1180.
5. Karr J. R. и др. A Whole-Cell Computational Model Predicts Phenotvpe from Genotype // Cell. 2012. T. 150. № 2. C. 389-401.
6. Kim W. J., Kim H.U., Lee S.Y. Current state and applications of microbial genome-scale metabolic models // Curr. Opin. Svst. Biol. 2017. T. 2. C. 10-18.
7. Akb ERDIN I. R. и др. In Silico Cell: Challenges and Perspectives // Math. Biol. Bioinforma. 2013. T. 8. № 1.
8. Demin O., Goryanin I. Kinetic Modelling in Systems Biology. , 2008.
9. Hellerstein J.L. и др. Recent advances in biomedical simulations: a manifesto for model engineering // FlOOOResearch. 2019. T. 8. C. 261.
10. Ocone A., Millar A. J., Sanguinetti G. Hybrid regulatory models: a statistically tractable approach to model regulatory network dynamics // Bioinformatics. 2013. T. 29. № 7. C. 910-916.
11. Funahashi А. и др. CellDesigner 3.5: A Versatile Modeling Tool for Biochemical Networks // Proc. IEEE. 2008. T. 96. № 8. C. 1254-1265.
12. King Z. А. и др. BiGG Models: A platform for integrating, standardizing and sharing genome-scale models // Nucleic Acids Res. 2016. T. 44. № DI. C. D515-D522.
13. Lloyd C.M. и др. The CellML Model Repository // Bioinformatics. 2008. T. 24. № 18. c. 2122-2123.
14. Malik-Sheriff R. S. и др. BioModels—15 years of sharing computational models in life science // Nucleic Acids Res. 2019.
15. Henkel R., Wolkenhauer O., Waltemath D. Combining computational models, semantic annotations and simulation experiments in a graph database // Database. 2015. T. 2015. C. 1-16.
16. Kirk P.D.W., Babtie A.C., Stumpp M.P.H. Systems biology (un)certainties // Science (80-, ). 2015. T. 350. № 6259. C. 386-388.
17. Stanford N. J. и др. The evolution of standards and data management practices in systems biology // Mol. Svst. Biol. 2015. T. 11. № 12. C. 851-851.
18. Beal J. и др. Communicating Structure and Function in Synthetic Biology Diagrams // ACS Synth. Biol. 2019. T. 8. № 8. C. 1818-1825.
19. bruggeman F. J., Westerhopp H. V. The nature of systems biology // Trends Microbiol. 2007. T. 15. № 1. C. 45-50.
20. llkhoshvai v. а. и др. Generalized chemokinetic method for gene network simulation // Mol. Biol. 2001. T. 35. № 6. C. 919-925.
21. PALSSON B. The challenges of in silico biology Moving from a reductionist paradigm to one that views cells as systems will necessitate // 2000. T. 18. C. 1147-1150.
22. kljrata H. и др. BioFNet: Biological functional network database for analysis and synthesis of biological systems // Brief. Bioinform. 2013. T. 15. № 5. C. 699-709.
23. Pathep B.A. Молекулярно-генетическая система управления // Природа. 2001. Т. 3. С. 16-22.
24. Moodie S. и др. Systems Biology Graphical Notation: Process Description language Level 1 Version 1.3 // J. Integr. Bioinform. 2015. T. 12. № 2.
25. Norsigian С. J. и др. BiGG Models 2020: multi-strain genome-scale models and expansion across the phylogenetic tree // Nucleic Acids Res. 2019. T. 48. № Dl. C. D402-D406.
26. Zhang F. и др. Systems biology markup language (SBML) level 3 package: multistate, multicomponent and multicompartment species, version 1, release 2 //J. Integr. Bioinform. 2020. T. 17. № 2-3. C. 0-74.
27. ЛихошваЙ В. А. и др. Обобщенный химико-кинетический метод моделирования сложных биологических систем. Компьютерная модель онтогенеза бактериофага Lambda // Вычислительные технологии. 2000. Т. 5. № Специальный выпуск, посвященный 10-летней годовщине Лаборатории теоретической генетики Института цитологии и генетики СО РАН. С. 87-99.
28. Казанцев Ф.В., др. Система автоматизированной генерации математических моделей генных сетей // Информационный вестник ВОГИС. 2009. Т. 13. № 1. С. 163-169.
29. Акбердин И. Р. и др. «Электронная клетка»: проблемы и перспективы // Математическая биология и биоинформатика. 2013. Т. 8. № 1. С. 287-307.
30. жаботинский А. М. Концентрационные автоколебания., 1974. С. 1-179. М.: Наука.
31. Hucka М. и др. The Systems Biology Markup Language (SBML): Language Specification for Level 3 Version 1 Core // J. Integr. Bioinforma. 2015. T. 12. № 2. C. 382-549.
32. Lakhova T. N. и др. Algorithm for the Reconstruction of Mathematical Frame Models of Bacterial Transcription Regulation // Mathematics. 2022. T. 10. № 23. C. 4480.
33. Kanehisa M. Enzyme Annotation and Metabolic Reconstruction Using KEGG., 2017. C. 13534. McDonald A. G., Boyce S., Tipton K. F. ExplorEnz: the primary source of the IUBMB
enzyme list // Nucleic Acids Res. 2009. T. 37. № Database. C. D593-D597.
35. Wittig U. и др. SABIO-RK-database for biochemical reaction kinetics // Nucleic Acids Res. 2012. T. 40. № Dl. C. D790-D796.
36. Kazantsev F. V. и др. MAMMOTh: A new database for curated mathematical models of biomolecular systems // J. Bioinform. Comput. Biol. 2018. T. 16. № 01. C. 1740010 (16 pages).
37. Otasek D. и др. Cytoscape Automation: empowering workflow-based network analysis // Genome Biol. 2019. T. 20. № 1. C. 185.
38. Hoops S. и др. COPASI - a COmplex PAthway Simulator // Bioinformatics. 2006. T. 22. № 24. C. 3067-3074.
39. Cock P. J. А. и др. Biopython: freely available Python tools for computational molecular biology and bioinformatics // Bioinformatics. 2009. T. 25. № 11. C. 1422-1423.
Лашин Сергей Алексан- Окончил в 2003 г. ММФ НГУ. Специа-
дрович — канд. биол. наук, до- лист в области математического и компью-
цент, ведущ. науч. сотр. секто- терного моделирования биологических систем
ра биоинформатики и инфор- широкого круга — молекулярно-генетических,
мационных технологий в ге- популяционно-генетических, экологических,
нетике Института цитологии разработки биоинформатических методов, про-
и генетики СО РАН, E-mail: граммного обеспечения и баз данных. [email protected].
Graduated in 2003 from MMF NSU. Specialist in the field of mathematical and computer modeling of biological systems of wide range — molecular-genetic, population-genetic, ecological, development of bioinformatic methods, software and databases.
Казанцев Федор Владимирович, канд. биол. наук, старш. науч. сотр. сектора компьютерного анализа и моделирования биологических систем Института цитологии и генетики СО РАН, E-mail: kazfdrQ bionet.nsc.ru.
Области научных интересов: системная биология, биоинформатика в разделах математического и компьютерного моделирования генных, белковых, метаболических и сигнальных сетей. Участвовал в разработке серии предметно-ориентированных биологических интернет ресурсов и баз данных.
Research interests: systems biology, bioinformatics in the sections of mathematical and computer modeling of gene, protein, metabolic and signaling networks. Participated in the development of a series of subject-oriented biological Internet resources and databases.
Лахова Татьяна Николаевна — младш. науч. сотр. сектора биоинформатики и информационных технологий в генетике Института цитологии и генетики СО РАН, E-mail: [email protected].
В область научных интересов входят математическое моделирование биологических систем и анализ данных.
Research interests include mathematical modeling of biological systems and data analysis.
Матушкин Юрий Георгиевич — канд. биол. наук, доцент, старш. науч. сотр., зав. лабораторией молекулярно-генетических систем Института цитологии и генетики СО РАН, E-mail: mat@bionet .nsc . ru.
Специалист в области молекулярной эволюции и математического моделирования молекулярно-генетических систем.
Specialist in molecular evolution and mathematical modeling of molecular genetic systems.
Дата поступления — 02.11.2024