Научная статья на тему 'Формальный анализ строя локальной структуры нуклеотидных последовательностей'

Формальный анализ строя локальной структуры нуклеотидных последовательностей Текст научной статьи по специальности «Математика»

CC BY
190
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТРОЙ ЦЕПИ / НУКЛЕОТИДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / ХАРАКТЕРИСТИКИ СТРОЯ / ФУНКЦИИ ХАРАКТЕРИСТИК СТРОЯ / L-ГРАММЫ / ЛОКАЛЬНАЯ СТРУКТУРА НУКЛЕОТИДНОЙ ЦЕПИ / CHAIN''S ORDER / SEQUENCE / NUCLEOTIDE SEQUENCE / ORDER CHARACTERISTICS / FUNCTIONS OF ORDER CHARACTERISTICS / L-GRAMS / LOCAL STRUCTURE OF NUCLEOTIDE CHAIN

Аннотация научной статьи по математике, автор научной работы — Гуменюк Александр Степанович, Поздниченко Николай Николаевич, Шпынов Станислав Николаевич

Рассматриваются средства для анализа локальной структуры нуклеотидных последовательностей, которые в предыдущих публикациях использовались для оценки порядка расположения компонентов нуклеотидной цепи в целом. Определены функции некоторых характеристик строя и представлены соответствующие формулы для их вычисления. Рассмотрены возможности использования этих функций для описания и исследования локальной структуры нуклеотидных цепей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гуменюк Александр Степанович, Поздниченко Николай Николаевич, Шпынов Станислав Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Formal analysis of order in the local structure of the nucleotide sequences

The definition of the chain order and integral characteristics of the order, in particular, for nucleotide sequences were presented in the previous papers. These characteristics showed the high sensitivity to the arrangement of components. The possibility of comparison, classification and hashing based on the introduced formalisms and using characteristics to order have been considered. The approach developed by the authors allows displaying the local structure of sign sequences of arbitrary nature by numerical sequences that represent the arrangement of their components. The generally accepted method of studying large arrays of measurement data, linguistic texts, nucleotide sequences, and long sequences of another nature is the «window scan». This paper describes means for analysis of the local structure of complete full-length sequences based on the characteristics of the order of separate fragments (L-grams), named the functions of characteristics of order. The formulas for calculation of the values of these functions are of the following form: Ду = Xj^^y ^ij; %i+ij'' £ [5 * k,s * k + m ni fcik''l''S ) = ^^(о^Ду'' y=i ;=i f g(k''l''S)= fa(k'' l'' s)/ l, U n> /Д B(k''l,s)= |ППД'''' л) J =1 i=1 f r(k,l,s)=fb g(k''l''S)/f D(k''l''S) '' where x^ is a number of position of i-th occurrence of j-th element of alphabet on position of current fragment; k is a number of fragment; s is a step size (when s=1 fragments become L-grams); l is a window length; f G(kJ''S) is a depth function; f a(kJ''S) is an average remoteness function; f Ag(k, l,s) is an average geometric interval function; f r(k, l,s) is a regularity function; f D(k, l,s) is a descriptive information function. A larger window allows detecting fragments with similar order of greater length. Increasing the length of the fragments results in function values provides tending to a value of corresponding integral characteristic of the full length sequence. Reducing the length of the fragments allows using separate functions values for detection of more detailed features of the arrangement of components within the window. Preliminary studies showed that the relationship between the window length and the dispersion of the characteristic values is hyperbolic. However, if the window length is reduced to the cardinality of the alphabet (m = 4), this dependence is violated. Thus, as expected, the uncertainty of the location of the fragment is associated with the uncertainty of the function values obtained for a given window length. Selection of an optimal window length for various tasks, including, dependence on the cardinality of the alphabet of the original sequence, requires additional research. Software for calculating and displaying the functions of characteristics of order is developed and tested on ribosomal RNA of several organisms. Research revealed the influence of fragment (L-gram) length on the shape of functions of characteristics of order. The possibility of using the functions of the characteristics of order for finding similar or overlapping fragments in one or more sequences is considered, as well as the inverse problem finding of occurrences of the specified fragments in the complete genome sequence. Displaying the order of nucleotide sequences with functions, besides noted means also allows using the classical methods of mathematics, such as: mathematical analysis, spectral analysis, correlation analysis, etc., that would be impossible with the direct analysis of symbolic sequences themselves. It is noted that the graphical representation of functions of characteristics of order allows carrying expert analysis of long nucleotide sequences, including complete genome sequences.

Текст научной работы на тему «Формальный анализ строя локальной структуры нуклеотидных последовательностей»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2014 Управление, вычислительная техника и информатика № 4 (29)

УДК 004.8: 575

А.С. Гуменюк, Н.Н. Поздниченко, С.Н. Шпынов

ФОРМАЛЬНЫЙ АНАЛИЗ СТРОЯ ЛОКАЛЬНОЙ СТРУКТУРЫ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Рассматриваются средства для анализа локальной структуры нуклеотидных последовательностей, которые в предыдущих публикациях использовались для оценки порядка расположения компонентов нуклеотидной цепи в целом. Определены функции некоторых характеристик строя и представлены соответствующие формулы для их вычисления. Рассмотрены возможности использования этих функций для описания и исследования локальной структуры нуклеотидных цепей.

Ключевые слова: строй цепи; нуклеотидная последовательность; характеристики строя; функции характеристик строя; L-граммы; локальная структура нуклеотидной цепи.

В опубликованных ранее работах [1, 2] дано определение строя цепи [3] и представлены интегральные характеристики строя знаковых, в том числе нуклеотидных последовательностей, которые показали высокую чувствительность к расположению компонентов. На основе введенных формализмов были рассмотрены возможности сравнения, классификации, хеширования последовательностей с помощью характеристик строя.

Разрабатываемый авторами подход позволяет отображать локальную структуру знаковых цепей произвольной природы числовыми последовательностями, которые представляют расположение компонентов. Это, в свою очередь, открывает возможности для применения разнообразных математических методов анализа числовых массивов данных, которые без такого преобразования неприменимы непосредственно к символьным последовательностям.

Прежние публикации [4, 5] представляли средства и числовые характеристики для анализа строя целостных и полноразмерных нуклеотидных цепей, а также составных частей таких цепей. Приведем некоторые из этих характеристик:

где х - номер места на позиции рассматриваемой полноразмерной цепи; х7]- - номер места 7-го вхождения у-го элемента алфавита на позиции данной цепи; Ду - интервал от 7-го до (7 + 1)-го вхождения у-го символа; Пу - число вхождений у-го символа; п - длина цепи (число мест на её позиции); т - мощность алфавита рассматриваемой цепи (для нуклеотидной последовательности т = 4); О - глубина расположения компонентов в цепи; g - средняя удалённость компонентов в цепи; г - регулярность расположения компонентов в цепи (0 < г < 1); Дg - среднегеометрический интервал между любыми соседними одинаковыми символами; В - число описательных информаций, вычисляемое по формуле М. Мазу-

1. Интегральные характеристики строя цепи

(1) (2)

(3)

(4)

(5)

ра [6].

2. Функции характеристик строя цепи

Общепринятым методом исследования больших массивов данных измерений, лингвистических текстов, нуклеотидных последовательностей и длинных цепей другой природы является «просмотр окном» [7]. В настоящей работе представлены средства для анализа локальной структуры целостных полноразмерных последовательностей на основе характеристик строя отдельных, но связных фрагментов (Ь--грамм) и возможности их использования.

Для формального определения функции характеристики строя введем ряд понятий, часть из которых дана в рамках «алгебры ментальных событий» [8].

Место - элементарная ячейка, предназначенная для хранения одного компонента цепи. Позиция - это упорядоченное множество мест. Фрагмент - участок полной цепи. Окно - позиция фрагмента (участок позиции полной цепи). Размер окна - количество мест на позиции окна. Шаг - это смещение окна на позиции полной цепи, позволяющее выделить следующий фрагмент цепи. Размер шага -размер смещения окна, измеряемый числом мест. Функция характеристики строя цепи - это упорядоченное множество значений характеристик строя, вычисленных для всех фрагментов, последовательно взятых на позиции полной цепи. Отсчётное значение функции характеристики строя - это значение функции характеристики строя, вычисленное для отдельного фрагмента, задаваемого его номером, длиной и размером шага.

Ниже представлены формулы для вычисления отсчётных значений некоторых функций характеристик строя.

кц= Ъ+у-Ху; х1+1], х1] е[з*к,5*к + 1], (6)

ГсШ,*) = Е™!^0^-' (7)

Гд(к,1,з) = Гс(к,1,з)/1, (8)

= (9)

Мк, I, 5) = ГАд(к, I, 5)/Гв(к, I, 5) , (10)

где х7/ - номер места 7-го вхождения /-го элемента алфавита на позиции данного фрагмента; к - номер фрагмента; 5 - размер шага (при 5 = 1 фрагменты являются Ь-граммами); I - размер окна; /с(к, 1,я) -функция глубины; /д(к, 1,я) - функция средней удалённости; /&д(к, 1,я) - функция среднего геометрического интервала; (к, I, я) - функция регулярности; (к, I, я) - функция числа описательных инфор-маций.

Общее количество фрагментов при заданных длине цепи, шаге и размере фрагмента определяется

в виде

ктах = ]п/5-1 + *1 (11)

Заметим, что мощность алфавита данного фрагмента т может быть меньше мощности алфавита всей цепи (минимум 1, если фрагмент полностью заполнен одинаковыми компонентами). Аргументы функций (к,1,5) - натуральные числа. Таким образом, данные функции являются функциями дискретных аргументов. Зная все три параметра, можно посчитать отдельное значение такой функции. Также возможно вычислить многомерную функцию, изменяя не только номер фрагмента, но и два других параметра. Так как все функции характеристик строя не имеют обратных, задача восстановления значений аргументов по отдельному значению функции является поисковой и требует больших вычислительных ресурсов.

3. Свойства функций характеристик строя

На рис. 1 представлены графики функции удалённости 188 рибосомальной РНК организма Сг7-евШ1ш gr7seus (Хомячок китайский) (ОепБапк id DQ235090.1?from=11629&to=13499) [9], вычисленные с размером окна 100 (рис. 1, а) и 25 (рис. 1, Ь) и шагом 2. Сравнение графиков показывает, что при

уменьшении размера окна график функции характеристики оказывается всё менее «сглажен» и в нем проявляются всё большие колебания.

Локальные характеристики

.] -

О 100 200 300 400 500 600 7СО 800

Фрагменты цепочки

Локальные характеристики

О.Б

0 100 200 300 ¿00 500 600 700 800 900

^ фрагменты цепочки

Рис. 1. Графики функции удалённости: а - при длине фрагментов 100 нуклеотидов; b - при длине фрагментов 25 нуклеотидов

Больший размер окна позволяет обнаруживать схожие по строю фрагменты большей длины. В пределе, при увеличении размера фрагментов, значения функции стремятся к значению соответствующей интегральной характеристики строя полноразмерной цепи. При уменьшении длины фрагментов отдельные значения функции позволяют выявлять всё более тонкие особенности расположения компонентов в пределах окна фрагмента. Предварительные исследования показали, что зависимость между размером окна и разбросом характеристики имеет гиперболический характер. Однако если размер окна уменьшается до мощности алфавита (m = 4), данная зависимость нарушается. Таким образом, как и предполагалось, неопределённость расположения фрагмента связана с неопределённостью значений функции, получаемых при заданном размере окна.

На рис. 2 представлены графики функции удалённости (рис. 2, а) и функции регулярности (рис. 2, b) той же нуклеотидной последовательности, что и на рис. 1, вычисленные с размером окна 50 и шагом 2. Из рисунка видно, что данные функции не являются функционально зависимыми и могут дополнять друг друга при комплексном описании локальной структуры нуклеотидных последовательностей.

0 9

О 100 200 300 400 500 600 700 800 SOO

\

Фрагменты цепочки

Локальные характеристики

0.45

о юо 200 300 400 500 600 700 800 900

О фрагменты цепочки

Рис. 2. Графики функций характеристик строя: а - функция удалённости; Ь - функция регулярности

Следует учитывать, что при увеличении длины шага уменьшается количество вычисляемых от-счётных значений, и для выявления совпадающих цепочек и фрагментов при таком разбиении требуется более сложная поисковая процедура, которая может потребовать дополнительных вычислительных ресурсов. Кроме того, при экспертном анализе сокращение количества отсчётных значений упрощает восприятие графического представления функций, вычисленных для длинных нуклеотидных последовательностей.

Дополнительных исследований требует выбор оптимального размера окна для решения различных задач, в том числе в зависимости от мощности алфавита исходной последовательности.

4. Применение функций характеристик строя для исследования нуклеотидных цепей

Ниже на представленных графиках видно, что особи одного вида (рис. 3) демонстрируют практически идентичную форму функции глубины /а. Виды одного класса (рис. 4) имеют схожую форму этой функции, виды разных классов (рис. 5, 6) - сильно отличающуюся форму данной функции.

45 О 100 200 300 -100 500 600 700 S00 900

Фрагменты цепочки

Рис. 3. Графики функции глубины 18S рибосомальных РНК двух особей одного вида (DQ235090.1, NR_045132.1)

Локальные характеристики цепочек

4S о чю гоо ас» «о sôo боо ?ôo soc 500

Рис. 4. Графики функции глубины 18S рибосомальных РНК двух видов, принадлежащих к разным отрядам одного класса (DQ235090.1, AJ311675.1)

Локальные характеристики цепочек

45 О Гоо ïoô S0Ô «О 500 600 700 всю SOO

Рис. 5. Графики функции глубины 18S рибосомальных РНК двух видов, принадлежащих к разным классам одного типа (AJ311672.1, DQ235090.1)

50 . —i— —i— ---------

О 100 ZOO 300 400 500 600 700 SOU

Фрагменты цепочки

Рис. 6. Графики функции глубины 18S рибосомальных РНК двух видов, принадлежащих к разным классам одного типа (AJ311672.1, EU637036.1)

Отметим, что значения интегральной характеристики этих же организмов G (таблица) соответствуют представленным графикам [4].

Значения интегральной характеристики исследуемых нуклеотидных последовательностей

№ пп Название организма G № пп Название организма G

1 Cricetulus griseus 2745,91 4 Erinaceus europaeus 2 671,10

2 Cricetulus griseus 2 2752,30 5 Kareius bicoloratus 2 722,66

3 Crocodylus niloticus 2625,63

Перечислим другие применения функций характеристик строя: выделение повторяющихся одинаковых или схожих фрагментов; выделение разных фрагментов с одинаковым или схожим строем; поиск границ генов, интронов и экзонов, «слов»; установление функционального назначения некодирую-щих последовательностей; сравнение последовательностей; более надёжное хеширование, чем на основе интегральных характеристик.

Заключение

Сформулировано понятие функции характеристики строя цепи. Заданы формулы для вычисления значений некоторых функций характеристик строя и продемонстрированы возможности использования таких функций для анализа локальной структуры нуклеотидных последовательностей. Разработаны программные средства для вычисления и отображения функций характеристик строя [10]. Программные средства апробированы при сравнении рибосомальных РНК нескольких организмов. По результатам исследований выявлено влияние длины фрагментов (Ь-грамм) на форму функций характеристик строя.

Отмечены возможности использования функций характеристик строя для поиска схожих или совпадающих фрагментов в рамках одной или нескольких генетических цепочек, а также решения обратной задачи - поиск мест вхождений заданного фрагмента на позиции полноразмерной цепи.

Отображение строя нуклеотидных последовательностей функциями, кроме отмеченных средств, позволяет применять также классические методы математики, а именно математический анализ, спектральный анализ, корреляционный анализ и т.п., что было бы невозможно при непосредственном анализе самих знаковых последовательностей. Отмечено, что графическое представление функций характеристик строя делает возможным экспертный анализ длинных нуклеотидных цепей.

ЛИТЕРАТУРА

1. Гуменюк А.С., Морозенко Е.В., Родионов И.Н. Формализация анализа строя знаковых цепей // Вестник Томского государ-

ственного университета. Управление, вычислительная техника и информатика. 2011. № 2(15). С. 15-23.

2. Gumenyuk A., Kostyshin A., Simonova S. An approach to the research of the structure of linguistic and musical texts // Glottometrics.

2002. No. 3. С. 61-69.

3. Гуменюк А.С. О средствах анализа взаимного расположения компонентов знаковой последовательности // Военная техника,

вооружение и технологии двойного применения : материалы III Междунар. технолог. конгр. Омск : ОмГТУ, 2005. Ч. 2. С. 48-52.

4. Гуменюк А.С., Поздниченко Н.Н., Шпынов С.Н., Родионов И.Н. О средствах формального анализа строя нуклеотидных це-

пей // Математическая биология и биоинформатика. 2013. Т. 8, № 1. С. 373-397. URL: http://www.matbio.org/arti-cle.php?journ_id=15&id=158

5. Гуменюк А. С., Поздниченко Н.Н. Анализ строя нуклеотидных последовательностей // Материалы Всероссийской конферен-

ции с международным участием «Знания - онтологии - теории» (ЗОНТ-2013) 8-10 октября 2013 года. Новосибирск, 2013. Т. 2. С. 58-68.

6. МазурМ. Качественная теория информации. М. : Мир, 1974. 240 с.

7. Садовский М.Г. Информационно-статистический анализ нуклеотидных последовательностей : дис. ... д-ра физ.-мат. наук.

Красноярск, 2004. 394 с.

8. Гуменюк А.С. О формализмах конструирования абстрактных объектов во внутреннем физическом пространстве информаци-

онной системы (Элементы алгебры ментальных событий) // Системный анализ в проектировании и управлении: труды X Междунар. науч.-практ. конф. СПб. : Изд-во Политех. ун.-та, 2006. Ч. 2. С. 172-181.

9. National Center for Biotechnology Information. URL: http://www.ncbi.nlm.nih.gov/nuccore/

10. Цымбал В.С., Поздниченко Н.Н. О разработке модуля для вычисления локальных характеристик строя нуклеотидных последовательностей // Материалы XII Всероссийской научно-практической конференции с международным участием «Информационные технологии и математическое моделирование (ИТММ-2013)». Томск : Изд-во Том. ун-та, 2013. С. 61-65.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ГуменюкА.С., канд. техн. наук, доцент. E-mail: gumas45@mail.ru Омский государственный технический университет Поздниченко Н.Н. E-mail: nick670@yandex.ru Омский государственный технический университет Шпынов С.Н., д-р мед. наук. E-mail: stan63@inbox.ru НИИЭМ им. Н.Ф. Гамалеи (г. Москва)

Поступила в редакцию 8 июня 2014 г.

Gumenyuk Alexander S., Pozdnichenko Nikolay N. (Omsk State Technical University, Russian Federation), Shpynov Stanislav N. (Gamaleya Institute of Epidemiology and Microbiology, Russian Federation). Formal analysis of order in the local structure of the nucleotide sequences.

Keywords: chain's order, sequence, nucleotide sequence, order characteristics, functions of order characteristics, L-grams, local structure of nucleotide chain.

The definition of the chain order and integral characteristics of the order, in particular, for nucleotide sequences were presented in the previous papers. These characteristics showed the high sensitivity to the arrangement of components. The possibility of comparison, classification and hashing based on the introduced formalisms and using characteristics to order have been considered. The approach developed by the authors allows displaying the local structure of sign sequences of arbitrary nature by numerical sequences that represent the arrangement of their components.

The generally accepted method of studying large arrays of measurement data, linguistic texts, nucleotide sequences, and long sequences of another nature is the «window scan». This paper describes means for analysis of the local structure of complete full-length sequences based on the characteristics of the order of separate fragments (L-grams), named the functions of characteristics of order. The formulas for calculation of the values of these functions are of the following form:

Ai}= xl+1J £ [5 * k,s * k + /],

m ni

fcik.l.s) = ^^io^Ay,

j=1 ;=i

fg(k,l,s)=fc(k'l's')/l,

, U ni

fAg(k,l,s)= innA''

4 '=1 1=1

fr(k'l'S)=fAa(k'l'S)/fD(k'l'S),

where x^ is a number of position of i-th occurrence of j-th element of alphabet on position of current fragment; k is a number of fragment; s is a step size (when s=1 fragments become L-grams); l is a window length; fG(k,1 ,s) is a depth function; f„(k,1 ,s) is an average

remoteness function; fAg(k, l,s) is an average geometric interval function; fr(k, l,s) is a regularity function; fD(k, l,s) is a descriptive information function.

A larger window allows detecting fragments with similar order of greater length. Increasing the length of the fragments results in function values provides tending to a value of corresponding integral characteristic of the full length sequence. Reducing the length of the fragments allows using separate functions values for detection of more detailed features of the arrangement of components within the window. Preliminary studies showed that the relationship between the window length and the dispersion of the characteristic values is hyperbolic. However, if the window length is reduced to the cardinality of the alphabet (m = 4), this dependence is violated. Thus, as expected, the uncertainty of the location of the fragment is associated with the uncertainty of the function values obtained for a given window length. Selection of an optimal window length for various tasks, including, dependence on the cardinality of the alphabet of the original sequence, requires additional research.

Software for calculating and displaying the functions of characteristics of order is developed and tested on ribosomal RNA of several organisms.

Research revealed the influence of fragment (L-gram) length on the shape of functions of characteristics of order. The possibility of using the functions of the characteristics of order for finding similar or overlapping fragments in one or more sequences is considered, as well as - the inverse problem - finding of occurrences of the specified fragments in the complete genome sequence. Displaying the order of nucleotide sequences with functions, besides noted means also allows using the classical methods of mathematics, such as: mathematical analysis, spectral analysis, correlation analysis, etc., that would be impossible with the direct analysis of symbolic sequences themselves. It is noted that the graphical representation of functions of characteristics of order allows carrying expert analysis of long nucleotide sequences, including complete genome sequences.

REFERENCES

1. Gumenyuk A.S., Morozenko E.V., Rodionov I.N. Formalization of analysis of order of sign chains. Vestnik Tomskogo gosudarst-

vennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science, 2011, no. 2(15), pp. 15-23. (In Russian).

2. Gumenyuk A., Kostyshin A., Simonova S. An approach to the research of the structure of linguistic and musical texts. Glottometrics,

2002, no. 3, pp. 61-69.

3. Gumenyuk A.S. [On the means of analysis of mutual arrangement of the components of the sign sequence]. Voennaya tekhnika, voor-

uzhenie i tekhnologii dvoynogo primeneniya : materialy III Mezhdunar. tekhnolog. Kongressa [Military equipment, arms and double purpose technologies. Procs. of the 3rd International Congress of Technology]. Omsk: OmSTU Publ., 2005, pt. 2, pp. 48-52. (In Russian).

4. Gumenyuk A.S., Pozdnichenko N.N., Shpynov S.N., Rodionov I.N. Formal Analysis of Structures of Nucleotide Chains. Ma-

tematicheskaya biologiya i bioinformatika - Mathematical Biology and Bioinformatics, 2013, vol. 8, no. 1, pp. 373-397. Available at: http://www.matbio. org/arti-cle. php?j ourn_id=15&id=158.

5. Gumenyuk A.S., Pozdnichenko N.N. [Analysis of order of the nucleotide sequences]. Materialy Vserossiyskoy konferentsii s mezhdu-

narodnym uchastiem "Znaniya - ontologii - teorii" (ZONT-2013) [The 4th All-Russian Conference "Knowledge - Ontology - Theory" (KONT-13).]. Novosibirsk, 2013, vol. 2, pp. 58-68. (In Russian).

6. Mazur M. Kachestvennaya teoriya informatsii [Qualitative information theory]. Moscow: Mir Publ., 1974. 240 p.

7. Sadovskiy M.G. Informatsionno-statisticheskiy analiz nukleotidnykh posledovatel'nostey: dis. d-ra fiz.-mat. nauk [Information and

statistical analysis of nucleotide sequences. Physics and Mathematics Doc. Thesis]. Krasnoyarsk, 2004. 394 p.

8. Gumenyuk A.S. [On the formalism of constructing abstract objects in the inner physical space of information system (Elements of the

algebra of mental events)]. Sistemnyy analiz v proektirovanii i upravlenii: trudy X Mezhdunar. nauch.-prakt. konf. [The system analysis in the design and management. Procs. of the 10th International Scientific and Practical Conference]. St. Petersburg: Polytechnic University Publ., 2006, pt. 2, pp. 172-181.

9. National Center for Biotechnology Information. Available at: http://www.ncbi.nlm.nih.gov/nuccore/

10. Tsymbal V.S., Pozdnichenko N.N. [About the development of the module for the calculation of local characteristics of order of the nucleotide sequences]. Materialy XII Vserossiyskoy nauchno-prakticheskoy konferentsii s mezhdunarodnym uchastiem "In-formatsionnye tekhnologii i matematicheskoe modelirovanie (ITMM-2013) " [Proc. of 12th All-Russian research conference "Information technologies and mathematical modeling" (ITMM-2013)]. Tomsk: Tomsk State University Publ., 2013, pp. 61-65.

i Надоели баннеры? Вы всегда можете отключить рекламу.