Научная статья на тему 'ДИЗАЙН НАИБОЛЕЕ СПЕЦИФИЧНЫХ ПРАЙМЕРОВ И ЗОНДОВ ДЛЯ ГЕНА GY1 У GLYCINE MAX (L.) MERR.'

ДИЗАЙН НАИБОЛЕЕ СПЕЦИФИЧНЫХ ПРАЙМЕРОВ И ЗОНДОВ ДЛЯ ГЕНА GY1 У GLYCINE MAX (L.) MERR. Текст научной статьи по специальности «Биологические науки»

CC BY
91
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Агронаука
Область наук
Ключевые слова
In silico / Glycine max / праймеры / ПЦР / глицинин / биоинформатика / in silico / Glycine max / primers / PCR / glycinin / bioinformatics

Аннотация научной статьи по биологическим наукам, автор научной работы — Андрей Андреевич Пензин, Павел Дмитриевич Тимкин

Соя является высоко востребованной культурой во многих странах мира. Одними из главных качеств сои, что обеспечивают столь большую популярность, являются её большую питательность, высокобелковость и возможность легкого адсорбирования белковой части при экстракции масла. Наиболее важными составляющими белковой фракции являются глицинин и β-конглицинин, которые являются основными представителями запасных белков культурной сои, общее количество которых может достигать 70%. Глицинины представляют большую ценность, обладая высокими питательными качествами, и представляют интерес как в использовании при составлении рационов сельскохозяйственных животных, так и при производстве продуктов питания для человека. Для определения наличия или отсутствия различных типов глицинина у сортов культурной сои может быть использован ПЦР-метод. Это наиболее распространенный метод используемый для анализа ДНК применяемый для множества различных целей таких как определение родства, выявление заболеваний, локализация и определение уровня экспрессии генов. Качество выполнения поставленных перед ПЦР задач зависит от множества факторов среди которых характеристика амплификатора, количество циклов ПЦР, качество ДНК-матрицы, но наибольшее влияние оказывают структура и специфичность праймеров. Исходя из этого было принято решение самостоятельного дизайна праймеров с использованием современного биоинформатического подхода. Для выполнения дизайна праймеров в первую очередь из открытой базы данных NCBI была взята последовательность гена GY1 кодирующего белок глицинин G1 у Glycin max. После чего используя алгоритм BLAST в QuantPrime была найдена мРНК транслирующаяся в нужный белок и на её основе в той же программе были составлены наиболее специфичные праймеры для проведения ПЦР в реальном времени. Программной были созданы 86 подходящих праймеров из которых средней специфичностью обладали 15, а в полном объёме удовлетворяющий критериям специфичности праймеров – 1. Как итог были получены наиболее подходящие праймеры для проведения ПЦР в реальном времени, что позволит не только определить длину полученной последовательности, но и определить количество полученных копий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Андрей Андреевич Пензин, Павел Дмитриевич Тимкин

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESIGN OF THE MOST SPECIFIC PRIMERS AND PROBES FOR THE GY1 GENE IN GLYCINE MAX (L.) MERR.

Soy is a highly demanded crop in many countries around the world. One of the main qualities of soybeans that provide such great popularity are its high nutritional value, high protein content and the ability to easily adsorb the protein part during oil extraction. The most important components of the protein fraction are glycinin and β-conglycinin, which are the main representatives of the storage proteins of cultivated soybeans, the total amount of which can reach 70%. Glycinins are of great value, having high nutritional qualities, and are of interest both in the preparation of diets for farm animals and in the production of food for humans. PCR can be used to determine the presence or absence of different types of glycinin in cultivated soybean varieties. It is the most common method used for DNA analysis and is used for many different purposes such as parentage, disease detection, localization, and gene expression levels. The quality of the tasks assigned to PCR depends on many factors, including the characteristics of the amplifier, the number of PCR cycles, the quality of the DNA template, but the structure and specificity of the primers have the greatest influence. Based on this, a decision was made to independently design primers using a modern bioinformatics approach. To perform the primer design, first of all, the sequence of the GY1 gene encoding the glycinin G1 protein from Glycin max was taken from the open NCBI database. After that, using the BLAST algorithm in QuantPrime, mRNA translating into the desired protein was found and, based on it, the most specific primers for real-time PCR were compiled in the same program. The software created 86 suitable primers, of which 15 had medium specificity, and 1 fully met the criteria for primer specificity. As a result, the most suitable primers for real-time PCR were obtained, which will allow not only to determine the length of the resulting sequence, but also to determine number of copies received.

Текст научной работы на тему «ДИЗАЙН НАИБОЛЕЕ СПЕЦИФИЧНЫХ ПРАЙМЕРОВ И ЗОНДОВ ДЛЯ ГЕНА GY1 У GLYCINE MAX (L.) MERR.»

Научная статья УДК 577.113.6

ДИЗАЙН НАИБОЛЕЕ СПЕЦИФИЧНЫХ ПРАЙМЕРОВ И ЗОНДОВ ДЛЯ ГЕНА GY1 У GLYCINE MAX (L.) MERR.

Андрей Андреевич Пензин, Павел Дмитриевич Тимкин

Всероссийский научно-исследовательский институт сои, г. Благовещенск, Россия, paa@vniisoi.ru

Аннотация. Соя является высоко востребованной культурой во многих странах мира. Одними из главных качеств сои, что обеспечивают столь большую популярность, являются её большую питательность, высокобелковость и возможность легкого адсорбирования белковой части при экстракции масла. Наиболее важными составляющими белковой фракции являются глицинин и р-конглицинин, которые являются основными представителями запасных белков культурной сои, общее количество которых может достигать 70%. Глицинины представляют большую ценность, обладая высокими питательными качествами, и представляют интерес как в использовании при составлении рационов сельскохозяйственных животных, так и при производстве продуктов питания для человека. Для определения наличия или отсутствия различных типов глицинина у сортов культурной сои может быть использован ПЦР-метод. Это наиболее распространенный метод используемый для анализа ДНК применяемый для множества различных целей таких как определение родства, выявление заболеваний, локализация и определение уровня экспрессии генов. Качество выполнения поставленных перед ПЦР задач зависит от множества факторов среди которых характеристика амплификатора, количество циклов ПЦР, качество ДНК-матрицы, но наибольшее влияние оказывают структура и специфичность праймеров. Исходя из этого было принято решение самостоятельного дизайна праймеров с использованием современного биоинформатического подхода. Для выполнения дизайна праймеров в первую очередь из открытой базы данных NCBI была взята последовательность гена GY1 кодирующего белок глицинин G1 у Glycin max. После чего используя алгоритм BLAST в QuantPrime была найдена мРНК транслирующаяся в нужный белок и на её основе в той же программе были составлены наиболее специфичные праймеры для проведения ПЦР в реальном времени. Программной были созданы 86 подходящих праймеров из которых средней специфичностью обладали 15, а в полном объёме удовлетворяющий критериям специфичности праймеров - 1. Как итог были получены наиболее подходящие праймеры для проведения ПЦР в реальном времени, что позволит не только определить длину полученной последовательности, но и определить количество полученных копий.

Ключевые слова: In silico, Glycine max, праймеры, ПЦР, глицинин, биоинформатика.

Для цитирования: Пензин А. А., Тимкин П. Д. Дизайн наиболее специфичных праймеров и зондов для гена GY1 у Glycine max (L.) Merr. // Агронаука. 2023. Том 1. № 1. C.85-89.

Original article

UDC 577.113.6

DESIGN OF THE MOST SPECIFIC PRIMERS AND PROBES FOR THE GY1 GENE IN GLYCINE MAX (L.) MERR.

Andrej A. Penzin, Pavel D. Timkin

All-Russian Scientific Research Institute of Soybean, Blagoveshchebsk, Russia, paa@vniisoi.ru

Abstract. Soy is a highly demanded crop in many countries around the world. One of the main qualities of soybeans that provide such great popularity are its high nutritional value, high protein content and the ability to easily adsorb the protein part during oil extraction. The most important components of the protein fraction are glycinin and p-conglycinin, which are the main representatives of the storage proteins of cultivated soybeans, the total amount of which can reach 70%. Glycinins are of great value, having high nutritional qualities, and are of interest both in the preparation of diets for farm animals and in the production of food for humans. PCR can be used to determine the presence or absence of different types of glycinin in cultivated soybean varieties. It is the most common method used for DNA analysis and is used for many different purposes such as parentage, disease detection, localization, and gene expression levels. The

© Пензин А.А., Тимкин П.Д., 2023

quality of the tasks assigned to PCR depends on many factors, including the characteristics of the amplifier, the number of PCR cycles, the quality of the DNA template, but the structure and specificity of the primers have the greatest influence. Based on this, a decision was made to independently design primers using a modern bioinformatics approach. To perform the primer design, first of all, the sequence of the GY1 gene encoding the glycinin G1 protein from Glycin max was taken from the open NCBI database. After that, using the BLAST algorithm in QuantPrime, mRNA translating into the desired protein was found and, based on it, the most specific primers for real-time PCR were compiled in the same program. The software created 86 suitable primers, of which 15 had medium specificity, and 1 fully met the criteria for primer specificity. As a result, the most suitable primers for real-time PCR were obtained, which will allow not only to determine the length of the resulting sequence, but also to determine number of copies received.

Keywords: in silico, Glycine max, primers, PCR, glycinin, bioinformatics.

For citation: Penzin A. A., Timkin P. D. Dizajn naibolee specifichnyh prajmerov i zondov dlya gena GY1 u Glycine max (L.) Merr. [Design of the most specific primers and probes for the GY1 gene in glycine max (L.) Merr.]. Agronauka. -Agroscience. 2023; 1; 1: 85-89. (in Russ.)

Введение

Высокие пищевые качества сои обуславливают её большое распространение и популярность. Из множества качеств сои особо ценится большое содержание белка в семенах. Ключевым компонентом пищевого качества является содержание запасных белков, чья биологическая роль заключается, в основном, в обеспечении семян сои азотом во время прорастания. Запасным принято считать такой белки, общее количество которого составляет более 5% от общего количества, помимо этого не обладающие ферментативной активностью [1].

Глицинины и (3-конглицинины являются наиболее ценными белками, поскольку лишены антипитательных свойств и обладают внушительным аминокислотным составом, что обуславливает высокую ценность как для производства продуктов питания, так и для кормопроизводства кормов в сельском хозяйстве [2, 3].

Для определения наличия и уровня экспрессии генов, отвечающих за кодирование глицинина определённого типа могут быть использованы специальные праймеры для ПЦР анализа.

ПЦР - один из самых распространенных методов анализа ДНК, позволяющий выполнять большой ряд задач, среди которых идентификация образцов, составление родословных, поиск точечных мутаций, определение уровня экспрессии генов. Среди факторов, влияющих на успешное проведение реакции можно особо выделить последовательность праймеров, поскольку именно от неё зависит специфичность амплификации [4].

Правильно подобранные праймеры должны обладать рядом качеств, что определяют их пригодность для проведения ПЦР анализов. Праймеры не должны быть ком-

плементарны другим участкам генома, кроме целевого, количество гуанина и цитозина не должно превышать 45-55%, поскольку может произойти дезаминирование и метилирование, что снижает специфичность реакции [5, 6].

Знания о наличии и уровне экспрессии генов, отвечающих за синтез глицининов могут стать подспорьем для селекционной работы при создании новых сортов исходя из чего перед нами стоит цель создания праймеров специфичных для гена GY1 у Glycine max.

Материалы и методы

Для выполнения поставленной задачи был осуществлен поиск нужной последовательности гена, что кодирует интересующий нас белок. Для этого была использована открытая база данных NCBI [7]. Далее используя алгоритм BLAST в веб сервисе QuantPrime [8], созданном для дизайна и проверки прайме-ров для ПЦР была найдена наиболее гомологичная мРНК транслирующаяся в интересующий нас белок глицинин G1. После чего на том же сервисе для неё были построены наиболее подходящие праймеры.

QuantPrime - это сервис проектирования пар праймеров, включающий в свою базу данных информацию о 295 различных видов эукариот. Позволяет создать наиболее подходящие пары праймеров для qPCR на основе SYBR Green, выдавая результаты, для которых длина ампликона 50-150 пар нукле-отидов с температурой отжига около 60оС. Особо строго идет отбор праймеров по количеству GрC островков. Наиболее неподходящие праймеры удаляются автоматически после нахождения участков схожих с искомым транскриптом. Инструменты QuantPrime также производят отбор для продуктов после процесса сплайсинга, что позволяет нацелиться на определённую мишень.

Специфичность праймеров оценивалась по следующим критериям:

1) высокая специфичность - гомологичны нужному транскрипту, не амплифицируют остальную часть ДНК, одиночные праймеры не расщепляются на другие мишени

2) средняя специфичность - один или оба праймера имеют дополнительные мишени.

3) низкая специфичность - склонны к деза-минированию и метилированию, один или оба праймера имеют дополнительные мишени.

Для проверки релевантности полученных праймеров на сервисе Uniprot [9] было проведено выравнивание нуклеотидных последова-

тельностей праймеров с мРНК.

Результаты и обсуждения

Взяв исходную последовательность гена, отвечающего за синтез глицининов из базы данных NCBI, а точнее последовательность пре-мРНК используя инструментарий QuantPrime была найдена мРНК NM_001248898.3(XM_003521244.1), отвечающая за синтез интересующего нас белка гли-цинина G1.

После чего в QuantPrime были спрогнозированы 86 возможных праймеров, из которых наибольшей специфичностью обладали 16 (таблица).

Таблица - Наиболее подходящие праймеры

№ Последовательность праймера Специфичность

1 F-CCTGACATCTACAACCCTCAAGCC Высокая

R-CGAACATTGCATTCTTGCGGAGAG

2 F-TTCGCCACAACATTGGCCAGAC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

3 F-GCCACAACATTGGCCAGACTTC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

4 F-GCCACAACATTGGCCAGACTTC Средняя

R-GAACATTGCATTCTTGCGGAGAG

5 F-GGATCTCTCCGCAAGAATGCAATG Средняя

R-TATGCTGTTCGCGTTCAGGTTG

6 F-GGATCTCTCCGCAAGAATGCAATG Средняя

R-ATTATGCTGTTCGCGTTCAGGTTG

7 F-GGATCTCTCCGCAAGAATGCAATG Средняя

R-TTATGCTGTTCGCGTTCAGGTTG

8 F-GGATCTCTCCGCAAGAATGCAATG Средняя

R-TCTCACCGTTGCAATTCACCAC

9 F-ACATTGGCCAGACTTCATCACCTG Средняя

R-CGAACATTGCATTCTTGCGGAGAG

10 F-GGATCTCTCCGCAAGAATGCAATG Средняя

R-GCGTATATTATGCTGTTCGCGTTC

11 F-TGGCCAGACTTCATCACCTGAC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

12 F-GGCCAGACTTCATCACCTGACATC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

13 F-TGGCCAGACTTCATCACCTGAC Средняя

R-GAACATTGCATTCTTGCGGAGAG

14 F-ATCTACAACCCTCAAGCCGGTAGC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

15 F-TCTACAACCCTCAAGCCGGTAG Средняя

R-CGAACATTGCATTCTTGCGGAGAG

16 F-TTGGCCAGACTTCATCACCTGAC Средняя

R-CGAACATTGCATTCTTGCGGAGAG

Среди 16 наиболее подходящих пар праймеров 1 пара обладала наибольшей специфичностью и отвечала всем требованиям. Для проверки релевантности полученных праймеров на сервисе Uniprot было проведено выравнивание прямого и обратного

праймеров с мРНК (рисунок 1). Для удобства визуализации выравнивания был построен праймер комплементарный обратному (цепочка сдаасайдсайсйдсддадад была заменена на ctctccgcaagaatgcaatgttcg).

Рисунок - Результаты множественного выравнивания наиболее специфичных праймеров с мРНК

По результатам выравнивания была подтверждена высокая комплементарность полученных праймеров. Помимо этого, расстояние между праймерами соответствовало указанной длине полученного ампликона и составило 121 пару нуклеотидов.

Заключение

Как итог были созданы праймеры для гена GY1 у Glycine max удовлетворяющие всем требованиям специфичности и с количеством GC не превышающего допу-

стимые значения. Наиболее удачная пара праймеров имела последовательность "CCTGACATCTACAACCCTCAAGCC" у прямого и "CGAACATTGCATTCTTGCGGAGAG" у обратного, получаемый ампликон имеет расчётную длину в 121 пару нуклеотидов, поиск дополнительных мишеней для данного праймера не дал результатов. Полученные праймеры могут помочь определить наличии гена GY1 в исследуемых образцах, а также уровень его экспрессии с использованием ПЦР реальном времени.

Список источников

1. Pingxu Qin, Taoran Wang, Yangchao Luo, A review on plant-based proteins from soybean: Health benefits and soy product development, Journal of Agriculture and Food Research, Volume 7, 2022. https:// doi.org/10.1016/jjafr.2021.100265.

2. Jason D. Gilman, Kristin D. Bilyeu, Genes and Alleles for Quality Traits on the Soybean Genetic/ Physical Map,Editor(s): Richard F. Wilson, Designing Soybeans for 21st Century Markets, AOCS Press, 2012, Pages 67-96, https://doi.org/10.1016/B978-0-9830791-0-1.50009-1.

3. Mohamed H. Abd El-Salam, Safinaz El-Shibiny, Natural biopolymers as nanocarriers for bioactive ingredients used in food industries, Editor(s): Alexandru Mihai Grumezescu, In Nanotechnology in the Agri-Food Industry, Encapsulations, Academic Press, 2016, Pages 793-829, https://doi.org/10.1016/B978-0-12-804307-3.00019-3 PCR past, present and future

4. Hanliang Zhu, Haoqing Zhang, Ying Xu, Sona Lassakova, Marie Korabecna, and Pavel Neuzil, PCR past, present and future, BioTechniques 2020 69:4, 317-325. https://doi.org/10.2144/btn-2020-0057

5. Qu, Wubin & Shen, Zhiyong & Zhao, Dongsheng & Yang, Yi & Zhang, Chenggang. (2008). MFEprimer: Multiple factor evaluation of the specificity of PCR primers. Bioinformatics (Oxford, England). 25. 276-8. 10.1093/bioinformatics/btn614.

6. Moulton, Matthew & Song, Hojun & Whiting, Michael. (2010). Assessing the effects of primer specificity on eliminating numt coamplification in DNA barcoding: A case study from Orthoptera (Arthropoda: Insecta). Molecular ecology resources. 10. 615-27. 10.1111/j.1755-0998.2009.02823.x.

7. National Center for Biotechnology Information [Электронный ресурс]. URL: https://www.ncbi.nlm. nih.gov/search/all/?term=WIN (02.12.2022).

8. Arvidsson, S., Kwasniewski, M., Riano-Pachon, D.M. et al. QuantPrime - a flexible tool for reliable

high-throughput primer design for quantitative PCR. BMC Bioinformatics 9, 465 (2008). https://doi. org/10.1186/1471-2105-9-465

9. Database of primary protein sequences [Электронный ресурс]. URL: https://www.uniprot.org -database of primary protein sequences (02.12.2022).

References

1. Pingxu Qin, Taoran Wang, Yangchao Luo, A review on plant-based proteins from soybean: Health benefits and soy product development, Journal of Agriculture and Food Research, Volume 7, 2022. https:// doi.org/10.1016/j.jafr.2021.100265.

2. Jason D. Gilman, Kristin D. Bilyeu, Genes and Alleles for Quality Traits on the Soybean Genetic/ Physical Map,Editor(s): Richard F. Wilson, Designing Soybeans for 21st Century Markets, AOCS Press, 2012, Pages 67-96, https://doi.org/10.1016/B978-0-9830791-0-1.50009-1.

3. Mohamed H. Abd El-Salam, Safinaz El-Shibiny, Natural biopolymers as nanocarriers for bioactive ingredients used in food industries, Editor(s): Alexandru Mihai Grumezescu, In Nanotechnology in the Agri-Food Industry, Encapsulations, Academic Press, 2016, Pages 793-829, https://doi.org/10.1016/B978-0-12-804307-3.00019-3 PCR past, present and future

4. Hanliang Zhu, Haoqing Zhang, Ying Xu, Sona Lassakova, Marie Korabecna, and Pavel Neuzil, PCR past, present and future, BioTechniques 2020 69:4, 317-325. https://doi.org/10.2144/btn-2020-0057

5. Qu, Wubin & Shen, Zhiyong & Zhao, Dongsheng & Yang, Yi & Zhang, Chenggang. (2008). MFEprimer: Multiple factor evaluation of the specificity of PCR primers. Bioinformatics (Oxford, England). 25. 276-8. 10.1093/bioinformatics/btn614.

6. Moulton, Matthew & Song, Hojun & Whiting, Michael. (2010). Assessing the effects of primer specificity on eliminating numt coamplification in DNA barcoding: A case study from Orthoptera (Arthropoda: Insecta). Molecular ecology resources. 10. 615-27. 10.1111/j.1755-0998.2009.02823.x.

7. National Center for Biotechnology Information [Электронный ресурс]. URL: https://www.ncbi.nlm. nih.gov/search/all/?term=WIN (02.12.2022).

8. Arvidsson, S., Kwasniewski, M., Riano-Pachon, D.M. et al. QuantPrime - a flexible tool for reliable high-throughput primer design for quantitative PCR. BMC Bioinformatics 9, 465 (2008). https://doi. org/10.1186/1471-2105-9-465

9. Database of primary protein sequences [Электронный ресурс]. URL: https://www.uniprot.org -database of primary protein sequences (02.12.2022).

Информация об авторах

А.А. Пензин - мл. науч. сотр. лаборатории биотехнологии;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П.Д. Тимкин - мл. науч. сотр. лаборатории биотехнологии

Information about the authors

Penzin A.A. - Junior Researcher, Laboratory of Biotechnology

Timkin P.D. - Junior Researcher, Laboratory of Biotechnology

Статья поступила в редакцию 31.01.2023; одобрена после рецензирования 28.02.2023; принята к публикации 15.03.2023

The article was submitted 31.01.2023; approved aftee reviewing 28.02.2023; accepted for publication 15.03.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.