Научная статья на тему 'ПРОЕКТИРОВАНИЕ ЭЛЕКТРОННОЙ БАЗЫ ДАННЫХ ДЛЯ ЗООЛОГИЧЕСКОЙ КОЛЛЕКЦИИ РЕСПУБЛИКИ КАЗАХСТАН'

ПРОЕКТИРОВАНИЕ ЭЛЕКТРОННОЙ БАЗЫ ДАННЫХ ДЛЯ ЗООЛОГИЧЕСКОЙ КОЛЛЕКЦИИ РЕСПУБЛИКИ КАЗАХСТАН Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
111
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
базы данных / биологическая систематика / зоологическая коллекция / интерфейс / СУБД / MySQL / PhpMvAdmin / databases / biological taxonomy / zoological collection / interface / DBMS / MySQL / PhpMv Admin

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Калимолдаев Максат Нурадилович, Мазакова Айгерим Талгатовна, Ященко Роман Васильевич, Мазаков Талгат Жакупович, Абдилдаева А. А.

В последние годы исследования в области биологии и генетики привели к увеличению биологической информации, хранящейся в базах данных. Такое же увеличение объема информации произошло в области зоологии, но развитие баз данных в этой области не рассматривалось. В статье описана разработанная электронная база хранения зоологической коллекции Института зоологии Министерства образования и науки Республики Казахстан. Создание базы и банка данных по государственной научной зоологической коллекции позволит использовать ее в научных, образовательных и прикладных целях, которая будет использована для учета, контроля состояния и долговременного сохранения единой национальной зоологической коллекции и управления ценными зоологическими коллекционными материалами. Государственная зоологическая научная коллекция является важнейшим источником информации для различных направлений биологических исследований. Она является не только основой для проведения научных изысканий по систематике, молекулярной генетике животных, но и документальным подтверждением корректности выполненных фаунистических работ. При решении этой важной в теоретическом и практическом отношении проблемы особую актуальность приобретает инвентаризация образцов видового разнообразия. На основе MySQL разработана электронная база данных с удобным интерфейсом для ввода данных из государственной зоологической коллекции Республики Казахстан. Разработанная ЭБД включает информационно-поисковую систему и обеспечит дальнейшее формирование виртуальной научной зоологической коллекции. Электронная база данных предназначена для зоологов, а также для специалистов других профилей, нуждающихся в зоологической информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Калимолдаев Максат Нурадилович, Мазакова Айгерим Талгатовна, Ященко Роман Васильевич, Мазаков Талгат Жакупович, Абдилдаева А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ELECTRONIC DATABASE DESIGN FOR ZOOLOGICAL COLLECTION OF THE REPUBLIC OF KAZAKHSTAN

In recent years, research in biology and genetics has led to an increase in biological information stored in databases. The same increase in the amount of information occurred in the field of zoology, but the development of databases in this area was not considered. The article describes the developed electronic database for storing the information about zoological collection of the Institute of Zoology of the Ministry of Education and Science of the Republic of Kazakhstan. The creation of a database and a data bank for the state scientific zoological collection will allow it to be used for scientific, educational and applied purposes, which will be used for accounting, monitoring the status and long-term preservation of a single national zoological collection and managing valuable zoological collection materials. The State Zoological Scientific Collection is the most important source of information for various areas of biological research. It is not only the basis for conducting scientific research on svstematics, molecular genetics of animals, but also documentary confirmation of the correctness of the faunistic works performed. When solving this problem, which is important in theoretical and practical terms, an inventory of specimens of species diversity is of particular relevance. On the basis of MySQL, an electronic database has been developed with a convenient interface for entering data from the state zoological collection of the Republic of Kazakhstan. The developed EDB includes an information retrieval system and will ensure the further formation of a virtual scientific zoological collection. The electronic database is intended for zoologists, as well as for specialists of other profiles in need of zoological information.

Текст научной работы на тему «ПРОЕКТИРОВАНИЕ ЭЛЕКТРОННОЙ БАЗЫ ДАННЫХ ДЛЯ ЗООЛОГИЧЕСКОЙ КОЛЛЕКЦИИ РЕСПУБЛИКИ КАЗАХСТАН»

ELECTRONIC DATABASE DESIGN FOR ZOOLOGICAL COLLECTION OF THE REPUBLIC OF KAZAKHSTAN

M.N. Kalimoldayev*, A. T. Mazakova**, R. V. Yashchenko***, T.Zh. Mazakov**'*, A. A. Abdildayeva*

institute of Information and Computing Technologies, KN MES RK, **KazNU named after al-Farabi, ***Institute of Zoology, MES RK

DOI: 10.24412/2073-0667-2021-4-40-54

In recent years, research in biology and genetics has led to an increase in biological information stored in databases. The same increase in the amount of information occurred in the field of zoology, but the development of databases in this area was not considered. The article describes the developed electronic database for storing the information about zoological collection of the Institute of Zoology of the Ministry of Education and Science of the Republic of Kazakhstan.

The creation of a database and a data bank for the state scientific zoological collection will allow it to be used for scientific, educational and applied purposes, which will be used for accounting, monitoring the status and long-term preservation of a single national zoological collection and managing valuable zoological collection materials.

The State Zoological Scientific Collection is the most important source of information for various areas of biological research. It is not only the basis for conducting scientific research on svstematics, molecular genetics of animals, but also documentary confirmation of the correctness of the faunistic works performed. When solving this problem, which is important in theoretical and practical terms, an inventory of specimens of species diversity is of particular relevance.

On the basis of MySQL, an electronic database has been developed with a convenient interface for entering data from the state zoological collection of the Republic of Kazakhstan. The developed EDB includes an information retrieval system and will ensure the further formation of a virtual scientific zoological collection.

The electronic database is intended for zoologists, as well as for specialists of other profiles in need of zoological information.

Key words: databases, biological taxonomy, zoological collection, interface, DBMS, MySQL, PhpMv Admin.

References

1. Kashvap, H., et al. Big data analytics in bioin- formatics: A machine learning perspective. arXiv 1506.05101, 2015.

2. Turner, V., Gantz, J., and Minton, S. The digital universe of opportunities: Rich data and the increasing value of the internet of things. Tech. rep., 2014.

3. Ragunath, P. K., Venkatesan, P., and Ravimohan, R. New curriculum design model for bioinformatics postgraduate program using systems biology approach // Journal of Computer Science & Systems Biology. 2009. N 2. P. 300-305.

(cj) M.N. Kalimoldayev, A. T. Mazakova, R. V. Yashchenko, T.Zh. Mazakov, A. A. Abdildayeva, 2021

4. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2000. N 28. P. 15-18.

5. Burge, S. W., et al. Rfam 11.0: 10 years of RNA families // Nucleic Acids Research 41, Dl. 2012. 1)220 1)232.

6. Ponten, F., Schwenk, J. M., Asplund, A., and Edqvist, P.-H. D. The human protein atlas as a proteomic resource for biomarker discovery // Journal of Internal Medicine. 2011. 270, 5. P. 428-446.

7. de Lorenzo, V., et al. The power of synthetic biology for bioproduction, remediation and pollu tion control // KM BO reports. 2018. 19, 4. e45658.

8. Duigou, T., du Lac, M., Carbonell, P., and Faulon, J.-L. RetroRules: a database of reaction rules for engineering biology // Nucleic Acids Research 47, Dl. 2018. D1229-D1235.

9. Nielsen, J., and Keasling, J. D. Engineering cellular metabolism // Cell 164. 2016. P. 1185-1197.

10. Rose, P. W., et al. The rcsb protein data bank: redesigned web site and web services. Nucleic Acids Research 39. 2011. D392-D401.

11. Bourne, P. Will a biological database be deferent from a biological journal? // PLOS Computational Biology. 2005. 1, 3.

12. Singh, S., et al. Comparative modeling study of the 3-d structure of small delta anti-gen protein of hepatitis delta virus // Journal of Computer Science k, Systems Biology. 2010. 3. P. 1-4.

13. Hoskeri, J., Krishna, V., and Amruthavalli, C. Functional annotation of conserved hypothetical proteins in rickettsia massiliae mtu5 // Journal of Computer Science k, Systems Biology. 2010. 3. P. 50-52.

14. Altschul, S., Gish, W., Miller, W., et al. Basic Local Alignment Search Tool // Journal of Molecular Biology. 1990. 215. P. 403-410.

15. Benham, S., et al. Taxus baccata in Europe: Distribution, habitat, usage and threats. Publications Once of the EU: Luxembourg, 2016.

16. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2000. 28. P. 15-18.

17. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2014. 42. P. 7-32.

18. Dalmaris, E., et al. Dataset of targeted metabolite analysis for Five taxanes of hellenic taxus baccata 1 // Populations. 2020. Data 5, 1.

19. Birnev, E., and Clamp, M. Biological database design and implementation // Briefings in Bioinformatics. 2004. 5, 1. P. 31-38.

20. Bourne, P. Will a biological database be different from a biological journal // PLOS Computational Biology. 2005. 1, 3.

21. Bradley, A. R., Rose, A. S., Pavelka, A., et al. An efficient file format for the transmission, visualization, and analysis of macromolecular structures // PLOS Computational Biology. 2017. 13. P. 1-16.

22. Duggirala, S. Newsql databases and scalable in-memorv analytics. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., vol. 109 of Advances in Computers. Elsevier, 2018. P. 49.

23. Srinivasa, K., and Hirivannaiah, S. Comparative study of different in-memorv (no/new) SQL databases. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., vol. 109 of Advances in Computers. Elsevier. 2018. P. 133-156.

24. Raj, P. A detailed analysis of NoSQL and NEWTSQL databases for bigdata analytics and distributed computing. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., of Advances in Computers. Elsevier, Vol. 109. 2018. P. 1-48.

25. Microsoft. Microsoft SQL Server. 2017: (RTM) 14.0.1000.169 (X64) Aug 22 2017 17:04:49 Copyright (C) 2017 Microsoft Corporation Express Edition (64-bit) on Windows 10 Home 10.0 [X64] (Build 18362:).

ПРОЕКТИРОВАНИЕ ЭЛЕКТРОННОЙ БАЗЫ ДАННЫХ ДЛЯ ЗООЛОГИЧЕСКОЙ КОЛЛЕКЦИИ РЕСПУБЛИКИ

КАЗАХСТАН

М.Н. Калимолдаев*, Э. Т. Мазак,ова**5 Р. В. Ященко***, Т. Ж. Мазаков**'*, А.А. Абдилдаева*

*Институт информационных и вычислительных технологий КН МОН РК

**КазНУ имени аль-Фараби ***Институт зоологии Министерства образования и науки Республики Казахстан

УДК 598.2+591.9

DOI: 10.24412/2073-0667-2021-4-40-54

В последние годы исследования в области биологии и генетики привели к увеличению биологической информации, хранящейся в базах данных. Такое же увеличение объема информации произошло в области зоологии, но развитие баз данных в этой области не рассматривалось. В статье описана разработанная электронная база хранения зоологической коллекции Института зоологии Министерства образования и науки Республики Казахстан.

Создание базы и банка данных по государственной научной зоологической коллекции позволит использовать ее в научных, образовательных и прикладных целях, которая будет использована для учета, контроля состояния и долговременного сохранения единой национальной зоологической коллекции и управления ценными зоологическими коллекционными материалами. Государственная зоологическая научная коллекция является важнейшим источником информации для различных направлений биологических исследований. Она является не только основой для проведения научных изысканий по систематике, молекулярной генетике животных, но и документальным подтверждением корректности выполненных фаунистических работ. При решении этой важной в теоретическом и практическом отношении проблемы особую актуальность приобретает инвентаризация образцов видового разнообразия.

На основе MySQL разработана электронная база данных с удобным интерфейсом для ввода данных из государственной зоологической коллекции Республики Казахстан. Разработанная ЭБД включает информационно-поисковую систему и обеспечит дальнейшее формирование виртуальной научной зоологической коллекции.

Электронная база данных предназначена для зоологов, а также для специалистов других профилей, нуждающихся в зоологической информации.

Ключевые слова: базы данных, биологическая систематика, зоологическая коллекция, интерфейс, СУБД, MySQL, PhpMvAdmin.

Введение. На сегодняшний день существует множество программ, которые приводят к использованию простых баз данных, это dBase (1980-е годы), FoxPro (для DOS, Windows,

Работа выполнена за счет средств программно-целевого финансирования научных исследований на 2021-2022 годы по проекту ИРН OR11465437 „Разработка национального электронного банка данных по научной зоологической коллекции Республики Казахстан, обеспечивающего их эффективное использование в науке и образовании".

(с) М. Н. Калимолдаев, Э. Т. Мазакрва, Р. В. Ященко, Т. Ж. Мазаков, А. А. Абдилдаева, 2021

Таблица 1

Сводка баз данных нуклеотидных последовательностей

Базы данных URL Особенность

GenBank http://www.ncbi.nlm.nih.gov/ Архивная база данных генетических последовательностей NIH.

EMBL http://www.ebi.ac.uk/embl/ Архивная база данных генетических последовательностей EBI.

DDBJ http://www.ddbj.nig.ac.jp/ Архивная база данных генетических последовательностей NIG.

SGD http://www.yeastgenome.org/ Хранилище генома пекарских дрожжей и биологических данных.

EBI genomes http://www.ebi.ac.uk/genomes/ Он обеспечивает доступ и статистику для завершенных геномов.

Ensembl http://www.ensembl.org/ База данных, которая поддерживает автоматическое аннотирование выбранных геномов эукариот.

UniGene http://www.ncbi.nlm.nih.gov/ Каждый кластер унигенов содержит

sites/entrez?db=unigene последовательности, представляющие уникальный ген, а также связанную с ним информацию.

dbEST http://www.ncbi.nlm.nih.gov/ Подразделение GenBank, содержащее

dbEST/ данные последовательности тегов выражений.

1990-е годы), Microsoft Excel и Access для анализа биологических данных, В связи с постоянным добавлением большого количества новых данных в области биологии (зоология, ботаника, антропология, генетика, молекулярная биология), возникает необходимость создания электронных баз данных по зоологической коллекции. Данные, которыми могут заполняться базы данных, генерируются из различных источников (серверы, датчики, встроенные в телефоны, видеокамеры, МРТ-сканеры, приставки) [1, 2], Биоинформатика включает в себя три направления, которые фокусируются на хранении, организации и анализе огромного количества данных. Первое направление посвящено разработке новых алгоритмов и статистики, которые необходимы для улучшения отношений между членами больших наборов данных. Второе направлено на анализ и интерпретацию данных различных типов, а третье направление связано с разработкой и внедрением инструментов, обеспечивающих эффективный доступ и управление информацией в базе данных. Чтобы понять структуру баз данных зоологической коллекции, необходимо знать понятия реляционных баз данных и концепцию получения информации из цифровых библиотек,

В настоящее время существуют обширные базы данных (показаны в табл. 1-4), ориентированные на нуклеиновые кислоты [3], базы данных ДНК (GenBank) [4], EDA (RNAcentral) [5], белковые базы данных Proteins (PDB), Универсальный Белковый ресурс (UniProt), база данных Атласа белков человека [6], базы данных заболеваний, ориентированных на рак (Атлас генома рака (TCGA), Консорциум генома рака (ICGC) и базы данных для промышленной биоэкономии [7-9], Универсальный белковый ресурс включает в себя три базы данных-члена: базу знаний UniProt (UniProtKB), референеные кластеры UniProt (UniRef) и архив UniProt (UniPare) [10]. Содержимое баз данных включает табли-

Таблица 2

Сводка баз данных последовательностей белков

Базы данных URL Особенность

Swiss- Prot/TrEMBL http://www.expasy.org/ Описание функции белка, структуры

sprot/ его доменов, посттрансляционных мо-

дификаций и т.д.,

UniProt http://www.pir.uniprot.org/ Центральное хранилище для РШ,

Я\гЫ^Рго! и ТгЕМВЬ.

PIR http://pir.georgetown.edu/ Он стремится быть всеобъемлющим,

хорошо организованным, точным и по-

следовательно аннотированным.

Pfam pfam.Sanger.ac.uk/ База данных семейств белков, опреде-

ленных как домены.

Таблица 3

Краткое описание структурных баз данных

Базы данных

URL

Особенность

PDB

SCOP

САТН NDB

www.rcsb.org/pdb/

scop.mrc-lmb.cam.ac.uk/ scop/

www.cathdb.info

http://ndbserver.rutgers. edu/

Хранилище структур белка, предоставляющее инструменты для анализа этих структур.

Классификация ЗБ-структур белка в иерархической схеме структурных классов.

Иерархическая классификация доменной структуры белка. База данных, содержащая структурную информацию о нуклеиновых кислотах.

цы (частота, размер, код), текстовые описания, названия столбцов, атрибуты, сущности, классификации, формат данных. Таким образом, биологическая база данных формируется из набора структурированных биологических данных и собранных данных, организованных таким образом, чтобы обеспечить легкий доступ к получению, управлению и обновлению содержания [11, 12].

Наиболее часто используемой моделью управления данными является реляционная модель. Языком, подходящим для обработки больших объемов данных модели реляционной базы данных, является язык структурных запросов (SQL), включенный в такие программы как SQL Server Management Studio (SSMS) или M y SQL. В отличие от стандартных баз данных, SQL позволяет использовать реляционные базы данных с использованием языка баз данных, ориентированного на набор.

Создание базы данных по зоологической коллекции в Республике Казахстан является актуальной задачей в рамках Международных („Конвенция о биологическом разнообразии") и Национальных государственных стратегических и программных документов Республики Казахстан („Стратегия развития Республики Казахстан до 2050 года „Казахстан-2050", Гос. программа „Цифровой Казахстан" от 12 декабря 2017 года.№ 827, Гос. программа развития образования и науки Республики Казахстан на 2020-2025 гг., Послание Главы

Таблица 4

Сводка баз данных путей

Базы данных

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

URL

Особенность

KEGG

BioCyc

BRENDA ЕМР

BRITE

http://www.genome.j p/kegg/

http://www.biocyc.org/

http://www.brenda-enzymes.org/ http://emp.mcs.anl.gov/

http://www.genome.j p/kegg/ brite.html

Хранилище структур белка, предоставляющее инструменты для анализа этих структур.

Классификация ЗБ-структур белка в иерархической схеме структурных классов.

Иерархическая классификация доменной структуры белка. База данных ферментов и метаболических путей: общедоступный сервер.

Биомолекулярные связи в информации, передаче и выражении.

Результат

Рис. 1. Структура базы данных

государства „Третья модернизация Казахстана: глобальная конкурентоспособность" от 31 января 2017 года и др.) по сохранению биологического разнообразия и устойчивому развитию и рациональному использованию природных ресурсов. Кроме того, создание национальной зоологической коллекции обеспечит выполнение национального законодательства (Закон РК Об охране, воспроизводстве и использовании животного мира, Экологический кодекс Республики Казахстан) и повышает научно-технический потенциал государства и его мировой имидж за счет сохранения и развития зоологических коллекционных фондов.

Создание и разработка национальной электронной базы данных по зоологической научной коллекции Республики предполагает создание соответствующего веб-портала для публичного использования.

Код id int Коллекция collection list Принадлежность к организации affil list Номер помещения pos_room text Номер стелажа/ pos_shelving text Номер коробки/ кластера pos_box text Номер тары/банки text Серийный номер/ тип pos_tare_serial text Номер матрасика pos_matt text Номер препарата glass_prep text Номер тушки spec_numb text Номер образца coll_numb text Перемещ др. орг- text Форма хранения storage_type list Фиксирующее вещество fix_agent list образце spec_typ list

i 2 3 4 s 6 7 8 9 10 il 12 13 14 15 16

а

Палеонтологическая РГП на ПХВ «Институт зоологии» КН МОН РК

Рис. 2. Шаблон таблицы для заполнения

Разработанная зоологическая база данных используется для учета, контроля состояния и долговременного сохранения единой национальной зоологической коллекции и управления ценными зоологическими коллекционными материалами.

Разработанная база позволяет оценить современное состояние зоологических научных коллекций Казахстана, хранящихся, главным образом, в коллекционном фонде Института зоологии „Зоологическая коллекция", который составляет более 715 тыс. экз. позвоночных и беспозвоночных животных.

1. Существующие базы данных. Для наполнения базы данных по зоологической коллекции необходимо систематизировать информацию и разработать форматы ее хранения для оптимизации ее размещения и поиска с использованием надлежащих программных средств [14-16]. Существующие в настоящее время базы данных сосредоточены на хранении данных о белках и нуклеиновых кислотах |17, 18], ДНК [9], RDÀ [19]. Наши результаты представляют собой новый дизайн реляционной базы данных для области зоологии.

Рассмотрим выбранную модель данных по зоологической коллекции, необходимо получить все детали для ее эффективного решения.

Традиционные базы данных имеют данные в таблицах, хранящихся в полях для столбцов. Преимущество хранилища данных столбцов заключается в более быстрой обработке агрегационных запросов по сравнению с базами данных строк [22, 23]. Наши таблицы в базе данных также имеют данные, заполненные полями для отдельных столбцов. Мы разделили таблицы на частотные и кодовые таблицы, связанные с нами — первичный и внешний ключ, что также ускоряет запросы. Сходство типа данных в большинстве столбцов позволяет лучше сжимать данные при выполнении алгоритмов сжатия, что также ускоряет запросы [24], тем самым ускоряя анализ данных [8, 17]. Типичный тип данных, который является частью неструктурированных файлов, содержит вложенные записи, наборы, списки и варианты.

2. Предложенная структура базы данных.

2.1. Структура базы данных. Для хранения данных исследований разработана реляционная БД с использованием Microsoft SQL Server Management Studio (SSMS) [25]. Зоологическая база данных состоит из частотных таблиц, размерных таблиц и кодовых таблиц, соединенных с помощью первичного и внешнего ключа. Частотные таблицы заполняются данными в повторяющихся интервалах в зависимости от частоты сбора и содержат информацию о типах данных.

В таблице хранятся данные с видовыми характеристиками, относящимися к зоологическим коллекциям.

3 Zoology Файл Справка

Отделение

Орнитология

Ввод данных

Данные образца

Номер помещения:

Номер стелажа/шкафа:

Номер коробки/кластера:

Номер тары/банки:

Серийный номер/тип тары:

Номер матрасика:

Номер стекл. препарата:

Номер тушки:

Номер сбора/особи:

Перемещение в др. орг-ции:

Коллекция -

Принадлежность к организации -

Форма хранения: -

Фиксирующее вещество: -

Тип образца: -

Tun nfinns 1 ПА ППГ^ИП п V

Прикрепить фото: Прикрепить видео:

Обзор... Обзор...

Загрузить в БД

Рис. 3. Окно ввода данных

2.2. Тип базы данных. Тип данных был выбран на основе характера введенных данных. Числа имели числовой тип данных. Приведенный выше тип данных предназначен для следующих атрибутов ID, collection, affil, pos_room, pos_sholving, pos_box, pos_tare, pos_tare_serial, pos_matt, glass_prop, spoc_numb, coll_numb, transfer, storage_type, fix_agont, spec_typo, collotype, condition, handling. Текстовые строки переменной длины хранятся в виде данных тина nvarehar (максимальный размер 536 870 912 символов).

В phpMyAdmin была создана основная база проекта zoology, в которой были реализованы 5 таблиц: users, positions, fundament, departments, classes. В таблице users были созданы ноля: фамилия, имя и отчество пользователя, помер отдела, в котором пользователь работает, помер должности, которую он занимает, его логин и пароль дня дальнейшего входа в программу. Таблица positions храпит номера и названия должностей и их нрава па чтение, запись и изменение. Таблица departments содержит номера и название отделов, в котором работают пользователи. Это может быть сам администратор, руководство или лаборант. В таблице classes расположена основная описательная информация про образцы. Например, царство, вид, род, подвид и т. д. Таблица fundament является основной. В пей содержатся 63 параметра, среди которых есть помер образца, место его нахождения, в каком виде был найден и как хранится. Также в этой таблице есть ноля, которые содержат ссылки па фото и видео.

Рис. 4. Окно поиска информации

Создан пользовательский интерфейс дня заполнения, поиска, изменения информации, связанной с базой данных. Также есть возможность импортирования данных с Excel фай-

Внутренняя база данных зоологической коллекции содержит полный набор сведений но единицам хранения, а ее наполнение контролируется кураторами коллекций.

Дня разрешения доступа пользователей и разделения нрав доступа к различным функционалам системы в соответствии с пользовательскими полномочиями предусмотрена система, основанная на вводе логина и пароля (рис. 3). Для защиты от неправомерных действий пользователей в системе внедрена возможность ведения журнала пользовательских действий.

Система ввода данных обеспечивает возможность включения медиафайлов (изображения — фото животных), аудиофайлов (голоса птиц и т.н.) (рис. 3). При вводе данных максимально обеспечена возможность выбора информации из соответствующего списка, что обеспечивает корректность набора повторяющейся информации.

Дня оперативного поиска требуемой информации разработано соответствующее окно (рис. 4).

После нахождения, информация предоставляется в виде экранной формы (рис. 5).

На данное время в базе заполнено более 1000 записей, опытная эксплуатация показала верность принятых решений.

Заключение. На основе MySQL разработана электронная база данных с удобным интерфейсом дня ввода данных из государственной зоологической коллекции Республики Казахстан. Разработанная ЭБД включает информационно-поисковую систему и обеспечит дальнейшее формирование виртуальной научной зоологической коллекции.

Коллекция: Арахнологическая Тип образца: Образец Состояние: Хорошее Пол: Male Возраст: Subadult

Местонахождение: Южный Казахстан. Жамбылекая обл , Жуалынекий р-н (с. Бауыржан Момышулы)

Коллектор: Сальменовэ М.

Рис. 5. Экранная форма представления информации об экспонате

Электронная база данных предназначена дня зоологов, а также дня специалистов других профилей, нуждающихся в зоологической информации.

Разрабатываемая технология может быть использована (после соответствующей адаптации) дня более широкого применения, в частности, дня построения виртуального музея биологических экспонатов видов, распространенных па территории Казахстана.

Положительный экономический эффект заключается в том, что дня получения информации из зоологической коллекции не требуется дорогостоящая аппаратура. Социальный эффект выражается в широте доступности соответствующей информации из ЭБД.

Созданная база данных но зоологической коллекции позволит проводить количественный и качественный анализ таксономического разнообразия и мониторинг беспозвоночных и позвоночных животных Казахстана, а также проводить ревизию видовых определений коллекционных материалов па основе новейших научных достижений в современной зоологической систематике. На основе современного учета и анализа состояния коллекционных фондов можно осуществлять оценку достаточности этих фондов для отражения многообразия животного мира страны и уточнения видовых определений коллекционных материалов в соответствии с современными изменениями в систематике беспозвоночных и позвоночных животных.

Применение специализированных геоипформациоппых систем (ГПС) позволяет эффективным образом собирать, хранить, обрабатывать и распространять зоологическую информацию, что способствует качественно новому осмыслению эко.логических процессов. В то же время, возможности геоипформациоппых технологий в экологических процессах указывают па актуальность проведения исследований в области совершенствования методики создания и направлений применения подобных систем.

Список литературы

1. Kashvap, Н., et al. Big data analytics in bioin- formaties: A machine learning perspective. arXiv 1506.05101, 2015.

2. Turner, V., Gantz, .J., and Minton, S. The digital universe of opportunities: Rich data and the increasing value of the internet of things. Tech. rep., 2014.

3. Ragunath, P. K., Venkatesan, P., and Ravimohan, R. New curriculum design model for bioinformatics postgraduate program using systems biology approach // Journal of Computer Science & Systems Biology. 2009. N 2. P. 300-305.

4. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2000. N 28. P. 15-18.

5. Burge, S. W., et al. Rfam 11.0: 10 years of RNA families // Nucleic Acids Research 41, Dl. 2012. 1)220 1)232.

6. Ponten, F., Schwenk, J. M., Asplund, A., and Edqvist, P.-H. D. The human protein atlas as a proteomic resource for biomarker discovery // Journal of Internal Medicine. 2011. 270, 5. P. 428-446.

7. de Lorenzo, V., et al. The power of synthetic biology for bioproduction, remediation and pollu tion control // KM BO reports. 2018. 19, 4. e45658.

8. Duigou, T., du Lac, M., Carbonell, P., and Faulon, J.-L. RetroRules: a database of reaction rules for engineering biology // Nucleic Acids Research 47, Dl. 2018. 1)1229 1)1235.

9. Nielsen, J., and Keasling, J. D. Engineering cellular metabolism // Cell 164. 2016. P. 1185-1197.

10. Rose, P. W., et al. The rcsb protein data bank: redesigned web site and web services. Nucleic Acids Research 39. 2011. D392-D401.

11. Bourne, P. Will a biological database be deferent from a biological journal? // PLOS Computational Biology. 2005. 1, 3.

12. Singh, S., et al. Comparative modeling study of the 3-d structure of small delta anti-gen protein of hepatitis delta virus // Journal of Computer Science k, Systems Biology. 2010. 3. P. 1-4.

13. Hoskeri, J., Krishna, V., and Amruthavalli, C. Functional annotation of conserved hypothetical proteins in rickettsia massiliae mtu5 // Journal of Computer Science k, Systems Biology. 2010. 3. P. 50-52.

14. Altschul, S., Gish, W., Miller, W., et al. Basic Local Alignment Search Tool // Journal of Molecular Biology. 1990. 215. P. 403-410.

15. Benham, S., et al. Taxus baccata in Europe: Distribution, habitat, usage and threats. Publications Once of the EU: Luxembourg, 2016.

16. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2000. 28. P. 15-18.

17. Benson, D., Karsch-Mizrachi, I., Lipman, D., et al. GenBank // Nucleic Acids Res. 2014. 42. P. 7-32.

18. Dalmaris, E., et al. Dataset of targeted metabolite analysis for Five taxanes of hellenic taxus baccata 1 // Populations. 2020. Data 5, 1.

19. Birnev, E., and Clamp, M. Biological database design and implementation // Briefings in Bioinformatics. 2004. 5, 1. P. 31-38.

20. Bourne, P. Will a biological database be different from a biological journal // PLOS Computational Biology. 2005. 1, 3.

21. Bradley, A. R., Rose, A. S., Pavelka, A., et al. An efficient file format for the transmission, visualization, and analysis of macromolecular structures // PLOS Computational Biology. 2017. 13. P. 1-16.

22. Duggirala, S. Newsql databases and scalable in-memorv analytics. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., vol. 109 of Advances in Computers. Elsevier, 2018. P. 49.

23. Srinivasa, K., and Hirivannaiah, S. Comparative study of different in-memorv (no/new) SQL databases. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., vol. 109 of Advances in Computers. Elsevier. 2018. P. 133-156.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

24. Raj, P. A detailed analysis of NoSQL and NEWTSQL databases for bigdata analytics and distributed computing. In A Deep Dive into NoSQL Databases: The Use Cases and Applications //P. Raj and G. C. Deka, Eds., of Advances in Computers. Elsevier, Vol. 109. 2018. P. 1-48.

25. Microsoft. Microsoft SQL Server. 2017: (RTM) 14.0.1000.169 (X64) Aug 22 2017 17:04:49 Copyright (C) 2017 Microsoft Corporation Express Edition (64-bit) on Windows 10 Home 10.0 [X64] (Build 18362:).

Калимолдаев Максат Нурадилович академик

HAH РК, доктор физико-математических наук, профессор, советник генерального директора Института информационных и вычислительных МОН РК;

Калимолдаев М. Н. в 1975 1980 годы учился на факультете механики и прикладной математики КазГУ имени С. М. Кирова но специальности „Прикладная математика". С 1980 по 1982 1ч\ работал инженером лаборатории экономико-математических методов Института математики и механики АН КазССР. С 1982 г. начинает заниматься в области теории управления. С этого момента и но настоящее время жизнь и деятельность М. Н. Калимолдаева неразрывно связаны с КазНУ имени аль-Фараби. Здесь он прошел путь от старшего лаборанта, аспиранта, ассистента, старшего преподавателя, доцента кафедры теории управления до профессора кафедры информационных систем КазНУ имени аль-Фараби. Подготовил и успешно защитил кандидатскую диссертацию на тему „Исследование динамики многомерных фазовых си"

летних научных исследований М. И. Калимолдаева стала защита докторской диссертации на тему „Устойчивость и математическое моделирование нелинейных многомерных фазовых си"

тором более 250 научных работ, в том числе 12 монографий и 15 учебных пособий для вузов и абитуриентов, более 20 свидетельств о государственной регистрации объекта интеллектуальной собственности, 2 свидетельств о государственной регистрации нрав на объект авторского нрава. С 2012 г. М. Н. Калимолдаев являлся научным руководителем научно- исследовательских проектов.

М. N. Kalimoldaev studied at the Faculty of Mechanics and Applied Mathematics of S.M. Kirov Kazakh State University in 1975 1980 with a degree in applied mathematics. From

1980 to 1982 he worked as an engineer at the Laboratory of Economic and Mathematical Methods of the Institute of Mathematics and Mechanics of the Academy of Sciences of the Kazakh SSR. Since 1982, he has been studying in the field of management theory. From that moment to the present, the life and work of M. N. Kalimoldaev are inextricably linked with the al-Farabi KazNU. Here he worked his way up from senior laboratory assistant, graduate student, assistant, senior lecturer, associate professor of the Department of Management Theory to professor of the Department of Information Systems of Al-Farabi Kazakh National University. He prepared and successfully defended his PhD thesis on the topic „Study of dynamics of multidimensional phase systems" (1990). The logical conclusion of M. N. Kalimoldaev's long-term scientific research was the defense of his doctoral dissertation on

the topic „Stability and mathematical modeling

"

(2000). M. N. Kalimoldaev is the author of more than 250 scientific papers, including 12 monographs and 15 textbooks for universities and applicants, more than 20 certificates of state registration of an intellectual property object, 2 certificates of state registration of rights to an object of copyright. Since 2012 M. N. Kalimoldaev has been the scientific director of research projects.

Мазакова Айгерим Тал-гатовна докторант Казахского национального университета имени аль-Фараби, в 2019 году закончила бакалавриат по специальности „ Информационные системы" Казахского национального университета имени аль-Фараби, в 2021 году магистратуру по той же специальности. В настоящее время является докторантом 1 курса Казахского национального университета имени аль-Фараби.

Mazakova Aigerim Talgatovna, graduated in 2019 with a bachelor's degree in Information Systems from Al-Farabi Kazakh National

University, in 2021 with a master's degree in the same specialty. Currently, he is a lst-year doctoral student at Al-Farabi Kazakh National University.

Ященко Роман Васильевич — доктор биологических наук, генеральный директор Института зоологии МОН РК. В 1984 году окончил Казахский государственный университет (с отличием). В 1994 году получил ученую степень кандидата биологических наук по специальности „Энтомология", в 2009 году — доктора биологических наук по той же специальности. В 1984 году пришел на работу в Институт зоологии АН Казахской ССР (ныне Институт зоологии МОН РК). До 1989 года находился на должности лаборанта, с 1989 по 1995 годы — младш. науч. сотр., с 1995 по 2004 — старш. науч. сотр., с 2004 по 2009 — вед. науч. сотр., с 2009 по 2013 — главн. науч. сотр. В январе-августе 2013 года проработал генеральным директором Института зоологии и затем с декабря 2018 г. по настоящее время продолжил возглавлять этот научно-исследовательский институт. С 1997 года возглавляет научное общество „Тетис". С 2011 года возглавляет Казахстанский национальный комитет МАБ („Человек и биосфера") ЮНЕСКО и входит в состав Национальной комиссии РК по делам ЮНЕСКО и ИСЕСКО. С 2014 по 2016 годы был вице-президентом МАБ по Азиатско-Тихоокеанскому региону. С 2020 года является советником ЮНЕСКО по биосферным резерватом (регион Азии и Тихого океана). Является членом нескольких научных обществ: Американское энтомологическое общество (с 1997 года), Украинское энтомологическое общество (с 2003 года), Society for Conservation Biology (с 2003 года) и др.

Yaschenko, Roman Vasilyevich graduated from the Kazakh State University in 1984 (with honors). In 1994 he received the degree of

Candidate of Biological Sciences in the specialty "

Sciences in the same specialty.

In 1984, he joined the Institute of Zoology of the Academy of Sciences of the Kazakh SSR (now the Institute of Zoology of the Ministry

of Education and Science of the Republic of Kazakhstan). Until 1989, he was a laboratory assistant, from 1989 to 1995 — a junior researcher, from 1995 to 2004 — a senior researcher, from 2004 to 2009 — a leading researcher, from 2009 to 2013 — chief researcher. In January-August 2013, he worked as the Director General of the Institute of Zoology and then from December 2018 to the present, he continued to head this research institute.

Since 1997, he has been the head of the scientific society „Tethys". Since 2011, he has been

the head of the Kazakhstan National Committee of „"

and is a member of the National Commission of the Republic of Kazakhstan for UNESCO and ISESCO. From 2014 to 2016, he was the Vice President of the IAB for the Asia-Pacific region. Since 2020, he has been an adviser to UNESCO on the Biosphere Reserve (Asia and the Pacific region).

He is a member of several scientific societies: the American Entomological Society (since 1997), the Ukrainian Entomological Society (since 2003), the Society for Conservation Biology (since 2003), etc.

Мазаков Талгат Жаку-пони ч — доктор технических наук, профессор кафедры „Искусственный интеллект и Big "

дент факультета механики и прикладной математики Каз-

ГУ им. С. М. Кирова по специ-"

гг. — аспирант Института математики и механики АН КазССР. 1985-1988 гг. — младш. науч. сотр, науч. сотр. Института математики и механики АН КазССР. 1988-1997 гг. — ассистент, старший преподаватель, доцент, заведующий кафедрой КазНУ имени аль-Фараби. 19972013 — служба в КНБ РК (первый заместитель Академии КНБ РК, полковник). С 2014 — военный пенсионер КНБ РК, главн. Науч. сотр. Института информационных и вычислительных технологий, профессор КазНУ им.аль-Фараби (по совместительству). 1985 год — канд. физ.-мат. наук по специальности „дифференциаль-

Ш)

ОД

N

"

год доктор физ.-мат. наук но епециально-

стн „Математическое моделирование, чиелен-

"

нрофеееор но енециальноети „Информатика,

"

год член-корреенондент Национальной Инженерной Академии РК. 2006 год академик Международной Академии Информатизации. С 2005 года но 2010 год эксперт Комитета но надзору и аттестации научных кадров МОИ РК

в области „Математики, информатики и вычие-"

матичеекая теория управления, вычислительная математика, компьютерное моделирование, разработка аппаратно-программных комплексов и автоматизированных информационных аналитических систем. Подготовил одного доктора технических наук, пять кандидатов наук, трех PhD. Имеет 105 публикаций, 7 свидетельств о государственной регистрации права на объект авторского права.

Mazakov Talgat Zhakupovich, Ph.D., Professor. 1977 1982 student of the Faculty of Mechanics and Applied Mathematics of the Kirov Kazakh State University with a degree in applied mathematics. 1982 1985 - postgraduate student of the Institute of Mathematics and Mechanics of the Academy of Sciences of the Kazakh SSR. 1985 1988 MNS, NS of the Institute of Mathematics and Mechanics of the Academy of Sciences of the Kazakh SSR. 1988 1997 assistant, senior lecturer, associate Professor, head of the Department of Al-Farabi Kazakh National University. 1997 2013 service in the National Security Committee of the Republic of Kazakhstan (First Deputy of the Academy of the National Security Committee of the Republic of Kazakhstan, Colonel). Since 2014 military pensioner of the National Security Committee of the Republic of Kazakhstan, STS of the Institute of Information and Computing Technologies, Professor of Al-Farabi Kazakh National University (part-time). 1985 Candidate of Physical and Mathematical

Sciences, specialty „Differential equations and

"

Physical and Mathematical Sciences, specialty „Mathematical modeling, numerical methods and

"

specialty „computer science, computer engineering "

of the National Engineering Academy of the Republic of Kazakhstan. 2006 Academician of the International Academy of Informatization. From 2005 to 2010 expert of the Committee for Supervision and Certification of Scientific Personnel of the Ministry of Education and Science of the Republic of Kazakhstan in the field of

„Mathematics, computer science and computer "

theory of control, computational mathematics, computer modeling, development of hardware and software complexes and automated information analytical systems.

He has trained one Doctor of Technical Sciences, five Candidates of Sciences, three PhD doctors. He has 105 publications, 7 certificates of state registration of the right to an object of copyright.

А. А. Абдилдаева PhD,

етарш. науч. сотр. Института информационных и вычислительных технологий КН МОН РК. В 2002 году закончила Алматинекий государственный университет имени Абая но

специальности „Информатика и английский "

тики, в 2016 году защитила докторскую диссертацию на соискание степени доктор PhD. Трудовую деятельность начала с 2002 года в средней школе № 92. Работала преподавателем информатики в Республиканском медицинском колледже, старшим преподавателем кафедры „Информатика и прикладная матема-"

тра послевузовского образования „Гылым ор-"

тута информационных и вычислительных технологий КН МОИ РК, директором филиала

"

РГП на ПХВ Института информационных и вычислительных технологий i'. Hyp-Султан, деканом высшей школы информационных технологий и инженерии Международного универеите-

та Астана. Общий стаж научно-педагогической деятельности 14 лет.

Abdildayeva A. A. graduated from Almatv State University named after Abai in 2002 with a degree in Computer Science and English, qualification: teacher of computer science, in 2016 she defended her doctoral dissertation for the degree of Doctor PhD.She started her career in 2002 at secondary school No. 92. She worked as a computer science teacher at the Republican Medical College, senior lecturer at the Department of „Informatics and Applied Mathematics" of Abai

KazNPU, head of the Center for Postgraduate Education „Gylym Ordasv", senior researcher at

the „Institute of Information and Computing "

„"

of the RSE at the Institute of Information and Computing Technologies Nur-Sultan, Dean of the Higher School of Information Technology and Engineering of Astana International University. The total experience of scientific and pedagogical activity is 14 years.

Дата поступления — 19.10.2021

i Надоели баннеры? Вы всегда можете отключить рекламу.