УДК 004.432.2
ПЛАТФОРМА УПРАВЛЕНИЯ ПАКЕТАМИ ПРИЛОЖЕНИЙ АНАЛИЗА ДАННЫХ
С ОТКРЫТЫМ ИСХОДНЫМ КОДОМ
Ю.А. Савченко Научный руководитель - Д.В. Тихоненко
Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева Российская Федерация 660037, г. Красноярск, просп. им. газеты «Красноярский рабочий», 31
E-mail: ula.savchenko13@gmail.com
В данной статье рассмотрена программа для статистического анализа - Anaconda, которая предоставляет все необходимое для решения задач по анализу и обработке данных.
Ключевые слова: исходный код, статистический анализ, язык программирования, дистрибутив, система.
OPEN SOURCE DATA ANALYTICS APPLICATION PACKAGE MANAGEMENT PLATFORM
Y.A. Savchenko Scientific supervisor - D.V. Tikhonenko
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation E-mail: ula.savchenko13@gmail.com
This article discusses a program for statistical analysis - Anaconda, which provides everything you need to solve problems in the analysis and processing of data and machine learning.
Keywords: source code, statistical analysis, programming language, distribution, system.
Развитие области анализа данных, которую в зарубежных странах называют data science, оказывает большое влияние на развитие современного общества. В частности, благодаря data science стало возможным резко продвинуть технологии искусственного интеллекта и внедрить их во многие сферы ежедневной рутины. Методы data science помогают коммерческим предприятиям принимать оптимальные стратегические решения, изучать сложные биологические структуры и получать новые знания, и многие другие сферы применения. Методы data science могут помогать в моделировании затрат или в исследованиях в области здравоохранения, а также могут помочь коммерческим предприятиям принимать оптимальные стратегические решения и отраслевой статистический.
Одной из программ для статистического анализа является система Anaconda от одноимённой компании, которая предназначена для управления приложениями анализа данных с открытым исходным кодом (для языков Python и R), основанных на моделях разворачивания проектов машинного обучения, предоставляя необходимую информацию для лиц, принимающих решения, а также на современных алгоритмах интеллектуального анализа данных и статистических методах анализа [2]. Эта платформа подходит как для студентов, так и для опытных специалистов. Она также подходит для коммерческих предприятий, которым необходимо обеспечить полный жизненный цикл машинного обучения и представляет из себя платформу для поддержки искусственного интеллекта.
Актуальные проблемы авиации и космонавтики - 2022. Том 2
Python — универсальный язык, его достаточно легко освоить и можно использовать с чем угодно. В частности, его можно использовать и для статистического анализа данных. В качестве примеров можно привести аналитику данных, машинное обучение, искусственный интеллект или веб-разработку. Для каждой из этих задач требуются разные пакеты и версии Python. Для эффективного использования этих пакетов и версий необходимо использовать виртуальную среду [3]. Это позволяет каждому проекту иметь свои собственные зависимости и позволяет легко переключаться между приложениями независимо от их зависимостей и требований. Однако у этой системы есть и ограничения - доступно только для пакетов Python.
Стандартный менеджер пакетов pip работает с Python и пренебрегает зависимостями из не-Python библиотек (HDF5, MKL, LLVM), в исходном коде которых отсутствует файл установщика [1]. Проще говоря, pip — это менеджер пакетов, который позволяет легко устанавливать, обновлять и удалять пакеты Python. Он работает в виртуальной среде Python.
Conda — это менеджер пакетов с открытым исходным кодом и система управления средой. Этот инструмент предназначен для управления и установки пакетов с гораздо большим количеством функций, чем pip. Conda может обрабатывать как сами пакеты Python, так и зависимости библиотек вне пакета Python. Это также менеджер пакетов для всего программного обеспечения (Windows, macOS и Linux) [3].
Conda написан на чистом Python, что упрощает использование в виртуальной среде Python. Conda также подходит для библиотек C, пакетов R, Java и других языков программирования.
Он устанавливает бинарные, двоичные, системы. Инструмент сборки conda build создает пакеты из исходного кода, тогда как установка conda install выполняет установку из пакетов сборки Conda [1].
Conda является менеджером пакетов и менеджером среды, включенных в Anaconda -дистрибутива Python, предоставляемого Continuum Analytics [2].
Anaconda упрощает управление пакетами и их развертывание. Эта платформа создает виртуальную среду, которая позволяет легко развернуть любой проект. Anaconda является альтернативой Python и предоставляет все необходимые пакеты одновременно, также она решает множество общих проблем как на начальном этапе, так и на протяжении всего процесса разработки. Так что, она удобнее для пользователей. В целом можно отметить, что Anaconda значительно упрощает задачи в области данных и машинного обучения.
Основная особенность дистрибутива — оригинальный менеджер разрешения зависимостей Conda с графическим интерфейсом Anaconda Navigator (см. рис. 1), что позволяет отказаться от стандартных менеджеров пакетов (таких, как pip для Python). Anaconda Navigator может искать пакеты в облаке Anaconda, устанавливать их в среде, запускать пакеты и обновлять их.
о
О ANACONDA NAVIGATOR
и
* о 9
Рис. 1. Графический интерфейс Anaconda Navigator
Anaconda скачивается один раз и всю последующую настройку, включая установку дополнительных модулей, можно производить в офлайн. Кроме того, обеспечивается возможность сохранять несколько изолированных сред с раздельным разрешением версионных зависимостей в каждой.
Но также хотелось бы отметить о недостатке этой системы - Anaconda «раздутая»: многие из пакетов никогда не используются, следовательно, установка займет несколько гигабайт дискового пространства.
Библиографические ссылки
1. Учебник по Python Anaconda - Начало Работы С Anaconda. [Электронный ресурс]. URL: h https://pythobyte.com/python-anaconda-tutorial-79f1c5c3/ (дата обращения 01.04.22)
2. Знакомство с Anaconda: что это такое и как установить [Электронный ресурс]. URL: https://medium.com/nuances-of-
programming/%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%BC%D1%81%D1%82%D 0%B2%D0%BE-%D1%81-anaconda-%D1%87%D1%82%D0%BE-%D1%8D%D1%82%D0%BE-%D1%82%D0%B0%D0%BA%D0%BE%D0%B5-%D0%B8-%D0%BA%D0%B0%D0%BA-%D1%83%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%B8%D1%82%D1%8 C-2c19b3e8226 (дата обращения 01.04.22)
3. Начало работы с Anaconda на Python. [Электронный ресурс]. URL: https://3ty.ru/languages/python/nachalo-raboty-s-anaconda (дата обращения 01.04.22)
©Савченко Ю.А., 2022