Научная статья на тему 'ПЛАТФОРМА УПРАВЛЕНИЯ ПАКЕТАМИ ПРИЛОЖЕНИЙ АНАЛИЗА ДАННЫХ С ОТКРЫТЫМ ИСХОДНЫМ КОДОМ'

ПЛАТФОРМА УПРАВЛЕНИЯ ПАКЕТАМИ ПРИЛОЖЕНИЙ АНАЛИЗА ДАННЫХ С ОТКРЫТЫМ ИСХОДНЫМ КОДОМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
исходный код / статистический анализ / язык программирования / дистрибутив / система / source code / statistical analysis / programming language / distribution / system

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ю.А. Савченко, Д.В. Тихоненко

В данной статье рассмотрена программа для статистического анализа – Anaconda, которая предоставляет все необходимое для решения задач по анализу и обработке данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ю.А. Савченко, Д.В. Тихоненко

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPEN SOURCE DATA ANALYTICS APPLICATION PACKAGE MANAGEMENT PLATFORM

This article discusses a program for statistical analysis Anaconda, which provides everything you need to solve problems in the analysis and processing of data and machine learning.

Текст научной работы на тему «ПЛАТФОРМА УПРАВЛЕНИЯ ПАКЕТАМИ ПРИЛОЖЕНИЙ АНАЛИЗА ДАННЫХ С ОТКРЫТЫМ ИСХОДНЫМ КОДОМ»

УДК 004.432.2

ПЛАТФОРМА УПРАВЛЕНИЯ ПАКЕТАМИ ПРИЛОЖЕНИЙ АНАЛИЗА ДАННЫХ

С ОТКРЫТЫМ ИСХОДНЫМ КОДОМ

Ю.А. Савченко Научный руководитель - Д.В. Тихоненко

Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева Российская Федерация 660037, г. Красноярск, просп. им. газеты «Красноярский рабочий», 31

E-mail: ula.savchenko13@gmail.com

В данной статье рассмотрена программа для статистического анализа - Anaconda, которая предоставляет все необходимое для решения задач по анализу и обработке данных.

Ключевые слова: исходный код, статистический анализ, язык программирования, дистрибутив, система.

OPEN SOURCE DATA ANALYTICS APPLICATION PACKAGE MANAGEMENT PLATFORM

Y.A. Savchenko Scientific supervisor - D.V. Tikhonenko

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation E-mail: ula.savchenko13@gmail.com

This article discusses a program for statistical analysis - Anaconda, which provides everything you need to solve problems in the analysis and processing of data and machine learning.

Keywords: source code, statistical analysis, programming language, distribution, system.

Развитие области анализа данных, которую в зарубежных странах называют data science, оказывает большое влияние на развитие современного общества. В частности, благодаря data science стало возможным резко продвинуть технологии искусственного интеллекта и внедрить их во многие сферы ежедневной рутины. Методы data science помогают коммерческим предприятиям принимать оптимальные стратегические решения, изучать сложные биологические структуры и получать новые знания, и многие другие сферы применения. Методы data science могут помогать в моделировании затрат или в исследованиях в области здравоохранения, а также могут помочь коммерческим предприятиям принимать оптимальные стратегические решения и отраслевой статистический.

Одной из программ для статистического анализа является система Anaconda от одноимённой компании, которая предназначена для управления приложениями анализа данных с открытым исходным кодом (для языков Python и R), основанных на моделях разворачивания проектов машинного обучения, предоставляя необходимую информацию для лиц, принимающих решения, а также на современных алгоритмах интеллектуального анализа данных и статистических методах анализа [2]. Эта платформа подходит как для студентов, так и для опытных специалистов. Она также подходит для коммерческих предприятий, которым необходимо обеспечить полный жизненный цикл машинного обучения и представляет из себя платформу для поддержки искусственного интеллекта.

Актуальные проблемы авиации и космонавтики - 2022. Том 2

Python — универсальный язык, его достаточно легко освоить и можно использовать с чем угодно. В частности, его можно использовать и для статистического анализа данных. В качестве примеров можно привести аналитику данных, машинное обучение, искусственный интеллект или веб-разработку. Для каждой из этих задач требуются разные пакеты и версии Python. Для эффективного использования этих пакетов и версий необходимо использовать виртуальную среду [3]. Это позволяет каждому проекту иметь свои собственные зависимости и позволяет легко переключаться между приложениями независимо от их зависимостей и требований. Однако у этой системы есть и ограничения - доступно только для пакетов Python.

Стандартный менеджер пакетов pip работает с Python и пренебрегает зависимостями из не-Python библиотек (HDF5, MKL, LLVM), в исходном коде которых отсутствует файл установщика [1]. Проще говоря, pip — это менеджер пакетов, который позволяет легко устанавливать, обновлять и удалять пакеты Python. Он работает в виртуальной среде Python.

Conda — это менеджер пакетов с открытым исходным кодом и система управления средой. Этот инструмент предназначен для управления и установки пакетов с гораздо большим количеством функций, чем pip. Conda может обрабатывать как сами пакеты Python, так и зависимости библиотек вне пакета Python. Это также менеджер пакетов для всего программного обеспечения (Windows, macOS и Linux) [3].

Conda написан на чистом Python, что упрощает использование в виртуальной среде Python. Conda также подходит для библиотек C, пакетов R, Java и других языков программирования.

Он устанавливает бинарные, двоичные, системы. Инструмент сборки conda build создает пакеты из исходного кода, тогда как установка conda install выполняет установку из пакетов сборки Conda [1].

Conda является менеджером пакетов и менеджером среды, включенных в Anaconda -дистрибутива Python, предоставляемого Continuum Analytics [2].

Anaconda упрощает управление пакетами и их развертывание. Эта платформа создает виртуальную среду, которая позволяет легко развернуть любой проект. Anaconda является альтернативой Python и предоставляет все необходимые пакеты одновременно, также она решает множество общих проблем как на начальном этапе, так и на протяжении всего процесса разработки. Так что, она удобнее для пользователей. В целом можно отметить, что Anaconda значительно упрощает задачи в области данных и машинного обучения.

Основная особенность дистрибутива — оригинальный менеджер разрешения зависимостей Conda с графическим интерфейсом Anaconda Navigator (см. рис. 1), что позволяет отказаться от стандартных менеджеров пакетов (таких, как pip для Python). Anaconda Navigator может искать пакеты в облаке Anaconda, устанавливать их в среде, запускать пакеты и обновлять их.

о

О ANACONDA NAVIGATOR

и

* о 9

Рис. 1. Графический интерфейс Anaconda Navigator

Anaconda скачивается один раз и всю последующую настройку, включая установку дополнительных модулей, можно производить в офлайн. Кроме того, обеспечивается возможность сохранять несколько изолированных сред с раздельным разрешением версионных зависимостей в каждой.

Но также хотелось бы отметить о недостатке этой системы - Anaconda «раздутая»: многие из пакетов никогда не используются, следовательно, установка займет несколько гигабайт дискового пространства.

Библиографические ссылки

1. Учебник по Python Anaconda - Начало Работы С Anaconda. [Электронный ресурс]. URL: h https://pythobyte.com/python-anaconda-tutorial-79f1c5c3/ (дата обращения 01.04.22)

2. Знакомство с Anaconda: что это такое и как установить [Электронный ресурс]. URL: https://medium.com/nuances-of-

programming/%D0%B7%D0%BD%D0%B0%D0%BA%D0%BE%D0%BC%D1%81%D1%82%D 0%B2%D0%BE-%D1%81-anaconda-%D1%87%D1%82%D0%BE-%D1%8D%D1%82%D0%BE-%D1%82%D0%B0%D0%BA%D0%BE%D0%B5-%D0%B8-%D0%BA%D0%B0%D0%BA-%D1%83%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%B8%D1%82%D1%8 C-2c19b3e8226 (дата обращения 01.04.22)

3. Начало работы с Anaconda на Python. [Электронный ресурс]. URL: https://3ty.ru/languages/python/nachalo-raboty-s-anaconda (дата обращения 01.04.22)

©Савченко Ю.А., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.