Научная статья на тему 'КЛАССИФИКАЦИЯ DATA SCIENCE И СПОСОБЫ ПРИМЕНЕНИЯ'

КЛАССИФИКАЦИЯ DATA SCIENCE И СПОСОБЫ ПРИМЕНЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
112
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DATA SCIENCE / BIG DATE / DATA SCIENTIST

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузнецов А.А., Толоконцева А.С.

В данной статье рассмотрены классификации data science и способы применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA SCIENCE CLASSIFICATION AND APPLICATIONS

This article discusses data classifications and uses.

Текст научной работы на тему «КЛАССИФИКАЦИЯ DATA SCIENCE И СПОСОБЫ ПРИМЕНЕНИЯ»

МАТЕМАТИКА, ИНФОРМАТИКА, ИНЖЕНЕРИЯ

УДК 004.491.22

Кузнецов А. А. студент 2 курса факультет «Отделение магистратуры» ФГБОУ ВО «Поволжский государственный университет

телекоммуникаций и информатики»

Россия, г. Самара Толоконцева А. С. студент 2 курса факультет «Отделение магистратуры» ФГБОУ ВО «Поволжский государственный университет

телекоммуникаций и информатики»

Россия, г. Самара

КЛАССИФИКАЦИЯ DATA SCIENCE И СПОСОБЫ ПРИМЕНЕНИЯ

Аннотация: В данной статье рассмотрены классификации data science и способы применения.

Ключевые слова: data science, big date, data scientist

Kuznetsov A.A. student 2 year Faculty of Department of magistracy «Povolzhskiy State University of Telecommunications and Informatics»

Russia, Samara Tolokontseva A.S. student 2 year Faculty of Department of magistracy «Povolzhskiy State University of Telecommunications and Informatics»

Russia, Samara

DATA SCIENCE CLASSIFICATION AND APPLICATIONS

Summary: This article discusses data classifications and uses. Keywords: data science, big date, data scientist

Наука о данных или Data Science - это наука об изучении научных данных. В 2002 году Комитет по данным для науки и техники (CODATA) выпустил Научный журнал данных. CODATA рассматривает науку о данных как методы и технологии, используемые для проведения научных исследований путем управления научными данными и их использования.

По мере того, как научные данные становятся все более доступными, наука о данных используется для более точной описания ресурсоемкого характера современной науки и техники. Например, исследователи из NuMedii, Inc., крупной компании по сбору данных в Силиконовой долине, предсказали, можно ли использовать существующие лекарства для лечения рака яичников, изучив данные по экспрессии генов из более чем 2500 образцов опухолей яичников. В качестве еще одного примера можно привести математиков из Гарвардского университета в Эйдене и Мишельскую историю Америки, использующих Ngrams на Google. Они использовали Ngrams для поиска частоты использования двух фраз:" United States are " и " United States is ". Результаты поиска показали, что до гражданской войны в Америке эти две фразы использовались примерно с одинаковой частотой, но после гражданской войны, последняя стала намного более распространенной, чем первая. С этой точки зрения данные в основном относятся к данным, полученным и использованным в научных исследованиях. Это подчеркивает, что наука о данных - это управление, обработка и использование научных данных в поддержку научных исследований, т.е. общеизвестных в настоящее время научных исследований, требующих больших объемов данных, или четвертой парадигмы научных исследований.

Наука о данных - это наука об изучении бизнес-данных. В 2010 году Loukides обсудил вопрос о том, что такое наука о данных, утверждая, что наука о данных должна позволять создавать информационные продукты, а не работать как простое приложение с данными. В 2013 г., отметил Provost и др., "извлечение знаний из данных для решения бизнес-задач" является одной из фундаментальных концепций data science. Обеспечение поддержки исследований методологии BI составляет существенную часть работы выполненных многими учеными на данным. Для этого значительная часть практикующих специалистов по БИ была преобразована в специалистов по данным. Amazon, Google, LinkedIn, Facebook и другие интернет-компании открыли вакансии для специалистов по данным и создали команды по сбору данных. Эти специалисты изучают и анализируют бизнес данные для предоставления услуг по принятию управленческих решений. Например, Amazon использует совместную фильтрацию для получения высококачественных рекомендаций по продуктам, а Facebook использует функцию "Люди, которых вы можете знать" для рекомендации дружеских связей. С этой точки зрения, получение знаний из деловых данных для принятия решений является одним из аспектов науки о данных. По этой причине многих ученых БИ также называют специалистами в области данных. Однако, по сравнению с вопросами БИ, наука о данных больше фокусируется на общих вопросах при анализе различных бизнес-данных, на вопросах методологии бизнес-аналитики.

Использованные источники:

1. Наука о данных, Википедия [Электронный ресурс] — режим доступа: https://ra.wikipedia.org/wiki/Наука_о_данных (дата обращения: 20.08.2020);

i Надоели баннеры? Вы всегда можете отключить рекламу.