Научная статья на тему 'ТЕНДЕНЦИИ РАЗВИТИЯ, РИСКИ И ПЕРСПЕКТИВЫ БАЗ БОЛЬШИХ ДАННЫХ'

ТЕНДЕНЦИИ РАЗВИТИЯ, РИСКИ И ПЕРСПЕКТИВЫ БАЗ БОЛЬШИХ ДАННЫХ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
509
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Colloquium-journal
Область наук
Ключевые слова
большие данные / СУБД / перспективы развития баз больших данных. / big data / DBMS / prospects for the development of big data.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Плескач Валентина Леонидовна, Краснощок Виктор Николаевич, Криволапов Ярослав Владимирович, Скачек Людмила Николаевна

В статье приведены тенденции развития, риски и перспективы баз больших данных в современных условиях пандемии и постоянно увеличивающегося объема больших данных в условиях развития цифро-вого общества.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT TRENDS, RISKS AND PROSPECTS OF BIG DATABASES

The article shows the development of trends, risks and prospects of big data databases in the modern con-ditions of a pandemic and the constantly increasing big data volume and in the context of the digital society development.

Текст научной работы на тему «ТЕНДЕНЦИИ РАЗВИТИЯ, РИСКИ И ПЕРСПЕКТИВЫ БАЗ БОЛЬШИХ ДАННЫХ»

УДК 004.043

Плескач Валентина Леонидовна,

доктор экономических наук, профессор Киевского национального университета

имени Тараса Шевченко Краснощок Виктор Николаевич, канд.техн. наук, доцент Киевского национального университета

имени Тараса Шевченко Криволапов Ярослав Владимирович, ассистент Киевского национального университета имени Тараса Шевченко

Скачек Людмила Николаевна канд.техн. наук, доцент Национальной академии внутренних дел DOI: 10.24412/2520-6990-2022-1124-39-42 ТЕНДЕНЦИИ РАЗВИТИЯ, РИСКИ И ПЕРСПЕКТИВЫ БАЗ БОЛЬШИХ ДАННЫХ

Pleskach Valentyna Leonidovna,

Doctor of Economics, Professor, Taras Shevchenko National University of Kyiv Krasnoshtshok Viktor Nikolaevich, cand.tech.sci., associate professor Taras Shevchenko National University of Kyiv Krivolapov Yaroslav Vladimirovich, assistant at the Taras Shevchenko National University of Kyiv

Skachek Ludmila Nikolaevna

cand.tech.sci., associate professor of the National Academy of Internal Affairs

DEVELOPMENT TRENDS, RISKS AND PROSPECTS OF BIG DATABASES Аннотация.

В статье приведены тенденции развития, риски и перспективы баз больших данных в современных условиях пандемии и постоянно увеличивающегося объема больших данных в условиях развития цифрового общества.

Abstract.

The article shows the development of trends, risks and prospects of big data databases in the modern conditions of a pandemic and the constantly increasing big data volume and in the context of the digital society development.

Ключевые слова: большие данные, СУБД, перспективы развития баз больших данных. Keywords: big data, DBMS, prospects for the development of big data.

Большие данные (Big Data) - это огромные объемы структурированных и неструктурированных данных, а также методы, технологии и средства их сбора, хранения, обработки и анализа с целью получения скрытых закономерностей различной цифровой информации. Аналитики компании IBS «весь мировой объем больших данных» оценивают следующим образом: 2003 г. - 5 эксабайтов данных (1 ЭБ = 1 млрд гигабайтов), 2008 г. - 0,18 зеттабайта (1 ЗБ = 1024 эксабайта), 2015 г. - свыше 6,5 зеттабайтов, 2020 г. - 40-44 зеттабайта, в 2025 г. - этот объем будет увеличен еще в 10 и более раз.

Основными принципами работы с большими данными являются:

горизонтальная масштабируемость - основополагающий принцип обработки больших данных, так как необходимо увеличивать количество вычислительных узлов, по которым распределяются эти данные, причем обработка должна происходить без ухудшения производительности;

отказоустойчивость - принцип безотказной работы вычислительных узлов. Методы работы с

большими данными должны учитывать возможность таких ситуаций и предусматривать превентивные меры;

локальность данных: поскольку данные распределены по большому количеству вычислительных узлов, то они физически находятся на одном сервере, а обрабатываются на других серверах, затраты на передачу данных могут оказаться неоправданно большими, поэтому обработку больших данных обеспечивают на той же ЭВМ, где они хранятся.

В конце 2000-х, когда только появился термин Big Data, к базам больших данных относили СУБД NoSQL, MapReduce и средства Hadoop. В дальнейшем к технологиям больших данных стали относить другие решения, обеспечивающие такие же характеристики и возможности по обработке сверхбольших массивов данных, а также некоторые аппаратные средства.

В 2018 году объем глобального рынка Big Data и бизнес-аналитики достиг $ 168,8 млрд.

TECHNICAL SCIENCE / «ШЦУШШУМ-ЛШШаИ» 20222

40

В соответствии с оценкой IDC, по итогам 2019 года объем глобального рынка больших данных увеличился на 12 %, по сравнению с показателями предыдущего года, и достиг $189,1 млрд. После 2019 года рост рынка Big Data достиг 13,2 % среднегодового роста.

До 2025 года ResearchAndMarkets прогнозирует возможные темпы роста глобального рынка Big Data на уровне 19,7% ежегодно.

300 250 200 150 100 50 0

В 2015 году аналитическая компания Gartner удалила большие данные из своей диаграммы Gartner Hype Cycle, объяснив это решение тем, что эти технологии перестали быть «hype» и стали нормой для корпоративного IT: «сегодня все данные большие». Любая отрасль, которая по разным причинам развивается - формируется вместе с Big Data и является неотъемлемой частью рынка Big Data.

С марта 2020 года и по сегодня некоторые отрасли приостановили развитие: стадионы закрылись, фондовый рынок упал, производство многих товаров потребления сократилось, а международный туризм утратил темпы роста. Киберспорт оказался единственным спортом в мире, который не приостановил свою деятельность, а перешел в онлайн, в то время как остальные виды спорта ушли на перерыв. Как следствие Twitch и многие других

Вместе с тем, с учетом постоянно усложняющейся ситуации в мире с пандемией, и, как следствие, переходом различных видов деятельности человека в цифровую сферу, а также цифровиза-цией общества, темпы роста рынка Big Data могут оказаться гораздо больше. Динамику роста баз больших данных показано на рисунке 1.

контент-платформы установили ряд финансовых рекордов, потому что люди из-за изоляции люди больше проводили время в глобальной сети Интернет.

Компания Zoom, предлагающая коммуникационное программное обеспечение Zoom, которое объединяет видеоконференции, онлайн-встречи, чат и мобильную совместную работу, в начале 2017 г. была оценена в 1 $ млрд. В начале апреля 2020 г. количество ежедневных пользователей Zoom выросло до 200 млн человек, по сравнению с 10 млн в декабре 2019 г. К началу 2020 г/ компания была оценена в 16 $ миллиардов.

На сегодня рынок Big Data имеет неравномерные сегменты. Доля стран-лидеров в общем объеме рынка больших данных представлена на рисунке 2.

Динамика роста рынка больших данных, млрд долл.

2015 2016 2017 2018 2019 2022

годы

Рисунок 1 - Динамика роста баз больших данных, $ млрд

Доля стран-лидеров в общем объеме рынка больших

данных, %

Рисунок 2 - Доля стран-лидеров в общем объеме рынка больших данных, %

Сегодня Big Data является одним из драйверов развития информационной отрасли и одной из самых быстрых сфер информационных технологий. Технологии обработки Big Data широко используются в телекоммуникационной отрасли, инжиниринге, финансовой сфере, интернет-компаниями, электронном бизнесе. Также реализуются программы внедрения технологии в государственном секторе. Компании, наиболее быстро осваивающие технологии обработки данных, получают конкурентное преимущество в своем сегменте.

Сегодня к сети Интернет в мире подключено примерно 50 млрд. устройств, а объем генерируемых ими данных достигает 45 трлн. Гб, по мнению экспертов. Гигантские потоки этой информации используются в разных сегментах цифровой экономики.

Интернет генерирует петабайт данных каждую секунду. В сочетании с мощным анализом данных, Big Data предлагают перспективу значительного создания стоимости, социальных благ и повышения производительности труда.

Ведущие мировые IT-компании выделяют следующие факторы роста данных:

- слияние технологических разработок, в частности, увеличение повсеместного широкополосного доступа в Интернет;

- большое снижение стоимости доступа в Интернет;

- снижение затрат на хранение данных, что приводит к тому, что данные могут храниться в течение длительного времени;

- инструменты для обработки данных становятся все более мощными, сложными, повсеместными и недорогими, что позволяет легко найти и связать данные.

Облачные вычисления играют существенную роль в увеличении хранения данных и мощности

переработки. Программное обеспечение с открытым исходным кодом (OSS), охватывающее полный спектр решений, необходимых для больших объемов данных, включая хранение, обработки и аналитики, также внесли свой значительный вклад, чтобы сделать большие аналитические данные доступными для более широких слоев населения.

Дешевизна сбора и хранения больших данных компенсируется необходимостью привлекать профессиональных аналитиков.

Развитие Big Data позволяет наиболее полно учитывать все факторы и риски, влияющие на развитие конкретной компании. Более того, значительный массив информации дает возможность действовать на опережение - проанализировав множество факторов, опередив при этом конкурентов. Вопрос лишь в правильной трактовке, как скоро и верно можно превратить информационный хаос в ценный «информационный ресурс», выяснить, что дает использование этого инструмента экономике в целом. То есть анализ больших данных позволяет нам достичь:

- снижение финансовых рисков;

- увеличение гибкости;

- стремление к большей автоматизации;

- увеличение уровня удовлетворенности клиентов и т.д.

Неважно, что предлагают компании потребителю, качественные товары, услуги или цифровые товары - все это, как правило, должно искать отзыв. Компании получили возможность предвидеть желание предлагать продукт, который клиент подсознательно хочет купить.

Пример - торговая площадка Amazon или китайская версия Ali Express, анализируя просмотры, покупки, программа отслеживает закономерность и рекомендует то, что потенциально может заинтересовать покупателя, и, следовательно, уровень продаж благодаря такому инструменту значительно

42

TECHNICAL SCIENCE / «ШЦУШШУМ-ЛШШаИ» #W24), 2022

растет. Наибольшими проблемами Big Data являются:

- затраты на их обработку. Сюда можно включить как дорогостоящее оборудование, так и затраты на заработную плату квалифицированным специалистам, способным обслуживать огромные массивы информации;

- обилие входной и выходной информации. Если, например, исследование дает не 2-3, а большое количество результатов, то очень сложно остаться объективным и выделить из общего потока данных только те, которые повлияют на состояние любого явления;

- проблема конфиденциальности. В связи с тем, что большинство сервисов обслуживания клиентов переходят на онлайн использование данных, очень легко стать очередной мишенью для кибер-преступников. Даже хранение личной информации без любых интернет-транзакций может привести к нежелательным для клиентов облачных хранилищ последствиям;

- проблема потерь информации. Меры предосторожности требуют не ограничиваться одноразовым резервированием данных, а делать хотя бы 2-3 резервные копии хранилища. Однако с увеличением объема возрастают сложности с резервированием - и IT-специалисты пытаются найти оптимальное решение этой проблемы.

Внедрение технологии Big Data сопровождается рядом еще достаточно серьезных проблем. Одна из них - оценка эффективности проектов Big Data. Вообще выделяют два источника эффективности Big Data. Во-первых, они позволяют сократить затраты и время анализа и оперативно подготовить информацию для принятия решений. Во-вторых, применение Big Data обеспечивает сохранение индивидуализации и персонификации услуг на В2С (Business-to-consumer) цифровых рынках. Несмотря на это, рассчитать экономическую эффективность проектов, основанных на использовании технологии Big Data, довольно сложно.

Следующая проблема, возникающая при использовании такой технологии, связана с подготовкой специалистов, способных их применять. Такие специалисты, с одной стороны, должны иметь под-

УДК 629.7.036.22

готовку в области математической статистики, обработки и анализа данных, уметь работать с аппаратно-программными комплексами. Не считая того, они обязаны иметь навыки постановки маркетинговых задач. Они также должны знать методы, сценарии, алгоритмы маркетинговой деятельности, уметь формулировать требования к функциональным характеристикам аппаратно-программных комплексов и систем, реализующих технологии Big Data, обеспечивая создание конкурентных преимуществ сервисных предприятий.

Также технологии Big Data характеризуются высокой стоимостью и проблемой фильтрации обрабатываемых данных. То есть необходимо определить, какие данные необходимо добывать, хранить и анализировать, а какие информационный мусор.

И, наконец, еще одна проблема Big Data носит нравственный характер. То есть возникает вопрос: «Есть ли сбор данных нарушением приватных границ». В результате чего возникает необходимость в обеспечении безопасности хранения и использования данных.

Однако, несмотря на все сложности с использованием Big Data, бизнес ориентирован на рост вложений в это направление.

Таким образом, Big Data - это сфера технологий, которая получила распространение во многих областях бизнеса. Перспективы внедрения Big Data связаны с конкурентным преимуществом, которое получают компании в части повышения операционной эффективности бизнеса, привлечения дополнительного потока клиентов, минимизации рисков и внедрения технологий анализа и прогнозирования данных.

Список литературы

1. Кримшальний кодекс Украши // Законо-давство Укра1ни - 2015 - с.216.

2. РСТ-инвест [электронный ресурс] - Режим доступа. - URL: https:// http://www.rst-invent.ru/ (дата обращения: 10.05.2019)

3. ТЭМИКС [электронный ресурс] - Режим доступа. - URL: http:// http://temix.com.ua/ (дата обращения: 10.05.2019)

4. Foundations of Data Science (English Edition) Avrim Blum, John Hopcroft, Ravi Kannan. Cambridge University Press; 1st edition (January 23, 2020). 431 р.

Андреев О. В.,

к. техн. н., доцент, Загребельна Л. I.,

к. техн. н., доцент Укратська ¡нженерно-педагоггчна академ1я, Харюв

Кобець О. В., к. техн. н., доцент

Нацюнальний технгчний утверситет «Хартвський полгтехтчний

Iнститут»

РР!: 10.24412/2520-6990-2022-1124-42-48 ХАРАКТЕРИСТИКА ВЩЦЕНТРОВОГО НАСОСА З РЕГУЛЬОВАНОЮ ЧАСТОТОЮ

ОБЕРТАННЯ

i Надоели баннеры? Вы всегда можете отключить рекламу.