Научная статья на тему 'ТЕХНОЛОГИИ «БОЛЬШИХ ДАННЫХ»: ВОЗМОЖНОСТИ И ПЕРСПЕКТИВЫ'

ТЕХНОЛОГИИ «БОЛЬШИХ ДАННЫХ»: ВОЗМОЖНОСТИ И ПЕРСПЕКТИВЫ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
172
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Большие данные / Интернет / 3V-концепция / типы данных / Интернет-исследования / безбарьерная среда.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гончарова И.В., Прончев Г.Б.

Статья посвящена проблемам, связанным с анализом и использованием «Больших данных» в практической деятельности человека. Рассматриваются источники и механизмы появления больших массивов данных. Даная классификация хранилищ «Больших данных». Анализируются принципы технологии больших данных и законодательство Российской Федерации в данной сфере. Приведены примеры использования и потенциальные возможности технологий «Больших данных» для решения конкретных социальных задач. Статья представляют интерес для специалистов, занимающихся проблемами развития Интернет-технологий и использования «Больших данных».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гончарова И.В., Прончев Г.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ТЕХНОЛОГИИ «БОЛЬШИХ ДАННЫХ»: ВОЗМОЖНОСТИ И ПЕРСПЕКТИВЫ»

DOI: 10.24412/2224-9133-2023-3-138-144 NIION: 2021-0079-3/23-160 MOSURED: 77/27-025-2023-03-160

ГОНЧАРОВА Инна Владимировна,

кандидат педагогических наук, доцент, доцент кафедры социальных технологий Московского государственного университета имени М.В. Ломоносова, e-mail: ig73@inbox.ru

ПРОНЧЕВ Геннадий Борисович,

кандидат физико-математических наук, доцент, старший научный сотрудник Института энергетических проблем химической физики им. В.Л. Тальрозе, ФИЦ Химической физики им. Н.Н. Семенова РАН, e-mail: pronchev@rambler.ru

ТЕХНОЛОГИИ «БОЛЬШИХ ДАННЫХ»: ВОЗМОЖНОСТИ И ПЕРСПЕКТИВЫ

Аннотация. Статья посвящена проблемам, связанным с анализом и использованием «Больших данных» в практической деятельности человека. Рассматриваются источники и механизмы появления больших массивов данных. Даная классификация хранилищ «Больших данных». Анализируются принципы технологии больших данных и законодательство Российской Федерации в данной сфере. Приведены примеры использования и потенциальные возможности технологий «Больших данных» для решения конкретных социальных задач. Статья представляют интерес для специалистов, занимающихся проблемами развития Интернет-технологий и использования «Больших данных».

Ключевые слова: Большие данные, Интернет, 3V-концепция, типы данных, Интернет-исследования, безбарьерная среда.

GONCHAROVA Inna Vladimirovna,

Candidate of Pedagogical Sciences, Associate Professor, Associate Professor of the Department of Social Technologies at Faculty of Sociology of Lomonosov Moscow State University,

Moscow, Russia

PRONCHEV Gennadi Borisovich,

Candidate of Physics and Mathematics, Associate Professor, Senior Researcher at the Talrose Institute of Energy Problems of Chemical Physics of the Semenov,Federal Research Center for Chemical Physics of the Russian Academy of Sciences,

Moscow, Russia

BIG DATA TECHNOLOGIES: OPPORTUNITIES AND PROSPECTS

Annotation. The article is devoted to the problems associated with the analysis and use of "Big Data" in human practice. The sources and mechanisms of the appearance of large data sets are considered. The classification of "Big Data" repositories is given. The principles of big data technology and the legislation of the Russian Federation in this area are analyzed. Examples of the use and potential possibilities of "Big Data" technologies for solving specific social problems are given. The article is of interest to specialists dealing with the development of Internet technologies and the use of "Big Data".

Key words: Big data, Internet, 3V concept, data types, Internet research, barrier-free environment.

Развитие компьютерных средств и информационно-коммуникационных технологий привело к масштабному росту цифровой информации, для хранения и обработки которой потребовались новые подходы и оборудование [7; 12]. С начала XXI века объемы циркулирующей

в компьютерных сетях информации возрастало огромными темпами [27] и за такими потоками информации был закреплен термин «Большие данные». «Большие данные - это наборы данных, размеры которых выходят за пределы возможностей по сбору, хранению, управлению и анализу,

присущих обычному программному обеспечению базы данных» [22]. Для того чтобы иметь представление об объеме существующих данных можно привести несколько интересных фактов:

каждые сутки через сеть ВКонтакте пользователи публикуют 15 млрд. сообщений и осуществляют 9 млрд. просмотров фрагментов информации [16];

СберБанк обрабатывает более 14 млрд. транзакций в год [14].

Сегодня мы можем оперировать объемами данных, превышающих сотни террабайт. Общий объем создаваемых, собираемых, копируемых и потребляемых данных во всем мире в 2020 г. достиг 64 зеттабайта. По прогнозам он будет быстро увеличиваться и в течение следующих пяти лет до 2025 г. объем глобальных данных вырастет до более чем 180 зеттабайт [28].

Источники появления больших данных весьма разнообразны [15] и если провести условное деление, то можно выделить три кластера:

1. данные, получаемые в результате цифровой деятельности человека;

2. данные, получаемые в результате работы машин;

3. данные, которые предоставляет природа.

Каждый из этих кластеров имеет спектр

своих источников, который постоянно обновляется и дополняется. К первой группе относятся Веб-данные, полученные из социальных сетей, покупки в интернет-магазинах, посещение пользователей и их перемещение внутри сайтов различной направленности: государственные службы, финансовые организации, медиа и другие. Помимо веб-данных сюда также относятся медицинские данные, данные о торгах фондовых бирж, данные из контакт-центров и другие. Ко второй группе относятся данные, полученные от промышленного оборудования и интеллектуальных информационных систем коммунальных предприятий, телеметрические данные самоидентификации мобильных устройств. К третьей группе относятся данные, полученные в результате наблюдения за изменениями, происходящими в природе, в первую очередь, это данные метеослужб.

Для характеристики больших данных используется З^концепция, представленная в 2001 г. компанией MetaGroup [20] и включающая 3 свойства: объем (англ. volume), разнообразие (англ. variety) и скорость (англ. velocity). Первоначально объем данных рассматривался вне контекста технологий больших данных, и относился к данным, с которыми работа на обычном компьютере невозможна. Развитие средств и технологий позволяет в настоящее время собирать различные по структуре данные, не только текстовые, что приводит к постоянному увеличению объема,

и отражает вторую характеристику - разнообразие.

Все многообразие хранящихся данных можно разделить на три типа: структурированные, полуструктурированные и неструктурированные. К структурированному типу относятся данные, представляемые в строго определенном порядке (последовательность, формат). Например, реляционные базы данных. Полуструктурированные данные не подчиняются строгим пра-вилаи по последовательности и формату, но имеют логическую структуру. Для пользователя являются понятными, но неестественными для прочтения. В качестве примера можно привести информацию, размещенную в Веб-страницах. Технологии больших данных позволяют агрегировать и перерабатывать не только два первых типа, но и неструктурированные данные, которые не обладают четкой, заранее определенной моделью. К этому типу относятся аудио- и видео-информация и текстовые данные. Примерами могут служить PDF-файлы и мультимедийные Веб-ресурсы.

По мере развития технологий к первым трем свойствам З^концепции добавились значимость, достоверность и ценность данных. Значимость заключается в методах анализа и возможности применения для дальнейшего развития, при этом все большее значение уделяется достоверности полученных данных и пользе от накопленной информации. Ценность заключается в сортировке данных, пригодных для применения. При работе с большими данными возможно нивелирование информационного шума, составляющего в настоящее время до 80% накопленных данных. Однако, с развитием технологий, при обращении к необработанным большим данным в будущем позволит извлечь дополнительные данные, пропущенные при первоначальной обработке или пригодные для решения других задач [9].

При работе с большими данными используется процесс ETL, где extracted (англ.) - извлечение данных из накопленного объема, transformed (англ.) - конвертация данных путем соединения, комбинирования и применения соответствующего функционального аппарата, loaded (англ.) -импортирование данных в анализатор [21]. В качестве методов анализа используются смешение и интеграция данных. Реализация данного подхода осуществляется при помощи алгоритма параллельной обработки больших объемов информации - MapReduce [8]. Операция Map представляет собой один тот же вид работы по предварительной обработке или преобразованию данных, она выполняется на одном или нескольких узлах системы, затем подключается операция Reduce, которая консолидирует резуль-

таты предыдущей работы в единый набор результатов.

Базовым принципом технологии больших данных является горизонтальное масштабирование. Под масштабируемостью понимается возможность увеличения ресурсов для увеличения производительности системы. Масштабируемость делится на два вида: горизонтальная и вертикальная. При вертикальном масштабировании в существующее оборудование добавляются новые ресурсы или заменяются на более мощные, например замена процессора на более мощный. Такая процедура приводит к быстрой запол-няемости и ограниченности. При горизонтальном масштабировании добавляется новое оборудование и производится распараллеливание и равномерная нагрузка на весь аппаратный комплекс. Таким образом, производительность увеличивается за счет увеличения нового оборудования, количества серверов, которые взаимодействуют и синхронизируются [23].

Программное обеспечение, реализующее MapReduce, поддерживает автоматическое распараллеливание, в результате чего система самостоятельно разбивает входные данные на фрагменты и отправляет их на определенные узлы для исполнения задачи. Помимо этого, система контролирует сообщение между отдельными узлами и сообщает о наличии сбоев. Популярная реализация с открытым исходным кодом представлена экосистемой ApacheHadoop. Программная библиотека Apache Hadoop - Веб-ресурс, позволяющий распараллеливать обработку больших данных между различными кластерами компьютеров. Возможно масштабирование от одного сервера до нескольких тысяч, каждая из которых может реализовывать локальные вычисления и иметь собственные хранилища [18].

Веб-ресурс Hadoop имеет четыре основных модуля, выполняющих определенные функции для анализа больших данных. Первый модуль -распределённая файловая система Hadoop HDFS (англ. Hadoop Distributed File System), которая хранит данные в доступном формате на большом количестве связанных узлов хранения. Модуль YARN (англ. Yet Another Resource Negotiator) обеспечивает связанное управление ресурсами кластера, позволяет группировать узлы и отправлять задание в конкретную группу. Модуль MapReduce обеспечивает возможность параллельной обработки данных на основе YARN. Модуль Hadoop Common предоставляет общие утилиты, подходящие для различных операционных систем пользователя, и обеспечивающие чтение данных, хранящихся в файловой системе Hadoop.

Практически все крупные интернет-компании используют Hadoop при работе с большими данными. Например, СберБанк и Газпромнефть.

Аппаратное оборудование монтируется в Центре обработки данных. Внешне аппаратная выглядит как набор стеллажей (телекоммуникационных стоек), в которые компактно и безопасно крепятся серверы, маршрутизаторы, станции и другая ^-инфраструктура [4]. По объему стойки все разные, в дата-центрах Яндекса в одну стойку устанавливается до 80 серверов. По необходимости, допустим, при увеличении объема информации, стойки всегда можно добавить и поместить в них новое оборудование. Оборудование для больших данных весьма дорогостоящее, поэтому небольшие компании довольно часто арендуют телекоммуникационные стойки в Центрах обработки данных под свои нужды. Так ЦОД «Авантаж» от МТС имеет 6400 кв.м. площади машинных залов и предлагает 2240 стойко-мест для размещения в аренду [19].

Важным вопросом при работе с большими данными является соблюдение законодательства РФ о сборе, хранении и распространении полученной информации [17]. Так как информация и способы ее получения разнообразны, то в рамках правого регулирования применяются законы об информации, о персональных данных, об интеллектуальной собственности и иные нормативно-правовые акты, в зависимости от сферы данных.

Конституцией РФ определены основные положения об информации [1]:

- ч. 1 ст. 24 запрещает сбор, хранение, использование и распространение информации о частной жизни лица без его согласия;

- ч. 4 ст. 29 предоставляет каждому право свободно искать, получать, передавать, производить и распространять информацию любым законным способом;

- ст. 42 предоставляет каждому право на достоверную информацию об окружающей среде;

- п. и) ст. 71 в ведении Российской Федерации находятся информация, информационные технологии и связь.

На основании Конституции РФ принят ФЗ-149 «Об информации, информационных технологиях и о защите информации» [2]. Он регулирует отношения, возникающие при осуществлении права ч. 4 ст. 29 Конституции РФ, при сборе информации и применении информационных технологий, а также вопросы обеспечения защиты информации. Закон трактует информацию как «сведения (сообщения, данные) независимо от формы их представления». Так же там описано, что такое информационные технологии, информационная система, информационно-коммуникационная сеть. В законе изложены основные положения соблюдения информационной безопасности, в частности:

- недопустимость сбора, хранения, использования и распространения информации о частной жизни лица без его согласия (п. 7, ст. 3);

- обладатель информации обязан принимать меры по защите информации (п. 4, ст. 6);

- недопустимость преимуществ применения одних информационных технологий перед другими, если это не установлено другими положениями (п. 8, ст. 3).

Закон разрешает собирать и использовать общедоступную информацию, которая считается таковой в отсутствие установленных ограничений правообладателя. Ограничением, например, может послужить наличие статуса коммерческой тайны или же пользовательских соглашений, устанавливающих запрет на использование данных.

Основным правовым нормативом о защите персональных данных является ФЗ-152 «О персональных данных», регламентирующий ч. 1 ст. 24 Конституции РФ. Закон описывает такие понятия, как персональные данные, обработка, распространение, и предоставление персональных данных (статья 3). «Персональные данные- любая информация, относящаяся прямо или косвенно определенному или определяемому физическому лицу» [3]. Законом предусмотрено использование информации частного лица только с его письменного согласия. Довольно часто пользователи социальных сетей выкладывают персональные данные на своих страницах. Такая информация считается конфиденциальной и не подлежит сбору. В то же время, если человек намеренно раскрыл свои персональные данные, сделал их общедоступными, то запрета на использование такой информации нет. Во избежание нарушения нормативных положений возможна обработка полностью обезличенных данных, по которым невозможно идентифицировать личность человека.

Для реализации проектов, связанных с большими данными, в команде работают профессионалы разного профиля. Во-первых, в команде должен быть специалист, который генерирует главную идею проекта, строит гипотезу, описывает модель, объясняет почему использование больших данных необходимо для изучения и изменения этой модели. Построением прогностической модели занимается аналитик. От его умения использовать методы углубленной аналитики зависит общее представление о понимании и перспективе развития модели. В функции ^-администратора входит обеспечение 1Т- инфраструктуры, он решает вопросы бесперебойного программно-аппаратного обеспечения. В задачи программиста входит разработка и автоматизация программных средств обработки данных. Контролирует весь процесс руководитель про-

екта. В зависимости от широты и бюджета проекта в команду могут привлекаться и другие специалисты, например контроллеры и эксперты [11].

Использование технологий больших данных для решения социальных задач возможно в сочетании знаний социологии и IT-технологий, в команде специалистов-социологов и IT-техноло-гов при проведении социологических исследований, либо в применении междисциплинарного подхода в обучении студентов соответствующих профилей [6].

В настоящее время пока не разработана единая методология использования больших данных в социологии, однако, уже накоплен опыт использования многофункциональных систем автоматической обработки данных.

В работах, посвященных вопросам кибер-безопасности дистанционного обучения во время пандемии [13; 26] и коммуникации людей с ограниченными возможностями в социальных сетях [25] в качестве инструмента была выбран анализатор Popsters [24]. С его помощью был осуществлен сбор первичной информации общественного мнения, произведена оценка мнений аудитории и классификация полученных данных по различным метрикам для дальнейшего анализа.

Основными преимуществами платформы является простой и интуитивный интерфейс. Через поисковую строку можно выбрать социальную сеть и далее осуществить поиск либо по названию, либо по доменному адресу, либо по хэштегу. На платформе можно проводить одновременный анализ до 10 сообществ. В системе можно задать определенный интересующий период, либо анализировать за все время существования сообщества. После проведенной загрузки исследователю выдаются блоки сообществ по основным показателям стандартных характеристик: лайки, репосты, комментарии, количество опубликованных записей, просмотры, а также наборы собственных метрик Popsters, включающих средние показатели вовлеченности в сообщество, в пост, привлекательность, коммуникабельность, видимость и другие. Выходные данные выдаются в виде таблиц, а графические данные в интерактивном режиме. Помимо этого, анализатор позволяет выгрузить полученные данные в виде отчета в удобных пользователю форматах.

Для оценки возможностей россии ского банковского сектора в создании безбарьерной среды с помощью информационной системы Медиалогия [10] был проведен анализ средств массовой информации. Анализировались описанные в средствах массовой информации проблемы людей с ограниченными возможностями и их возможные решения, предлагаемые экосисте-

мой Сбер [5]. Результаты показали, что инструментарий Медиалогии, построенный на технологиях больших данных, достаточно успешно может быть использован при проведении автоматического контент-анализа.

В заключении можно констатировать, что интерес к большим данным начал проявляться с начала нулевых годов XXI века, когда была выделена определенная структура, даны характеристики, построена архитектура и стали понятны основные принципы работы. Актуальность в бизнес-среде объясняется преимуществом техноло-

гий, позволяющими использовать огромные накопленные объемы информации для выработки долгосрочных стратегий. В социологии в настоящее время пока не выработана единая методология использования больших данных, однако уже накоплена определенная база успешного применения таких технологий.

Работа выполнена в рамках Программы развития Междисциплинарной научно-образовательной школы Московского университета «Математические методы анализа сложных систем».

Список литературы:

[1] Конституция РФ [Электронный ресурс] / Государственная дума. - Режим доступа: URL: http: // duma.gov.ru/news/55446 (дата обращения: 15.01.2023)

[2] Федеральный закон от 27.07.2006 № 149-ФЗ «Об информации, информационных технологиях и о защите информации» [Электронный ресурс] / Президент России. - Режим доступа: URL: http: // www.kremlin.ru/acts/bank/24157/page/1 (дата обращения: 15.01.2023).

[3] Федеральный закон от 27.07.2006 № 152-ФЗ «О персональных данных» [Электронный ресурс] / Президент России. - Режим доступа: URL: http: // www.kremlin.ru/acts/bank/24154 (дата обращения: 15.01.2023).

[4] ГОСТ Р 58812-2020. Центры обработки данных. Инженерная инфраструктура. Операционная модель эксплуатации. Спецификация. - М.: Стандартимформ, 2020. - 36 с.

[5] Гончарова И.В. Устойчивое развитие государства и социальные технологии // Вопросы политологии. 2022. Т. 12. № 1(77). - С. 92-110.

[6] Гончарова И.В., Прончев Г.Б., Кричевер Е. И. Педагогическая траектория изучения технологий управления большими массивами данных / Современные тенденции развития системы образования: материалы Международной научно-практической конференции (Чебоксары, 27 марта 2018 г.). - Чебоксары: ИД Среда, 2018. - С. 31-33.

[7] Демидов О. Глобальное управление Интернетом и безопасность в сфере использования ИКТ: Ключевые вызовы для мирового сообщества. - М.: Альпина Паблишер, 2016. - 198 с.

[8] Дьюрнер Д. Большие данные - MapReduce без Hadoop с применением конвейера ASP.NET / Microsoft. [Электронный ресурс]. - Режим доступа: URL: https: // learn.microsoft.com/ru-ru/archive/msdn-magazine/2015/june/big-data-mapreduce-without-hadoop-using-the-asp-net-pipeline (дата обращения 15.01.2023).

[9] Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим. - М.: Манн, Иванов и Фербер, 2012. - 240 с.

[10] Медиалогия. Мониторинг соцсетей и СМИ. [Электронный ресурс]. - Режим доступа: URL: https: // www.mlg.ru (дата обращения: 9.01.2023).

[11] Новые методы работы с большими данными: победные стратегии управления в бизнес-аналитике. - М.: Пальмир, 2016. - 528 с.

[12] Прончев Г.Б., Лонцов В.В., Монахов Д.Н., Монахова Г.А. Проблемы безопасности информационного общества современной России: Монография. - М.: Экон-Информ, 2014. - 215 с.

[13] Прончев Г.Б., Любимов А.П., Гончарова И.В., Михайлов А.П. Киберугрозы для образовательного процесса в период пандемии коронавируса SARS-COV-2 // Представительная власть - XXI век: законодательство, комментарии, проблемы. 2021. № 7-8 (190-191). - С. 24-34.

[14] СберДанные. Исследования на основе больших данных Сбербанка [Электронный ресурс]. / Сбербанк. - Режим доступа: URL: https: // www.sberbank.com/ru/analytics/sberdata (дата обращения: 15.01.2023).

[15] Фрэнкс Б. Укрощение больших данных: как извлекать знания из массивов информации с помощью глубокой аналитики. - М.: Манн, Иванов и Фербер, 2014. - 352 c.

[16] Что такое VK/ ВКонтакте [Электронный ресурс]. - Режим доступа: URL: https: // vk.company/ ru/company/about (дата обращения: 15.01.2023).

чттюжжжжжжжшютттжжжжжжжшютттюжжжжжжж*^^

[17] Шинкарецкая Г.Г., Берман А.М. Цифровизация и проблема обеспечения национальной безопасности // Образование и право. 2020. № 5. - С. 254-260.

[18] Apache Hadoop [Электронный ресурс]. - Режим доступа: URL: https: // hadoop.apache.org (дата обращения: 15.01.2023).

[19] Colocation. Размещение оборудования во флагманском ЦОД «Авантаж» от МТС / #CloudMTS [Электронный ресурс]. - Режим доступа: URL: https: // cloud.mts.ru/services/colocation (дата обращения 15.01.2023).

[20] Laney D. 3D Data Management: Controlling Data Volume, Velocity, and Variety. - META group Inc.,

2001.

[21] Loshin D. ETL (Extract, Transform, Load) / Business Intelligence. - Morgan Kaufmann, 2012. - 400

p.

[22] Manyika J., Chui M, Brown B., Bughin J., Dobbs R., Roxburgh Ch. and Byers A.H. Big Data: The Next Frontier for Innovation, Competition, and Productivity [Электронный ресурс] / McKinsey Global Institute. - Режим доступа: URL: https: // www.mckinsey.com/capabilities/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation (дата обращения: 15.01.2023).

[23] Marz N., Warren J. Big Data: Principles and best practices of scalable realtime data systems. -Manning, 2015. - 328 p.

[24] Popsters. Общие вопросы [Электронный ресурс]. - Режим доступа: URL: https: // popsters.ru/ app/faq (дата обращения: 9.01.2023).

[25] Pronchev G.B., Goncharova I.V., Proncheva N. G. The range of communication topics of the visually impaired in the internet communities // Humanities and Social Sciences Reviews. 2020. V. 8(4). - P. 301-314.

[26] Pronchev G.B., Goncharova I.V., Lyubimov A.P., Mikhailov A.P. Information Security of the Educational Process during the COVID-19 Pandemic // Journal of Higher Education Theory and Practice. 2023. V. 23(2). - P. 218-232.

[27] Pronchev G.B., Proncheva N.G., Goncharova I.V. Modern management of media environment: negative effects for the society of today // Journal of Environmental Treatment Techniques. 2019. V. 7(4). -P. 836-840.

[28] Volume of data/information created, captured, copied, and consumed worldwide from 2010 to 2020, with forecasts from 2021 to 2025 [Электронный ресурс] / Statista. - Режим доступа: URL: https: // www.statista.com/statistics/871513/worldwide-data-created (дата обращения: 15.01.2023).

Spisok literatury:

[1] Konstituciya RF [Elektronnyj resurs] / Gosudarstvennaya duma. - Rezhim dostupa: URL: http: // duma.gov.ru/news/55446 (data obrashcheniya: 15.01.2023)

[2] Federal'nyj zakon ot 27.07.2006 № 149-FZ «Ob informacii, informacionnyh tekhnologiyah i o zash-chite informacii» [Elektronnyj resurs] / Prezident Rossii. - Rezhim dostupa: URL: http: // www.kremlin.ru/acts/ bank/24157/page/1 (data obrashcheniya: 15.01.2023).

[3] Federal'nyj zakon ot 27.07.2006 № 152-FZ «O personal'nyh dannyh» [Elektronnyj resurs] / Prezident Rossii. - Rezhim dostupa: URL: http: // www.kremlin.ru/acts/bank/24154 (data obrashcheniya: 15.01.2023).

[4] GOST R 58812-2020. Centry obrabotki dannyh. Inzhenernaya infrastruktura. Operacionnaya model' ekspluatacii. Specifikaciya. - M.: Standartimform, 2020. - 36 s.

[5] Goncharova I.V. Ustojchivoe razvitie gosudarstva isocial'nye tekhnologii// Voprosypolitologii. 2022. T. 12. № 1(77). - S. 92-110.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[6] Goncharova I.V., Pronchev G.B., KricheverE. I. Pedagogicheskaya traektoriya izucheniya tekhnologij upravleniya bol'shimi massivami dannyh / Sovremennye tendencii razvitiya sistemy obrazovaniya: materialy Mezhdunarodnoj nauchno-prakticheskoj konferencii (Cheboksary, 27 marta 2018 g.). - Cheboksary: ID Sreda, 2018. - S. 31-33.

[7] Demidov O. Global'noe upravlenie Internetom i bezopasnost' v sfere ispol'zovaniya IKT: Klyuchevye vyzovy dlya mirovogo soobshchestva. - M.: Al'pina Pablisher, 2016. - 198 s.

[8] D'yurner D. Bol'shie dannye - MapReduce bez Hadoop s primeneniem konvejera ASP.NET/Microsoft. [Elektronnyj resurs]. - Rezhim dostupa: URL: https: // learn.microsoft.com/ru-ru/archive/msdn-maga-zine/2015/june/big-data-mapreduce-without-hadoop-using-the-asp-net-pipeline (data obrashcheniya 15.01.2023).

[9] Majer-Shenberger V., Kuk'er K. Bol'shie dannye. Revolyuciya, kotoraya izmenit to, kak my zhivem, rabotaem i myslim. - M.: Mann, Ivanov i Ferber, 2012. - 240 s.

[10] Medialogiya. Monitoring socsetej i SMI. [Elektronnyj resurs]. - Rezhim dostupa: URL: https: // www. mlg.ru (data obrashcheniya: 9.01.2023).

[11] Novye metody raboty s bol'shimi dannymi: pobednye strategii upravleniya v biznes-analitike. - M.: Pal'mir, 2016. - 528 s.

[12] Pronchev G.B., Loncov V.V., Monahov D.N., Monahova G.A. Problemy bezopasnosti informacion-nogo obshchestva sovremennoj Rossii: Monografiya. - M.: Ekon-Inform, 2014. - 215 s.

[13] Pronchev G.B., Lyubimov A.P., Goncharova I.V., Mihajlov A.P. Kiberugrozy dlya obrazovatel'nogo processa v periodpandemii koronavirusa SARS-COV-2 // Predstavitel'naya vlast' - XXI vek: zakonodatel'stvo, kommentarii, problemy. 2021. № 7-8 (190-191). - S. 24-34.

[14] SberDannye. Issledovaniya na osnove bol'shih dannyh Sberbanka [Elektronnyj resurs]. / Sberbank. - Rezhim dostupa: URL: https: // www.sberbank.com/ru/analytics/sberdata (data obrashcheniya: 15.01.2023).

[15] Frenks B. Ukroshchenie bol'shih dannyh: kakizvlekat'znaniya izmassivovinformaciis pomoshch'yu glubokoj analitiki. - M.: Mann, Ivanov i Ferber, 2014. - 352 c.

[16] Chto takoe VK / VKontakte [Elektronnyj resurs]. - Rezhim dostupa: URL: https: // vk.company/ru/ company/about (data obrashcheniya: 15.01.2023).

[17] Shinkareckaya G.G., Berman A.M. Cifrovizaciya i problema obespecheniya nacional'noj bezopasnosti // Obrazovanie i pravo. 2020. № 5. - S. 254-260.

[18] Apache Hadoop [Elektronnyj resurs]. - Rezhim dostupa: URL: https: // hadoop.apache.org (data obrashcheniya: 15.01.2023).

[19] Colocation. Razmeshchenie oborudovaniya vo flagmanskom COD «Avantazh» ot MTS / #Cloud-MTS [Elektronnyj resurs]. - Rezhim dostupa: URL: https: // cloud.mts.ru/services/colocation (data obrashcheniya 15.01.2023).

[20] Laney D. 3D Data Management: Controlling Data Volume, Velocity, and Variety. - META group Inc.,

2001.

[21] Loshin D. ETL (Extract, Transform, Load) / Business Intelligence. - Morgan Kaufmann, 2012. -

400 p.

[22] Manyika J., Chui M, Brown B., Bughin J., Dobbs R., Roxburgh Ch. and Byers A.H. Big Data: The Next Frontier for Innovation, Competition, and Productivity [Elektronnyj resurs] / McKinsey Global Institute. -Rezhim dostupa: URL: https: // www.mckinsey.com/capabilities/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation (data obrashcheniya: 15.01.2023).

[23] Marz N., Warren J. Big Data: Principles and best practices of scalable realtime data systems. -Manning, 2015. - 328 p.

[24] Popsters. Obshchie voprosy [Elektronnyj resurs]. - Rezhim dostupa: URL: https: //popsters.ru/app/ faq (data obrashcheniya: 9.01.2023).

[25] Pronchev G.B., Goncharova I.V., Proncheva N. G. The range of communication topics of the visually impaired in the internet communities // Humanities and Social Sciences Reviews. 2020. V. 8(4). - P. 301-314.

[26] Pronchev G.B., Goncharova I.V., Lyubimov A.P., Mikhailov A.P. Information Security of the Educational Process during the COVID-19 Pandemic // Journal of Higher Education Theory and Practice. 2023. V. 23(2). - P. 218-232.

[27] Pronchev G.B., Proncheva N.G., Goncharova I.V. Modern management of media environment: negative effects for the society of today // Journal of Environmental Treatment Techniques. 2019. V. 7(4). - P. 836-840.

[28] Volume of data/information created, captured, copied, and consumed worldwide from 2010 to 2020, with forecasts from 2021 to 2025 [Elektronnyj resurs] / Statista. - Rezhim dostupa: URL: https: // www. statista.com/statistics/871513/worldwide-data-created (data obrashcheniya: 15.01.2023).

*<smmmmmmmmmmmmmmmm$mmmmmmmmmmmmmmmmmmmmmmmmm$mmmmmmmmmmmmmmmmmmmmmmmmemmmmmmmmmmmmmemmm*

i Надоели баннеры? Вы всегда можете отключить рекламу.