Научная статья на тему 'Основные аспекты управления данными в государственных и международных организациях'

Основные аспекты управления данными в государственных и международных организациях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
46
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
управление данными / базы данных / СУБД / экспертные системы / нейросети / гибридный интеллект / Big data / Индустрия 5.0 / data management / databases / DBMS / expert systems / neural networks / hybrid intelligence / Big data / Industry 5.0

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Семёнова Ольга Викторовна

Целью данной работы является выявление ключевых аспектов в сфере управления данными на основе системного подхода. В статье рассмотрены программно-аппаратные средства и технологии, а также организационно-правовые и морально-этические аспекты управления данными в компаниях, государственных и международных организациях. Отмечается, что достаточно активно развивается российский рынок программных продуктов в условиях импортозамещения; приводятся данные рейтингов и краткие характеристики перспективных российских продуктов в сфере управления данными. Выявлены общие противоречия в необходимости защиты персональных данных и праве на информацию, стремительном развитии нейросетей и ошибках в их работе, различающейся информационной политике государств и необходимости в трансграничном обмене данными. Дальнейшее развитие глобальных инициатив возможно на основе определения каждым из государств необходимого и достаточного уровня «глубины», открытости и достоверности. Экспертные системы могли бы играть «направляющую» роль для усвоения принципиально важных знаний нейросетями. Наиболее перспективным решениям может стать взаимодействие гибридного искусственного интеллекта на основе нейросетей, экспертных систем с человеком и окружающей его внешней средой, как основной цели Индустрии 5.0.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE MAIN ASPECTS OF DATA MANAGEMENT IN STATE AND INTERNATIONAL ORGANIZATIONS

The purpose of this work is to identify key aspects in the field of data management based on a systematic approach. The article deals with software and hardware and technologies, as well as organizational, legal, moral and ethical aspects of data management in companies, government and international organizations. It is noted that the Russian market of software products is developing quite actively in the context of import substitution; rating data and brief characteristics of promising Russian products in the field of data management are given. General contradictions are revealed in the need to protect personal data and the right to information, the rapid development of neural networks and errors in their work, the different information policies of states and the need for cross-border data exchange. Further development of global initiatives is possible on the basis of determining by each of the states the necessary and sufficient level of «depth», openness and reliability. Expert systems could play a «guiding» role for the assimilation of fundamentally important knowledge by neural networks. The most promising solutions may be the interaction of hybrid artificial intelligence based on neural networks, expert systems with a person and his environment, as the main goal of Industry 5.0.

Текст научной работы на тему «Основные аспекты управления данными в государственных и международных организациях»

Основные аспекты управления данными в государственных и международных организациях

Семёнова Ольга Викторовна,

старший преподаватель, кафедра государственного управления во внешнеполитической деятельности, Дипломатическая академия МИД России E-mail: Semenova-o-v@yandex.ru

Целью данной работы является выявление ключевых аспектов в сфере управления данными на основе системного подхода. В статье рассмотрены программно-аппаратные средства и технологии, а также организационно-правовые и морально-этические аспекты управления данными в компаниях, государственных и международных организациях. Отмечается, что достаточно активно развивается российский рынок программных продуктов в условиях импортозамещения; приводятся данные рейтингов и краткие характеристики перспективных российских продуктов в сфере управления данными. Выявлены общие противоречия в необходимости защиты персональных данных и праве на информацию, стремительном развитии ней-росетей и ошибках в их работе, различающейся информационной политике государств и необходимости в трансграничном обмене данными. Дальнейшее развитие глобальных инициатив возможно на основе определения каждым из государств необходимого и достаточного уровня «глубины», открытости и достоверности. Экспертные системы могли бы играть «направляющую» роль для усвоения принципиально важных знаний нейросетями. Наиболее перспективным решениям может стать взаимодействие гибридного искусственного интеллекта на основе нейросетей, экспертных систем с человеком и окружающей его внешней средой, как основной цели Индустрии 5.0.

Ключевые слова: управление данными, базы данных, СУБД, экспертные системы, нейросети, гибридный интеллект, Big data, Индустрия 5.0.

£7

CJ

со

см

см

О)

Z

154

На протяжении всей истории данные служили основой для получения знаний. Примером фиксации данных в древности можно считать зарубки на носу (дощечки с заметками), а систематизировать данные начали в XVII веке. C приходом индустриальной революции в XIX веке потребовалось вести подсчеты, связанные с автоматизацией производства. В 1884 г. появилась табулатура, способная считывать перфокарты, с 1890 г. при переписи населения стали использовать табуляторы. В 1927 г.г. вошли в обиход магнитные ленты, позже - диски и т.д. В в1948 г. Клод Шеннон ввел понятие бита. В 1960 г. появилась международная организация по управлению данными - Международная федерация по обработке информации (IFIP), которая определила данные как «формальное представление фактов или идей, которые можно передавать и которыми можно управлять каким-либо способом». В 1966 г. на 11-й Генеральной ассамблее Международный совет по науке открыл Комитет по данным для науки и техники (CO-DATA). Каждое новое изобретение обладало новыми, улучшенными характеристиками по сбору и обработке данных.

Данные - это зафиксированные сигналы, отдельные факты, представленные в готовом для хранения, передачи и обработки виде, это минимальные семантические единицы, представляющие собой дискретный набор значений. Данные используются для их последующего анализа и принятия решений.

Управление данными - это процесс сбора, хранения, защиты и использования данных организации, реализуемый в целях эффективности принятия решений. Методология управления данными базируется на множестве технических, программных, организационных, методических, организационных, правовых и морально-этических аспектов, которые легли в основу построения информационных систем (ИС). Рассматривая эволюцию ИС, можно отметить, что в практике управления первыми стали системы обработки электронных данных - СОД (Electronic Data Processing - EDP).

Объём данных, как можно заметить, растет по экспоненциальному закону. Вся содержащаяся в информационных системах информация (Big data) отражает такое количество фактов действительности, которого во многих случаях становится достаточно для построения модели существующих объектов или части реального мира. Именно данные и используются для поиска полезных уточнений, составления общей картины изучаемого явления. Data Mining - это поиск закономерностей, ранее неизвестных, нетривиальных знаний в больших массивах данных.

Самые популярные программы для ведения данных - Базы данных. Это информационные массивы, представленные в наиболее чётко структурированном виде. Системы управления базами данных (СУБД) позволяют их систематизировать, фильтровать, пополнять, делать запросы и т.п. Данные структурированы в соответствии с представляемой моделью. Существуют следующие их разновидности:

Иерархическая, представляющая различные уровни подчинённости;

Сетевая, напоминающая граф с узлами - объектами БД и ребрами - связями между ними. Пропагандистом этой модели был Чарльз Бахман. Сетевая модель данных CODASYL основана на математической теории множеств;

Реляционная, основанная на модели Э.Ф. Кодда, в которой данные представлены в виде связанных между собой посредством ключевых полей таблиц. Для реляционных баз данных разработан язык SQL. Данные классифицированы по типам (текстовые, числовые, денежные, логические и т.п.), а основными объектами, наряду с таблицами, являются запросы, формы, отчёты и др.;

Объектные и объектно-ориентированные модели позволяют представлять с помощью объектно-ориентированного языка любую сущность реального мира в виде объектов, их атрибутов, методов и классов. Такие средства являются информационной основой для систем других классов.

NoSQL - это один из новых подходов к организации хранения данных, решающий проблемы масштабируемости, доступности за счет согласованности данных. Доступ к данным осуществляется уже не языком SQL, а скриптами (небольшими программами); [4]

Документная база данных - нереляционная СУБД, которая хранит данные в документах (а не в строках и столбцах, как в реляционных СУБД);

СУБД типа ключ-значение связывают ключ с каким-либо одним значением;

Графовые СУБД - сетевые модели в виде графов с их свойствами и отношениями между узлами; Колоночные СУБД подобны реляционным, однако для обращения к данным считывается не вся строка, а обращение идёт сразу к нужной колонке;

Многомодельные СУБД позволяют отобразить всё информационное пространство Интернета, характеризуются тем, что могут быть применимы в облачной СУБД. На рисунке 1 приводится рейтингов популярности в поисковых системах СУБД - DB - Engines Rankinr (один из первых рейтингов популярности продуктов разработчиков СУБД). Он показывает, что на август 2023 г. среди российских мультимодальных СУБД PostgreSQL занимает 4 место, Эластичный поиск - 7 позицию, Click-House (остановил деятельность в России) - 39 строчку, Tarantool - 162 место, Postgres-XL - 246 Linter - 315 место [12]. Интерес к данному исследованию связан с тем, что многие иностранные разработчики ПО (а в сфере СУБД это Microsoft, ORACLE и другие) приостановили или прекратили свою деятельность на территории России.

Рис. 1. Рейтинг СУБД по данным DB-Engines Rankin (август 2023 г.)

PostgreSQL - свободно-распространяемая СУБД, разработанная международным сообществом и значительным вкладом разработчиков Postgres Professional.

Postgres Pro - российская коммерческая реляционная СУБД (входит в реестр Российского ПО), облада-

ющая высокой производительностью и надежностью; используется во многих сферах промышленности и финансах.

ClickHouse - это база данных, предназначенная для проведения бизнес-аналитики, формирования отчётов;

сз о

сг

0

1

-1 У

=Е СГ

со

I_

u

CM О)

используется в электронной коммерции, в исследовательской работе и др.

СУБД Линтер - реляционная система управления базами данных, полностью отечественный продукт, созданный специалистами ЗАО НПП «РЕЛЭКС». Линтер Стандарт - российская реляционная СУБД, включена в Единый реестр российских программ для электронных вычислительных машин и баз данных Минцифры РФ. Основные преимущества - предъявление минимальных требований к памяти, что позволяет использовать во встраиваемых решениях, либо на M2M/IoT устройствах. Линтер Бастион - российская реляционная СУБД, которая гарантирует высочайший уровень безопасности данных пользователя, включена в Единый реестр российских программ для электронных вычислительных машин и баз данных Минцифры РФ. С 2017 г. «РЕЛЭКС» развивает масштабируемую реляционную СУБД SoQoL, которая, по мнению разработчика, показывает значительное превосходство отечественного решения над PostgreSQL, Oracle и Microsoft SQL Server в производительности [7].

Эластичный поиск - поисковая система с поддержкой автозаполнения, геолокации, с функцией менеджера журналов, сервисом консультаций, созданная по типу NoSQL.

Основным преимуществом СУБД Tarantool является высокая производительность запросов на чтение по сравнению с аналогичными СУБД. Tarantool соединяет в себе два основных принципа: высокая скорость работы и высокая надежность, тогда, когда аналогичные СУБД не могут сочетать в себе наличие двух этих факторов. СУБД используют Авито, Yota, Qiwi и т.д.

На базе систем управления базами данных и систем поддержки принятия решений строятся хранилища данных (ХД). Хранилище - структурированная информация, озеро данных - неструктурированное вместилище данных разного формата (csv, xml, json, parquet, jpg, png, mov, mp3, pdf). Представителями программных продуктов этой категории являются SAP Business Warehouse (SAP), Informatica и другие. ХД часто содержат семантический слой (бизнес-слой), поддерживающий фразы на естественном. Фабрики данных - службы, организующие интеграцию, перемещение и обработку необработанных данных в данные, пригодные для дальнейшего использования.

Центральным местом хранения цифрового контента является репозиторий, которым управляет система ECM (Enterprise Content Management). Такие системы предоставляют мощные возможности для поиска, управления записями, шифрования, контроля доступа для авторизованных пользователей, аналитики и отчётности и много других функций. Российские ECM представлены продуктами: платформа Documino, Docsvision, ЭЛАР Контекст, зарубежными - ECM Alfresco, Microsoft SharePoint, Doxis4 и др.

Репозиторий метаданных (метаданные - это информация о другой информации, сведения о признаках, свойствах и т.п.) хранит данные на протяжении всего жизненного цикла бизнес-проекта. Критически важные данные - это информация, которая имеет особую ценность и необходима для нормального функционирования предприятия, организации или государства. Она обладает высокой степенью конфиденциальности, надежности и целостности.

Подходы к управлению данными напрямую зависят от новейших информационных технологий. По отчёту IEEE за 2023 год, наиболее перспективными выделены 3D интегральные схемы с применением оптических лучей; озёра данных; облачные технологии, блокчейн, естественный пользовательский интерфейс, который,

используя большой объем данных (по прогнозируемому к 2025 году 175 зеттабайт), будет способствовать по-настоящему глубокое обучение ИИ.

Компании, государственные и международные организации разрабатывают организационные и методологические основы управления данными. Например, одним из выводов из исследований компании Gartner является то, что при внедрении процессов УД 80% инициатив, направленных на построение и развитие системы УД, не приводят к ожидаемым результатам из-за отсутствия понимания цели и ожиданий. Практика показывает, что часто не прорабатывается архитектура данных, игнорируется аналитическая культура, приобретаются коробочные решения, не учитывающие нужды организации, но включающие ненужные функции.

Ключевым фактором успешной реализации стратегии управления данными в организации является наличие единого ответственного лица. Руководителем высшего звена, отвечающим за использование данных и комплектующий команду, является главный директор по данным (Chief data officer). Для создания новых бизнес-моделей на основе корпоративных данных создаётся подразделение - Департамент управления данными (Chief Data Office), который руководит инициативами, ориентированными на бизнес, возглавляет культурные изменения, позволяющие сформировать стратегические принципы и подходы организации к данным. Конкретный массив данных контролируется владельцем данных (Data owner). Data consumer (потребитель данных) - любое приложение, пользователь, получающие доступ к данным. Data producer - перехватывает данные, обеспечивая их соответствие требованиям потребителей данных к качеству. Data steward - обычно отвечает за выполнение политик использования данных, полноту и качество содержимого данных, координирует работу по описанию таблиц, атрибутов и связей, определяет степень доверия к данным, обеспечивает повышение качества их надежности и др. Data analyst - исследует, оценивает, обобщает данные и сообщает о результатах высшему руководству. Data Scientist - это специалист по работе с данными для решения задач бизнеса. Он работает на стыке программирования, машинного обучения и математики. Data custodian (data modeler, администратор баз данных) и ETL-разработчик управляет технической средой обслуживания и хранения данных, отвечает за качество, целостность и безопасность данных в процессе ETL (extract, transform, load).

Государство использует данные при анализе, подготовке, принятии управленческих решений, для обоснования законопроектов, получения сведений из реестров, подтверждающие различные юридические факты, для оценки качества госуправления, достижения стратегических и тактических целей, оценки эффективности деятельности госслужащих, принятия решений относительно граждан и др. [15, с. 47]. Целями национальной программы «Цифровая экономика Российской Федерации» являются создание информационно-телекоммуникационной инфраструктуры для обработки, хранения, высокоскоростной передачи и хранения больших объёмов данных, а также использование преимущественного отечественного ПО государственными органами, органами местного самоуправления и организациями. Указом Президента Российской Федерации от 31 марта 2023 г. № 231 создаётся цифровая платформа Российской Федерации «ГосТех», функционирование которой поручено Правительству [11]. Она будет служить основой для государственных ИС, для связи граждан, государства и бизнеса и включать множество сервисов.

Как выяснил CNews, Счетная плата (СП) намерена создать систему управления данными на российской платформе Unidata (компании «Юнидата») [13]. Газпромнефть запустила проект создания «умного озера данных», который стал первым в российской практике. Это комплексная платформа обработки, хранения и анализа данных с интегрированным Data Governance, с помощью которой реализуются около 50% всех аналитических проектов и инициатив региональных продаж [6].

Ведущими игроками на мировом рынке платформ УД являются Lotame Solutions, KBM Group, Rocket Fuel, Krux Digital, Turn, Informatica и другие. 18 декабря 2019 года компания Mail.ru Group сообщила о запуске единой платформы управления и обработки данных (DMP - Data Management Platform). DMP даёт представление о целевой аудитории на основе обезличенных данных о 92% аудитории рунета, включая социально-демографические и ценностно-поведенческие характеристики и интересы [1]. В 3-м квартале 2021 г. лидером программы The Forrester Wave™ по продукции управления данными стала компания Ataccama. В 2022 г. российская компания DIS Group разработала решение для бизнес-анализа, создания корпоративных каталогов, бизнес-глоссариев Plus7 EDM (Enterprise Data Management). В дополнение к этому продукту компания заявила о других решениях - зарегистрированном в 2023 г. в реестре российского ПО продукте «Юниверс MDM» (для управления мастер-данными), «Юниверс DG» (для полного цикла управления данными), «Юниверс smart ETL» (основанное на технологиях open source решения для трансформации и наполнения озёр данных) и «Юниверс DQ» (для организации и мониторинга качества данных) [2,3]. Проекты, интегрированные с продуктами «Юнидата», вошли в список лидеров в престижном исследовании Magic Quadrant Gartner, они успешно реализованы в Федеральных органах исполнительной власти, в частности, в Аналитическом центре при Правительстве Российской Федерации, в Министерствах, учебных заведениях и т.п.

Сравнительно новым сервисом является выявление критичных данных, связанное с определением доменов данных, учитывающим их зависимость от других данных, с информацией об уровне защищённости, системами мониторинга для выявления аномалий в критичных данных и т.п. В исследованиях CDO организаций из Electronic Business Group отмечена необходимость в снижении издержек в текущих активностях и росте эффективности бизнес-направлений за счет управления данными, а в качестве наиболее наглядного решения выбрать аспект, который является наиболее проблемным для организации [15, с. 86].

Система управления содержимым (Content management system, CMS) - ИС для совместного процесса создания, редактирования и управления контентом. Web Content Management System - программный комплекс для создания, редактирования и контроля Web-страниц. Средства поддержки рабочих групп включают возможности интерактивного общения, проектные методы общей работы. Средства управления рабочими потоками - это инструмент для разработки маршрутов, автоматизации бизнес-процессов и других задач.

Одна из новых тенденций - дополненное управление данными (augmented data management). Для того, чтобы процессы управления данными были самонастраивающимися, саморегулирующимися и полностью автоматизированными, подключаются искусственный интеллект и машинное обучение. Ещё один из трендов, выявленный Gartner - дополненная аналитика. Возможности ИИ, машинного обучения, обработка текстов

на естественном языке (NLP) служит как для поиска важных сведений, так и для диалога, доступного любому сотруднику для доступа к своим данным.

Рынок инструментов управления качеством данных растёт примерно на 20% в год; это универсальные решения, специализированные системы, средства интеграции и очистки данных, управления реестрами, метаданными и пр. Примерами таких систем являются: informatica, IBM, MS Data Quaity Services, SAP, Unidata; SAS DQ, SAP Data Services, TIBCO Clarity; Informatica Master Data Management, Data Management, Syncsort Trillium, Alter-yx, Pentaho, Unidata; Informatica Enterprise Data Catalog и другие.

Существует множество подходов к определению качества данных. Именно качество данных будет определять результат информационной деятельности. На качество влияют степень предвзятости, гендерные и расовые предрассудки и множество других факторов. Ричард Ван и Диана Стронг описали четыре категории качества данных - внутреннюю, контекстуальную, репрезентативную и по степени доступности. Целостность, точность, надёжность, методологическую надёжность, доступность, удобство обслуживания выделяют в МВФ (Data Quality Assessment Framework). В DQAF включено семь структур для поддержания единых стандартов качества - таких, как национальные счета, индекс стоимости жизни, различные статистические показатели и др. [11].

Для исключения таких разночтений применяются стандарты (начиная с ГОСТ Р 56214-2014/IS0/TS 80001:2011, ГОСТ 56215 ISO/TS 8000-150:2011). Качество как общих, так и основных, а также транзакционных данных определяется в стандартах группы ISO/TS 8000. Международные стандарты группы ISO 25000 определяют качество программного продукта исходя из общей модели качества данных.

Не так быстро, как программы, регулируются этические стороны использования данных. Российское законодательство вводит инициативы в отношении регулирования данных. С 2006 г. в России действует Закон о персональных данных. «Кодекс этики с сфере искусственного интеллекта» был разработан в 2021 году Альянсом в сфере искусственного интеллекта совместно с Аналитическим центром и Минэкономразвития. Основные положения адресованы Государству, бизнесу, разработчикам, учёным и носят рекомендательный характер. Мин-цифры согласовало законопроект, предусматривающий штрафы от 1 до 3 процентов за утечку персональных данных пользователей [9].

Ассоциация больших данных (АБД), организованная в октябре 2018 года (основные участники - МегаФон, Mail.Ru Group, Яндекс, Сбербанк, oneFactor, Тинькофф Банк) создаёт единые принципы и стандарты обработки, хранения, передачи и использования больших данных, формирует кодекс этики использования данных для защиты интересов пользователей. Кодекс содержит отраслевые стандарты профессионального и этического поведения. Документ также предполагает создание и ведение Реестра добросовестных участников. В состав Кодекса входит «Белая книга», в которой собраны примеры ответственного поведения в отношении обращения с данными [16].

Различные государства принимают инициативы, регулирующие правила использования больших данных. Статистическое управление Соединенного Королевства в феврале 2021 года СУСК основало Центр прикладной этики данных (ЦПЭД), который ставит перед собой цель стать одним из признанных мировых лидеров в области прикладной этики данных [14]. В ЕС в 2018 г. Вступил в силу генеральный регламент о персональных данных

сз о

сг ш

0

1

-1 У

"О ш

сг

со

I_

u

CM О)

(GDPR), который должны соблюдать операторы стран -участниц ЕС и ЕЭС, компании всех стран, обрабатывающие ПД граждан ЕС и ЕЭС. В США государство предоставляет намного больший доступ к ПД граждан в связи с принципами свободы информации, коммерции и безопасности общества, что находит отражение в законодательстве также и в отдельных штатах. В Китае условия использования данных диктуются государством и крупными дата- корпорациями, этичным считается жесткий контроль над ПД граждан [8].

Для госслужащих в Новой Зеландии приняты документ «Принципы безопасного и эффективного использования данных и аналитики», согласно которым необходимо фокусироваться на нуждах граждан, поддерживать прозрачность работы с данными, обеспечивать общественное благо.

В некоторых странах ИИ может быть признан автором произведения; в Германии, Франции и Китае пустили беспилотные авто, но Чили, например, одобряет право на защиту от технологических достижений, Ев-рокомиссия вводит ограничение на использование ИИ. Одним из шагов в сфере регулирования этики ИИ стал запуск глобальной платформы д1оЬа1роПсу.А1 (ООН, ЕС, Совета Европы и других международных органов) о международном регулировании ИИ. Рекомендация ЮНЕСКО в сфере этики ИИ в 2021 г. стала первым глобальным документом, которую приняли 193 государства. Документ призывает компании и государства повысить эффективность защиты персональных данных, дать возможность гражданам не только получить доступ к ним, но и возможность их удалять, вводит запрет использования ИИ для слежки, но рекомендует использовать его для борьбы с изменением климата и др. [5]. Появление глобальных документов, вырабатывающих общие принципы управления данными - важный шаг, позволяющий унифицировать и формализовать процедуры использования данных и постепенно устранять имеющиеся противоречия. Учёт того, как трудно выбираются согласованные подходы к трансграничному обмену данными, каждое из государств может определить уровень «глубинности» и приватности данных, подлежащих обмену, но именно условие их достоверности даст возможность для дальнейшего развития сети Интернет, самих государств и взаимоотношений между ними.

Результат работы нейросетей напрямую зависит от качества данных. Поэтому, несмотря на все преимущества, нейросети могут выдать неожиданный результат. Скорее всего, перспективным решением данной проблемы может стать гибридный интеллект. Следует вести активные разработки и в области экспертных систем, функционирующих на основе знаний специалистов. Из всех информационных систем именно они могут соблюдать наиболее важные принципы в той или иной деятельности, играть корректирующую роль на основе имеющейся базы знаний, следуя заданной логике. Если сигналам от экспертной системы присваивать значимый вес, это можно использовать, как обучающее правило для нейросети. Разрабатываются также способы обучения нейросетей на примерах, задаваемых экспертом. Потенциал нейросетей и экспертных систем, синхронизированных между собой на уровне программно-аппаратных средств, данных, знаний, наряду с контролем человека, аккумулирует самые сильные стороны разных видов интеллекта в одной системе. Качественные изменения в сфере управления данными на уровне индивидуумов, организаций, государств и в условиях трансграничного обмена, бесспорно, смогут вывести общество на новый уровень взаимоотношений, характерный для грядущей пятой промышленной революции,

когда наряду с автоматизацией и интеллектуализацией

во главе угла остаётся человек и его взаимоотношения

с окружающим миром.

Литература

1. 2019: Запуск платформы управления и обработки данных: [Электронный ресурс] // Деловой портал с уникальной базой знаний TAdviser о том, как устроено государство и бизнес, а также об информационных технологиях в их работе. URL: https:// www.tadviser.ru/index.php/%D0%9F%D1%80%D0 %BE%D0%B4%D1%83%D0%BA%D1%82: Mail.ru_ Group_Data_Management_Platform_%28DMP%29?-cache=no&ptype=integr&ysclid=llnjjkszx6172516798/ (Дата обращения: 27.08.2023).

2. DIS Group анонсировала комплексное российское решение по управлению данными и информацией // Сетевое издание «CNews». 18 июля 2022. URL: https:// www.cnews.ru/news/line/2022-07-18_dis_group_an-onsirovala_kompleksnoe?ysclid=llnn8sw5hi465990352 (Дата обращения: 27.08.2023).

3. DIS Group обеспечит полный цикл управления данными на российских технологиях: [Электронный ресурс] // Сетевое издание «CNews». 19 января 2023. URL: https://www.cnews.ru/news/line/2023-01-19_ dis_group_obespechit_polnyj_tsikl?ysclid=Nnncb-8mt0116563024/. (Дата обращения: 27.08.2023).

4. NoSQL: [Электронный ресурс]. // Аналитика Big Data для руководителей и менеджеров / Школа больших данных BD Scool. URL: https://bigdatascooll/wiki/ nosql. (Дата обращения: 27.08.2023).

5. Андрей Незнамов. D-Russia: Топ-10 мировых событий в сфере правового регулирования и этики ИИ: [Электронный ресурс] // Ассоциация Электронных Торговых Площадок.М. 29 декабря 2021 г. URL: https://aetp.ru/market-news/item/431921. (Дата обращения: 27.08.2023).

6. Газпром нефть первой в России запустила «умное озеро данных»: Электронный ресурс // Новостной портал о ТЭК России и Мира Neftegaz. RU /Информационное агентство Neftegaz.RU. 11 февраля 2020. URL: https://neftegaz.ru/news/ tsifrovizatsiya/524234-gazprom-neft-pervoy-v-rossii-zapustila-umnoe-ozero-dannykh/?ysclid=lll7fjx4 jc635161615/ (Дата обращения: 27.08.2023).

7. Исход американских компаний из России ускорил отказ от работы с их операционными системами и СУБД: [Электронный ресурс] // Сетевое издание «CNews». 25 августа 2023. URL: https://www.cnews. ru/news/line/2023-08-25_ishod_amerikanskih_kom-panij?ysclid=llqwtr66ao683357862. (Дата обращения: 27.08.2023).

8. Ларионова М.В., Шелепов А.В. Возможно ли лидерство «Группы двадцати» по вопросам управления данными? Есть ли шанс на сближение подходов? // Вестник международных организаций. 2023. Т. 18. № 1. С. 7-32 (на русском и английском языках). doi:10.17323/1996-7845-2023-01-01

9. Минцифры готовит новую версию законопроекта об оборотных штрафах за утечку персональных данных: [Электронный ресурс] // Официальный сайт Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации. 12 июля 2022 г. URL: https://digital.gov.ru/ru/events/41722/. (Дата обращения: 27.08.2023).

10. Национальный проект «Цифровая экономика»: [Электронный ресурс] // общероссийская цифровая платформа Стратегия 24 / URL: https://strategy24.ru/

rf/management/projects/natsional-nyy-proyekt-tsifrova-ekonomika?ysclid=lje8gaqg9v874424503/ (Дата обращения: 27.08.2023).

11. Р. Куцев. Управление качеством данных: роли, процессы, инструменты: [Электронный ресурс] // Сообщество ИТ-специалистов «Хабр». 14 ноября 2022. URL: https://habr.com/ru/articles/694690/. (Дата обращения: 27.08.2023).

12. Рейтинг DB-Engines - популярность тренда: [Электронный ресурс] // DB-Engines. URL: https://db-en-gines.com/en/ranking_trend. (Дата обращения: 27.08.2023).

13. Счетная палата построит систему управления данными аудита на российской платформе: [Элетрон-ный ресурс] // Сетевое издание «CNews». 15 марта 2022. URL: https://www.cnews.ru/news/top/2022-03-15_schetnaya_palata_postroit/. (Дата обращения: 27.08.2023).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Углубленный обзор этики данных, подготовленный Канадой и Соединенным Королевством Великобритании и Северной Ирландии при участии Евроста-та: [Электронный ресурс] // Европейская экономическая комиссия Конференция европейских статистиков / Семьдесят первое пленарное заседание. Женева, 22-23 июня 2023 года. URL: https://unece.org/ sites/default/files/2023-05/CES%202023%205%20R. pdf/. (Дата обращения: 27.08.2023).

15. Управление данными в госсекторе. Навигатор для начинающих / под ред. О.М. Гиацинтова, В.А. Сазонова, М.С. Шклярук. - М.: РАНХиГС, 2022. - 198 стр.

16. Юлия Кривошапко. Крупнейшие компании определили этические принципы работы с данными: [Электронный ресурс] // Интернет-портал «Российской газеты»; гл. ред. В.А. Фронин. 12.12.2019. URL: https://rg.ru/2019/12/12/krupnejshie-kompanii-opredelili-eticheskie-principy-raboty-s-dannymi.htm-l?ysclid=llq978l033613638647. (Дата обращения: 27.08.2023).

THE MAIN ASPECTS OF DATA MANAGEMENT IN STATE AND INTERNATIONAL ORGANIZATIONS

Semenova O.V.

Diplomatic Academy of the Ministry of Foreign Affairs of Russia

The purpose of this work is to identify key aspects in the field of data management based on a systematic approach. The article deals with software and hardware and technologies, as well as organizational, legal, moral and ethical aspects of data management in companies, government and international organizations. It is noted that the Russian market of software products is developing quite actively in the context of import substitution; rating data and brief characteristics of promising Russian products in the field of data management are given. General contradictions are revealed in the need to protect personal data and the right to information, the rapid development of neural networks and errors in their work, the different information policies of states and the need for cross-border data exchange. Further development of global initiatives is possible on the basis of determining by each of the states the necessary and sufficient level of «depth», openness and reliability. Expert systems could play a «guiding» role for the assimilation of fundamentally important knowledge by neural networks. The most promising solutions may be the interaction of hybrid artificial intelligence based on neural networks, expert systems with a person and his environment, as the main goal of Industry 5.0.

Keywords: data management, databases, DBMS, expert systems, neural networks, hybrid intelligence, Big data, Industry 5.0.

References

1. 2019: Launch of the data management and processing platform: [Electronic resource] // Business portal with a unique TAd-viser knowledge base about how the state and business work,

as well as about information technologies in their work. URL: https://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE %D0%B4%D1%83%D0%BA%D1%82: Mail.ru_Group_Data_ Management_Platform_%28DMP%29?cache=no&ptype=inte-gr&ysclid=llnjjkszx6172516798/ (Date of access: 27.08.2023).

2. DIS Group announced a comprehensive Russian solution for data and information management // CNews online edition. July 18, 2022. URL: https://www.cnews.ru/news/ line/2022-07-18_DIS_Group_announced_a comprehensive?y-sclid=llnn8sw5hi465990352 (Date of access: 27.08.2023).

3. DIS Group will provide a full cycle of data management on Russian technologies: [Electronic resource] // CNews online edition. January 19, 2023 (Date of access: 27.08.2023).

4. NoSQL: [Electronic resource]. // Big Data Analytics for Executives and Managers / Big Data School BD Scool. URL: https:// bigdatascooll/wiki/nosql. (Date of access: 27.08.2023).

5. Andrey Neznamov. D-Russia: Top 10 world events in the field of legal regulation and AI ethics: [Electronic resource] // Association of Electronic Trading Platforms.M. December 29, 2021 URL: https://aetp.ru/market-news/item/431921. (Date of access: 27.08.2023).

6. Gazprom Neft was the first in Russia to launch a "smart data lake": Electronic resource // News portal about the fuel and energy complex of Russia and the World Neftegaz.RU / Information agency Neftegaz.RU. 11 February 2020. URL: Gazprom-Neft-was- the-first-in-Russia-to-launch-a-smart-data-lake/?ysclid=lll7 fjx4jc635161615. (Date of access: 27.08.2023).

7. The exodus of American companies from Russia accelerated the refusal to work with their operating systems and DBMS: [Electronic resource] // CNews online edition. URL: https:// www.cnews.ru/news/line/2023-08-25_the_exodus_of_Ameri-can_companies?ysclid=llqwtr66ao683357862. August 25, 2023 (Date of access: 27.08.2023).

8. Larionova M.V., Shelepov A.V. Is G20 leadership possible on data governance? Is there any chance for a convergence of approaches? // Bulletin of international organizations. 2023. V. 18. No. 1. P. 7-32 (in Russian and English). doi:10.17323/1996-7845-2023-01-01

9. The Ministry of Digital Development is preparing a new version of the draft law on turnover fines for the leakage of personal data: [Electronic resource] // Official website of the Ministry of Digital Development, Communications and Mass Media of the Russian Federation. July 12, 2022 URL: https://digital.gov.ru/ru/ events/41722/. (Date of access: 27.08.2023).

10. National project "Digital Economy": [Electronic resource] // all-Russian digital platform Strategy 24 / URL: https://strategy24. ru/rf/management/projects/ national-project-Digita-Economy?ys clid=lje8gaqg9v874424503 / (Date of access: 27.08.2023).

11. R. Kutsev. Data quality management: roles, processes, tools: [Electronic resource] // Habr Community of IT Specialists. November 14, 2022. URL: https://habr.com/ru/articles/694690/. (Date of access: 27.08.2023).

12. DB-Engines rating - trend popularity: [Electronic resource] // DB-Engines. URL: https://db-engines.com/en/ranking_trend. (Accessed: 08.27.2023).

13. The Accounts Chamber will build an audit data management system on the Russian platform: [Electronic resource] // CNews online edition. March 15, 2022. URL: https://www.cnews.ru/ news/top/2022-03-15_schetnaya_palata_postroit/. (Date of access: 27.08.2023).

14. An in-depth review of data ethics prepared by Canada and the United Kingdom of Great Britain and Northern Ireland with the participation of Eurostat: [Electronic resource] // Economic Commission for Europe Conference of European Statisticians / Seventy-first plenary session. Geneva, 22-23 June 2023. URL: https://unece.org/sites/default/files/2023-05/CES%202023%20 5%20R.pdf/. (Accessed: 08.27.2023).

15. Data management in the public sector. Navigator for beginners / ed. O.M. Giatsintova, V.A. Sazonova, M.S. Shklyaruk. - M.: RANEPA, 2022. - 198 pages.

16. Julia Krivoshapko. The largest companies have determined the ethical principles of working with data: [Electronic resource] // Internet portal of Rossiyskaya Gazeta; ch. ed. V.A. Fronin. 12.12.2019. URL: https://rg.ru/2019/12/12/ Tehe-largest-companies-have-determined-the-ethical-principles-of-working-with-data.html?ysclid=llq978l033613638647. (Date of access: 27.08.2023).

C3

о

сг

IE

0

1

-1 У

IE СГ

i Надоели баннеры? Вы всегда можете отключить рекламу.