EDN: YYHKNQ
А.И. Репичев - к.э.н., доцент кафедры «Менеджмент и управление персоналом», Среднерусский институт управления - филиал РАНХиГС, Орел, Россия, repichev@bk.ru,
A.I. Repichev - candidate of economic sciences, associate professor of the department «Management and personnel management», Central Russian Institute of Management, Branch of RANEPA, Orel, Russia;
Х.М. Мусаева - ассистент кафедры «Экономика и экономическая безопасность отраслей и предприятий», Институт экономики и финансов, Чеченский государственный университет имени А.А. Кадырова, Грозный, Россия, bela_musaeva@mail.ru,
Kh.M. Musaeva - assistant lecturer of the department of economics and economic security of industries and enterprises, Institute of Economics and Finance, Chechen State University named after A.A. Kadyrov, Grozny, Russia.
УПРАВЛЕНИЕ ДАННЫМИ В СОВРЕМЕННЫХ КОМПАНИЯХ DATA MANAGEMENT IN MODERN COMPANIES
Аннотация. Цифровая трансформация деятельности организаций невозможна без перехода на новый уровень принятия решений - на основе данных, а он, в свою очередь, невозможен без выстраивания процессов и улучшения навыков управления данными. Работа с данными дает организациям возможность создавать новые сервисы, быстрее реагировать на события, снизить стоимость управления, принимать более обоснованные и прозрачные решения во всех отраслях. В каждой организации есть данные, которые могут быть полезны, но не всегда понятно, с чего начать работу с данными и как именно с ними работать. Важная часть преобразований - это изменение отношения к данным, повышение культуры работы с ними, что требует серьезных усилий от руководства организации.
В данной статье обоснована необходимость управление данными организации. Осуществлена характеристика процесса управления данными и категорий, входящих в этот процесс.
Abstract. Digital transformation of organizations' activities is impossible without moving to a new level of decision - making - based on data, and it, in turn, is impossible without building processes and improving data management skills. Working with data gives organizations the opportunity to create new services, respond faster to events, reduce the cost of management, and make more informed and transparent decisions in all industries. Every organization has data that can be useful, but it is not always clear where to start working with data and how to work with them. An important part of the transformation is a change in attitude to data, an increase in the culture of working with them, which requires serious efforts from the management of the organization.
This article substantiates the need for data management of the organization. The characteristics of the data management process and the list of categories included in this process are carried out.
Ключевые слова: управление данными, информация, эффективность управления.
Keywords: data management, information, management efficiency.
Современные организации функционируют в условиях развития информационного общества. Информационное общество - историческая фаза развития цивилизации, в которой важнейшими продуктами производства являются информация и знания. В информационном обществе первостепенную роль играют информация, знания и информационно-коммуникационные технологии (ИКТ).
В 2006 году бизнесмен Клайв Хамби ввел в обращение метафору «Данные - это новая нефть», а вице-президент американской Ассоциации рекламодателей (Association of National Advertisers) Майкл Палмер развил эту мысль: «Данные похожи на сырье. Оно полезно, но в необработанном виде непригодно для использования. Его необходимо преобразовать в газ, пластмассу, химикаты и тому подобные вещи...». Одновременно другие эксперты писали о том, что аналогия между данными и нефтью не работает, что данные могут быть токсичными или даже «мусорными».
Любая организация должна стремиться ко всестороннему и глубокому пониманию своих ресурсов и их стратегическому анализу, однако кейсов успешного управления данными как ресурсом пока не так много.
Ресурсы по отдельности не создают конкурентного преимущества; они должны быть задействованы все вместе, только тогда они формируют так называемую организационную способность - способность организации осуществлять специфическую деятельность. Организационные способности в модели Гранта требуют, чтобы опыт сотрудников организации был объединен с оборудованием, технологией и другими ресурсами. Для получения конкурентного преимущества на основе организационной способности она должна быть уникальна и/или должна обеспечивать ключевые факторы успеха (например, помогать создавать ценности для пользователей).
В большинстве организаций еще не введена практика последовательного управления информационными активами, как это сделано в отношении активов материальных или финансовых. В частности, сохраняется несогласованность между управлением ИТ и управлением данными. Как отмечал авторитет в области управления данными Джон Лэдли, «команды разработчиков поспешно производят сотни приложений и сервисов, не принимая во внимание вопросы использования связанных с ними данных».
Данные, в зависимости от того, как устроена работа с ними, могут быть как сырьем для прорывных решений в организации, так и мусором - если они неконсистентны, разрозненны, некорректно собраны и не управляются должным образом. Поэтому в данной статье уделено внимание тому, как наладить управление данными, чтобы противостоять негативным воздействиям и извлечь ценность из имеющихся информационных ресурсов, превратить их из «мусора» в «нефть» цифровой экономики.
Управление данными - это процесс управления доступностью, целостностью и безопасностью данных на предприятиях путем создания стандартов и политики контроля данных [4].
В зависимости от назначения и области применения принято выделять следующие типы данных (рисунок 1).
Рисунок 1 - Типы данных
По степени структурированности можно выделить:
1) структурированные данные - данные, имеющие строго фиксированную структуру, определяемую формальной моделью данных (например, реляционной схемой);
2) полуструктурированные (слабоструктурированные) данные - данные, не имеющие строго определенной структуры, но предполагающие наличие правил, позволяющих выделять отдельные семантические элементы при их интерпретации, прежде всего правил расстановки тегов и других маркеров, отмечающих и выделяющих элементы данных (например, файлы, созданные с использованием языка XML и его многочисленных производных, html-страницы и др.);
3) неструктурированные данные - данные, произвольные по форме, не имеющие строго определенной структуры и не организованные по определенным правилам.
После обеспечения целостности данных организация будет иметь согласованные данные. Но если эти данные недоступны, они не подходят по назначению. Точно так же, если данные согласованы и доступны, но не имеют отношения к операциям организации, принятию решений или планированию, они также теряют свое качество. Все управленческие решения и практические действия, имеющие отношение к данным, так или иначе привязаны к их жизненному циклу (ЖЦ). Он начинается с планирования и заканчивается ликвидацией данных. Ниже представлены процессы жизненного цикла данных:
1) планирование;
2) проектирование и обеспечение доступности данных;
3) создание или получение данных;
4) перемещение, преобразование, хранение, а также обслуживание данных и предоставление совместного доступа к ним;
5) расширение возможностей использования данных;
6) улучшение (повышение ценности) данных.
Завершает цикл ликвидация данных. Кроме того, на протяжении всего жизненного цикла данные можно очищать, преобразовывать, подвергать слиянию или агрегировать.
Управление данными помогает:
- избежать несоответствий данных между подразделениями и департаментами организации;
- улучшить качество данных путем выявления ошибок и их исправления;
- повысить качество аналитики и предоставления данных руководству для принятия решений;
- привести данные в порядок в соответствии с федеральными требованиями.
Процесс управления данными включает в себя перечень категорий, подвергающихся воздействию со стороны организации [2].
Во-первых - это управление Master Data или Master Data Management (MDM). Master Data организации включают данные о ключевых элементах бизнеса, таких как клиенты, поставщики и многое другое. Иными словами, Master Data это справочники информации. Важно понимать, что Master Data не включают в себя данные о транзакциях и платежах.
Процесс управления Master Data это процесс создания унифицированного набора данных по всей компании, по ключевым элементам бизнеса, то есть этими данными пользуется вся компания целиком.
Процесс управления Master Data помогает наладить качество данных, определить стандарты и структуру информации, легче производить обмен данными в компании между подразделениями путем интеграции.
Важной категорией управления данными является управление метаданными в компании. Это описание всех данных по базам, таблицам, столбцам. Управление метаданными очень полезно для работы аналитиков. Вместо того, чтобы долго искать требуемую информацию достаточно открыть каталог и получить требуемые данные [5].
Следующей значимой категорией управления данными является качество данных. В первую очередь качество данных характеризуется точностью и достоверностью, то есть отсутствием синтаксических, семантических или смысловых ошибок. Во вторую очередь качество данных зависит от актуальности, т.е. соответствия имеющихся данных текущему моменту времени.
В составные компоненты управления данными также входят безопасность хранения и защита данных. На сегодняшний день существуют три наиболее распространенных вида хранения данных:
- локальное;
- облачное;
- гибридное.
Каждое из них имеет, как преимущества, так и недостатки. Например, локальное хранение данных обладает следующими параметрами. Преимуществами применения будут являться:
- полный контроль;
- производительность;
- безопасность, то есть данные лучше защищены от внешнего доступа.
Недостатки применения локального хранения данных будут состоят в:
- необходимости приобретения дорогостоящего оборудования и наличии необходимого помещения;
- проблемах с доступом вне организации;
- возможных простоях и отключениях при улучшении оборудования или программного обеспечения.
Существует несколько видов доступа к данным: внутренний доступ, внешний, группы и отдельных
пользователей. В рамках этого параметра нужно в первую очередь определиться, кто имеет доступ, и главное зачем должны быть выработаны определенные правила и политика по предоставлению прав доступа к данным. Это касается как внешнего доступа извне, так и внутреннего [3].
К внутреннему доступу относится, например, данные по зарплатам сотрудников, то есть к этим данным обычно имеют доступ только руководство и финансовое подразделение, никто больше к ним доступа не имеет.
Уровни доступа зависят от локальных задач. Пользователи как правило не имеют прямого доступа к данным, к базам, к серверам. они имеют доступ через отчеты Business Intelligence (инструмент, применяемый для бизнес-анализа данных) и к своим приложениям, таким как Microsoft Excel.
Последняя часть процесса управления данными это регулирование. Имеется ввиду соответствие данных существующему законодательству. Частая ошибка при внедрении процесс управления данными это то, что сам процесс управления концентрируется больше на самих данных, нежели на стратегии достижения результата.
Политика управления данными, как правило, включает в себя наличие целой команды, так называемого управляющего комитета, который помогает обеспечить внедрение управление данными.
Как правило, в управляющий комитет входят как руководители, так и бизнес-пользователи, которые работают непосредственно с данными и которые знают о данных практически все. Работая вместе, комитет определяет стандарты процедуры и политику работы с данными.
Данные являются настоящим активам на балансе организации и могут принести прибыль при правильном их использовании. Чтобы обеспечить основу для старта работы в проекте по аналитике данных и иметь более четкое представление о больших данных, с которыми придется работать, полезно рассматривать всю работу как некий цикл с различными этапами. Это ни в коем случае не линейный цикл. На каждый из этапов иногда придется возвращаться, и каждый из этих этапов очень сильно связан с предыдущим.
Есть несколько подходов, с помощью которых можно представить сущность жизненного цикла проектов.
Первый подход это CRISP-DM, он расшифровывается как Cross-Industry process for data mining. Это межотраслевой процесс для работы по пониманию данных.
Второй подход - это SEMMA. Это аббревиатура от английских слов Sample, Explore, Modify, Model, Assess. Это общая методология и последовательность шагов интеллектуального анализа данных, предложенная американской компанией SAS. Она используется в большинстве проектов, которые очень чётко сфокусированы исключительно на моделирование.
Начнем с первого подхода, который называется CRISP-DM, он представлен в виде цикла, из некоторых его этапов можно возвращаться на предыдущие:
1) понимание бизнеса и задачи, которую нужно решить в проекте по работе с данными;
2) понимание данных, которые будут использоваться для решения;
3) подготовка этих данных;
4) моделирование;
5) оценка результатов;
6) внедрение;
7) мониторинг;
8) доработка.
Альтернативным методом является SEMMA. Он представляет собой последовательность шагов интеллектуального анализа данных. Данная последовательность более детально описывает этап моделирования, то есть Data mining, которые используются в проектах. Некоторые компании используют SEMMA для того, чтобы более детально спланировать процесс моделирования [2].
Алгоритм применения метода SEMMA, заключается в следующем. Первым пунктом является выборка, когда происходит подключение к источникам данных, и выбирается определенная генеральную совокупность, на основе которой будут происходить действия.
Формирование начального набора данных для моделирования очень важно делать из качественных источников. Информация, которая там содержится должна быть достаточно полной и качественной для того, чтобы можно было проводить исследование.
Следующим пунктом является проведение исследования. На этом этапе происходит выявление ассоциации, визуальный интерактивный статистический анализ, понимание данных путем обнаружения ожидаемых, либо каких-то непредвиденных связей между данными или переменными, которые будут применяться в последствии.
Следующий пункт заключается в модификации, то есть в преобразовании данных таким образом, чтобы они были наиболее подходящими для тех задач, которые необходимо решать.
Далее в рамках применения метода SEMMA осуществляется переход к моделированию, то есть к использованию либо нейронных сетей, либо к определению каких-то регрессии и так далее. Здесь аналитики организации не ограничены в выборе и могут использовать те решения, которое наиболее подходят.
Финальным этапом является оценка. Это сравнение моделей, которые применялись и оценка полученного результата.
Ключевое отличие подхода SEMMA от CRISP-DM заключается в том, что в SEMMA отсутствует очень важный этап, такой как понимание бизнеса и вообще понимание контекста, в котором производится исследование.
Идеальный подход к жизненному циклу и вообще к ведению проектов на основе больших данных представляет собой симбиоз всех существующих подходов.
Вопросы управления данными в организациях невозможны без рассмотрения информации о хранилище данных и платформе данных о клиентах. В настоящее время известно несколько перспективных архитектурных концепций построения платформы данных, в частности Modern Data Architecture, Lambda Architecture и Data Mesh Architecture. Modern Data Architecture соединяет преимущества DWH и озера данных. Реализация во многом зависит от главного инженера проекта.
Lambda Architecture позволяет решать задачи, связанные с обработкой в режиме реального времени. Data Mesh Architecture объединяет пакетную и потоковую обработку данных (стриминг), а также хранит данные в облаке. Организации могут анализировать данные в режиме реального времени, снизив при этом затраты на управление инфраструктурой хранилища.
В итоге, следует отметить, что цифровая трансформация деятельности организаций невозможна без перехода на новый уровень принятия решений - на основе данных, а он, в свою очередь, невозможен без выстраивания процессов и улучшения навыков управления данными. Работа с данными дает организациям возможность создавать новые сервисы, быстрее реагировать на события, снизить стоимость управления, принимать более обоснованные и прозрачные решения во всех отраслях.
В каждой организации есть данные, которые могут быть полезны, но не всегда понятно, с чего начать работу с данными и как именно с ними работать. Важная часть преобразований - это изменение отношения к данным, повышение культуры работы с ними, что требует серьезных усилий от руководства организации.
Источники:
1. Адаменко, А. А. Результаты осуществления управленческой деятельности в коммерческой организации / А. А. Адаменко, Т. Е. Хорольская, Д. В. Петров // Естественно--гуманитарные исследования. - 2021. - № 34(2). - С. 1014. - DOI 10.24412/2309-4788-2021-10940. - EDN MVUQJL.
2. Агальцов, В.П. Базы данных. В 2-х т.Т. 1. Локальные базы данных: Учебник / В.П. Агальцов. - М.: ИД ФОРУМ, НИЦ ИНФРА-М, 2013. - 187 c.
3. Методы, модели и технологии управления социально-экономическими системами в эпоху цифровой трансформации / И. Л. Авдеева, П. И. Ананченкова, Е. В. Васильева [и др.]. - Орел : Среднерусский институт управления - филиал РАНХиГС, 2022. - 208 с.
4. Репичев, А. И. Определение типичных ошибок в работе команды организации при внедрении Agile / А. И. Репичев, Е. С. Филатова // Горизонты развития проектного управления: теория и практика : Материалы II Международной научно-практической конференции, Москва, 04 марта 2021 года / Редколлегия: С.М. Нечаева [и др.]. - Москва: Государственный университет управления, 2021. - С. 152-154.
5. Теория и практика стратегического управления экономическими системами / И. Л. Авдеева, Н. А. Азарова, О. А. Базарнова [и др.]. - Орёл : Среднерусский институт управления - филиал РАНХиГС, 2021. - 278 с.
6. Филатова, Е. С. Культура работы с данными / Е. С. Филатова, А. И. Репичев // Современные тенденции развития менеджмента и государственного управления: Материалы всероссийской очной научно-практической конференции, Орёл, 03 декабря 2021 года. - Орёл: Среднерусский институт управления - филиал РАНХиГС, 2021. - С. 343-347.