УДК 330.341.2
Лежнева В.Е., Шушунова Т.Н.
АНАЛИЗ ОСНОВНЫХ ПРИЛОЖЕНИЙ DATA SCIENCE В ЦИФРОВОЙ ЭКОСИСТЕМЕ МАРКЕТИНГА
Лежнева Варвара Евгеньевна - студентка 1 курса магистратуры кафедры менеджмента и маркетинга; e-mail: vary@mail.ru.
Шушунова Татьяна Николаевна - к.т.н., доцент кафедры менеджмента и маркетинга; ФГБОУ ВО «Российский химико-технологический университет имени Д.И. Менделеева» Россия, Москва, 125047, Миусская пл., д. 9.
Цифровой маркетинг в современных экономических реалиях становится ключевым фактором успеха и крупных компании и сектора малого и среднего бизнеса. Однако технологии электронного бизнеса требуют повышения цифровых навыков маркетологов, которые работают в тесном симбиозе с цифровыми аналитиками и разработчиками программного обеспечения. Ведущая парадигма цифровой экосреды компании формируется на основе подходов управления знаниями с применением Data Science, поэтому анализ приложений Data Science в цифровом маркетинге представляется достаточно актуальным и своевременным.
Ключевые слова: цифровой маркетинг; цифровая экосистема; большие данные; машинное обучение, нейросети.
ANALYSIS OF BASIC DATA SCIENCE APPLICATIONS IN THE DIGITAL MARKETING ECOSYSTEM
Lezhneva V.E., Shushunova T. N.
D. Mendeleev University of Chemical Technology of Russia, Moscow, Russian Federation
Digital marketing in modern economic realities is becoming a key factor in the success of both large companies and the small and medium-sized business sector. However, e-business technologies require enhanced digital skills for marketers who work in close symbiosis with digital analysts and software developers. The leading paradigm of the company's digital eco-environment is formed on the basis of knowledge management approaches using Data Science, therefore, the analysis of Data Science applications in digital marketing seems to be quite relevant and timely. Key words: digital marketing; digital ecosystem; big data; machine learning, neural networks.
С начала XXI века цифровой маркетинг значительно изменился с точки зрения направлений использования и роста эффективности. Это привело к появлению цифровой экосистемы, которая объединяет пользователей в режиме 24/7 и формирует новые привычки и поведение пользователей. Цифровой маркетинг динамично расширяет набор Интернет-методов, чтобы убедить пользователей купить продукт или услугу. Уже обыденными для электронного бизнеса стали такие технологии, как поисковая оптимизация (SEO) - оптимизация результатов поиска от основных поисковых систем; маркетинг в поисковых системах (SEM) или программная реклама - стратегии спонсирования рекламы в поисковых системах или в рекламных местах на баннерах на веб-сайтах; маркетинг в социальных сетях (SMM) - стратегии взаимодействия с пользователями в социальных сетях с помощью социальной рекламы.
Однако ключевые способы повышения прибыльности или ROI в цифровом маркетинге связаны с применением методов Data Science в цифровой экосистеме, так как они позволяют решить такие вопросы как управление информацией, полученной от потребителей; формирование надежного источника данных о потребителях и компаниях, применение нового анализа данных и инновационных методов для создания знаний. Поэтому для увеличения шансов на успех на платформах цифровых и социальных сетей компаниям следует выявлять неявные закономерности, используя методы искусственного интеллекта (AI) и Machine Learning (ML).
Соответственно, цифровой маркетинг все больше подвержен влиянию в таких областях исследований, как информатика или Computer Science (CS), а также во всех других областях исследований, которые облегчают сбор, упорядочивание и управление данными. Data Science включает улучшение емкости хранения данных компании, проведение маркетинговых исследований и сегментацию потребителей или извлечение ключевой информации о проблемах компании [1]. Как экосистема Data Science включает в себя различные стратегии идентификации шаблонов, модели анализа, показатели эффективности, статистические переменные и технические навыки. Поэтому маркетологи, не имеющие опыта в Data Science, Machine Learning столкнулись с проблемой приобретения таких знаний и навыков и их использования не только технически, но также стратегически и оперативно. Чтобы проанализировать влияние увеличения использования компаниями Data Science в цифровом маркетинге, в работе проведен анализ основных приложений Data Science в цифровой экосистеме и выделены ключевые моменты и альтернативы применению этих методов в цифровом маркетинге.
В настоящее время компании используют Data Science вне зависимости от размера бизнеса, как показывает профессиональная социальная сеть специалистов по работе с данными Kaggle [2]. По их данным, 78% предприятий подтверждают, что количество анализируемой и используемой информации в последнее время значительно возросло. Бизнес понимает, что неструктурированная
информация содержит очень важные для компании знания, способные повлиять на результаты бизнеса, а основная цель Data Science - извлечь знания из анализа данных, чтобы ответить на конкретные вопросы бизнеса. Анализируя данные, методы Data Science позволяют извлекать шаблоны из баз данных для объяснения проблемы или формулирования гипотез. В Data Science ключевая идея состоит в том, что закономерности, выявленные в данных, являются неочевидными и полезными для компаний.
В традиционном маркетинге специалисты могут идентифицировать максимум три атрибута или характеристики элемента (продукта, услуг, потребителей и т. д.) - функции или переменные и построить математическую модель. Однако с помощью шаблонов Data Science можно одновременно идентифицировать сотни и тысячи атрибутов (переменных) [3]. В Data Science существуют различные типы шаблонов, которые могут быть применены к цифровом маркетинге: кластеризация - сегментация в бизнесе, состоит из идентификации поведения, вкусов или привычек, которые идентифицируют одну и ту же группу потребителей среди других; разработка правил ассоциации (ARM), которая состоит из идентификации шаблонов приобретенных продуктов; шаблоны прогнозирования, которые прогнозирует недостающее значение атрибута (продукта, услуги и т. д.) вместо прогнозирования будущего.
В зависимости от целей компании в цифровом маркетинге различные типы шаблонов могут использоваться для улучшения этих стратегий, а также для улучшения способность компании понимать и структурировать основные атрибуты, функции или переменные, извлеченные из баз данных компаний. В этом смысле тип собираемых данных также важен с точки зрения компании, поскольку разработанные стратегии, нацеленные на цифровые платформы и социальные сети, должны основываться на больших данных (Big Data). Большие данные характеризуются чрезмерным объемом данных, разнообразием типов данных и скоростью, с которой данные должны обрабатываться.
Основа Big Data в том виде, в котором они существуют сегодня, была заложена Реляционной моделью данных (RDM) Кодда (1971), которая позволяла собирать и хранить информацию, а также выполнять прямые запросы к информации в базах данных [4]. Кодд также заложил основы языка структурированных запросов (SQL), текущего стандарта для запросов базы данных. Последние разработки в области хранения данных привели к созданию новых баз данных, известных как базы данных NoSQL. Базы данных NoSQL хранят переменные данные и их атрибуты с помощью таких языков, как JavaScriptObject Notation (JSON). JSON меньше весит, имеет более высокую скорость обработки и самоописания по сравнению с традиционной табличной реляционной моделью SQL.
В Data Science базы данных состоят из различных переменных или индикаторов. Эти базы данных известны как «наборы данных» или «записи данных».
Каждая из переменных, содержащихся в наборах данных, обозначает определенную характеристику. Наборы данных могут содержать структурированные или неструктурированные данные. Структурированные данные могут храниться в таблицах, при этом каждая таблица имеет одинаковую структуру или атрибуты. Напротив, неструктурированные данные имеют собственную внутреннюю структуру, и, следовательно, атрибуты могут быть организованы по-разному в каждой таблице. Атрибуты иногда берутся из необработанных данных. Для анализа наборов данных Data Science использует модели, основанные на машинном обучении (Machine Learning) - алгоритмы для автоматического анализа больших наборов данных. Маркетологи могут обучить эти модели извлечению маркетинговых идей и выявлению закономерностей поведения потребителей. Эти алгоритмы можно использовать и обучать, подключаясь к базам данных компаний.
В цифровом маркетинге Machine Learning превратился в так называемое глубокое обучение (Deep Learning), технологию, которая позволила изменить то, как компьютеры обрабатывают язык и изображения. Deep Learning - это новейшая форма Machine Learning в цифровом маркетинге, которая состоит из набора моделей нейронных сетей с несколькими уровнями и модулями в одной сети [5]. Также в цифровом маркетинге используются и другие подходы к данным с использованием машинного обучения: ансамблевые модели (Ensemble of models) для прогнозирования с использованием источника моделей, где каждая модель голосует по каждому запросу; нейронные сети с глубоким обучением, которые имеют разные уровни сетей, обнаруживают закономерности и могут обучаться; машинное зрение (Machine vision), которое внутри нейронных сетей с глубоким обучением позволяет визуально идентифицировать и распознавать объекты, людей, продукты в области анализа текста и предопределенных шаблонов; Natural-lenguage processing (НЛП) работает с языком и текстом, чтобы выявлять идеи, которые объясняют шаблоны, не идентифицируемые людьми.
В цифровом маркетинге в области машинного обучения существует два основных типа аналитических подходов: контролируемое обучение (Supervised learning) и неконтролируемое обучение (Unsupervised learning) - машинное обучение с использованием наборов данных без определенной структуры [6]. Supervised learning (SL) - действие Machine Learning, которое позволяет алгоритму сопоставлять вход и выход, обычно известные как пары вход-выход. идентификации для ранее необнаруженных шаблонов в наборе данных без ранее существовавших меток. SL включает в себя обучение набора образцов, включая фрагменты текста, пользовательский контент (Usergenerated content, UGC), сообщения в Facebook, отзывы по поводу продукта и т. д. Все эти данные в цифровом маркетинге можно использовать для обучения алгоритма. Как только ожидаемая скорость (точность) алгоритма будет достигнута, алгоритм, работающий с машинным обучением, может автоматически
выполнять маркетинговые исследования. В отличие от контролируемого обучения (Supervised learning), неконтролируемое обучение автоматически определяет образцы, которые еще не были обнаружены в данных. В этом случае контроль человека минимален. Алгоритмы, которые работают с Machine Learning, называются машинами опорных векторов (SVM), известными как одноклассовые классификаторы [7]. SVM проверяет набор данных, чтобы определить основные характеристики и аналогичное поведение экземпляров, составляющих базу данных, и может обучаться на регулярной основе. SVM классифицирует несходные значения экземпляров, чтобы маркетолог мог изучить выявленные аномалии.
Процессы анализа данных должны быть построены с использованием соответствующих концепций. Соответственно, в Data Science были введены концепции интеллектуального анализа данных (Data mining, DM) и обнаружения знаний (knowledge discovery, KD). В настоящее время эти две концепции (DM и KW) используются маркетологами для обозначения стратегий анализа наборов данных.
Data mining - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации) [8]. Сегодня концепция Data mining больше используется в мире бизнеса и маркетинга для обозначения процессов обнаружения и идентификации шаблонов в наборах данных. В цифровом маркетинге известно, что удержание существующего клиента обходится гораздо дешевле для компании, чем привлечение нового. Методы Data Mining позволяют выделить именно тех потенциальных клиентов, на которых нужно сосредоточить свои усилия, чтобы сделать их активными клиентами, то есть чтобы перевести их в другое состояние. Это значительно сэкономит усилия, ресурсы, и, как следствие, повысит прибыльность бизнеса. Представляют также интерес те клиенты, которые вероятно откажутся от услуг компании. Возврат ушедшего клиента оцениваются экспертами в сотни раз превышающими стоимость по удержанию. Поэтому предотвратить уход хорошего клиента - одна из важнейших задач любого успешного бизнеса. Data Mining позволяет своевременно определить собирающихся уходить прибыльных клиентов. Это даст возможность провести эффективную кампанию, нацеленную на удержание таких клиентов.
Напротив, Knowledge discovery, происходит от концепции обнаружения знаний в базах данных (KDD) и сейчас более широко используется в научном мире. Это более техническая концепция для обозначения процессов обнаружения и идентификации шаблонов в наборах данных.
Таким образом, в ходе исследования выявлены основные концепции, методы и показатели производительности, используемые в Data Science на протяжении последних двух десятилетий, и их приложения в цифровом маркетинге, которые маркетологи должны учитывать при рассмотрении стратегии цифрового маркетинга, основанной на анализе данных. Сегодня компании все больше
участвуют в экосистеме, управляемой данными. Соответственно, количество удобных для пользователя приложений на основе машинного обучения, которые могут использовать компании, маркетологи и потребители, значительно увеличилось. Понимание маркетологами основных понятий Data Science необходимо для того, чтобы обеспечить эффективность бизнеса в долгосрочном периоде, поскольку отсутствие такого понимания уже превратилось в проблему навыков, так как предприятия тратят много времени на организацию, обработку и структурирование баз данных своих пользователей и клиентов. Также были определены подходящие методы, используемые в Data Science для извлечения практических сведений из больших объемов данных. Наилучшее использование этих стратегий требует глубокого понимания цифровых технологий маркетинга
Список литературы
1. Customer Data Science: что делать с данными для лучшего понимания клиента. - URL: https:// https://vc.ru/marketing/113767-customer-data-science-chto-delat-s-dannymi-dlya-luchshego-ponimaniya-klienta (дата обращения: 19.05.2021).
2. Новая данность: что такое Data Science и зачем она нужна вашей компании. - URL: https://trends.rbc.ru/trends/industry/cmrm/60740ae09a7 947fd64bbed56 (дата обращения: 19.05.2021).
3. Практическая статистика для специалистов Data Science: Пер. с англ. / П. Брюс, Э. Брюс. - СПб.: БХВ-Петербург, 2018. - 304 с.
4. Базы данных: учебник и практикум для академического бакалавриата / С. А. Нестеров. — М.: Издательство Юрайт, 2016. - 230 с. - Серия: Бакалавр. Академический курс.
5. Шотыло Д.М., Крайнова В.Е., Скурыдин А.В. Тенденции развития искусственных нейронных сетей в цифровой экономике // ЭКОНОМИНФО. 2018. №4. URL: https://cyberleninka.ru/article/ n/tendentsii-razvitiya-iskusstvennyh-neyronnyh-setey-v-tsifrovoy-ekonomike (дата обращения: 20.05.2021).
6. Созыкин Андрей Владимирович Обзор методов обучения глубоких нейронных сетей // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017. №3. URL: https://cyberleninka.ru/ article/n/obzor-metodov-obucheniya-glubokih-neyronnyh-setey (дата обращения: 21.05.2021).
7. И. И. Фролов, Р. Х. Садыхов Построение классификатора на основе машины опорных векторов для распознавания символов // Доклады БГУИР. 2018. №1 (31). URL: https://cyberleninka.ru/ article/n/postroenie-klassifikatora-na-osnove-mashiny-opornyh-vektorov-dlya-raspoznavaniya-simvolov (дата обращения: 21.05.2021).
8. Мосягин Александр Борисович Использование методологии Data Mining при решении задач обработки социальных данных // Мониторинг. 2015. №3 (127). URL: https://cyberleninka.ru/article /n/ispolzovanie-metodologii-data-mining-pri-reshenii-zadach-obrabotki-sotsialnyh-dannyh (дата обращения: 20.05.2021).