Научная статья на тему 'БОЛЬШИЕ ДАННЫЕ И НАПРАВЛЕНИЯ ИХ ИСПОЛЬЗОВАНИЯ В МАРКЕТИНГЕ'

БОЛЬШИЕ ДАННЫЕ И НАПРАВЛЕНИЯ ИХ ИСПОЛЬЗОВАНИЯ В МАРКЕТИНГЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
744
119
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БОЛЬШИЕ ДАННЫЕ / BIG DATA / МАРКЕТИНГ / MARKETING / МАРКЕТИНГОВЫЕ ИССЛЕДОВАНИЯ / MARKETING RESEARCH / РЕКЛАМА / PUBLICITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горелова А.А.

Большие данные, возможности, связанные с их использованием, ещё недостаточно чётко позиционированы в нашем сознании. Целью предлагаемой статьи является систематизация информации в области больших данных, анализ методов и подходов, используемых сегодня в маркетинговой практике (рекламной деятельности, медиаизмерениях, маркетинговых исследованиях), анализ границ и барьеров, стоящих на пути более широкого внедрения технологии, связанной с большими данными. Материалы статьи могут быть использованы при подготовке студентов по программе маркетинг, в частности, при чтении таких дисциплин как интернет- маркетинг, маркетинговые исследования, реклама.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горелова А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «БОЛЬШИЕ ДАННЫЕ И НАПРАВЛЕНИЯ ИХ ИСПОЛЬЗОВАНИЯ В МАРКЕТИНГЕ»

БОЛЬШИЕ ДАННЫЕ И НАПРАВЛЕНИЯ ИХ ИСПОЛЬЗОВАНИЯ В МАРКЕТИНГЕ

Горелова А.А. ©

К.э.н., доцент кафедры информационных технологий и инструментальных методов в экономике Нижегородского государственного университета им. Н.И. Лобачевского

Аннотация

Большие данные, возможности, связанные с их использованием, ещё недостаточно чётко позиционированы в нашем сознании.

Целью предлагаемой статьи является систематизация информации в области больших данных, анализ методов и подходов, используемых сегодня в маркетинговой практике (рекламной деятельности, медиаизмерениях, маркетинговых исследованиях), анализ границ и барьеров, стоящих на пути более широкого внедрения технологии, связанной с большими данными.

Материалы статьи могут быть использованы при подготовке студентов по программе маркетинг, в частности, при чтении таких дисциплин как интернет-маркетинг, маркетинговые исследования, реклама.

Ключевые слова: большие данные, big data, маркетинг, marketing, маркетинговые исследования, marketing research, реклама, publicity.

Большие данные: особенности технологии

Результатом интеллектуальной деятельности людей является лавинообразный рост информации в мире. По данным компании IDC Digital Universe, к середине 2015 года общее количество данных превысило 6,5 зеттабайта (ЗБ). (1 ЗБ = 1024 эксабайта (ЭБ), 1 ЭБ = 1 млрд гигабайтов). По прогнозам к 2020-му году мировой объём информации достигнет 40-44 зеттабайтов, то есть на каждого жителя Земли будет приходиться по 5200 Гб.

Значимыми источниками больших данных являются хранилища бизнес -информации, показания различных датчиков и устройств, интернет (социальные сети, информационные сайты, файлообменники), мобильные устройства и т.д.

Всё более актуальной становится проблема повышения эффективности в использовании больших данных помогут ли они увеличить продажи или сократить расходы бизнеса?

Традиционные технологии хранения, анализа и управления типичными базами данных (БД) далеко не всегда эффективны при работе с большими данными. Это связано с рядом особенностей:

• большие данные находятся в различных хранилищах, что не позволяет использовать привычные инструменты для установления полезных взаимосвязей между ними;

• большие данные не имеют структурированного формата как это характерно для традиционных БД;

• данные непрерывно обновляются.

Обобщая эти особенности, консалтинговая компания Forrester даёт следующее определение: « Большие данные объединяют техники и технологии, которые извлекают смысл на экстремальном пределе практичности [7,с. 163-164].

К отраслевым источникам, генерирующим огромные потоки данных, можно отнести медицинские технологии (различные видео, мониторинг в реальном времени, изображения), телефонию, электростанции, коммунальные службы. В мире появляются технологии "smart grid", позволяющие коммунальным службам ежеминутно и даже ежесекундно измерять десятки тысяч параметров, связанных с потреблением электроэнергии домохозяйствами.

© Горелова А. А., 2017 г.

Растёт использование Big Data государственными и коммерческими секторами с накопленными объёмами данных в сотни терабайт или петабайт.

Мониторинг поведения пользователей на сайтах, покупателей интернет - магазинов, загрузка информации на сайтах, обмен видео, например, через You Tube, генерируют ежедневно огромные массивы информации.

Данные классифицируются как Extremely Big Data, если сроки их хранения исчисляются годами.

Термин big data (большие данные) впервые появился в специальном выпуске журнала Nature, посвященном взрывному росту мировых объемов информации в 2008 году.

Big Data является сегодня важнейшим трендом интернет-маркетинга и IT-индустрии. Специалисты в области технологии Big Data выделяют три основных типа задач [6]:

1. Хранение и управление объемом данных в сотни терабайт или петабайт.

2. Организация неструктурированной информации (текстов, изображений, видео, показаний камер видеонаблюдений, гаджетов и т.д.)

3. Анализ Big Data, включая работу с неструктурированной информацией, генерацию аналитических отчетов, использование прогностических моделей.

Большие данные (из разных источников и различных форматов) хранятся в необработанном виде в так называемых «озёрах» данных (Data lake). Преимущества Data lake:

• данные анализируются в исходном виде;

• «озёра» менее затратны, чем хранилища структурированых данных;

• использовать данные из хранилищ могут одновременно несколько человек.

Big Data (несколько терабайт, петабайт) могут быть сохранены и систематизированы в так называемых распределенных файловых системах. Для управления распределённой файловой системой используются программные средства и стандартное техническое обеспечение. Система Hadoop [7, 7-13], например, предназначена для хранения и управления хранилищами данных в диапазоне от нескольких терабайт до петабайт. Информация хранится на жестких дисках ( их количество может достигать тысячи), на стандартных компьютерах. Каждую порцию информации, для увеличения надёжности, сохраняют несколько раз. Специальная карта map отслеживает место хранения конкретной информации (например, о сделках в сети магазинов). Идея, так называемого, алгоритма Map-Reduce: входные данные распределяются на рабочие узлы, где они предварительно обрабатываются, (map-шаг), а затем они объединяются (reduce-шаг).

Компания Google впервые начала использовать MapReduce. Это позволило распределять крупную задачу по сотням или тысячам серверов и затем собирать множества их ответов в один. В 2004 году Google опубликовала статью о MapReduce, для создания конкурентного рынка и росту интернет-индустрии. Благодаря возросшему спросу Google значительно увеличила свой доход (не менее,чем на 30 процентов).

Hadoop - открытая версия Map Reduc - была активно использована другими компаниями, такими как Amazon, Facebook, Google и NSA и т.д., что значительно снизило стоимость обработки данных. Итогом стало появление платной услуги, получившей название облачные вычисления. Кредитная карта позволяет программистам использовать мощности арендованных компьютеров для решения определённой задачи.

Социальные сети эффективно существуют также благодаря MapReduce и Hadoop. Компании имеют прибыль только от показов рекламы. Для миллиардов же пользователей Facebook, например, бесплатен.

Методы анализа, обработки оцифрованной информации, её представления, а также проектирования баз данных связываются с Data science (наукой о данных) [8]. В последние годы наблюдается коммерциализация Data science и, как следствие, появление в мире высокооплачиваемой профессии data scientist.

Большие данные, благодаря высокой скорости их обработки делают анализ предсказательным в отличие от традиционного описательного бизнес - анализа, что важно

при разработке бизнес - стратегий. Кроме этого, технологии больших данных позволяют анализировать значительно большее количество быстро получаемых и меняющихся сведений различных типов. Это даёт возможность проводить более глубокие исследования.

Технологии, а также методы обнаружения в исходных данных ранее неизвестных закономерностей (data mining), находятся на стыке искусственного интеллекта, статистики и баз данных.

Методы и алгоритмы Data Mining [5, с.18-79] предназначены для анализа неструктурированных данных большого объема и размерности. Корреляции и связи устанавливаются в процессе использования современных методов распознавания образов, других аналитических технологий (деревья принятия решений и классификации, кластеризацию, нейронносетевые методы и т.д.).

Сфера применения Data Mining достаточно широкая и включает в себя маркетинг, бизнес, интернет, промышленность, геология, медицина, телекоммуникации, фармацевтика и т.д.

Например, анализ побочных эффектов лекарств базы данных FDA (Food and Drug Administration - Управление по контролю за пищевыми продуктами и лекарственными препаратами) выявил, что два совместно применяемых лекарства,- антидепрессант пароксетин и правастатин (для понижения уровня холестерина),- могут привести к развитию диабета. Кроме этого, было выявлено сорок семь ранее неизвестных неблагоприятных взаимодействий.

Подробнее о тех изменениях в нашей жизни, которые могут произойти, в связи с использованием больших данных, рассказывается в книге Майер Шенбергера, Кеннет Кукьера с характерным названием « Большие данные. Революция, которая изменит то, как мы живём, работаем и мыслим» [3].

Big Data в маркетинге

Анализ больших данных находит своё применения в маркетинге для прогнозирования спроса, выявления особенностей поведения потребителей, их

сегментирования, разработки маркетинговых и, в частности, коммуникативных стратегий. Сопоставляя такие факторы как сезонность, географию запросов на конкретный продукт можно спрогнозировать сезонный спрос и разработать план по распределению бюджета рекламы на конкретный период в конкретном регионе.

При разработке рекламной кампании необходимо определить целевую аудиторию и разработать контент рекламного обращения. Для выявления целевой аудитории можно опираться как на собственные критерии, так и на данные рекламодателя о посетителях своих сайтов (промо- сайта, соответствующих страниц основного сайта).

Для поиска похожей аудитории используются предиктивные алгоритмы по обучающейся выборке, так называемый Look-alike Яндекс запустил этот особый вид таргетинга Look-alike ещё в 2013 году. Look-alike нацеливает рекламу той аудитории, которая по своим характеристикам и поведением похожа на требуемую, целевую аудиторию. Для понимания «похожести» нужно организовать большую выборку, чтобы более точно задать характеристики о поведении своих клиентов. Собирается информация о тех клиентах, которые совершили определённое действие: скачали прайс- лист или каталог, перешли по ссылке, заказали и оплатили товар и так далее. При небольших объёмах собственной выборки дополнительную информацию можно купить. Например, платформы Visual DNA, Weborama предоставляют различные данные в том числе, о записях пользователей в социальных сетях, их последних покупках.

Чтобы повысить эффективность Look-alike полезно иметь не менее десятков тысяч собственных записей и иметь поставщиков дополнительной информации, которые реально готовы этой информацией делиться.

Эффект Look-alike в социальных сетях, как свидетельствуют практики, будет гораздо меньше в связи с небольшим охватом аудитории. Для нацеливания содержания

рекламного обращения на конкретного пользователя используется персонализация email-рассылок, товарные рекомендации на сайте, динамический ретаргетинг.

Суть динамического ретаргетинга заключается в том, что реклама даётся только тем участникам сообщества, которые вступили туда недавно. Это связано с особенностью индивидуальных интересов участников, которые и учитывает реклама. Если участник покинет сообщество, то продолжение рекламы потеряет смысл.

Применение Big Data,, развитие поведенческого таргетирования привели к появлению технологии RTB-аукциона — Real Time Bidding [1] В соответствии с этой технологией продажа и покупка рекламных показов происходит на основе аукциона. Сайт рекламодателя привязан к определённому RTB- агентству. Пользователь вводит в строке браузера интересующий его запрос. Сайт отправляет запрос на просмотр рекламного объявления и данные пользователя для таргетирования (пол, возраст, интересы) в RTB-агентство. Запрос классифицируется по ряду параметров (данные о площадке, на которую совершён вход, времени входа, данных о клиенте и т. д). Информация о клиенте, которому показывается реклама, определяется на основе данных cookie и его интернет-истории.

Рекламодатели-участники аукциона, получают запрос на показ рекламы и предлагают свои ставки. Право на показ рекламы получает тот, кто предложит максимальную цену. При этом победитель платит не максимальную, а вторую (из всех предложенных) по величине цену. Это возможно, когда участники аукциона не знают ставок друг друга.

Технология RTB-аукциона позволяет рекламодателям контролировать

ценообразование и нацеливать рекламу только заинтересованным потребителям. Это значительно её отличает от контекстной и медийной рекламы, когда обеспечивается продажа определённого числа показов.

Содержание рекламы, её цветовое решение динамично меняется в соответствии с потребностями клиента, его демографическими характеристиками, уровнем лояльности. Постоянные клиенты могут получить более выгодные условия.

Реклама RTB эффективна в случае недорогих брендов и при значительном охвате аудитории. Специалисты не рекомендуют использовать технологию онлайн-аукциона для престижных брендов, чтобы не подорвать их репутацию.

В России, на торгах наиболее активны рекламодатели из сферы e-commerce , крупные банки (Сбербанк, «Банк Тинькофф Кредитные Систем).

Большие данные определяют и одну из важнейших современных тенденций маркетинговых исследований. Огромными массивами данных о потребителях располагают интернет-провайдеры, сотовые операторы, маркетинговые агентства и т.д. Исследовательские компании имеют онлайн - панели в сотни тысяч респондентов, а специализированные агентства до 600 тысяч.

Онлайн исследования наиболее эффективны при тестировании рекламы, продуктов, ценовых исследований. исследованиях лояльности. Данные о поведении потребителей в интернете (поисковые запросы, посещенные страницы, просмотренная реклама), накопленные на базе онлайн панелей являются основой для сегментирования потребителей и разработке как стратегий продвижения так и медиа стратегий для соответствующих площадок в интернете.

Актуальной становится проблема организации работы с большими данными, применение новых методов их обработки и анализа. В целях интеграции, синтеза данных из различных источников используется так называемый подход data fusion. Для прогнозирования продаж, например, можно объединить данные различных панелей-потребительских, торговых, специализированных ( например, врачей).

Благодаря подходу single source появилась возможность работать с потоками информации из одного источника (от одного респондента). Немалый интерес вызывают данные о поведении и покупках одного и того же респондента в интернете. Для получения

таких данных участникам панелей устанавливают специализированные программы. Для контроля за телесмотрением тех же участников используются автоматизированные технические устройства, так называемые человеко-счётчики или пиплметры.

Для исследования данных о телесмотрении в целом применяется анализ возвратных данных кабельных операторов (return path data) [4].

Современная технология медиаизмерений предполагает интеграцию больших данных от цифровых тюнеров, интернет-счётчиков, контролирующих поведение пользователей интернета, ТВ, а также данных традиционных выборочных опросов, позволяющих определить демографические данные этих пользователей.

Достаточно прогрессивной является технология сингл-сорс-исследований (single source) [4], позволяющая измерять медиа-активности человека по одной выборке. Один и тот же контент, например, кинофильм можно увидеть не только на экране компьютера, но и в онлайн -кинотеатре, интернете, другим каналам распространения - в приложениях на СМАРТ ТВ, планшетах и смартфонах. Сингл-сорс-исследование позволяет отследить разноплановое медиа- потребление участников выборки.

В России в качестве первых шагов в использовании этой технологии была создана (в рамках общей панели ТВ-измерений) субпанель TNS для измерения просмотра ТВ -программ на компьютере.

Примером успешной реализации сингл-сорс-исследования кроссплатформенного измерения телепросмотра является компания Nielsen в США. Замеряется не только просмотр телепередач, но и просмотр телеконтента на различных платформах и экранах ( DVR (цифровой видеорекордер), сервисы VOD операторов платного телевидения, ТВ-приставки с выходом в Интернет а также компьютеры, планшеты и смартфоны).

Большие данные не заменяют исследования, но они являются информационной основой для проведения более глубоких и кратких опросов.

Социальные сети являются источниками большого количества маркетинговой информации [2, с.37-41,8] и, прежде всего, о пользователях, включая как их идентификационные данные, так и различные дополнительные данные ( интересах, увлечениях, способе проведения досуга, уровне образования, друзьях, покупках и т.д. Развитие технологии больших данных создали новые возможности для интегрирования и обогащения различных сведений о пользователях социальных сетей

Например, российская система ForSMedia, предназначенная для анализа социальных сетей даёт возможность формировать профили клиентов , базируясь как на данных, заданных в социальных сетях, так и на многочисленных сведениях, которые пользователи оставляют в группах подписки, различных сообщениях, постах. Углублённый анализ социальных сетей позволяет разрабатывать новые подходы в управлении брендом, давать рекламу, соответствующую интересам, пользователей, предлагать новые каналы сбыта.

Российский рынок, связанный с большими данными, находится в стадии становления. Заметным российским трендом в сфере технологии больших данных является их проникновение в новые области использования, например, в производство. Для многих компаний мотивирующим фактором является возможность повышения показателей своей эффективности и конкурентоспособности.

Руководители российских компаний отмечают ряд барьеров, препятствующих развитию рынка биг дата:

• отсутствие специалистов, владеющих инструментами и методами обработки больших;

• отсутствие опыта внедрения и, соответственно, знаний о возможных выгодах от использования Big Data;

• проблемы качества и количества данных, накопленных у потенциального заказчика. Нередко имеющиеся данные не пригодны для анализа, и выгоды для компании в этом случае выглядят достаточно сомнительно;

• не всегда ясно, как и для каких целей использовать накопленную информацию. В тоже время, инновации, связанные с накоплением больших данных, эффективным

их использованием, становятся уже сегодня стратегически значимыми для развития

российских компаний и повышения их конкурентоспособности.

Литература

1. Васева М. Технологии Real Time Bidding и Programmatic в мире интернет-рекламы.// Онлайн-агентство performance-маркетинга. [Электронный ресурс]. Режим доступа: http://www.marketing.spb.ru/lib-research/methods/Big_Data.htm https://1ps.ru/blog/promotion/2016/texnologii-real-time-bidding-i-programmatic/

2. Вэй Тан, Брайан Блейк, Иман Салех. Аналитика Больших Данных и социальные сети // Открытые системы.СУБД. — 2013. — № 8. — С. 37-41. Режим доступа: http://www.osp.ru/os/2013/08/13037856

3. Майер Шенбергер, Кеннет Кукьер. Большие данные. Революция, которая изменит то, как мы живём , работаем и мыслим . - М.: Манн, Иванов и Фербер, 2014.- 240 с.

4. Полуэхтова И.А. Исследования аудитории и медиапотребления в цифровой среде: методологические и практические проблемы // Медиаскоп. 2016. Вып. 4. Режим доступа: http: //www.mediascope. ru/2199

5. Рафалович В. Data mining или интелектуальный анализ данных для занятых. Практический курс.- [Электронный ресурс] Режим доступа: 978-5-9791-0311-2, 2016.- 110 с.

6. Работа с Big Data: основные области и возможности//Энциклопендия маркетинга- [Электронный ресурс]. Режим доступа: http://www.marketing.spb.ru/lib-research/methods/Big_Data.htm http://datareview.info/article/bolshie-dannyie-vs-biznes-analitika

7. Сергеева И.И., Шапиро О. С. Особенности использования технологии big data //Экономическая среда . Изд-во: Орловский государственный университет экономики и торговли. 2014.- №2.-с. 163-164 .

8. Силен Д., Мейсман А., Али М. Основы Data Science и Big Data. Python и наука о данных.-[Электронный ресурс]. Режим доступа: 978-5-496-02517-1, -2017. -336с.

9. Shvachko, Konstantin Apache Hadoop. The Scalability Update (англ.). — 2011. — Vol. 36, no. 3. — P. 7—13. — ISSN 1044-6397.

i Надоели баннеры? Вы всегда можете отключить рекламу.