УДК 339.138 + 658.8 ББК У584.3
ОБЩИЙ ПОДХОД К АНАЛИЗУ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ В МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЯХ
А.И. Глушков
Статья посвящена вопросам проявления причинно-следственных связей в решении задач управления предприятием, то есть отыскания эффективных «рычагов управления». Для классической маркетинговой информационной системы рассмотрены вопросы общепринятого программного прикладного оснащения, а также технологии анализа, выявляющие причинно-следственные связи: АВС-анализ; корреляционно-регрессионный анализ как основа совместного анализа взаимосвязанных данных; факторный анализ, позволяющий определить статистически значимые связи в поведении случайных величин.
Ключевые слова: причинно-следственные связи, маркетинговая информационная система, корреляционный и регрессионный анализ, факторный анализ.
Внутреннюю и внешнюю деятельность любой организации увязывает маркетинг, выступающий в качестве реальной системы координации взаимодействия всех субъектов, входящих в систему производства и сбыта товаров и услуг.
Основой маркетинга служит двуединый и взаимодополняющий подход. С одной стороны -тщательное и всестороннее изучение рынка, спроса, вкусов и потребностей, ориентация производства на эти требования, адресность выпускаемой продукции; с другой - активное воздействие на рынок и существующий спрос, на формирование потребностей и покупательских предпочтений.
Эффективность соответствующих маркетинговых решений в первую очередь определяется правильным и своевременным воздействием «рычагами управления» на объект управления, что определяет необходимость выявления причинноследственных связей в каждой конкретно решаемой проблеме.
В классической функциональной схеме маркетинговой информационной системы за сбор исходной информации отвечают следующие основные подсистемы: подсистема внутренней отчетности (анализа внутренней информации - как правило, класс ERP-систем); подсистема маркетингового наблюдения (маркетинговой разведки) и подсистема маркетинговых исследований. А в задачи объединяющей подсистемы - обеспечения маркетинговых решений, как раз и входит на первом этапе анализа круг вопросов по определению наиболее эффективных, статистически значимых «рычагов управления» проблемой [1].
Для решения отмеченных задач, возникающих в процессе совместного анализа внутренней и внешней информации, в основном используется программное обеспечение класса BI (Business Intelligence - деловая разведка), а также CRM (системы управления взаимоотношениями с клиентами). В зависимости от сложности проявляющихся проблем управления в прикладном программном
обеспечении используются следующие общепринятые технологии анализа, выявляющие причинно-следственные связи: АВС-анализ как подход «здравого смысла» управленческого персонала в стабильно процветающем бизнесе; корреляционно-регрессионный анализ как основа совместного анализа взаимосвязанных данных; факторный анализ (а также кластерный и дискриминантный анализы в последующем), позволяющий определить статистически значимые связи в поведении случайных величин.
Следует отметить, что анализ только одной величины без учета влияния многих взаимосвязанных факторов в единой коммерческой структуре не представляет интереса с точки зрения управления кампанией, так как не раскрывает причинноследственных связей - рычагов управления, а даже наоборот - подразумевает, что в стиле управления кампанией не предполагается никаких изменений. К таким технологиям анализа можно отнести чистое прогнозирование, как трендовое, так и авторегрессионное, а также статистический анализ с определением доверительного интервала для значений всей генеральной совокупности по результатам анализа выборки.
Рассмотрим естественный подход аналитика-управленца в постепенном проявлении глубины причинно-следственных связей для целенаправленного управления анализируемой проблемой, а также сферы применения каждого технологического метода анализа.
1. АВС-анализ основывается на принципе дисбаланса, при проведении которого строится график зависимости совокупного эффекта от количества элементов. Такой график называется кривой Парето, кривой Лоренца или АВС-кривой. По результатам анализа ассортиментные позиции ранжируются и группируются в зависимости от размера их вклада в совокупный эффект. В логистике АВС-анализ обычно применяют с целью отслеживания объёмов отгрузки определённых
артикулов и частоты обращений к той или иной позиции ассортимента, а также для ранжирования клиентов по количеству или объёму сделанных ими заказов.
По сути, АВС-анализ - это ранжирование ассортимента по разным параметрам. Ранжировать можно и поставщиков, и складские запасы, и покупателей, и длительные периоды продаж - всё, что имеет достаточное количество статистических данных. Также метод АВС широко используется при планировании и формировании ассортимента на различных уровнях гибких логистических систем, в производственных системах, системах снабжения и сбыта. Таким образом, результатом АВС-анализа является группировка объектов по степени влияния на общий результат, с проявлением наиболее и наименее сильно влияющих групп выделенных в анализе объектов.
Как метод анализа, АВС-анализ можно отнести к предварительным подходам в области выделения причинно-следственных связей, когда результатом является группировка влияющих на проблему факторов без детального анализа частного влияния каждого из них на конечный результат.
2. Корреляционно-регрессионный анализ. В общей методике множественного регрессионного анализа корреляционный анализ выступает как предварительная стадия попарного анализа всех взаимовлияющих величин. В профессиональных прикладных пакетах типа 8Р88 корреляционный анализ может выступать как отдельный подход в проявлении силы и характера взаимовлияния факторов с проявлением статистической значимости полученных результатов. Также следует отметить разнообразие подходов в определении значений коэффициентов корреляции в зависимости от условий проведения эксперимента и получения исходных статистических данных:
- параметрический и непараметрический методы, различающиеся предположением о близости закона распределения случайной величины к нормальному;
- парные и частные коэффициенты корреляции, различающиеся учетом влияния прочих величин на силу связи двух анализируемых.
В конечном итоге, анализируя различия значений коэффициентов корреляции в разных вышеуказанных подходах, также можно получить интересную дополнительную информацию о характере попарных взаимовлияний. Так, значительное различие парного и частного коэффициента корреляции говорит о сильном влиянии других величин на силу связи двух анализируемых факторов [2].
Сам множественный регрессионный анализ подразумевает в конечном итоге построение модели влияния множества предикторов - независимых факторов, на зависимую переменную. Причем направление причинно-следственных влияний определяет сам аналитик еще на стадии планирования эксперимента.
Модели регрессии желательно получать в наиболее простом виде, но, конечно же, удовлетворяющими минимальным требованиям к их достоверности. Общепринятым показателем качества модели регрессии в парном варианте выступает квадрат коэффициента корреляции, а в множественном - коэффициент детерминации, числовое значение которого показывает процент изменчивости (дисперсию) зависимой переменной, определяемый полученным уравнением регрессии.
Общепринятые варианты моделей регрессии следующие:
- для простого анализа (две величины) - простая линейная, изредка применяют простую нелинейную, если линейная модель не удовлетворяет аналитика по достоверности аппроксимации;
- для множественного анализа - множественная линейная; нелинейные влияния учитываются как доля взаимовлияния независимых величин (предикторов) в профессиональном инструментарии типа SPSS;
- при наличии временного сдвига между анализируемыми величинами - линейные модели с учетом лагов (временных сдвигов) как в простом, так и множественном варианте.
С точки зрения применяемого инструментария следует отметить большую ограниченность табличного процессора Excel, позволяющего проводить только парный анализ без учета лагов. Но для предварительной стадии анализа часто аналитики удовлетворяются его возможностями.
Для профессионального анализа причинноследственных связей во множественном подходе общепринятым инструментом считается пакет SPSS, позволяющий строить не только множественные модели с оценкой нелинейной составляющей, но и определять статистическую значимость как модели в целом, так и влияния каждого предиктора по отдельности. Но при наличии временных сдвигов в анализируемых величинах пакет SPSS бесполезен. В этой ситуации необходимо применять профессиональный инструментарий маркетолога - как, например, пакет Marketing Analytic, позволяющий определить не только лаги по каждому предиктору в отдельности, но также и рассчитать коэффициенты чувствительности и их значимость для всех предикторов.
Конечная цель получения достоверной и качественной модели регрессии состоит в ее применении для последующего прогнозирования зависимой переменной по желаемым значениям независимых величин, или же наоборот. Но в случае сложных моделей обратное прогнозирование - по желаемому значению зависимой переменной определение значений предикторов, не всегда представляется возможным. Но пакет Marketing Analytic как раз и реализует программно эту возможность, что является его большим преимуществом перед другими классическими профессиональными пакетами.
Маркетинг
С точки зрения анализа причинно-следственных связей имеющихся величин корреляционно-регрессионый анализ является наиболее полным, особенно с учетом возможностей современного прикладного инструментария.
Развитие же этого подхода в виде факторного анализа позволяет не только фиксировать взаимовлияние величин, но и изменять (редуцировать) предикторы, переходя в новое, как правило -меньшее по размерности, пространство умозрительных факторов, которые определяют основную долю влияния на проблему. Дальнейшее развитие в виде кластерного и дискриминантного анализа, основывающееся на сокращении числа переменных, позволяет уже дать общие объединяющие характеристики групп в исходных данных, например: объединять самих респондентов, дающих ответы на вопросы анкет, в группы по схожести/различию их содержания.
Следует отметить, что в настоящее время факторный анализ включён во все современные пакеты статистической обработки данных - R, SAS, SPSS, Statistica и т. д.
3. Факторный анализ впервые возник в психометрике и в настоящее время широко используется не только в психологии, но и в социологии, в экономике, статистике и других науках. Основные идеи факторного анализа были заложены английским психологом и антропологом, основателем евгеники Гальтоном Ф. (1822-1911), внесшим также большой вклад в исследование индивидуальных различий [3].
Факторный анализ позволяет решить две важные проблемы исследователя:
- определение взаимосвязей между переменными (классификация переменных);
- сокращение числа переменных.
При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие, происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.
Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов (МГК). Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов.
В качестве примера на рисунке изображено весовое перераспределение старых 6 компонентов, сильно коррелирующих между собой, в два новых фактора, а также графическая иллюстрация их соответствия. Откуда следует, что первый новый
Соmponent*
1 2
VI -,151 ,930
V2 ,951 -,230
VЗ -,068 ,898
V4 ,961 ,107
V5 -,166 -,881
V6 ,978 ,039
1,0
0,0
CN
С
Ф
С
о
CL
Е
о
О
-1,0
-1,0
-v4
v5
-,5
0,0
v4
J
v2
1,0
Component 1
Перераспределение шести компонентов в два фактора
5
фактор объединяет в себя 2, 4 и 6 компоненты, а второй фактор - 1, 3 и 5 в инверсии компоненту.
Изложенные выше особенности анализа причинно-следственных связей не ограничивают инициативы маркетолога-аналитика и творческого применения прочих технологических приемов обработки данных маркетинговых исследований. В целом же рассмотренный подход последовательного проявления знаний о взаимовлиянии анализируемых величин может выступать как основа в подобных маркетинговых исследованиях.
Литература
1. Успенский, И. В. Интернет-маркетинг: учебник / И.В. Успенский. - СПб.: СПГУЭ-ИФ, 2006. - 553 с.: ил.
2. Хили, Дж. Статистика. Социологические и маркетинговые исследования. 6-е изд. / под общей ред. А.А. Руденко; пер. с англ. - Киев: ООО «Диа-СофтЮП»; СПб.: Питер, 2005. - 638 с.: ил.
3. Главные компоненты и факторный анализ.
- http://www.statsoft.ru/home/textbook/modules/ stfacan.html.
Поступила в редакцию 9 октября 2012 г.
Глушков Александр Иванович. Кандидат технических наук, доцент кафедры «Маркетинг и менеджмент», Южно-Уральский государственный университет (г. Челябинск). Область научных интересов - информационные технологии, анализ экономической информации, исследование социально-экономических процессов. Контактный телефон: 8-950-736-25-37, e-mail: [email protected]
Alexsander I. Glushkov is a candidate of economic sciences, associate professor of marketing and management department, South Ural Stale University (Chelyabinsk). The area of academic interests - information technologies, economic data analysis, study of social and economic processes. Contact telephone number: +7-950-736-25-37, e-mail: [email protected]