Научная статья на тему 'Сегментация потребителей с помощью кластерного анализа'

Сегментация потребителей с помощью кластерного анализа Текст научной статьи по специальности «Математика»

CC BY
488
149
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕГМЕНТАЦИЯ / КЛАСТЕРНЫЙ АНАЛИЗ / МЕТОД СРЕДНЕЙ СВЯЗИ / МЕТОД ВАРДА / WARD''S METHOD / ДЕНДОГРАММА / SEGMENTATION / CLUSTER ANALYSIS / AVERAGE METHOD OF COMMUNICATIONS / DENDOGRAM

Аннотация научной статьи по математике, автор научной работы — Бардина Н.Ю., Федюшин Н.А.

В статье раскрываются аспекты сегментации потребителей с помощью кластерного анализа. Рассмотрены основные этапы и процедуры кластерного анализа, приведены рекомендации по интерпретации полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бардина Н.Ю., Федюшин Н.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Segmentation using cluster analysis

The article describes aspects of consumer segmentation using cluster analysis. The basic steps and procedures of cluster analysis, some recommendations for the interpretation of the results.

Текст научной работы на тему «Сегментация потребителей с помощью кластерного анализа»

New university

Economics & Law 2015. № 5 (51)

ISSN 2221-7347

УДК 316.422.42

Н.Ю. Бардина , Н.А. Федюшин

СЕГМЕНТАЦИЯ ПОТРЕБИТЕЛЕЙ С ПОМОЩЬЮ КЛАСТЕРНОГО АНАЛИЗА

В статье раскрываются аспекты сегментации потребителей с помощью кластерного анализа. Рассмотрены основные этапы и процедуры кластерного анализа, приведены рекомендации по интерпретации полученных результатов.

Ключевые слова: сегментация, кластерный анализ, метод средней связи, метод Варда, дендограмма.

Исходным пунктом инновационного маркетингаявляется маркетинговое исследование. Главная цель маркетингового исследования заключается в разработке концепции общего представления о структуре и закономерностях динамики рынка и об обосновании необходимости и возможностей конкретной фирмы для более эффективной адаптации её производства, технологии и структуры, а также выводимой на рынок продукции или услуг к спросу и требованиям конечного потребителя. В самом общем виде процесс маркетингового исследования включает в себя ряд этапов:

1) формулировка проблемной ситуации (формирование гипотезы);

2) получение, сбор данных;

3) обработка и подготовка информации;

4) подведение итогов.

Следующим важным этапом является сегментация рынка. Сегментация может быть проведена различными методами, том числе кластерным анализом.

Кластерный анализ. Кластерный анализ - это общее название множества вычислительных процедур, используемых при создании классификации. Результатом процедур является образование кластеров или групп очень похожих объектов. Таким образом, кластерный анализ (классификационный анализ или численная таксономия) - это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы.

Кластерный анализ в маркетинге используют для следующих целей:

1) сегментация рынка;

2) понимание поведения покупателей (идентификация однородных групп покупателей);

3) определение возможностей нового товара (определение конкурентоспособных товаров в пределах данного рынка).

Проведение кластерного анализа включает следующие этапы:

1) формулировка проблемы (выбор переменных). Определение набора переменных, на базе которых будет проводиться кластеризация. Выбранный набор переменных должен описывать сходство между объектами с точки зрения признаков, имеющих отношение к данной проблеме исследования.

2) выбор способа измерения расстояния или меры сходства

Цель кластеризации - группирование несхожих объектов, поэтому для того, чтобы оценить, насколько они похожи или непохожи, необходимо использовать некую единицу измере- * **

© Бардина Н.Ю., Федюшин Н.А., 2015.

DOI: 10.15350/2221-7347.2015.5

Бардина Наталья Юрьевна - старший преподаватель кафедры «Менеджмент организаций», Московский государственный индустриальный университет.

** Федюшин Никита Александрович - старший преподаватель кафедры «Менеджмент организаций», Московский государственный индустриальный университет.

25

Новый университет

Экономика и право 2015. № 5 (51)

ISSN 2221-7347

ния. Наиболее часто в качестве такой меры используется расстояние между двумя объектами. Объекты с меньшими расстояниями между собой больше похожи, чем объекты с большими расстояниями. Наиболее часто используемая мера сходства - евклидово расстояние, определяемое как

где dij - расстояние между объектами i и j;

xip - значение p-переменой для i-го объекта; xjp - значение p-переменой для j -го объекта; p = 1 до k - количество переменных.

Результатом вычисления евклидовых расстояний является матрица размерностью n x n, где n -число объектов. На пересечениях строк и столбцов находится расстояние между объектами.

3) выбор метода кластеризации. Наиболее простыми являются методы иерархической аг-ломеративной кластеризации. Кластеризация начинается с каждого объекта в отдельном кластере. Кластеры объединяют, группируя объекты каждый раз во всё более и более крупные кластеры. Этот процесс продолжают до тех пор, пока все объекты не станут членами одного единственного кластера. Изо всех иерархических методов наилучшие результаты показывают:

а) метод одиночной связи начинает процесс кластеризации с поиска двух наиболее похожих объектов в матрице сходства. По правилу объединения для метода одиночной связи новый кандидат на включение в состав кластера присоединяется к существующей группе в том случае, если он имеет наивысший уровень сходства с каким-либо из членов этой группы. Другими словами, для объединения двух объектов требуется только одна связь между ними.

б) метод средней связи, в основе которого лежит среднее значение всех расстояний, измеренных между объектами двух кластеров, при этом в каждую пару входят объекты из разных кластеров;

в) метод Варда (Уорда). Данный метод построен таким образом, чтобы минимизировать внутриклассовую дисперсию. Кластеры формируют таким образом, чтобы минимизировать квадраты евклидовых расстояний до кластерных средних. Для каждого кластера вычисляют средние всех переменных. Затем для каждого объекта вычисляют квадраты евклидовых расстояний до кластерных средних. Эти квадраты расстояний суммируют для всех объектов. На каждой стадии объединяют два кластера с наименьшим приростом в полной внутриклассовой дисперсии.

Результатом выполнения метода Варда является денограмма (рис. 1).

Читают дендограмму снизу вверх. Горизонтальные линии показывают кластеры, объединяемые вместе. Положение линии относительно шкалы расстояния показывает расстояния, при которых кластеры объединили. Поскольку многие расстояния на первых стадиях объединения примерно одинаковой величины, трудно описать последовательность, в которой объединили первые кластеры. Однако понятно, что на последних двух стадиях расстояния, при которых кластеры должны объединиться, достаточно большие. Эта информация имеет смысл при принятии решения о количестве кластеров.

4) принятие решения о количестве кластеров.

Твёрдых правил, позволяющих быстро принять решение здесь нет, однако можно руководствоваться следующими:

а) необходимо руководствоваться практическими и теоретическими соображениями;

б) в качестве критерия можно использовать расстояния, при которых объединяют кластеры. Так, резкое увеличение меры расстояния свидетельствует об образовании нового кластера;

в) относительные размеры кластеров должны быть достаточно выразительными;

к

d = У (Х

V Л Z—i v 1

V p=i

ip

2

26

New university

Economics & Law 2015. № 5 (51)

ISSN 2221-7347

г) можно построить график зависимости отношения суммарной внутригрупповой дисперсии к межгрупповой дисперсии от числа кластеров. Точка, в которой наблюдается изгиб или резкий поворот, указывает на приемлемое число кластеров.

ш

d6

d5

1 3 4 2 5 6 7 8 14 12 13 .. n

Рис. 1. Дендограмма метода Варда

5) интерпретация и профилирование кластеров. Включает проверку кластерных центроидов. Центроиды представляют средние значения объектов, содержащихся в кластере по каждой из переменных.

Библиографический список

1. Дюран Б., Одел П. Кластерный анализ. - М.: Финансы и статистика., 1977. - 128 с.

2. Ким Дж-О., Мьюллер Ч.У. Факторный, дискриминантный и кластерный анализ. - М.: Финансы и статистика., 1989. - 215 с.

3. Ламбен Жан-Жак Стратегический маркетинг. Европейская перспектива. Пер. с французского. -СПб.: Наука, 1996. - 589 с.

4. Нэреш К.Малхотра. Маркетинговые исследования. Практическое руководство. - М: Вильямс, 2003. - 957 с.

UDC 316.422.42

N.Yu. Bardina, N.A.Fedyushin

SEGMENTATION USING CLUSTER ANALYSIS

The article describes aspects of consumer segmentation using cluster analysis. The basic steps and procedures of cluster analysis, some recommendations for the interpretation of the results.

Keywords: segmentation, cluster analysis, average method of communications, ward’s method, dendogram.

27

i Надоели баннеры? Вы всегда можете отключить рекламу.