Научная статья на тему 'Кластерный анализ на стадии сегментирования в процессе маркетинговых исследований'

Кластерный анализ на стадии сегментирования в процессе маркетинговых исследований Текст научной статьи по специальности «Математика»

CC BY
282
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕР / СЕГМЕНТ / ДЕНДОГРАММА / МЕТРИКА / МАТРИЦА РАССТОЯНИЯ

Аннотация научной статьи по математике, автор научной работы — Ермолаев Г. Н.

В данной статье рассматривается методика проведения кластерного анализа в процессе маркетинговых исследований. В статье описывается метод иерархического кластерного анализа на основе построения дендограмм для малых архитектурных форм.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Кластерный анализ на стадии сегментирования в процессе маркетинговых исследований»

Ермолаев Г.Н.

Аспирант, кафедра экономики и менеджмента, Камская государственная инженерно-экономическая академия, г.Набережные Челны

КЛАСТЕРНЫЙ АНАЛИЗ НА СТАДИИ СЕГМЕНТИРОВАНИЯ В ПРОЦЕССЕ МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЙ

Аннотация

В данной статье рассматривается методика проведения кластерного анализа в процессе маркетинговых исследований. В статье описывается метод иерархического кластерного анализа на основе построения дендограмм для малых архитектурных форм.

Ключевые слова: кластер, сегмент, дендограмма, метрика, матрица расстояния

Одной из ступеней сегментации в процессе маркетингового исследования является разделение потребителей по отношению их к продукции. При решении задачи сегментирования рынка по достаточно большому числу показателей, прогнозирования конъюнктуры рынка отдельных товаров, изучении и прогнозировании экономической депрессии и многих других проблем происходит столкновение с многомерностью описания социально-экономических явлений. В связи с этим современная маркетинговая деятельность не может не учитывать потребительских мотивов.

Впервые в 1939 году описание кластерного анализа было сделано исследователем Трионом. Главное назначение кластерного анализа - разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Методы кластерного анализа можно применять в самых различных случаях, даже в тех случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству. Проводя кластерный анализ и принимая на его основе какие либо маркетинговые решения необходимо оценивать размеры кластеров не только в количестве потребителей, но и в объеме их потребления [2].

Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их компактными и наглядными.

Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения. В частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов за счет замены их характеристиками обобщенных значений параметров кластера [4].

По нашему мнению наиболее близкое определение кластерного анализа представляет собой многомерную статистическую процедуру, выполняющую сбор данных, содержащих их информацию о выборке объектов, и затем упорядочивающая объекты в однородные группы (кластеры) [5]. Кластерами называют сегменты потребителей, сгруппированные по отношению к продукту и близкие между собой по присущим им общим свойствам.

Сегодня существует достаточно много методов кластерного анализа. Методы кластерного анализа подразделяются на иерархические и итерационные. Наибольшей популярностью пользуются итерационные методы, при анализе результатов

социологических исследовании рекомендуется осуществлять анализ методами иерархического агломеративного семеИства. Одним из методов иерархического агломеративного семеИства является метод Уорда, при котором внутри кластера оптимизируется минимальная дисперсия, в итоге создаются группы одинаковых размеров. Главным итогом иерархического кластерного анализа является дендрограмма или «сосульчатая диаграмма». ОдноИ из проблем такого анализа выступает отсутствие однозначных критериев выделения групп объектов [7]. Дендограмма - это графическое изображение результатов процесса последовательной кластеризации, которая осуществляется в терминах матрицы расстояний. С помощью дендограммы можно графически или геометрически изобразить процедуру кластеризации при условии, что эта процедура оперирует только с элементами матрицы расстояний или сходства. В дендограмме объекты располагаются вертикально слева, результаты кластеризации -справа. Значения расстояний или сходства, отвечающие строению новых кластеров, изображаются по горизонтальной прямой поверх дендограмм. Вид дендограммы зависит от выбора меры сходства или расстояния между объектом и кластером и метода кластеризации. Наиболее важным моментом является выбор меры сходства или меры расстояния между объектом и кластером [4].

Решение задачи кластеризации принципиально неоднозначно, на это существует несколько причин: не существует однозначно наилучшего критерия качества кластеризации; число кластеров, как правило, неизвестно заранее и устанавливается экспертным путем; результат кластеризации существенно зависит от метрики, выбор которой субъективен. Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве Х, разбить множество объектов G на п кластеров (подмножеств) F1, F2, ..., Fn, так, чтобы каждый объект О] принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам были разнородными.

Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией [7]. Например, в качестве целевой

функции может быть взята внутригрупповая сумма квадратов отклонения:

/

2 1

п п 1 п

т-I (- х )2-I х 2 - П1

х,

1 -1 1 -1 п

- -1

, (1)

где х] - представляет собой измерения ] -го объекта.

Например, необходимо разбить потребителей малых архитектурных форм (МАФ) в малоэтажном строительстве по осведомленности в них. Пусть О включает п характеристик, любая из которых характеризуется: наличием у потребителей МАФ на участках ^1), желание в дополнении МАФ на участке ^2), заинтересованность в новостях о МАФ (Р3), основной источник информации о МАФ ^4), посещение выставок связанных с МАФ (Р5), критерий выбора МАФ ^6), дополнительные услуги при покупке МАФ (Т7), условия оплаты за МАФ ^8) и т.д. В данном случае дендограмма будет выглядеть примерно так, как показано на рисунке 1.

сходство 1 0,9 0,8 0,7 0,6 0,5 0Г4 0,3 0Г2 0,1

расстояние ОД 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 П.

Г2 ¥1

¥4-Р5

¥7

га

Рисунок 1 - Дендограмма осведомленности потребителей в МАФ

Объекты 1-ый и j -ый попадали бы в один кластер, когда расстояние (отдаленность) между точками XI и Хj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим. Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между XI и Xj из Еп, где Еп - п-мерное евклидово пространство. Неотрицательная функция d(Xl , Xj) называется функцией расстояния (метрикой), если:

а) d(Xi , Xj) > 0, для всех XI и Xj из Еп

б) d(Xi, Xj) = 0, тогда и только тогда, когда XI = Xj

в) d(xi, х|) = XI)

г) d(Xi, Xj) < d(Xi, Xk) + d(Xk, Xj), где Xj; Xi и Xk - любые три вектора из Еп. Значение d(Xi, Xj) для Xi и Xj называется расстоянием между Xi и Xj и

эквивалентно расстоянию между Gi и О] соответственно выбранным характеристикам ^1, F2, F3, ..., Fn).

Пусть п измерений XI, X2,..., Xn представлены в виде матрицы данных размером р

х п:

х =

х11 х12 ... Х1п

Х21 х22 ... Х2п = (^2,. ., ^п)

Хр1 Хр 2 ... Хрп

Тогда расстояние между парами векторов d(Xl , X]) могут быть представлены в виде симметричной матрицы расстояний:

' 0 ^12 ... 4п

D = ^21 0 ... ^

... 0

Неоднородность единиц измерения и вытекающая отсюда невозможность обоснованного выражения значений различных показателей в одном масштабе приводит к

тому, что величина расстояний между точками, отражающими положение объектов в пространстве их свойств, оказывается зависящей от произвольно избираемого масштаба.

Таким образом, различные методы кластерного анализа позволяют получать кластеры, различающиеся по размеру и форме. Благодаря кластерному анализу можно рассмотреть достаточно большой объем информации и сжать большие массивы социально-экономической информации, сделать их наглядными.

Литература

1. Айвазян С.А., Бухштабер В.М., Енюков И.С. Мешалкин Л.Д. Прикладная статистика: классификация и снижение размерности. - М.: Финансы и статистика, 1989г.;

2. Девятко И.Ф. Методы социологического исследования - Екатеринбург: Пресс, 2002146 стр.

3. Журавлев Ю.И., Рязанов В.В., Сенько О.В. «Распознавание». Математические методы. Программная система. Практические применения. - М.: Оазис, 2006.;

4. Мандель И.Д. Кластерный анализ. - М.: Финансы и статистика, 1988.;

5. Олдендерфер М.С., Блэшфилд Р.К. «Кластерный анализ»/ «Факторный дискриминантный и кластерный анализ» : пер. с англ.; Под ред. И.С. Енюкова. - М.: «Финансы и статистика», 1989 - 215 стр.;

6. Хайдуков Д.С. Применение кластерного анализа в государственном управлении// Философия математики: актуальные проблемы. - М.: МАКС Пресс, 2009г.

7. Шуметов В.Г., Шуметова Л.В. «Кластерный анализ: подход с применением ЭВМ». ОрелГТУ, Орел, 200, - 118 стр.;

i Надоели баннеры? Вы всегда можете отключить рекламу.