ОБНАРУЖЕНИЕ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ ПРИ ПОКУПКЕ _ТОВАРОВ ПЕРВОЙ НЕОБХОДИМОСТИ
Ризаев Ильдус Султанович
кандидат тех.наук, доцент
Захарова Земфира Хаматовна,
доцент
Январева Екатерина Валерьевна,
магистр
Митрофанов Николай Сергеевич,
магистр
Казанский национальный исследовательский технический университет
г. Казань
THE DISCOVERY OF LOGICAL REGULARITIES WHEN BUYING ESSENTIAL COMMODITIES
Rizaev Ildus Sultanovich, candidate of technical Sciences, associate Professor Zakharova Zemfira Hamitovna,associate Professor Yanvaryov Ekaterina Valer'evna, master of science
Mitrofanov Nikolay Sergeyevich, master of science, Kazan national research technical University, Kazan АННОТАЦИЯ
Рассматриваются вопросы обнаружения взаимосвязанных событий при приобретении товаров первой необходимости на основе ассоциативных правил. ABSTRACT
Examines the detection of correlated events when acquiring goods on the basis of Association rules. Ключевые слова: транзакция, ассоциативные правила, поддержка, достоверность, Deductor Keywords: transaction, Association rules, support, reliability, Deductor
Одним из немаловажных факторов в современном обществе является приобретение товаров первой необходимости. Это одежда, продукты питания, косметические товары, лекарства и т.д. Можно заметить, что совершая покупки люди, как правило, приобретают не один товар, а несколько. Например, женщина, зайдя в магазин косметики, и купив духи, купит, скорее всего, и губную помаду. В аптеке больной гриппом купив ар-бидол, купит и средство от насморка, и комплект витаминов. В продуктовом магазине покупатель положит в корзину возможно следующий набор продуктов: молоко, творог, хлеб, чай, песок, печенье. Для работников торговли является весьма важной задачей учитывать те наборы товаров (продуктов), которые покупаются совместно. Это позволит более продумано расставлять товары на полках магазинов, в больших торговых центрах более продумано располагать отделы.
Учитывая, что в разные периоды времени могут появляться разные группы покупателей, можно более эффективно планировать закупки товаров, устанавливать соответствующие торговые наценки, объявлять своевременно акции на отдельные виды товаров и т.д.
Для обнаружения таких взаимосвязанных событий современная математика предлагает раздел интеллектуального анализа данных - поиск ассоциативных правил [1]. Базовым понятием таких правил является транзакция, представляющая собой некоторое множество взаимосвязанных событий. Так женщина купившая духи с вероятностью 80% купит и губную помаду. Больной, купивший лекарство от гриппа с вероятностью 90% купит и лекарство от насморка. Покупатель, зашедший в магазин «Пятерочка», приобретая
кочан капусты, с вероятностью 75% приобретет и помидоры и огурцы.
Формально задача описываются следующим образом: Пусть Я = (гх, г2,.............., гп} множество исследуемых объектов, Т = , 12,.............., 1п} множества
транзакций, где каждая из транзакций является подмножеством множества R, то есть: Угк е 1к ^ гк е Я . Транзакции представляют собой наборы объектов из множества R, предназначенные для анализа, которые хранятся в базе данных. Чтобы выявить всевозможные группы приобретаемых товаров из множества R, необходимо перебрать все возможные варианты. При этом, количество всевозможных групп может быть очень большим [2].
Ассоциативное правило можно представить как импликацию над множеством X -> Y (если X то Y). Например, если больной покупает лекарство от гриппа, то он купит и средство от насморка с вероятностью 90%.
Количество групп G из множества N объектов можно определить по формуле:
N ( N 1
о = 11 1
d=1
Vd У
При этом каждая группа может включать целый ряд подмножеств. Например, если группа состоит из трех элементов G= (а, Ь, с), то могут быть получены следующие правила:
а ^ (Ь, с), Ь ^ (а, с), с ^ (а, Ь)
(а, Ь) ^с, (а, с) ^-Ь, (Ь, с) ^а
Количество правил составляет 2к - 2 . Количество всевозможных правил из множества N объектов определяется следующим образом:
Л (^ (N - d^
R = Z
d=1
d
l* £
дятся такие величины как поддержка и достоверность [1]. Поддержка (support) - определяет величину транзакций, поддерживающих данное правило:
Suppx
T
X ЦТ
T
^ У
Так как, количество правил может быть очень большим необходимо выделить только те правила, которые являются полезными [3].
Для оценки полезности ассоциативных правил вво-
Достоверность (confidence) - вероятность того, что из события X следует событие Y:
ConfX
T
1 V
SuPPx
X ^Т
T
1 V
SuPPx
Ле кар ciBa2.txt— Блокнот
Файл Правка Формат Вид Справка
В
I/V Лекарства
1001 Синяки и гематомы-
1001 Спецмазь
1001 Йод
1001 Алоэ
1001 Левомолгель
1001 Спасатель
1001 Далобене
1002 Растяжения-
1002 Спецмазь
1002 Нурофен
1002 Которол
1003 Синяки и гематомы-
1003 Найз
1003 Облепиховое масло
1003 Алоэ
1003 Левомолгель
1003 Далобене
1004 Ушибы-
1004 Спецмазь
1004 Облепиховое масло
1004 Левомолгель
1004 Которол
1004 Эстракт подорожника
1005 Раны и царапины-
1005 Спецмазь
1005 Нурофен
1005 Которол
N Лекарства
► 1001 Синяки и гематомы-
1001 Спецмазь
1001 Йод
1001 Алоэ
1001 Левомолгель
1001 Спасатель
1001 Далобене
1002 Растяжения-
1002 Спецмазь
1002 Нурофен
1002 Которол
1003 Синяки и гематомы-
1003 Найз
1003 Облепиховое масло
1003 Алоэ
1003 Левомолгель
1003 Далобене
1004 Ушибы-
1004 Спецмазь
1004 Облепиховое масло
1004 Левомолгель
1004 Которол
1004 Эстракт подорожника
1005 Раны и царапины-
1005 Спецмазь
1005 Нурофен
1005 Которол
1005 Эстракт подорожника
1006 Ушибы-
1006 Найз
Рис. 1. Фрагмент входного документа(а) и его вид в Deductor^)
Рассмотрим пример. Пусть имеется входной файл, в котором представлен перечень транзакций, где каждый элемент представляет собой лекарство от недуга. Так как используются обобщенные ассоциативные правила, то в каждую транзакцию включается «предок» который в данном случае представляет болезнь, рис.1. Для поиска ассоциативных правил воспользуемся аналитической платформой Deductor (компании BaseGroup Labs) [4].
В результате построения ассоциативных правил выявлено соответствующее число правил и множеств.
Для удаления мало полезных правил задают селектор, рис.2. В качестве условия указывается болезнь, а в качестве следствия - лекарство.
Таким образом, получилось 14 правил (рис. 3).
Достоверность указывает что, если у человека растяжение, то он с вероятностью 75,00% будет лечиться Которолом. Меру значимости данного ассоциативного правила показывает лифт, чем величина лифта выше, тем более значимо данное правило по сравнению с его аналогами. Следовательно, можно сделать вывод о том, какие наборы лекарств помогают от болезней.
Рис. 2. Селектор
N5 Номер правила V ■ | ■ §§ Поддержка ¿i Достоверность ^ Лифт
кг Кол-во %
1 10 Раны и царапины- Алоэ 2 11г75 50 г00 0Г944
2 12 Синяки и гематомы- Алоэ 5 29,41 83,33 1г574
3 31 Раны и царапины- Которол 2 11г76 50 г00 1,063
4 32 Растяжения- Которол 3 17,65 75гОО 1г594
5 35 Ушибы- Которол 3 17г65 75г00 1г594
S 44 Ушибы- Левомолгель 2 11г76 50 г00 1,063
7 46 Раны и царапины - Нурофен 2 11г75 50 г00 1г700
3 53 Растяжения - Облепиховое масло 3 17гб5 75г00 1г417
9 58 Раны и царапины- Эстракт подорожника 3 17,65 75г00 2,550
10 SO Растяжения- Спецмазь 3 17,65 75г00 0,981
И 61 Синяки и гематомы- Спасатель 4 23,53 66,67 2,833
12 62 Синяки и гематомы- Спецмазь 4 23,53 66,67 0,872
13 63 Ушибы- Спецмазь 3 17,65 75г00 0Г981
14 S4 Ушибы- Эстракт подорожника 3 17,65 75г00 2,550
Рис. 3. Ассоциативные правила
Ассоциативные правила можно представить в виде по условию, либо по следствию. На рис.4 представле-«дерева решений». Оно может быть построено либо но дерево правил по условию.
Е-ф
I
Й-Élit" Élit" Élit" É-É-
Ассоциативные правила [по следствию) ¡?> Далобене (35,29%; 6) |> Алоэ (52,94%; Э] ?> Левомолгель (47.06а; 8) •> Облепиковое масло (52,94%; Э] Синяки и гематомы- (35.29%; 6) •> Спецмазь (76,47%; 13] Спасатель (23.53%; 4] •> Которол (47,06%; 8) р Й си (23,53%; 4]
!?:■ ИШМШиИИИИеШЖИ
Нурофен [11.76%; 2] {•> Эстракт подорожника (17,65%; 3) ?> Нурофен (28,41%; 5] •> Эстракт подорожника (29,41 %; 5) ?> Ушибы- (23,53%; 4)
Условие Поддержка Достоверность, % Лифт
Кол-во %
Нурофен 2 11,80 40,00 1,7
Эстракт подорожника 3 17,60 60,00 2,55
Количество правил: 2; Следствие: Раны и царапины
Рис. 4. Дерево правил (по условию)
Отображаемый в данный момент результат можно интерпретировать как 2 правила:
1. Если у человека рана и царапина, то ему с вероятностью 40% поможет Нурофен .
2. Если у человека рана и царапина, то ему с вероятностью 60% поможет Экстракт подорожника.
Заключение
Результаты, полученные с помощью вычисления обобщенных ассоциативных правил позволит определить наборы лекарств покупаемых совместно при определенных заболеваниях. Такая информация даст возможность более эффективно подбирать лекарства, при заболеваниях определенного типа.
Данный пример можно интерполировать и на любые товары (продукты), покупаемы совместно. Это позволит более продумано расставлять продукты на полках магазинов, товары в супермаркетах.
Литература:
1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP/ Изд-во СПБ.: БХВ-Пе-тербург, 2008 - 384 с.
2. Ризаев И.С., Рахал Я. Интеллектуальный анализ данных для поддержки принятия решений. - Казань: Изд-во МОиН РТ, 2011. - 172 с.
3. Ризаев И.С., Шарнин Л.М., Яхина З.Т. Поиск закономерностей между взаимосвязанными событиями на основе ассоциативных правил. - Казань: Вестник КГТУ им.А.Н.Туполева, №4, 2014, с.314-317.
4. Ларин С., Выявление обобщенных ассоциативных правил [Электронный ресурс] /Технологии анализа данных BaseGroup Labs. Режим доступа: http:// www.basegroup.ru/library/analysis/association_rules/ generalized.