Научная статья на тему 'ОБНАРУЖЕНИЕ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ ПРИ ПОКУПКЕ ТОВАРОВ ПЕРВОЙ НЕОБХОДИМОСТИ'

ОБНАРУЖЕНИЕ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ ПРИ ПОКУПКЕ ТОВАРОВ ПЕРВОЙ НЕОБХОДИМОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
29
7
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ризаев Ильдус Султанович, Захарова Земфира Хаматовна, Январева Екатерина Валерьевна, Митрофанов Николай Сергеевич

Рассматриваются вопросы обнаружения взаимосвязанных событий при приобретении товаров первой необходимости на основе ассоциативных правил

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ризаев Ильдус Султанович, Захарова Земфира Хаматовна, Январева Екатерина Валерьевна, Митрофанов Николай Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ОБНАРУЖЕНИЕ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ ПРИ ПОКУПКЕ ТОВАРОВ ПЕРВОЙ НЕОБХОДИМОСТИ»

ОБНАРУЖЕНИЕ ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ ПРИ ПОКУПКЕ _ТОВАРОВ ПЕРВОЙ НЕОБХОДИМОСТИ

Ризаев Ильдус Султанович

кандидат тех.наук, доцент

Захарова Земфира Хаматовна,

доцент

Январева Екатерина Валерьевна,

магистр

Митрофанов Николай Сергеевич,

магистр

Казанский национальный исследовательский технический университет

г. Казань

THE DISCOVERY OF LOGICAL REGULARITIES WHEN BUYING ESSENTIAL COMMODITIES

Rizaev Ildus Sultanovich, candidate of technical Sciences, associate Professor Zakharova Zemfira Hamitovna,associate Professor Yanvaryov Ekaterina Valer'evna, master of science

Mitrofanov Nikolay Sergeyevich, master of science, Kazan national research technical University, Kazan АННОТАЦИЯ

Рассматриваются вопросы обнаружения взаимосвязанных событий при приобретении товаров первой необходимости на основе ассоциативных правил. ABSTRACT

Examines the detection of correlated events when acquiring goods on the basis of Association rules. Ключевые слова: транзакция, ассоциативные правила, поддержка, достоверность, Deductor Keywords: transaction, Association rules, support, reliability, Deductor

Одним из немаловажных факторов в современном обществе является приобретение товаров первой необходимости. Это одежда, продукты питания, косметические товары, лекарства и т.д. Можно заметить, что совершая покупки люди, как правило, приобретают не один товар, а несколько. Например, женщина, зайдя в магазин косметики, и купив духи, купит, скорее всего, и губную помаду. В аптеке больной гриппом купив ар-бидол, купит и средство от насморка, и комплект витаминов. В продуктовом магазине покупатель положит в корзину возможно следующий набор продуктов: молоко, творог, хлеб, чай, песок, печенье. Для работников торговли является весьма важной задачей учитывать те наборы товаров (продуктов), которые покупаются совместно. Это позволит более продумано расставлять товары на полках магазинов, в больших торговых центрах более продумано располагать отделы.

Учитывая, что в разные периоды времени могут появляться разные группы покупателей, можно более эффективно планировать закупки товаров, устанавливать соответствующие торговые наценки, объявлять своевременно акции на отдельные виды товаров и т.д.

Для обнаружения таких взаимосвязанных событий современная математика предлагает раздел интеллектуального анализа данных - поиск ассоциативных правил [1]. Базовым понятием таких правил является транзакция, представляющая собой некоторое множество взаимосвязанных событий. Так женщина купившая духи с вероятностью 80% купит и губную помаду. Больной, купивший лекарство от гриппа с вероятностью 90% купит и лекарство от насморка. Покупатель, зашедший в магазин «Пятерочка», приобретая

кочан капусты, с вероятностью 75% приобретет и помидоры и огурцы.

Формально задача описываются следующим образом: Пусть Я = (гх, г2,.............., гп} множество исследуемых объектов, Т = , 12,.............., 1п} множества

транзакций, где каждая из транзакций является подмножеством множества R, то есть: Угк е 1к ^ гк е Я . Транзакции представляют собой наборы объектов из множества R, предназначенные для анализа, которые хранятся в базе данных. Чтобы выявить всевозможные группы приобретаемых товаров из множества R, необходимо перебрать все возможные варианты. При этом, количество всевозможных групп может быть очень большим [2].

Ассоциативное правило можно представить как импликацию над множеством X -> Y (если X то Y). Например, если больной покупает лекарство от гриппа, то он купит и средство от насморка с вероятностью 90%.

Количество групп G из множества N объектов можно определить по формуле:

N ( N 1

о = 11 1

d=1

Vd У

При этом каждая группа может включать целый ряд подмножеств. Например, если группа состоит из трех элементов G= (а, Ь, с), то могут быть получены следующие правила:

а ^ (Ь, с), Ь ^ (а, с), с ^ (а, Ь)

(а, Ь) ^с, (а, с) ^-Ь, (Ь, с) ^а

Количество правил составляет 2к - 2 . Количество всевозможных правил из множества N объектов определяется следующим образом:

Л (^ (N - d^

R = Z

d=1

d

l* £

дятся такие величины как поддержка и достоверность [1]. Поддержка (support) - определяет величину транзакций, поддерживающих данное правило:

Suppx

T

X ЦТ

T

^ У

Так как, количество правил может быть очень большим необходимо выделить только те правила, которые являются полезными [3].

Для оценки полезности ассоциативных правил вво-

Достоверность (confidence) - вероятность того, что из события X следует событие Y:

ConfX

T

1 V

SuPPx

X ^Т

T

1 V

SuPPx

Ле кар ciBa2.txt— Блокнот

Файл Правка Формат Вид Справка

В

I/V Лекарства

1001 Синяки и гематомы-

1001 Спецмазь

1001 Йод

1001 Алоэ

1001 Левомолгель

1001 Спасатель

1001 Далобене

1002 Растяжения-

1002 Спецмазь

1002 Нурофен

1002 Которол

1003 Синяки и гематомы-

1003 Найз

1003 Облепиховое масло

1003 Алоэ

1003 Левомолгель

1003 Далобене

1004 Ушибы-

1004 Спецмазь

1004 Облепиховое масло

1004 Левомолгель

1004 Которол

1004 Эстракт подорожника

1005 Раны и царапины-

1005 Спецмазь

1005 Нурофен

1005 Которол

N Лекарства

► 1001 Синяки и гематомы-

1001 Спецмазь

1001 Йод

1001 Алоэ

1001 Левомолгель

1001 Спасатель

1001 Далобене

1002 Растяжения-

1002 Спецмазь

1002 Нурофен

1002 Которол

1003 Синяки и гематомы-

1003 Найз

1003 Облепиховое масло

1003 Алоэ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1003 Левомолгель

1003 Далобене

1004 Ушибы-

1004 Спецмазь

1004 Облепиховое масло

1004 Левомолгель

1004 Которол

1004 Эстракт подорожника

1005 Раны и царапины-

1005 Спецмазь

1005 Нурофен

1005 Которол

1005 Эстракт подорожника

1006 Ушибы-

1006 Найз

Рис. 1. Фрагмент входного документа(а) и его вид в Deductor^)

Рассмотрим пример. Пусть имеется входной файл, в котором представлен перечень транзакций, где каждый элемент представляет собой лекарство от недуга. Так как используются обобщенные ассоциативные правила, то в каждую транзакцию включается «предок» который в данном случае представляет болезнь, рис.1. Для поиска ассоциативных правил воспользуемся аналитической платформой Deductor (компании BaseGroup Labs) [4].

В результате построения ассоциативных правил выявлено соответствующее число правил и множеств.

Для удаления мало полезных правил задают селектор, рис.2. В качестве условия указывается болезнь, а в качестве следствия - лекарство.

Таким образом, получилось 14 правил (рис. 3).

Достоверность указывает что, если у человека растяжение, то он с вероятностью 75,00% будет лечиться Которолом. Меру значимости данного ассоциативного правила показывает лифт, чем величина лифта выше, тем более значимо данное правило по сравнению с его аналогами. Следовательно, можно сделать вывод о том, какие наборы лекарств помогают от болезней.

Рис. 2. Селектор

N5 Номер правила V ■ | ■ §§ Поддержка ¿i Достоверность ^ Лифт

кг Кол-во %

1 10 Раны и царапины- Алоэ 2 11г75 50 г00 0Г944

2 12 Синяки и гематомы- Алоэ 5 29,41 83,33 1г574

3 31 Раны и царапины- Которол 2 11г76 50 г00 1,063

4 32 Растяжения- Которол 3 17,65 75гОО 1г594

5 35 Ушибы- Которол 3 17г65 75г00 1г594

S 44 Ушибы- Левомолгель 2 11г76 50 г00 1,063

7 46 Раны и царапины - Нурофен 2 11г75 50 г00 1г700

3 53 Растяжения - Облепиховое масло 3 17гб5 75г00 1г417

9 58 Раны и царапины- Эстракт подорожника 3 17,65 75г00 2,550

10 SO Растяжения- Спецмазь 3 17,65 75г00 0,981

И 61 Синяки и гематомы- Спасатель 4 23,53 66,67 2,833

12 62 Синяки и гематомы- Спецмазь 4 23,53 66,67 0,872

13 63 Ушибы- Спецмазь 3 17,65 75г00 0Г981

14 S4 Ушибы- Эстракт подорожника 3 17,65 75г00 2,550

Рис. 3. Ассоциативные правила

Ассоциативные правила можно представить в виде по условию, либо по следствию. На рис.4 представле-«дерева решений». Оно может быть построено либо но дерево правил по условию.

Е-ф

I

Й-Élit" Élit" Élit" É-É-

Ассоциативные правила [по следствию) ¡?> Далобене (35,29%; 6) |> Алоэ (52,94%; Э] ?> Левомолгель (47.06а; 8) •> Облепиковое масло (52,94%; Э] Синяки и гематомы- (35.29%; 6) •> Спецмазь (76,47%; 13] Спасатель (23.53%; 4] •> Которол (47,06%; 8) р Й си (23,53%; 4]

!?:■ ИШМШиИИИИеШЖИ

Нурофен [11.76%; 2] {•> Эстракт подорожника (17,65%; 3) ?> Нурофен (28,41%; 5] •> Эстракт подорожника (29,41 %; 5) ?> Ушибы- (23,53%; 4)

Условие Поддержка Достоверность, % Лифт

Кол-во %

Нурофен 2 11,80 40,00 1,7

Эстракт подорожника 3 17,60 60,00 2,55

Количество правил: 2; Следствие: Раны и царапины

Рис. 4. Дерево правил (по условию)

Отображаемый в данный момент результат можно интерпретировать как 2 правила:

1. Если у человека рана и царапина, то ему с вероятностью 40% поможет Нурофен .

2. Если у человека рана и царапина, то ему с вероятностью 60% поможет Экстракт подорожника.

Заключение

Результаты, полученные с помощью вычисления обобщенных ассоциативных правил позволит определить наборы лекарств покупаемых совместно при определенных заболеваниях. Такая информация даст возможность более эффективно подбирать лекарства, при заболеваниях определенного типа.

Данный пример можно интерполировать и на любые товары (продукты), покупаемы совместно. Это позволит более продумано расставлять продукты на полках магазинов, товары в супермаркетах.

Литература:

1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технология анализа данных: Data Mining, Visual Mining, Text Mining, OLAP/ Изд-во СПБ.: БХВ-Пе-тербург, 2008 - 384 с.

2. Ризаев И.С., Рахал Я. Интеллектуальный анализ данных для поддержки принятия решений. - Казань: Изд-во МОиН РТ, 2011. - 172 с.

3. Ризаев И.С., Шарнин Л.М., Яхина З.Т. Поиск закономерностей между взаимосвязанными событиями на основе ассоциативных правил. - Казань: Вестник КГТУ им.А.Н.Туполева, №4, 2014, с.314-317.

4. Ларин С., Выявление обобщенных ассоциативных правил [Электронный ресурс] /Технологии анализа данных BaseGroup Labs. Режим доступа: http:// www.basegroup.ru/library/analysis/association_rules/ generalized.

i Надоели баннеры? Вы всегда можете отключить рекламу.