Научная статья на тему 'Использование индуктивных методов и правил нечеткого вывода для решения задач идентификации пользователей веб-ресурса в рамках реализации системы поддержки принятия решений'

Использование индуктивных методов и правил нечеткого вывода для решения задач идентификации пользователей веб-ресурса в рамках реализации системы поддержки принятия решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
94
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
интернет маркетинг / системы поддержки принятия решений / индуктивные методы / правила нечеткого вывода / машинное обучение / Internet marketing / decision support systems / inductive methods / fuzzy logic / machine learning.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Степанов Илья Сергеевич

В статье рассмотрен алгоритм идентификации пользователей веб-ресурса для расчёта эффективности инвестиций в интернет маркетинг. Алгоритм реализован на базе индуктивных методов и правил нечеткого вывода. Обоснованы преимущества данного подхода в сравнении с инструментами отслеживания звонков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This paper describes the algorithm of Web-site user’s identification for the calculation of an investment efficiency in online marketing. The algorithm is implemented based on inductive methods and rules of fuzzy inference. This approach was compared with call tracking tools and the advantages were justified.

Текст научной работы на тему «Использование индуктивных методов и правил нечеткого вывода для решения задач идентификации пользователей веб-ресурса в рамках реализации системы поддержки принятия решений»

Евразийский Союз Ученых (ЕСУ) # 10 (19), 2015 | ТЕХНИЧЕСКИЕ НАУКИ

143

ИСПОЛЬЗОВАНИЕ ИНДУКТИВНЫХ МЕТОДОВ И ПРАВИЛ НЕЧЕТКОГО ВЫВОДА ДЛЯ РЕШЕНИЯ ЗАДАЧ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ ВЕБ-РЕСУРСА В РАМКАХ РЕАЛИЗАЦИИ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Степанов Илья Сергеевич

Аспирант кафедры теоретической и прикладной информатики Сибирского государственного университета путей

сообщения, г. Новосибирск

АННОТАЦИЯ

В статье рассмотрен алгоритм идентификации пользователей веб-ресурса для расчёта эффективности инвестиций в интернет маркетинг. Алгоритм реализован на базе индуктивных методов и правил нечеткого вывода. Обоснованы преимущества данного подхода в сравнении с инструментами отслеживания звонков.

ABSTRACT

This paper describes the algorithm of Web-site user’s identification for the calculation of an investment efficiency in online marketing. The algorithm is implemented based on inductive methods and rules of fuzzy inference. This approach was compared with call tracking tools and the advantages were justified.

Ключевые слова: интернет маркетинг, системы поддержки принятия решений, индуктивные методы, правила нечеткого вывода, машинное обучение.

Keywords: Internet marketing, decision support systems, inductive methods, fuzzy logic, machine learning.

Несмотря на то, что развитие сети интернет и электронной коммерции в частности, достигло широкого распространения, далеко не все операции перешли в сферу онлайн обслуживания. В связи с чем возникают проблемы с идентификацией пользователей, которые обращаются в компанию по телефону или отправляют письма на электронную почту. Вследствие чего возникают проблемы с расчётом эффективности инвестиций в тот или иной вид маркетинговых инициатив.

На рынке представлен ряд инструментов для отслеживания телефонных звонков, существуют разные подходы к реализации, но суть этих методов заключается в отображении разных телефонных номеров разным группам пользователей или каждому пользователю в отдельности. Данный метод работает довольно эффективно, но требует дополнительных финансовых затрат, кроме того, набор телефонных номеров естественным образом ограничивает количество пользователей.

В качестве альтернативы предложен метод идентификации пользователей по косвенным признакам, а именно, зная время обращения и телефонный номер, а, следовательно, и географическую локацию, а также потребности обратившегося клиента, есть возможность сопоставить эти данные с визитами на сайт. Получив перечень параметров достаточный для идентификации пользователей, можно методом экспертной оценки из множества визитов на сайт выбрать подходящий, либо констатировать его отсутствие.

Таким образом, объект можно описать набором критериев (параметров) А(1), А(2) ... А(п), принадлежащих соответствующим базовым множествам U(1), U(2) ... U(n). Совокупность критериев с соответствующими значениями характеризует приемлемость P данного объекта относительно поставленной задачи [1].

Задача осложнена отсутствием возможности установить точное соответствие параметров, т.к. между визитом и обращением проходит определенное время, кроме того, данные могут быть неполными, как в описании параметров клиен-

та, так и в описании параметров пользователя. Таким образом, эксперт может только предполагать соответствие с определенной вероятностью.

Для формализации данного процесса потребуется использование правил нечеткого вывода. В нечеткой логике, в отличие от классической, вместо величин истина и ложь используется величина степень истинности.

Переходя к логике предикатов, нам необходимо сформулировать предикат соответствия:

Соответствует (X,Y,P) :-

Соответствие атрибута А1 (XA1,YA1,PA1),

Соответствие атрибута An (XAn,YAn,PAn).

где

X - клиент, обратившийся в компанию,

Y - пользователь, с которым мы его идентифицируем,

Р - степень истинности гипотезы.

Данный предикат будет определяться через соответствие атрибутов экземпляров классов Клиент и Пользователь. Поскольку соответствие каждого из атрибутов является неточным, то для каждого из них будет своя степень истинности, которая будет иметь определенное влияние на конечную величину. Предикаты соответствия атрибутов будут формироваться на этапе извлечения знаний.

При реализации системы поддержки принятия решений выделяют четыре основных задачи [2]:

1. извлечение знаний;

2. верификация знаний;

3. вывод рекомендаций;

4. объяснение рекомендаций.

Извлечение знаний можно реализовать путем описания знаний эксперта в данной области, задав допустимые значения атрибутов и правила их соответствия. Но при экспертной оценке есть риск получить неточные знания, а также возникает потребность поддерживать их актуальность, т.к. условия соответствия могут со временем меняться.

144

Евразийский Союз Ученых (ЕСУ) # 10 (19), 2015 | ТЕХНИЧЕСКИЕ НАУКИ

В качестве решения данных проблем выступают индуктивные методы машинного обучения. Индуктивное логическое программирование - это один из подходов к машинному обучению. Оно представляет собой метод изучения отношений на примерах. В методе ILP в качестве языка определения гипотез используется логика предикатов [3].

В рассматриваемой задаче имеется множество объектов класса Клиент и множество объектов класса Пользователь. Существует некоторая зависимость между экземплярами данных классов, но она неизвестна. Известна только конечная совокупность прецедентов - пар «Клиент, Пользователь», называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом вводится степень истинности. Данный подход также снимает задачу верификации знаний.

В качестве обучающей выборки можно взять множество пар, соответствие между которыми определено экспертом, а в дальнейшем расширять её новыми поступающими данными.

При выводе рекомендаций, помимо соответствий, степень истинности которых высока, система также предоставляет эксперту соответствия со средней и низкой степенью истинности, которые в зависимости от решения эксперта будут пополнять множества положительных или отрицательных решений для обучающей выборки, тем самым уточняя алгоритм. Положительные примеры будут расширять множество решений, отрицательные, напротив, будут сужать его.

Задача объяснения рекомендации в данном случае сводится к выводу определяющих атрибутов и их значений.

Список литературы:

1. Борисов, Крумберг, Федоров Принятие решений на основе нечетких моделей. Примеры использования, 1990. Стр. 94.

2. Системы поддержки принятия решений: Учебно-ме-тод. пособие / Попов А.Л. - Екатеринбург: Урал. гос. ун-т, 2008. - 26с.

3. Братко И. Алгоритмы искусственного интеллекта на языке PROLOG, 3-е издание. : Издательский дом «Вильяме», 2001. — 446с. :

КОРРЕКЦИЯ МЕТОДА ДОСТУПА В СЕТЯХ ETHERNET

Сторожок Евгений Анатольевич

доцент, кандидат технических наук, преподаватель

Сторожок Олег Евгеньевич

инженер-программист Тихоокеанское высшее военно-морское училище им. С.О. Макарова

г. Владивосток

АННОТАЦИЯ

Предлагается использование математического аппарата теории массового обслуживания для моделирования процессов в локальной вычислительной сети. Рассматривается возможный вариант схемы временного разделения канала связи. Механизм включения (выключения) временного разделения основан на использовании статистического метода последовательного анализа.

ABSTRACT

Use of mathematical apparatus of the theory of mass service for modelling of processes in the local computer network is offered. The possible variant of the scheme of time division of a communication channel is considered. The mechanism of inclusion (deenergizing) of time division is based on use of a statistical method of the consecutive analysis

Ключевые слова: система массового обслуживания, метод доступа, статистический метод последовательного анализа, коллизия, среда передачи данных.

Keywords: system of mass service, a method of access, a statistical method of the consecutive analysis, a collision, the environment of data transmission.

Введение

Лидирующее положение среди технологий, используемых при создании локальных сетей, принадлежит технологии Ethernet. Данная технология предусматривает использование метода доступа к единой среде передачи данных CSMA/CD : [2, с. 21]. Метод носит вероятностный характер, который не гарантирует успешность передачи сообщения в случае высокой интенсивности сетевого трафика. Здесь нет возможности приоритетного доступа и по этой причине

сети, использующие данный метод доступа, плохо приспособлены для решения задач управления в реальном масштабе времени. Доступ по схеме CSMA/CD (из-за столкновений) предполагает ограничение на минимальную длину пакета. По существу, этот метод доступа предполагает широковещательную передачу пакетов. Все рабочие станции логического сетевого сегмента воспринимают эти пакеты хотя бы частично, чтобы прочесть адресную часть. Логика поведения субъектов в сети с доступом CSMA/CD может варьироваться. Здесь существенную роль играет то, син-

i Надоели баннеры? Вы всегда можете отключить рекламу.