Научная статья на тему 'РАЗРАБОТКА АЛГОРИТМА ПОДБОРА ПЕРСОНАЛИЗИРОВАННОГО КОНТЕНТА САЙТА'

РАЗРАБОТКА АЛГОРИТМА ПОДБОРА ПЕРСОНАЛИЗИРОВАННОГО КОНТЕНТА САЙТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
57
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
система управления контентом сайта / правила подбора контента / персонализация сайта / персонализированный контент / content management system / content selection rules / personalization of the site / personalized content

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тюха А.С.

Статья посвящена разработке алгоритма подбора персонализированного контента для групп пользователей. Подходом предусмотрен подбор правил из Базы знаний даже для пользователей, не принадлежащих к выявленным группам. Приведена структура правила, а также дано теоретико-множественное описание структурных элементов страницы сайта, для которых возможна настройка подмен.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE SELECTION OF PERSONALIZED SITE CONTENT ALGORITHM DEVELOPMENT

The article is devoted to the development of an algorithm for selecting personalized content for user groups. The approach provides for the selection of rules from the Knowledge Base, even for users who do not belong to the identified groups. The structure of the rule is given, as well as a set-theoretic description of the structural elements of the site page, for which it is possible to configure substitution.

Текст научной работы на тему «РАЗРАБОТКА АЛГОРИТМА ПОДБОРА ПЕРСОНАЛИЗИРОВАННОГО КОНТЕНТА САЙТА»

УДК 004.89

Тюха А. С. студент магистрант Белгородский государственный национальный исследовательский университет научный руководитель: Асадуллаев Р.Г.

доцент Россия, г. Белгород РАЗРАБОТКА АЛГОРИТМА ПОДБОРА ПЕРСОНАЛИЗИРОВАННОГО КОНТЕНТА САЙТА Аннотация: Статья посвящена разработке алгоритма подбора персонализированного контента для групп пользователей. Подходом предусмотрен подбор правил из Базы знаний даже для пользователей, не принадлежащих к выявленным группам. Приведена структура правила, а также дано теоретико-множественное описание структурных элементов страницы сайта, для которых возможна настройка подмен.

Ключевые слова: система управления контентом сайта, правила подбора контента, персонализация сайта, персонализированный контент.

Tyukha A.S., undergraduate student Belgorod State National Research University

Russia, Belgorod Supervisor: Asadullaev R. G., Associate Professor THE SELECTION OF PERSONALIZED SITE CONTENT ALGORITHM DEVELOPMENT Abstract: The article is devoted to the development of an algorithm for selecting personalized content for user groups. The approach provides for the selection of rules from the Knowledge Base, even for users who do not belong to the identified groups. The structure of the rule is given, as well as a set-theoretic description of the structural elements of the site page, for which it is possible to configure substitution.

Key words: content management system, content selection rules, personalization of the site, personalized content.

Как правило, реализация подхода персонализации web-ресурса происходит на основании заранее заданных алгоритмов или правил [1]. Оба предложенных подхода имеют свои сильные стороны, в связи с чем, предлагается их одновременное использование: на этапе определения кластера для посетителя сайта срабатывает алгоритм соответствующей процедуры «Определение кластера», далее, на основании результата (выявленной группы пользователей) согласно правилам, определяющим значения элементов контента для выявленной группы, производится сборка страницы сайта (рисунок 1).

Рисунок 1 - Алгоритм подбора персонализированного контента При обращении пользователя к странице сайта система получает некоторый набор данных о нём, на основании которых возможно отнесение пользовательского портрета к той или иной выделенной группе. Процедура идентификации аналогична той, которая используется на этапе кластеризации пользователей (рисунок 2) - для текущего объекта осуществляется проверка окрестности на наличие достаточного количества соседей [2,3].

Рисунок 3.4 - Алгоритм поиска кластера для нового пользователя Если число соседствующих точек оказывается больше минимально заданного значения, тогда точка записывается в кластер, в котором уже находятся окружающие точки. Соответственно, формирование контента происходит согласно заданному для выявленного кластера правилу.

В том случае, если группу (кластер) определить не удается, т.е. точка отнесена к одному из шум-кластеров, система осуществляет поиск ближайшего к объекту кластера и, в соответствии с правилами подбора контента для найденной группы осуществляется сборка элементов контента. Определение ближайшего к рассматриваемой точке кластера происходит путем расчета расстояния до центров каждого из известных кластеров. В результате выполнения процедуры находится центроид, расстояние до которого наименьшее. Соответственно, контент будет формироваться на основании правил, заданных для кластера, центром которого он является.

Как было обозначено ранее элементы контента, разбитые на множества, хранятся в Базе данных системы соответствующими боками, выбор для которых определяется правилами, хранящимися в Базе знаний этой же системы управления контентом.

Объекты подмены контента для множества элементов страницы А={А1,А2, хранятся в четком соответствии с выявленными группами

профилей пользователей Р=[р1, р2,..., р;}. Для каждого р;- £ Р заданы

элементы в подмножествах Аг, А2,... ,At, поэтому правила, хранящиеся в Базе знаний, продукционного типа имеют следующую структуру:

Если пользователь P = pt, то А1=а11, А2 = а21, ..., Ai = а^.

Во множество элементов страницы A по решению специалиста, ответственного за персонализацию ресурса могут быть включены такие элементы как:

1. Множество заголовков сайта А1 = [a11t а12,..., a1j}.

2. Множество основных подзаголовков сайта А2 = {а.21, Œ22, ..., &2j}.

3. Множество текстовых блоков, поясняющих подзаголовок А3 = [а31, а32,..., a3j}.

4. Множество надписей кнопки с призывом к действию

A4 = {а41, &42, ..., &4j\

5. Множество заголовков формы А5 = {а51, а52,..., a5j}.

6. Множество прочих элементов Ai = [ai1) ai2,..., а^}.

Таким образом, предложенный подход сочетает алгоритмический и основанный на правилах способы реализации персонализированного подбора контента сайта под разные категории его посетителей. Причем алгоритмическая часть позволяет определить, каким именно правилом система будет руководствоваться при построении страницы. Для пользователей, которые не могут быть отнесены к уже выявленным группам, предлагается использование правил ближайшего кластера.

Использованные источники:

1. Роуз Р. Управление контент-маркетингом. Практическое руководство по созданию лояльной аудитории для вашего бизнеса. Москва: Манн, Иванов и Фербер, 2014. 229 с.

2. Барсегян А.А. Методы и модели анализа данных: OLAP и Data Mining. Спб.: БХВ-Петербург, 2004. 336 с.

3. Райзин Дж. Вэн. Классификация и кластер Москва: Мир, 2008. 390 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.