Научная статья на тему 'МОДЕЛЬ УПОРЯДОЧИВАНИЯ СОДЕРЖАНИЯ ВЕБ-СТРАНИЦ НА ОСНОВЕ ОПЫТА ПОЛЬЗОВАТЕЛЕЙ И ЦЕЛЕЙ ВЕБ-САЙТА'

МОДЕЛЬ УПОРЯДОЧИВАНИЯ СОДЕРЖАНИЯ ВЕБ-СТРАНИЦ НА ОСНОВЕ ОПЫТА ПОЛЬЗОВАТЕЛЕЙ И ЦЕЛЕЙ ВЕБ-САЙТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
47
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
PAGERANK / АЛГОРИТМЫ РАНЖИРОВАНИЯ / ОПТИМИЗАЦИЯ САЙТА / АНАЛИТИКА ЦЕЛЕЙ САЙТА / ПОВЫШЕНИЕ КОНВЕРСИИ / ПОКАЗАТЕЛЬ ОТКАЗОВ / ГЛУБИНА ПРОСМОТРА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бугара Д.А.

В данной статье описана модель упорядочивания содержания веб-страницы, которая позволяет минимизировать стоимость достижения целей, стоящих перед владельцем ресурса, снизить издержки, связанные с потерей потребительского доверия, и повысить эффективность взаимодействия пользователей с веб-сайтом на основе их опыта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МОДЕЛЬ УПОРЯДОЧИВАНИЯ СОДЕРЖАНИЯ ВЕБ-СТРАНИЦ НА ОСНОВЕ ОПЫТА ПОЛЬЗОВАТЕЛЕЙ И ЦЕЛЕЙ ВЕБ-САЙТА»

УДК 004.05

Д.А. Бугара

МОДЕЛЬ УПОРЯДОЧИВАНИЯ СОДЕРЖАНИЯ ВЕБ-СТРАНИЦ НА ОСНОВЕ ОПЫТА

ПОЛЬЗОВАТЕЛЕЙ И ЦЕЛЕЙ ВЕБ-САЙТА

В данной статье описана модель упорядочивания содержания вебстраницы, которая позволяет минимизировать стоимость достижения целей, стоящих перед владельцем ресурса, снизить издержки, связанные с потерей потребительского доверия, и повысить эффективность взаимодействия пользователей с веб-сайтом на основе их опыта.

Ключевые слова: PageRank, алгоритмы ранжирования, оптимизация сайта, аналитика целей сайта, повышение конверсии, показатель отказов, глубина просмотра.

Интернет на рубеже XXI века превратился в глобальную платформу обмена данными, поэтому эффективность управления информационными потоками и способность получения данных, повышающих интерес пользователей к веб-ресурсу, являются важными и необходимыми характеристиками для оценки функционирующего веб-сайта.

Острой проблемой наряду с доступностью к информации является её качество, так как более качественная информация предоставляет заведомое преимущество тем, кто ей владеет, по сравнению с теми, кто получает её из источников сомнительного происхождения.

Исследования в области качества данных являются достаточно спорными ввиду их новизны и неточных требований, предъявляемых к описанию характеристик и параметров, которые смогли бы дать уточнения относительно ценности располагаемой информации для её владельца.

1.Принципы ранжирования веб-страниц в поисковых системах

Фундаментальные предположения относительно принципов ранжирования веб-страниц были заложены в 1998 году на примере двух алгоритмов PageRank и HITS. В их основу заложен принцип нахождения максимально авторитетных страниц, которые получили одобрения или рекомендации в виде ссылок с других страниц. Такой подход принято считать моделью на основе потока рейтингов.

Ввиду высокой универсальности таких подходов алгоритмы были уточнены путём модификации и учёта персональных предпочтений пользователей, основанных на их истории просмотра, актуальных отзывах, пометках страниц в социальных сетях и других видах веб-коммуникации.

Тем не менее, учёт таких дополнений не всегда является эффективным, так как оценка качества основана на прошлом опыте пользователей и не учитывает их склонность к изменчивости с течением времени. Для повышения релевантности предоставляемой информации стал производиться сравнительный анализ накопленного опыта других пользователей, обладающих похожими признаками и поведением, а также учитываться активность в виде пиков (значительное превышение спроса на информацию в течение короткого промежутка времени), производиться анализ трендов и тенденций, даваться прогноз на перспективу.

Алгоритмы PageRank и HITS явились прародителями для множества дополнений, включая ObjectRank, Co-Rank, FutureRank, и обусловили появление ещё более 30 различных показателей, таких как TrustRank, ImageRank, TwitterRank, SocialPageRank и многих других. Каждый из этих алгоритмов обладает своим преимуществом и недостатком при оценке того или иного вида данных в глобальной сети, а любое используемое решение всё равно имеет вероятностный характер оценок качества и ценности для конечного потребителя информации.

Следует отметить, что большинство алгоритмов разработаны для ранжирования и поиска вебстраниц максимально релевантных ключевому запросу и применяются в поисковых системах достаточно успешно, так как именно они являются тем самым эталоном качества предоставляемой информации в интернете, на который все стараются равняться.

Однако большинство веб-сайтов не являются поисковыми системами, хоть и частично выполняют функцию поиска. Их целями, например, может быть конверсия посетителя в покупателя, для достижения которой необходимо совершить ряд последовательных действий на сайте. Использование алгоритмов поисковых систем для оценки таких действий пользователей не будет обеспечивать получение необходимых данных для анализа, так как ранжирование и поиск релевантной страницы не является главной целью конкретного ресурса.

© Бугара Д.А., 2016.

ISSN 2223-4047

Вестник магистратуры. 2016. № 1(52). Т.1.

Автор работы в данной статье описывает предлагаемую модель упорядочивания информации, построенную на базе тех целей, которые ставит перед собой владелец ресурса, на основе накопленного опыта пользователей, которые достигают эти цели или действуют так, чтобы отвергнуть их, а также приводит результаты от практического использования.

2.Основные требования при внедрении предлагаемой модели

Основным требованием для внедрения предлагаемой модели является реализация основных принципов объектно-ориентированного программирования при построении архитектуры приложения, а также разбиение содержания веб-страниц на объекты предметной области, под которыми подразумевается текстовая статья, услуга, товар, аукцион, страница компании и т.д.

3.Действующая система контрактов

Предлагаемая модель упорядочивания содержания веб-страниц основана на существовании контрактных отношений между функциональным узлом (веб-страницей) и объектами предметной области.

Под целями в рамках данного контекста понимается реализация пользователями ожидаемых моделей поведения, например, нажатие кнопки, ввод параметров или переход на конкретную страницу. Цепочка целей предполагает последовательное выполнение таких моделей поведения, результат действия которых неизбежно приводит к необходимости достижения цели, находящейся следующей в существующей цепочке.

Функциональный узел приобретает ряд свойств по достижению целей, а на пользователя в рамках взаимодействия с узлом начинают возлагаться определённые ожидания по достижению их. Свойства узла характеризуются внутренними и внешними факторами (показателями), а также накопленным опытом взаимодействия с другими пользователями, связями между объектами предметной модели, которые имеют или не имеют отношения к рассматриваемому узлу.

Контрактные отношения заключаются на срок действия поставленных целей и на определённых условиях, которые регламентируются правилами заключения контракта для конкретного узла.

Так как цели могут меняться, либо быть уточнены с течением времени, то и контракт может быть пересмотрен или заключён на новый срок, если это предусмотрено условиями его заключения. Кроме того, если контракт можно заключить на более выгодных условиях или заключение нового контракта приводит к снижению издержек, связанных с его обслуживанием и это предусмотрено условиями, то в силу могут вступить новые контрактные отношения.

Выгодными считаются такие условия, когда стоимость достижения цели или начисляемое количество штрафов будет снижено, либо выгода от заключения нового контракта будет больше. Это обеспечит компенсацию издержек, связанных с обслуживанием контрактов в рамках рассматриваемое узла.

Показатель выгодности контрактных отношений определяется путём начисления бонусов и штрафов, которые считаются по заданным правилам, если действующее контрактное отношение ведёт к достижению поставленной цели, либо приводит к достижению тех, которые поставлены не были.

Стоимость контракта для владельца ресурса определяется издержками на его заключение, ценой его обслуживания, а также размером ожидаемой выгоды от достижения цели пользователем.

Квота на количество заключаемых контрактов регламентируется качественными показателями, например, размером текущего рейтинга для каждого объекта предметной модели, при расчёте которого может учитываться, например, наличие текстовой и графической информации, оценок со стороны пользователей в виде отзывов и комментариев, а также количественных показателей, заданных владельцем ресурса.

Таким образом, действующая система контрактов сможет дать оценку относительно выгоды распределения содержания веб-страниц в рамках конкретного веб-сайта, опираясь на поставленные цели и опыт взаимодействия с пользователями, а на основе полученных данных поможет выявить проблемные узлы.

4.Архитектура построения программного модуля

Архитектура программного модуля основана на принципах объектно-ориентированного программирования и содержит в себе реализацию паттерна MVC и реализует RESTful API подход.

Для хранения данных, необходимых для реализации контрактных отношений, выбрана реляционная база данных MySQL.

Для обслуживания каждой сущности создан менеджер - специальный класс, которые реализует бизнес-логику в рамках взаимодействия объектов классов внутри модуля. Кроме того, сущности имеют специальные репозитории, которые отвечают за выборку из базы данных MySQL.

Все методы менеджеров, репозиториев, помощников и сборщиков являются сервисами, поэтому они могут быть использованы как внутри себя, так и в методах контроллеров. Такой подход позволяет соблюсти принцип DRY и сделать архитектуру более гибкой.

3 nodes_targets_reports

? id INT

f node id INT

f largeUd INT

achieved_amount INT

rejected_amount INT

created._at DATETIME

♦ Ограниченна

* Индексы

□ targets

Í id INT

f Jcùon_ type_ id INT

t parent^id INT

benefit_expected DOUBLE

created at DATETIME

finished_at DATETIME

* Ограниченна

* Индексы

□ nodes_targets_effic¡ency £

"*] contracts

? id INT

f nodejd INT

f target_id achieve_factor INT DOUBLE

created_at DATETIME

* Ограничения

» Индексы

□ nodes_act¡ons_types_reports £

? id INT

f nodejd INT

f action_typeJd INT

total cost DOUBLE

created_at DATETIME

* Ограничения

+ Индексы

и

□ actionstypes

t id INT

objectjdentifier VARCHAR

action_type ENUM

slngle.cost DOUBLE

♦ Ограничения

□ actions

? id INT

f acdon_type_td INT

f user_/d INT

f nodejd INT

created_at DATETIME

cost_per_action DOUBLE

* Ограничения

* Индексы

□ contracts_types

? id INT

early_terminaüon TINYINT

penalty_cost DOUBLE

stimulation cost DOUBLE

condusion_cost DOUBLE

* Ограничения

3 nodes_appl¡cants fid

f nodejd INT f object_id INT amount INT

* Ограничения

* Индексы

►о-

□ users

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

? id INT

first_name VARCHAR

last name VARCHAR

username VARCHAR

email VARCHAR

salt VARCHAR

password VARCHAR

♦ Ограничения

□ nodes_targets_users t id INT

f nodejd INT . f targetjd INT f object'd № f user_id INT created.at DATETIME Ограничения ♦ Индексы

1 id INT

t node id INT

f object_id INT

f contract_type_id INT

status ENUM

service_cost DOUBLE

created at DATETIME

updated_at DATETIME

flnished_at DATETIME

г Ограничения

+ Индексы

□ objects

t id INT

class VARCHAR

rating DOUBLE

view_model LONGTEXT

t Ограничения

3 nodes

? id INT

O-f

i г

i uri VARCHAR type B/UM

* Ограничения

♦ Индексы

Рис. 1. ERM-cxeMa базы данных для реализации контрактных отношений

5.Практическое применение

Описываемая модель была реализована при создании веб-сервиса по организации праздников, доступного по адресу http: // festus.by.

В результате использования подхода упорядочивания содержания веб-страниц на основе опыта пользователей и целей веб-сайта был снижен процент отказа от просмотра посадочных страниц на 80%, средняя глубина просмотра сайта увеличилась с 2 до 6 страниц на 1000 пользователей в течение 2015 года. Это говорит о существенном увеличении интереса к ресурсу со стороны посетителей.

Кроме того, был увеличен процент конверсии новых посетителей в зарегистрированных пользователей на 30%, а общее число достигнутых целей, которые менялись на базе статистического анализа за сентябрь-ноябрь 2015 года, за 2015 года превысили аналогичный показатель 2014 в 4 раза, что говорит о повышении эффективности взаимодействия пользователей с веб-сайтом.

Следует отметить, что срок внедрения данной модели составил 240 человека/часа. Данный показатель является достаточно высокий, так как требования, предъявляемые при внедрении модели со стороны веб-сервиса, были выполнены частично, поэтому в процессе внедрения появилась необходимость вносить изменения в архитектуру проекта.

В целом, можно считать, что предлагаемая модель достаточно эффективна и может быть улучшена при дальнейшей практической апробации и внедрении в другие веб-сайты.

Библиографический список

1.Sayyadi-Harikandehei H. Authority Flow-based Ranking in Heterogeneous Networks: Prediction, Personalization, and Learning to Rank. // University of Maryland, UMI dissertation publishing, 2014. P. 10-69.

2.Stoyanovich J. Search and Ranking in Semantically Rich Applications. // Columbia university, UMI dissertation publishing, 2010. P.30-87.

БУГАРА ДЕНИС АНДРЕЕВИЧ - магистрант, Белорусский государственный университет информатики и радиоэлектроники, Республика Беларусь.

i Надоели баннеры? Вы всегда можете отключить рекламу.