Научная статья на тему 'Применение систем веб-аналитикидля исследования поведенияпользователей сайта'

Применение систем веб-аналитикидля исследования поведенияпользователей сайта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
172
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБ-АНАЛИТИКА / ПОВЕДЕНИЕПОЛЬЗОВАТЕЛЕЙ / ВЕБ-СЕРВИСЫ / WEB SERVICES / ИНТЕРНЕТ / INTERNET / ИНТЕРНЕТ-ТЕХНОЛОГИИ / INTERNET TECHNOLOGY / WEB-ANALYTICS / USERS BEHAVIOR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лавлинский Н.Е.

Анализ поведения пользователей веб-сайтов дает обширные воз-можности для построения новых видов сервисов в Сети, а также по-вышения эффективности существующих. В статье рассматриваютсяосновные подоходы к анализу поведения посетителей сайта с исполь-зованием систем веб-аналитики

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лавлинский Н.Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OFWEB-SITE USERS BEHAVIORUSING WEB-ANALYTICS SYSTEMS

Analysis of web-sites users behavior gives us a vast possibilities forbuilding new web-services of increasing efficiency of existing applications.The article describes some common approaches to analysis of web-usersbehavior using web-analytics systems

Текст научной работы на тему «Применение систем веб-аналитикидля исследования поведенияпользователей сайта»

ПРИМЕНЕНИЕ СИСТЕМ ВЕБ-АНАЛИТИКИ ДЛЯ ИССЛЕДОВАНИЯ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ САЙТА

ANALYSIS OF WEB-SITE USERS BEHAVIOR USING WEB-ANALYTICS SYSTEMS

Лавлинский Н.Е. — кандидат экономических наук, доцент кафедры Информатики Российского экономического университета имени Г.В. Плеханова.

Lavlinskiy N.E. — candidate of economic Sciences, associate Professor of the Chair of Informatics, Plekhanov Russian University of Economics

Аннотация

Анализ поведения пользователей веб-сайтов дает обширные возможности для построения новых видов сервисов в Сети, а также повышения эффективности существующих. В статье рассматриваются основные подоходы к анализу поведения посетителей сайта с использованием систем веб-аналитики.

Abstract

Analysis of web-sites users behavior gives us a vast possibilities for building new web-services of increasing efficiency of existing applications. The article describes some common approaches to analysis of web-users behavior using web-analytics systems.

Ключевые слова: веб-аналитика, поведение пользователей, веб-сервисы, интернет, интернет-технологии

Keywords: web-analytics, users behavior, web services, internet, internet technology

Развитие систем анализа данных в последнее время идет в сторону использования так называемых «больших данных» (big data). Это значит, что вместо чистых структурированных данных ограниченного размера используются слабоструктурированные, зашумленные, характеризующиеся полнотой охвата и увеличенным размером.

В современных системах веб-аналитики (например, Яндекс. Метрика, Google Analytics) уже давно используется механизм анализа

289

данных на основе полных сессий пользователя на сайте [1]. Одно из преимуществ Интернета как среды электронного бизнеса состоит в возможности довольно точного отслеживания поведения потребителей на сайте. Основная задача веб-аналитики состоит в переработке исходных технических данных пользовательских сессий и выявлению полезных выводов или знаний об особенностях поведения посетителей.

Можно выделить две основных группы исходных данных для целей веб-аналитики:

• данные о хитах (посещение страницы);

• данные о поведении на странице (скорость загрузки, прокрутка, курсор мыши, клики, набор текста).

Первая группа данных традиционно входит в набор инструментов веб-аналитики. Технически, при заходе на любую страницу отслеживаемого сайта происходит отправка запроса со следующими данными (часть может отсутствовать):

• ID пользователя (по coockie).

• Время.

• Браузер и операционная система.

• Разрешение экрана.

• Адрес страницы.

• Адрес страницы, с которой был переход.

• Предпочитаемый язык пользователя.

• IP-адрес пользователя.

• Данные о расширениях браузера (JavaScript, Adobe Flash), его настройках.

При наличии этих данных можно составить следующие аналитические отчеты:

• Посещаемость сайта (страницы, визиты, уникальные пользователи).

• География посещений.

• Технические параметры (браузер, разрешение, ОС, устройство).

• Карта посещений (пути по сайту).

• Глубина просмотра сайта, процент отказов.

• Источники трафика (поисковые системы, сайты, прямой ввод адреса).

Работа по интерпретации этих отчетов ложится на аналитика, который должен исходя из общепринятых правил сделать нужные выводы о поведении посетителей сайта. При этом существует большое

290

количество противоречивых параметров. Например, глубина просмотра сайта: считается, чем она больше, тем интереснее сайт и больше завлекает посетителя. Однако, для сайта электронной коммерции это может означать большое количество переходов и низкое удобство пользования.

Вторая группа данных внедрена в системы аналитики относительно недавно и дает представление о конкретных действиях на странице. Для отслеживания таких параметров программный код счетчика производит отправку запросов регулярно в течение всего нахождения пользователя на странице, собирая данные в пакеты. В процессе просмотра страницы собираются следующие данные:

1. Скорость загрузки страницы и ее отдельных компонентов.

2. Положение курсора мыши.

3. Нажатие клавиш на клавиатуре.

4. События прокрутки страницы.

5. Клики по любым элементам страниц.

6. Вводимый в поля текст.

7. Действия с сенсорным средством ввода.

Результатом обработки таких данных являются отчеты:

• Тепловая карта страницы (клики).

• Карта скроллинга (прокрутка страницы).

• Вебвизор (просмотр посещения в реальном времени с движением курсора).

• Аналитика форм (заполнение полей, отправка).

• Скорость загрузки отдельных страниц.

Отчеты этой группы также бесполезны без трактовки аналитиком.

Больший смысл в анализ поведения пользователей на сайте может внести внедрение целей посещений. Эта возможность есть в основных системах веб-аналитики и необходима для сайтов электронного бизнеса. Цель — это необходимое действие пользователя, которое обладает определенной ценностью для владельцев сайта. Для большинства сайтов электронной коммерции это заказ или оплата товара на сайте. В сфере услуг это заполнение формы заказа услуги или звонок. Основной проблемой в отслеживании целей посещения сайта является офлайновая составляющая и повторные посещения с других устройств. Например, клиент может зайти на сайт, увидеть адрес офиса компании и приехать для заказа лично. В случае с несколькими устройствами клиент может увидеть рекламное объявление, перейти по нему, а заказать товар с планшета, который никак не связан с первым компьютером.

291

Привязка целей позволяет сравнить множества посетителей, достигших цели и не сделавших этого. Таким образом, получаем набор параметров посещений «ценных» и «бесполезных» пользователей сайта. Также можно отдельно рассматривать различия в путях по сайту двух групп, возможно есть какой-то тупик на сайте, с которого посетители уходят и не совершают конверсию.

Следующим уровнем развития систем аналитики можно считать автоматизированный анализ исходных данных посещений с использованием механизмов машинного обучения. Примером может служить исследование, проведенное Ю. Устиновским, П. Сердюковым (Яндекс), посвященное персонализации выдачи с использованием изучения поведения пользователей. Также этой теме повящена работа М. Агеева, Д. Лагуна и Е. Агиштейна «Анализ неявных предпочтений пользователей», проведенной совместно Яндексом и Emory University [2, 3]. Суть этих исследований состоит в сборе и анализе данных о сессиях посещения пользователем страниц результатов поисковой системы и обычных сайтов. Общая задача персонализации выдачи поисковой машины и уточнения описания сайта (сниппета) состоит в определении наиболее ценной информации в условиях неопределенности и автоматической массовой обработки данных.

Для решения такой задачи исследователи выбрали метод машинного обучения (в том числе, метод деревьев решений). Например, для анализа уточнения контекста поиска пользователя (персонализа-ции выдачи), необходимо провести классификацию его логических сессий и кластеризовать все его посещения по логическим сессиям. В результате, например, при поиске по запросу «ягуар» пользователь увидит выдачу по животному миру, если немного ранее он интересовался статьей о кошачьих или выдачу о дилерах и сервисных центрах, если он был на сайте автомобильного журнала. Результаты указанных исследований показывают значимое улучшение качества поиска и описания сайтов, созданных с использованием машинного обучения на данных о поведении пользователей.

Возвращаясь к задачам электронного бизнеса, следует отметить значительный потенциал использования машинного обучения на данных пользовательского поведения для повышения эффективности веб-сайтов. Уже сегодня данные о продажах активно обрабатываются для советующих систем на сайтах (с этим товаром также покупают...) Однако, еще большей ценностью обладает система, дающая представление

292

об интересах и предпочтениях пользователя, даже в случае первого посещения. В сторону этой технологии движется компания Яндекс, анонсировавшая в 2013 году концепцию Яндекс. Атом. Смысл этой концепции заключается в массовой индивидуализации веб-сайтов на основе данных об интересах пользователей, выявляемых системами Яндекса. Например, технология на базе этой концепции могла бы реализовывать смену шаблонов дизайна для разных сегментов аудитории или предлагать только релевантные товары (с учетом пола, возраста и предпочтений).

В качестве заключения стоит заметить, что высокий интерес к анализу поведения пользователей делает актуальной разработку гибкой системы сбора анализа таких данных с использованием методов машинного обучения. Также важно, что на данный момент большинство бесплатных систем веб-аналитики не предоставляют экспорт данных для альтернативного анализа, доступны только готовые отчеты и комбинации уже посчитанных показателей. Таким образом, задача включает в себя две части: сбор исходных данных поведения и анализ поведения на их основе. С учетом современного уровня вычислительных мощностей, доступных бизнесу, в ряде задач можно использовать полный набор данных, исключая возможные неточности ограниченной выборки. Основными задачами такой системы могут стать: персона-лизация веб-сайтов, тестирование маркетинговых решений, выявление неявных закономерностей, оценка удобства пользования веб-сервисов.

Библиографический список

1. Абдикеев Н.М., Китова О.В., Лавлинский Н.Е., Бондаренко В.И, Евтеев Б.В. Интернет технологии в экономике знаний: Учебник / Под научной редакцией докт. техн. наук Н.М. Абдикеева. — М.: Инфра-М, 2010.

2. Mikhail Ageev, Dmitry Lagun, Eugene Agichtein. Improving Search Result Summaries By Using Searcher Behavior Data // SIGIR 2013.

3. Mikhail Ageev, Dmitry Lagun, Eugene Agichtein. The Answer is at your Fingertips: Improving Passage Retrieval for Web Question Answering with Search Behavior Data // EMNLP 2013.

Контактная информация:

125430, г. Москва, ул. Митинская, 46, кв. 125; e-mail: nick@methodlab.info.

Contact links:

125430, Moscow, Mitinskaya st., 46, 125; e-mail: nick@methodlab.info.

293

i Надоели баннеры? Вы всегда можете отключить рекламу.