ПОВЫШЕНИЕ РАЗНООБРАЗИЯ РЕКОМЕНДАЦИЙ ЗА СЧЕТ ПЕРСОНАЛИЗАЦИИ

Садовская Анастасия Владимировна; Афанасьев Арсений Геннадьевич; Афанасьев Геннадий Иванович

УДК 004.8

Информационные технологии

Садовская Анастасия Владимировна, магистрант, Московский государственный технический университет им. Н.Э. Баумана Афанасьев Арсений Геннадьевич, ассистент, Московский государственный технический университет им. Н.Э. Баумана Афанасьев Геннадий Иванович, кандидат технических наук, доцент, Московский государственный технический университет им. Н.Э. Баумана

ПОВЫШЕНИЕ РАЗНООБРАЗИЯ РЕКОМЕНДАЦИЙ ЗА СЧЕТ

ПЕРСОНАЛИЗАЦИИ

Аннотация: Рекомендательные системы завоевывают все большую известность из-за увеличения информации, доступной через Интернет. Основным аспектом качества такой системы долгое время считалась точность рекомендаций, которая связана с тем, насколько рекомендации актуальны для каждого отдельного пользователя. Однако повышенное внимание уделяется разнообразию как важному аспекту качества рекомендаций. Поскольку персонализация диверсификации была упущена из виду, мы предлагаем метод для выполнения процесса диверсификации персонализированным образом, позволяя контролировать компромисс между разнообразием и точностью. Кроме того, мы также представляем технику рекомендаций, которая использует прошлые предпочтения пользователя и рейтинги опытных экспертов по категориям в процессе генерации рекомендаций. Мы объединяем эти два метода, чтобы обеспечить более персонализированный опыт диверсификации.

Ключевые слова: разнообразие, персонализация, рекомендательные системы.

Abstract: Recommender systems are gaining more and more prominence due to the increase in information available over the Internet. The main aspect of the

quality of such a system has long been considered the accuracy of recommendations, which is related to how relevant the recommendations are to each individual user. However, increased attention is being paid to diversity as an important aspect of the quality of recommendations. Since the personalization of diversification has been overlooked, we propose a method for performing the diversification process in a personalized manner, allowing control over the trade-off between variety and accuracy. In addition, we also present a recommendation technique that uses the user's past preferences and ratings of experienced category experts in the recommendation generation process. We combine these two methods to provide a more personalized diversification experience.

Keywords: diversity, personalization, recommender systems.

Введение

Обилие информации быстро возросло с развитием технологий. Следовательно, людям стало трудно легко найти то, что они хотят. Рекомендательные системы направляют людей в персонализированной манере к интересным или полезным предметам в пространстве возможных вариантов [1]. Это выполняется путем тщательного наблюдения и записи прошлых предпочтений пользователей. Один из способов, которым пользователи указывают свои предпочтения в отношении элементов, — это оценка элементов. Основываясь на этих прошлых предпочтениях, рекомендательные системы прогнозирует рейтинг, который пользователь даст невидимому элементу, и предсказывает, насколько релевантным будет определенный элемент для пользователя. Такие системы оценивались на основе точности вынесенных рекомендаций. Но точность не является единственным фактором, который устанавливает удовлетворенность пользователей и качество рекомендаций [2]. Разнообразие и новизна рекомендаций также имеют решающее значение для повышения эффективности процесса генерации рекомендаций [2].

Разнообразие относится к тому, насколько различны элементы в списке

по отношению друг к другу [3], обычно основываясь на свойствах элементов. Разнообразие уменьшает избыточность рекомендаций, тем самым расширяя диапазон вариантов, предлагаемых пользователю.

Основная часть

Одним из известных традиционных методов рекомендаций является контент-ориентированный, который генерирует рекомендации пользователю на основе того, насколько элемент похож на функции элементов, которые пользователь предпочитал в прошлом. Другим методом является пользовательская коллаборативная фильтрация ( UserCF), которая основана на аналогичной концепции соседей и рекомендует элементы, которые были предпочтительны другими пользователями с похожими вкусами.

Хотя индивидуальное разнообразие, т.е. предоставление разнообразного набора предметов человеку, считается важным, максимизация разнообразия приводит к жертве точности, поскольку разнообразие и точность являются двумя конкурирующими целями. Таким образом, компромисс между ними должен контролироваться. Постфильтрационные подходы учитывают этот аспект и генерируют диверсифицированный список рекомендаций, жадно выбирая к элементов, которые максимизируют заданный критерий, из списка рекомендаций, состоящего из списка рекомендаций, состоящего из п (п> к) элементов, сгенерированных рекомендательной системой. Большинство из этих подходов постфильтрации [5, 6], которые контролируют разнообразие и компромисс точности, основаны на критериях максимальной предельной релевантности (MMR) [8], приведенных в (1), используемых для поиска. диверсификация результата. В (1) отношение документа к запросу пользователя обозначается s im1(Di,Q), а сходство между двумя документами обозначается s im2(Di,Dj) и А используется в качестве параметра, который контролирует разнообразие и компромисс релевантности.

MMR = arg max [Asim1(Di, Q) - (1 - А) maxsim2(Di,Dj))] (1)

D(ER\S DjES

Хотя большинство из этих существующих подходов к диверсификации

неперсонализированы и осуществляют одинаковую процедуру диверсификации для каждого пользователя, опросы пользователей [7] показывают, что склонность к разнообразию не одинакова для каждого человека. Следовательно, процедура диверсификации также должна осуществляться в персонализированной манере. Таким образом, мы определяем, что персонализированная стратегия диверсификации должна учитывать диверсификацию списка рекомендаций, включая либо более новые элементы, либо более релевантные элементы на основе прошлого опыта пользователя. Существует стратегия [9], которая диверсифицирует список рекомендаций пользователя в отношении категории товаров, на основе которого прошлые предпочтения пользователя наиболее разнообразны. Хотя это включает в себя некоторую персонализацию, она не учитывает, должна ли диверсификация придавать большее значение новым элементам или соответствующим элементам, основанным на персонализации.

Методология

В этом разделе мы попробуем представить дизайн предлагаемого подхода. Персонализированная техника диверсификации представляет собой постфильтрационный подход и состоит из двух основных компонентов, а именно: ExpertRec и PersonalizedDiv. Мы используем ExpertRec для создания списка рекомендаций, который будет использоваться в качестве входных данных для PersonalizedDiv, чтобы сформировать окончательный диверсифицированный список рекомендаций.

Экспертный рекомендательный движок (ExpertRec)

Expert — based Recommender Engine (ExpertRec) — это метод рекомендаций, который прогнозирует рейтинги для элементов на основе как прошлых предпочтений пользователя, так и оценок экспертов и генерирует список рекомендаций. Эксперты определяются как пользователи, которые имеют большой опыт работы в определенной категории предметов. Например, в домене кино пользователь, который оценил около ста романтических фильмов, имеет более высокий опыт и знания в жанре романтики, чем

пользователь, который оценил около ста фильмов самых разных жанров. Таким образом, мы определяем экспертов как пользователей, которые показали низкие разнообразные предпочтения в прошлом, и мы идентифицируем их как экспертов в категории, которую они имеют. больше опыта, о чем свидетельствует наибольшее число предметов, относящихся к этой категории. ExpertRec также учитывает, насколько релевантный элемент для пользователя, основываясь на том, насколько категории элемента похожи на категории элементов прошлых предпочтений пользователя. Чтобы предсказать рейтинги на основе оценок экспертов и прошлых предпочтений пользователя и тем самым сформировать окончательный список рекомендаций, ExpertRec проходит несколько шагов, которые представлены далее.

Измерение разнообразия предпочтений пользователей

Первым этапом ExpertRec является поиск разнообразия предпочтений каждого пользователя. Для этого мы сначала создаем профиль предпочтений категории пользователя ( Си) и используем его для измерения разнообразия. Си указывает, насколько пользователь предпочитает каждую категорию элементов. Например, в домене кино Си указывает, насколько вы предпочитаете приключенческие, романтические жанры и т.д. Вычисляем Сис в соответствии с (2) для каждой категории товара c и строим Си (Си с е Си). Профиль пользователя u включает в себя все элементы, которые и оценил, и он представлен ии. Набор категорий, к которым принадлежит элемент j, задается I j, например, это указывает на набор жанров фильма j.

Си'с = wUT^ (2)

Затем мы адаптируем энтропию Шеннона, как в (3) для вычисления разнообразия прошлых предпочтений пользователя Du. Здесь |С| указывает общее количество категорий элементов в наборе данных.

DU = - ifJt Си,с log|C| Си_с (3)

Создание группы экспертов

На этапе создания группы экспертов выбираются эксперты и создаются группы экспертов для каждой категории предметов. В ExpertR.ec пользователи, которые продемонстрировали низкое разнообразие в своих предпочтениях, были идентифицированы как эксперты в категории, которую они оценили больше всего. Для выбора экспертов мы сначала выбираем пользователей, которые имеют более низкий Би заданного порога Т (0 < Би, Т < 1). Из этих пользователей мы выбираем экспертов для каждой категории, определяя категорию с наибольшей вероятностью предпочтения (т.е. агдтах Си с) в Си этого пользователя. Если пользователь имеет одинаковую самую высокую вероятность предпочтения для более чем одной категории, мы идентифицируем этого пользователя как эксперта во всех этих категориях. Таким образом, в конце этого этапа, для каждой из категорий предметов, у нас есть группа экспертов, которая включает экспертов этой категории.

Прогнозирование релевантности

Прогнозирование релевантности — это заключительный этап Ехре^Яес, который предсказывает релевантность элемента для пользователя. Чтобы предсказать рейтинг для элемента, мы объединяем оценку, которую мы получаем, учитывая прошлые предпочтения пользователя, и оценку, которую мы получаем от экспертов. Мы получаем окончательную оценку релевантности для элемента у из (4), где иБсоге^ — это оценка, основанная на прошлых предпочтениях пользователя, а ЕБсогеу - оценка, основанная на оценках, данных экспертами. Деление на 2 указывает на одинаковый вклад обеих баллов.

„„ и5соге;+Е5соге; .

ЯБсоге] =--1 (4)

Оценка на основе пользователя

Оценка на основе пользователей (иБсоге) получается из измерения сходства на основе контента. Основная концепция иБсоге^ заключается в том, чтобы рассчитать, насколько пользователь хотел бы элемент у, основываясь на том, насколько пользователю нравятся категории элемента у, как указано в

прошлых оценках пользователя. Рассматривая оценки, которые пользователь дал элементам, которые похожи на элемент у, мы можем предсказать иБсогеув соответствии с (5).

иБсогеу =

(5)

Мы представляем оценку, которую пользователь и дал элементу ¿, по ги>^. В конечном итоге иБсоге даст оценку того, насколько важен элемент для пользователя на основе прошлых предпочтений пользователя.

Оценка на основе экспертов

Оценка на основе экспертов (ЕБсоге) — это оценка, полученная на основе оценок экспертов. Чтобы рассчитать ЕБсогеу для элемента у, мы сначала определим группу экспертов для категорий элементов у. Например, если предмет имеет жанры романтики и триллера, мы сначала выбираем группу экспертов по романтике и группу экспертов по триллерам из ранее сгенерированного набора экспертных групп. После этого мы выбираем экспертов из тех групп, которые оценили товар . Один раз набор экспертов-членов, которые оценили пункт у, заданный ЕМу, идентифицируется, все их

рейтинги агрегируются для получения ЕБсоге согласно (6). £

иеЕЛ/,

ЕЬсоге, =

I ЕМ} (6)

Ехре^Яес прогнозирует рейтинги для товаров, которые пользователь не оценил, на основе ЯБсоге, приведенного в (4), и элементы упорядочены в соответствии с прогнозируемыми рейтингами, а топ N позиции рекомендуются пользователю.

Ехре^Яес использует не только прошлые рейтинги пользователей, но и рейтинги экспертов. Следовательно, даже если пользователь не оценил какой-либо предмет, похожий на рекомендуемый товар, он все равно будет

рекомендован пользователю, если эксперты оценили его хорошо. Следовательно, ExpertRec, в отличие от других традиционных рекомендательных систем, усиливает разнообразие, позволяя добавлять новые элементы в список кандидатов пользователя. Также безопасно рекомендовать такие новые предметы, поскольку этот предмет был рекомендован не только обычным пользователем, но и группой экспертов, которые имеют более высокий опыт работы с этим предметом. категория.

Создавая список рекомендаций как с актуальными, так и с новыми элементами, ExpertRec поддерживает PersonalizedDiv для проведения диверсификации персонализированным образом. После создания первоначального списка рекомендаций из ExpertReс, мы подаем его в качестве входных данных для PersonalizedDiv и генерируем окончательный список рекомендаций.

Персонализированный модуль диверсификации

Основная задача, выполняемая модулем персонализированной диверсификации (Personal izedD iv), заключается в создании списка рекомендаций для пользователя, диверсифицированного персонализированным образом, позволяя контролировать компромисс между разнообразием и актуальностью. Основная гипотеза PersonalizedDiv заключается в следующем: с одной стороны, пользователи, которые имеют опыт работы с различными категориями предметов и отдают им предпочтение, имеют склонность к различным новым элементам. Таких пользователей можно идентифицировать по их весьма разнообразному профилю ( Си). Таким образом, PersonalizedDiv диверсифицирует списки рекомендаций таких пользователей более новыми элементами, которые разнообразны в отношении прошлых предпочтений рассматриваемого пользователя.

С другой стороны, пользователи, которые показали предпочтения только для нескольких категорий элементов, которые могут быть распознаны по менее разнообразному профилю, которым они обладают, как правило, предпочитают категории элементов, аналогичные тем, которые у них есть. ранее показывал

предпочтение. Таким образом, PersonalizedDiv диверсифицирует списки рекомендаций таких пользователей большим количеством элементов, похожих на то, что пользователь потреблял раньше. Разнообразие профиля предпочтений категории пользователя ( Си) также может иметь среднее значение, указывая на то, что пользователь предпочитает различные новые элементы, а также предметы, похожие на его прошлые предпочтения. Диверсификация списка рекомендаций такого пользователя путем включения как новых, так и релевантных элементов также регулируется PersonalizedDiv. Следовательно, целью PersonalizedDiv является получение такого персонализированного диверсификационного поведения, которое диверсифицирует окончательный список рекомендаций пользователя на основе d различий прошлых предпочтений пользователя.

PersonalizedDiv — это постфильтрационный подход, сформулированный как проблема оптимизации, которая генерирует окончательный список рекомендаций путем итеративного выбора к элементов из списка элементов-кандидатов из п(п> к) элементов, сгенерированных из ExpertRec, которые максимизируют нашу целевую функцию (7). Это более подробно объясняется в [10].

Используемая нами целевая функция, приведенная в пункте (7), принимает максимальную предельную релевантность (MMR) [9]. Он использует параметр Л (0 < Л < 1) для контроля компромисса между разнообразием и релевантностью. В (7) RScorei представляет рейтинг для элемента , предсказанный рекомендательной системой, используемый для создания списка элементов-кандидатов. Когда список кандидатов генерируется из ExpertRec, RScorei укажет рейтинг, рассчитанный по (4). Максимальная оценка, которую пользователь может дать элементу в разрешенной рейтинговой шкале, указывается MaxPossibleRating, а RScorei делится на него, чтобы получить нормализованный балл релевантности. Следовательно, первый компонент (7) связан с релевантностью элемента для пользователя.

Второй компонент (7), который является Р01у(1,Я,Си,0и), рассчитывается по (8) и коррелирует с разнообразием окончательного списка рекомендаций. Поэтому очевидно, что Л может быть использовано для контроля разнообразия и компромисса релевантности.

Рег8<таИгаЮ1У({, IIСи. Д,) = А-

i? С'pfyyp •

•»г -R—Vn ■ +(1-А)PDiv(i.R.Cu,Du) , ч

MaxPossiblc Rating ' v (J)

Если мы дополнительно проясним (8), мы можем понять, что он состоит из двух основных компонентов; ^-персонализированный, вычисляемый по (9) и Эти компоненты вместе дают оценку, связанную с

персонализированной диверсификацией. Далее мы разворачиваем каждый из этих компонентов.

Д,си, £>„) = ЖрегаопЫШ * Я) (8) V |А.-С'„.с|

. _ __.г

И',.

;0 < И ppre<maiU*d $ 1

(9)

Наша концепция персонализированной диверсификации заключается в персонализированном весе ( Wpersonац2еа), приведенном в (9). Чем выше разница между разнообразием прошлых предпочтений пользователя, Du и прошлым опытом пользователя с категорией c, которая является категорией элемента i, выше вероятность добавления элемента в окончательный список. Разница будет выше, если Du высокий, а i является новым элементом, обозначенным более низким значением Сис для категорий i или если Du низкий, а является релевантным элементом, обозначенным более высоким Си с. Дополнительные сведения о Wpersonaiized можно найти в [10]. Весовые значения WpersonaUzed рассчитываются соответствующим образом, чтобы включить персонализированную диверсификацию.

Чтобы сохранить разнообразие окончательного списка рекомендаций, мы умножаем Wpersonauzea на div(i, R) в (8). div(i, R) дает оценку того, насколько разнообразным будет список R , если мы добавим в него элемент i. Он вычисляется как обратный агрегированному попарному сходству между элементом i и каждым элементом j в списке R. Сходство между двумя

элементами вычисляется с помощью сходства J а с card.

Экспериментальные результаты

Для проведения экспериментов по оценке предложенного нами подхода мы использовали набор данных MovieLenslOOk, который содержит пользовательские рейтинги к фильмам и жанрам фильмов. Наша оценка состояла из двух фаз экспериментов. Первая серия экспериментов была направлена на оценку ExpertRec, а вторая — на изучение PersonalizedDiv. Мы использовали традиционный алгоритм UserCF, доступный в Apache Mahout, настроенный с размером окрестности 50 и сходством корреляции Пирсона в качестве меры сходства пользователей. Выборочный размер первоначального рекомендательного перечня кандидатов составлял 100 пунктов, а окончательный список рекомендаций — 10.

Эксперименты для ExpertRec

Мы провели эксперименты, чтобы оценить, является ли наш подход ExpertRec конкурентоспособным в отношении точности прогнозирования рейтинга и для содействия разнообразию в рекомендательных списках. Перед проведением количественных экспериментов мы должны были определить пороговое значение Т, которое будет использоваться в ExpertRec. Мы проанализировали набор данных и заметили, что при Т < 0,4 экспертов не было или их было очень мало. Таким образом, мы выбрали Т = 0,8, так как это средняя точка возможного диапазона значений (0,5 — 1,0).

Мы использовали UserCF в качестве базовой линии для сравнения ExpertRec с и сгенерировали список элементов кандидатов из обоих методов. Для измерения точности прогнозирования рейтинга мы использовали метрику RMSE и использовали метод удержания, сохраняя 70% оценок каждого пользователя для построения обучающего набора и оставшиеся 30% для тестового набора и проводили валидацию в течение 5 раундов. Итоговый балл R MSE был средним RMS E каждого раунда. Для измерения разнообразия мы использовали попарную метрику ILD@k [7] с Jaccard Similarity в качестве меры

подобия. Мы сгенерировали списки элементов даты candi для каждого пользователя, используя выбранную технику рекомендаций, т.е. либо ExpertReс, либо иБегСР. Затем мы измерили разнообразие сгенерированного списка каждого пользователя с помощью ILD, и окончательная оценка ILD была рассчитана путем усреднения значений ILD для каждого списка пользователей. Полученные результаты приведены в таблице 1.

Таблица 1. Результат

ILD RMSE

иБегСР 0.2336 1.1128

ExpertRec 0.2694 1.4737

Погрешность прогнозирования рейтинга, измеряемая в RMSE, показывает, насколько прогнозируемый рейтинг отклоняется от фактического рейтинга. Согласно результатам, эта ошибка больше в ExpertReс по сравнению с ияегСР. Результаты также показывают, что оценка ILD ExpertRec больше, чем ияегСР. Это указывает на то, что ExpertRec работает лучше, чем ияегСР в отношении разнообразия.

Анализируя результаты, мы заметили, что ExpertRec не работает лучше, чем иБегСР в задаче прогнозирования рейтинга. Поскольку UScore в ExpertRec рассчитывается по контент-ориентированному подходу, и единственным контентом, который мы рассматривали, был жанр в кино, вышеуказанное препятствие можно было бы уменьшить, если бы использовалось больше функций, поскольку US o вносит значительный вклад в окончательный прогнозируемый рейтинг. Это также может быть связано с некоторыми ограничениями, присущими метрикам измерения точности.

Как и ожидалось, для разнообразия ExpertRec дал лучшие результаты. ияегСР рекомендует фильмы, которые оценили соседи, имеющие схожий вкус с пользователем. Если соседи, которые имеют большое сходство с пользователем, выбраны, основываясь на транзитивном свойстве, каждый сосед

будет похож друг на друга, потому что их предпочтения однородны. Таким образом, набор рекомендаций, выработанных из их предпочтений, будет однородным. Рекомендуя фильм пользователю, ExpertRec учитывает рейтинги, данные Экспертами соответствующего жанра, а не рейтинги соседей пользователя. Эти Эксперты могут иметь или не иметь сходство с предпочтениями пользователя. Мы рассматриваем их рейтинги, потому что считаем, что, поскольку они являются экспертами в определенном жанре, фильмы, которые они высоко оценили, на самом деле являются хорошими и полезными фильмами, и можно с уверенностью рекомендовать такой фильм пользователю. Мы должны отметить, что мы рассматриваем, предпочитает ли пользователь фильмы этого жанра, а также US core. Но фильм, который не имеет никакого сходства с прошлыми предпочтениями пользователя, имеет шанс быть рекомендованным в ExpertReс, если он высоко оценен экспертами. Таким образом, ExpertRec обладает врожденными качествами для продвижения разнообразия и подтверждается полученными результатами.

Эксперименты для Р е rso па 1 \т.е dDiv

Мы провели качественные и количественные эксперименты, чтобы проверить способность PersonalizedDiv диверсифицировать список рекомендаций персонализированным образом, контролируя при этом актуальность и разнообразие компромиссов.

Качественные эксперименты

Основной целью наших качественных экспериментов было убедиться, что процесс диверсификации PersonalizedDiv персонализирован. Таким образом, мы надеемся выяснить, способен ли PersonalizedDiv диверсифицировать список рекомендаций более новыми элементами, если пользователь в прошлом демонстрировал различные предпочтения, т.е. пользователь, который предпочитает исследовать новые вещи, и разнообразить список более релевантными элементами, если пользователь показывал однородные предпочтения в прошлом.

Сначала мы проанализировали набор данных и определили три уровня разнообразия, а затем случайным образом выбрали трех пользователей для трех уровней. Уровни:

• высокий уровень: 0.7 < Du < 1.0.

• средний уровень: 0.4 < Du<0.7.

• низкий уровень: 0.0 < Du<0.4.

Мы сгенерировали список элементов-кандидатов с помощью ExpertRec и окончательный список рекомендаций с помощью PersonalizedDiv для каждого из трех пользователей. Мы настроили Л = 0 в (7) для достижения максимального разнообразия для эксперимента над поведением диверсификации. Мы тщательно изучили сформированный окончательный список рекомендаций и сгенерирован Си для проверки того, персонализирован ли процесс диверсификации.

Как показано в Таблице 2, вкусы пользователя разнообразны, и Мистерия, Вестерн, Фэнтези, Документальный и Фильм-Нуар — это жанры, в которых он имеет наименьший опыт, в то время как Ужасы являются самым новым жанром, поскольку его нет в Си. Его список рекомендаций имеет больше предметы из вышеперечисленных жанров. Однако это невозможно, если новые элементы не присутствовали в списке элементов-кандидатов, созданном ExpertReс. ExpertRec учитывает прошлые предпочтения пользователя к жанрам, а также рейтинги, данные экспертами. Новые предметы ожидаются из-за рассмотрения оценок, данных экспертами. Поскольку ужасы — это жанр романа для этого пользователя, который не находится в его Си, единственной перспективой добавления фильма ужасов в список кандидатов является EScore в (6), данный экспертами по ужасам рекомендуемым фильмам ужасов. Это свидетельствует о том, что рейтинги экспертов оказывают влияние на добавление новых пунктов в окончательный рекомендательный список.

Таблица 2. Рекомендации для пользователя (высокое разнообразие)

Пользователь в Таблице 3 имеет однородные предпочтения, которые не очень разнообразны. Его основными интересами являются боевик и триллер, в то время как приключения, романтика и преступление являются его другими предпочтениями. Его список рекомендаций диверсифицирован с большим количеством элементов предпочтительных жанров пользователя, которые включают жанры, которые мы упомянули.

Таблица 3. Рекомендации для пользователя (низкое разнообразие)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Профиль пользователя - Рекомендательный перечень

Низкоуровневый

977 Акция

273 Акция | Преступность | Триллер 925 Триллер 1250 Акция

Таким образом, проведенный качественный эксперимент показывает, что PersonalizedDiv способен разнообразить список рекомендаций персонализированным образом, адаптируя их, продвигая новые или актуальные предметы.

Количественные эксперименты

Для дальнейшей оценки PersonalizedDiv мы провели эксперименты с различными конфигурациями PersonalizedDiv. Для измерения релевантности мы использовали метрику nDCG@k, в которой верхние результаты списка кандидатов представляли ideal DCG, и мы использовали метрику ILD для разнообразия, как и раньше. Мы использовали как ExpertRec, так и UserCF для создания списков элементов-кандидатов.

Мы сравнили PersonalizedDiv со следующими базовыми иста-оф-арт техниками.

1. Случайное разнообразие: случайный выбор k элементов из списка кандидатов.

2. Отсутствие разнообразия: выбор верхних k позиций из списка кандидатов

3. MMR[8] (Я = 0.5): Современный метод диверсификации,

сконфигурированный для получения равного уровня разнообразия и актуальности. Сгенерированные списки кандидатов использовались в качестве входных данных для каждого из этих методов, а окончательные списки рекомендаций были сформированы для продолжения процесса оценки. Полученные результаты приведены в таблице 4.

Таблица 4.

ExpertRec UserCF

ILD nDCG ILD nDCG

MaxDiv Случайноеразнообразие 0.2654 - 0.2333 -

ПерсонализированныйDiv Х=0 0.1965 0.0574

MaxRel ^Разнообразие - 1.000 - 1.000

Персонализированный^ Х=1 1.000 1.000

Согласно результатам MaxDiv в Таблице 4, более высокий балл разнообразия, чем PersonalizedDiv как для ExpertRec, так и для UserCF, получен случайным разнообразием. Поскольку рандомизация является источником высшего разнообразия, для PersonalizedDiv практически невозможно получить более высокий или такой же уровень разнообразия при сохранении аспекта персонализации. Если мы сравним оценки разнообразия ExpertRec and UserCF, мы можем заметить, что существует замечательный контраст между оценками, и ExpertRec показывает более высокий показатель разнообразия. Причиной этого может быть более высокий балл разнообразия, полученный списком кандидатов ExpertRec, как в Таблице 1.

Результаты MaxRel в таблице IV указывают, как PersonalizedDiv и No Diversity получил максимальный балл релевантности 1,0 для списков кандидатов, сформированных как из ExpertRec, так и из UserCF. Поскольку и No Diversity, и PersonalizedDiv(X=1) (согласно (7)) возвращают

верхние элементы списка кандидатов, а метрика nDCG также учитывает тот же набор элементов, что и идеально релевантный список элементов, ожидается, что оба получат максимальные результаты.

Результаты конфигурации Equal Diversity & Relevance приведены в таблице 5, где рассчитывается среднее значение разнообразия и релевантности. Согласно результатам, ExpertRec поддерживает как MMR, так и PersonalizedDiv для достижения более высоких результатов по сравнению с UserCF. Результаты также показывают, что, когда пользователь нуждается как в разнообразии, так и в релевантности, мы должны рассмотреть возможность создания списка кандидатов из ExpertRec и использовать метод постфильтрации MMR. Когда пользователь нуждается в разнообразии и релевантности наряду с персонализацией, мы должны рассмотреть возможность создания списка кандидатов из UserCF вместе с техникой PersonalizedDiv. Из результатов мы можем наблюдать, что мы достигли лучших результатов, чем неперсонализированная MMR, даже с дополнительным этапом персонализации, используя элементы-кандидаты, сгенерированные из UserCF.

Таблица 5. Объединенный результат для PersonalizedDiv

ExpertRec UserCF

avg(ILD;nDCG) ivg(ILD;nDCG)

Equal Div & MMR X=0.5 0.6223 0.5302

Rel [ерсонализированныйDiv X=0.5 0.5583 0.5322

Из экспериментов мы также можем сделать вывод, что список кандидатов, сгенерированный ExpertRec, является абсолютным победителем для конфигураций MaxDiv и Equal Div&Rel для всех подходов после фильтрации и для MaxRel как для ExpertRec, так и для UserCF. являются победителями. При настройке на максимальное разнообразие PersonalizedDiv

работает лучше с ExpertRec, что показывает, что подход ExpertRec положительно повлиял на PersonalizedDiv для достижения более высокого разнообразия даже с дополнительными этап персонализации.

Заключение

Предлагаемые подходы ExpertRec и PersonalizedDiv вместе демонстрируют способность персонализировать диверсификацию рекомендаций, позволяя контролировать компромисс между разнообразием и актуальностью, а также с учетом рейтингов экспертов. Результаты экспериментов показали, что подход обеспечивает сопоставимые результаты с современными подходами.

Библиографический список:

1. Burke R., Hybrid Recommender Systems: Survey and Experiments // User Modeling and User-Adapted Interaction 12(4). 2002. P. 331-370.

2. Sean J., McNee M., Konstan J. Accurate is not always good: How accuracy metrics have hurt recommender systems // Extended abstracts on Human factors in computing systems (CHI06). 2016. P. 1097-1101.

3. Barraza-Urbina A., Heitmann B., Hayes C., Carrillo-Ramos A. Xplodiv: An exploitation-exploration aware diversification approach for recommender systems // The Twenty-Eighth International Flairs Conference. 2015. P.189-196.

4. Vargas S., Castells P. Exploiting the diversity of user preferences for recommendation // Proceedings of the 10th Conference on Open Research Areas in Information Retrieval. 2013. P.129-136.

5. Ziegler C.N., McNee S. M., Konstan J. A., Lausen G. Improving recommendation lists through topic diversification // 14th international conference on World Wide Web. ACM. 2005. P.22-32.

6. Smyth B., McClave P. Similarity vs. diversity // Case-Based Reasoning Research and Development. Springer. 2001. P.347-361.

7. Chen L., Wu W., He L. How personality influences users' needs for recommendation diversity? // CHI'13 Extended Abstracts on Human Factors in

Computing Systems. ACM. 2013. P.829-834.

8. Carbonell J., Goldstein J. The use of mmr, diversity-based reranking for reordering documents and producing summaries // 21st annual international ACM SIGIR conference on Research and development in information retrieval. ACM. 1998. P.335-336.

9. Di Noia T., Ostuni V. C., Rosati J., Tomeo P., Di Sciascio E. An analysis of users' propensity toward diversity in recommendations // 8th ACM Conference on Recommender systems. ACM. 2014. P.285-288.

ПОВЫШЕНИЕ РАЗНООБРАЗИЯ РЕКОМЕНДАЦИЙ ЗА СЧЕТ ПЕРСОНАЛИЗАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

Текст научной работы на тему «ПОВЫШЕНИЕ РАЗНООБРАЗИЯ РЕКОМЕНДАЦИЙ ЗА СЧЕТ ПЕРСОНАЛИЗАЦИИ»