с ч
ЕКОНОМ1ЧШ НАУКИ
v у
УДК 330.16--028.68:005.953.2-027.552 DOI: 10.15587/2313-8416.2018.152949
АНАЛ1З МЕТОД1В, МОДЕЛЕЙ ТА АЛГОРИТМ1В ПЕРСОНАЛ1ЗАЦП ДЛЯ РОЗРОБЛЕННЯ РЕКОМЕНДАЦ1ЙНИХ СИСТЕМ
© Ю. О. Котлярова
В cmammi до^джуються методи, моделi та алгоритми персоналгзаци в цифровому середовищi. Наведена загальна характеристика титв рекомендацшних систем, ïx методи, моделi та алгоритми, переваги та недолки застосування. В роботi запропоновано застосування таксономИ' знань для створення iнтелектуального додатку персонал1зацИ' для пiдтримки прийняття маркетингових рiшень для тдприемств у цифровому середовищi. Видшено додатковi джерела даних для створення рекомендацш Ключовi слова: персоналiзацiя, методи, моделi, алгоритми та таксономiя знань для рекомендацшних систем
1. Вступ
В еру цифрово! глобалiзацii синергетика наук е невщ'емною частиною формування нового шфор-мацшного простору. Серед таких наук можна видши-ти економшу, маркетинг та психологш.
В сучаснш цифровш економщ значну увагу потрiбно придшити вивченню саме бiхевiористичноi економiки, яка розглядае поведiнку людини пiд впливом множини факторiв зовнiшнього середовища, за принципом «стимул-реакщя», де пiд реакцiею можна розглянути кiнцевi дii покупцiв-споживачiв, наприклад, придбання товарiв, а пiд стимулом - мар-кетинговi заходи, що викликають у споживачiв потреби та бажання придбати товари. Отже, вивчаючи причини мiж стимулом та реакщею, можна встанови-ти закономiрний зв'язок, на певний стимул викликати тi чи iншi реакцп, а тим самим досягти потрiбноi по-ведiнки людини.
2. Лiтературний огляд
Людина як споживач мае значну шльшсть рiзноманiтних потреб, задоволення яких i становить змiст и поведшки.
Однiею з авторитетних бiхевiористичних моделей маркетингу прийнято вважати модель вибiрко-во! поведiнки споживача, що розроблена Ф. Котле-ром [1]. Вш характеризуе вибiр споживача як послвдовшсть трьох блокiв: стимулюючi фактори маркетингу, «чорний ящик» свiдомостi споживача та реакщя. «Чорний ящик» розглядаеться як набiр пев-них стимулiв i складаеться з двох блошв: перший -це особистiснi характеристики покупця, якi вплива-
ють на сприйняття стимулюючих факторiв маркетингу та шших подразникiв i викликають певш реакцп на них; другий - сам процес прийняття споживачем рiшення про покупку товару чи послуги, який впли-вае на споживчу поведiнку загалом.
В робот [2], що стала класикою в дослщженш та моделюваннi поведiнки споживачiв видiлено ос-новнi фактори (сощальш, культурнi, особистiснi, психологiчнi), якi впливають на поведiнку спожи-вачiв i як цi фактори впливу можуть пояснити, чому споживач приймае те або шше рiшення. Авторами розроблена модель, що показуе взаемозв'язок кон-кретних факторiв зовнiшнього середовища, внутршшх факторiв споживача та процесу прийняття ршення про покупку в едину систему, що дозво-ляе описати споживача та його потреби.
Значну увагу персоналiзацii придiлено в до-слiдженнi [3], де наведено актуальшсть застосування веб-технологiй, а саме ввдслвдковування поведiнки споживача на веб-сайтi. Кожний клiк на банер чи по-силання надае сукупнiсть шформацп про те, чим щкавився споживач, в який час, яш сторiнки ввдвщу-вав, як довго перебував на веб-сайп. Такi данi значно збагачують i доповнюють фактори, що описували [2]. Процедура реестрацii вiдвiдувачiв сайту надае мож-ливiсть зв'язати !х демографiчнi данi з поведшкою, цим самим виявити мотивацiю вiдвiдувачiв. Аналiз купiвельноi поведiнки в режимi реального часу доз-воляе персоналiзувати вмiст веб-сайтiв в залежностi ввд споживчих потреб.
Для формування вдалих рекламних кампанiй з просування товарiв безпосереднiй вплив на по-
ведшку споживачiв справляють за допомогою маркетинговых комушкацш. Запропоновано комплекс про-сування, що поеднуе у собi засоби рекламы, стиму-лювання збуту, персонального продажу, засобiв ко-мунiкацii тощо [4]. Дiевiсть впливу рiзних видiв ко-мунiкацii на поведшку споживачiв залежить вiд якосл та складових елементiв комунiкацii.
З точки зору психологи вибору та прийняття ршень споживачем в роботах [5, 6] запропоновано концепцш прийняття ршень в умовах невизначе-носп, що отримала назву «теория перспектив», яка доводить що поведшка людини нерацiональна, i що ця нерацюнальшсть не випадкова i не безглузда -навпаки, цiлком систематична i передбачувана. Авторами запропонована формальна модель, що дозво-ляе спростити створення механiзму пiдвищення за-лученосп споживача у взаемодш з маркетплейсом.
Серед моделей, що присвячеш вивченню по-ведiнки споживача та прийняття економiчних рiшень [7, 8] видмють наступнi: теорiя рацiонального вибору, теорiя iгор, теорiя прийняття ршень, теорiя очiкуваноi корисностi, теорiя перспектив, теория об-межено1' рацiональностi, теорiя масового обслуго-вування.
В умовах розвитку цифрово1' економiки та дiджиталiзацii уах сфер людськоi дiяльностi акту-альним питанням е дослiдження поведiнки саме в цифровому середовищi iз застосуванням математич-них методiв i алгоритшв.
3. Мета та задачi дослщження
Мета дослiдження - провести аналiз методiв, моделей та алгоритмiв персоналiзацii для розроблен-ня рекомендацiйних систем та задоволення потреб споживачiв.
Для досягнення мети були поставленi наступи
задачi:
1. Дослiдити потреби сучасного суспшьства в цифровому середовищi.
2. Дослвдити процес персоналiзацii в цифровому середовищi та його основт етапи.
3. Визначити перспективи застосування реко-мендацiйних систем в цифровому середовищг
4. Визначити галузi наук для дослвдження по-ведiнки та потреб споживача.
5. Проаналiзувати iснуючi сервiси, з впро-вадженими рекомендацшними системами.
6. Охарактеризувати типи рекомендацшних систем, 1'х методи, моделi, алгоритми. Навести переваги та недолiки застосування рiзних типiв рекомендацшних систем. Класифiкувати рекомендацiйнi си-стеми.
7. Розробити таксономiю знань для створення телектуального додатку персоналiзацii контенту. Описати фактори знань для розроблення рекомен-дацшних систем.
8. Визначити додатковi ресурси для збагачення даними рекомендацiйну систему.
4. Сучасш потреби цифрового суспшьства
В цифровому свт неможливо обштися без ви-користання цифрових пристро1'в, що дають змогу знайти потрiбну iнформацiю про продукт, але й мютять достатню iнформацiю про самого власника гаджету, що значно доповнюе аналiтичну картину. Часто людина стикаеться з надмiрнiстю отримання нерелевантних пропозицш вiд представникiв елек-тронного бiзнесу, що формуе не завжди позитивне враження. Значною проблемою е й великий рiзновид варiантiв пропозицiй, що ускладнюе вибiр того чи шшого товару. Пiдтримка прийняття рiшення в цифровому шформацшному просторi е серйозною проблемою. Тому, щоб допомогти споживачевi знайти i надати необхiдну iнформацiю, digital-маркетологи розробляють i впроваджують рекомендацiйнi систе-ми (recommender systems), якi дозволяють максимально налаштувати, персонiфiкувати та спрогно-зувати, що забажае окремий споживач, i надати йому вiдповiдне комерцiйне повщомлення пiд його кон-кретну потребу. Ршенням визначених проблем е ро-зроблення рекомендацiйних систем на основi ме-тодiв, моделей та алгорштшв персоналiзацiï. Викори-стання таких систем дозволить e-commerce при-скорити та зб№шити прибуток, а споживачам задо-вольнити власш потреби та побажання.
Технологи персоналiзацiï виводять цифровий маркетинг на новий штелектуальний рiвень, що часто називають превентивний маркетинг або маркетинг без попередження.
5. Результати дослвджень
Персоналiзацiя - одне з найактуальшших питань сучасного штелектуального маркетингу, що знайшло свое мшце в рекомендацiйних системах, яю формують рекомендацiï незалежно для кожного конкретного споживача на основi його попередшх дiй (покупок, пошукiв, вподобань, оцшок, вiдгукiв та коментарiв), сощально-демографiчних даних та враховуючи поведшку шших користувачiв цифрового простору. Щ данi потiм застосовують для прогнозування того, як менти оцшюють набори сумiжних товарiв або наскшьки ймовiрно, що клiент повинен купувати додатковий товар. Реко-мендацiйнi системи базуються на двох принципах: перший - це потреби людини, що визначають напрям дш (поведшка), другий - реакщя на стимул (задоволення чи незадоволення потреб), яка на ос-новi даних про користувача i товар (предмет) дае рекомендаций Зазвичай таш системи включають в себе весь процес - ввд отримання шформаци до ïï представлення користувачу, застосовуючи программ iнструменти та методи (рис. 1).
Рис. 1. Цикл персонaлiзaцiï в цифровому середовищi в контекстi рекомендaцiйниx систем
Метою персоналiзацiï в цифровому середо-вищ1 е створення для покупцiв-споживачiв персонального комфортного простору в мереж1 1нтернет взагалi, i позитивного досввду взаемодiï з e-commerce-ресурсами, зокрема 1нтернет-магазинами, електронними торговими майданчиками i прайс-агрегаторами, яш також вiдомi як маркетплейси. Як наслщок, пошуковi сервiси та власники e-commerce отримують iнструментарiй для оптишзацд викори-стання сво1х ресурсiв.
Впровадження таких рекомендацiйних систем (технологiй персоналiзацiï) дозволить вирiшити цiлу низку проблем:
- вивчення сегменту та потреб споживачiв, враховуючи психологiчнi та фiзичнi особливостi;
- iнформування споживачiв про цiкавi пропо-
зицiï;
- перевантаження нецiльовим контентом;
- калiбрування вподобань споживачiв та утри-мання ïx зацiкавленостi;
- шдвищення вартостi кошика;
- заохочення та зацiкавленiсть до продукту чи платформи e-commerce;
- персоналiзацiя контенту для споживачiв;
- вивчення поведшки споживача на e-commerce-ресурсах;
- продаж супутнix товарiв;
- швидка адаптацiя до нових штереив спожи-
вача;
- формування актуальних комерцiйниx пропо-зицiй для споживачiв;
- заощадження часу на здшснення пошуку по-трiбниx товарiв;
- формування цшьових повiдомлень через email розсилку;
- шдвищення лояльносп та прив'язаностi до бренду.
Описaнi проблеми дозволить виршити си-нергетикa тaкиx гaлузей нaук, як псиxологiя, шфор-мaцiйнi теxнологiï, мaтемaтикa тa стaтистикa (рис. 2). В дaному випaдку псиxологiя повиннa вiдповiсти нa пигання, як1 сaме елементи контенту вaрто врa-xовувaти, щоб результaт рекомендaцiï можнa було б нaзвaти персонaлiзовaним, тобто персонaльне зaдо-волення потреб окремого спожнвaчa. Соцiологiя ви-стуше як iнструмент для спостереження, реeстрaцiï фaктiв (опитувaння), узaгaльнення тa виведення зa-кономiрностей в деякому соцiaльному середовищi тa соцiaльнiй реaльностi. Iнформaцiйнi теxнологiï мaють нaдaти необxiднi прогрaмно-теxнiчнi зaсоби, що iнтегровaнi з метою збирaння, опрaцювaння, зберiгaння, розповсюдження, вiдобрaження тa вико-ристaння iнформaцiï, a мaтемaтнчнa стaтистикa, в свою чергу, повиннa зaбезпечити iнструментaрiй (aлгоритми, методи тa моделi) для видiлення тa ш-терпретaцiï елементiв рекомендaцiï. В дaному шд-xодi розробляеться модель псиxологiчного портрету користувaчa, якa дозволить з високою iмовiрнiстю прогнозувaти реaкцiю спожнвaчa нa зaпропоновaну йому одиницю контенту.
Досвщом зaстосувaння рекомендaцiйниx систем дшяться тaкi велик1 цифровi сервки, як Amazon, Netflix [9, 10], Facebook, LinkedIn, YouTube, Spotify, Google, Best Buy, Pinterest, Last.fm, Pandora, тa Le Boutique [11, 12]. У кожному з rnx юнуе своя спецнфiкa, якa безпосе-редньо зaлежить вщ типу дaннx, яш потрiбно рекомен-дувaти. ïx основш метa - збнрaти величезну шльшсть дaниx, що стосуеться поведiнкн спожнвaчiв тa ïxmx дiй у межи середовищ^ тa прогнозувaти, як1 об'екти мо-жуть бути цiкaвi спожнвaчу. Цю iнформaцiю можнa си-стемaтично зберiгaти в профiляx користувaчiв i зaсто-совувaти для мaйбутнix взaeмодiй.
Розглянемо основнi методи, моделi тa aлго-ритми рекомендaцiйниx систем ^бл. 1).
Рис. 2. Галузi наук nepcorafli3a^ï в KOHTeKCTi рекомендацiйних систем
Таблиця 1
Загальна характеристика типiв рекомендацшних систем, ïx методи, модeлi, алгоритми, переваги та нeдолiки за-
стосування
Tun peKOMeMga-iiiiiiioï CHCTeMH Характеристика ре-комендацшноТ сис-теми Методи, модел1 та алгоритми, що за-стосовують Переваги Недолiки
1 2 3 4 5
Ko^aôoparaBHa $№трaцw Ha oc- HOBi naM'ari (Memory-based collaborative filtering) У [13-15] описано, що даний вид фттрацп намагаеться знайти користувачiв, якi схожi на активного користувача, i вико-ристовуе !х вподобан-ня для прогнозування одиниць контенту для активного користува-ча, що формуються на основi обчислення мь ри схожосп по нако-пиченим даним. метод найближчих сусiдiв, корeляцiя Пiрсона, векторна модель (подiбнiсть на основi векторного косинуса) - масштабування для великого об'ему даних; - простий в реалiзацii; - легке оновлення бази даних контенту. - пов№ний в об-численнi, так як використовуе всю базу даних кожного разу коли здшснюе прогно-зування; - неточнi та не-надшш рекомен-дацii.
Ko^aôopaTHBHa $№трaцw Ha oc-HOBi aHam3y mo-gem gaHHx (Model-based collaborative filtering) Використовуе ма-шинне навчання i ш-телектуальний аналiз даних, що знаходить складнi шаблони оцi-нки в навчальних да-них, а потiм робить штелектуальш висно-вки або рекомендацп для користувача на основi вивчено1' моде-лi. Такий пiдхiд у [16] спрямований на по-шук закономiрностей, що дозволяе розкрити прихованi чинники, що пояснюють оцшку користувачiв. методи Байесових мереж, методи кластерного аналiзу, методи на основi моделей Маркова, мереж залежнос-тей, модeлi регресс, методи розкла-дання сингулярних значень (SVD), ма-трична факториза-цiя - тдвищення продукти-вностi прогнозування; - масштабування до фактичного набору даних; - легко уникае викорис-тання фiтингiв. - розрiдженiсть даних, що пояс-нюеться не мож-ливютю надати рекомендацп ко-ристувачам що не мають оцшок або рейтингу на оди-ницю контенту; - не пiдтримують шкрементного навчання, менша точнiсть прогнозу.
Продовження таблицi 1
2
5
Колаборативна
фiльтрацiя на ос-
новi подiбностi
користувачiв
(User-based
collaborative
filtering)
Фiльтрацiя цього типу проходить в два етапи [17]: на першому ви-значаеться скiльки користувачiв у баз1 даних сxожi з поточ-ним користувачем, на другому - оцшюють-ся сxожi користувач1, щоб передбачити, який тип контенту на-дати користувачeвi, враховуючи загальну вагу користувачiв, що бiльш сxожi на нього.
Колаборативна фiльтрацiя на ос-новi подiбностi eлeмeнтiв (Item-based
collaborative filtering)
Для формування ре-комендацiй викорис-товуеться подiбнiсть мiж оцiнками моделей елеменпв. Якщо два елементи, як правило, мають однаковi оцш-ки користувачiв, то вони схожц i користу-вачi повиннi мати аналопчш рекомен-дацii для подiбних елементiв, доведено у [17].
вщстань Евклiда, Хеммшга, ввдстань мiських квартатв, кореляцiя nipcoHa, рангова кopеляцiя Стрмена, алгоритм Weighted Slope One, навний клacифiкaтop Байе-са, кластерна модель, матриця фак-тopизaцii, косинус-на пoдiбнicть, кое-фiцiент Жаккарда.
- штуггивно зрозумiла i проста в рeалiзацiï;
- висока точнiсть;
- ефективна з точки зору часу формування реко-мендацш;
-ресурсомютшсть (вимоги до пам'я-тi) так як для роз-рахунку рекоме-ндацш необхвдно збeрiгати всю ма-трицю даних про користувачiв та гх вподобання;
- складнiсть (велика шльшсть обчислень, що нeобxiднi для отримання реко-мeндацiй);
- обчислення схожосп доц1ль-но для вiдносно невеликих баз даних;
- складшсть про-гнозування для нових користува-чiв, так як у них ще немае оцшок;
- при оброблeнi великоГ шлькосп даних та обчис-лeннi сxожостi виникають про-блеми отримання рeзультатiв реко-мендацш в реальному часi;
- складшсть про-гнозування при появi нових елеменпв, так як для них ще немае оцшок.
Колаборативна фiльтрацiя на ос-новi транзакцш (transaction-based)
Для видачi рекомен-дацiй, використову-ють данi щодо здшс-нених рашше транза-кцiй купiвлi товарiв [18], що представля-ють собою деякий на-бiр елеменпв контенту (товарiв), що ку-пують разом.
асошативш правила, алгоритм Apriori
- вiзуалlзацiя здiйснeниx транзакцiй;
- висока швидшсть ана-л1зу даних;
- висока точшсть i стаб1-льн1сть.
- надшрна к1ль-к1сть товару, що е у правилах, може ускладнити ана-л1з законом1рнос-тей;
- надм1рна шльшсть правил мо-же ускладнювати розум1ння.
1
3
4
Продовження таблиц 1
1 2 3 4 5
Колаборативна фiльтрацiя на ос-HOBi тепв (tag-based) Рекомендацiйнi сис-теми на основi тегiв аналiзують термши, якi використовуе ко-ристувач, виявляючи залежнiсть !х семан-тичного значення з контекстом де вш зга-дуеться, хоча саме значения елементу в контексл не ввдобра-жаеться[16]. Такi сис-теми можуть «розумь ти» iнформацiю про самого користувача i контекст в якому за-значений тег. матрична фактори-зацiя, iмовiрнiсний факторний аналiз, косинусна подiб-HicTb, метод най-ближчих сусiдiв, методи кореляцii, латентно-семантичний ана-лiз, на1вний класи-фiкатор Байеса, алгоритм Apriori, алгоритм Портера, алгоритм Пейса - фжсують важливi по-няття щодо контенту; - виявлення штереав користувачiв; - кластeризацiя контенту; - покращуе виявлення подiбностi користувачiв; - легке оновлення про-фшю користувача (дода-вання тeгiв) - низька продук-тившсть; - складнiсть по-будови; - залучення сто-роншх сeрвiсiв для отримання додаткових даних про теги та 1х ви-користання.
Колаборативна фiльтрацiя на ос-HOBi латентних моделей (Latent models for collaborative filtering) На моделi з прихова-ними факторами великий вплив мають саме набiр фактов, якi дуже специфiчнi для предметно! облас-тi (наприклад, склад-шсть персонаж!в фь льму, кiлькiсть дш у фiльмi). Такi фактори в цшому неочевиднi i тому важко оцiнити !х вплив на рейтинг. Основною метою даних моделей е виявити приховаш фактори з даних рейтингу за до-помогою математич-них методiв, зазначе-но у [19, 20]. семплювання за Гiббсом, латентне розмщення Дiрiх-ле, байесовськi ме-режi, гаусовське розподiлення, метод Ланцоса, ста-хастичний градiен-тний спуск, матри-чна факторизащя, алгоритм Expectation Maximization, алгоритм SVD, метод максимальноi пра-вдоподiбностi, алгоритми multi-armed bandit. - висока точшсть; - дозволяе врахувати не тiльки парнi лiнiйнi ко-рeляцiï, але й множиннi взаемоди змiнних. - можливiсть оперувати прихованими змiнними; - можливiсть моделюва-ти складш явища; - можливiсть пeрeвiрки моделей на вiдповiднiсть вихiдним даним. - складшсть су-мiсного викорис-тання; - зниження шви-дкостi обчислен-ня при збшьшен-нi обсягу вхiдних даних.
Колаборативна фiльтрацiя на ос-новi графiв (Graph-based collaborative ranking) Алгоритми рекомен-дацш на основi графь шв являють собою вь дносини мiж користу-вачами та елементами як двопарний графiк, де ввдображаеться по-парне порiвияння вподобань користува-ча до елементу, який вш оцiнив [21]. метод найближчих сусщв, iндекс Ка-ца, косинусна по-дiбнiсть, алгоритм Random Walk with Restarts, класифшащя за методом Роккю - моделюе ранговi данi у формi структури графiв, що дозволяе ощнювати близькiсть користувачiв та елеменпв, на основi яких можна зробити ре-комeндацiю. - даш залежать вiд контексту; - висока вартють збирання даних для побудови графу; - трудомюткий процес складання залежностей.
Продовження таблиц1 1
1 2 3 4 5
Рекомендацшш системи на осно-вi контенту (Content-based filtering) Рекомендац1йн1 системи контентноГ ф1ль-траци працюють з проф1лями користува-ч1в, що м1стять впо-добання та смаки. Вподобання заснован1 на рейтингу користу-вача для р1зних пред-мет1в. В процес1 ре-комендац1й пор1вню-ються елементи, як1 вже позитивно оц1нив користувач, з елемен-тами, як1 в1н не оц1-нив, i знаходяться зб1-ги. Елементи, схож1 на позитивно оц1нен1, будуть рекомендован! користувачев1 [22]. матрична фактори-защя, матриць, ко-синусна подiб-нiсть, асоцiативнi правила, латентне розмiщення Дiрiх-ле, прихована мар-ковська модель, алгоритм прямого-оберненого ходу, векторна модель, шдекс Соренсена - рекомендацп на основi вподобань конкретного користувача; - найб№ш ефективний для персональних реко-мендацiй. - неможливють виведення цiльо-вих рекомендацш в разi незаповне-ного профшю; - рекомендацii аналогiчнi тим, яю користувач надавав перевагу в минулому; - неоцшеш кори-стувачем елемен-ти не можуть бути рекомендова-ш
Рекомендацшш системи основаш на знаннях (knowledge-based filtering) Це системи, як1 для формування рекомен-даци використовують отриман1 знання з предметноГ област1. Дана система форму-вання рекомендацш не враховуе оц1нки 1нших користувач1в, а лише проф1ль конкретного користувача i об'екти. В зв'язку з цим системи можуть враховувати користу-вацьк1 побажання, де-мограф1чн1 особливо-ст1 та ш [23]. метод найближчих сусiдiв, на1'вний класифiкатор Байе-са, асоцiативнi правила, методи нечггко1' iмплiкацii, асоцiативнi мережу карти подiбностi, байесовi мережi. - бiльш глибокий аналiз об'ектiв, будуючи зв'язки мiж об'ектами не за критерiям схожосп, а враховуючи взае-мозв'язок груп об'ектiв; - враховують ряд додат-кових опцш, якi вiдно-сяться до iндивiдуальних ознак конкретного кори-стувача; - простота реалiзацii при наявному наборi правил. - труднощi в по-будовi знань; - складно засто-совувати, де то-вари часто купу-ються; - залежнiсть вiд предметно1' обла-стi;
Рекoмендaцiйнi системи ocнoвaнi на випадках (case-based filtering) Case-based п1дх1д враховуе наявшсть дода-тковоГ сутносп [24] : вимоги користувача (user requirements). Задача даного шдходу заключаеться в тому, щоб знайти рекомендован! об'екти, зпдно вимогам. метод найближчих сусщв, асоцiативнi правила, кореляцiя Пiрсона, кластерна модель, матриця факторизацii, кое-фiцiент Жаккарда - здiйснюеться пiдбiр рекомендацiй на основi подiбностi; - точна ввдповщшсть за-питу користувача. - вимагае уточ-нення вiд корис-тувача; - використовуе данi на основi минулих рекоме-ндацiй.
Продовження таблицi 1
1 2 3 4 5
Рекомендацшш системи на осно-Bi сощально-демографiчних даних (demographic / social-based filtering) Даний тип рекомен-дацш категоризуе ко-ристувачiв на основi демографiчних груп, враховучи вж, стать, на скiльки вiн забез-печений, де проживае, сшльки заробляе та iн. Системи сощальних рекомендацiй вирь шують проблеми тра-дицiйноi рекоменда-цИ, використовуючи сощальн данi про користувача, поведшку, його оцiнки, вщноси-ни, членство в стль-нотах, вподобання, коментарi, голоси, закладки та ш. [25]. методи розкладан-ня сингулярних значень (SVD), Обмежена машина Больцмана, методи регресiйного аналi-зу, методи спектрального розкладу, тензорна фактори-зацiя, алгоритми баготорiвневоï кластеризацiï, мат-рична кластериза-щя, генетичнi ал-горитми - не потребуе iсторii оцiнок користувачiв; - точне сегментування та кластеризация користу-вачiв - великий обсяг даних про корис-тувача; ресурсомютшсть обчислень; - обмеженiсть даних про корис-тувачiв.
Рекомендацiйнi системи на осно-Bi корисносп ш-формацii (utility-based filtering) Utility-based розрахо-вуе вiдносну користь кожного елементу для користувача [26]. В даних рекомендацш-них системах можна створювати багато власних областей знань i ранжувати по ним, досягаючи мак-симальних результа-тiв регресiйний аналiз, нейронш мережi, генетичнi алгорит-ми - надае рекомендаци щодо невiдповiдних ат-рибутiв продукту; - висока ефектившсть застосування. - побудова функ-ц11' корисносп для кожного окремо-го користувача; - вимагае вiд ко-ристувачiв оць нювання елементi для функци кори-сностi, що наван-тажуе користува-ча.
Описанi рекомендацшш системи прийнято класифiкувати за факторами персоналiзацiï й видшя-ють системи колаборативноï (спiльноï) фiльтрацiï, контентно-орieнтованi системи, системи основаш на знаннях, на ступеш корисностi, на сощально-демографiчних показниках i гiбриднi системи (рис. 3).
Пбридш системи мiстять методи, яш поедну-ють фiльтрацiю на основi спiльного використання та контенту, а також iншi методи рекомендаций У [27] наведено основнi стратеги пбридних рекомендацiй:
- перемикання мш методами;
- одночасне використання рiзних рекомен-дацiй (мiксування);
- об'еднання декiлькох методiв;
- уточнення шшими рекомендацiйними системами;
- характеристики рiзних джерел даних реко-мендацш виводяться разом у единий алгоритм ре-комбiнацii;
- одна модель рекомендацш використовуеться як iнша;
- вихвдш данi однiеi системи застосовують як вхдт для iншоi.
Загалом рекомендацiйнi системи застосовують знання, яш можна отримати з профiлю користувача, що складаеться з уподобань, штереав i потреб та з самого маркетплейсу - дат про контент. Виходячи з цього можна розробити таксономiю знань для створення iите-лектуального додатку персоналзаци (рис. 4).
Рис. 3. Класифжатя рекомендацiйних систем
1 1сощальш знания
Ьщивщуалып знания
Джерела знань /
1
1 Знания предметно! обласп
Поведшка (ди)
1нтереси
Поведшка
Ощнка
Демограф1чт показники
h Рейтинги
Контекст — Вщгуки
N
Демограф1чт показники Мггки (ощнка)
Вимоги Вщгуки
1нтереси та побажання Ц / \ Точки входу/виходу
Кшки
Контент Значення
Характеристика контенту Параметри
Контексту альт знания Обмеження
Рис. 4. Таксономия знань для створення iнтелектуального додатку персоналiзацii
Таким чином розроблену таксономiю знань можна представити як набiр елементiв:
Т2рег!!опа1=^к, 1к, Бк>,
де Бк - множина соцiальних знань, що включае тдмножину (Б1, БЪ, БЛ, Бс}, де Б1 - соцiальнi штере-си дослщження предметно1' областi; БЪ - сощальна поведiнка споживачiв товарiв чи послуг предметно1' областi; БЛ - соцiально-демографiчнi показники споживачiв предметно1' обласп; пiдмножина Бс=(Ба\ Бсг, Бсс}, де Бс - контекст предметно1' обласп, що ви-користовуеться для соцюлопчних дослiджень, Ба' -оцiнка контенту предметно1' областi на основi соцюлопчних дослщжень, Бсг - рейтинг контенту предметно1' областi на основi соцюлопчних до-слiджень, Бсс - вщгуки про контент дослiджуваноi предметно1' обласп;
Ik - множина iндивiдуальних знань про кори-стувача, що включае в себе тдмножину {Ia, Idi, Ir, Iiw}, де Ia - дп, яш здшснював конкретний користу-вач; Idi - соцiально-демографiчнi показники окремо-го користувача; Ir - вимоги та побажання конкретного користувача; Iiw - тдмножина, що мютить пара-метри iнтересiв конкретного користувача i складаеть-ся з {Iiws, Iiwc, Iiwp, Iiwcl}, де Iiws - оцшка контенту користувачем; Iiwc - ввдгуки, що залишив користувач про контент; Iiwp - веб-сторшка, з яко! користувач прийшов та з яко! завершив свое перебування в цифровому об'екп; Iiwcl - д^ користувача ввдносно цифрового об'екта (теплова карта, трекер подш);
Dk - множина знань про предметну область, що включае тдмножину знань {Dc, Dd, Dck}, де Dc -контент деяко! предметно! обласп; Dd - характеристика (опис) контенту предметно! обласп за атрибутами {Ddv, Ddp, Ddc}, де Ddv - числовi значення, що
може приймати одиниця контенту, Ddp - параметри, як1 характеризують одиницю контенту i Ddc - обме-ження для деяко1' одиницi контенту; Dck - знання, щодо специфiчних особливостей одиницi контенту задано1' предметно1' областi.
Сдиним суттевим недолiком бшьшосп реко-мендацiйних систем можна видшити проблему «холодного старту», як для нових користувачiв, так i для нових елеменпв контенту. «Холодний старт» - розрщжешсть даних, тобто ввдсутшсть початкових даних для надання рекомендацш, у випадку з користувачами - це ввдсутшсть реакци на контент (оцшка, мiтка, рейтинг) та ввдсутшсть даних про самого користувача, а з елементами контенту - ввдсутшсть тих самих оцшок вщ користу-вачiв, отже нiкому ix рекомендувати. Але дану проблему можна вирiшити, здiйснивши коре-ляцiйно-регресiйний аналiз для елементiв предметное' обласп або iз застосуванням однокласовоï ко-лаборативноï фiльтрацiï (one -class collaborative filtering), де е достатшм сам факт придбання оди-ницi товару.
Для збагачення даними застосовуються таш категорй' даних:
- first party data - власш данi, яш накопичив маркетплейс про сво^'х ктенпв, що зiбранi в процесi ïx взаемодй' з маркетплейсом (чим щкавилися, як1 сторiнки переглядали), а також дан з CRM-системи;
- second party data - це сторонш даш маркет-плейсу, як1 можна придбати для збагачення сво^'х даних i отримати новий погляд на власних ктенпв. До уваги беруть клжи, сощальну активнiсть (натис-кання кнопки «подiлитись», лайки), iншi поведш-ковi фактори;
- third party data - даш трепх сторш; ïx джере-ло - сервюи email-розсилок, платiжнi системи, сто-ронш веб-ресурси, данi лiчильникiв з веб-ресурав, облiковi записи соцiальниx мереж, даш з DSP -платформ (Demand Side Platform) i RTB-системи (Real Time Bidding), сервюи обробки i збертання даних про цшьову аудиторш - DMP-платформи (Data Management Platform, платформа керування даними) [28].
Одшею з новiтнix теxнологiй збору шформацп про вибiр, поведiнку, звички та навиъ емоцп кори-стувачiв, з ïx цифрових пристроив е (финес-трекери, мобiльнi пристроï) - intelligent user interfaces [29], що попм обробляеться методами штучного штелекту (розпiзнавання образiв i ситуацiй, мови, тексту, жеспв, класифiкацiя зображень) для формування персоналiзованоï рекламное' пропозицп.
Таким чином проведений аналiз методiв, моделей та алгоршмв рекомендацiйниx систем свiдчить про наявшсть широкого арсеналу шстру-ментiв для створення рекомендацшних систем, що може стати шдгрунтям для вдосконалення шфор-мацiйного забезпечення систем пiдтримки прий-няття рiшень та вдосконалення самого мехашзму формування рекомендацiй користувачу в цифровому середовищг Така система забезпечить стш-кий розвиток та функцюнування цифрових пiдприемств та ввдповвдатиме вимогам сьогодення.
6. Висновки
1. Для задоволення потреб сучасного спожива-ча в цифровому середовищi необхщно застосовувати новiтнi iнформацiно-комунiкацiйнi технологй', рекомендацшш системи зокрема. Таю системи дозволя-ють персоналiзувати контент та тдвищити релевант-нiсть комерцiйниx повщомлень.
2. Для формування персональних рекомен-дацiй, необх1дно пройти так1 етапи:
- зiбрати початковi данi про споживача та його дй' ввдносно контенту та маркетплейсу;
- обробити отримаш результати методами iнтелектуального аналiзу даних;
- здiйснити прогнозування отриманих резуль-тат1в та представити рекомендаци окремому споживачу.
3. Рекомендацiйнi системи виршують низку проблем, що пов'язаш з задоволенням потреб спожи-вачiв вiдповiдно до ïx вподобань. До основних пере-ваг можна вщнести:
- формування актуальних комерцiйниx пропо-зицiй для споживачiв, тим самим тдвищуеться вартiсть кошика та обсяги продаж1в супутнix товарiв;
- шдвищення лояльносл та прив'язаностi до бренду;
- заохочення та зацiкавленiсть до продукту та маркетплейсу.
4. Для виршення проблеми персоналiзацiï варто залучити додатковi галузi наук, так1 як псиxологiя, iH-формацiйнi технологй', математика та статистика, що дозволять дослвдити поведiнку споживачiв, виявити за-кономiрностi та потреби, а також прогнозувати реакц1ю споживача ввдносно сформовано^' рекомендацй'.
5. Свiтовi гiганти цифрового бiзнесу визнають високий потенцiал у тому, що системи рекомендацш дозволяють збирати величезну шльшсть iнформацiï щодо поведiнки користувачiв та ïxHix дiй в цифровому середовищг Як показуе практика таш iнтелекту-альнi додатки задовольняють потреби споживачiв та п1двищують ïx лояльшсть.
6. Аналiз рiзниx типiв рекомендацшних систем, ïx метода та алгортшв показав ïx високу практичну значимють виходячи зi специфiки предметное' областг Однi алгоритми виграють за часом, iншi за точнiстю, але для тдтримки маркетингових рiшень саме в цифровому середовищi було виршено обрати так1 методи: методи розкладання сингулярних значень (SVD), метод найближчих сусiдiв, наï'вний класифiкатор Байеса, байесовi мережi, асоцiативнi правила. Комплекс таких метода дозволяе створити iнгелектуальнi рекомендацшш системи, що пояснюють, переконують та про-гнозують, тим самим розширюючи класичнi меxанiзми цифрового середовища.
До основних типiв рекомендацiйниx систем прийнято в1дносити колаборативну фiльтрацiю, рекомендацшш системи на основi контенту та пбридш В залежносп вщ специфiки предметноï областi та виршення проблеми вiдсутностi початкових даних пропонуеться використовувати i iншi типи рекомендацшних систем, що основаш на знаннях, на ступеш корисносп, на соцiально-демографiчниx показни-ках, яш можуть доповнювати, уточнювати, замiщувати та збагачувати даними рекомендацiйнi
системи для надання бiльш вдалих, персоналiзова-них рекомендацiй.
7. Для подальшого проектування штелекту-ального додатку з персоналiзацii контенту було ро-зроблено таксономш (онтологiю) знань, де видшено такi фактори: множину сошальних знань, множину
iндивiдуальних знань про споживача та множину знань про предметну область.
8. Для розширення знань, щодо персональних рекомендацш доцiльно використовувати спецiальнi джерела знань цифрового простору, - RTB-систему, DSP- та DMP-платформи.
Лiтература
1. Котлер Ф. Основы маркетинга. Москва: Прогресс, 1990. 672 с.
2. Блэкуэлл Р., Миниард П., Энджел Дж. Поведение потребителей: уч. Санкт-Петербург: Питер, 2007. 944 с.
3. Алешина И. В. Поведение потребителей: уч. Москва: Экономистъ, 2006. 525 с.
4. Прокопенко О. В., Троян М. Ю. Поведшка споживачiв: навч. пос. Кшв: Центр учбовоi лггератури, 2008. 176 с.
5. Kahneman D., Tversky A. Prospect Theory: An Analysis of Decision under Risk // Econometrica. 1979. Vol. 47, Issue 2. P. 263-292. doi: http://doi.org/10.2307/1914185
6. Tversky A., Kahneman D. Advances in prospect theory: Cumulative representation of uncertainty // Journal of Risk and Uncertainty. 1992. Vol. 5, Issue 4. P. 297-323. doi: http://doi.org/10.1007/bfD0122574
7. Поведенческая экономика: современная парадигма экономического развития: монография / ред. Журавлёвa Г. П., Манохит Н. В., Смагиш В. В. Москва-Тамбов: Издательский дом ТГУ им. Г.Р. Державина, 2016. 340 c.
8. Поведение потребителей: уч. пос. Тамбов: Изд-во ФГБОУ ВПО «ТГТУ», 2012. 84 с.
9. Linden G., Smith B., York J. Amazon.com recommendations: item-to-item collaborative filtering // IEEE Internet Computing. 2003. Vol. 7, Issue 1. P. 76-80. doi: http://doi.org/10.1109/mic.2003.1167344
10. Amatriain X., Basilico J. Netflix Recommendations: Beyond the 5 stars (Part 1). Netflix Technology Blog. 2012. URL: https://medium.com/netflix-techblog/netflix-recommendations-beyond-the-5-stars-part-1-55838468f429
11. Corinna U. Use Cases of Recommendation Systems in Business - Current Applications and Methods. 2018. URL: https://emerj.com/ai-sector-overviews/use-cases-recommendation-systems/
12. Златьева Д. Опыт персонализации контента в Le Boutique: как интуиция побеждает machine learning. 2016. URL: https://retailers.ua/news/tehnologii/5102-opyit-personalizatsii-kontenta-v-le-boutique-kak-intuitsiya-pobejdaet-machine-learning
13. Джонс М. Т. Рекомендательные системы: Часть 1. Введение в подходы и алгоритмы. Принципы работы рекомендательных механизмов Интернета // IBM Corporation. 2014. URL: https://www.ibm.com/developerworks/ru/library/os-recommender1/index.html
14. Tilahun B., Awono C., Batchakui B. A Survey of State-of-the-art: Deep Learning Methods on Recommender System // International Journal of Computer Applications. 2017. Vol. 162, Issue 10. P. 17-22. doi: http://doi.org/10.5120/ijca2017913361
15. Korbut D. Recommendation System Algorithms. Main existing recommendation engines and how they work. 2017. URL: https://statsbot.co/blog/recommendation-system-algorithms/
16. Tag-based collaborative filtering recommendation in personal learning environments / Chatti M. A. et. al. // IEEE Transactions on Learning Technologies. 2013. Vol. 6, Issue 4. P. 337-349. doi: http://doi.org/10.1109/tlt.2013.23
17. Пятикоп Е. Е. Исследование метода коллаборативной фильтрации на основе сходства элементов // 1нформатика, юбернетика та обчислювальна технжа. 2013. С. 109-114.
18. Machine Learning (8) - Recommender Engine: Collaborative Filtering. 2015. URL: oliviaklose.azurewebsites.net
19. Hofmann T., Puzicha J. Latent Class Models for Collaborative Filtering // IJCAI '99 Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers Inc., 1999. P. 688-693.
20. Langseth H., Nielsen T. D. A latent model for collaborative filtering // International Journal of Approximate Reasoning. 2012. Vol. 53, Issue 4. P. 447-466. doi: http://doi.org/10.1016/j.ijar.2011.11.002
21. Shams B., Haratizadeh S. Graph-based collaborative ranking // Expert Systems with Applications. 2017. Vol. 67. P. 5970. doi: http://doi.org/10.1016/j.eswa.2016.09.013
22. Various Methods of Using Content-Based Filtering Algorithm for Recommender Systems / Swathi S. et. al. // International Journal of Innovative Research in Science, Engineering and Technology. 2017. Vol. 6, Issue 2. P. 1606-1613.
23. Asanov D. Algorithms and Methods in Recommender Systems. Berlin: Institute of Technology, 2004. URL: https://www.snet.tu-berlin.de/fileadmin/fg220/courses/SS11/snet-project/recommender-systems_asanov.pdf
24. Lorenzi F., Ricci F. Case-based recommender systems: a unifying view // ITWP'03 Proceedings of the 2003 international conference on Intelligent Techniques for Web Personalization. Acapulco: Springer-Verlag, Berlin: Heidelberg, 2005. P. 89-113. doi: http://doi.org/10.1007/11577935_5
25. Marung U., Theera-Umpon N., Auephanwiriyakul S. Top-N Recommender Systems Using Genetic Algorithm-Based Visual-Clustering Methods // MDPI Reference List and Citations Style Guide. Basel, 2016.
26. Feng D. Utility-based Recommender Systems Using Implicit Utility and Genetic Algorithm // International Conference on Mechatronics, Electronic, Industrial and Control Engineering. 2015. P. 860-864. doi: http://doi.org/10.2991/meic-15.2015.197
27. Brusilovsky P., Kobsa A., Nejdl W. The adaptive web: methods and strategies of web personalization. Heidelberg: Springer-Verlag Berlin, 2007. 762 p.
28. Dent A. An In-Depth Look At Second-Party Data For Digital Marketers. 2015. URL: https://marketingland.com/second-party-data-digital-marketers-128254
29. Sonntag D. ISMAR Tutorial on Intelligent User Interfaces, Proceedings of ISMAR 2015. Related DFKI Technical Report. 2015.
Рекомендовано до публгкацИ д-р екон. наук Степаненко О. П.
Дата надходження рукопису 09.10.2018
Котлярова Юлiя Олександрiвна, асшрант, асистент, кафедра шформацшних систем в економщ, На-вчально-науковий шститут «1нститут шформацшних технологш в економщ» Державного вищого навча-льного закладу «Кшвський нацюнальний економiчний ушверситет iменi Вадима Гетьмана», пл. Львiвсь-ка, 14, м. Кшв, Украша, 04053 E-mail: julkot@ukr.net