Научная статья на тему 'ПОКРАЩЕННЯ АЛГОРИТМУ "ITEM TO ITEM" МЕТОДУ КОЛАБОРАТИВНОї ФіЛЬТРАЦії ДЛЯ РОЗРОБКИ РЕКОМЕНДАЦіЙНИХ СИСТЕМ НА ОСНОВі КОСИНУСНОї МіРИ ШЛЯХОМ ОЦіНКИ РЕЛЕВАНТНОСТі'

ПОКРАЩЕННЯ АЛГОРИТМУ "ITEM TO ITEM" МЕТОДУ КОЛАБОРАТИВНОї ФіЛЬТРАЦії ДЛЯ РОЗРОБКИ РЕКОМЕНДАЦіЙНИХ СИСТЕМ НА ОСНОВі КОСИНУСНОї МіРИ ШЛЯХОМ ОЦіНКИ РЕЛЕВАНТНОСТі Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
283
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРЕЛЯЦіЯ / CORRELATION / КОСИНУС / COSINE / КОЛАБОРАТИВНА / ФіЛЬТРАЦіЯ / ВЕКТОР / ТАНіМОТО / TANIMOTO / USER / ID / URL / COLLABORATIVE / FILTRATION. VECTOR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кучерук В.Ю., Глушко М.В.

Представлено аналіз результатів порівняння рекомендаційних систем на основі коефіцієнту кореляції Танімото у порівняння із алгоритмом «item to item» колаборативної фільтрації шляхом оцінки релевантності. Сформовані дані для досліджень у вигляді користувачів із унікальними ID. Алгоритм колабортивної фільтрації заснований на косинусній мірі, яка являє подібність предметів як косинус між векторами покупок в матриці користувачів та предметів

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кучерук В.Ю., Глушко М.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Improving the item to item algorithm of collaborative filtration method for the development of recommendation systems based on the cosine measure by relevant assessment

The analysis of comparative results of reference systems on the basis of the Tanimoto correlation coefficient in comparison with the "item to item" algorithm of collaborative filtration with the help of relevant assessment is presented. Data for surveys in the form of users with unique IDs are formed. Algorithm of collaborative filtration is based on a cosine measure, which represents the similarity of objects as a cosine between the vectors of purchases in the matrix of users and objects

Текст научной работы на тему «ПОКРАЩЕННЯ АЛГОРИТМУ "ITEM TO ITEM" МЕТОДУ КОЛАБОРАТИВНОї ФіЛЬТРАЦії ДЛЯ РОЗРОБКИ РЕКОМЕНДАЦіЙНИХ СИСТЕМ НА ОСНОВі КОСИНУСНОї МіРИ ШЛЯХОМ ОЦіНКИ РЕЛЕВАНТНОСТі»



ТЕХН1ЧН1 НАУКИ

V

УДК 004.78, 004.048

DOI: 10.15587/2313-8416.2018.120886

ПОКРАЩЕННЯ АЛГОРИТМУ «ITEM TO ITEM» МЕТОДУ КОЛАБОРАТИВНО1 ФЫЬТРАЦП ДЛЯ РОЗРОБКИ РЕКОМЕНДАЦ1ЙНИХ СИСТЕМ НА ОСНОВ1 КОСИНУСНО1 М1РИ ШЛЯХОМ ОЦ1НКИ РЕЛЕВАНТНОСТ1

© В. Ю. Кучерук, М. В. Глушко

Представлено анализ результатгв поргвняння рекомендацшних систем на основi коефщенту кореляцИ Татмото у порiвняння i3 алгоритмом «item to item» колаборативно'1 фшьтрацп шляхом оцтки реле-вантностi. Сформован дат для дослiджень у виглядi користувачiв i3 унтальними ID. Алгоритм кола-бортивно'1 фшьтрацИ заснований на косинуснт мiрi, яка являе подiбнiсть предметiв як косинус мiж векторами покупок в матрицi користувачiв та предметiв

Ключовi слова: кореляцiя, косинус, колаборативна, фiльтрацiя, вектор, Татмото, user, ID, URL

1. Вступ

Рекомендацшна система - шдклас системи фшьтрацп шформацп, яка будуе рейтинговий пере-лш об'еклв (фшьми, музика, книги, новини, веб-сайти), яким користувач може надати перевагу. Для цього використовуеться шформащя з профiлю ко-ристувача. 1снують двi основш стратеги створення рекомендацшних систем: фшьтращя вмюту i колаборативна ф№тращя. При фiльтрацii вмiсту ство-рюються профiлi користувачiв i об'еклв. Профiлi користувачiв можуть мiстити демографiчну шфор-мацiю або вiдповiдi на певний набiр питань [1]. Профш об'ектiв можуть мiстити назви жанрiв, iме-на акторiв, iмена виконавщв, тощо. Або якусь iншу шформацш в залежностi вiд типу об'екта. При ко-лаборативнiй фiльтрацii використовуеться шформа-цiя про поведiнку користувачiв у минулому - на-приклад, iнформацiя про придбання або оцшки. В цьому разi не мае значения, з якими типами об'еклв ведеться робота, але при цьому можна брати до ува-ги неявш характеристики, якi складно було б враху-вати при створенш профiлю. Основна проблема цього типу рекомендацшних систем - «холодний старт»: вшсутшсть даних про користувачiв чи об'ек-ти, якi нещодавно з'явились у системi [2].

Рекомендацшш системи порiвнюють однотип-нi даш вiд рiзних людей i розраховують список реко-мендацiй для конкретного користувача. Деяш прик-лади ]!х комерцiйного та некомерцiйного використан-ня наведенi в статтi про колаборативну фiльтрацiю. Для розрахунку рекомендацiй використовуеться граф iнтересiв. Рекомендацiйнi системи - зручна альтернатива пошуковим алгоритмам, оскшьки дозволяють виявити об'екти, яш не можуть бути знайденi остан-нiми. Цiкаво, що рекомендацiйнi системи часто ви-

користовують пошуковi машини для iндексацii не-звичайних даних [3].

Рекомендацiйна система - це програма, яка на 0CH0Bi даних про користувача (User) i предмет (Item) дае рекомендаций Така система включае в себе весь процес - вiд отримання шформацп до ii подання ко-ристувачевг Важливий кожен етап. Вiд шформацп, яка збираеться залежить, якi алгоритми будуть засто-сованi. Хорошi алгоритми дають хорошi, кориснi рекомендаций Критерii оцiнки результату дозволяють вибрати найб№ш пiдходящi алгоритми [4].

Таким чином можна зробити висновок, що продукт як сайт повинен бути максимально корисним для користувача. Цим обгрунтовуеться актуальшсть проведення даних дослiджень

2. Аналiз лiтературних даних та постановка проблеми

Переважно всi IT-компанii в сферi «ecommerce» використовують колаборативну ф№трацш, перша компанiя яка реалiзувала так алгоритми -Amazon. Найпопулярнiша в Украш - Rozetka. Проте в сучасному свiтi часто доводиться стикатися з проблемою рекомендаци товарiв або послуг користува-чам будь-яко1' iнформацiйноi системи. Не так давно компашя Netflix проводила конкурс з призовим фондом в 1 м№йон доларiв, завданням якого стояло по-лiпшення алгоритму рекомендацп фiльмiв. З цього зрозумiло, що реалiзацiя алгоритмiв коллаборативно1' фiльтрацii складна, проте вона може бути застосова-на до любого бiзнесу [5].

Вже ввдомо, що колаборативна фiльтрацiя -метод, який використовуеться деякими рекоменда-цiйними системами. В цiлому, колаборативна фшьтращя - процес фшьтрацп шформацп або зразшв за

допомогою методiв за участю сшвробггнищва мiж декiлькома агентами, точками зору, джерелами даних i т. д. Застосування колаборативно! фiльтрацii, як правило, пов'язане з дуже великими наборами даних. В нашому випадку колаборативна фттращя - це один з методiв побудови прогнозу в рекомендацшних системах, який використовуе вiдомi переваги (оцшки предметiв, ди, поведiнку) групи користувачiв для прогнозування невiдомих переваг iншого користува-ча. Основне припущення колаборативно! фiльтрацii' полягае в наступному: тi, хто однаково оцiнювали будь-яш предмети в минулому, схильнi давати схожi оцiнки iнших предметiв i в майбутньому [6].

Для прогнозування за допомогою алгоритму «item to item» потрiбно використати предмет, на ввд-мшну алгоритму «user to user», який прогнозуе на основi вподобань користувачiв. Предмет - це змшна, яка позначаеться як «0» - предмет не виконаний, або як «1» - предмет виконаний. Змшна предмету може являти певну дш, зроблену з товаром на сайп: най-популярнiшi застосування предмету це оцшка товару, або його покупка. Тобто, якщо користувач купуе товар, то його значения предмету =1. Ва користува-чi, якi купити товар - об'еднують в когорти (групи людей, схожi мiж собою за певними ознаками, пове-дiнкою, i вже новому користувачу, який буде ввдвь дувати сторiнку певного товару - йому буде запро-понований товар, найбшьш схожий на той, який вш переглядае, на основi вподобань користувачiв.

Щоб зрозумiти яку ефективнють та користь несе для себе колаборативна фшьтращя потрiбно з чимось порiвияти результати. Якщо одразу реалiзу-вати складний алгоритм колаборативно! фшьтрацп, враховуючи, що до цього на сайп не iснувало жодно! рекомендацшно! системи, розробку не можливо буде порiвняти з iснуючим рекомендацiйним блоком. Тому виршено спочатку реалiзувати рекомендацiйну систему на базi простшого алгоритму - коефiцiенту Таиiмото.

Тому в дослвдженш спочатку реалiзуеться ре-комендацiйний блок, який базуеться на коефщенп кореляцп Танiмото, який в реалiзацii е бiльш прость шим, враховуючи що в рамках цього точшсть в гшо-тезi теж менша. Пiсля цього, рекомендацiйна система буде працювати на алгоритмi колаборативно! фтт-рацп «item to item». I тодi можна буде замiряти результат.

3. Мета та задачi досл1дження

Метою проведених дослвджень е тдвищення точностi рекомендацiйноi системи, яка пропонуе ав-томобiлi на сайп Automoto.ua, та корисна для корис-тувача, допомагаючи знайти необхiдне авто, та ско-ротивши загальний час пошуку транспорта.

Для досягнення мети були поставлеш наступнi

задачi:

1. Реалiзувати рекомендацiйну систему на базi коефiцiенту кореляцп Таиiмото.

2. Реалiзувати рекомендацiйну систему алгоритму «item to item» колаборативно! ф№трацп.

4. Матерiали i методи досл1дження

Об'ектом дослiджень був вибраний «алгоритм колаборативно! ф№трацп на 0CH0Bi статистик покупок» на сайп Automoto.ua, яка являе собою пошукову систему, спецiалiзацiею яко! е пошук оголошень про продаж автомобшв, мотоциклiв, спецтехнiки та ш-ших транспортних засобiв в УкраЫ. Automoto.ua дае можливiсть здшснювати пошук пропозицiй про продаж авто по всш Укра!ш, надаючи максимально пов-нi та актуальш результати. Сьогоднi сайт обробляе шформацш з бiльш нiж 100 автосайпв Укра!ни. Що-дня в базi знаходиться бiльше 700 тисяч оголошень, 9-16 тисяч з яких е свiжими надходженнями за пото-чний день. Маючи необхвдний об'ем шформацп, реа-лiзували блок на кшцевих сторiнках оголошень пiд назвою «Более выгодно» опираючись спочатку на коефщент Танiмото, який описуе ступiнь схожосп двох множин:

k = (1)

a + b — c

де к - коефiцiент Ташмото (число вiд 0 до 1), чим вш ближче до 1, тим бшьше схожi множини; a - кшь-кiсть елементiв в першш множинi; b - шльшсть еле-ментiв у другiй множит; c - кiлькiсть спiльних еле-ментiв в двох множинах.

Множина приймалась за сторiнки, якi були вь двiданi користувачами сайту за певний перюд. Далi вивантажено програмним шляхом iнформацiю, де кожному користувачу присвоюемо унiкальний ID та фшсувалось сторiнки, якi користувач переглядае (рис. 1). О^м цього фiксувалась дата та час. Колонка «is visit» ввдповадае за те, з яко! сторшки користувач починае сесш на сайп:

якщо 1 - це сторшка входу на сайт,

якщо 0 - сторшка ввдвадана в процес сеси. Колонка «user id» ввдповщае за користувача iз прис-военим ID.

Колонка «url» - сторiнка сайту, ввдввдана ко-ристувачем [7].

Вивантаживши статистику пльки за тиждень отримано 776542 рядки даних, яких достатньо для дослвджень (рис. 2).

Шсля реалiзацi! блоку «Более выгодно» на сторшках оголошень переходимо до реалiзацi!' колаборативно! фшьтрацп. 1нту!тивно зрозумiло, що для рекомендаци користувачевi № 1 будь-якого продукту, вибирати потрiбно з продуктiв, якi подобаються якимось користувачам 2-3-4-n., Якi найбiльш схожi за сво!ми оцiнками на користувача № 1.

Отримати чисельне вираження цiе! «схожостi» користувачiв можемо за допомогою векторiв в N-вимiрному просторi продуктiв, а порiвнювати вектора можемо наступними вiдомими методами:

- Косинусна мiра;

- Коефiцiент кореляцп Пiрсона;

- Евклiдова вiдстань;

- Коефщент Танiмото;

- Манхеттенський ввдстань i т. д.

updated 2017-082017-082017-082017-086 2017-087 12017-088 2017-089 2017-0810 2017-08 11 2017-0812 2017-0813 2017-0814 2017-0815 2017-0816 2017-0817 2017-0818 2017-0819 2017-0820 2017-0821 2017-0822 2017-0823 20 1 7-0824 20 1 7-0825 2017-0826 20 1 7-0827 20 1 7-0828 20 1 7-0829 2017-0830 2017-08-

A

at

■23 08 •23 14 ■23 U •24 00 ■24 00 •22 10 ■27 14 ■27 14 •27 14 ■27 15 ■24 17 •24 17 ■24 17 •24 17 ■27 08 •27 09 •25 23 ■25 23 ■25 23 •25 23 ■25 23 •23 15 ■27 12 ■22 12 •22 12 ■22 12 22 12 •23 09 ■24 14

в с

is visit user id

:22:12 12:34 31:48 :08:55 :26:40 :28:51 55:55 56:22 :56:23 :07:02 :20:29 20:47 22:21 :22:22 :50:57 :42:58 02:27 03:07 :03:14 :04:29 : 04:37 :39:49 17:55 48:39 :48:43 :49:37 49:41 56:36 :34:08

776531

776532

776533

776534

776535

776536

776537

776538

776539 77654D

776541

776542

2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29 2017-08-29

10:03:47 10:03:50 10:03:54 10:03:55 10:04:11 10:04:12 10:04:19 10:04:31 10:04:31 10:04:34 10:04:42

47149 47149 51437 158493 158493 163895 196878 196878 196878 196878 203140 203140 203140 203140 206567 208413 215574 215574 215574 215574 215574 218764 221810 231291 231291 231291 231291 233141 243822

url

hnps://automoto.ua/interesting/yak oskarzhiti shtratjolitsiyi lazivki_pro_yaki malo hto znae-880.html https://automoto.ua/intcrestmg/yak oskarzhiti shtrafjolitsiyi lazivlajrojiaki malo hto znae-880.html https://automoto.ua/auto-review/Nissan/350Z

https://automoto.ua/Sea-Ray-260-Sundancer-2004-K.iev-14177337.html

https://automoto.ua/Sea-Ray-260-Sundancer-2004-Kiev-14177337.html

https://automoto.ua/car/BMW/X5/not-customed

https://automoto.ua/spectelmika/Minitraktor

https://automoto.ua/Bulat-150-2017-Vinnitsa-16615094.html

https://automoto.ua/spectehnika/Minitraktor

https://automoto.ua/uk/spectehnika/Minitraktor

https://automoto.ua/MTZ-622-Belarus-2016-Mankovka-16456388.html

https://automoto.ua/spectehnika/MrZ/622-Belarus

https://automoto.ua/MIZ-622-Belams-2016-Kiev-16363332.html

https://automoto.ua/car/MTZ/622-Belams/customed

https://automoto.ua/city/Mariupol

https://automoto.ua/car/Tesla/Model-X

https://automoto.ua/car/Renault/Master/used

https://automoto.ua/Renault-Master-2000-Ternopol-16708169.html

https://automoto.ua/car/Renault/Master/used

https://automoto.ua/Renault-Master-2004-Kremenchug-16693190.html

https://automoto.ua/car/Renault/Master/used

https://aiitomoto.Ua/uk/q/Mototsikli-Volinska-424128.html

https://automoto.ua/news/politseyskie-mogut-ostanovit-avtomobil-na-doroge-tolko-v-9-sluchayah-641 l.html https://automoto.ua/uk/moto/IZH/Planeta-4

https://automoto.ua/uk/q/Mototsikli-lZH-l'laneta-4-lemopilska-do-4000-7460366.html https://automoto.ua/uk/IZH-Planeta-4-1984-Terebovlya-16380055.html https://automoto.ua/uk/IZH-Planeta-4-1985-Dunaevtsyi-16217579.html https://automoto.ua/car/Europe/Polsha/Mercedes-Benz https://automoto.ua/car/Europe/Germany

Рис. 1. 1нформащя про Kop^TyBa4iB i3 присвоеним унiкальним ID

L 40735392 https://automoto.Ua/q/Legkovyie-avtomobili-Deu-Lanos-Nikolaevskaya-Uod-vyipuska-ot-2006-do-3 800-6^^9289.html

0 40735394 https://automoto.ua/car/Europe/Polsha/BMW-7-Series-2007-25 89297.html

1 40735397 https://automoto.ua/car/Opel/Omega/used

1 40735401 htlps://aulomuto.ua/iiileresting/yak_oskarzhili_shlraf_politsiyi_lazivki_pro _yaki_malo_hto_znae-880.html I 40735411 https://automoto.ua/interestmg/prava dlya_es chi zobovyazue asotsiatsiya minyati_posvidchennya vodiya-1593.html1

0 40735413 https://aulomolo.ua/car/Europe/Polsha/BMW

1 40735419 https://automoto.ua/city/Galich/ear

1 40735428 http5://aulomoto.ua/LuAZ-967-1978-Ivanofrankovsk-7862763,html I 40735429 https://automoto.ua/interesting/edu takoy_300_kmch_vdrug_otkuda_ne_vozmis-1507.html I 40735432 https://automoto.ua/uk/spectehiiika/John-Deere/Teraopol

1 40735438 hnps://aut0m0t0-ua/interesting/yak_oskarzbiti_shtraljolitsiyi_lazivki_pro_yaki_trialo_h1o_znae-880.html

Рис. 2. Загальна кшьшсть iнформацiï за тиждень

Далеко не завжди у користyвачiв е можливють виставляти оцiнки предметiв. Тобто для колаборати-вной фiльтрацiï можуть бути достyпнi лише двiйковi дан (купував користувач предмет чи m). Проте да-ний алгоритм не враховуе релевантшсть (вщповвд-нiсть до пошукового запиту) сторiнки для користувача [6]. Алгоритм реагуе тшьки на оцiнкy товару або на його покупку [8, 9]. По статистищ в свт - ввдсо-ток конверсiï на сайтах становить всього 2-3 %. Тобто, рекомендацшна система обробляе тшьки 2-3 % даних для видачi шформацп.

Тому у дослщженш розроблений алгоритм, який враховуе релевантшсть сторшки для 100 % ко-ристyвачiв, i на основi цього рекомендуе переглянути iншi автомобiлi на сайтi. Суть алгоритму полягае в тому, що заметь покупки чи оцшки товару, присво-юючи кожному користувачу (User) - вдентифжатор (ID), запускаемо таймер при переглядi URL-сторшки оголошення (карточка товару). Якщо при цьому, користувач перебувае на сторшщ б№ше 15 секунд, то ця сторшки вважаеться релевантною, якщо менше, то ш (t>15 сек.=1, t<15 сек.=0).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Спочатку даний алгоритм розраховував подiб-нiсть предметiв як косинус мiж векторами покупок в матрицi користувачiв та предметiв (2-3 %).

Розглянемо роботу алгоритму на приклащ статистики, де за предмет приймаеться час перегляду URL-сторiнки оголошення в табл. 1.

Таблиця 1

Приклад матриц користyвачiв та п] эедмепв

Користувач Предмет 1 Предмет 2 Предмет 3

Вiктор 1 0 1

Микола 0 1 1

Марiя 0 1 0

В цьому випадку косинус мiж «Предмет 1» i «Предмет 2» розраховуеться так:

(1,0,0)-(0,1,1) _0. II (1,0,0) ||«|| (0,1,1) || ' ()

мiж «Предмет 1» i «Предмет 3»:

(1, о, 0) • (1,1,0) =J_„071.

V 2 ~ ' '

|| (1,0,0) || • || (1,1,0) || i мiж «Предмет 2» i «Предмет 3»:

(0,1,1) • (1,1,0) ,=i = 05

(3)

II (0,1,1) || • || (1,1,0) || 2

(4)

Таким чином, користувач, що знаходиться на сторшщ опису «Предмету 1», отримае «Предмет 3» в якосп рекомендацii; на сторшщ «Предмету 2» -«Предмет 3» i на сторшщ «Предмету 3» - «Предмет 1» а попм «Предмет 2») [10, 11]. В даному алгоршм використовуеться один коефщент на кожну пару предмепв (косинус), на пiдставi якого i створюються рекомендацii. Тобто для п предметiв буде потрiбно розрахувати i зберегти п(п-1)/2 косинусiв [8, 9].

Отже, робота алгоритму буде проходити в деш-лька етапiв, осшльки спочатку потрiбно визначати значення «предмету», яке буде дорiвнювати перегляд-

нутш сторiнцi URL оголошення, на якш користувач перебувае не менше 15 секунд, цим самим оцшюючи релевантнють сторiнки до пошуку користувача [10, 11]. Тшьки пiсля визначення таких ввдбуваються по-дальшi обрахунки iз знаходження косинусно1' мiри, при якш береться до уваги 100 % шформацп про ш-тереси користувачiв, цим самим покращуючи алгоритм Item to Item методу колаборативно1' фшьтрацп для розробки рекомендацiйних систем шляхом оцшки релевантносп [12].

5. Результати дослщжень рекомендацiйного блоку «Более выгодно» коефщенту кореляци Та-нiмото та роботи алгоритму «item to item» колла-боративноТ фшьтрацп

За допомогою незалежного визнаного сервюу web-аналiтики Google Analytics ми порiвняли взае-модiю (клiк) з блоком «Более выгодно» шд час роботи рекомендацш на основi Ташмото (нижнiй гра-фiк) та на основi колаборативно1' фiльтрацii (верхнiй графш) (рис. 3).

Рис. 3. Результати взаемодп з блоком «Более выгодно»

Порiвнявши результати взаемодп по блоку ви-явили, що алгоритм «item to item» колаборативно1' фiльтрацii на 45,33 % ефектившший нiж рекомендацп на основi коефiцiенту кореляци Ташмото. Оскшьки, взаемодiя iз блоком при роботi колаборативно1' фшьтрацп вища на 45,33 %, то це свщчить про ii ви-соку точнiсть та користь для користувачiв.

6. Висновки

1. Реалiзовано рекомендацiйний блок «Более выгодно» на основi коефiцiенту кореляци Ташмо-то. Реалiзацiя цього блоку дала першу рекоменда-

цiйну систему, яка за визначений перюд принесла 175 416 клшв по блоку на сайт! (рис. 3, статистика ни-жнього графiка), що позитивно вплинуло на поведшко-в! характеристики сайту та подальшi конверсii.

2. Реал!зовано рекомендацшний блок «Более выгодно» на основ! алгоритму «item to item» кола-боративно1' фшьтрацп. Реал!защя цього блоку дала першу рекомендацшну систему, яка за визначений перюд принесла 254 937 клЫв по блоку на сайт! (рис. 3, статистика верхнього графша), що позитивно вплинуло на поведшков! характеристики сайту та подальш! конверсп.

Л^ература

1. Рекомендацшна система // Wikipedia.org. Дата оновлення: 31 липня 2016. URL: https://uk.wikipedia.org/wiki/ Рекомендацшна_система

2. Коллаборативная фильтрация // Habrahabr. Дата обновления: 28 августа 2012. URL: https://habrahabr.ru/post/150399/

3. Slope One // Wikipedia. Last edited: 30 April 2015. URL: https://en.wikipedia.org/wiki/Slope_One

4. Su X., Khoshgoftaar T. M. A Survey of Collaborative Filtering Techniques // Advances in Artificial Intelligence. 2009. Vol. 2009. P. 1-19. doi: 10.1155/2009/421425

5. Гомзин А. Г., Коршунов А. В. Системы рекомендаций: обзор современных подходов // Труды ИСП РАН. 2012. C. 402-417. URL: http://cyberleninka.ru/article/n/sistemy-rekomendatsiy-obzorsovremennyh-podhodov

6. Ghazanfar M. A., Prugel-Bennett A. Building Switching Hybrid Recommender System Using Machine Learning Classifiers and Collaborative Filtering // International Journal of Computer Science. 2010. Vol. 37, Issue 3. URL: http://www.iaeng.org/I JCS/issues_v37/issue_3/IJCS_37_3_09.pdf

7. Приклад оголошення. Automoto. 2017. URL: https://automoto.ua/uk/Mercedes-Benz-GLE-Class-2017-Khmelnytskyi-18044982.html

8. Linden G., Smith B., York J. Amazon.com recommendations: item-to-item collaborative filtering // IEEE Internet Computing. 2003. Vol. 7, Issue 1. P. 76-80. doi: 10.1109/mic.2003.1167344

9. Hu Y., Koren Y., Volinsky C. Collaborative filtering for implicit feedback datasets // 2008 Eighth IEEE International Conference on Data Mining. Pisa, 2008. P. 263-272. doi: 10.1109/icdm.2008.22

10. Sarwar B. M., Karypis G., Konstan J. A. Item-based collaborative filtering recommendation algorithms // Proceedings of ACM WWW '01. Hong Kong, 2001. 285-295. doi: 10.1145/371920.372071

11. Karypis G. Evaluation of object-based top-N algorithms // Proceedings of the tenth international conference on Information and knowledge management - CIKM01. Atlanta, 2001. P. 247-254. doi: 10.1145/502624.502627

12. Кучерук В. Ю., Глушко М. В., Митковський О. Покращення a^opnrMyitemtoitem методу колаборативнп фшьтрацп для розробки рекомендацшних систем шляхом оцшки релевантном! // Вимiрювaння, контроль та дiaгностикa в тех-тчних системах (ВКДТС-2017). Вшниця, 2017. C. 215. URL: http://mpa.vntu.edu.ua/images/conference/conf2017/VCDTS% 202017.pdf

Дата надходження рукопису 18.12.2017

Кучерук Володимир Юршович, доктор техтчних наук, професор, зaвiдувaч кафедри, кафедра метрологи та промислово1 автоматики, Вшницький нaцiонaльний технiчний унiверситет, Хмельницьке шосе, 95, м. Вшниця, Украша, 21021 E-mail: vladimir.kucheruk@gmail.com

Глушко Михайло Васильович, кафедра метрологи та промислово1 автоматики, Вшницький нацюналь-ний техшчний ушверситет, Хмельницьке шосе, 95, м. Вшниця, Украша, 21021, E-mail: mikhailhlushko@gmail.com

УДК 778.528.7

Б01: 10.15587/2313-8416.2017.120748

ИССЛЕДОВАНИЕ ИЗОБРАЖЕНИЙ ПРИЗНАКООБРАЗУЮЩИХ ЭЛЕМЕНТОВ ДЕФЕКТА ТИПА "ТРЕЩИНА"

© Е. В. Горда, А. А. Пузько

В работе приведены результаты исследования элементов дефектов типа "трещина" с точки зрения формирования признаков, характеризующих их зоны смежности. Такой подход позволяет учесть не только собственно трещину, но и порожденные дефекты в области ее локализации. Полученные результаты могут быть использованы при построении систем мониторинга, распознавания и идентификации дефектов для оценки состояния объектов строительства, а так же для систем наблюдения процесса образования трещин

Ключевые слова: трещина, признак, изображение, элемент, наблюдаемость, область, корень, овраг, мониторинг, идентификация

1. Введение

Мониторинг и распознавание дефектов типа "трещина (ДТТ) методами неразрушающего контроля, особенно в оптическом диапазоне Web-камер позволяет с одной стороны, - определять наличие дефектов типа "трещина", а с другой,- иметь широкое применение и в задачах измерения параметров ДТТ. Исходя из этого, можно отметить, что определение признакообразующих возможностей элементов ДТТ в целях построения систем мониторинга, является актуальной задачей.

2. Анализ литературных данных

Необходимость своевременного выявления дефектов объектов строительства обусловлена обеспечением безопасности их эксплуатации. Сложность

задачи мониторинга поверхностей сооружений часто связана с доступностью важных конструкций и узлов сооружений, что делает методы оптического контроля на основе обработки цифровых изображений все более популярными [1].

Отдельные аспекты задачи выявления ДТТ рассматриваются в работах, связанных с исследованиями механики трещинообразования [2] и распространения их в сплошных средах [3]. Задача обработки цифровых изображений является частью теории распознавания образов основные методы и модели, которой изложены в ряде монографий. В работе [4] рассматривается применение вероятностных методов и оценка рисков в задачах идентификации объектов. Монография [5] посвящена фундаментальным основам теории распознавания, включая различные мето-

i Надоели баннеры? Вы всегда можете отключить рекламу.