Научная статья на тему 'ЗАСТОСУВАННЯ КЛАСТЕРНОГО АНАЛІЗУ ДЛЯ ПРОСУВАННЯ БІЗНЕСУ У СОЦІАЛЬНИХ МЕРЕЖАХ'

ЗАСТОСУВАННЯ КЛАСТЕРНОГО АНАЛІЗУ ДЛЯ ПРОСУВАННЯ БІЗНЕСУ У СОЦІАЛЬНИХ МЕРЕЖАХ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
15
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
соціальні мережі / система просування / потреби споживачів послуг / кластерний аналіз / алгоритм найближчого сусіда / алгоритм k-means / social networks / promotion system / needs of service consumers / cluster analysis / nearest neighbor algorithm / k-means algorithm

Аннотация научной статьи по экономике и бизнесу, автор научной работы — С М. Шевченко, Ю Д. Жданова, Т І. Шевцова

Використання соціальних мереж для досягнення бізнес-цілей, зокрема просування своїх послуг (товарів), є затребуваним у сучасному світі. У 2022 році понад 4,59 мільярдів людей (Statista) користувалися соціальними мережами. Враховуючи таку колосальну аудиторію активних користувачів, маркетологи вбачають важливим та значущим використання соціальних мереж для бізнес-діяльності своєї компанії. Це спонукало до дослідження методів та інструментарію просування продукції в Іnternet. Огляд наукової та методичної літератури дозволив виділити існуючі методи просування бізнесу: Owned Media; Paid Media; Earned Media; Social Media, основним недоліком яких є негативні коментарі користувачів, що шкодить репутації компанії. У даній статті розглядається можливість застосування методів кластерного аналізу для просування бізнесу у соціальних мережах. Визначено поняття кластерний аналіз, описано найпопулярніші методи кластерного аналізу, представлено типовий механізм його проведення. За основу у дослідженні запропоновані блок-схеми проведення кластеризації методом ближнього сусіда та методом k-means. Виявлені у кожному з них переваги та недоліки. В якості прикладу проведено розподіл споживачів послуг ТОВ «ЕПАМ СИСТЕМЗ», що надається за одну добу, в залежності від попиту на послуги компанії з урахуванням вікового критерію. Результати показали, які послуги і для якого віку є більш привабливими, що допоможе ефективніше проводити заходи стимулювання обсягів продажів ІТ-послуг у соціальних мережах, що призведе до зростання обсягів прибутку організації у майбутньому. Результати дослідження можна впровадити в навчальний процес студентів економічного профілю та студентів галузі 12 Інформаційні технології.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE RESEARCH OF CLUSTER ANALYSIS WAYS OF APPLICATION FOR BUSINESS PROMOTION IN SOCIAL NETWORKS

The use of social networks to achieve business goals, in particular to promote one’s services (goods), is in demand in today’s world. In 2022, more than 4.59 billion people (Statista) used social networks. Given such a colossal audience of active users, marketers consider it important and meaningful to use social networks for their company’s business activities. Studying methods and tools to promote products on the Internet is a result of this. The review of scientific and methodical literature has highlighted existing methods of business promotion: Owned Media; Paid Media; Earned Media; Social Media, the main drawback of which are negative comments from users, which harms the company’s reputation. This article considers the possibility of applying methods of cluster analysis to promote business in social networks. The concept of cluster analysis has been defined, the most popular methods of cluster analysis have been described, a typical mechanism for its implementation has been presented. The study is based on block-schemes of clustering by near neighbor method and k-means method. Advantages and disadvantages have been identified in each of them. As an example, the distribution of consumers of services of «EPAM SYSTEMZ» LLC, which is provided for a day, depending on the demand for services of the company, taking into account the age criterion. The results showed which services and for what age are more attractive, which will help to more effectively carry out measures to stimulate sales of IT services in social networks, which will lead to an increase in the volume of profit of the organization in the future. The results of the study can be introduced into the educational process of students of economic profile and students of branch of knowledge 12 Information Technologies.

Текст научной работы на тему «ЗАСТОСУВАННЯ КЛАСТЕРНОГО АНАЛІЗУ ДЛЯ ПРОСУВАННЯ БІЗНЕСУ У СОЦІАЛЬНИХ МЕРЕЖАХ»

УДК 004.04 DOI https://doi.Org/10.35546/kntu2078-4481.2023.4.32

С. М. ШЕВЧЕНКО

кандидат педагопчних наук, доцент, доцент кафедри шформацшно! та юбернетично! безпеки iMeHi професора Володимира Бурячка Кшвський ушверситет iменi Бориса Гршченка ORCID: 0000-0002-9736-8623

Ю. Д. ЖДАНОВА

кандидат фiзико-математичних наук, доцент, доцент кафедри шформацшно! та юбернетично! безпеки iменi професора Володимира Бурячка Ки!вський унiверситет iменi Бориса Грiнченка ORCID: 0000-0002-9277-4972

Т. I. ШЕВЦОВА

мапстрант кафедри iнженерi! програмного забезпечення Державний унiверситет шформацшно-комушкацшних технологiй

ORCID: 0009-0007-2802-8127

ЗАСТОСУВАННЯ КЛАСТЕРНОГО АНАЛ1ЗУ ДЛЯ ПРОСУВАННЯ Б1ЗНЕСУ

У СОЦ1АЛЬНИХ МЕРЕЖАХ

Використання со^альних мереж для досягнення бгзнес-цшей, зокрема просування свогх послуг (moeapie), е затребуваним у сучасному свiтi. У 2022 роцi понад 4,59 мiльярдiв людей (Statista) користувалися сощальними мережами. Враховуючи таку колосальну аудиторт активних користувачiв, маркетологи вбачають важливим та значущим використання со^альних мереж для бiзнес-дiяльностi свое'1 компанИ. Це спонукало до до^дження методiв та iнструментарiю просування продукцИ в Internet.

Огляд науковог та методичное лiтератури дозволив видшити iснуючi методи просування бизнесу: Owned Media; Paid Media; Earned Media; Social Media, основним недолiком яких е негативнi коментарi користувачiв, що шкодить репутацИ компанИ. У дант статтi розглядаеться можливiсть застосування методiв кластерного аналiзу для просування бизнесу у сощальних мережах. Визначено поняття кластерний аналiз, описано найпопу-лярнiшi методи кластерного аналiзу, представлено типовий механизм його проведення. За основу у до^джент запропоноват блок-схеми проведення кластеризацИ методом ближнього сусiда та методом k-means. Виявленi у кожному з них переваги та недолжи.

В якостi прикладу проведено розподш споживачiв послуг ТОВ «ЕПАМ СИСТЕМЗ», що надаеться за одну добу, в залежностi вiд попиту на послуги компанИ з урахуванням вжового критерiю. Результати показали, як послуги i для якого вк е бшьш привабливими, що допоможе ефективнШе проводити заходи стимулювання обся-гiв продажiв IT-послуг у сощальних мережах, що призведе до зростання обсягiв прибутку органезацИу майбут-ньому. Результати до^дження можна впровадити в навчальний процес студентiв економiчного профшю та студентiв галузi 12 Ыформацшм технологи.

Ключовi слова: сощальш мережi, система просування, потреби споживачiв послуг, кластерний аналiз, алгоритм найближчого суада, алгоритм k-means.

S. M. SHEVCHENKO

PhD, Associate Professor, Associate Professor at the Department of Information and Cyber Security named after Professor Volodymyr Buriachok Borys Grinchenko Kyiv University ORCID: 0000-0002-9736-8623

YU. D. ZHDANOVA

PhD, Associate Professor, Associate Professor at the Department of Information and Cyber Security named after Professor Volodymyr Buriachok Borys Grinchenko Kyiv University ORCID: 0000-0002-9277-4972

T. I. SHEVTSOVA

Master's Student at the Department of Software Engineering National University of Information and Communication Technologies

ORCID: 0009-0007-2802-8127

THE RESEARCH OF CLUSTER ANALYSIS WAYS OF APPLICATION FOR BUSINESS PROMOTION IN SOCIAL NETWORKS

The use of social networks to achieve business goals, in particular to promote one's services (goods), is in demand in today's world. In 2022, more than 4.59 billion people (Statista) used social networks. Given such a colossal audience of active users, marketers consider it important and meaningful to use social networks for their company's business activities. Studying methods and tools to promote products on the Internet is a result of this.

The review of scientific and methodical literature has highlighted existing methods of business promotion: Owned Media; Paid Media; Earned Media; Social Media, the main drawback of which are negative comments from users, which harms the company's reputation. This article considers the possibility of applying methods of cluster analysis to promote business in social networks. The concept of cluster analysis has been defined, the most popular methods of cluster analysis have been described, a typical mechanism for its implementation has been presented. The study is based on block-schemes of clustering by near neighbor method and k-means method. Advantages and disadvantages have been identified in each of them.

As an example, the distribution of consumers of services of «EPAM SYSTEMZ» LLC, which is provided for a day, depending on the demand for services of the company, taking into account the age criterion. The results showed which services andfor what age are more attractive, which will help to more effectively carry out measures to stimulate sales of IT services in social networks, which will lead to an increase in the volume ofprofit of the organization in the future. The results of the study can be introduced into the educational process of students of economic profile and students of branch of knowledge 12 Information Technologies.

Key words: Keywords: social networks, promotion system, needs of service consumers, cluster analysis, nearest neighbor algorithm, k-means algorithm.

Постановка проблеми

Сучасний час харакгеризуеться рiзноманiтними шноващями та сучасними технологиями, зокрема сощаль-ними мережами, яш можна вважати невщ'емною частиною повсякденного життя. Майже в уах частинах свиу незлiченна шльшсть людей щодня користуються сощальними мережами. Сьогодш практично кожна людина мае можливють спшкуватися з шшими людьми за рахунок використання сощальних мереж.

Сощальш мереж1 застосовуються в якосп засобу сшлкування та обеднання людей у всьому свт, що дозволяе людям дiзнаватися про новi звича!' та культури, а також сприяе масовому поширенню шформацп серед людей (обмш вщео та фотографiями, пропозищями роботи, вщгуками тощо). Останшм часом вони знайшли широке застосування в господарськш дiяльностi субеклв господарювання. Вплив сощальних мереж проникае в ус аспекти людського життя, як особистого, так i професшного. Субекти господарювання намагаються використо-вувати потужшсть сощальних мереж переважно для просування свое! продукци, створення бренду або залучення нових ктенпв. Сощальш мереж! допомагають у створенш лояльносл юнуючих ктентпв до тако! мiри, що вони це зроблять добров!льно та безкоштовно поширюватимуть дан! про д!яльшсть певних компанш.

Переваги побудови сощальних мереж як шструменту побудови зв'язшв з громадськ1стю для компани полягають у тому, що сощальш мереж! можуть забезпечити поширення рекламного контенту серед потенцшних ктенпв. Кр!м того, сощальш мереж! можуть допомогти налаштувати зворотнш зв'язок систем, створювати чати в сощальних мережах i можуть дозволити обмшюватися враженнями в!д спожитих товар!в або послуг. Компани можуть створювати бренд компани або бренд продукту за рахунок створення профшв у мережах Facebook i Linkedin або обль кового запису у Twitter. Станом на ачень 2023 року Facebook був найбшьш часто використовуваною платформою сощальних мереж серед маркетологов у всьому свт. Зпдно з глобальним опитуванням, 89 вщсотшв маркетологiв сощальних мереж використовували мережу для просування свого б!знесу, тод! як ще 80 ввдсотшв робили це через Instagram [1]. Оск1льки розвиток шформацшних технологий сприяе розвитку в!ртуально! комушкаци, то компани, що виробляють товари або надають послуги, мають розмовляти з! сво!ми потенцiйними споживачами !х мовою.

Аналiз останшх досл1джень i публiкацiй

Обрана проблематика розглядалася у працях таких науковщв, як П. Т!васшг, Р. П. Кайперс, Г. Ертуг, Дж. Кантвелл, А. Зах!р, М. Юлдафф та у працях шших дослвднишв. Сл!д шдкреслити, що бурхливий розвиток шформацшних технологш змушуе компани адаптуватися до поточних тенденцш у сво!й б!знес-д!яльносл, особливо тих, що стосуються IT. Тим б!льше це стосуеться субеклв господарювання, як! здшснюють свою госпо-дарську д!яльшсть в онлайн-середовищ! Одним !з найбшьш використовуваних i яскраво виражених сучасних тренд!в е сощальш мереж! Саме тому дослщники вивчали, як корисно можна застосовувати сощальш мереж! та як це впливае на результатившсть заход!в системи просування товар!в чи послуг.

Одшею з таких мереж е, наприклад, сощальна платформа Facebook. М. С. Луо розглядала Facebook не лише як сторшку для розмiщення повiдомлень, а й як платформу, мюце, де можна поширити рiзноманiтнi програми сти-мулювання продаж1в товарiв та послуг. Сощальна мережа LinkedIn спочатку була призначена для пошуку людей, яких потрiбно залучити до роботи в компанп через знайомих, друзiв, а шзшше стала застосовуватися як рекламна платформа [2]. Г. Ертуг шдкреслював, що сучасш соцiальнi мереж1 дозволяють створити професшну iдентичнiсть в Iнтернетi та знайти i отримати пропозицп про роботу, бiзнес-спiвпрацю, пропозицп брати участь у виграшах, лотереях, акцiях. LinkedIn надавав численш переваги, якi можна використовувати для професiйного розвитку та початку бажано! карери. Це дозволяло створити професшну анкету, завантажити CV та шформацш про освiту та досвщ роботи i залучити потенцшних роботодавцiв та отримати бажану роботу. З шшого боку, це дозволяло формувати бази даних потенцiйних покупщв певного товару або певно! послуги [3].

Сощальна мережа Twitter була створена в 2006 (з липня 2023 йде оновлення до X) рощ i на сьогодш працюе на основi так званих мжроблопв. Мiкроблоги - коротка повiдомлення, довжина яких не перевищуе ста сорока сим-волiв. Ця мережа, в першу чергу, була призначена для подорожуючих людей, щоб вони могли подiлитися сво!м досвiдом за рахунок використання мобiльних телефонiв чи шших пристро!в. Р. Равiна-Рiполь визначала, що популярною сощальною мережею була Instagram, безкоштовна програма для обмшу фотографiями та вiдео, доступною для пристро!в iPhone та Android. Люди можуть використовувати Instagram, щоб поширювати фотографп та вiдео зi сво!ми пiдписниками або обраними групами друзiв, рекламувати товари, послуги. Використовуються, також, так званi хештеги, як1 дозволяють легше шукати контент з пею ж тематикою, зберегти сторiнки з рекламною iнформацiею, як1 привернули увагу [4]. Р. Тiвасiнг пвдкреслював, що застосування соцiальних мереж як методу реалiзацil прямих продаж1в, дозволяе забезпечити проведення ефективного стлкування з людьми, що е сучас-ною базою електронного маркетингу, застосування яких призводить до зростання обсягiв прибутку компани [5]. У дослiдженнi [6] доведено, що сощальш мереж1 впливають на ефектившсть онлайн-бiзнесу у рiзних секторах принаймш на 30%, хоча Twitter та YouTube румунськими компанiями використовуються нечасто.

Таким чином, переваги сощальних мереж у просуванш бiзнесу е очевидними. Це спонукало менеджерiв компанш ефективно 1'х використати для формування та розвитку свого бренду, посилення вiдвiдування 1'х офiцiйного сайту, що дозволить збшьшити кiлькiсть активних покупщв, як наслщок, збiльшиться прибуток. У дослщженш [7] здiйснено огляд основних шструменлв i технологiй Internet-маркетингу, розкрито сутшсть кожно! категорп, наведено рекомендацп щодо застосування iнструментiв компанiями рiзного масштабу, а також зазначено найпопулярн^ Intemet-iнструменти для просування продукцп: Owned Media; Paid Media; Earned Media; Social Media. Один iз способiв просування бiзнесу у соцiальних мережах носить назву Social Media Marketing (SMM). Задач^ як1 можна виршити за допомогою SMM: залучення вiдвiдувачiв на сайт компанп'; пiдвищення вшзнаваносп вашого бренду; пiдтримка репутацп; шдвищення лояльностi до компанп'; збшь-шення обсягу продаж; органiзацiя майданчика для комушкацп з клiентами, зворотного зв'язку; запуск i супро-вiд нового проекту [8-11]. Проте одним iз недолЫв SMM-просування е негативнi коментар^ що може привести до негативних наслщшв для компанп'.

Останнiм часом у наукових джерелах обгрунтовуеться необхщшсть застосування методiв кластерного ана-лiзу для визначення оцiнки ефективностi управлшня бiзнесом [12, 13]. Так, кластерний аналiз застосовують для сегментацп ктенлв на основi схожих характеристик [12]; для ефективного використання ресурсного потенщалу [13]; для розробки продуктiв та послупв на основi потреб ктенлв [12]; для визначення ризик1в у бiзнес-дiяль-ностi та iнше. Вище викладене подтвердило важливiсть та актуальшсть даного досл1дження.

Формулювання мети дослщження

Метою досл1дження е обгрунтування можливостей застосування методiв кластерного аналiзу для просування бiзнесу у соцiальних мережах.

Виклад основного матер1алу дослiдження

Уперше термiн «кластерний аналiз» було введено у 1939 рощ (Tryon Robert). Проте розквиу цей метод не мав, бо вимагав громiздкi обрахунки в процесi виконання. Лише на початку нашого столiття iнтенсивний розвиток потужних комп'ютерiв вiдкрив можливостi для обробки великих даних з метою 1х групування по схожим характеристикам. Кластерний аналiз - метод аналiзу даних, який досл1джуе природш групи в наборi даних, ввдомих як кластери. Цей метод дае можливють вiдносити об'екти до одше1 групи не за одним показником, а за дешлькома водночас. Також допомагае в1днайти структуру даних, що неможливо зробити з боку експерта чи зовшшньому аналiзi [14, 15]. Кластерному анал1зу не потрiбно групувати точки даних у будь-якi попередньо визначеш групи, що означае, що це - метод навчання без контролю. Виокремлюють жорстку та м'яку кластеризацiю. Жорстка кластеризацiя передбачае, що кожна точка вх1дних даних частково або повнютю належить до кластеру або ш. М'яка кластеризац1я визначае, що заметь того, щоб помщати кожну вх1дну точку даних в окремий кластер, при-значаеться ймовiрнiсть перебування цiеl точки даних у цих кластерах.

Вщомо понад ста алгоршшв кластеризацй'. Розглянемо деякi з них докладнше. Iерархiчнi методи даться на два види: агломеративнi та дивизимш. Першi базуються на тому, що уа об'екти розташовують в окремi класи,

а попм, враховуючи метрику подiбностi, щ об'екти склеюють i тим самим зменшують кшьшсть кластерiв поки не отримуеться один. Друп методи - навпаки: yci об'екти - один кластер. 1з збiльшенням вiдстанi 1х рoзпoдiляють по окремим.

Центровдш мoделi - iтерацiйнi алгоритми кластеризаци, у яких поняття пoдiбнoстi виводиться на oснoвi близькoстi точки даних до центро1да або центру кластерiв. Найчастiше використовуються такi з них, як метод k-means та Fuzzy c-means. У цих моделях слщ задати кiлькiсть кластерiв заздалепдь. Ц мoделi виконуються гте-ративно, щоб знайти локальний оптимум даних.

Мoделi щiльнoстi шукають у прoстoрi даних обласп з рiзнoю щiльнiстю точок даних у прoстoрi даних. Вони видiляють рiзнi щiльнi регioни та призначають точки даних у цих репонах одному кластеру. Популярними прикладами моделей щщъносп е DBSCAN i OPTICS. Цi мoделi е особливо корисними для щентифтаци кластерiв дов№но! форми та виявлення викидiв, оск1льки вони можуть виявляти та ввдокремлювати точки, розташоваш в розрщжених областях простору даних, а також точки, як1 належать до щшьних областей.

Класифiкацiю алгoритмiв кластеризаци ввдображено на рис. 1.

Рис. 1. Найбшьш популярнi алгоритми кластеризаци

Кластеризащя дозволяе поеднати в собi таю методи, як методи розбиття, ieрархiчноl кластеризаци, нечiткоl кластеризаци, реалiзацiя кластеризаци на основi щiльностi та на основi моделi. У кластеризаци на основi щшь-ностi данi групуються за областями високо! концентраци точок даних, оточених областями низько! концентраци точок даних. В основному алгоритм знаходить мюця, у яких багато точок даних, i викликае щ кластери. Кластери можуть мати будь-яку форму, вони не е обмеженими оч^ваними умовами. Алгоритми кластеризаци цього типу не намагаються призначити кластерам викиди, тому вони iгноруються.

Методи кластеризаци на основi розподiлу ва точки даних вважаються частинами кластера на основi ймовiр-ностi того, що вони належать до певного кластера. 1снуе центр-точка, i зi збiльшенням вiдстанi точки даних вщ центру ймовiрнiсть того, що вона буде частиною цього кластера, зменшуеться. Кластеризащя на основi центровда е чутливою до початкових параметрiв, але е швидким i ефективним методом аналiзу даних. Цi типи алгоритме роздiляють точки даних на основi к1лькох центрощв у даних. Кожна точка даних призначаеться кластеру на основi квадрата И вiдстанi ввд центро1да. Це - найбiльш часто використовуваний тип кластеризаци. Кластеризацiя на основi ieрархil зазвичай використовуеться для ieрархiчних даних, як1 отримуються з бази даних компани або таксономи. Це дозволяе створити дерево кластерiв, щоб все було органiзовано за принципом побудови ieрархil зверху-вниз.

Анал1з лггератури з досл1джувано1 теми [12, 13, 16-19] дозволив видшити типовий алгоритм виконання кластерного аналiзу у рiзних галузях для рiзних об'екпв, зокрема у бiзнесi.

Використаемо результати дослвдження [16]. Нехай множина А = [а1,а2,...ап} - множина об'eктiв, В - мно-жина номерiв кластерiв. Вибираеться метрика (найчаспше формула вiдстанi) d¡j [х1к, х]к). Необхiдно розбити

множину A на тдмножини (кластеры), яш не перетинаються, i кожен кластер MicTHB об'екти близьк1 за метрикою

dj {xit'xjk) ,а об'екти рiзних класiв iстотно вiдрiзнялися. Кожному об'екту at приписуеться номер кластера Bi.

Множина A може складатися i3 об'ектiв, як1 мають рiзнi одиницi вимiрювання або рiзний дiапазон представле-них значень, тому потрiбно здiйснити нормування вхвдних даних. При кластерному аналiзi е два основш способи нормалiзацii даних: MinMax-нормалiзацiя та Z-нормалiзацiя.

MinMax-нормалiзацiя здiйснюеться наступним чином:

x - min\X 1

x'= —г Fi m (1)

max\X i - mm\X i

У разi всi значення будуть у дiапазонi вiд 0 до 1; дискретш бiнарнi значення визначаються як 0 та 1.

Z-нормалiзацiя:

х - M\X 1

-мл (2)

де M[X] - математичне сподiвання, a[X] - середне квадратичне вiдхилення.

Введемо метрику для ощнки дослiджуваних об'ектiв i вiдстаней мiж ними. Як правило, ввдстань м1ж двома об'ектами представлена неввд'емною функцiею близькостi, яка вводиться для будь-яких об'ектiв кластерного аналiзу. Якщо розглядати реальнi умови контролю, то ефектившше порiвнювати об'екти за штегральними характеристиками. На жаль, цей споаб далеко не завжди застосовний через неможливiсть узгодження вах одиниць вимiру з урахуванням рiзницi метричних полiв.

У кластерному аналiзi можуть використовуватися мiри подiбностi: коефщенти кореляци, мiри вiдстанi, кое-фщенти асоцiативностi, ймовiрнiснi коефiцiенти подiбностi. За мiру подiбностi у нашому дослвдженш будемо використовувати евклiдову ввдстань:

dab = ^(Xa " Xb )2 + (Уа~ Уь )

(3)

Надалi вибираеться i впроваджуеться у процес вщповщний алгоритм кластерного аналiзу та у результат! здш-снити перевiрку достовiрностi результатiв.

Метою нашо! експериментально! роботи е визначення окремих груп на основi вибору продуктiв, запропонова-них компашею ТОВ «ЕПАМ СИСТЕМЗ». Використаемо метод найближчого сусвда та метод к-теаш.

Перевага алгоритму найближчого сусвда, що вiдноситься до iерархiчного алгоритму кластеризаци полягае у тому, що е наочний результат, простота реатзаци, використовуеться до широкого кола сфер, являеться пошуком найкращого рiшень iз можливих.

Недолiки найближчого сусвда: збертае всю вибiрку об'ектiв, що провокуе до витрат пам'ятi, якщо серед об'екпв iснуе викид (тобто, об'ект розташований всерединi чужого класу), то ва об'екти, якi будуть знаходитись найближче до всiх iнших, будуть класиф^ватись неправильно.

Алгоритм виконання даного методу представлено на рисунку 2.

Переваги алгоритму к-теаш, що вщноситься до неiерархiчних алгоритмiв кластеризаци, - це зрозумшсть та швидкiсть виконання, можливють перевiрки статистично! значимостi вщмшностей мiж видiленими кластерами. Недолiки: потрiбно наперед задати к1льк1сть кластерiв для розбиття, результат роботи залежить вщ того, яким чином були визначеш початковi центри кластерiв.

Процес виконання алгоритму к-теаш представлено на рисунку 3 [17].

Задамо k кластерiв.

1. Обчислiть вiдстань вiд кожно! точки даних di (1<^<=п) до вах центрощв с (1<=]<=к) як d(di, с).

2. Для кожно! точки даних di знайдггь найближчий центро!д с i призначте di кластеру ].

3. Встановити ClusterId[i]=j; // j:Id найближчого кластера.

4. Встановити Nearest_Dist[i]= d(d^, с).

5. Для кожного кластера] (1<=]<=к) перерахуйте центро!ди.

6. Повторiть.

7. Для кожно! точки даних

7.1. Обчислиъ його ввдстань ввд центро!да поточного найближчого кластера.

7.2. Якщо ця вiдстань менша або дорiвнюе поточнiй найближчiй вiдстанi, точка даних залишаеться в кластерi.

Рис. 2. Блок-схема алгоритма кластеризацп методом найближчого сусща

1накше

7.2.1. Для кожного центровда cj (1<=j<=k) обчислпъ ввдстань d(dt, cj).

7.2.2. Призначте точку даних dt кластеру з найближчий центровд cj.

7.2.3. Встановити ClusterId[i]=j.

7.2.4. Встановити Nearest_Dist[i]= d(dt, cj).

8. Для кожного кластераj (1<=j<=k) перерахуйте центро1ди, цей процес повторюеться до тих nip, поки цен-тровди не вiдокpемляться суттево.

ТОВ «ЕПАМ СИСТЕМЗ» входить до найбшьших IТ-компанiй свiту, будучи найбiльшим виробником замов-ного програмного забезпечення та бiзнес-додаткiв. До основних видiв дiяльностi ТОВ «ЕПАМ СИСТЕМЗ» належать:

1 - курси з програмування,

2 - навчання куpсантiв (магiстеpський освггаш piвень),

3 - створення програмного продукту,

4 - консультування з питань шформатизацп, надання програмного забезпечення,

5 - дiяльнiсть у сфеpi iнфоpмацiйних технологiй i комп'ютерних систем,

6 - оброблення та розмщення даних.

Проведемо кластерний аналiз шести послуг, що надае ТОВ «ЕПАМ СИСТЕМЗ» сво!м клiентам за одну добу, враховуючи подш споживачiв на двi вiковi групи: вiд 18 до 40 рошв та вщ 41 до 60 рок1в. Застосуемо параметр x для позначення попиту на послуги клiентiв ТОВ «ЕПАМ СИСТЕМЗ» вцсово! групи вiд 18 до 40 рошв, а параметр y - для позначення попиту на послуги ктенпв ТОВ «ЕПАМ СИСТЕМЗ» вшово! групи ввд 41 до 60 рошв. Вихвдш даш для кластерного аналiзу подано у таблиц 1.

Рис. 3. Блок-схема алгоритма кластеризаци методом к-теаш

Bii\i.ini даш для кластерного аналiзу

Таблиця 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X У

1 2 9

2 5 11

3 6 7

4 12 6

5 13 6

6 14 5

У вщповвдносп до формули (3), застосовуючи вихiднi данi для кластерного аналiзу, вдаеться розрахувати еле-менти ново! матрицi. Результати розрахуншв показано у таблицях 2-6.

Taблиця 2

Перший eTan K^acTeproa^ï

1 2 3 4 5 6

1 0,00 3,61 4,47 10,44 11,40 12,65

2 3,61 0,00 4,12 8,60 9,43 10,82

З 4,47 4,12 0,00 6,08 7,07 8,25

4 10,44 8,60 6,08 0,00 1,00 2,24

5 11,40 9,43 7,07 1,00 0,00 1,41

6 12,65 10,82 8,25 2,24 1,41 0,00

Taблиця 3

Другий етлп клacтepизaщï

1 2 3 4,5 6

1 0,00 3,61 4,47 10,44 12,65

2 3,61 0,00 4,12 8,60 10,82

З 4,47 4,12 0,00 6,08 8,25

4,5 10,44 8,60 6,08 0,00 2,24

6 12,65 10,82 8,25 2,24 0,00

Taблиця 4

Третш eтaп клacтepизaщï

1 2 3 4,5,6

1 0,00 3,61 4,47 10,44

2 3,61 0,00 4,12 8,60

З 4,47 4,12 0,00 6,08

4,5,6 10,44 8,60 6,08 0,00

Taблиця 5

Четвертий eтaп клacтepизaщï

1,2 З 4,5,6

1,2 0,00 4,12 8,60

З 4,12 0,00 6,08

4,5,6 8,60 6,08 0,00

Taблиця 6

Peзультaт клacтepизaщï

1,2,3 4,5,6

1,2,3 0,00 6,08

4,5,6 6,08 0,00

З таблиць 2-6 можна зpобиги висновок, що для зaстосyвaння для вибipки aлгоpигмy найближчого суада зна-добилися б чотиpи етапи. На пеpшомy етaпi (таблиця 2) сеpед елементiв мaтpицi обиpaються двi гpyпи елементiв, якi за значенням e найближчими м1ж собою, що означае основу гpyпyвaння нaбоpiв подiбниx дaниx. Саме тому обpaно обекти гpyп 4 та 5. Елементи групування видiлено синiм кольоpом, а елементи, що видшеш бiлим кольо-pом, пеpеносяться y наступну мaтpицю без змiн. Що ж стосуеться обеклв, видiлениx синiм кольоpом, то з двоx гpyп дaниx y наступну мaтpицю пеpеноситься найменше з pозглянyтиx значень. На дpyгомy еташ (таблиця 3) за вищезазначеним aлгоpитмом здiйснюeться поеднання обекпв гpyп 4, 5 та 6. На тpетьомy еташ (таблиця 4) pеaлiзyeться поеднання обеклв гpyп 1 та 2 чеpез те, що в обpaниx гpyпax знaxодяться елементи з найменшими значеннями. На четвеpтомy етaпi (таблиця 5) здшснюеться поеднання обекпв ^уп 1, 2 та 3. За pезyльтaтaми клaстеpизaцiï (таблиця 6) виокpемлено обекти двоx клaстеpiв гpyп 1, 2, 3 та 4, 5, 6 вщстань мiж якими складае 6,08 yмовниx одиниць. Taким чином, споживaчi вiком вiд 18 до 40 pокiв вiддaють пеpевaгy отpимaнню послуг пiд номеpaми 1, 2, 3, а споживaчi вiком вщ 41 до 60 pокiв - послуг тд номеpaми 4, 5, 6. Biзyaльно це добpе видно на дендpогpaмi (pис. 4).

Рис. 4. Дендрограма кластеризаци даних кочнами ТОВ «ЕПАМ СИСТЕМЗ»

Саме тому ТОВ «ЕПАМ СИСТЕМЗ», розумшчи що краще запропонувати сво1'м клieнтам певно! вшово! групи, допоможе ефективнiше проводити заходи стимулювання актуалiзащl продаж1в 1Т-послуг у сощальних мережах, що призведе до зростання обсягiв прибутку пiдприeмства у майбутньому.

Результат кластеризацй' даних компанп ТОВ «ЕПАМ СИСТЕМЗ» за методом £-means показано на рис. 5. Маемо два згустки (кластери) iз сво1'м центро!дом вiдповiдно. Невеликий обсяг статистичних даних пов'язаний з процесом розумшня застосування цих методiв для створення програмного забезпечення.

Наразi створюеться програмне забезпечення для розв'язання вiдповiдних завдань.

Висновки

В умовах розвитку шноващйних технологiй комунiкацiя в соцiальних мережах ефективно застосовуеться для здiйснення просування послуг пiдприемства в Iнтернетi. Саме математичш методи, зокрема кластерний аналiз, можуть забезпечити об'ективнi результати у процеа бiзнес-дiяльностi компанп. Розробка програмного забезпечення надасть можливiсть здшснювати обчислення дуже швидко, що дозволить керiвництву компанп та менеджерам приймати бшьш обгрунтованi рiшення.

Рис. 5. Результат кластеризацй" даних компашУ ТОВ «ЕПАМ СИСТЕМЗ» за методом k-means

Список використаноТ лггератури

1. Leading social media platforms used by marketers worldwide as of January 2023. Statista. (2023) URL: https:// www.statista.com/statistics/259379/social-media-platforms-used-by-marketers-worldwide/

2. Luo C. Analyzing the impact of social networks and social behavior on electronic business during COVID-19 pandemic. Information Processing and Management. №. 58. 2021. Р. 37.

3. Cuypers R. P., Ertug G., Cantwell J., Zaheer A., Kilduff M. Making connections: social networks in international business. Journal of International Business Studies. №. 51 (5). 2020. Р. 714-736.

4. Ahumada-Tello E., Ravina-Ripoll R., Galvez-Albarracin E. G. Social networks and academic performance self-perception in business sciences students. Social science. №. 36 (66).2020. Р. 105-117.

5. Tiwasing Р. Social media business networks and SME performance: a rural-urban comparative analysis. Growth and Change. №. 52 (3). 2021. Р. 1892-1913.

6. Alexandra Ioanid, Cezar Scarlat. Factors Influencing Social Networks Use for Business: Twitter and YouTube Analysis. Procedia Engineering, Volume 181, 2017, Pages 977-983, ISSN 1877-7058. URL: https://doi.org/10.1016/j. proeng.2017.02.496.

7. 1лляшенко С. М., 1ванова Т. £. 1нструменти та методи просування продукцп в Internet: аналггичний огляд. Маркетинг i менеджмент тновацш. № 3. 2015. С. 20-32. URL: http://nbuv.gov.ua/UJRN/Mimi_2015_3_4.

8. Шевчук I. Б. Бiзнес у сощальних мережах: Навч. поаб. Львiв: Видавництво ННВК «АТБ», 2021. 219 с. URL: https://financial.lnu.edu.ua/wp-content/uploads/2021/11/BSM_navchalnyy-posibnyk_2.pdf]

9. Варна М. Що таке SMM i як працюе маркетинг у сощальних мережах. Гайд для початшвщв. (2023) URL: https://netpeak.net/uk/blog/shcho-take-smm-i-yak-pratsyue-marketing-u-sotsial-nikh-merezhakh-gayd-dlya-pochatkivtsiv/

10. Маркетинг в сощальних мережах. SMM агенство (2022) URL: https://cases.media/article/marketing-v-socialnikh-merezhakh-smm-agenstvo

11. Lisa Harris and Alan Rae. Social networks: the future of marketing for small business. Journal Of Business Strategyj. Vol. 30 No. 5. 2009.

12. Koirala, Jyoti, Understanding the Use of Cluster Analysis in Business (March 27, 2023). URL: https://ssrn.com/ abstract=4400674 or http://dx.doi.org/10.2139/ssrn.4400674

13. Безпарточний М. Г. Використання кластерного аналiзу при ощнщ ефективносл д1яльносп торговельних шдприемств. Торгiвля, комерцiя, тдприемництво: збiрник наукових праць. Львiв: Львiвська комерцшна академгя. Вип. 17. 2014. С. 24-27.

14. Jain A. K., Dubes R. C. (1988). Algorithms for Clustering Data. Upper Saddle River. NJ: Prentice-Hall, Inc. URL: http://dl.acm.org/citation.cfm?id=SERIES10022.42779

15. Jain А.К, Murty M.N., Flynn P.J. Data Clustering: A Review. ACM Computing Surveys. Vol. 31, No. 3. 1999. Р. 264-323. URL: http://www.eecs.northwestern.edu/~yingliu/datamining_papers/survey.pdf

16. Шевченко СМ., Жданова Ю.Д., Негоденко О.В., Куцук В.А. Модель експертно! системи для медичного скриншгу на основi метсдов кластерного аналiзу. Moderni aspekty vedy: XXVII. Dil mezinarodni kolektivni monografie. Mezinarodni Ekonomicky Institut s.r.o. Ceska republika: Mezinarodni Ekonomicky Institut s.r.o., 2023. С. 478-494. URL: http://perspectives.pp.ua/public/site/mono/mono-27.pdf

17. K. A. Abdul Nazeer, M. P. Sebastian. Improving the Accuracy and Efficiency of the k-means Clustering Algorithm. Proceedings of the World Congress on Engineering. 2009. Vol I WCE 2009, July 1-3, 2009, London, U.K.

18. Лотиш О.Я. Кластерний аналiз в сегментаци галузг Вюник Одеського нацюнального утверситету. Еконо-Mirn. Випуск 5 (78). Том 24. 2019. С. 37-42. URL: https://doi.org/10.32782/2304-0920/5-78-6

19. Роскладка А.А., Роскладка Н.О., Дзигман О.О. Кластерний аналiз ктентсько! бази даних пвдприемств сфери послуг. Агросвт. № 16. 2019. С. 8-17. URL: https://economics.kntu.kr.ua/pdf/2(35)/17.pdf

References

1. Leading social media platforms used by marketers worldwide as of January 2023. Statista. (2023) URL: https:// www.statista.com/statistics/259379/social-media-platforms-used-by-marketers-worldwide/

2. Luo C. (2021) Analyzing the impact of social networks and social behavior on electronic business during COVID-19 pandemic. Information Processing and Management. №. 58. Рр. 37.

3. Cuypers R. P., Ertug G., Cantwell J., Zaheer A., Kilduff M. (2020) Making connections: social networks in international business. Journal of International Business Studies. №. 51 (5). Рр. 714-736.

4. Ahumada-Tello E., Ravina-Ripoll R., Galvez-Albarracin E. G. (2020) Social networks and academic performance self-perception in business sciences students. Social science. №. 36 (66). Рр. 105-117.

5. Tiwasing Р. (2021) Social media business networks and SME performance: a rural-urban comparative analysis. Growth and Change. №. 52 (3). Рр. 1892-1913.

6. Alexandra Ioanid, Cezar Scarlat. (2017) Factors Influencing Social Networks Use for Business: Twitter and YouTube Analysis. Procedia Engineering, Volume 181. Pp. 977-983, ISSN 1877-7058. URL: https://doi.org/10.1016/j. proeng.2017.02.496.

7. Ilyashenko S. M., Ivanova T. E. (2015) Tools and methods for promoting products on the Internet: an analytical review. Marketing and innovation management. No. 3. Pp. 20-32. URL: http://nbuv.gov.ua/UJRN/Mimi_2015_3_4.

8. Shevchuk I. B. (2021) Business at social boundaries: Navch. pos_b. Lviv: Vidavnitstvo NNVK «ATB». [in Ukrainian] URL: https://financial.lnu.edu.ua/wp-content/uploads/2021/11/BSM_navchalnyy-posibnyk_2.pdf]

9. Varna M. (2023) What is SMM and how does marketing work in social networks. A guide for coworkers. URL: https://netpeak.net/uk/blog/shcho-take-smm-i-yak-pratsyue-marketing-u-sotsial-nikh-merezhakh-gayd-dlya-pochatkivtsiv/

10. Marketing in social networks. SMM agency (2022) URL: https://cases.media/article/marketing-v-socialnikh-merezhakh-smm-agenstvo

11. Lisa Harris and Alan Rae. (2009) Social networks: the future of marketing for small business. Journal Of Business Strategyj. Vol. 30 No. 5.

12. Koirala, Jyoti. (March 27, 2023). Understanding the Use of Cluster Analysis in Business. URL: https://ssrn.com/ abstract=4400674 or http://dx.doi.org/10.2139/ssrn.4400674

13. Bezpartochniy M. G. (2014) The use of cluster analysis in the evaluation of the efficiency of trade enterprises. Trade, commerce, entrepreneurship: collection of scientific works. Lviv: Lviv Commercial Academy. Issue 17. Pp. 24-27.

14. Jain A. K., Dubes R. C. (1988). Algorithms for Clustering Data. Upper Saddle River. NJ: Prentice-Hall, Inc. URL: http://dl.acm.org/citation.cfm?id=SERIES10022.42779

15. Jain A.K, Murty M.N., Flynn P.J. (1999) Data Clustering: A Review. ACM Computing Surveys. Vol. 31, No. 3. Pp. 264-323. URL: http://www.eecs.northwestern.edu/~yingliu/datamining_papers/survey.pdf

16. Shevchenko S.M., Zhdanova Yu.D., Nehodenko O.V., Kutsuk VA. (2023) An expert system model for medical screening based on cluster analysis methods. Moderni aspekty vëdy: XXVII. Dil mezinârodni kolektivni monografie. Mezinarodni Ekonomicky Institut s.r.o. Ceska republika: Mezinarodni Ekonomicky Institut s.r.o. Pp. 478-494. URL: http://perspectives.pp.ua/public/site/mono/mono-27.pdf

17. K. A. Abdul Nazeer, M. P. (2009, July 1) Sebastian. Improving the Accuracy and Efficiency of the k-means Clustering Algorithm. Proceedings of the World Congress on Engineering. 2009. Vol. I WCE 3. London, U.K.

18. Lotysh O.Ya. (2019) Cluster analysis in industry segmentation. Bulletin of Odessa National University. Economy. Issue 5 (78). Volume 24. Pp. 37-42. URL: https://doi.org/10.32782/2304-0920/5-78-6

19. Roskladka A.A., Roskladka N.O., Dzigman O.O. (2019) Cluster analysis of the client database of service enterprises. Agroworld. No. 16. Pp. 8-17. URL: https://economics.kntu.kr.ua/pdf/2(35)/17.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.