Научная статья на тему 'ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА АНАЛИЗА ТОНАЛЬНОСТИ ДЛЯ ИЗМЕРЕНИЯ ЛОЯЛЬНОСТИ ПОКУПАТЕЛЕЙ И ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННАЯ НА НЕЧЕТКОЙ ЛОГИКЕ'

ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА АНАЛИЗА ТОНАЛЬНОСТИ ДЛЯ ИЗМЕРЕНИЯ ЛОЯЛЬНОСТИ ПОКУПАТЕЛЕЙ И ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННАЯ НА НЕЧЕТКОЙ ЛОГИКЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
137
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ТОНАЛЬНОСТИ / НЕЧЕТКАЯ ЛОГИКА / ПРИНЯТИЕ РЕШЕНИЙ / ЛОЯЛЬНОСТЬ КЛИЕНТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Герасименко Евгения Михайловна, Стеценко Валентина Витальевна

Представлен интеллектуальный подход к измерению лояльности клиентов к конкретному продукту, основанный на анализе комментариев. Общий анализ тональности в твитах и сообщениях проводится довольно часто, однако ориентированный на задачи анализ мнений пользователей и измерение уровня их лояльности является новой идеей. Сложность в проведении ориентированного на задачу анализа тональности сообщений заключается в измерении лояльности клиента к конкретному продукту на основе мнения клиентов об этом самом продукте. Полученные данные об уровне лояльности клиента к продукту смогут помочь новому клиенту принять решение о конкретном товаре, учитывая его различные особенности и отзывы предыдущих клиентов. В качестве набора данных был использован большой массив данных, состоящих из онлайн-отзывов клиентов с Amazon.com. Набор исходных данных представляет собой совокупность отзывов, из которых предлагаемый подход формирует агрегированную оценку мнений, далее используется модель нечеткой логики для измерения лояльности клиента к продукту. В предложенном подходе входной текст сначала обрабатывается с помощью таких методов как токенизация, удаления стоп-слов, лемматизация, затем происходит маркировка частей речи и осуществляется анализ полярности отзывов, затем, к полученным агрегированным оценкам применяются методы нечеткой логики, чтобы определить степень лояльности клиентов к продукту. В этой работе использовались различные библиотеки с открытыми API, такие как SentiWordNet, Stanford CoreNLP и т.д. Используемый подход фокусируется на выявлении тональности обзоров, которые могут быть положительными, отрицательными и нейтральными. В нашем исследовании мы использовали треугольную функцию принадлежности, также известную как trimf, потому что она поддерживает три переменные и создает связь между ними. Реализация подхода обеспечивает высокую точность определения лояльности к продуктам электронной коммерции, которая превосходит предыдущие подходы, а применение нечеткой логик позволило значительно повысить значения таких показателей как точность, полнота и F-мера.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Герасименко Евгения Михайловна, Стеценко Валентина Витальевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN INTELLIGENT SENTIMENT ANALYSIS SYSTEM FOR MEASURING CUSTOMER LOYALTY AND MAKING DECISIONS BASED ON FUZZY LOGIC

This paper presents an intelligent approach of measuring customer loyalty to a specific product based on the analysis of comments. General sentiment analysis in tweets and messages is quite common, but task-oriented analysis of user opinions and measuring their level of loyalty is a new idea. The tricky part of doing task-oriented sentiment analysis lies in measuring customer loyalty to a particular product based on how customers feel about that product itself. The resulting data on the level of customer loyalty to the product can help a new customer to make a decision on a specific product, taking into account its various characteristics and feedback from previous customers. The dataset was a large dataset of online customer testimonials from Amazon.com. The set of initial data is a set of reviews, from which the proposed approach forms an aggregated assessment of opinions, then a fuzzy logic model is used to measure customer loyalty to the product. In the proposed approach, the input text is first processed using such methods as tokenization, removal of stop words, lemmatization, then the parts of speech are marked and the polarity of the reviews is analyzed, then fuzzy logic methods are applied to the obtained aggregated estimates to determine the degree of customer loyalty to the product. This work used various open API libraries such as SentiWordNet, Stanford CoreNLP, etc. The approach used focuses on identifying the sentiment of reviews, which can be positive, negative and neutral. In our study, we used a triangular membership function, also known as trimf, because it supports three variables and creates a relationship between them. The implementation of the approach ensures high accuracy in determining loyalty to e-commerce products, which is superior to previous approaches, and the use of fuzzy logic has significantly increased the values of such indicators as precision, recall, and F-measure.

Текст научной работы на тему «ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА АНАЛИЗА ТОНАЛЬНОСТИ ДЛЯ ИЗМЕРЕНИЯ ЛОЯЛЬНОСТИ ПОКУПАТЕЛЕЙ И ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННАЯ НА НЕЧЕТКОЙ ЛОГИКЕ»

Раздел II. Интеллектуальные системы

УДК 0004.912 DOI 10.18522/2311-3103-2021-4-42-50

Е.М. Герасименко, В.В. Стеценко

ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА АНАЛИЗА ТОНАЛЬНОСТИ ДЛЯ ИЗМЕРЕНИЯ ЛОЯЛЬНОСТИ ПОКУПАТЕЛЕЙ И ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННАЯ НА НЕЧЕТКОЙ ЛОГИКЕ

Представлен интеллектуальный подход к измерению лояльности клиентов к конкретному продукту, основанный на анализе комментариев. Общий анализ тональности в твитах и сообщениях проводится довольно часто, однако ориентированный на задачи анализ мнений пользователей и измерение уровня их лояльности является новой идеей. Сложность в проведении ориентированного на задачу анализа тональности сообщений заключается в измерении лояльности клиента к конкретному продукту на основе мнения клиентов об этом самом продукте. Полученные данные об уровне лояльности клиента к продукту смогут помочь новому клиенту принять решение о конкретном товаре, учитывая его различные особенности и отзывы предыдущих клиентов. В качестве набора данных был использован большой массив данных, состоящих из онлайн-отзывов клиентов с Amazon.com. Набор исходных данных представляет собой совокупность отзывов, из которых предлагаемый подход формирует агрегированную оценку мнений, далее используется модель нечеткой логики для измерения лояльности клиента к продукту. В предложенном подходе входной текст сначала обрабатывается с помощью таких методов как токениза-ция, удаления стоп-слов, лемматизация, затем происходит маркировка частей речи и осуществляется анализ полярности отзывов, затем, к полученным агрегированным оценкам применяются методы нечеткой логики, чтобы определить степень лояльности клиентов к продукту. В этой работе использовались различные библиотеки с открытыми API, такие как SentiWordNet, Stanford CoreNLP и т.д. Используемый подход фокусируется на выявлении тональности обзоров, которые могут быть положительными, отрицательными и нейтральными. В нашем исследовании мы использовали треугольную функцию принадлежности, также известную как trimf потому что она поддерживает три переменные и создает связь между ними. Реализация подхода обеспечивает высокую точность определения лояльности к продуктам электронной коммерции, которая превосходит предыдущие подходы, а применение нечеткой логик позволило значительно повысить значения таких показателей как точность, полнота и F-мера.

Анализ тональности; нечеткая логика; принятие решений; лояльность клиентов.

E.M. Gerasimenko, V.V. Stetsenko

AN INTELLIGENT SENTIMENT ANALYSIS SYSTEM FOR MEASURING CUSTOMER LOYALTY AND MAKING DECISIONS BASED ON FUZZY LOGIC

This paper presents an intelligent approach of measuring customer loyalty to a specific product based on the analysis of comments. General sentiment analysis in tweets and messages is quite common, but task-oriented analysis of user opinions and measuring their level of loyalty is a new idea. The tricky part of doing task-oriented sentiment analysis lies in measuring customer loyalty to a particular product based on how customers feel about that product itself. The resulting data on the level of customer loyalty to the product can help a new customer to make a decision on a specific product, taking into account its various characteristics and feedback from previous cus-

tomers. The dataset was a large dataset of online customer testimonials from Amazon.com. The set of initial data is a set of reviews, from which the proposed approach forms an aggregated assessment of opinions, then a fuzzy logic model is used to measure customer loyalty to the product. In the proposed approach, the input text is first processed using such methods as tokenization, removal of stop words, lemmatization, then the parts of speech are marked and the polarity of the reviews is analyzed, then fuzzy logic methods are applied to the obtained aggregated estimates to determine the degree of customer loyalty to the product. This work used various open API libraries such as SentiWordNet, Stanford CoreNLP, etc. The approach used focuses on identifying the sentiment of reviews, which can be positive, negative and neutral. In our study, we used a triangular membership function, also known as trimf because it supports three variables and creates a relationship between them. The implementation of the approach ensures high accuracy in determining loyalty to e-commerce products, which is superior to previous approaches, and the use of fuzzy logic has significantly increased the values of such indicators as precision, recall, and F-measure.

Sentiment analysis; fuzzy logic; decision making; customer's loyality.

Введение Широкое использование интернета произвело революцию в нашей жизни благодаря появлению множества различных услуг, облегчающих жизнь, таких как онлайн-покупки, онлайн-курсы, онлайн-банкинг и многое другое. За последнее десятилетие электронная коммерция (процесс покупки и продажи товаров через Интернет) растет день ото дня и превратилась в будущее покупок. Законодателями моды в современной электронной коммерции являются Amazon, E-Bay, Ali Baba Express и многие другие. AMAZON.com - один из крупнейших интернет-магазинов розничной торговли. В последнее время насчитывается около 244 миллионов учетных записей активных покупателей, 200 миллионов активных продуктов и 2,2 миллиарда продаж за последние 12 месяцев (в среднем 6 миллионов продаж в день. Покупки онлайн значительно облегчают процесс клиентам и предприятиям. Однако, проблема, с которой сталкиваются пользователи электронной коммерции, - это необходимость в более совершенной и улучшенной платформе сравнения и выбора товаров и цен. [1] Если такая платформа доступна, она может сэкономить время, деньги и энергию клиента и может помочь в покупке более качественных продуктов, отвечающих определенным требованиям. Большим источником знаний являются отзывы клиентов о товарах на сайтах социальных сетей и электронной коммерции, которые могут эффективно воздействовать на принятие решений новыми клиентами [2-6].

Самый простой и широко используемый метод измерения удовлетворенности потребителя состоит в том, чтобы понять его чувства или мнения, которые выражаются в форме комментариев [7-9]. Важнейший способ понять их чувства, настроение и мнения или узнать, что они пытаются сделать, - это оценить их отзывы и комментарии о товаре и услугах [10]. Отслеживание мнений, чувств, ответов и настроений клиентов известно, как анализ мнений и анализ тональности [11]. Тип анализа текста, целью которого является выявление мнения и полярности обзоров, называется тональным анализом. Это вид анализа текста, который имеет дело с широким аспектом обработки естественного языка, вычислительной семантики и интеллектуального анализа текста [12].

Мнения, высказанные на сайтах социальных сетей, очень эффективны для процесса принятия решений в деловых организациях. Организации используют эти посты для извлечения мнений людей и проведения анализа настроений. Анализ тональности позволяет определить тональность текста как положительную, отрицательную или нейтральную.

Общий анализ тональности в твитах и сообщениях проводится довольно часто, однако ориентированный на задачи анализ мнений пользователей и измерение уровня их уверенности является новой идеей. Сложность в проведении ориентированного на задачу анализа тональности сообщений заключается в измерении лояльности клиента к конкретному продукту на основе мнения клиентов об этом самом продукте.

В предложенном подходе мы определяем отношение пользователей, анализируя их комментарии. Мы можем рассматривать их как положительные, нейтральные или отрицательные. Мы измеряем «PN-полярность» субъективных терминов, то есть распознаем, является текст, в котором выражаются мнения и эмоции, позитивным или негативным. С помощью библиотеки Stanford CoreNLP представленный подход легко понимает, что люди пытаются выразить своими словами. Чтобы определить тональность и полярность входного текста, [13] используется библиотека SentiWordNet для измерения уровня вовлеченности клиента в продукт. Для измерения лояльности клиентов на основе оценки тональности, рассчитанной на основе отзывов, применяется метод нечеткой логики. Нечеткая логика - это процесс рассуждения, который очень похож на рассуждение человека [14]. Этот подход копирует процесс принятия решения человеком, включая все вариации между цифровыми значениями ДА и НЕТ. Стандартная логика, которую компьютер может легко понять, состоит в том, чтобы принимать конкретный ввод и выдавать определенный вывод как ИСТИНА или ЛОЖЬ, или 1 или 0, что равняется человеческому ДА или НЕТ. Нечеткая логика работает на уровнях возможностей ввода для достижения определенного результата и также называется многозначной логикой, которая имеет дело только с истинными значениями. Значения истинности варьируются от всех значений в диапазоне от 0 до 1. Оно не распространяется только на истинные и ложные значения, такие как булева алгебра.

Методология. Разработанный подход предназначен для анализа тональности отзывов и измерения отношения пользователей относительно их комментариев к конкретному продукту. На рис. 1 представлена базовая структура архитектуры анализа тональности.

Рис. 1. Базовая структура архитектуры анализа тональности

Процесс начинается со сбора отзывов, комментариев, сообщений и твитов пользователей, относящихся к конкретному продукту, из различных источников, таких как социальные сети, торговые сайты и т.д. В представленном подходе был собран набор данных, состоящий из 500 отзывов с AMAZON. В этом исследовании собраны мнения клиентов и отзывы о продуктах Apple (таких как Apple iPhone 6 и iPhone 7).

Токенизация. Каждый отзыв из набора данных обрабатывается индивидуально. Предварительная обработка рецензий начинается с фазы токенизации, которая разделяет фрагмент рецензии на небольшие единицы, такие как токены. Типичный процесс токенизации может определять знаки препинания и создавать то-кены текста. Токен может быть чем угодно, предложением, словом или символом и т. д. Мы использовали StanfordCoreNLP PTB Tokenizer, который на самом деле является способом токенизации английского письма PENN TREEBANK, и разбивает рецензии на предложения, чтобы упростить сам файл.

Удаление стоп-слов. Набор бессмысленных или не относящихся к делу слов в тексте может серьезно повлиять на точность вывода. Следовательно, удаление таких стоп-слов из входного текста является важной фазой в анализе тональности текста. В собранных пользовательских обзорах стоп-словом может быть число, предлог или имя человека, название продукта и т.д. Каждый отзыв после процесса токенизации проходит этап удаления стоп-слов. Используемый подход использует библиотеку CoreNLP [15], которая помогает идентифицировать список стоп-слов.

Лемматизация. Лемматизация - процесс, который использует словарь и морфологический анализ, чтобы в итоге привести слово к его канонической форме - лемме, что позволяет достичь более точных результатов в анализе тональности [16]. Во многих текстовых документах используются разные формы слова, например, мобильный телефон, мобильные телефоны, мобильники, которые относятся к «мобильный».

Маркировка частей речи (PoS). После фазы лемматизации в тексте отзыва проводится маркировка частей речи для определения лексической позиции и значения конкретного слова в предложении. Лексическая позиция и значение помогают определить влияние слова в предложении. Используемый подход выполняет маркировку частей речи с помощью Stanford POS tagger, который является частью библиотеки Stanford CoreNLP [17]. На этом этапе PoS tagger маркирует каждое слово в тексте обзора, например:

♦ Вход: This phone has best features e.g., screen, sound system, etc.

♦ Выход: [This/DT] [phone/NN] [has/VBZ] [best/JJS] [features/NNS] [e.g.,/VBG] [screen/NN] [,/,] [sound/JJ] [system/NN] [,/,] [etc./FW] [./.]

Анализ полярности отзывов. Измерение полярности отзыва клиента является ключевым этапом в используемом подходе. В предложенном подходе для определения показателя полярности каждого слова в обзоре пользователя используется библиотека SentiWordNet 3.0.0 [18]. Показатели полярности каждого слова в предложении суммируются и в итоге получается общий уровень полярности предложения. Табл. 1 показывает выходные данные процесса PoS, а табл. 2 показывает обработанный пример.

Таблица 1

Результат маркировки частей речи

POS_ID POS наименование POS_аббревиатура SentiWordNet_ аббревиатура

1 Noun (существительное) NN N

2 Adjective (прилагательное) JJ A

3 Verb (глагол) VB V

4 Adverb (наречие) RB R

5 Noun plural (существительное мн.ч.) NNS N

6 Adjective Superlative (прилагательное в превосходной степени сравнения) JJS A

7 Verbs (глаголы (мн.ч.) VBZ V

Таблица 2

Методология применяемая в тональном анализе

1 Оригинальное предложение iPhone 6 is one of the good models of Apple phone.

2 Предложение после удаления стоп-слов IPhone 6 + one + good + models + Apple phone.

3 Предложение после IPhone/NNP 6/CD is/VBZ one/CD of/IN the/DT

маркировки частей речи с использованием Stanford good/JJ models/NNS of/IN Apple/NNP phone/NN./.

POS tagger

4 Предложение после лемматизации IPhone 6 + one + good + model + Apple phone.

5 Предложение c применением SentiWordNet IPhone#n 6#n one#n good#a model#n Apple#n phone#n.

IPhone#n ==> SentiWordNet Score: 0.0

one#n ==> SentiWordNet Score: 0.0

good#a ==> SentiWordNet Score: 0.634

6 Разметка веса токенов model#n ==> SentiWordNet Score: 0.0

в предложении Apple#n ==> SentiWordNet Score: 0.0

phone#n ==> SentiWordNet Score: 0.0

review#n==>SentiWordNet Score: 0.053

7 Суммарная оценка 0.343

8 Оценка предложения Положительная

Положительная 34,35%

Отрицательная 0,0%

Нейтральная 5,0%

Первая строка отображает ввод простого отзыв в форме предложения, затем удаляются стоп-слова на втором шаге. На третьем этапе мы применяем лемматизацию к этому обзору. На четвертом используем маркировку Stanford Parts-of-Speech. После применения POS-маркировки мы используем маркировку SentiWordNet, которая присваивает балл каждому слову в зависимости от его веса в предложении. Здесь мы применили ограничения и произвели расчет только оценки прилагательных в данных

отзывах. Мы ориентировались только на отзывы, основанные на прилагательных, потому что прилагательное - это качественное слово или слово, которое описывает существительное, которое явно отражает настроения, стоящие за отзывами.

Далее мы рассчитываем оценку слов в предложении, но в тексте мы используем только оценку прилагательных слов. На седьмом этапе все баллы суммируются определения суммы всех слов сентиментальности в данном предложении.

Восьмой этап включает наиболее важную особенность тонального анализа -определение типа тональности предложения. Тип предложения отзыва показывает, считается ли отзыв положительным, нейтральным или отрицательным. Тип предложения данного отзыва является положительным, получен с помощью словаря SentiWordNet. В последних трех строках код вычисляет, насколько обзор является положительным, нейтральным или отрицательным, и конечный результат показывает, что он положительный, потому что он имеет самый высокий процент положительных оценок.

Применение нечеткой логики. Для определения лояльности клиентов к продукту мы использовали систему нечеткой логики.

Фаззификация. Первым шагом в используемых системах нечеткой логики является распознавание входных и выходных переменных. В этом процессе четкие входные данные преобразуются в нечеткое множество функциями принадлежности [19]. Входные переменные системы нечеткой логики представлены в нечетких множествах с использованием лингвистических терминов, функций принадлежности и лингвистических переменных.

Преобразование четких входных значений в нечеткие значения выполняется с использованием функций членства, и этот метод преобразования известен как фаззи-фикация. Каждая функция принадлежности отображает особенность лингвистической переменной, которая размыта. Поскольку мы применяем этот подход к функции принадлежности к лингвистическим переменным в нашем исследовании, мы принимаем «Оценку мнения» и «Лояльность клиентов» в качестве входных переменных, которые могут быть «Ро$»(Положительный), «№и»(Нейтральный), «№^>(Огрицательный), и функцию принадлежности к лингвистической переменной «Лояльность клиентов» -это «РезМо(Псевдо)», «Latent (Скрытая)» и «Тгие(Истинная)». Мы описали нечеткий набор следующим соотношением (1):

А = цЛСх,) + ц2К(х2) +

(1)

В уравнении (1) нечеткое множество называется ядром фаззификации, является постоянной величиной, а преобразуется в нечеткое множество .

Мы принимаем оценку анализа мнений в качестве входной лингвистической переменной, а лояльность клиентов - в качестве выходной лингвистической переменной, которая состоит из лингвистических терминов: «Истинная лояльность», «Псевдо лояльность» и «Скрытая лояльность»

В нашем исследовании мы используем треугольную функцию принадлежности, также известную как trimf. Мы используем именно эту функцию принадлежности, потому что она поддерживает три переменные и создает связь между ними. Эти переменные являются: положительными (а), отрицательными (b), нейтральными (т). (Уравнение (2)).

(2)

где а, Ь и т представляют координаты х для треугольника, х представляет четкое значение из изолированной переменной нечеткой вселенной дискурса. Мы разделили оценку настроения на три вида:

♦ положительная;

♦ нейтральная;

♦ отрицательная.

В «Псевдо лояльности» значение в trimf лежит в пределах 0,0 <х <0,30, потому что потребитель не уверен, совершит ли он покупку товара данной марки в будущем. Это называется низкой лояльностью.

При «скрытой лояльности» значение в trimf лежит в пределах 0,30<х <0,70, потому что потребитель предпочитает не покупать что-либо какой-либо марки, но если он соберется покупать, он всегда будет покупать одну марку. Это - средняя лояльность.

В «Истинной лояльности» значение в trimf лежит в пределах 0.70<х<1.0, потому что потребитель лоялен только к продукту данной марки. Товары данной марки заслуживают доверия и покупатели всегда советуют их своей семье, друзьям и родственникам. Они никогда не переключатся с этого бренда. Это - высокая лояльность.

Правила нечеткой логики. Основой любой системы нечеткой логики являются ее правила. Используя эти правила, мы можем легко описать контролируемый результат и сделать вывод. Это простые правила Если-ТО. Предположим, у нас есть переменная х, включенная в задачу (которая является нашей оценкой настроений), поэтому выход лояльности имеет свою собственную функцию членства, которая является низкой, средней и высокой, например, когда мы применяем правила (показанные в табл. 3), это даст:

♦ Если х низкий, то лояльность низкая.

♦ Если х средний, то лояльность средняя.

♦ Если х высокий, то лояльность высока.

Таблица 3

Нечеткие правила расчета лояльности клиентов

№ Правило

1 Если оценка тональности отрицательная, то уровень «Лояльности клиента» - «псевдо»

2 Если оценка тональности нейтральная, то уровень «Лояльности клиента» - «скрытый»

3 Если оценка тональности высокая, то уровень «Лояльности клиента» - «истинный»

Дефаззификация - это метод, который генерирует количественные результаты в четкой логике, которая достигается с помощью нечетких множеств и функций принадлежности с последовательными степенями. Это метод, который переводит нечеткое множество в четкое множество, используя набор правил, которые преобразуют ряд переменных в нечеткий результат, дает вычислимые результаты, которые содержат нечеткие множества и функции принадлежности и выполняет отображение вывода нечетких множеств в четкие значения.

Мы преобразуем нечеткий выходной сигнал в четкий выходной сигнал, который формируется с помощью шагов системы нечеткого вывода, а функцию членства в лояльности клиентов принимается как выходной сигнал [20].

Вот некоторые правила дефаззификации, где «х» обозначает оценку настроения, а «у» обозначает тип лояльности:

если (0,0<x <0,30), то y = «псевдо лояльность» если (0,30<x <0,70), то y = «скрытая лояльность», если (0,70<x<1,0), тогда у = «истинная лояльность»

Эксперимент и результаты. Результаты получены с использованием алгоритма SentiWordNet и нечеткой логики. Мы собрали 500 комментариев для двух разных продуктов Apple. После формирования набора данных, мы применили к нему предварительную обработку, проанализировали, разбили на токены и провели лемматизацию. В результате предложения разбились на 3 типа: положительные, отрицательные и нейтральные. Результаты оценки измерялись с помощью программного обеспечения SentiWordNet 3.0. Применялся подход определения тональности на уровне предложений. Был получен следующий результат: 320 положительных, 105 - нейтральных, а 75 - отрицательных отзывов. Предложенный подход показал хорошую эффективность, поскольку точность нашего подхода составила 89,32 %, полнота - 80,36 %, а F-мера - 83,69 %, что превосходит результаты, полученные в работах [1.2], в которых точность не превысила 87,5 %, полнота - 65 %, F-мера - 70,3 % .

Ограничением представленного метода является то, что он обрабатывает только грамматически правильный и не содержащий орфографических ошибок текст на английском языке.

Заключение. В данной работе рассматривается важная проблема измерения лояльности покупателей к конкретному продукту. Очень часто проводят анализ тональности твитов и публикаций, однако целенаправленный анализ настроений пользователей в отзывах о продукте с целью выявления ключевых функций, понравившихся пользователям, и уровня их лояльности является новой идеей. Для классификации типов лояльности была применена нечеткая логика, что позволило значительно повысить значения таких показателей как точность, полнота и F-мера. В будущем эта работа может быть расширена за счет рассмотрения обоих типов предложений, то есть субъективных и объективных.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Grabner D., Zanker M., Fliedl G., Fuchs M. Classification of customer reviews based on sentiment analysis, Proceedings of the 19th Conference on Information and Communication Technologies in Tourism (ENTER), Helsingborg, Sweden, 24-27 January 2012, pp. 460-470.

2. Bagheri A., Saraee M., De Jong, F. Care more about customers: Unsupervised domain-independent aspect detection for sentiment analysis of customer reviews, Knowl.-Based Syst., 2013, Vol. 52, pp. 201-213.

3. Wilson T., Wiebe J., Hoffmann P. Recognizing contextual polarity in phrase-level sentiment analysis, Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing, Vancouver, BC, Canada, 6-8 October 2005, pp. 347-354.

4. Hu M., Liu B. Mining and summarizing customer reviews, Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, WA, USA, 22-25 August 2014, pp. 168-177.

5. Neri F., Aliprandi C., Capeci F., Cuadros M., By T. Sentiment analysis on social media, Proceedings of the IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), Istanbul, Turkey, 26-29 August 2012, pp. 919-926.

6. He W., Zha S., Li L. Social media competitive analysis and text mining: A case study in the pizza industry, Int. J. Inf. Manag,. 2013, Vol. 33, pp. 464-472.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Chandrashekaran M., Rotte K., Tax S.S., Grewal R. Satisfaction strength and customer loyalty, J. Mark. Res, 2007, 44, pp. 153-163.

8. Kang D.; Park Y. Review-based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach, Expert Syst. Appl, 2014, 41, pp. 1041-1050.

9. Chamlertwat W., Bhattarakosol P., Rungkasiri T., Haruechaiyasak C. Discovering Consumer Insight from Twitter via Sentiment Analysis, J. UCS, 2012, 18, pp. 973-992.

10. Bauman K., Liu B., Tuzhilin A. Recommending Items with Conditions Enhancing User Experiences Based on Sentiment Analysis of Reviews, Proceedings of the CBRecSys@ RecSys; CEUR Workshop 2016, Boston, MA, USA, 16September 2016, Vol. 1677, pp. 19-22.

11. Dubey A., Gupta A., Raturi N., Saxena P. Item-Based Collaborative Filtering Using Sentiment Analysis of User Reviews, Proceedings of the International Conference on Application of Computing and Communication Technologies, Delhi, India, 9 March 2018, pp. 77-87.

12. Artificial Intelligence Fuzzy Logic Systems. Available online: https://www.tutorialspoint. com/artificial_intelligence/artificial_intelligence_fuzzy_logic_systems.htm (accessed on 02. 06. 2021).

13. SentiWordNet. n.d. Available online: https://sentiwordnet.isti.cnr.it/ (accessed on 12 February 2020).

14. Zadeh L.A. Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic. Fuzzy Sets Syst., 1997, 90, pp. 111-127.

15. Manning C., Surdeanu M., Bauer J., Finkel J., Bethard S., McClosky D. The Stanford CoreNLP natural language processing toolkit, Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, Baltimore, MD, USA, 23-24 June 2014, pp. 55-60.

16. Barbosa L., Feng J. Robust sentiment detection on twitter from biased and noisy data. In Proceedings of the 23rd International Conference on Computational Linguistics, Beijing, China, 36-44 August 2010.

17. Manning C., Surdeanu M., Bauer J., Finkel J., Bethard S., McClosky D. The Stanford CoreNLP natural language processing toolkit, Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations, Baltimore, MD, USA, 23-24 June 2014, pp. 55-60.

18. Baccianella S., Esuli A., Sebastiani F. Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining, Lrec 2010, 10, pp. 2200-2204.

19. Herrera-Viedma E. Fuzzy sets and fuzzy logic in multi-criteria decision making. The 50th anniversary of Prof. Lotfi Zadeh's theory, Introduction, Technol. Econ. Dev. Econ., 2015, 21, pp. 677-683.

20. Indhuja, K.; Reghu, P.C. Fuzzy Logic Based Sentiment Analysis of Product Review Documents, Proceedings of the 1st International Conference on Computational Systems and Communications, Trivandrum, India, 17-18 December 2014, pp. 18-22.

Статью рекомендовал к опубликованию д.т.н. А.В. Боженюк.

Герасименко Евгения Михайловна - Южный федеральный университет; e-mail: egera-simenko@sfedu.ru; г. Таганрог, Россия; кафедра систем автоматизированного проектирования; к.т.н.. доцент.

Стеценко Валентина Витальевна - e-mail: stecenko@sfedu.ru; кафедра систем автоматизированного проектирования; аспирант.

Gerasimenko Evgeniya Michailovna - Southern Federal University; e-mail: egerasimenko@sfedu.ru; Taganrog, Russia; the department of computer aided design, cand. of eng. sc.; associated professor.

Stetsenko Valentina Vitalievna - e-mail: stecenko@sfedu.ru; the department of computer aided design; postgraduate.

i Надоели баннеры? Вы всегда можете отключить рекламу.