АНАЛИЗ ВОЗМОЖНОСТЕЙ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОГО ЗРЕНИЯ В РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ-СИСТЕМАХ

Афанасьев Геннадий Иванович; Афанасьев Арсений Геннадьевич; Зо Хтет Аунг

УДК 004.8

Информационные технологии

Афанасьев Геннадий Иванович, кандидат технических наук, доцент,

Московский государственный технический университет им. Н.Э. Баумана (национальный исследовательский университет) Афанасьев Арсений Геннадьевич, ассистент, Московский государственный технический университет им. Н.Э. Баумана (национальный исследовательский

университет)

Зо Хтет Аунг, магистрант, Московский государственный технический университет им. Н.Э. Баумана (национальный исследовательский

университет)

АНАЛИЗ ВОЗМОЖНОСТЕЙ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОГО

ЗРЕНИЯ В РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ-СИСТЕМАХ

Аннотация: Компьютерное зрение и распознавание образов достигли больших успехов за последнее десятилетие, особенно в категоризации и обнаружении признаков. Эта статья направлена на анализ возможностей компьютерного зрения с точки зрения Интернет онлайн-покупок на примере компьютеров. Анализируется возможность извлечения значимой информации из изображений и применения ее в системе онлайн-рекомендаций для улучшения покупательского спроса в Интернете.

Ключевые слова: рекомендательная система, компьютерное зрение, машинное обучение, покупательский спрос, атрибуты изображений.

Abstract: Computer vision and pattern recognition have made great strides over the last decade, especially in categorization and feature detection. This article is aimed at analyzing the possibilities of computer vision in terms of Internet online shopping using computers as an example. The possibility of extracting meaningful information from images and using it in an online recommendation system to

improve online shopping is analyzed.

Keywords: recommender system, consumer demand, image attributes.

computer vision, machine learning,

Введение

В последние годы, с развитием онлайн-покупок, покупательский спрос онлайн-покупателя изучался многими исследователями с разных точек зрения [1; 2; 3; 4; 5; 6; 7; 8; 9]. Среди этих исследований важный вопрос спроса покупок в Интернете заключается в разнице между спросом покупок в Интернете и офлайн. Эти исследования показали, что социально-экономические факторы изменились и стали незначительными, но аспект безопасности имеет тенденцию быть более существенным. Согласно этим исследованиям веб-сайты онлайн-покупок созданы для улучшения спроса покупок с нескольких точек зрения, включая контроль качества веб-сайта, дизайн интерфейса, качество обслуживания. Предыдущие исследования показали, что существующая неопределенность по продаваемым продуктам и низкая идентифицируемость продавцов имеет негативное влияние на удовлетворенность клиентов и, следовательно, на плохой спрос по онлайн-покупкам. Исследователи стремились собрать больше информации о продуктах и других функциях, чтобы улучшить впечатления клиентов от покупок в Интернете, включая использование больших данных, компьютерного зрения и недавно разработанных методов машинного обучения. Системы онлайн-рекомендаций для улучшения спроса покупок в Интернете приобрели популярность, потому что данные о прошлых транзакциях могут использоваться для прогнозирования выбора клиентов при покупке. В то же время существует множество успешных решений для систем онлайн-рекомендаций клиентов. Например, Amazon увеличила свои продажи почти на 30%, разработав систему онлайн-рекомендаций на основе истории просмотров клиентов. В то же время система онлайн-рекомендаций также помогает Amazon контролировать безопасность и цену продаваемого товара путем анализа больших данных, предоставляемых

клиентами и продуктами. Однако большинство существующих систем онлайн-рекомендаций разрабатываются на основе читаемого текста, оставляя без внимания много новых типов данных, таких как изображения и мультимедийные данные, которые не используются.

Мультимедийные данные и данные изображений предоставляют гораздо больше информации, чем читаемые тексты. Как извлекать значимую информацию из мультимедийных ресурсов, таких как изображения, и применять извлеченную информацию в системах рекомендаций для онлайн-покупок, редко рассматривалось в основном из-за недостаточного учета новых достижения в развитии технологий компьютерного зрения. Эта статья направлена на определения новых методов Интернет-торговли с точки зрения компьютерного зрения и машинного обучения и предлагает основу для интеграция этих новых методов с существующими онлайн-покупками рекомендательные системы.

Компьютер и аксессуары используются в этом исследовании в качестве примера для изучения такой возможности. Сначала рассматриваются прошлые исследования с точки зрения спроса онлайн-покупок, в основном по дизайну веб-сайта онлайн-покупок или удовлетворенности клиентов в Интернете, а затем проведен анализ методов компьютерного зрения, которые можно применить для улучшения спроса онлайн-покупок.

В частности, учитываются, ведущие конференций по компьютерному зрению, таких как компьютерное зрение и распознавание образов и мультимедийная конференция ACM, особенно ориентированных на компьютеры и аксессуары. Результаты аналитического обзора показали, что метод анализа атрибутов можно использовать для улучшения спроса покупок в Интернете. Мы проиллюстрировали это, продемонстрировав, как система рекомендаций по компьютерным предметам может быть разработана с помощью метода обучения атрибутов в компьютерном зрении. Затем формулируются последствия как для исследователей, так и для практиков.

Методы компьютерного зрения и онлайн рекомендательные системы

Предыдущие исследования покупательского поведения в Интернете показало, что аспекты дизайна веб-сайта, надежность, отзывчивость и доверие влияют на общее качество обслуживания и удовлетворенность клиентов. Поэтому возникает вопрос - как можно улучшить спрос онлайн-покупок с точки зрения дизайна веб-сайта, и какие новые технологии от Computer Vision можно использовать для улучшения дизайна веб-сайта.

Извлечение семантических атрибутов из изображений

Ранние исследования системы онлайн-рекомендаций редко рассматривали изображение в качестве важного фактора, в основном, рассматривали для четкого отображения изображений для достижения оптимального эффекта визуализации продукта. Информация на картинке не полностью изучалась, главным образом потому, что методы обработки изображений не были полностью разработаны в первые дни. Наряду с развитием технологии интерактивности изображений, которая позволяет создавать изображения продуктов и манипулировать ими, увеличивается потенциал использования большего количества функций изображений, в последнее время, благодаря методам машинного обучения, компьютерное зрение стало одним из важных компонентов информационных систем. Одним из главных достижений в области компьютерного зрения является распознавание категорий изображений [8]. Первое улучшение связано с представлением изображений признаков, например, на уровне признаков есть виды признаков, которые могут быть извлечены различными методами, включая SIFT, гистограммы ориентированного градиента (HOG), локальный двоичный шаблон (LBP), Фильтры максимального отклика. На основе этих функций можно разработать хорошо обученную модель для классификации различных объектов, таких как мышь, клавиатура или USB-накопитель, по категориям. Семантические атрибуты, предоставленные исследователем, могут быть использованы для дальнейшей помощи в классификации объектов. Некоторые бизнес-решения уже использовали спрос онлайн-покупок с CV и ML3 для предварительного анализа изображений и достигли удовлетворительных результатов. Пример

семантических извлеченных атрибутов компьютеров показан в таблице 1.

Таблица 1. Пример семантических атрибутов компьютеров

№ Бренд HDMI DVI USB Разъёмы для Аудио Сеть

1 Lenovo есть есть USB 2.0, USB 3.0 есть RJ-45

2 Acer есть есть USB 2.0, USB 3.0 есть RJ-45

3 ASUS есть есть USB 2.0, USB 3.0 есть RJ-45

Однако проблема с этим механизмом распознавания заключается в том, что некоторые части объекта, такие как цвет и разъёмы, часто игнорируются. Для решения этой проблемы вводятся некоторые новые модели для изучения оптических свойств. Используя этот метод, из изображений можно извлечь наблюдаемые человеком свойства. Если мы добавим эти свойства как метки вместе с изображениями, то изображения можно группировать, комбинируя метки. например, компьютер можно описать по его цвету или дизайну, и компьютеры можно отличить по этим свойствам. Используя эти методы, мы являемся компьютерным дизайном, можно извлечь некоторые дополнительные семантические функции, такие как цвета и текстуры. Но эти методы хорошо работают только с четкими и простыми данными изображения. В результате эти методы трудно использовать со сложными и зашумленными источниками изображений в реалистичной среде онлайн-покупок. Для решения этой проблемы были разработаны некоторые модели обнаружения объектов. Эти модели используют антропоморфные или простые методы обнаружения объектов для поиска интересных объектов на изображении, поэтому метод изучения атрибутов можно применять только к существующим объектам. С помощью такого расширенного метода мы можем извлекать семантические

атрибуты из изображений в реальной среде онлайн-покупок. В этой области уже проводятся успешные исследования. На самом деле, уже есть успешные исследования по этому поводу [8; 9].

Рисунок 2. Извлечение атрибутов компьютеров (идентифицируется типы разъёмов и местоположение разъёмов, наименования визуально идентифицируемых разъёмов и указатели на них на рисунке не приведены.).

Как показано выше, применение этой информации, собранной с помощью метода компьютерного зрения, может помочь улучшить дизайн веб-сайта и улучшить не только восприятие продуктов, но и спрос покупок. Однако, основываясь на исследовании сложности веб-сайта, можно разделить весь вебсайт на шесть аспектов и обнаружить, что важность каждой части неодинакова. И в целом, дизайн веб-сайта не должен быть слишком сложным. Поэтому при применении этих новых технологий в среде онлайн-покупок нам необходимо учитывать сложность новых функций. Чтобы применить огромное количество информации, предоставляемой методами компьютерного зрения, необходимо выполнить определенную работу в области информационной системы, чтобы измерить влияние этих семантических функций.

Расширение систем рекомендаций с помощью использования изображений

Среди большинства веб-сайтов электронной коммерции стало тенденцией анализировать поведение клиентов на основе их истории транзакций и использовать эту информацию, чтобы давать клиентам рекомендации по

улучшению их покупательского спроса [3; 4; 5].

В настоящее время большинство интернет-магазинов, таких как Amazon и eBay, предлагают рекомендации анализируя историю просмотров или покупок своих клиентов. Этот подход успешен, потому что можно предлагать своим клиентам похожие аксессуары или продукты с помощью истории поиска. Ограничение заключается в том, что все оценки основаны на комбинациях элементов с элементами или пользователей. Алгоритм этих моделей рассматривает только отношения между предметом и пользователем или предметом и предметом, но игнорирует особенности продуктов. Наиболее важные функции, извлеченные из изображений на веб-сайтах электронной коммерции, будут использоваться для улучшения систем онлайн-рекомендаций и повышения качества покупок. Извлеченные функции могут быть воспринимаемыми человеком дескрипторами, такими как цвет и дизайн, например, одежда на сайте Amazon обычно включает пять показателей: цвет; название материала и марки. Но можно извлечь из изображений атрибуты, предоставленных веб-сайтом. Например, можно использовать классификации аксессуаров компьютеров на основе атрибутов, извлеченных из изображений. Таким образом, пользователи могут предоставлять более точное описание продуктов на более высоком когнитивном уровне, тем самым предоставляя более полную информацию о продукте на более высоком концептуальном и когнитивном уровне.

Анализ изображений людьми в цикле

Большинство проблем компьютерного зрения решаются с помощью алгоритмов машинного обучения [1; 2], и нет необходимости создавать большой набор данных изображений, чтобы учиться на этом алгоритме. Вместо этого исследователям необходимо собирать хорошо размеченные наборы компьютерных данных для учебных целей. Качество этого набора данных в некоторой степени определяет точность модели компьютерного зрения. Однако сбор таких наборов данных обычно является дорогостоящим и трудоемким. Особенно в индустрии компьютеров и аксессуаров продукты и дизайн

меняются каждый год, и компании часто обновляют свои наборы данных. Для решения этой проблемы предлагается метод «человек в петле» [7]. В этом методе собираются ответы человека на некоторые специальные вопросы дизайна, и эти вопросы структурируются как человеческие знания для обогащения модели. По сравнению с предыдущим алгоритмом люди в циклическом методе используют меньше наборов данных и получают более точные результаты с помощью динамического метода. Текущие достижения в круговых методах для людей широко применяются только к наборам данных животных или незнакомым классам. Отзывы о компьютерах и электронике различаются у разных групп клиентов, поэтому работ по электронике мы пока не видели. Чтобы улучшить идентификацию людей в цепных методах для компьютеров и электроники в алгоритм могут быть включены отзывы от разных групп клиентов. Результаты прошлых маркетинговых исследований по сегментации клиентов можно считать применимыми к людям в цепных методах. Это синтез предыдущих маркетинговых теорий и теорий информационных систем.

Выводы

Целью данной статьи был анализ потенциала сочетания методов компьютерного зрения с методами информационных систем для улучшения спроса покупок в Интернете. Был рассмотрен и освящен ряд методов компьютерного зрения и навыков машинного обучения. Затем рассмотрено текущее развитие рекомендательных систем онлайн-покупок. Было обнаружено, что большинство систем рекомендаций по покупкам в Интернете используют только текстовую информацию о продуктах и мало информации об изображениях. Последнее мало учитываться в существующих системах онлайн-рекомендаций. Поэтому можно сделать вывод, что извлечение информации из изображений продуктов с помощью методов компьютерного зрения может улучшить спрос онлайн-покупок за счет более качественной и полной информации. Потенциал системы онлайн-сертификации с использованием методов компьютерного зрения очень многообещающий, но имеется еще много

вопросов для решения. Можно предложить для дальнейшего рассмотрения два важных аспекта, чтобы лучше применять методы компьютерного зрения к системам онлайн-рекомендаций. Во-первых, какие функции семантики использовать для построения концептуальных моделей для извлечения атрибутов из изображений продуктов? У нас могут быть потрясающие технологии компьютерного зрения, но потребителям может не понравиться информация, извлеченная из изображений продуктов. Концептуальные модели даже существующей маркетинговой теории можно использовать, чтобы сделать концептуальные особенности более значимыми для методов компьютерного зрения. Во-вторых, какие знания о потребителе необходимо использовать для создания алгоритма для компьютера и его аксессуаров с участием людей? Как применять методы компьютерного зрения к системе онлайн-рекомендаций? Поэтому важно получить представление и знания с точки зрения пользователей. Дальнейшие исследования возможно будут сосредоточены на тестировании и изучении отзывов клиентов о существующих системах онлайн-рекомендаций с помощью методов компьютерного зрения. Так же с технической точки зрения также есть некоторые проблемы, которые необходимо решить, прежде чем применять информацию, извлеченную из изображений, в систему онлайн-рекомендаций. Упомянутые выше новые алгоритмы сосредоточены только на технической стороне, и большинство из них хорошо работают только с подробными помеченными обучающими данными. В практических ситуациях создание хорошо размеченных обучающих данных может быть затруднено, а анализируемые изображения содержат много шумовых данных. В этом случае производительность существующих алгоритмов компьютерного зрения следует тщательно протестировать перед использованием на реальных данных.

Библиографический список:

1. Афанасьев Г.И., Абулкасимов М.М., Сурикова О.В. Алгоритмы оптимизации, используемые в нейронных сетях, и градиентный спуск // Аспирант и соискатель. 2019. № 6 (114). С.81- 86.

2. Галичий Д.А., Афанасьев Г.И., Нестеров Ю.Г., Распознавание эмоций человека при помощи современных глубокого обучения методов // E-SCIO. 2021. №5. С.317-331.

3. Чжан Чжибо, Афанасьев Г.И. Основные технологии и перспективы эволюции персонализированных рекомендательных систем // E-SCIO. 2024. №4(67). С.309-320.

4. Чжан Чжибо, Афанасьев Г.И. Применение моделей глубокого обучения в области рекомендательных систем, основанных на содержании //Искусственный интеллект в автоматизированных системах управления и обработки данных (ИИАСУ 22). Сборник статей Всероссийской научной конференции. В 2 т. (Москва. МГТУ им. Н.Э. Баумана. 27-28 апреля 2022 г.). -М.: МГТУ им. Н.Э. Баумана, Т.1. С. 278-284.

5. Andersen R. Trust-based recommendation systems: an axiomatic approach /Andersen R., Borgs C., Chayes J., Feige U., Flaxman A., Kalai A., Mirrokni V., Tennenholtz, M. // ACM ( Proceedings of the 17th international conference on World Wide Web. 2008). 2008. Р. 199-208.

6. Banko M. Open in- formation extraction for the web / Banko M., Cafarella M.J., Soderland S., Broadhead M., Etzioni O. // IJCAI. Vol. 7. 2007. P. 2670-2676.

7. Bauer H.H. Etransqual: A transaction process- based approach for capturing service quality in online shopping / Bauer H.H., Falk T., Hammerschmidt M. //Journal of Business Research 59(7). 2006. P. 866-875.

8. Farhadi A. Describing objects by their attributes/ Farhadi A., Endres I., Hoiem D., Forsyth D .// Computer Vision and Pattern Recognition. 2009. CVPR 2009. IEEE Conference. 2009. P.1778-1785.

9. Kuo H.M., Chen C.W. Application of quality function deployment to improve the quality of internet shopping website interface design // International Journal of Innovative Computing. Information and Control 7(1). 2011. P. 253-268.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Афанасьев Геннадий Иванович, Афанасьев Арсений Геннадьевич, Зо Хтет Аунг

Текст научной работы на тему «АНАЛИЗ ВОЗМОЖНОСТЕЙ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОГО ЗРЕНИЯ В РЕКОМЕНДАТЕЛЬНЫХ ИНТЕРНЕТ-СИСТЕМАХ»