Научная статья на тему 'Прогнозирование в интеллектуальных системах-ассистентах на основе алгоритма поиска косяком рыб'

Прогнозирование в интеллектуальных системах-ассистентах на основе алгоритма поиска косяком рыб Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
189
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕРСОНАЛИЗАЦИЯ ОБРАЗОВАТЕЛЬНОГО КОНТЕНТА / КОЛЛАБОРАТИВНАЯ ФИЛЬТРАЦИЯ / ВИКТИМНОСТЬ / ПРОГНОЗИРОВАНИЕ ПРЕДПОЧТЕНИЙ / ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ-АССИСТЕНТЫ / БИОИНСПИРИРОВАННЫЕ МЕТОДЫ / АЛГОРИТМ ПОИСКА КОСЯКОМ РЫБ / PERSONALIZATION OF EDUCATIONAL CONTENT / COLLABORATIVE FILTERING / VICTIMIZATION / PREDICTION OF PREFERENCES / INTELLIGENT ASSISTANT SYSTEMS / BIOINSPIRED METHODS / FISH SCHOOL SEARCH ALGORITHM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бова Виктория Викторовна, Кулиев Эльмар Валерьевич, Родзин Сергей Иванович

Работа связана с решением проблемы персонализации ресурсов Интернет для повышения эффективности организации и сопровождения психологически-безопасного поведения пользователей в интернет-пространстве. Особую актуальность данная проблема приобретает для сферы интернет-обучения в условиях непрерывного роста числа образовательных Интернет-ресурсов и сервисов, развития контента, несущего виктимное воздействие на морально-нравственные аспекты личности обучающегося. Среди наиболее перспективных подходов к ее решению в настоящее время выделяется подход, который базируется на прогнозировании предпочтений пользователей для формирования контента, соответствующего их интересам и ожиданиям. С целью эффективного извлечения и обработки данных, а также выявления закономерностей, позволяющих сделать выводы (прогнозы) о конкретных предпочтениях пользователей применяются методы интеллектуального анализа данных и машинного обучения. В статье предложен метод прогнозирования предпочтений субъекта обучения в интеллектуальных системах-ассистентах для генерации рекомендаций и персонализации образовательного контента и услуг. Принципиальным отличием предложенного метода является переход от персональных рекомендаций к групповым на основе методов коллаборативной фильтрации пользователей со схожими предпочтениями. Для формирования рекомендаций разработана модель оценки предпочтений, основанная на совместном использовании методов Item-Item CF и User-User CF, что позволит решить проблему «холодного старта» и повысить качество рекомендаций для пользователей со схожими интересами и характеристиками поведения. Оценка прогнозирования связана с большой размерностью параметров модели обучения. Для снижения размерности пространства поиска предпочтений из неявных данных большого объема об активности пользователя и повышения точности прогноза разработан биоинспирированный алгоритм поиска косяком рыб, отличающийся масштабируемостью и способностью обрабатывать разреженные данные. Экспериментальные исследования эффективности работы алгоритма были проведены на тестовых данных MovieLens и подтвердили высокую обобщающую способность и точность прогноза предпочтений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREDICTION IN INTELLECTUAL ASSISTANT SYSTEMS BASED ON FISH SCHOOL SEARCH ALGORITHM

The work is related to solving the problem of personalizing Internet resources in order to increase the efficiency of organization and maintenance of psychologically safe user behavior in the Internet space. This problem is of particular relevance for the field of online education in the context of the continuous growth of the number of educational Internet resources and services, the development of content, which has a victimic effect on the moral and ethical aspects of the student's personality. Among the most promising approaches to its solution, currently stands out an approach that is based on predicting user preferences for generating content that meets their interests and expectations. In order to efficiently extract and process data, as well as to identify patterns that allow conclusions (predictions) to be made about specific user preferences, data mining and machine learning methods are used. The article proposes a method for predicting the preferences of the subject of training in intelligent assistant systems for generating recommendations and personalizing educational content and services. The principal difference of the proposed method is the transition from personal recommendations to group based on methods of collaborative filtering of users with similar preferences. To formulate recommendations, a preference evaluation model has been developed, based on the combined use of Item-Item CF and User-User CF methods, which will solve the cold start problem and improve the quality of recommendations for users with similar interests and behavior characteristics. Evaluation of forecasting is associated with a large dimension of the parameters of the learning model. To reduce the dimension of the search space preferences from a large amount of implicit data about user activity and improve the accuracy of the forecast, a bioinspired fish school search algorithm has been developed that is distinguished by scalability and the ability to process sparse data. Experimental studies of the efficiency of the algorithm were carried out on MovieLens test data and confirmed the high generalizing ability and accuracy of forecasting preferences.

Текст научной работы на тему «Прогнозирование в интеллектуальных системах-ассистентах на основе алгоритма поиска косяком рыб»

12. Mikheev M.A. Osnovy teploperedachi [Fundamentals of heat transfer]. 3rd ed. Moscow: Bastet, 2010, 342 p.

13. HamedBeirami, Ali ZargarShabestari, Mohammad Mahdi Zerafat. Optimal PID plus fuzzy controller design for a PEM fuel cell air feed system using the self-adaptive differential evolution algorithm, International journal of hydrogen energy, 10 August 2015, Vol. 40, Issue 30, pp. 9422-9434.

14. Sivaranjani P. and Senthilkumar A. Thermal-Aware Non-Slicing VLSI Floorplanning Using a Smart Decision-Making PSO-GA Based Hybrid Algorithm, Journal of Circuits, Systems, and Signal Processing, 2015, Vol. 34, pp. 3521-3542. Available at: http://dx.doi.org/10.1007/s00034-015-

0020-x.

15. Wang, L. Fast Algorithms for Thermal-Aware Floorplanning, Journal of Circuits, Systems, and Computers, 2014, Vol. 23. Article ID: 1450098. Available at: http://dx.doi.org/10.1142/ s0218126614500984.

16. Cadence, "Digital Implementation and Sign-off Flow," in Rapid Adoption Kits. [Online]. Available at: http://support.cadence.com/ (accessed 2019).

17. Tomas KH. Kormen, Charl'z I. Leyzerson, Ronald L. Rivest, Klifford Shtayn. Algoritmy: postroenieianaliz [Algorithms: construction analysis]. 3nd ed. Moscow: Vil'yams, 2014, 1328 p.

18. More Than Moore's-3D-IC Economics and Design Enablement, Cadence design systems, 2013. Available at: http://www.semi.org/en/sites/semi.org/files/docs/6SiP%20Global%20Summit% 203DIC%20Technology%20Forum%20_%20Brandon%20Wang.pdf (accessed 22 January 2019).

19. Ivanova Е.М. Sistemy proektirovaniya. Tendentsii mirovogo rynka SAPR SBIS [Design system. Trends in the global CAD market VLSI], Elektronika: Nauka, Tekhnologiya, Biznes [Electronics: Science, Technology, Business], 2006.

20. Kovalev A.V. Tekhnologii energosberezheniya v mikroelektronnykh ustroystvakh: monografiya [Energy-saving technologies in microelectronic devices: monography]. Taganrog: Izd-vo TTI YuFU, 2009, 100 p.

Статью рекомендовал к опубликованию д.т.н., профессор Н.И. Витиска.

Курейчик Виктор Михайлович - Южный федеральный университет; e-mail: kur@tgn.sfedu.ru;

347928, г. Таганрог, пер. Некрасовский, 44; тел.: 88634311487; кафедра систем автоматизированного проектирования; д.т.н.; профессор.

Данильченко Владислав Иванович - e-mail: danil4enko.vladislaw@yandex.ru; тел.:

89526088561; кафедра систем автоматизированного проектирования; аспирант.

Kureichik Viktor Mikhailovich - Southern Federal University; e-mail: kur@tgn.sfedu.ru;

44, Nekrasovsky, Taganrog, 347928, Russia; phone: +78634311487; the department of computer-

aided design; dr. of eng. sc.; professor.

Danilchenko Vladislav Ivanovich - e-mail: danil4enko.vladislaw@yandex.ru; phone: +79526088561;

the department of computer-aided design; postgraduate.

УДК 004.822 DOI 10.23683/2311-3103-2019-2-34-47

В.В. Бова, Э.В. Кулиев, С.И. Родзин

ПРОГНОЗИРОВАНИЕ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ-АССИСТЕНТАХ НА ОСНОВЕ АЛГОРИТМА ПОИСКА КОСЯКОМ РЫБ*

Работа связана с решением проблемы персонализации ресурсов Интернет для повышения эффективности организации и сопровождения психологически-безопасного поведения пользователей в интернет-пространстве. Особую актуальность данная проблема приобретает для сферы интернет-обучения в условиях непрерывного роста числа образо-

* Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-29-22019.

вательных Интернет-ресурсов и сервисов, развития контента, несущего виктимное воздействие на морально-нравственные аспекты личности обучающегося. Среди наиболее перспективных подходов к ее решению в настоящее время выделяется подход, который базируется на прогнозировании предпочтений пользователей для формирования контента, соответствующего их интересам и ожиданиям. С целью эффективного извлечения и обработки данных, а также выявления закономерностей, позволяющих сделать выводы (прогнозы) о конкретных предпочтениях пользователей применяются методы интеллектуального анализа данных и машинного обучения. В статье предложен метод прогнозирования предпочтений субъекта обучения в интеллектуальных системах-ассистентах для генерации рекомендаций и персонализации образовательного контента и услуг. Принципиальным отличием предложенного метода является переход от персональных рекомендаций к групповым на основе методов коллаборативной фильтрации пользователей со схожими предпочтениями. Для формирования рекомендаций разработана модель оценки предпочтений, основанная на совместном использовании методов Item-Item CF и User-User CF, что позволит решить проблему «холодного старта» и повысить качество рекомендаций для пользователей со схожими интересами и характеристиками поведения. Оценка прогнозирования связана с большой размерностью параметров модели обучения. Для снижения размерности пространства поиска предпочтений из неявных данных большого объема об активности пользователя и повышения точности прогноза разработан биоинспирированный алгоритм поиска косяком рыб, отличающийся масштабируемостью и способностью обрабатывать разреженные данные. Экспериментальные исследования эффективности работы алгоритма были проведены на тестовых данных MovieLens и подтвердили высокую обобщающую способность и точность прогноза предпочтений.

Персонализация образовательного контента; коллаборативная фильтрация; вик-тимность; прогнозирование предпочтений; интеллектуальные системы-ассистенты; био-инспирированные методы; алгоритм поиска косяком рыб.

V.V. Bova, E.V. Kuliev, S.I. Rodzin

PREDICTION IN INTELLECTUAL ASSISTANT SYSTEMS BASED ON FISH SCHOOL SEARCH ALGORITHM

The work is related to solving the problem of personalizing Internet resources in order to increase the efficiency of organization and maintenance of psychologically safe user behavior in the Internet space. This problem is ofparticular relevance for the field of online education in the context of the continuous growth of the number of educational Internet resources and services, the development of content, which has a victimic effect on the moral and ethical aspects of the student's personality. Among the most promising approaches to its solution, currently stands out an approach that is based on predicting user preferences for generating content that meets their interests and expectations. In order to efficiently extract and process data, as well as to identify patterns that allow conclusions (predictions) to be made about specific user preferences, data mining and machine learning methods are used. The article proposes a method for predicting the preferences of the subject of training in intelligent assistant systems for generating recommendations and personalizing educational content and services. The principal difference of the proposed method is the transition from personal recommendations to group based on methods of collaborative filtering of users with similar preferences. To formulate recommendations, a preference evaluation model has been developed, based on the combined use of Item-Item CF and User-User CF methods, which will solve the cold start problem and improve the quality of recommendations for users with similar interests and behavior characteristics. Evaluation of forecasting is associated with a large dimension of the parameters of the learning model. To reduce the dimension of the search space preferences from a large amount of implicit data about user activity and improve the accuracy of the forecast, a bioinspired fish school search algorithm has been developed that is distinguished by scalability and the ability to process sparse data. Experimental studies of the efficiency of the algorithm were carried out on MovieLens test data and confirmed the high generalizing ability and accuracy of forecasting preferences.

Personalization of educational content; collaborative filtering; victimization; prediction of preferences; intelligent assistant systems; bioinspired methods; fish school search algorithm.

Введение. Современные Интернет-технологии прочно вошли в повседневную жизнь каждого активного человека, претендуя на первое по значимости место в ряду способов решения образовательных, профессиональных, социальных и коммуникативных проблем [1]. Интернет-пространство на сегодняшний день является неограниченным ресурсом для саморазвития и распространителем знаний [2-4], что подтверждается непрерывным ростом числа образовательных Интернет-ресурсов и услуг. Однако, ресурсы Интернет при положительном влиянии на самообразование могут отрицательно влиять на морально-нравственные аспекты личности. Актуальное значение в данных условиях приобретает проблема возникновения рисков вик-тимного влияния ресурсов Интернет на поведение обучающегося. Виктимность воздействий на личность обучаемого связана с информационной насыщенностью Интернет-пространства разнообразным содержанием, развитием контента сомнительного качества и отсутствием сценария информального поведения субъекта обучения, основанного на его информационных потребностях [5].

Поэтому актуальной задачей, связанной с решением проблемы повышения эффективности организации и сопровождения деятельности обучающегося в информационно-образовательной Интернет-среде (ИОИС) является адаптация Интернет-ресурсов к потребностям пользователя, включая когнитивные, психологические, профессиональные и образовательные предпочтения [1, 3-5].

В связи с этим в фокусе междисциплинарных научных исследований находятся проблемы моделирования сценариев интернет-поведения пользователей в социально значимых целях формирования культуры безопасного поведения в Интернет-сервисах, учета факторов эмоционального и психологического состояния пользователя в момент использования Интернет-контента [2, 4-7]. Возможным решением перечисленных проблем для организации и сопровождения эффективной деятельности субъекта обучения в Интернет-пространстве является персона-лизация контента, позволяющая увеличить релевантность отбора объектов изучения в соответствии с индивидуальными особенностями, интересами и предпочте-ними пользователей ИОИС. При работе с большими объемами данных о пользовательской активности в интеллектуальных системах-ассистентах возникают проблемы алгоритмического характера, связанные с обеспечением точности, устойчивости и вычислительной эффективности процессов их обработки и интерпретации. Анализ состояния исследований и разработок по сформулированным проблемам [7-10] показывает, что существующие методы и алгоритмы обработки больших данных не отвечают ожиданиям и потребностям специалистов в этой области, что актуализирет задачу разработки новых методов и моделей автоматизации этих процессов. Авторами в работе предлагается метод прогнозирования предпочтений субъекта обучения с целью выработки рекомендаций построения и использования поведенческого профиля пользователя для рекомендательных систем-ассистентов, персонифицирующих образовательную деятельность в ИОИС.

1. Проблематика и методы исследования. В контексте проблемы персонализации образовательного контента на основе прогнозирования и выявления предпочтений и групп схожих Интернет-ресурсов встает задача обработки большого количества данных о субъектах Интернет-обучения и анализа определенных закономерностей, позволяющих сделать выводы о конкретных предпочтениях пользователей [2, 11].

Основным источником информации о пользовательских предпочтениях являются данные об активности пользователей при посещении конкретного Интернет-ресурса. Эти данные собираются в основном неявным образом (протоколирование действий пользователей) и обладают следующими основными свойствами: значительный объем, разнородность и быстрое изменение (или

обновление) данных во времени [7, 11]. Адаптация под знаниевые требования конкретного пользователя - сложноформализуемая задача, т.к. для ее решения необходимо принимать во внимание как присущие обучаемому неопределенность и спонтанность поведения в рамках конкретного Интернет-ресурса, так и множество неопределенностей, связанных с особенностями функционирования информационно-образовательной Интернет-среды.

Таким образом, основной целью обработки данных о пользовательской активности является извлечение полезной информации для формирования персонального информационного предложения максимально соответствующего ожиданиям, в том числе и неявным для сопровождения безопасной информационно-образовательной деятельности в Интернет-пространстве. Для достижения поставленной цели должны быть решены следующие задачи [7, 12]:

♦ объединение однородных по множеству признаков Интернет-ресурсов в классы объектов образовательной траектории.

♦ группирование пользователей с близкими интересами и характеристиками поведения в ИОС.

♦ формирование устойчивых поведенческих профилей пользователей на основе интегрированного представления всей совокупности явных и неявных данных о пользовательской активности.

Задача построения рекомендательных систем во многом объединяет в себе черты всех вышеперечисленных задач. Как было ранее отмечено, в таких системах обучающая информация о пользователе извлекается из всех доступных источников: Для их анализа привлекается дополнительная информация, объёмы которой во много раз превосходят априорный объём данных о пользователе. Такие данные являются гетерогенными, могут обладать разной степенью достоверности, т.е. быть неполными [9-11]. Для их обработки применяются методы интеллектуального анализа данных и машинного обучения [6-8, 12-14]. В большинстве современных рекомендательных систем используются следующие базовые подходы: коллаборативная фильтрация (collaborative filtering, CF) и контентная фильтрация (content-based filtering, CbF) [11, 15]. Метод контентной фильтрации фокусируется на выявлении объектов со схожими характеристиками по отношению к тем объектам, которые уже заинтересовали пользователя. В данном случае учитывается модель поведения пользователя и характеристики заинтересовавших его объектов. Для генерации рекомендаций выявляются объекты с семантически близким контентом [6, 9].

Методы коллаборативной фильтрации накапливают данные о предпочтениях пользователей с помощью явных и неявных методов оценки пользователей с похожим поведением. Методы коллаборативной фильтрации можно разделить на два класса: анамнестические (memory-based) и модельные (model-based) [13, 15]. Анамнестические алгоритмы сравнивают поведение текущего пользователя со всеми остальными, о которых есть данные, чтобы определить множество наиболее похожих на него пользователей. Модельные алгоритмы используют разделение пользователей на группы, основываясь на их поведении. Для составления рекомендаций определяется наиболее близкая пользователю группа.

На рис. 1 представлен обобщенный механизм генерации рекомендаций, базирующийся на автоматическом сотрудничестве множества пользователей и на выделении (методом фильтрации) тех пользователей, которые демонстрируют схожие предпочтения или паттерны поведения [15].

В контексте задачи исследования авторами рассматриваются методы:

♦ коллаборативная фильтрация на основе анализа предпочтений групп пользователей с близкими интересами (User-User Collaborative Filtering, User-User CF);

♦ коллаборативная фильтрация на основе анализа взаимосвязей между объектами Интернет-ресурсов (Item-Item Collaborative Filtering, Item-Item CF).

Рис. 2. Процедура формирования рекомендаций по предпочтениям пользователей

Для поиска рекомендаций конкретному пользователю на основании его поведенческого профиля и выявления групп объектов (Интернет-ресурсов) со схожими характеристиками авторами предлагается метод повышения эффективности персонализации Интернет-контента, основанный на модели (model based) и интеграции методов Item-Item CF и User-User CF для формирования персонального информационного предложения. Такой подход позволит для новых пользователей или пользователей с нерепрезентативной историей поведения генерировать рекомендации, базируясь на данных о подобии информационных единиц (метод Item-Item CF). Таким образом, решается проблема «холодного старта» и повышается качество рекомендаций для малоактивных пользователей, а также пользователей со слабо выраженными предпочтениями [9]. В результате агрегирования данных о пользовательских предпочтениях и формирования его поведенческого профиля предпочтение отдается оценкам, найденным с использованием метода User-User CF, исходя из гипотезы, что при наличии качественных поведенческих профилей пользователей данный метод позволяет более точно предсказывать их предпочтения.

Для решения задачи снижения размерности пространства поиска предпочтений из неявных данных большого объема об активности пользователя и нахождения лучшей рекомендации предлагается использовать метаэвристику «поиск косяка рыб», относящуюся к биоинспирированным методам глобальной оптимизации [16-18]. Метаэвристические методы, имитирующие процессы протекающие в природной среде и основанные на поведении некоторых видов животных и растений, становятся все более популярными для задач оптимизации, для которых нахождение решений с помощью классических численных методов поиска является неэффективным или невозможным [14, 16]. Авторами предлагается биоинспирирова-ный алгоритм поиска косяком рыб, отличающийся масштабируемостью и способностью обрабатывать разреженные данные.

2. Постановка задачи. Одним из способов решения задачи прогнозирования является переход от персональных рекомендаций к групповым на основе методов коллаборативной фильтрации пользователей со схожими предпочтениями [15].

Исходные данные для этой задачи могут быть представлены следующим образом: пусть задано I = {i1, i2, • ••, im} - множество объектов (Интернет-ресурсов), U = {иь u2, ..., un} множество всех пользователей, а ua - текущий пользователь, для которого составляются рекомендации. R = {(и, i)\u 6 U, i 6 I, rUi - известна} I -множество пар пользователей и объектов, для которых известна оценка предпоч-

тения. Тогда {(иь /ь r\), ..., (uk, ik, rk)} - матрица активности с информацией о поведении пользователей. Каждая запись ((ui, ti, ri)) означает, что оценка, поставленная пользователем ut доле материалов ti, равняется ri.

Требуется по обучающему набору {R, (ги¡|(и, i) Е R} построить модель r(u,i), предсказывающую оценку предпочтения для произвольной пары (и, i) Е U х I. Для повышения точности прогноза предпочтений разработать эвристический алгоритм обучения индивидуального и коллективного классификаторов (предикторов) композиции моделей прогнозирования, обладающего высокой обобщающей способностью и точностью предсказаний.

3. Описание метода прогнозирования предпочтений. Предварительным этапом обработки данных о пользовательской активности является совместная фильтрация множества предпочтений на основе методов Item-Item CF и User-User CF (рис. 2).

Рис. 2. Схема метода прогнозирования предпочтений

Для оценки степени близости пользователей в контексте их предпочтений и построения поведенческих профилей производится взвешивание оценки предпочтения и вычисление расстояний между элементами матрицы активности пользователей УяЦЛ, Те Я"™, ие Я"*, 1е Я™*. На рис. 3 представлена разреженная матрица Я"™, где каждый элемент {ги^ - вектора скрытых (латентных) предпочтений пользователей ие Я* и ¡]- е Я* объектов Интернет-ресурсов соответственно, ё - размерность пространства признаков предпочтений пользователей пи и рейтинга объектов т.

" //////

Г

V

1

1

ь + i сс

users users

У

Рис. 3. Матрица факторизации предпочтений пользователей

R

Для минимизации функции потерь при построении матрицы активности и определения прогноза оценки предпочтения используется среднеквадратичная ошибка обучения - Root Mean Square Error (RSME) [15].

RSME = ^Yj^W—Uji)4 (2)

где rui и ru i - прогнозируемые и наблюдаемые оценки предпочтений пользователей u и элементов i соответственно. Тогда прогнозируемое значение рассчитывается по следующему выражению rUj = u Jij и rUj = (ui, ij).

Y(Ui, ij)= minUjj Y.(uji)es(ruji - Vi) 2. (3)

Оценка прогнозирования связана с большой размерностью параметров модели обучения и имеет (nu+mi)^d свободных параметров, которые должны быть определенным образом ограничены [9]. Для минимизации ошибки обучения введем параметр регуляризации X.

112

Y(u„ ij)= minuiY (ij) eR (ru,i - ru,i) 2 + К I I и I I 2 + I I ij | I ). (4)

Далее для повышения эффективности прогноза предпочтений применим параметр взвешивания [13] на основе вычисления веса (степени доверия).

СО ij = 1+ 7 | ru i-ru j i I , (5)

где 7 - коэффициент сглаживания. Для нахождения оптимальных значений элементов матрицы Y(U, I), необходимо решить следующую оптимизационную задачу f(x) = min Y (ui, ij):

min U£ R nkj£ R mkY (ij) e RC ij (ru ji Tu j i) 2 + * ( 1 1 Ui 1 1 2 + | | ij | | ). (6)

Обучение классификатора (предиктора) как модели прогнозирования предпочтения будем проводить с учетом регуляризации [11]. За оценку качества модели примем RSME классификатора.

Рассмотрим итерационный процесс коллективного обучения модели прогнозирования оценки предпочтения. Введём обозначения параметров для обучения моделей:

♦ ruY и Ti j прогнозируемые индивидуальным и коллективным предикторами, построенные на k-м шаге, оценки предпочтений пользователя ueU к объекту (Интернет-ресурсу) ieI;

♦ и - модели индивидуального и коллективного предикторов объекта Tu ,

(u, i)eR в перевзвешенной на k-й итерации построения r (к) на обучающей

выборке.

Соотношение между коллективным и индивидуальными предикторами определим как:

r ( к ) = 1 Y к уГ ( г) (7)

rUj i = Y ' = irju, i, (7)

где T= {t1,t2,... ,tk} и L= {¡¡,¡2,... ,4} - множества моделей коллективных и индивидуальных предикторов соответственно, у - вес индивидуального предиктора в коллективе.

На первом шаге строится модель на обучающих данных. Первый классификатор обучается на всех обучающих данных с равными весами. На каждой последующей итерации веса расставляются соответственно классифицированным данным в зависимости от их точности, т.е. веса правильно классифицированных данных уменьшаются, а неправильно классифицированных - увеличиваются. Таким образом, на k-м шаге происходит процесс перевзвешивания выборки, веса вычисляются по результатам полученных ошибок коллективного предиктора, построен-

ного на предыдущем, (k-1)-м шаге. Затем обучается индивидуальный предиктор на перевзвешенной выборке. Далее выбирается вес для нового построенного индивидуального предиктора, с которым он будет учитываться в коллективном предикторе. В качестве оценки точности прогноза выбрана среднеквадратичная ошибка обучения коллективной модели оценки предпочтения:

RSME = £ UjieR| i-rUi¿) 2 I —minf (8)

4. Биоинспирированный алгоритм поиска косяком рыб. Оптимизацию параметров модели предлагается производить с помощью метаэвристического алгоритма поиска косяком рыб (Fish School Search - FSS) [17-20]. В FSS каждая особь является реактивным агентом, обладающим собственной памятью, где хранится информация о его весе и лучшем положении (текущий вектор решений) в поисковом пространстве (области допустимых решений). Эта особенность алгоритма позволяет отказаться от необходимости отыскивать и фиксировать глобально лучшие решения. Разработанный алгоритм FSS соответствует следующим правилам [17-19]:

♦ этапами алгоритма являются операторы кормления и плавания, применяемые ко всей популяции;

♦ процесс кормления в алгоритме является аналогичным процессу оценки решений в оптимизации f(x). Вес рыбы < рассчитывается как разница между значением целевой функции (ЦФ) на текущем и предыдущем шаге и формализует ее индивидуальный успех в поиске решения. Алгоритм предусматривает, что у отдельной рыбы вес ограничивается свободным параметром amax и оценивается один раз в каждом цикле алгоритма;

♦ этап плавания представляет процесс миграции агентов с шагом y(t) -взвешенной суммы индивидуальных перемещений и направлен на подражание коллективному движению рыб в агрегации. Процесс плавания управляется кормлением и состоит из последовательных процессов индивидуального, коллективно-инстинктивного и коллективно-волевого движения.

Структурная схема алгоритма FSS представлена на рис. 4. Количество поисковых агентов (rui) N и их позиции x, (и, i) Е U х I задаются случайным образом при построении матрицы факторизации Y&UI. Начальное значение веса агента < задается согласно (5). Соседняя позиция n рассчитывается с учетом вероятности распределения рна интервале [-1,1] как:

n,(t) = x,(t) + р *S,nd(t). (9)

Индивидуальное плавание порождает новую позицию для дальнейшего исследования. Вычисление шага миграции производится согласно:

Sind(t+1) = Smd(t) - (Si - Sf) / tmax, (10)

где Sind - шаг перемещения, величина равномерно распределенная в интервале [S,= 0; Sf], Sf=tmax максимальному номеру итерации алгоритма,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оператор кормления обновляет вес агента < на каждой итерации. Изменение веса рассчитывается на основе значения пригодности с учетом изменений значений ЦФ текущей и соседней позиций Af(t) согласно:

f) = fnm - f тя (ii)

Расчет веса в новом положении происходит в соответствии с:

<а1(.t+1) = C0i(t) + Aß(t) / max[Sf(tJ\. (12)

С точки зрения задачи оптимизации на этом этапе проверяется, находится ли точка в области допустимых значений, а также проверяется, лучше ли значение ЦФ в этой точке [20]. Коллективно-инстинктивное плавание реализуется после завершения всеми агентами индивидуальных перемещений. Смещение движения определяет следующее уравнение:

= Yt гАх j ( t) А/ j ( t)

П) Yt А j ( t) ,

(13)

где Ах(.)= п$) - х$) - индивидуальное движение рыбы в течение итерации. Уравнение показывает, что шаг миграции максимально зависит от влияния наиболее эффективных агентов в косяке, имеющих успешные индивидуальные перемещения. После выполнения миграции позиции косяка обновляются согласно х$+1)= х()+ уф.

Начало

Построение матрицы факторизации предпочтений

I

Ввод свободных параметров алгоритма

У

Инициализация начальной популяции агентов, размерностью N

Генерация начальных характеристик положения агентов х,

Вычисление соседней позиции агента, п,

Индивидуальное движение

Выполнение кормления, обновление веса рыбы w ,

Вычисление шага миграции рыб в косяке,уСО

Изменение расположения агентов А х, в косяке

I

Вычисление центра тяжести косяка, Б1

Расчет параметров расположения агентов х, в косяке

I

Обновление ЦФ

Оценка приспособленности, вычисление ЦФ

Коллективно-инстинктивное движение

Вычисление RSME

Применение положения с заданной вероятностью р

т

1 /

Изменение направления движения агентов в косяке с шагом Коллективно-

волевое движение

!

Выбор решения с лучшим значением ЦФ

I

Вывод значений RSME

I

Конец

Рис. 4. Структурная схема алгоритма ЕББ

Далее для корректировки позиций рыб выполняется коллективно-волевое плавание. На этом этапе происходит смещение всех агентов в направлении B(t) - текущего центра тяжести популяции. Если стая рыб набирает вес (что означает успех поиска), то все агенты популяции смещаются в B(t) всей агрегации, а если теряет вес, то от него [18].

рм Xf= (t) о (t)

B(t)—ШОёГ- (14)

Коллективно-волевое движение выполняется по правилу:

x(t+1) = Xi(t) ± Vvol rand[0,1]*(xi(t) - B(t)). (15)

где Vv0 определяет размер шага перемещений агентов и является случайной величиной.

Как только будут проанализированы все агенты, вычисляется значение RSME и к каждому из агентов применяется новое вычислительной положение с заданной вероятностью и расчет ЦФ Условием окончания работы алгоритма является свободный параметр количества итераций t.

Исследование эффективности работы алгоритма FSS было проведено на примере задачи оптимизации поиска оценки предпочтений, в качестве критериев эффективности были выбраны скорость и точность работы алгоритма.

5. Экспериментальные исследования. Для проведения экспериментов были взяты реальные данные из тестового набора MovieLens 100 k. Данные содержат 100000 оценок от 1000 пользователей на 1700 Интернет-ресурсов. Данный набор отобран так, что каждый пользователь оценил не менее 20 объектов. Оценки градуируются шкалой от 0.5 до 5 с шагом 0.5. Исходная выборка была разбита на 5 равных частей, из чего было составлено 5 пар выборок для обучения и тестирования (в пропорции 80 % к 20 %).

Для оценки качества разработанного алгоритма FSS сравнение проводилось с Alternating Least Squares (ALS) и Stochastic Gradient Descent (SGD) алгоритмами [9, 15] на скользящем контроле на данных разбиениях по внешним параметрам модели обучения, представленным в табл. 1. Внутренние параметры алгоритмов оценивались на обучающих выборках, точность итоговой модели обучения различными алгоритмами на валидационной.

Таблица 1

Внешние параметры, используемые для оценки точности RSME

^ 1 е м а с Lambda Латентные факторы

о 2 о 3 о 4 о 5 о 6 о го 8 о 9 о О о (N «ч (N © d «4 m © 4 «4 4 ©

& & Па о о о о о о о о о

SGD 10.25 1.15 1.08 1.06 1.03 1.02 ТОТ 0.95 0.93 0.92 0.91 0.91 OS © 0.89 0.88 0.91 0.95 0.96

S J 3 m 5 00 о 4 о 2 о о 8 ON 4 00 6 г- 9 00 г-00 г-00 4 00 8 г- 6 00 00 2 00

< ^ ^ ^ .0 .0 .0 .0 .0 .0 .0 .0 .0 © .0 .0

S т 2 \о г- OS 8 3 2 9 m 5 \о 3 6 CO f-<N <N 5

F .0 .0 .0 .0 .0 .0 .0 .0 .0 .0 .0 .0 © .0 .0 .0 © .0

Результаты экспериментов показаны на рис. 5, 6. Производительность алгоритма FSS при увеличении свободных параметров - латентных факторов и Lambda показывает более низкие значения ошибки обучения в сравнении с алгоритмами SGD и ALS. Увеличение параметра Lambda помогает лучше подстроить модель обучения под скрытые данные и повысить обобщающую способность алгоритма FSS.

Значения параметра регуляризации, Л

Рис. 5. Производительность по параметрам зависимости RMSE от Lambda

-5С0 -ALS -fSS

15 20 25 ЗО 40 45 SO

Количество латентных факторов, m

Рис. 6. Производительность по параметрам зависимости RMSE от количества

латентных факторов

Из диаграммы на рис. 7 видно, что значение RSME практически не меняется при увеличении числа итераций всеми алгоритмами. Тем не менее, мы замечаем, что значение RMSE остается лучшим для FSS и уменьшается при увеличении количества итераций. Время выполнения эвристического алгоритма FSS больше чем у ALS, но снижается с увеличением числа итераций (рис. 8).

10 is го г? зо

Количество итераций, t

Рис. 7. График зависимости RSME от количества итераций алгоритма

0,6

ас ' ■ .1

си

и

tu <i m

.III II II II

Il I I I

'5CO I ALS

ÎSS

LÛ 15 20 гъ

Количество итераций, t

30

Рис. 8. График зависимости времени работы алгоритмов от количества

итераций

Заключение. В работе представлен метод прогнозирования предпочтений для задачи персонализации контента обучения в Интернет-пространстве, позволяющий увеличить релевантность отбора объектов изучения в соответствии с индивидуальными особенностями, интересами и предпочтениями пользователей ИОС. Отличительная особенность которого состоит в идее комбинированного использования методов Item-Item CF и User-User CF, что позволяет решить проблему «холодного старта» и повысить качество рекомендаций для малоактивных пользователей, а также пользователей со слабо выраженными предпочтениями. Для повышения точности прогноза предпочтений разработан метаэвристический алгоритм FSS обучения индивидуального и коллективного предикторов композиции моделей прогнозирования. Экспериментальные исследования работы алгоритма подтвердили высокую обобщающую способностью и точность предсказаний.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Писаренко В.И. Системный подход в педагогике // Информатика, вычислительная техника и инженерное образование. - 2017. - № 2 (30). - С. 1-10.

2. Tingting Z., Chen L.Y., Liang-Hsien T. Understanding user motivation for evaluating online content: a self-determination theory perspective // Behaviour and Information Technology. - 2015. - No. 34. - P. 479-491.

3. Wilson P.M., Mack D.E., Grattan K.P. Understanding motivation for exercise: A self-determination theory perspective // Canadian Psychology. - 2008. - No. 49. - P. 250-256.

4. Lin H.F. Examining of cognitive absorption influencing the intention to use a virtual community // Behaviour and Information Technology. - 2009. - No. 28 (5). - P. 421-431.

5. Войскунский А., Евдокименко А., Федунина Н. Сетевая и реальная идентичность: сравнительное исследование // Психология. Журнал Вышей школы экономики. - 2013. - Т. 10, № 2. - P. 98-121.

6. Родзин С.И., Родзина Л.С. M-learning - управление контентом в контекстно-зависимой мобильной системе обучения // Информатика, вычислительная техника и инженерное образование. - 2014. - № 1 (16). - С. 53-61.

7. Кравченко Ю.А. Задачи семантического поиска, классификации, структуризации и интеграции информации в контексте проблем управления знаниями // Известия ЮФУ. Технические науки. - 2016. - № 7 (180). - С. 5-18.

8. Курейчик В.М., Картиев С.Б. Выбор алгоритма прогнозирования для разработки аналитического программного обеспечения // Инженерный вестник Дона. - 2017. - № 4 (47). - С. 128.

9. Guo G., Zhang J., Thalmann D. Merging trust in collaborative filtering to alleviate data sparsity and cold start // Knowledge-Based Systems. - 2014. - No. 57. - P. 57-68.

10. Kartiev S.B., Kureychick V.M. Algorithm for building recommendations for intelligent systems // Advances in Intelligent Systems and Computing. - 2018. - Vol. 680. - P. 76-83.

11. Su Z., Yan J., Ling., Che H. Research on personalized recommendation algorithm based on ontological user interest model // Journal of Computational Information Systems. - 2012.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- No. 8 (1). - P. 169-181.

12. Кулиев Э.В., Лежебоков А.А., Лещанов Д.В., Шкаленко Б.И. Механизмы роевого интеллекта и эволюционной адаптации на основе виртуального набора популяций для решения задач управления проблемно-ориентированными знаниями // Информатика, вычислительная техника и инженерное образование. - 2017. - № 1 (29). - С. 34-45.

13. Wedyan S. Review and Comparison of Associative Classification Data Mining Approaches // International Journal of Computer, Information, Systems and Control Engineering. - 2014.

- No. 8. - P. 34-45.

14. Логинов О.А., Лежебоков А.А., Бова В.В., Щеглов С.Н. Интеллектуальный анализ данных на основе биоинспирированного подхода // Информатизация и связь. - 2018. - № 4.

- С. 67-70.

15. Pan W., Ming Z. Collaborative Recommendation with Multiclass Preference Context // IEEE Intelligent Systems. - 2016. - No. 32 (2). - P. 45-51.

16. Курейчик В.М., Каланчук С.А. Обзор и состояние проблемы роевых методов оптимизации // Информатика, вычислительная техника и инженерное образование. - 2016.

- № 1 (25). - С. 1-13.

17. Monteiro R. P., Vergosa L. F. V., Bastos-Filho C. J. A. Improving the Performance of the Fish School Search Algorithm // International Journal of Swarm Intelligence Research (IJSIR).

- 2018. - № 9 (4). - P. 21-46.

18. Bastos-Filho C.J.A., Lima-Neto F.B., Lins Sousa M.F.C., Pontes M.R. On the influence of the swimming operators in the fish school search algorithm // IEEE International Conference on Systems Man and Cybernetics. - 2009. - P. 5012-5017.

19. Lima Neto F.B.D., Lacerda M.G. Weight based fish school search // IEEE International Conference Systems, Man and Cybernetics (SMC). - 2014. - P. 270-277.

20. Частикова В.А., Дружинина М.А., Кекало А.С. Исследование эффективности алгоритма поиска косяком рыб в задаче глобальной оптимизации // Современные проблемы науки и образования. - 2014. - № 4. - URL: http://science-education.ru/ru/article/view?id=14142 (дата обращения: 04.06.2019).

REFERENCES

1. Pisarenko V.I. Cistemnyy podkhod v pedagogike [System approach in pedagogy], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Computer science, computer engineering and engineering education], 2017, No. 2 (30), pp. 1-10.

2. Tingting Z., Chen L.Y., Liang-Hsien T. Understanding user motivation for evaluating online content: a self-determination theory perspective, Behaviour and Information Technology,

2015, No. 34, pp. 479-491.

3. Wilson P.M., Mack D.E., Grattan K.P. Understanding motivation for exercise: A self-determination theory perspective, Canadian Psychology, 2008, No. 49, pp. 250-256.

4. Lin H.F. Examining of cognitive absorption influencing the intention to use a virtual community, Behaviour and Information Technology, 2009, No. 28 (5), pp. 421-431.

5. Voyskunskiy A., Evdokimenko A., Fedunina N. Setevaya i real'naya identichnost': sravnitel'noe issledovanie [Network and real identity: a comparative study], Psikhologiya. Zhurnal Vyshey shkoly ekonomiki [Psychology. Journal ofHigher school ofEconomics], 2013, Vol. 10, No. 2, pp. 98-121.

6. Rodzin S.I., Rodzina L.S. M-learning - upravlenie kontentom v kontekstno-zavisimoy mobil'noy sisteme obucheniya [M-learning - content management in context-dependent mobile learning system], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Computer science, computer engineering and engineering education], 2014, No. 1 (16), pp. 53-61.

7. Kravchenko Yu.A. Zadachi semanticheskogo poiska, klassifikatsii, strukturizatsii i integratsii informatsii v kontekste problem upravleniya znaniyami [Problems of semantic search, classification, structuring and integration of information in the context of knowledge management problems], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences],

2016, No. 7 (180), pp. 5-18.

8. Kureychik V.M., Kartiev S.B. Vybor algoritma prognozirovaniya dlya razrabotki analiticheskogo programmnogo obespecheniya [The choice of forecasting algorithm for the development of analytical software], Inzhenernyy vestnik Dona [Don's engineering Bulletin],

2017, No. 4 (47), pp. 128.

9. Guo G., Zhang J., Thalmann D. Merging trust in collaborative filtering to alleviate data sparsity and cold start, Knowledge-Based Systems, 2014, No. 57, pp. 57-68.

10. Kartiev S.B., Kureychick V.M. Algorithm for building recommendations for intelligent systems, Advances in Intelligent Systems and Computing, 2018, Vol. 680, pp. 76-83.

11. Su Z., Yan J., Ling., Che H. Research on personalized recommendation algorithm based on ontolog-ical user interest model, Journal of Computational Information Systems, 2012, No. 8 (1), pp. 169-181.

12. Kuliev E.V., Lezhebokov A.A., Leshchanov D.V., Shkalenko B.I. Mekhanizmy roevogo intellekta i evolyutsionnoy adaptatsii na osnove virtual'nogo nabora populyatsiy dlya resheniya zadach upravleniya problemno-orientirovannymi znaniyami [Mechanisms of swarm intelligence and evolutionary adaptation based on a virtual set of populations for problem-oriented knowledge management], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Computer science, computer engineering and engineering education], 2017, No. 1 (29), pp. 34-45.

13. Wedyan S. Review and Comparison of Associative Classification Data Mining Approaches, International Journal of Computer, Information, Systems and Control Engineering, 2014, No. 8, pp. 34-45.

14. Loginov O.A., Lezhebokov A.A., Bova V.V., Shcheglov S.N. Intellektual'nyy analiz dannykh na osnove bioinspirirovannogo podkhoda [Data mining based on bioinspired approach], Informatizatsiya i svyaz' [Informatization and communication], 2018, No. 4, pp. 67-70.

15. Pan W., Ming Z. Collaborative Recommendation with Multiclass Preference Context, IEEE Intelligent Systems, 2016, No. 32 (2), pp. 45-51.

16. Kureychik V.M., Kalanchuk S.A. Obzor i sostoyanie problemy roevykh metodov optimizatsii [Review and state of the problem of optimization swarm methods], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Computer science, computer engineering and engineering education], 2016, No. 1 (25), pp. 1-13.

17. Monteiro R. P., Vergosa L. F. V., Bastos-Filho C. J. A. Improving the Performance of the Fish School Search Algorithm, International Journal of Swarm Intelligence Research (IJSIR), 2018, No. 9 (4), pp. 21-46.

18. Bastos-Filho C.J.A., Lima-Neto F.B., Lins Sousa M.F.C., Pontes M.R. On the influence of the swimming operators in the fish school search algorithm, IEEE International Conference on Systems Man and Cybernetics, 2009, pp. 5012-5017.

19. Lima Neto F.B.D., Lacerda M.G. Weight based fish school search, IEEE International Conference Systems, Man and Cybernetics (SMC), 2014, pp. 270-277.

20. Chastikova V.A., Druzhinina M.A., Kekalo A.S. Issledovanie effektivnosti algoritma poiska kosyakom ryb v zadache global'noy optimizatsii [Research of efficiency of algorithm of search of shoals of fishes in a problem of global optimization], Sovremennye problemy nauki i obrazovaniya [Modern problems of science and education], 2014, No. 4. Available at: http://science-education.ru/ru/article/view?id=14142 (accessed 04 June 2019).

Статью рекомендовал к опубликованию д.т.н., профессор Ю.А. Гатчин.

Бова Виктория Викторовна - Южный федеральный университет; e-mail: vvbova@yandex.ru; 347928, г. Таганрог, Некрасовский, 44; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Кулиев Эльмар Валерьевич - e-mail: elmar_2005@mail.ru; кафедра систем автоматизированного проектирования; доцент.

Родзин Сергей Иванович - e-mail: srodzin@sfedu.ru; тел.: 88634371673; кафедра МОП ЭВМ; профессор.

Bova Victoria Victorovna - Southern Federal University; e-mail: vvbova@yandex.ru; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer aided design; associate professor.

Kuliev Elmar Valerevich - e-mail: elmar_2005@mail.ru; the department of computer aided design; associate professor.

Rodzin Sergey Ivanovich - e-mail: srodzin@sfedu.ru; phone: +78634371673; the department of software engineering; professor.

i Надоели баннеры? Вы всегда можете отключить рекламу.