УДК 519.816 Вестник СПбГУ. Прикладная математика. Информатика... 2024. Т. 20. Вып. 2
МБС 91В06
Схема обратной связи в контексте аксиоматического подхода к сужению множества Парето
А. В. Сачков
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9
Для цитирования: Сачков А. В. Схема обратной связи в контексте аксиоматического подхода к сужению множества Парето // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2024. Т. 20. Вып. 2. С. 281-288. https://doi.org/10.21638/spbu10.2024.212
Предложена схема обратной связи для решения задач выбора в контексте аксиоматического подхода к сужению множества Парето. Приведены необходимые сведения об аксиоматическом подходе, изучен пример. Схема обратной связи раскрыта в контексте задачи о возможности заключения договора страхования. Рассмотрены возникающие в процессе построения схемы сопутствующие вопросы: о выделении критериев, об автоматическом сборе квантов на основе данных о действиях пользователя и др. Схема модифицирована, приведен алгоритм решения. Раскрыты направления дальнейших исследований.
Ключевые слова: выбор, множество Парето, обратная связь.
1. Введение. Статья фокусируется на применении аксиоматического подхода к сужению множества Парето в различных задачах. С выбором мы сталкиваемся постоянно, и задачи выбора решались с древних времен в самых разных контекстах. В настоящее время развитие вычислительной техники способствует автоматизации процесса нахождения решения во многих сценариях, рассматриваемый случай — не исключение. Данной тематике посвящено большое количество работ (см., например, [1, 2]). Часто при решении подобных задач предлагаемые варианты оцениваются согласно своим свойствам — критериям. Абстрактная природа объектов диктует необходимость их перевода в числовую форму для дальнейших с ними действий. Классический подход заключается в составлении так называемой взвешенной суммы критериев — каждому из них приписывается вес (число от 0 до 1, сумма весов равна 1), соответствующий важности критерия, значения критериев умножаются на веса и складываются. В зависимости от постановки задачи выбирается вариант с наибольшей или наименьшей суммой. Такой подход интуитивно понятен, но в то же время не опирается на строгий математический фундамент. Аксиоматический подход к сужению множества Парето предлагает один из вариантов строгого обоснования действий при решении задач выбора. На основе этой теории предлагается схема «обратной связи», позволяющая учитывать предпочтения клиента.
Подробное описание аксиоматического подхода к сужению множества Парето приводится в работе [3]. В ней последовательно рассмотрены не только базовые концепции, но и более продвинутые темы. Статья [4] содержит более краткое описание такого подхода.
Искусственный интеллект (ИИ) крайне широко распространен [5], используем его для оптимизации предлагаемой схемы в смысле выбора пары решений, наиболее сокращающей множество всех вариантов.
© Санкт-Петербургский государственный университет, 2024
2. Постановка задачи. Опишем основные элементы аксиоматического подхода в теории выбора. Подробности о нем содержатся в [3, 4].
Пусть существует множество решений (альтернатив, вариантов) X произвольной природы (автомобили, квартиры, мобильные телефоны, телевизоры и пр.). Необходимо сделать выбор из элементов X, т. е. подобрать лучшее в некотором смысле решение или множество решений.
Сравнивать решения будем с помощью численных оценок их качеств — критериев. В дальнейшем положим, что критерий — векторная функция
/ : X ^ М",
где п — количество выделенных параметров решения, каждому из которых отвечает вещественное число. По умолчанию критерии предполагается максимизировать, если же по смыслу требуется обратное, то соответствующий критерий берется с противоположным знаком.
Теперь введем отношение предпочтения Ух на X, являющееся воплощением преференций лица, принимающего решения (ЛПР). Таким образом, если для ЛПР решение Х1 € X предпочтительнее решения Х2 € X, то верно х\ Ух Х2.
С учетом вышесказанного сформулируем постановку задачи многокритериального выбора.
Задача 1. Построить О^) — множество выбираемых решений, когда есть тройка (X, /, Ух).
Здесь О(X) — решение задачи, содержащее альтернативы, выбранные на основе предпочтений ЛПР. Сложность работы непосредственно с элементами множества X заключается в произвольности их природы. Для борьбы с этим обстоятельством введем множество возможных векторов У = / (X), содержащее векторы значений критериев всех решений, и отношение предпочтения на У У у, удовлетворяющее соотношению
/(Х1) = У1 Уу У2 = /(Х2) ^ Х1 Ух Х2.
Введенные понятия дают возможность сформулировать задачу многокритериального выбора так.
Задача 2. Построить О (У), когда есть пара (У, Уу).
Рассмотрим аксиомы, лежащие в основе аксиоматического подхода к сужению множества Парето; они основаны на реальном поведении людей при решении задач выбора и накладывают ограничения на У у. При этом будем предполагать, что существует продолжение отношения У у с множества У на множество М". Их всего 4 [3]:
Аксиома 1. у1 У у у2 у2 € О (У).
Аксиома 2. Уу транзитивно.
Аксиома 3. У у согласовано с каждым из критериев /1,..., /п; это означает, что V», если у1 и у2 отличаются только в г-й компоненте, и у® > у®, тогда у1 У у у2.
Аксиома 4. У у линейно и однородно.
Понятие «элементарный квант информации об отношении предпочтения ЛПР» (или же просто «квант») лежит в основе аксиоматического подхода к сужению множества Парето и имеет смысл при выполнении вышеописанных аксиом. Приведем определение его упрощенной формы (в [3] содержится подробный вывод).
Определение 1. Пусть г, ] € 1 : п. Говорят, что задан элементарный квант информации об отношении предпочтения ЛПР (квант) > 0, если у € М" вида
у® = и® у^ = —и^, ук =0, к = г,] удовлетворяет выражению у Уу (0,..., 0) € М".
Смысл формального определения можно интерпретировать следующим образом: ЛПР готово расстаться с Wj количеством единиц критерия fj, при этом получив взамен единиц критерия /¿.
Как можно использовать полученный квант? Это делается так: пересчитываем старый критерий / и получаем новый /1, где / = /1 х wj + /j х /1 = /к, к = Используем /1 для пересчета всех у € У, после чего отбрасываем те решения, которые попадают под действие первой аксиомы, и в зависимости от ситуации продолжаем процесс сбора квантов или заканчиваем его, оглашая решение.
Приведем пример использования элементарного кванта для принятия решения в области страхования: пусть имеется случайный риск X, который оценен эксперт-но с математическим ожиданием Е(Х), страхователь (тот, кого страхуют) обладает капиталом ш, р есть премия — гарантированный убыток. Тогда страхователю предлагаем на сравнение решения вида (0, Е(Х)) и (р, Е(Х) + Ь), где Ь — общая сумма страховых выплат (может быть единовременной или растянутой во времени, условной и безусловной в зависимости от типа договора (полиса)). Может показаться, что такое сравнение довольно бессмысленно, однако это не так, ибо, исходя из решения, принятого страхователем, можно делать рекомендации в подобных ситуациях в будущем.
Рассмотрим также числовой пример, чтобы лучше понять механизм работы с квантами: пусть требуется выбрать полис на основе двух критериев. Первый — выгода. В качестве второго возьмем репутацию страховщика — естественно, что более известные и стабильные компании выглядят в глазах клиентов более привлекательными. Имеются варианты:
1) Ь = 1000, Я = -10,
2) Ь = 500, Я = -1,
3) Ь = 700, Я = -5,
в которых Я — рейтинг страховщика, Я отрицателен в силу того, что чем он меньше, тем лучше; вообще разные знаки значений критериев символизируют разность их сущности.
Пусть ЛПР сделал выбор между 1 и 2: 2 У у 1. Из этого извлекаем квант: = 500, = 9. Пересчитываем критерий: /1 = (9 х /1 + 500 х /2, /2) и варианты:
1) Ь = 4000, Я = -10,
2) Ь = 4000, Я = -1,
3) Ь = 3800, Я = -5.
Таким образом, второй полис признается лучшим — он по второму критерию лучше остальных, а по первому не хуже двух других.
Можно заметить, что понятие элементарного кванта сильно ограничивает его область применимости, ведь в подавляющем большинстве случаев число критериев ^ 3. Следовательно, логично было бы ввести понятие общего кванта информации (об отношении предпочтения ЛПР), которое уже совместимо с любым числом критериев.
Пусть п обозначает число критериев, I = {1,... ,п} — множество номеров критериев.
Определение 2. Пусть А, В € I, А = 0, В = 0. Говорят, что задан (общий) квант информации об отношении предпочтения ЛПР (квант) для групп критериев А, В вместе с наборами положительных параметров т* для всех г € А и т* для всех ] € В, если для вектора у' € М" вида
у/ = w* для всех i G A, yj' = —w* для всех j G B, ys' = 0 для всех s G I \ {A U B}
выполняется у' У Y (0,..., 0) G Rn.
Как можно видеть, пару индексов здесь мы заменили на пару подмножеств множества индексов, которые представляют собой группы критериев, сравнительную важность которых показывает квант.
Смысл понятия похож на таковое для элементарного кванта: ЛПР готово пожертвовать w* количеством единиц критериев fj для всех j G B, при этом получив взамен w* единиц критерия f для всех i G A. Такое определение предоставляет гораздо большую гибкость при выборе спектра решаемых задач.
Формула для пересчета критериев здесь несколько меняется, при этом также происходит повышение размерности самого критерия до p = n — |B| + |A| x |B|.
Итак, нужно построить C(X) — множество выбираемых решений на основе квантов об отношении предпочтения ЛПР. Раскроем суть решения этой задачи через схему обратной связи.
3. Схема обратной связи. Приведем краткое ее описание на примере задачи возможности заключения договора страхования [6]. В страховании две стороны — клиент (страхователь) и фирма (страховщик), у каждой стороны свои задачи. Задачами клиента являются следующие:
1) принять решение о страховании вообще;
2) выбрать страховщика;
3) избрать конкретный продукт. Для фирмы же стоят такие вопросы:
1) принятие внутренних решений;
2) сбор информации (квантов) от клиентов;
3) подбор параметров продуктов.
Для решения этих задач предлагается следующее: через мобильное приложение фирма собирает от клиентов кванты, при этом последние получают продукт с подобранными оптимальными параметрами по своим предпочтениям, а первая лучше понимает рынок и подбирает параметры.
Представим теперь компоненты программы, автоматизирующей сбор квантов и предоставление рекомендаций ЛПР на основе их предпочтений. Распространение мобильных устройств по всему миру подсказывает разумность использования именно такой программы. Она состоит из:
1) удаленного сервера, занимающегося основными вычислениями, агрегацией входных данных путем исследования сайтов-каталогов, их накоплением, хранением и обработкой;
2) графической оболочки (так называемый GUI — Graphical user interface, графический пользовательский интерфейс), позволяющей пользователю легко получать нужные рекомендации;
3) вычислительно-технического блока на устройстве пользователя, приводящего к получению рекомендации даже при отсутствии доступа к сети Интернет;
4) прочих служб.
Именно тот факт, что вычисления предполагаются к проведению как на удаленном сервере, так и на устройстве пользователя, разница в производительности между
которыми может быть десятки тысяч раз, указывает на необходимость оптимизации соответствующих вычислений.
Встает также резонный вопрос — что, если информация от квантов противоречива? Справиться с этим поможет критерий непротиворечивости [3].
Итак, краткое описание схемы следующее: ЛПР дает сравнение, извлекаем квант, сужаем множество решений, вновь идем к ЛПР. В рамках этой схемы возникает ряд сопутствующих задач. Рассмотрим некоторые из них.
4. Сопутствующие задачи. Основная задача, заслуживающая внимания, следующая: каждый квант сокращает множество решений минимум на одно, согласно первой аксиоме — если ЛПР не выбрал одно из предоставленных решений, оно не может войти в окончательное множество. В связи с этим возникает вопрос: как на каждом шаге алгоритма подбирать такую пару решений, которая будет при любом выборе ЛПР давать максимальное сокращение финального множества?
Дать ответ на вопрос потенциально может ИИ: в теории достаточно натренировать его на большом количестве размеченных данных, и модель сможет предлагать оптимальную в вышеописанном смысле пару решений.
Другой сопутствующий вопрос можно охарактеризовать следующим образом: возможен ли сбор квантов об отношении предпочтения ЛПР без непосредственного его опроса? В настоящее время обезличенные данные о действиях пользователей в сети Интернет собираются и обрабатываются самым широким кругом компаний, что открывает возможности для их применения в рассматриваемой схеме.
Примером данных, подходящих для решаемых целей, будут данные о переходах пользователя по веб-страницам. Например, ЛПР хочет выбрать смартфон, пользуется сайтом-агрегатором. Примерные действия в таком случае следующие: извлекаем отмеченные через фильтры параметры (размер экрана, батареи, камеры и пр.), их запоминаем; также изучаем переходы пользователя на страницы конкретных моделей и их запоминаем. Если при этом прослеживается предпочтение какой-то марки, то это также учитываем. На основе полученной информации из сравниваемых пар решений выбирается наиболее соответствующее предпочтениям ЛПР.
Немаловажно также отметить проблему выделения значимых критериев. Очевидно, что для каждой отдельной категории предметов возможно выделить сотни различных критериев, что неразумно. Выбор из них наиболее значимых существенно облегчит решение. Другой аспект того же толка — перевод не имеющих явных численных аналогов критериев в числовой формат (например, цвет).
Важен также вопрос об оптимальной точке останова алгоритма с участием квантов — в какой момент мы перестаем их собирать? Иначе говоря, в какой момент вычисления, необходимые для очередного шага алгоритма, становятся непропорционально сложными получаемой от них выгоде (сокращению множества решений)?
Последний заслуживающий внимания вопрос — рост размерности перемножаемых в рамках алгоритма матриц, он перекликается с предыдущим в смысле рациональности вычислений. Умножение матриц — достаточно трудоемкая операция в смысле количества затрачиваемых вычислительных ресурсов. Лучшая вычислительная сложность алгоритма умножения матриц, достигнутая на данный момент, составляет приблизительно 0(п2 37) [7], при этом значения сложности ниже 0(п2) не могут быть достигнуты, и требует внимания структура возникающих матриц с целью оптимизации. Невозможность применения алгоритмов для, например, разреженных матриц вместе с особенностями предлагаемой программы диктуют необходимость снижения нагрузки на участвующую в вычислениях аппаратуру.
Для решения вопроса предлагаются два подхода. Первый предполагает дробление множества альтернатив на куски и применение алгоритма с выбором наилучших альтернатив для каждого из них по отдельности, после чего получившиеся решения объединяются, и для них алгоритм запускается вновь. Несмотря на очевидные плюсы в плане понижения размерности матриц, возникающих в процессе применения алгоритма, появляются и дополнительные вопросы, в частности будет ли сохраняться соответствие аксиомам, другими словами — корректность. При малой размерности X целесообразность подхода в целом вызывает сомнения.
Второй подход состоит в оптимизации процесса получения у ЛПР квантов, уже освещенный выше. Помимо подготовки для этой цели модели ИИ представляется разумным рассмотрение следующих эвристических идей: будем предлагать для сравнения решения у', у'' с максимальной абсолютной суммарной разницей по всем критериям:
n
max ^ У^|у»' - yi''|
y'.y ..■ i=i
или же только по какому-либо одному критерию:
max ^ |у/ — у/| для какого-либо i G I.
5. Модифицированная схема обратной связи. С учетом вышесказанного получаем следующий общий алгоритм построения множества C(X):
1) зная множество решений X, построить множество векторов, составленных из значений их критериев Y, выделяя при этом лишь значимые и преобразовывая абстрактные в числовые значения;
2) определить оптимальные пары решений с учетом модели ИИ;
3) получить кванты на основе обезличенных данных, в смысле отсутствия в них указания на реальную персону, взамен имеется лишь уникальный идентификатор;
4) сузить множество решений на базе полученных квантов;
5) повторить до достижения избранной точки останова.
На основе постоянно поступающих новых данных фрагменты алгоритма корректируются, тем самым олицетворяя обратную связь.
6. Заключение. В статье рассмотрена схема обратной связи для решения задач выбора в контексте аксиоматического подхода к сужению множества Парето. Кратко раскрыта суть появляющихся сопутствующих задач. Все это позволяет разработать программный комплекс, автоматизирующий необходимые вычисления с дальнейшей оптимизацией UI и самого процесса вычислений. Также планируется провести сравнение с актуальными рекомендательными системами, так как обе сущности преследуют одну цель. Еще одним направлением исследований является внедрение элементов теории выбора и ИИ в системы управления сложными техническими комплексами [8, 9].
Литература
1. Hamel A. H., Kostner D. Multi-weight ranking for multi-criteria decision making // arXiv: 2312.03006. URL: https://arxiv.org/abs/2312.03006 (дата обращения: 2 декабря 2023 г.).
2. Bednarczuk E. M., Miroforidis Ja., Przemyslaw Pz. A multi-criteria approach to approximate solution of multiple-choice knapsack problem // arXiv: 1712.06723.
URL: https://arxiv.org/abs/1712.06723 (дата обращения: 2 декабря 2023 г.).
3. Ногин В. Д. Сужение множества Парето: аксиоматический подход. М.: Физматлит, 2018. 272 с.
4. Басков О. В. Алгоритм последовательного учета информации об относительной важности критериев в задаче многокритериального выбора // Процессы управления и устойчивость: Труды 41-й междунар. конференции аспирантов и студентов / под ред. Н. В. Смирнова, Г. Ш. Тамасяна. СПб.: Издат. дом Санкт-Петербургского университета, 2010. С. 553—558.
5. Erdil E., Besiroglu T. Explosive growth from AI automation: A review of the arguments // arXiv: 2309.11690. URL: https://arxiv.org/abs/2309.11690 (дата обращения: 2 декабря 2023 г.).
6. Сачков А. В. Исследование возможности заключения договора страхования с учетом функции полезности // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2023. Т. 19. Вып. 3. С. 369—373. https://doi.org/10.21638/11701/spbu10.2023.305
7. Duan R., Wu H., Zhou R. Faster matrix multiplication via asymmetric hashing // arXiv: 2210.10173. URL: https://arxiv.org/abs/2210.10173 (дата обращения: 2 декабря 2023 г.).
8. Ilyushina A. N., Pershin I. M., Trushnikov V. E., Novozhilov I. M., Pervukhin D. A., Tu-keyev D. L. Design of a software complex for control of induction equipment of metallurgical manufacture using systems theory // 2023 V International Conference on Control in Technical Systems (CTS). St. Petersburg: LETI Publ., 2023. P. 83-87.
9. Novozhilov I. M., Sidorenko A. A., Tukeyev D. L., Podkina M. E., Pervukhin D. A., Trushnikov V. E. Design of software and hardware complex of temperature field diagnostics using the theory of distributed parameter systems // 2023 V International Conference on Control in Technical Systems (CTS). St. Petersburg: LETI Publ., 2023. P. 88-91.
Статья поступила в редакцию 4 января 2024 г.
Огатъя принята к печати 12 марта 2024 г.
Контактная информация:
Сачков Александр Валерьевич — аспирант; [email protected]
Feedback loop scheme as related to axiomatic approach to Pareto set reduction
A. V. Sachkov
St. Petersburg State University, 7—9, Universitetskaya nab., St. Petersburg, 199034, Russian Federation
For citation: Sachkov A. V. Feedback loop scheme as related to axiomatic approach to Pareto set reduction. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2024, vol. 20, iss. 2, pp. 281-288. https://doi.org/10.21638/spbu10.2024.212 (In Russian)
A feedback loop scheme is proposed as related to axiomatic approach to Pareto set reduction. Necessary information on axiomatic approach is presented and an example is studied. The feedback loop scheme is explored as related to a problem of potential insurance contract conclusion. Problems arising with such approach are discussed, such as criteria selection, automatic quanta collection based on user behavior data and others. The scheme is then modified and an approximate solution algorithm is presented. Future research directions are outlined.
Keywords: choice, Pareto set, feedback loop.
References
1. Hamel A. H., Kostner D. Multi-weight ranking for multi-criteria decision making. arXiv: 2312.03006. Available at: https://arxiv.org/abs/2312.03006 (accessed: December 2, 2023).
2. Bednarczuk E. M., Miroforidis Ja., Przemyslaw Pz. A multi-criteria approach to approximate solution of multiple-choice knapsack 'problem. arXiv: 1712.06723. Available at: https://arxiv.org/abs/1712.06723 (accessed: December 2, 2023).
3. Noghin V. D. Reduction of the Pareto set: an axiomatic approach. Cham, Switzerland, Springer,
2014, XIX, 232 p. (Rus. ed.: Nogin V. D. Suzhenie mnozhestva Pareto: aksiomaticheskii podkhod. Moscow, Physmatlit Publ., 2018. 272 p.)
4. Baskov O. V. Algoritm posledovatel'nogo ucheta informatsii ob otnositel'noi vazhnosti kriteriev v zadache mnogokriterial'nogo vybora [Algorithm for sequential accounting of information on the relative criteria importance in the multicriteria choice problem]. The XLI Annual International Conference on Control Processes and Stability (CPS'10). St. Petersburg, Publishing House of St. Petersburg State University, 2010, pp. 553—558. (In Russian)
5. Erdil E., Besiroglu T. Explosive growth from AI automation: A review of the arguments. arXiv: 2309.11690. Available at: https://arxiv.org/abs/2309.11690 (accessed: December 2, 2023).
6. Sachkov A. V. Issledovanie vozmozhnosti zakliucheniia dogovora strakhovaniia s uchetom funktsii poleznosti [Examining the possibility of insurance contract conclusion based on utility function]. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Sciences. Control Processes, 2023, vol. 19, iss. 3, pp. 369-373. https://doi.org/10.21638/11701/spbu10.2023.305 (In Russian)
7. Duan R., Wu H., Zhou R. Faster matrix multiplication via asymmetric hashing. arXiv: 2210.10173. Available at: https://arxiv.org/abs/2210.10173 (accessed: December 2, 2023).
8. Ilyushina A. N., Pershin I. M., Trushnikov V. E., Novozhilov I. M., Pervukhin D. A., Tukeyev D. L. Design of a software complex for control of induction equipment of metallurgical manufacture using systems theory. 2023 V International Conference on Control in Technical Systems (CTS). St. Petersburg, LETI Publ., 2023, pp. 83-87.
9. Novozhilov I. M., Sidorenko A. A., Tukeyev D. L., Podkina M. E., Pervukhin D. A., Trushnikov V. E. Design of software and hardware complex of temperature field diagnostics using the theory of distributed parameter systems. 2023 V International Conference on Control in Technical Systems (CTS). St. Petersburg, LETI Publ., 2023, pp. 88-91.
Received: January 4, 2024.
Accepted: March 12, 2024.
Author's information:
Alexander V. Sachkov — Postgraduate Student; [email protected]