УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 004.75
АВТОМАТИЗАЦИЯ ПРОЦЕССА ВЫБОРА ТОВАРА С ИСПОЛЬЗОВАНИЕМ МЕТОДА РАССУЖДЕНИЙ НА ОСНОВЕ
ПРЕЦЕДЕНТОВ
Е.В. Тимошина, Е.А. Семенчев
Рассматривается метод, формирующий правдоподобные рассуждения и умозаключения на основе прецедентов (СБЕ), для системы поддержки принятия решений при продаже товара. Исследуется использование метрического алгоритма (метод ближайшего соседа) и возможность учитывать коэффициенты важности для параметров объекта («взвешенное» Евклидово расстояние) с целью организации извлечения прецедентов из библиотеки прецедентов (БП).
Ключевые слова: СБЯ-метод, Евклидова метрика, «взвешенное» Евклидово расстояние, прецедент, правдоподобные рассуждения, параметрическое представление.
Автоматизация процессов обработки информации за счет современных достижений компьютерных и информационных технологий стала играть значительную роль в жизнедеятельности человека. Актуальной проблемой является конструирование перспективных интеллектуальных систем. Присутствие механизмов, формирующих своевременные и правдоподобные умозаключения, сопутствует диагностированию проблемной ситуации и позволяет лицам, принимающим решения (ЛПР), совершать более выгодные и адекватные воздействия на объект управления.
В данной работе основное внимание уделяется правдоподобным рассуждениям на основе прецедентов (накопленного опыта), активно применяемым в диагностических системах, в юриспруденции, экспертных системах и системах машинного обучения, а также для решения задач интеллектуального поиска информации электронной коммерции. Рассматривается применение данного метода для системы формирования списка мебели, подходящей клиенту, на производственном предприятии. А также
описывается способ представления прецедентов и методы их извлечения из библиотеки прецедентов (БП) системы.
Рассуждения на основе прецедентов (накопленного опыта) базируются на понятии сходства (аналогии). Прецедент, в большинстве энциклопедических источников, определяется как случай, имевший место ранее и служащий примером или оправданием для последующих случаев подобного рода. Рассуждение на основе прецедентов (CBR — Case-Based Reasoning) является подходом, позволяющим решить новую, неизвестную задачу, используя или адаптируя решение уже известной задачи [1].
Применение CBR-методов для решения задач возможно в том случае, когда выполняются следующие условия, касающихся исследуемой области:
- схожие ситуации должны разрешаться подобными методами решения (принцип регулярности). В такой ситуации опыт, накопившийся к данному моменту, будет выступать в роли отправной точки процесса поиска решения для подобных неизвестных ситуаций;
- типы новых ситуаций и задач, требующих решения, должны иметь место повторению. Тогда данное условие дает гарантии, что для множества похожих ситуаций в будущем будет найден аналогичный опыт в прошлом.
На предприятии были исследованы процессы выяснения потребностей клиентов и приема заказов. На их основе в дальнейшем была поставлена задача создания системы, которая бы организовывала диалог с пользователем и формировала предложения на основе выбора прецедента. Данная программа должна осуществлять подбор нужного товара покупателю и выдавать рекомендации по образцам, близким к требованиям клиента. Таким образом, целью создания системы являлась максимальная оперативная помощь клиенту при подборе товара, а также уменьшение времени и повышение качества обслуживания клиентов. Объектом автоматизации в данной системе является процесс принятия решения о выборе товара.
С учетом поставленных целей и задач, была сформирована концептуальная модель разработанного программного обеспечения в виде CBR-цикла, представленная на рис. 1.
Рис. 1. CBR-цикл работы системы
246
Обычно СБЯ-методы состоят из четырех основных этапов, которые также называют цикл обучения по прецедентам или СБЯ-цикл.
В данной работе реализованы следующие режимы работы системы:
- взаимодействие с пользователем, которое обеспечивает интерфейс пользователя. Результатом данного взаимодействия является заказ пользователя или прецедент;
- извлечение наиболее адекватных прецедентов для сформированного заказа из библиотеки прецедентов;
- найденные прецеденты предлагаются пользователю для принятия решения;
- полученное решение сохраняется в библиотеке прецедентов как новый прецедент или как часть существующего.
Соответствующая концептуальной модели функциональная структура представлена на рис. 2.
Рис. 2. Схема функциональной структуры программного обеспечения
для подбора мебели
Функциональная модель включает модули «Ведение базы данных товаров», «Формирование заказа» и «Обработки заказа». Модуль ведения базы данных предусмотрен для хранения сведений об ассортименте, таких как характеристики столов, стульев, цвета обивки и мебели, данных о совершенных продажах. Модуль «Формирование заказа» включает в себя формирование параметров стола и формирование параметров стула. Фор-
247
мирование параметров стола предполагает внесение покупателем своих желаний о заказываемом столе, таких как форма, габариты стола (туда входят ширина, длина и высота), цвет стола и стоимостную границу, которой клиент хотел бы ограничить свой заказ, и другие параметры. Формирование параметров стульев включает возможность для потенциального покупателя выбрать тон стульев и цвет обивки тканью (или кожзаменителем), и также ограничить подбор стульев в ценовой категории. Выходной информацией является заказ клиента, сформированный на основе его пожеланий. Модуль «Обработка заказа» выполняет следующие функции:
- формирование списка предлагаемого товара при помощи методов логического вывода;
- возможность выбора модели из предложенного списка;
- сохранение данных о покупке в базе.
Выходной информацией для данного модуля являются данные о выбранной модели.
Методов, способных осуществлять извлечение прецедентов и их модификаций существует достаточное множество. Метод ближайшего соседа самый распространенный способ сравнения и извлечения прецедентов. Данный метод позволяет осуществить легкое вычисление степени сходства текущей проблемной ситуации и прецедентов из библиотеки прецедентов системы.
В основе метода ближайшего соседа лежит определенный способ измерения степени сходства (близости) прецедента и текущей проблемной ситуации. Говоря формально, необходимо ввести метрику на пространстве параметров (признаков, свойств) для описания прецедентов и текущей ситуации, а затем, определить на основе выбранной метрики расстояние между точками, соответствующими прецедентам, и точкой, соответствующей текущей ситуации, в итоге следует выбрать ближайшую точку (прецедент) к текущей ситуации. Безусловно, эффективность метода ближайшего соседа во многом зависит от выбора метрики. Несколько из основных метрик для определения расстояния между двумя точками: Евклидово расстояние, Манхэттенская метрика, Расстояние Чебышева, Расстояние Журавлева, Мера сходства по Хэммингу и др. [2].
Наиболее распространенным методом считается Евклидово расстояние - геометрическое расстояние в многомерном пространстве. Данная метрика использовалась в качестве меры близости для решения задачи классификации.
Наиболее трудным и наименее формализованным в задаче классификации является определение понятия однородности объектов. В общем случае понятие однородности объектов задается введением либо правила вычисления расстояний р(х;, х^ между любой парой исследуемых объектов (хь х2, ..., хп), либо некоторой функцией г(х;, х^, характеризующей степень близости 1-го и ]-го объектов.
Если задана функция вычисления расстояний р(х;, х^, то близкие с точки зрения этой метрики объекты считаются однородными, принадлежащими к одному классу. Очевидно, что необходимо при этом сопоставлять р(х;, х^ с некоторыми пороговыми значениями, определяемыми в каждом конкретном случае по-своему.
Аналогично используется и мера близости г(х;, х^, при задании которой требуется помнить о необходимости выполнения следующих условий:
- симметрии г(х;, х^ = г(х^ х;);
- максимального сходства объекта с самим собой
г(х;, х^ = шах^ г(х;, х^,
где х;, Xj - объекты для сравнения; г(х;, х^ - функция, характеризующая степень близости; 1< 1, ^ п, п - количество объектов сравнения.
- монотонного убывания г(х;, Xj) по мере увеличения р(х;, Xj), т.е. из р(хк, х[) > р(х;, Xj) должно следовать неравенство г(хк, х^ < р(х;, Xj). Обычное Евклидово расстояние определяется по формуле (1).
где х;1, Xjl - значения 1-го признака у 1-го О-го) объекта; 1 = 1, 2, ..., к, к -количество признаков объекта; 1,] = 1, 2, .... п, п - количество объектов сравнения; рЕ(х;, х]) - обычное Евклидово расстояние.
Оно используется в следующих случаях:
- наблюдения берутся из генеральной совокупности, имеющей многомерное нормальное распределение с ковариационной матрицей, т.е. исходные признаки взаимно независимы и имеют одну и ту же дисперсию;
- исходные признаки однородны по физическому смыслу и одинаково важны для классификации [3].
В случае если признаки измерены в разных единицах, прибегают к нормированию. Эта операция не всегда корректна. Поэтому применяют «взвешенное» Евклидово расстояние, которое определяется из выражения
где х;1, х]1 - значения 1-го признака у 1-го 0-го) объекта; рВЕ(х;, х]) - «взвешенное» Евклидово расстояние.
Оно применяется в тех случаях, когда каждой 1-й компоненте вектора наблюдений Х удается приписать некоторый «вес» ю1, пропорциональный степени важности признака в задаче классификации. Обычно принимают 0 < ю1 < 1, где 1 = 1,2, ..., к.
Определение весов, как правило, связано с дополнительными ис-
(1)
(2).
(2)
следованиями, например с организацией опроса экспертов и обработкой их мнений. Определение весов ю1 только по данным выборки может привести к ложным выводам.
В данной работе поиск прецедентов осуществляется по формуле (2), а в качестве весов ю1 применялась величина обратно пропорциональная квадрату размаха вариации. Размах вариации - это разность между максимальным и минимальным значениями признака, вычисляется по формуле
(3).
R = xl max — xl min, (3)
где R - размах вариации; x1max - максимальное значение 1-ого признака; x1min - минимальное значение 1-ого признака.
Тогда
1/ 1
W = / 2 =-т,
1 / R (x — x . )2'
\Л1 max Л1 min J
где ю1 - вес признака.
Применение «взвешенного» Евклидово расстояния обеспечило более быстрый поиск предлагаемого товара. Для вычисления оценок были сформированы вектор признаков заказа и вектора исходных параметров товара, причем все они должны быть в закодированном виде.
Для реализации успешных рассуждений на основе прецедентов следует сформировать корректное представление прецедентов в библиотеке прецедентов. Известно несколько различных способов представления и хранения прецедентов [2]. Условно их делят на ряд групп: параметрические, объектно-ориентированные, специальные (деревья, графы, логические формулы).
В общем случае прецедент включает в себя описание проблемной ситуации, решение данной проблемы в прошлом и возможно упоминание о результатах применения решения. Описание проблемы должно содержать всю информацию, необходимую для достижения цели вывода.
Для представления прецедентов чаще достаточно простого параметрического представления: CASE=(x1, x2, ... , xn, R), где x1,., xn - параметры проблемной ситуации, которые описывают данный прецедент;
x1 G Xb x2 G xn G Хш
где n - количество параметров для описания прецедента; X1, ... , Xn - области допустимых значений соответствующих параметров; R - решение (диагноз, рекомендации ЛПР).
Описание проблемы должно содержать всю информацию, необходимую для достижения цели вывода.
В данном программном обеспечении под прецедентом принимался заказ клиента со всеми параметрами, такими как форма стола, габариты, цена и другие. Оценка близости прецедентов производится с помощью
250
Евклидовой меры близости.
Например, множество признаков стола было обозначено как Lstoi = {№, название}, где 1 - форма стола; 2 - количество персон, на которое рассчитан стол; 3 - ширина (в диапазоне от 600 до 1050 мм); 4 - высота (в диапазоне от 525 до 760 мм); 5 - длина (в диапазоне от 650 до 1700 мм); 6 - раздвижной или нет; И другие.
Параметры для вычисления весов обозначены следующим образом: maxx k, minx k - максимальное и минимальное значения для параметра x jk.
Параметрическая модель представления прецедентов была расширена элементами продукционной модели представления знаний. Логический вывод прецедентов организован с помощью системы правил продукционного типа «Если (условие), то (действие)». Вывод предложения из имеющегося ассортимента осуществляется с использованием Евклидова расстояния. В условии проверяется соответствие стола из базы данных и пожеланий клиента, а при вычислении расстояния используются параметры мебели. Пример данных вычислений:
Если yii = xji и yi6 = 0 и yi7 = 0 и уП0 > xji0 , то
Pe (yi ,xj) ,
где рЕ - Евклидово расстояние; yi1, xj1 - форма стола, указанная клиентом и в базе данных; yi6 - параметр заказа, указывающий на способность стола раздвигаться; yi7 - параметр заказа, характеризующий способность стола менять высоту; yi10, xj10 - стоимость стола, указанная клиентом и в базе данных; yi5, xj5 - длина стола, указанная клиентом и в базе данных; yi4, xj4 -высота стола, указанная клиентом и в базе данных; yi3, xj3 - ширина стола, указанная клиентом и в базе данных.
Для вывода списка прецедентов использовалось «взвешенное» Евклидово расстояние. В качестве условия проверяются также характеристики стола, например раздвижной стол или нет. Далее если стоимость мебели из базы данных превышает указанную при заказе, то стоимость включается в расчет меры близости. Пример вычислений:
Если yi1 = 0 и yi2 = 0 и yi6 = 0 и yi7 = 0, то Если xj 10 > yn0 , то
( ) I (ft 5 - xj5 )2 + UT-j2 + (у: - xj3 )2 + (ул0 - j )2
Pbe \yi, kb-;-^ + 7-:-^ + 7-:-^ +
(max x5 - min x5 )2 (max x4 - min x4 )2 (max x3 - min x3 )2 (max x10 - min x10)
Иначе
Pee
У, x, )=
(У5 - Xj5 )2 + (Yi4 - XJ4 )2 + (Уз - x,3 )2
(max x5 - min x5 )2 (max x4 - min x4 )2 (max x3 - min x3 )2
где рВЕ - «взвешенное» Евклидово расстояние; yi2 - параметр заказа, характеризующий количество персон для стола; maxx;, minx; - максимальное и минимальное значения для параметра xj;.
Для обеспечения взаимодействия с пользователем предусмотрен интерфейс пользователя, пример работы которого представлен на рис. 3.
Рис. 3. Пример указания габаритов стола
Результатом работы программы является список товаров и расцветок, подходящих под пожелания клиента (рис. 4), а также набор альтернативных вариантов (рис. 5).
|-i Предложения
Заданные параметры для стола
Количество персон для стола 4
Длина не регулируется Высота не регулируется Материал дуб
Янтарь 6 Агат М 700*1300 Рубин МО Рубин Ю Рубин Ю6 Рубин Т Рубин Т1400 Янтарь М Агат 2 Агат 3 Агат Б1600 Агат 1400 Агат 1300 Сапфир О
ВАЖНОЕ для ог Г форма
Стоимость 10000 рублей
Заданные параметры дли стула
Ма териал дуб Выбран a
Стоимость 1000рублей Обивка ш
р | а
Белый бук (дуб) Выбеленный бук (дуб) Светлый бук (дуб) Коричневый бук (дуб) Светло-бурый бук (дуб) Светло-коричневый бук (дуб) Бурый бук (дуб) Темно -грана тоаый бук (дуб) Темно -бурый бук (дуб) Темно-бурый бук (дуб) Бук (дуб) цвета п
Отделка патиной
Белый буи (дуб) Выбеленный бук (дуб) Светлый буи (дуб) Коричневый бук (дуб) Светло-бурый бук (дуб) Светло-коричневый бук (дуб) бурый бук (дуб) Темно-гранатовый бук (дуб) Темно-бурый бук (дуб) Темно-бурый бук (дуб) бук (дуб) цвета
Молочный кожезаменитель Гиязно-зеленый однотонный (лён. Серый однотонный (лён) Бурый однотонный (лён)
Рис. 4. Результат работы программы (список товара)
Рис. 5. Результат работы программы (список альтернатив)
Таким образом, предложенный механизм рассуждений на основе прецедентов позволяет более эффективно осуществлять подбор нужного товара покупателю и формировать рекомендации по образцам, близким к требованиям клиента.
Система «Подбор мебели» может применяться с целью максимальной оперативной помощи клиенту при подборе товара, а также уменьшения времени и повышения качества обслуживания клиентов при продаже мебели.
Список литературы
1. Варшавский П.Р., Еремеев А.П. Методы правдоподобных рассуждений на основе аналогий и прецедентов для интеллектуальных систем поддержки принятия решений// Новости искусственного интеллекта. 2006. №3. С.39-62.
2. Варшавский П.Р. Механизмы правдоподобных рассуждений на основе прецедентов (накопленного опыта) для систем экспертной диагностики// Труды 11-й национальной конференции по искусственному интеллекту с международным участием (Дубна, 28 сентября - 3 октября 2008 г.). М: URSS, 2008. Т. 2. С. 106-113.
3. Назарова М.Г. Курс социально-экономической статистики [Электронный ресурс] / М., 2000. URL: http: //www.bibliotekar.ru/ economicheskaya-statistika-2/index.htm (дата обращения 20.04.2013).
Тимошина Елена Васильевна, бакалавр, Россия, Тула, Тульский государственный университет,
Семенчев Евгений Александрович, канд. техн. наук, доц., Россия, Тула, Тульский государственный университет
PROCESS AUTOMATION SELECTING A PRODUCT USING THE METHOD FOR CASE-BASED REASONING
E.A. Semenchev, E. V. Timoshina
A method of forming a plausible reasoning and mind-conclusions on the basis of precedents (CBR), for a decision support system for the sale of goods. We investigate the use of metric algorithm (nearest neighbor method) and the ability to take into account the importance of the coefficients for the parameters of the object ("weighted" Euclidean distance) to organize the removal of precedents of the case library (CL).
Key words: CBR-method, Euclidean metric, "weighted" Euclidean distance precedent plausible reasoning, the parametric representation.
Timoshina Elena, bachelor of engineering and technology, Russia, Tula, Tula State University,
Semenchev Evgeniy Aleksandrovich, candidate of technical science, docent, Russia, Tula, Tula State University