Научная статья на тему 'Выбор достаточного количества коэффициентов аппроксимирующего полинома в нечетком многомерном факторном пространстве'

Выбор достаточного количества коэффициентов аппроксимирующего полинома в нечетком многомерном факторном пространстве Текст научной статьи по специальности «Математика»

CC BY
111
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нечеткое факторное пространство / полиноминальные модели / Экспертные системы / извлечения и представление экспертной информации

Аннотация научной статьи по математике, автор научной работы — Спесивцев Александр Васильевич

Предложен метод выбора достаточного количества коэффициентов полиномиальной модели, формализующей экспертные знания в нечетком многомерном пространстве.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Спесивцев Александр Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The suggested method defines a sufficient quantity of coefficients of a polynomial model which makes it possible to formalize the expert`s opinion in fuzzy multi-dimensional factor space.

Текст научной работы на тему «Выбор достаточного количества коэффициентов аппроксимирующего полинома в нечетком многомерном факторном пространстве»

УДК 519.65:517.518.823

ВЫБОР ДОСТАТОЧНОГО КОЛИЧЕСТВА КОЭФФИЦИЕНТОВ АППРОКСИМИРУЮЩЕГО ПОЛИНОМА В НЕЧЕТКОМ МНОГОМЕРНОМ ФАКТОРНОМ ПРОСТРАНСТВЕ

© 2008 г. А.В. Спесивцев

Предложен метод выбора достаточного количества коэффициентов полиномиальной модели, формализующей экспертные знания в нечетком многомерном пространстве.

The suggested method defines a sufficient quantity of coefficients of a polynomial model which makes it possible to formalize the expert's opinion in fuzzy multi-dimensional factor space.

Ключевые слова: нечеткое факторное пространство, полиноминальные модели, экспертные системы, извлечения и представление экспертной информации.

Введение

Построение баз знаний (БЗ) в виде аналитического выражения (полинома) возможно путем формализации экспертной информации [1]. Однако в практике их построения иногда возникают условия [2, 3], когда нечеткое факторное пространство, в котором действует целевая функция (например, принятие решения высокого уровня), содержатся «виртуальные» переменные, количественное определение ошибок которых невозможно (например, учет так называемого «административного ресурса»). В условиях некорректности применения /-критерия Стьюдента или построения наилучшей интерполяционной формулы по минимуму остаточной дисперсии открытым остается вопрос количества значимых коэффициентов аппроксимирующего уравнения при сохранении адекватности вычислений мнению эксперта.

Решению данной проблемы и посвящено настоящее исследование.

Методика определения количества коэффициентов

Аппроксимация экспертной информации в виде аналитического выражения являет собой синтез элементов теории нечетких множеств в виде лингвистических переменных с теорией планирования экспериментов, где целевая функция представляется полиномом [4, 5]:

Y = Ь0 + + £ Ь]иХ]Хи + ... , у Ф и.

i =1 и, у=1

Число коэффициентов полинома К составляет

К = п + С2п + С3п +... + Сп-1п,) (1)

где п - количество независимых переменных факторного пространства.

В условиях принятого ограничения по эффектам взаимодействия не выше трех [5] даже при п = 5 К = 26. Как правило, большинство из них незначимо отличаются от нуля, т. е. неразличимы на фоне ошибки их определения при условии ее существования, и задача сводится, в первую очередь, к ограничению их количества.

Рассмотрим некоторые свойства полинома в аспекте решения задачи.

Во-первых, согласно теории планирования эксперимента [4] значения переменных так расположены в факторном пространстве, что матрица продукционных правил обладает свойством ортогональности, т. е. все коэффициенты независимы друг от друга. Это важнейшее свойство позволяет исключать любую совокупность коэффициентов и в любой последовательности без проведения повторных вычислений [5].

Во-вторых, следует различать двоякое использование полинома: как интерполяционной вычислительной формулы и как формулы косвенного измерения определяемого признака [2, 3]. Из математики известно, что при использовании для вычислений всех коэффициентов полинома ошибка аппроксимации будет равна нулю, а по мере роста числа их исключения -ошибка возрастает. При этом существует какой-то предел числа исключенных коэффициентов, когда ошибка аппроксимации становится недопустимой. Если же полином используется как формула косвенного определения в метрологическом плане, то, согласно закону накопления ошибок, каждое арифметическое действие вносит дополнительную лепту в общую величину погрешности. В данном случае уменьшение количества слагаемых полинома уменьшает суммарную погрешность косвенного измерения. Тогда можно определить такое количество членов полинома, когда ошибка косвенных измерений становится приемлемой с метрологической точки зрения.

В-третьих, уменьшение количества коэффициентов при использовании этих двух независимых «противоположно направленных» свойств полинома -вычислительного и измерительного - должно привести к компромиссному числу слагаемых, удовлетворяющих обоим требованиям и решению поставленной задачи в целом.

Пример применения

Продемонстрируем процедуру применения данной методики на примере построения полиномиальных моделей как баз знаний для двухуровневой интеллектуальной информационно-диагностическая системы (ИИДС) оценки выгодности создания в магистральном газопроводе (МГ) дополнительного кратковременного запаса газа [2, 3].

На первом иерархическом уровне строилась полиномиальная модель количества запаса газа на отдельном участке МГ (71) в факторном пространстве: Х1 - количество газа в трубе на данный момент времени, % от расчётного; Х2 - температура газа в трубе на выходе компрессорной станции, оС; Х3 - техническое состояние на участке между компрессорными станциями, качественная переменная; Х4 - температура окружающей среды, оС; Х5 - степень необходимости создания запаса газа в трубе, качественная переменная.

Факторное пространство сугубо нечеткое, так как даже количественные значения переменных приходится распространять на всю длину оцениваемого участка (около 100 км) магистрального газопровода. Кроме того, качественные переменные многофункциональны по своей сути. Так, например, Х5 учитывает множество положений: можно ли держать запас газа на данном участке, целесообразно ли это из экономических соображений, есть ли «заказ» на дополнительный газ, есть ли потребность увеличения потребления газа в определённый период из-за производственной необходимости, природных условий, конъюнктуры рынка сбыта газа, экономических факторов и т.д. Иными словами, данный фактор берется во внимание лицом, принимающим решения высокого уровня (ЛПРВУ), с учетом так называемого «административного ресурса» и характеризует динамику планирования работы газопровода. Включение данной переменной в факторное пространство объясняется тем, что она характеризует существующее положение дел «за пределами трубы», относящихся к «внешним воздействиям» не природного, а скорее конъюнктурного (возможно даже политического) аспекта во всем его многообразии.

В выбранном факторном пространстве традиционные оценки значимости коэффициентов по критерию Стьюдента объективно не действуют, а ошибку некоторых переменных определить не представляется возможным в принципе. Поэтому воспользуемся приведенной выше методикой.

Путем обработки специальной опросной матрицы [2, 3] были рассчитаны все 26 коэффициентов полинома (1). Для начала работы по методике условно приняли, что все параметры, даже Х5, измеряются с одинаковой ошибкой, например 1,5 % отн. Тогда

суммарная ошибка косвенного измерения по полиному s2aш, согласно закону накопления ошибок, складывается из квадратов ошибок измерений линейных, парных и тройных взаимодействий. Вычислительная же ошибка рассчитывается как остаточная дисперсия вариантов полинома с различным количеством его коэффициентов. Результаты расчётов представлены в табл. 1 и визуализированы, как показано на рис. 1.

Таблица 1

Результаты по обеим процедурам расчётов

№ Количество членов полинома Измерительная процедура Вычислительная процедура

s2 ° ош sош, % ош sош, %

1 25 123 11,0

2 14 56,2 7,5 5,47 2,3

3 10 29,2 5,4 10,5 3,2

4 8 22,5 4,7 16,3 4,0

5 4 9,0 3,0 31,3 5,6

4 8 12 16 20 Количество коэффициентов

24 28

Рис. 1. Графики зависимости ошибки от количества коэффициентов: 1 - линия ошибок измерения; 2 - линия остаточных ошибок по уравнению (2)

Пересечение линий в точке, соответствующей примерно 8 коэффициентам, по данной методике наилучшим образом соответствует решению поставленной задачи. Исходя из этого, в окончательном варианте было выбрано 8 коэффициентов. Результирующее уравнение (1) из 26 слагаемых, после исключения наименьших по модулю коэффициентов, окончательно в стандартизованном масштабе приняло вид:

Y = 26 - 7,97х1+5,63х3+9,38х5 -1,88х1х5 --1 ,88х3х4 - 1 ,88х4х5 - 2,34х1х2х4.

(2)

Построенное таким образом полиномиальное уравнение, согласно принятой методике, должно наилучшим с точки зрения количества коэффициентов уравнения образом представлять мнение эксперта. Поэтому необходимым этапом является проверка адекватности расчетов по полиному (2) экспертным оценкам.

Проверка адекватности уравнения мнению эксперта

Проверка гипотезы адекватности полиномиального уравнения мнению эксперта проводилась путём сравнения расчётных по (2) и фактических (экспертных) значений, как показано на рис. 2.

Экспертные значения, %

Рис. 2. Сравнение рассчитанных по (2) и экспертных значений

Высокий коэффициент корреляции (г = 0,97) и группировка точек вокруг теоретической линии тенденции, проходящей под 45 0 , свидетельствуют о значимости связи и отсутствии систематической ошибки. Тогда, после положительных результатов проведенной проверки, правомерно утверждать, что расчеты по уравнению (2) адекватно представляют знания эксперта по данному конкретному вопросу [2].

Проверка адекватности экспертной модели явлению в целом

На втором уровне ИИДС решалась задача оценки выгодности ситуации создания «горячего» запаса газа в целом для конкретного МГ, состоящего из 4 секций по 100 км между каждой компрессорной станцией, как это имеет место в ООО «Новгородрегионгаз» [2, 3]. Здесь в качестве выходной выбрана переменная Y2 - степень выгодности ситуации, выраженная в долях единицы.

Таким образом, рассматривалась распределённая система из четырех отдельных участков газопровода и оценивалась выгодность ситуации в целом с вычисленными по (2) запасами газа в каждом из них. Построенная таким образом ИИДС - иерархическая, поскольку зависимые переменные модели нижнего уровня выступают в качестве независимых при построении модели верхнего уровня: X1 = Y1I, I = 1,4 .

Процедура построения модели верхнего уровня в данном случае аналогична решению частных задач по каждому из участков [2].

Результирующее уравнение приняло вид:

Y2 = 0,4375 + 0,0625Х1 + 0,0875Х2 +

+ 0,1375Х3 + 0,1625Х4. (3)

Полученная модель существенно линейна.

Анализ уравнения показывает закономерное увеличение влияния уровня запасённого газа от положения участка по отношению к потребителю, т. е. чем ближе к потребителю, тем выше коэффициент его влияния: 0,16 при Х4 против 0,06 при Х1.

Очевидно, что при наличии газа даже на дальних от потребителя участках ситуация, с учётом фактора времени, может оцениваться как выгодная, когда есть возможность успеть осуществить его переброску потребителю.

Адекватность расчетов по созданной ИИДС в виде двух иерархически связанных моделей (2) и (3) практическим ситуациям по поставкам сверхлимитного газа потребителю за счёт правильной прогнозной количественной оценки дополнительного количества газа в трубе убедительно доказывается практическими данными «Новгородрегионгаз» (табл. 2).

Здесь под адекватностью следует понимать совпадение практических ситуаций с оценками по моделям, но не их количественные показатели. Подобная особенность присуща самой постановке задачи и её решениям в конкретных условиях. Так, при наличии вполне благоприятных условий (0,5) создания дополнительного кратковременного запаса газа на всех участках (табл. 2, строка 6), потребовался весь накопленный запас на заполнение подземного хранилища газа (ПХГ). При этом фактор времени не играл роли. В другом случае (строка 9) при явной возможности значительной поставки потребителю понадобилось всего 15 %. Однако во всех рассматриваемых случаях рекомендации ИИДС не противоречили возникающим ситуациям.

Отметим, что адекватность расчетов ИИДС в целом по МГ свидетельствует об адекватности модели количественной оценке дополнительного запаса газа в магистральной трубе по (3) и на каждом отдельном участке по уравнению (2).

Поскольку рассчитанные по формулам (2), (3) и оцениваемые как выгодные прогнозные оценки совпали с реальными ситуациями, прогнозы по построенным моделям можно считать адекватно отражающими реальный процесс принятия решения ЛПРВУ.

Выводы

1. В рамках решаемой задачи выбора наилучшей аппроксимирующей полиномиальной формулы, когда присутствуют неколичественные обобщенные переменные или адекватная оценка по модели не несет необходимости обязательно точного исполнения ситуации в количественном выражении - достаточно лишь факта реализации прогнозируемой ситуации, данная методика полностью оправдала себя. При этом, как следует из выбранного факторного пространства, ЛПРВУ предпочитает именно обобщенную («спрессованную») информацию по каждой из переменных, причём ошибки таких переменных могут быть учтены только неявно.

Таблица 2

Оценка ИИДС выгодности ситуации в целом

№ Дата Тв., °С Ym по (1) Y2, б/р Реальная ситуация

1 2 3 4

1 26.01.2006 -10 42,2 33,5 29,0 41,2 0,53 Поставлено газа потребителю на 40% больше лимита

2 30.02.2006 -3 39,1 28,8 29,7 33,5 0,47 Потребность 30 %, хотя была возможность больше, но не потребовалось

3 12.03.2006 2 29,8 16,0 11,9 25 0,29 На 25% больше, но не потребовалось больше

4 18.04.2006 9 19,9 14,9 23,1 16,8 0,27 25 %

5 30.05.2006 15 22,6 21,3 19,5 23,2 0,31 27 %

6 26.06.2006 28 40,3 30,2 29,6 37,8 0,50 Заполнение ПХГ, потребовался весь газ

7 28.07.2006 20 29,6 23,8 20,2 31,4 0,38 Плановое заполнение ПХГ, поэтому потребовалось 35 %

8 13.08.2006 22 20,7 18,1 15,8 23,6 0,28 23 %

9 25.09.2006 10 29,5 21,8 16,1 15,3 0,18 15 %

10 26.10.2006 5 7,4 6,9 7,4 6,4 0,09 5 %

11 29.11.2006 3 8,9 10,8 11,0 8,3 0,13 10 %, большая часть за счёт промышленности

12 5.12.2006 9 7,0 11,6 11,2 7,1 0,13 10 %

13 27.01.2007 -15 41,7 29,2 30 44,4 0,54 45 %

14 15.02.2007 -20 49,2 37,0 31,1 47,5 0,60 51 %

2. Процедура построения моделей по предлагаемому методу использует опыт и знания эксперта в виде продукционных правил типа «ситуация -принимаемое решение» только при заполнении одного столбца 7 опросной таблицы. Дальнейшая процедура построения модели практически полностью формализована. Исключение составляет выбор критерия выбраковки незначимых коэффициентов, однако благодаря предложенной в данной статье методике сделан еще один шаг в формализации работы эксперта и инженера знаний при решении одного из самых принципиальных вопросов -конструировании критериев адекватности модели изучаемому явлению, в данном случае экспертным оценкам.

Литература

1. Дроздов А.В., Спесивцев А.В. Формализация экспертной информации при логико-лингвистическом описании сложных систем // Изв. РАН. Техническая кибернетика. 1994. № 2. С. 89-96.

2. Уланова Н.Ю., Спесивцев А.В., Тропинов Ю.В. Интеллектуализация как путь повышения эффективности принятия решений в условиях неопределенности // Изв. вузов. Сев.-Кавк. регион. Техн. науки. 2007. № 4. С. 47-49.

3. Спесивцев А.В., Тропинова Н.Ю., Домшенко Н.Г. Об одном методе оценки достаточного количества коэффициентов аппроксимирующего полинома //Сб. докл. Х Междунар. конф. по мягким вычислениям и измерениям SCM 2007. Санкт-Петербург, 2007. С. 179-182.

4. Налимов В.В. Применение математической статистики при анализе вещества. М., 1960.

5. Спесивцев А.В. Управление рисками чрезвычайных ситуаций на основе формализации экспертной информации. СПб., 2004.

6 апреля 2008 г.

Спесивцев Александр Васильевич - канд. техн. наук, доцент, ведущий специалист ЗАО «Технолинк», г. Санкт-Петербург. Тел. (+7 846) 332-42-34.

i Надоели баннеры? Вы всегда можете отключить рекламу.