МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
О ПРИМЕНЕНИИ МЕТОДОВ НЕЧЕТКОГО АНАЛИЗА ДЛЯ ПРОГНОЗА ПОВЕДЕНИЯ ДРЕВЕСИНЫ, ПРОШЕДШЕЙ
гидротермическую обработку
В.Г. САНАЕВ, проф. каф. древесиноведенияМГУЛ, д-р техн. наук,
О.М. ПОЛЕЩУК, проф. каф. высшей математики МГУЛ, д-р техн. наук,
Е.Г. КОМАРОВ, доц. каф. информационно-измерительных систем и технологии приборостроения МГУЛ, канд. техн. наук
Древесина - это материал сложного строения, состоящий главным образом из трех биополимеров: лигнина, целлюлозы и гемицеллюлозы. В дополнение к этим полимерным компонентам древесина может содержать экстрактивные вещества в небольших количествах и несколько классов органических соединений, таких как сахар, танины, терпены, жиры или воск. Следствием сложного строения древесины является возникающая неопределенность (нечеткость) поведения древесины в процессе ее гидротермической обработки.
Гидротермическая обработка древесины - один из процессов, используемых для ее облагораживания, который служит для улучшения естественных свойств древесины, таких как устойчивость к деформации, сопротивляемость биологической коррозии и грибковым заболеваниям [1, 2]. Главными целями промышленной гидротермической обработки являются увеличение биологической стойкости древесины к загниванию, улучшение стойкости к атмосферным воздействиям. При выдерживании древесины в воде происходит разбухание и увеличение веса. При воздействии высоких температур может уменьшаться степень гигроскопичности, разбухания и усушки по причине формирования простых эфирных связей путем разделения двух смежных гидроксильных групп. То есть в результате термической обработки и термической деструкции уменьшается разбухание, и древесина теряет свой вес. Потеря массы зависит от температуры, времени и преобладающих условий термической обработки, а также размера образца. С другой стороны, в результате термической обработки древесина становится более хрупкой, ее прочность
[email protected]; [email protected]
на изгиб и растяжение уменьшаются. Таким образом, учитывая сложность строения древесины, и, как, следствие, неопределенность поведения в процессе гидротермической обработки, представляется актуальной задача прогнозирования поведения древесины при разных режимах этой обработки.
Чтобы понять, почему в данной работе предлагается аппарат нечеткого анализа, давайте рассмотрим следующие высказывания: «При длительной гидротермической обработке в древесине накапливаются продукты гидролиза полисахаридов», «древесина имеет весьма существенные недостатки: высокую горючесть, склонность к гниению, гигроскопичность, которая приводит к трещинообразованию и частичной потере несущей способности». В этих высказываниях используются слова естественного профессионального языка, такие как «длительная гидротермическая обработка», «высокая горючесть», «весьма существенные недостатки», «частичная потеря несущей способности». Использование таких терминов не является искусственно созданным исключением, это норма при описании и оценивании происходящих процессов. Но для того, чтобы учесть накопленный опыт экспертов, заставить этот опыт работать в рамках той или иной модели, высказывания нужно формализовать в рамках определенной теории. Что в этом плане может предложить классическая теория множеств? Например, понятие «длительная гидротермическая обработка» может быть задано временным отрезком [xm, хм] или характеристической функцией, изображенной на рис. 1.
Характеристическая функция принимает два значения - единица, когда время обработки принадлежит отрезку [xm, xM] и ноль,
148
ЛЕСНОЙ ВЕСТНИК 3/2011
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
1
XM
X
Рис. 1. Характеристическая функция множества, формализующего понятие «длительная гидротермическая обработка»
Рис. 2. Функция принадлежности нечеткого множества, формализующего понятие «длительная гидротермическая обработка»
когда не принадлежит. Тогда два временных значения x x3 считаются близкими в рамках такой формализации (они принадлежат отрезку [j1 xM]), а временные значения x x2 различными, хотя они гораздо ближе друг к другу, чем временные значения x2, x3. Получается некий парадокс, в результате чего компьютерная модель (созданная на основе предложенной формализации) может видеть фактически близкие ситуации как разные, а более физически различные - как одинаковые. Данная ситуация может привести к тому, что выводы, полученные при анализе такого рода моделей, не будут соответствовать представлениям экспертов.
Рассмотрим формализацию понятия «длительная гидротермическая обработка» с позиции теории нечетких множеств [3] по сути, не давая четких определений. Во-первых, человек никогда не мыслит скачкообразно, это не свойственно его мышлению. Если посмотреть на рис. 1, то там как раз присутствует эта скачкообразность. Более простой пример можно привести с оценкой роста человека. Например, мы не говорим, что рост мужчины 1.75 см является средним, а вот рост 1.76 см уже высоким. Здесь нужно еще учитывать, какой национальности мужчина. Например, мужчины острова Бали с ростом 1.75 см считаются очень высокими.
Обратимся к рис. 2, на котором представлена функция принадлежности нечеткого множества «длительная гидротермическая обработка». Во-первых, присутствует плавность перехода от одного значения к другому, во-вторых временные значения х1 и х2 видятся моделью как близкие, в-третьих, значение функции принадлежности можно трактовать
как степень уверенности эксперта в том, что конкретное временное значение действительно является длительной обработкой древесины и эта степень уверенности меняется от нуля до единицы, что более логично, чем описание степени уверенности эксперта только двумя значениями - ноль или единица. Кроме этого, компьютерная модель, построенная на основе этой формализации, будет воспринимать фактически близкие ситуации как похожие, а значит, будет более адекватной действительности [4].
Нечеткий логический контроллер (классификатор)
Рассмотрим структурную схему нечеткого лингвистического контроллера, представленную на рис. 3.
Возможность построения нечетких контроллеров предоставляет, например, программный комплекс MatLab/Simulink. Входной информацией нечеткого логического контроллера является числовая информация, поступающая с объекта управления. Эти данные поступают в блок под названием «Фаззификатор», где числовым значениям в соответствие ставятся их лингвистические значения. Например, входной информацией нечеткого логического контроллера для прогноза разбухания древесины и увеличения ее веса являются числовые значения двух переменных - температура термической обработки (в градусах) и время выдерживания в воде (в часах). Выходной информацией являются разбухание образца древесины (в миллиметрах) и увеличение веса (в граммах). Для входных и выходных переменных определяются уровни лингвистических шкал и осу-
ЛЕСНОИ ВЕСТНИК 3/2011
149
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рис. 3. Структурная схема нечеткого контроллера
Рис. 5. Лингвистическая переменная «Время выдерживания образца древесины в воде»
150
ЛЕСНОЙ ВЕСТНИК 3/2011
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рис. 6. Функция принадлежности терма «Нормальная температура термической обработки древесины»
ществляется построение соответствующих лингвистических переменных. Определение входных и выходных лингвистических переменных контроллера, так же как и правил нечеткого логического вывода, основано на практических (экспертных) знаниях и на интуиции. Таким образом, необходимой составляющей нечеткого контроллера является база знаний. Для температуры термической обработки предлагается использовать следующие уровни - очень низкая, низкая, нормальная, невысокая и высокая, для времени выдерживания в воде испытательных образцов - очень малое, малое, достаточно малое, нормальное, небольшое, большое и очень большое. Количество уровней для лингвистических переменных определяется на основе практических (экспертных) знаний, кроме этого разработан метод определения оптимального множества лингвистических шкал [5]. Лингвистические переменные для температуры термической обработки и времени выдерживания в воде представлены соответственно на рис. 4 и 5.
Как видно из этих рисунков, в качестве функций принадлежности термов (значений) лингвистических переменных выбраны треугольные функции принадлежности. Однако, опираясь на опыт экспертов, могут быть выбраны трапецеидальные функции принадлежности (графиком которых являются трапеции). Отличие треугольной и трапецеидальной функций принадлежности нечеткого множества состоит в том, что в случае треугольной функции принадлежности множество имеет одного типичного представителя
Рис. 7. Функция принадлежности терма «Нормальная температура термической обработки древесины»
(точку), а в случае трапецеидальной функции принадлежности множество имеет несчетное число типичных представителей (отрезок).
Чтобы лучше понять суть треугольных и трапецеидальных нечетких чисел (функции принадлежности которых являются соответственно треугольниками или трапециями), давайте рассмотрим функции принадлежности терма «Нормальная температура термической обработки», которые представлены соответственно на рис. 6 и 7.
Из вида функции принадлежности на рис. 6, следует, что температура 104° является типичной для рассматриваемого терма и степень уверенности в этом равна 1. Значения температуры 66° и 142° не принадлежат этому терму (степень уверенности в их принадлежности равна нулю), значения температуры от 66° до 142° принадлежат рассматриваемому терму с разными степенями уверенности, которые больше нуля и меньше единицы.
Из вида функции принадлежности на рис. 7, следует, что значения температуры от 100° до 108° являются типичными для рассматриваемого терма и степень уверенности в этом равна 1. Значения температуры 66° и 142° не принадлежат этому терму (степень уверенности в их принадлежности равна нулю), значения температуры от 66° до 100° и от 108° до 142° принадлежат рассматриваемому терму с разными степенями уверенности, которые больше нуля и меньше единицы.
Для выходных переменных (разбухание и увеличение веса) предлагается использовать следующие уровни - очень малое,
ЛЕСНОИ ВЕСТНИК 3/2011
151
39,50 40,06 40,62 41,18 41,75
Разбухание (мм)
Рис. 8. Лингвистическая переменная «Разбухание древесины»
Рис. 9. Лингвистическая переменная «Увеличение веса древесины»
малое, нормальное, небольшое и большое Лингвистические переменные для набухания и увеличения веса представлены соответственно на рис. 8 и 9.
После построения лингвистических переменных блок «Фаззификатор» ставит в соответствие числовым значениям переменных их лингвистические значения, то есть значения функций принадлежности соответствующих термов. Далее лингвистические значения поступают в блок системы нечеткого логического вывода, для построения которого используется опыт экспертов и, возможно, их интуиция. Правила логического вывода строятся по принципу ЕСЛИ....И..., ТО.... Например: «Если температура термической обработки нормальная и время выдерживания нормальное, то разбухание малое» или «Если температура термической обработки
невысокая и время выдерживания небольшое, то разбухание нормальное». После применения этой системы в блок «Дефаззификатор» поступает функция принадлежности выходной переменной, где по одному из известных правил этой функции принадлежности в соответствие ставится число, которое является прогнозным значением выходной переменной и может использоваться для выработки управляющих воздействий.
Достаточно часто для построения системы нечеткого логического вывода используется алгоритм Мамдани [6].
Чтобы понять работу этого алгоритма, рассмотрим две входные переменные X, Y, выходную переменную Z и упрощенную систему из двух нечетких правил вывода если X есть Л1 и Y есть B1, то Z есть C1, если X есть Л2 и Y есть B2, то Z есть C2,
152
ЛЕСНОЙ ВЕСТНИК 3/2011
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рис. 10. Функции принадлежности переменной X Рис. 11. Функции принадлежности переменной Y
Через A A2 обозначены термы лингвистической переменной X, через B1, B2 термы лингвистической переменной Y, через C1, C2 термы лингвистической переменной Z. Функции принадлежности лингвистических переменных X, Y, Z обозначены соответственно через дA , дв , дс , i = 1,2 и представлены на рис. 10-12.
Алгоритм Мамдани включает 4 этапа.
1. Фаззификация. Функции принадлежности дa , ДB , i = 1,2 применяются к физическим (фактическим) значениям x у0 переменных X, Y.
2. Нечеткий вывод.
ai = тт(да (хо X дв1 (Уо ^ а2 = min(Да2 (Хо ), Дв2 (Уо)).
Определение усеченных функций принадлежности переменной Z
дс; = Дс1 (^,
Дс1 = min(a 2, Дс2 (z)).
3. Композиция. Объединение усеченных функций принадлежности.
Д^ (z) = тах(Дс; (z) Дс1 (z)) .
4. Дефаззификация. Для непрерывного случая
12Д^ (z)dz
z = —---------.
0 |дЕ (z)dz
—
Для дискретного случая
z0
Е zi^£ (z) Ед^ (z)
i
Пусть x0 = 5, Уо = дa2 (5) = 0,25, дB1 (4,8)
4,8, тогда д а1 (5) = 0,75, = 0,1, дв2 (4,8) = 0,9.
ai = min(д a (хо), д b1 (Уо)) = min(0.75,аГ) = 0,1, a2 = тт(дa2 (хо), дв2 (Уо)) = min(0 25,0.9) = 0,25 .
Композиция усеченных функций принадлежности представлена на рис. 13.
Этап дефаззификации дает результат
4.2 4.5 8
| 0,1xdx + | (0,5x - 2)xdx + J 0,25xdx
z = _3_______4.2______________45________ =
Z0 ~ 4.2 4.5 8 _
J 0,1dx + J (0,5x - 2)dx + J 0,25dx
3 4.2 4.5
= (0,05(4,22 - 32) + 0,167(4,53 - 4,23) - (4,52 - 4,22) + + 0,125(82- 4,52)) / (0,1(4,2 - 3) + 0,25(4,52 - 4,22) -
- 2(4,5 - 4,2) + 0,25(8 - 4,5)) = 5,86.
Схема использования нечеткого логического контроллера для прогноза разбухания древесины и увеличения ее веса представлены на рис. 14.
Нечеткие логические контроллеры хорошо зарекомендовали себя в тех проблемных областях, где используется опыт экспертов, а построение прогнозных моделей и моделей принятия решений на основе классических математических методов очень сложно или практически невозможно. Гораздо проще задать систему логических правил в рамках профессионального языка экспертов и соответственно обойтись без построения сложных математических конструкций. Как показывает практика, средняя точность прогноза при использовании нечеткого логического контролера составляет более 90 %.
Нечеткая регрессионная модель
Для прогноза значений характеристик и изучения зависимостей между различными характеристиками традиционно использу-
ЛЕСНОИ ВЕСТНИК 3/2011
153
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рис. 12. Функции принадлежности переменной Z
ются методы классического регрессионного анализа. Общая задача исследования зависимостей, осуществляемая в рамках классического регрессионного анализа, может быть сформулирована следующим образом: по результатам N измерений x.p xi2,..., x.m, y ,, i = 1,N переменных X1, X2,..., Xm, Y построить такую функциюfX), X = (X1, X2,..., Xm)T, (Г-знак транспонирования), которая бы наилучшим (в определенном смысле) образом восстанавливала значения переменной Y по значениям переменных X X ..., X Частным случаем этой общей задачи является задача построения линейной регрессионной модели f(X) = a + aX + a2X2 + ... + a X + e, где e является ошибкой регрессии. Обычно предполагается, что e имеет нормальное распределение с нулевым математическим ожиданием и дисперсией, равной о2. Неизвестные коэффициенты регрессии находятся, например, методом наименьших квадратов. Выходная характеристика имеет исходные значения и модельные значения, которые в общем случае различны. Между модельными и исходными значениями находятся расстояния, потом эти расстояния возводятся в квадрат и складываются. Неизвестные коэффициенты регрессии находят при условии минимума полученной суммы квадратов расстояний (отсюда название метод наименьших квадратов). Прогнозным значением выходной характеристики является число или интервал с заданным уровнем доверия.
Аппарат классического регрессионного анализа до работы H. Tanaka [7] не имел альтернатив и традиционно применялся во всех областях деятельности человека. Появле-
y
3 4,2 4,5 8 x
Рис. 13. Композиция усеченных функций принадлежности
ние первой нечеткой регрессионной модели, разработанной H. Tanaka, было результатом долгих исследований, направленных на то, чтобы повысить точность модели и избавиться от необходимости делать предположение (возможно ошибочное) о виде распределения ошибок регрессионной модели (как уже было сказано, обычно предполагается, что ошибки имеют нормальное распределение).
С работы H. Tanaka началось развитие методов нечеткого регрессионного анализа, которые доказали на практике свою состоятельность и эффективность [8]. Входными и выходными исходными данными нечеткой регрессии могут быть обычные числа и нечеткие множества, коэффициентами нечеткой регрессии также могут быть как обычные числа, так и нечеткие множества. Главное отличие классической и нечеткой регрессий состоит в том, что ошибки классической регрессии считаются случайными величинами, а ошибки нечеткой регрессии считаются нечеткими множествами. Таким образом, в нечеткой регрессии нет необходимости делать предположение о виде вероятностного распределения ошибок, которое к тому же может быть ошибочным.
Для прогноза переменных Y1 = «Разбухание древесины в результате гидротермической обработки» и Y2 = «Увеличение веса древесины в результате гидротермической обработки» предлагается использовать нечеткие регрессионные модели, входными переменными которых являются X1 = «Температура термической обработки древесины» и X2 = «Время выдерживания древесины в воде». Принцип построения таких моделей разрабо-
154
ЛЕСНОЙ ВЕСТНИК 3/2011
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Рис. 14. Схема использования нечеткого логического контроллера при прогнозе поведения древесины
тан в [9, 10]. Зависимость между входными и выходными переменными находится в виде
Y = cIq + ci'^Xi + a2X2, i = 1,2,
где aj, i = 1,2, j = 0,2 - нечеткие числа с треугольными функциями принадлежности,
или в виде[11]
Y = a0 + d-jX^ + a2X2, + a^X^ +
+C4X4 + a’5X1X2, i = 1,2,
где aj, i = 1,2, j = 0,5 - нечеткие числа с треугольными функциями принадлежности.
При построении этих моделей и определении параметров неизвестных коэффициентов регрессии использованы некоторые принципы построения классической регрессии. Основной трудностью является не столько определение расстояния между исходными и модельными данными, поскольку исходные данные являются обычными числами, а мо-
дельные данные нечеткими числами, сколько полезность этого определения для построения модели. Поэтому, проанализировав известные определения расстояний для нечетких чисел, авторы пришли к необходимости определения агрегирующего интервала для нечетких чисел [12]. До этого определения существовали только точечные агрегирующие показатели, но они не позволяли учесть все информационные особенности нечетких данных. На основе этих агрегирующих интервалов были определены расстояния между нечеткими числами (как декартово расстояние между двумя точками на плоскости). Далее были найдены расстояния между исходными и модельными выходными данными, после чего для них был реализован метод наименьших квадратов. Прогнозное (модельное выходное) значение может быть представлено в виде нечеткого числа, четкого (обычного) числа и интервала с заданным уровнем доверия. Только мерой доверия в данном случае
ЛЕСНОЙ ВЕСТНИК 3/2011
155
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
выступает не вероятностная мера, а мера возможности.
Новое определение расстояния между нечеткими числами позволило построить числовые показатели качества этих нечетких моделей, а именно - аналог стандартного отклонения, аналог оценки стандартной ошибки и аналог коэффициента детерминации. Эти показатели имеют приставку «аналог», поскольку подобные показатели есть в классическом регрессионном анализе и после построения аналогичных показателей для нечетких моделей появилась возможность объективного сравнительного анализа моделей, построенных в рамках разных математических теорий. Вообще говоря, эти математические теории не такие уж и разные, поскольку понятие нечеткого множества является обобщением понятия обычного (классического) множества, а аппарат нечеткого регрессионного анализа является обобщением классического регрессионного анализа. Несомненно, оперировать с нечеткими множествами гораздо сложнее, чем с обычными множествами, но наградой за эту сложность является повышение точности моделей, их адекватность действительности, возможность оперировать словами естественного языка и учитывать опыт экспертов. Как показывает практика, средняя точность прогноза при использовании нечетких регрессионных моделей составляет более 90 %.
Таким образом, нечеткий регрессионный анализ в состоянии дать возможность учета и успешной обработки нечеткости, которая возникает при гидротермической обработке древесины в силу ее достаточно сложного строения.
Заключение
Древесина поглощает влагу вследствие гигроскопичности. Толщина и вес древесины изменяются в зависимости от условий окружающей среды. Эти изменения в древесном материале нежелательны, их стремятся минимизировать путем термической обработки. В работе предлагаются два подхода на основе нечеткого анализа для прогноза разбухания древесины и увеличения ее веса в зависимости от температуры термической обработки
и времени выдерживания древесины в воде. Первой моделью является нечеткий логический контроллер (классификатор), в основе которого лежит аппарат нечеткой логики. Существенным достоинством нечеткого контроллера является возможность описывать сложные взаимосвязи параметров на основе логических правил в рамках естественного языка. Второй моделью является нечеткая регрессионная модель, которая в случае подходящих характеристик качества позволяет определить зависимость между входными и выходными характеристиками в явном аналитическом виде. Разработанные модели предлагается использовать на различных этапах изготовления изделий из древесины.
Разработанные модели характеризуются высокой степенью устойчивости результатов обработки полученных данных, которая достигается за счет корректного представления (формализации) разнородной информации, а также за счет использования методов обработки данных, сочетающих в своей основе несколько теорий учета и обработки разных типов неопределенности. Интеллектуальность анализа этой информации достигается за счет применения логических построений, формализующих мыслительную работу экспертов. Самонастройка выводов поддерживается самообучением системы на основе апостериорных статистических и экспертных данных.
Библиографический список
1. Расев, А.И. Г идротермическая обработка и консервирование древесины: учебное пособие / А.И. Расев. - М.: Форум, 2010. - 416 с.
2. Mazela, B., Zakrzewski, R., Kowiak, G.W., Cofta, G., Bartkowiak, M. Resistance of thermally modified wood to basidiomycetes // Wood Technology. - 2004.
- Vol. 7 (1). Pp. 253-262.
3. Zadeh, L.A., (1994), Soft computing and fuzzy logic. IEEE Software, 48-56.
4. Полещук О.М., Комаров Е.Г. Методы и модели обработки нечеткой экспертной информации. - М.: Энергоатомиздат, 2007. - 288 с.: ил.
5. Полещук О.М. О применении нечетких множеств в задачах построения уровневых градаций // Лесной вестник. - 2000. - №4 (13). - C.142 - 146.
6. Mamdani E.H., Assilian S. An Experiment in Linguistic Synthesis with Fuzzy Logic Controller // Int. J. Man-Machine Studies. - 1975. - Vol. 7. - №1.
- Pp.1-13.
156
ЛЕСНОЙ ВЕСТНИК 3/2011