УДК 630.43
ПРОВЕРКА АДЕКВАТНОСТИ И ТОЧНОСТИ МОДЕЛИ РАСПРОСТРАНЕНИЯ КРОМКИ ПРИРОДНОГО ПОЖАРА ОСНОВАННОЙ НА МЕТОДЕ ПОДВИЖНЫХ СЕТОК
С.В. Яровой, Г.А. Доррер
ФГБОУ ВО «Сибирский государственный технологический университет», Красноярск, пр. Мира 82, e-mail: [email protected]
Рассматривается математическая модель для прогнозирования распространения кромки лесного пожара, основанная на методе подвижных сеток. Произведена оценка адекватности и точности реализованной модели, путем сравнения показателей, полученных на модели, с фактическими данными. В качестве фактических данных были использованы нормативные данные площадей лесных пожаров при разной продолжительности их действия и различных среднесуточных скоростях распространения огня по фронту (Указания по обнаружению..., 1995).
Для каждого значения скорости распространения фронта пожара из таблицы фактических данных было смоделировано по 5 низовых лесных пожаров, время распространения которых продолжалось 10 часов. Общее количество смоделированных пожаров - 35. Для каждого пожара каждый час записывались данные о текущем значении общей площади пожара. Моделирование производилось при различных скоростях и направлении ветра, а также различной штилевой скорости горения растительных материалов.
Для проверки точности были рассчитаны различные показатели ошибок, такие как MAE (средняя абсолютная ошибка), MAPE (средняя относительная ошибка), MPE (средняя процентная ошибка), MSE (среднеквадратичная ошибка).
Проверка адекватности осуществлялась статистическими методами. Для корректного использования статистических критериев проведена оценка нормальности исходных выборок, которая показала, что закон распределения, которому принадлежит исходная выборка, значительно отличается от нормального закона. Таким образом, для проверки адекватности реализованной модели были использованы непараметрические аналоги критериев Стьюдента и Фишера - критерий Вилкоксона для связных выборок (Wilcoxon signed-rank test) и критерий Сиджела-Тьюки (Siegel-Tukey test).
Проведенная проверка показала адекватность и достаточно высокую точность модели, а также ее пригодность для практического использования, в частности, в тренажерных системах.
Ключевые слова: математические методы моделирования, природные пожары, метод подвижных сеток, учебный тренажер, адекватность модели, статистические методы.
A mathematical model to predict the spread of the edge of a forest fire, based on the method of mobile grid is discussed. It was verified the accuracy and adequacy of the model, by comparing the data obtained from the model with actual data. As actual data were used normative data area of forest fires in the different duration of their action and the various daily average speeds of fire spread to the front [6].
For each value of the speed of fire spread on the front in the table with actual data it was modeled on 5 grassroots forest fires, propagation time which lasted 10 hours. A total of 35 simulated fire. For each fire every hour recorded information on the current value of the total area of the fire. Modeling was performed at different wind speed and direction, as well as various calm the burning rate of plant materials.
To check the accuracy was calculated various errors, such as MAE (mean absolute error), MAPE (mean absolute percent error), MPE (mean percentage error), and MSE (mean square error).
Adequacy test carried out by statistical methods. For correct use of statistical tests was a checked normality original sample. Test showed that the distribution, which owns the original sample, is significantly different from the normal law. Thus, to test the adequacy of sales models have been used nonparametric analogues of Student's t test and Fisher - Wilcoxon signed-rank test and Siegel-Tukey test.
The adequacy and high level accuracy of the model and it's usability for practical using in training systems is shown.
Keywords: mathematical modeling, wildfires, method of moving grids, training simulator, adequacy of the model, statistical methods.
ВВЕДЕНИЕ
Природный пожар - неконтролируемый процесс горения, стихийно возникающий и распространяющийся в природной среде. Данный термин объединяет лесные, торфяные и степные пожары. Природные пожары наносят огромный экономический и экологический ущерб регионам, на которых они возникают. Для эффективной борьбы с природными пожарами требуется разработка различных информационных
систем, позволяющих не только моделировать поведение природного пожара (системы BehavePlus (Andrews, 2003.), FARSITE (Finney, 1998)), но и осуществлять подготовку и переподготовку персонала, занятого в службах охраны лесов.
В ходе работы над данной проблемой авторами была разработана учебно-тренажерная система «Тай-га-3» (Яровой и др. 2015). Данная система позволяет моделировать лесопожарные ситуации, а также предоставляет пользователю различные средства
для борьбы с пожаром в реальном времени. Подобные разработки уже осуществлялись ранее (Доррер, 2008), однако на сегодняшний день они устарели как морально, так и технически.
В системе «Тайга-3» для построения контура низового лесного пожара была использована геометрическая модель, основанная на уравнении Гамильто-на-Якоби и методе подвижных сеток (Доррер, 2008), который впервые был предложен С.К. Годуновым в задачах газовой динамики (Годунов, 1972).
Чтобы судить о качестве выбранной модели, необходимо проанализировать систему показателей, характеризующих как адекватность модели, так и ее точность. В общем случае под адекватностью понимают степень соответствия модели тому реальному явлению или объекту, для описания которого она строится. О точности модели можно судить по величине ошибки (погрешности) прогноза. Таким образом, целью данного исследования стала проверка адекватности и точности модели распространения кромки пожара, реализованной в учебно-тренажерной системе для специалистов лесопожарной службы «Тайга-3».
ОПИСАНИЕ МЕТОДА МОДЕЛИРОВАНИЯ
В выбранной модели контур процесса в каждый момент времени рассматривается как непрерывная дифференцируемая линия на плоскости. Уравнение этой линии имеет вид ф(х, у, 0=0. В каждой точке контура выполняется условие неразрывности dф/ dt=0. Алгоритм расчета данным методом основан на численном интегрировании семейства характеристик уравнения Гамильтона-Якоби:
^ + ит%га(1(р = + ип\ &га<1(р |= 0, ш ш
где и = [и^ иу]г - вектор скорости, gradф=[dф/dx, dф/ йу]- вектор нормали к контуру, gradф/\gradф\ - единичный вектор нормали к контуру, и = ^гайф/^гайф\) и - величина нормальной скорости. Значок Т означает транспонирование.
Начальные условия для данного уравнения должны быть заданы на начальном многообразии Л0.В результате решения получается два массива: массив координат точек фронта и массив норма-
лей к фронту в этих точках р 0 = р .^,а>), I е N(0. Для описания структуры контура для каждой точки указываются номера соседних точек.
Таким образом, каждая точка контура C^ (/) характеризуется вектором (рисунок 1):
где х.(^), - координаты точки на плоскости; р (С) -вектор внешней нормали к контуру, L(i) - номер соседней точки предыдущей точки контура; R(i) - номер следующей точки контура.
Для расчета следующего состояния контура используются следующие данные:
• скорость распространения пожара v0
• индикатриса нормальной скорости £ (р, w)
Приращение координат в точке Ci(t) производится по формулам
Xi(t + At) = x(t) + Vo£„ , w)At c°s a,
y i(t + At) = y i(t) + votn (P, w)At Sin a,
где р — угол между нормалью к контуру в точке Ci (t) и направлением ветра w, a — угол между нормалью к контуру в точке C (t) и горизонтальной осью.
При реализации алгоритма расчета в тренажере, контур был представлен в виде массива, каждый элемент данного массива C . представляет собой запись, содержащую следующие поля - (X, Y, NX, NY, L, R), где:
X, Y - координаты точки на плоскости;
NX, NY- координаты вектора нормали к контуру;
L, R - номера точек, расположенных слева и справа от C .. Для расчета состояния контура на следующем шаге используется вектор ветра и скорость горения поверхности.
J
Рисунок 1 - Представление контура пожара в методе подвижных сеток
X, Y, NX, NY - имеют вещественные значения, а L и R - целые значения. Для обхода контура используется номер стартовой точки для обхода start. Точка контура, которая имеет данный номер в массиве, считается стартовой, и с нее всегда начинается обход контура. Обход контура осуществляется с помощью ссылок на левую и правую точки. При удалении точки из контура, точки из массива физически не удаляются, происходит перестановка значений L и R у соответствующих точек.
Сам алгоритм, основанный на методе подвижных сеток, приведен в (Finney, 1998).
ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬ
Проверка точности и адекватности модели может производиться путем сравнения показателей, полученных на модели, с фактическими данными, а также путем экспертного анализа. Второй способ часто используется для проверки моделей проектируемых систем, т.е. в ситуациях, когда реальная система во-
обще не существует. В нашем случае, предпочтительней воспользоваться первым вариантом.
В качестве реальных данных можно использовать статистические данные о природных пожарах, либо воспользоваться различными системами мониторинга состояния лесов. Наиболее популярной из таких систем является Информационная система дистанционного мониторинга лесных пожаров Федерального агентства лесного хозяйства РФ (ИСДМ-Рослесхоз). Данная система позволяет получить подробную информацию о площади каждого пожара на конкретную дату.
Выбор источника фактических данных для проверки модели зависит от цели моделирования. При разработке учебно-тренажерной системы «Тай-га-3» задача наиболее точного моделирования динамики одного конкретного пожара не ставилась. Для обучения специалистов лесопожарной службы необходимо моделировать динамику кромки пожара таким образом, чтобы средние значения показателей моделируемых пожаров совпадали с данными статистики. Таким образом, для проверки
точности и адекватности реализованной модели, в качестве фактических данных были использованы данные статистики, опубликованные в (Указания... 1995) (таблица 1).
Для каждого значения скорости распространения фронта пожара из таблицы 1 было смоделировано по 5 низовых лесных пожаров, время распространения которых продолжалось 10 часов. Общее количество смоделированных пожаров - 35. Для каждого пожара каждый час записывались данные о текущем значении общей площади пожара. Моделирование производилось при различных скоростях и направлении ветра, а также различной штилевой скорости горения растительных материалов. Пример моделирования одного пожара при разной продолжительности действия приведен на рисунках 2-4.
В результате эксперимента были получены данные, приведенные в таблице 2. В качестве значений площадей в таблице 2 принято среднее арифметическое 5 пожаров, смоделированных при равном значении скорости распространения фронта. В таблице значения округлены до тысячных долей.
Таблица 1 - Фактические площади (га) лесных пожаров при разной продолжительности их действия и различных среднесуточных скоростях распространения огня по фронту
Скорость распространения
Время с момента возникновения пожара, ч
фронта пожара, м/мин 1 2 3 4 5 6 7 8 9 10
3,0 2,5 10,0 22,0 40,0 62,0 90,0 120,0 160,0 200,0 250,0
2,5 1,8 7,0 16,0 28,0 42,0 63,0 86,0 112,0 142,0 175,0
2,0 1,2 4,7 11,0 20,0 30,0 43,0 58,0 76,0 95,0 118,0
1,5 0,7 2,9 6,6 12,0 18,0 26,0 36,0 47,0 60,0 73,0
1,0 0,4 1,5 3,4 6,0 10,0 14,0 19,0 24,0 31,0 38,0
0,5 0,1 0,6 1,8 2,4 3,7 5,3 7,3 9,5 12,0 14,8
0,25 0,07 0,3 0,6 1,1 1,7 2,4 3,3 4,3 5,4 6,7
Рисунок 2 - Скорость распространения фронта -2 м/мин, время с момента возникновения - 2 ч, ветер под пологом леса - ю/з 0,7 м/с, площадь пожара - 4,7208 га
Рисунок 3 - Скорость распространения фронта -2 м/мин, время с момента возникновения - 5 ч, ветер под пологом леса - ю/з 0,7 м/с, площадь пожара - 35,266 га
Рисунок 4 - Скорость распространения фронта -2 м/мин, время с момента возникновения - 9 ч, ветер под пологом леса - ю/з 0,7 м/с, площадь пожара -109,7189 га
Таким образом, для проверки точности и адекватности реализованной модели из таблицы 1 и 2 были сформированы две выборочные совокупности. Данные совокупности являются связанными и представлены в таблице 3. В данной таблице в столбце 5факг приведены фактические значения, в столбце £мод - полученные в результате моделирования.
По полученным выборкам рассчитали различные показатели ошибок, т.е. расхождений между фактическими значениями площадей и значениями, полученными в результате моделирования.
Таблица 2 - Площади (га) лесных пожаров при разной продолжительности их действия и различных среднесуточных скоростях распространения огня по фронту, полученные в результате моделирования
и, , м/ Время с момента возникновения пожара, ч
1 2 3 4 5 6 7 8 9 10
3,0 2,586 9,809 22,342 39,922 62,378 90,274 122,399 157,257 198,427 242,137
2,5 1,700 6,564 15,390 27,662 43,197 63,174 85,453 112,516 141,197 173,246
2,0 1,127 4,701 10,985 20,105 31,349 44,488 60,251 78,033 96,965 119,182
1,5 0,667 2,728 6,556 12,017 18,945 27,185 36,642 47,543 59,457 72,954
1,0 0,398 1,551 3,513 6,244 9,414 13,363 17,979 23,257 29,338 36,605
0,5 0,104 0,561 1,453 2,680 4,116 5,778 7,629 9,721 12,103 14,772
0,25 0,084 0,361 0,729 1,211 1,797 2,492 3,302 4,232 5,279 6,420
Средняя абсолютная ошибка (MAE)
МАЕ = ^ f |<WS^l =0,6673:га
Данная ошибка имеет ту же размерность, что и прогнозируемый показатель, зависит от масштаба измерения уровней временного ряда. В нашем случае получили среднюю ошибку, равную 0,6673 га, что является хорошим показателем при прогнозировании крупного пожара (более 25 га), однако для мелких пожаров (до 2 га) данная ошибка довольно велика. Таким образом, для оценки точности модели распространения пожара использовать ошибку MAE не совсем корректно, т.к. существует большой разброс фактических значений (от 0,01 га до 250 га и более).
Таблица 3 - Выборочная совокупность площадей (га) смоделированных и фактических лесных пожаров
i 5ф факт 5 мод i 5ф факт 5 мод i 5ф факт 5 мод
1 0,07 0,08428 25 6,24382 6 49 38 36,60518
2 0,1 0,10366 26 6,55618 6,6 50 40 39,92176
3 0,3 0,36072 27 6,42014 6,7 51 42 43,19744
4 0,4 0,39828 28 6,56426 7 52 43 44,48808
5 0,6 0,72864 29 7,6293 7,3 53 47 47,54302
6 0,6 0,56102 30 9,72066 9,5 54 58 60,25124
7 0,7 0,6668 31 9,41364 10 55 60 59,45732
8 1,1 1,211 32 9,80928 10 56 62 62,37782
9 1,2 1,12732 33 10,98496 11 57 63 63,17396
10 1,5 1,55102 34 12,10258 12 58 73 72,95426
11 1,7 1,79652 35 12,01726 12 59 76 78,03288
12 1,8 1,45342 36 13,3629 14 60 86 85,4532
13 1,8 1,69954 37 14,77158 14,8 61 90 90,27434
14 2,4 2,49174 38 15,3896 16 62 95 96,96458
15 2,4 2,68038 39 18,94494 18 63 112 112,51552
16 2,5 2,58644 40 17,9794 19 64 118 119,18234
17 2,9 2,72818 41 20,10542 20 65 120 122,39942
18 3,3 3,3019 42 22,3417 22 66 142 141,19664
19 3,4 3,51328 43 23,2574 24 67 160 157,25676
20 3,7 4,11642 44 27,18454 26 68 175 173,24632
21 4,3 4,23186 45 27,66154 28 69 200 198,42654
22 4,7 4,70062 46 31,34916 30 70 250 242,13722
23 5,3 5,77822 47 29,33824 31
24 5,4 5,27852 48 36,64242 36
Средняя относительная ошибка (MAPE)
* 100% = 4,085%
1 N —S
-т г 1 г* у—i I V1 факт мод
МАРЕ - — > —-
ЛТ t—i о
оценке точности прогноза. МАРЕ подчеркивает, насколько велики ошибки прогноза в сравнении с действительными значениями ряда. Данный метод в особенности хорош тогда, когда фактические значения ряда велики. Если же фактические значения временного ряда близки к 0, то в знаменателе окажется очень маленькое число, что сделает значение MAPE близким к бесконечности. Например, фактическая площадь пожара S, = 0,1 га, a прогнозная S = 1
А факт ' ' А мод
га, тогда MAPE = 100%*|0,1 - 1|/0.1 = 900%, хотя в действительности мы ошиблись, всего на 0,9 га, что для крупных пожаров не является критичным. Таким образом, ошибку MAPE рекомендуется использовать для пожаров, площадь которых превышает 1 га. Для пожаров, площадь которых не превышает 1 га, лучше использовать ошибку MAE.
Полученная относительная ошибка позволяет оценить точность реализованной модели, как высокую, т.к. значение средней относительной ошибки менее 10%. Т.е. площади моделируемых пожаров практически не отличаются от статистических данных.
Средняя процентная ошибка (MPE)
МРЕ = - ffe
NU S.
факт
$мод)
100% = -1,011%
факт
N ^ и
1=1 факт
Этот подход полезен в том случае, когда размер или значение прогнозируемой величины важны в
Используется для оценки смещения прогноза моделируемой величины. Данная оценка показывает, является ли прогноз переоценивающим или недооценивающим.
Т.к. -1,011% < 0, то прогноз считается переоценивающим, т.е. характерно систематическое завышение прогнозируемого показателя по сравнению с фактическими значениями. Однако на практике считается допустимым значение МРЕ, не превышающее 5% по модулю, следовательно, ошибка равная -1,011% считается вполне допустимой.
Среднеквадратичная ошибка (МЕЕ)
= = 1,6327
N 1=1
Поскольку каждое значение отклонения возводится в квадрат, этот метод подчеркивает большие ошибки прогноза. В нашем случае сильно выделяется ошибка моделируемого значения при скорости движения фронта 3 м/мин и продолжительности распространения 10 часов. Значение этой ошибки 61,8233093, что сильно увеличивает значение сред-
ней квадратичной ошибки для всей выборки. Тем не менее, MSE=1,6327 в целом можно считать приемлемой.
Проверка адекватности модели выполняется с использованием формальных статистических критериев. Наиболее часто адекватность модели обосновывается с помощью сравнения характеристик центральной тенденции (Критерий Стьюдента (Student, 1908)) и сравнения характеристик рассеяния (Критерий Фишера (Lomax, 2007)). Одно из важных условий корректного применения критериев Стьюдента и Фишера состоит в том, что анализируемые выборки должны происходить из нормально распределенных генеральных совокупностей.
Оценить нормальность выборки можно различными способами. Как правило, проверку начинают с построения гистограммы распределения. Затем, если вид гистограммы распределения оцениваемой выборки совпадает с гистограммой нормального распределения, то производят проверку с помощью критериев согласия.
Гистограмма распределения выборки Sj,^ приведена на рисунке 5. При построении гистограммы по оси абсцисс откладывают величины границ интервалов группирования, а по оси ординат - частоту попадания измеренной величины в интервал. Границы группирования на гистограмме округлены до целых значений. Анализируя полученную гистограмму можно сказать, что большинство площадей пожаров в выборке имеет значение менее 25 га. После 25 га площади пожаров распределены практически равномерно. Вид полученной гистограммы позволяет утверждать, что закон распределения, которому принадлежит выборка Sj^ значительно отличается от нормального закона.
Т.к. предположение о нормальности распределения исследуемых выборок не оправдалось, то для проверки адекватности модели необходимо воспользоваться непараметрическими аналогами критериев Стьюдента и Фишера.
Nj
50 40
I . . .
Применение критерия Уилкоксона (Вилкоксона) для связных выборок (Wilcoxon signed-rank test)
Сравнение зависимых выборок с помощью критерия Вилкоксона [9] осуществляется сходно с тем, как это делается при помощи парного критерия Стьюдента.
Сформулируем нулевую гипотезу И0 и альтернативную гипотезу И:
И0: медиана разницы фактических и смоделированных значений в выборках равна нулю;
И: медиана разницы фактических и смоделированных значений в выборках не равна нулю.
Для проверки нулевой гипотезы рассчитали тестовую статистику W данного критерия. Для этого вычислили разности для каждой пары результатов. Проранжировали положительные и отрицательные разности (кроме нулевых), чтобы наименьшая абсолютная величина (без учета знака) получила первый ранг. Затем отдельно вычислили сумму рангов положительных и отрицательных разностей, меньшую из двух сумм без учета знака назвали R и приняли за статистику W данного критерия.
Сумма отрицательных рангов равна 1150, положительных рангов - 1335. Таким образом, R=1150.
Если число ненулевых разностей больше 20, то статистика W приближается к стандартному нормальному распределению, т.е. необходимо рассчитать нормированную и центрированную статистику Вилкоксона [10]:
N(N+1)
Т =
R~ 4 _ 1242,5 1#(АТ+1)(2АГ+ТУ ~ -у/29198,75 I 24
= 0,54132689
О 25 50 75 100 125 150 175 200 225 250 275 Границы интервалов группирования
Рисунок 5 - Гистограмма распределения фактических значений площадей лесных пожаров (выборка 5факг)
Непараметрические критерии не используют информацию о виде функции распределения случайной величины. Они основаны на оперировании только частотами или рангами и являются менее мощными, чем параметрические.
Т асимптотически имеет стандартное нормальное распределение. Нулевая гипотеза (против альтернативы Н) отвергается, если Т >Ф1-а/ 2, где
Ф1-а есть (1-а) - квантиль стандартного нормального распределения. При а=0,05 значение квантиля Ф = 1,959964.
Т.к. 0,54132689<1,959964, то отвергнуть нулевую гипотезу нет оснований и можно сказать, что между фактическими площадями пожаров и площадями пожаров, вычисленными по модели нет статистической разницы.
Однако отсутствие статистической разницы между средними значениями выборок еще не гарантирует полного их сходства. Поэтому следующий этап в попытке различить выборки - сравнение степени рассеяния значений в них, то есть определение дисперсии и связанного с ней среднеквадратичного отклонения результатов от среднего. Одним из непараметрических критериев сравнения дисперсий является ранговый критерий Сиджела-Тьюки (непараметрический аналог критерия Фишера). Применение данного критерия накладывает ряд ограничений:
1) должно соблюдаться равенство медиан сравниваемых генеральных совокупностей, что должно
быть предварительно подвергнуто проверке на основании критерия знаков;
2) объем каждой выборки должен быть не меньше десяти: n > 10.
Таким образом, чтобы иметь право воспользоваться критерием Сиджела-Тьюки, необходимо сравнить медианы двух выборочных совокупностей.
Применение непараметрического критерия знаков (sign test)
Непараметрический критерий знаков используется для сравнения медиан двух связанных совокупностей [11, 12].
Сформулируем нулевую гипотезу И0 и альтернативную гипотезу И' :
И0: медианы выборок фактических и смоделированных значений равны между собой;
И1: медианы выборок фактических и смоделированных значений не равны между собой.
Для проверки нулевой гипотезы значения двух выборок сравниваются между собой, и подсчитывает-ся количество сдвигов: положительных, отрицательных и нулевых. Количество положительных сдвигов равно 38, количество отрицательных сдвигов - 32, нулевых - 0. В данном случае типичными являются положительные сдвиги, нетипичными - отрицательные. Подсчитали вероятность появления нетипичных сдвигов P (k):
1 и'
Р(к)=—*—-— " 2" к\(п-к\)
= 0,07372472
тив принадлежность каждого члена ряда той или иной выборке. Затем члены полученного ряда ранжировали следующим образом. Присвоили ранг R, равный 1, первому, минимальному члену ряда, ранг 2 — последнему, максимальному. Ранг 3 присваивают максимальному из оставшихся членов ряда, ранг 4 — минимальному из оставшихся и т.д. В случае если несколько членов ряда равны друг другу, им присваивали одинаковый ранг, равный их среднему арифметическому. Затем вычислили сумму рангов каждой выборки R1 = 4931 и R2 = 4939. За R1 приняли меньшую сумму.
Рассчитали статистику критерия:
z =
■I 12
= 0,0145865
nji2{nx + п2 +1)
где n - количество ненулевых сдвигов, k - количество нетипичных сдвигов.
Нулевая гипотеза о равенстве медиан не отвергается при выполнении неравенства P (k) > 0,05 (вероятность нетипичного сдвига велика). Альтернативная гипотеза о наличии достоверного сдвига считается верной, если P (k) < 0,01 (вероятность нетипичного сдвига мала). При выполнении неравенства 0,01 < P((k) < 0,05 решение о нулевой гипотезе не принимается.
Т.к. 0,073>0,05, то Pn(k) попадает в область допустимых значений критерия, что не дает оснований для отвержения нулевой гипотезы. Таким образом, имеем право воспользоваться критерием Сиджела-Тьюки.
Применение непараметрического критерия Сиджела-Тьюки(Siegel-Tukey test)
Данный критерий позволяет сравнить рассеяние показателей обеих выборок (Lehmann, 2006).
Сформулируем нулевую гипотезу Ид и альтернативную гипотезу И:
Ид: показатели рассеяния выборок фактических и смоделированных значений равны между собой;
И : показатели рассеяния выборок фактических и смоделированных значений не равны между собой.
Для проверки нулевой гипотезы обе выборки объединили в единый вариационный ряд, отме-
где n - объем первой выборки, n2 - объем второй выборки.
Сравнили полученное значение z с критическим значением квантиля нормального распределения ф\-а/ 2. Если z > Ф1-а/ 2 принимается гипотеза о том, что дисперсии статистически различаются. При а=0,05 значение квантиля ф = 1,959964. Т.к. 0,0145865 < 1,959964, то нулевую гипотезу о равенстве показателей рассеяния значений площадей фактических и смоделированных пожаров отвергнуть нет основания. А модель распространения кромки пожара основанную на методе подвижных сеток, реализованную в учебно-тренажерной системе «Тайга-3» можно считать адекватной.
ВЫВОДЫ
В результате проведенного исследования была проведена проверка качества реализованной в учебно-тренажерной системе «Тайга-3» модели распространения кромки пожара, основанной на методе подвижных сеток. Была проанализирована система показателей, характеризующих как адекватность модели, так и ее точность. Для оценки точности были рассчитаны различные показатели ошибок:
- средняя абсолютная ошибка (MAE);
- средняя относительная ошибка (MAPE);
- средняя процентная ошибка (MPE);
- среднеквадратичная ошибка (MSE).
Показатели каждой из приведенных ошибок
можно считать приемлемыми, а саму модель довольно точной.
Оценка адекватности была проведена с помощью критериев Вилкоксона для связанных выборок (Wilcoxon signed-rank test) и критерия Сиджела-Тьюки (Siegel-Tukey test). Данные критерии являются непараметрическими аналогами критериев Стьюдента и Фишера. По результатам расчета дан-
ных критериев можно с уверенностью сказать, что реализованная модель адекватна, а систему «Тай-га-3» можно успешно использовать для подготовки и переподготовки специалистов лесопожарных служб. Также систему предлагается использовать для обучения студентов вузов и техникумов лесо-хозяйственного профиля, работников лесохозяй-ственной отрасли на курсах повышения квалификации в учебно-игровой форме основам тактике борьбы с лесными пожарами.
Следует уточнить, что проверка была проведена только по показателю площади, а в качестве фактических данных взяты статистические данные. Т.е. утверждать, что построенные в системе контура пожаров буду иметь настолько же точные и адекватные значения других показателей (периметр пожара и др.) нет оснований. Для этого необходимо провести дополнительные исследования.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
Andrews, P. BehavePlus fire modeling system, version 2.0: User's Guide / P.L. Andrews, C.D. Bevins, R.C. Seli // USDA Forest Service Gen. Techn. Rep. RMRS-GTR-106WWW. - Ogden. - 2003. 45 p. Finney, M.A. FARSITE: Fire are simulator model, development and evaluation / M.A. Finney. - USDA Forest Service, Res. Paper RMRS-RP-4. Ogden, 1998. - 47 p.
Яровой С.В., Буслов И.А., Доррер Г.А. Учебно-тренажёрная система по основам тактики борьбы с лесными пожарами // Технологии техносферной безопасности. -Вып. 3 (61). - 2015. - http://ipb.mos.ru/ttb.
Доррер, Г.А. Динамика лесных пожаров / Г.А. Доррер. // -Красноярск: СО РАН, 2008. - 404 с.
Годунов, С.К. Об использовании подвижных сеток в газодинамических расчетах / С.К. Годунов, Г.П. Прокопов // Журн. вычислит. матем. и математ. физики - 1972. Т. 12, №2. - С. 429-439.
Указания по обнаружению и тушению лесных пожаров. Федеральная служба лесного хозяйства России. - М.: 1995. - 96 с.
Student, The probable error of a mean / Student // Biometrika, 1908. - № 6 (1). P. 1-25.
Lomax, Richard G. Statistical Concepts: A Second Course / R.G. Lomax // Lawrence Erlbaum Associates, 2007. - p. 10.
Wilcoxon, F. Individual comparisons by ranking methods / F. Wilcoxon // Biometrics Bulletin. - 1 (6). - 1945. - P. 80-83.
Oyeka, I. C. A. Modified Wilcoxon Signed-Rank Test / I. C. A. Oyeka // Open Journal of Statistics, 2012. - P. 172-176.
Conover, W.J. Chapter 3.4: The Sign Test / W.J. Conover // Practical Nonparametric Statistics (Third ed.), Wiley, 1999. - P. 157-176.
Sprent, P. Applied Nonparametric Statistical Methods (Second ed.) / P. Sprent // Chapman & Hall, 1989.
Lehmann, Erich L. Nonparametrics: Statistical Methods Based on Ranks / Erich L. Lehmann // Springer, 2006. -P. 9, 11-12.
Поступила в редакцию 12.10.15 Принята к печати 28.12.2015