Научная статья на тему 'МАТЕМАТИЧЕСКАЯ ОЦЕНКА ДОСТОВЕРНОСТИ ИНФОРМАЦИИ О ЛЕСНЫХ ПОЖАРАХ'

МАТЕМАТИЧЕСКАЯ ОЦЕНКА ДОСТОВЕРНОСТИ ИНФОРМАЦИИ О ЛЕСНЫХ ПОЖАРАХ Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
46
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛЕСНЫЕ ПОЖАРЫ / ЛЕСОПОЖАРНАЯ ОБСТАНОВКА / ПЛОЩАДЬ ЛЕСНОГО ПОЖАРА / ЭФФЕКТИВНОСТЬ ТУШЕНИЯ ЛЕСНЫХ ПОЖАРОВ / СТАТИСТИЧЕСКИЙ АНАЛИЗ / ЗАКОН ЛОГНОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / РИСК-ОРИЕНТИРОВАННЫЙ ПОДХОД

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Котельников Р. В., Мартынюк А. А.

Бурное развитие цифровых технологий в целом и методов обработки больших данных в частности открывает широкие возможности для получения новых алгоритмов информационной поддержки управленческих решений, в том числе в области охраны лесов от пожаров. На этом фоне существенно возрастают требования к точности данных о пожарной опасности в лесах и лесных пожарах. Технологии дистанционного зондирования Земли из космоса хоть и являются перспективным методом получения независимой от человеческого фактора информации, имеют пока ряд технических ограничений, не позволяющих полностью автоматизировать сбор информации, поэтому важно обеспечить всесторонний контроль сведений, поступающих от лесопожарных формирований. Кроме того, для долгосрочных прогнозов пожарной опасности необходимо учитывать ретроспективные данные и цикличность некоторых явлений. Это требует разработки методик оценки достоверности исходных данных. Анализ сведений о количестве лесных пожаров, возникших в Российской Федерации с 1969 по 2020 г., позволил выявить, что распределение значений в больших выборках близко к логнормальному. Это, по мнению авторов, является фундаментальным принципом. Небольшие отклонения в правой части распределения косвенно подтверждают гипотезу о возможном дроблении крупных лесных пожаров лицами, предоставляющими информацию. Это также согласуется с тем, что такое дробление обычно имеет смысл только при сложной лесопожарной ситуации (большом количестве лесных пожаров). Анализ данных о количестве лесных пожаров, ликвидированных в первые сутки, выявил характерное отклонение, которое косвенно доказывает гипотезу о вероятности искажения данных с целью улучшения отчетности. При этом характер отклонения согласуется с тем, что такое искажение обычно допускают при небольшой горимости, в условиях тяжелой лесопожарной обстановки при большом количестве пожаров подобная фальсификация данных теряет смысл. С использованием численной оценки степени отклонения статистических данных от предсказываемого в рамках закона логнормального распределения авторами сформирован рейтинг регионов с точки зрения достоверности архивных данных о лесных пожарах. Предложенный метод может стать одним из элементов риск-ориентированного подхода для планирования контрольно-надзорных мероприятий в области лесных отношений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Котельников Р. В., Мартынюк А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL ESTIMATION OF INFORMATION RELIABILITY REGARDING FOREST FIRES

The rapid development of digital technologies, especially methods for processing a large amount of information, offers vast opportunities for obtaining new algorithms for supporting management decisions, including the prevention of forest fires. Therefore, the requirements for data accuracy on fire hazards in forests and forest fires considerably increase. Even though the remote sensing of the Earth from space is a potential method for acquiring information independent of the human factor, it still has several technical limitations that hinder total automation. Therefore, it is important to provide а comprehensive control over the information coming from the forest fire departments. Besides, the long-term fire risk prognoses must consider retrospective statistics and cyclical weather conditions. This requires the creation of methods for evaluating the reliability of the initial data. An analysis of the records on the number of forest fires that happened in the Russian Federation from 1969 to 2020 revealed that the distribution of the values in a large sampling set is close to lognormal, which is the author’s fundamental principle. The few deviations on the right side of the distribution indirectly support the hypothesis that, in the provided information, the large forest fires in each case were presented as smaller, fragmented events. This is also consistent with the fact that such information usually occurs when the forest fire situation is complex and has many burning locations. An analysis of the records on the forest fires extinguished within one day identified a characteristic deviation, which indirectly supports the assumption that the data was probably distorted to improve recording. In such a situation, the deviation from the pattern corresponds to low combustibility and completely loses its meaning in the conditions of a severe forest fire situation with many burning areas. The authors have formed a ranking of the regions according to the validity of the archival records on the forest fires using the correspondence of the statistical data to the lognormal distribution. The proposed method can become one of the elements of a risk-oriented approach for planning control and supervisory measures in forestry policy.

Текст научной работы на тему «МАТЕМАТИЧЕСКАЯ ОЦЕНКА ДОСТОВЕРНОСТИ ИНФОРМАЦИИ О ЛЕСНЫХ ПОЖАРАХ»

Научная статья УДК 630*614.849

DOI: 10.37482/0536-1036-2023-3-21-34

Математическая оценка достоверности информации о лесных пожарах

Р.В. Котельников*, канд. техн. наук; ResearcherID: B-2453-2018, ORCID: https://orcid.org/0000-0002-9984-5913

А.А. Мартынюк, д-р с.-х. наук, проф.; ResearcherID: AAB-7622-2020, ORCID: https://orcid.org/0000-0001-7592-2614

Всероссийский научно-исследовательский институт лесоводства и механизации лесного хозяйства, ул. Институтская, д 15, г. Пушкино, Московская обл., Россия, 141202; [email protected]*, vniilm_martinuk@mail. ru

Поступила в редакцию 03.04.21 / Одобрена после рецензирования 28.06.21 /Принята к печати 30.06.21

Аннотация. Бурное развитие цифровых технологий в целом и методов обработки больших данных в частности открывает широкие возможности для получения новых алгоритмов информационной поддержки управленческих решений, в том числе в области охраны лесов от пожаров. На этом фоне существенно возрастают требования к точности данных о пожарной опасности в лесах и лесных пожарах. Технологии дистанционного зондирования Земли из космоса хоть и являются перспективным методом получения независимой от человеческого фактора информации, имеют пока ряд технических ограничений, не позволяющих полностью автоматизировать сбор информации, поэтому важно обеспечить всесторонний контроль сведений, поступающих от лесопожарных формирований. Кроме того, для долгосрочных прогнозов пожарной опасности необходимо учитывать ретроспективные данные и цикличность некоторых явлений. Это требует разработки методик оценки достоверности исходных данных. Анализ сведений о количестве лесных пожаров, возникших в Российской Федерации с 1969 по 2020 г., позволил выявить, что распределение значений в больших выборках близко к логнормальному. Это, по мнению авторов, является фундаментальным принципом. Небольшие отклонения в правой части распределения косвенно подтверждают гипотезу о возможном дроблении крупных лесных пожаров лицами, предоставляющими информацию. Это также согласуется с тем, что такое дробление обычно имеет смысл только при сложной лесопожарной ситуации (большом количестве лесных пожаров). Анализ данных о количестве лесных пожаров, ликвидированных в первые сутки, выявил характерное отклонение, которое косвенно доказывает гипотезу о вероятности искажения данных с целью улучшения отчетности. При этом характер отклонения согласуется с тем, что такое искажение обычно допускают при небольшой горимости, в условиях тяжелой лесопожарной обстановки при большом количестве пожаров подобная фальсификация данных теряет смысл. С использованием численной оценки степени отклонения статистических данных от предсказываемого в рамках закона логнормального распределения авторами сформирован рейтинг регионов с точки зрения достоверности архивных данных о лесных пожарах. Предложенный метод может стать одним из элементов риск-ориентированного подхода для планирования контрольно-надзорных мероприятий в области лесных отношений.

Ключевые слова: лесные пожары, лесопожарная обстановка, площадь лесного пожара, эффективность тушения лесных пожаров, статистический анализ, закон логнормально-го распределения, информационные технологии, риск-ориентированный подход

© Котельников Р.В., Мартынюк A.A., 2023

Цс^Т^ Статья опубликована в открытом доступе и распространяется на условиях лицензии СС BY 4.0

Для цитирования: Котельников Р.В., Мартынюк А.А. Математическая оценка достоверности информации о лесных пожарах // Изв. вузов. Лесн. журн. 2023. № 3. С. 21-34. https://doi.org/10.37482/0536-1036-2023-3-21-34

Original article

Mathematical Estimation of Information Reliability Regarding Forest Fires

Roman V. Kotelnikov®, Candidate of Engineering; ResearcherlD: B-2453-2018, ORCID: https://orcid.org/0000-0002-9984-5913

Âlexsander A. Martynyuk, Doctor of Agriculture, Prof.; ResearcherlD: AAB-7622-2020, ORCID: https://orcid.org/0000-0001-7592-2614

All-Russian Research Institute for Silviculture and Mechanization of Forestry, ul.Institutskaya, 15, Pushkino, Moscow region, 141202, Russian Federation; [email protected]®, [email protected]

Received on April 03, 2021 /Approved after reviewing on June 28, 2021 /Accepted on June 30, 2021

Abstract. The rapid development of digital technologies, especially methods for processing a large amount of information, offers vast opportunities for obtaining new algorithms for supporting management decisions, including the prevention of forest fires. Therefore, the requirements for data accuracy on fire hazards in forests and forest fires considerably increase. Even though the remote sensing of the Earth from space is a potential method for acquiring information independent of the human factor, it still has several technical limitations that hinder total automation. Therefore, it is important to provide a comprehensive control over the information coming from the forest fire departments. Besides, the long-term fire risk prognoses must consider retrospective statistics and cyclical weather conditions. This requires the creation of methods for evaluating the reliability of the initial data. An analysis of the records on the number of forest fires that happened in the Russian Federation from 1969 to 2020 revealed that the distribution of the values in a large sampling set is close to lognormal, which is the author's fundamental principle. The few deviations on the right side of the distribution indirectly support the hypothesis that, in the provided information, the large forest fires in each case were presented as smaller, fragmented events. This is also consistent with the fact that such information usually occurs when the forest fire situation is complex and has many burning locations. An analysis of the records on the forest fires extinguished within one day identified a characteristic deviation, which indirectly supports the assumption that the data was probably distorted to improve recording. In such a situation, the deviation from the pattern corresponds to low combustibility and completely loses its meaning in the conditions of a severe forest fire situation with many burning areas. The authors have formed a ranking of the regions according to the validity of the archival records on the forest fires using the correspondence of the statistical data to the lognormal distribution. The proposed method can become one of the elements of a risk-oriented approach for planning control and supervisory measures in forestry policy. Keywords: forest fires, forest fire conditions, burning of wooded area, forest fire suppression efficiency, statistical analysis, lognormal distribution, information technologies, risk-oriented approach

For citation: Kotelnikov R.V, Martynyuk A.A. Mathematical Estimation of Information Reliability Regarding Forest Fires. Lesnoy Zhurnal = Russian Forestry Journal, 2023, no. 3, pp. 21-34. (In Russ.). https://doi.org/10.37482/0536-1036-2023-3-21-34

This is an open access article distributed under the CC BY 4.0 license

Введение

Лесные пожары оказывают существенное влияние на биоразнообразие и экосистемы, здоровье человека [13]. Доля природных пожаров в глобальных выбросах углерода составляет 20 % [9, 20]. Климатические изменения приводят к увеличению количества засушливых дней, что, в свою очередь, повышает пожарную опасность во всем мире [10].

Бурное развитие цифровых технологий и методов обработки больших данных открывает широкие возможности для поиска новых алгоритмов информационной поддержки управленческих решений, в том числе в области охраны лесов от пожаров [4, 5]. С этим связан значительный рост требований к точности данных о пожарной опасности в лесах и лесных пожарах. Технологии дистанционного зондирования Земли из космоса, являясь перспективным методом получения независимой от человеческого фактора информации, тем не менее имеют ряд технических ограничений и не предоставляют возможности полной автоматизации сбора информации [1, 7, 8, 12, 15]. С этой точки зрения важно обеспечить всесторонний контроль сведений, предоставляемых лесопожар-ными формированиями. Кроме того, для долгосрочных прогнозов пожарной опасности нужно учитывать цикличность горимости, связанную с лесорасти-тельными особенностями регионов. Для этого необходима разработка методик оценки достоверности ретроспективных данных.

Несмотря на то, что системный подход к охране лесов от пожаров сформировался еще в начале XIX в., официальная информация о лесных пожарах стала централизованно собираться с 1969 г. В частности, в центральную базу авиационной охраны лесов (сейчас ФБУ «Авиалесоохрана», г. Пушкино) поступала информация от учреждений лесного хозяйства, полученная преимущественно авиационными или наземным способами. Подходы к учету лесных пожаров, в том числе состав и структура данных, менялись неоднократно. К сожалению, данные собирались нерегулярно и только с активно охраняемой территории лесов. Кроме того, до развития дистанционных методов мониторинга из космоса контролировать точность оценки площадей лесных пожаров было невозможно.

В последние десятилетия в России для федерального контроля достоверности поступающих от региональных лесопожарных служб сведений о пожарной опасности в лесах и лесных пожарах в соответствии с законодательством создана многоуровневая система специальных мероприятий. В частности, оперативный контроль осуществляется путем автоматического сравнения региональных данных с данными Информационной системы дистанционного мониторинга лесных пожаров Федерального агентства лесного хозяйства (ИСДМ-Рослесхоз) [2, 12], полученными методом детектирования тепловых аномалий. Если расхождения не устранены, проводится детальная проверка крупных лесных пожаров по данным снимков высокого пространственного разрешения. В отдельных спорных случаях может назначаться выездная проверка для натурного замера площади пожаров с использованием приборов спутниковой навигации в процессе облета на воздушном судне или пешего обхода контура пожара.

В то же время большие объемы информации из разных источников, накопленные в лесопожарных базах данных, позволяют проводить статистическую оценку точности сведений о количестве лесных пожаров и эффективности их тушения, что может значительно сократить временные и финансовые затраты на выполнение проверочных мероприятий.

Когда на процессы влияет большое количество сложноконтролируемых факторов, то такие процессы условно можно считать случайными. Даже если часть факторов можно контролировать, далеко не всегда получается формализовать их и численно учесть при исследовании самих процессов. Численные значения параметров (признаков) подобных процессов можно рассматривать как случайные величины. Ключевым параметром случайных величин является их вероятность (т. е. мера того, насколько возможно появление определенного значения этой величины) [6]. Знание закона распределения величины позволяет воспользоваться типовыми формулами расчета всех параметров (дисперсия, математическое ожидание и т. д.), что полезно для задач анализа и прогнозирования [11, 14].

Попытки анализа ретроспективных данных о лесных пожарах с точки зрения оценки формы закона распределения величин в выборке предпринимались давно [3, 16, 18, 19]. Основной сложностью при проведении подобных исследований является ограниченность доступных данных. Вместе с тем даже имеющиеся данные позволяют сделать вывод, что в большинстве случаев распределение сильно отличается от нормального, что связывают прежде всего с активным воздействием на пожары сил пожаротушения. Кроме того, влияние на данные оказывают алгоритмы обработки, что определенным образом искажает картину распределения. В большей степени это сказывается на границе чувствительности алгоритмов.

В рамках исследования анализировалась возможность использования статистических методов для оценки достоверности сведений о пожарной опасности в лесах и лесных пожарах в регионах и, прежде всего, выявления случаев манипуляций региональных органов лесоуправления отчетными данными в целях маскировки объективной лесопожарной обстановки. Речь идет о завышении количества лесных пожаров (дробление площади крупных лесных пожаров на более мелкие) для снижения средней площади одного лесного пожара, а также завышении доли пожаров, потушенных в первые сутки.

Объекты и методы исследования

Для исследования был выбран массив данных о количестве возникших лесных пожаров и лесных пожаров, ликвидированных в первые сутки, для каждого региона из наиболее часто рассматриваемых при характеристике лесопо-жарной обстановки и оценке эффективности тушения лесных пожаров. Для удобства географической интерпретации полученных результатов данные были преобразованы с учетом современного административного деления и отнесены к существующим границам субъектов Российской Федерации.

При выборе уровня агрегирования данных (по региону, времени года, месяцу или отдельному дню) учтено, что большая детализация (например, по каждому дню) усредняет все «случайные шумы» в данных, но существенно сокращает объем доступной для исследований выборки. С этой точки зрения за оптимальный уровень детализации приняты сводные данные в разрезе сезонов года (весна, лето, осень). Сформированная таким образом исследовательская выборка составила 4991 наблюдение.

В большой выборке распределение значений показателей, взятых для характеристики лесопожарной обстановки, близко к логнормальному. При этом отклонения от логнормального распределения связаны со значительным количеством случайных и неслучайных факторов. Случайные отклонения, влияющие на близость фактического распределения к расчетному, действуют для всех субъектов Российской Федерации, поэтому при сравнении регионов между собой этими факторами можно пренебречь. К неслучайным, по результатам анализа лесопожарной практики, следует отнести действия региональных органов лесоуправления по дроблению площади лесных пожаров и завышению количества пожаров, ликвидированных в первые сутки. Технология установления факта отклонений, вызванных неслучайными факторами, рассмотрена ниже.

Предложено для оценки анализируемых отклонений от базового распределения использовать улучшенный критерий Шапиро-Уилка W, обладающий максимальной статистической мощностью и адаптированный к большим выборкам - до 2000 наблюдений [17].

Алгоритм решения поставленной задачи предусматривал следующие шаги:

1. Выполнение подгонки основных параметрических распределений к исследуемой выборке для подтверждения близости формы распределения значений к логнормальной. Оценка близости этих распределений к теоретическому распределению по статистике Колмогорова-Смирнова. Повторение расчета отдельно для лет с высокой горимостью и для лет с низкой горимостью, чтобы оценить, насколько устойчив полученный результат. Расчет для этого суммарной пройденной огнем площади за весь год и сортировка годов в порядке возрастания значения. Нахождение 2 искомых крайних случаев посредством деления полученного списка пополам.

2. Расчет критерия Шапиро-Уилка для распределения количества лесных пожаров и пожаров, ликвидированных в первые сутки [17].

3. Расчет уровня статистической значимости для каждого значения критерия.

4. Ранжирование регионов по степени увеличения критерия Шапиро-Уи-лка, что соответствует приближению распределения к нормальному и, соответственно, повышению достоверности сведений. Выполнение аналогичного ранжирования для общего количества лесных пожаров и пожаров, ликвидированных в первые сутки.

5. Расчет «антирейтинга» регионов по среднему значению рангов.

6. Сортировка регионов по возрастанию итогового антирейтинга.

При построении гистограммы количество градаций для достижения большей наглядности подобрано экспериментально. При выборе учтено требование наличия не менее 20 интервалов и относительно равномерное изменение количества значений в интервалах. Гистограмма построена для преобразованных (прологарифмированных натуральным логарифмом) значений. Соответственно, интервалы выбраны равными в логарифмической разметке.

Результаты исследования и их обсуждение

Для подтверждения формы распределения значений количества лесных пожаров сформированы 3 выборки: все годы (1969-2021); годы с пониженной горимостью (1971, 1973-1975, 1977-1986, 1988-1995, 1997, 1999, 2001, 2004,

2005), годы с повышенной горимостью (остальные). Подгонка распределений и расчет статистики близости Колмогорова-Смирнова d, а также уровня значимости p произведены с использованием программного обеспечения Statistica (табл. 1).

Таблица 1

Оценка близости распределения значений количества возникших лесных пожаров к стандартным параметрическим распределениям Estimation of statistical confidence intervals for the number of forest fires to the standard distribution conditions

Параметрические распределения Годы низкой горимости Годы высокой горимости Все годы

d Р Ранг d Р Ранг d Р Ранг

Логнормальное 0,048 0,000132 3 0,043 3,81E-05 1 0,041 7,07E-08 1

Вейбулла 0,031 0,033137 1 0,059 3,50E-09 3 0,043 1,32E-08 2

Обобщенное Парето 0,046 0,000284 2 0,055 5,18E-08 2 0,053 1,01E-12 3

Обобщенное экстремальных значений 0,062 2,14E-07 4 0,066 1,78E-11 4 0,062 2,46E-17 4

Смешанное гауссовское 0,123 1,77E-28 5 0,168 5,75E-71 5 0,151 5,9E-100 5

Джонсона SB 0,134 2,32E-33 6 0,220 1,80E-121 6 0,187 7,7E-152 6

Нормальное 0,246 7,4E-112 7 0,304 1,10E-232 7 0,282 0 7

Полунормальное 0,308 1,1E-175 8 0,431 0 8 0,377 0 8

Релея 0,467 0 9 0,582 0 9 0,531 0 9

Треугольное 0,608 0 10 0,735 0 10 0,721 0 10

Круговое нормальное - - 11 - - 11 - - 11

Как видно из табл. 1, наиболее близкой формой распределения значений для 2 из 3 выборок является логнормальная форма. При низкой горимости ближе обобщенное распределение Паетто и распределение Вейбулла, но этот результат менее статистически значим и связан, вероятно, не только с существенно меньшим объемом выборки, но и с влиянием человеческого фактора, о котором будет сказано ниже. Учитывая специфику задачи, а также результат, полученный для всего диапазона рассматриваемых лет, за основу было взято логнормальное распределение.

Для удобства визуализации и последующего анализа значения количества возникших лесных пожаров и лесных пожаров, ликвидированных в первые сутки, прологарифмованы. Гистограммы приведены на рис. 1.

Учитывая, что после логарифмирования полученные преобразованные значения распределены по закону, близкому к нормальному, для оценки отклонения можно воспользоваться стандартными критериями (табл. 2).

450 400

8 350 S 300

S 200

I

ю

£ 150

о g

s® 100

50 0

500 450

0 400

5 350

1 300

« 250

§ 200 iS

о 150 У

100 50 0

0,00 0,38 0,75 1,13 1,51 1,89 2.26 2,64 3,02 3,40 3,77 4,15 4,53 4,91 5,28 5,66 6,04 6,42 6,79 7,17 7,55 7,92 Логарифм числа пожаров, ликвидированных в первые сутки

б

Рис. 1. Гистограммы распределения логарифмов значений (19692021 гг.): а - общего годового количества лесных пожаров; б - количества лесных пожаров, потушенных в первые сутки Fig. 1. The distribution histograms of logarithmic values (19692021 years): а - total annual number of forest fires; б - number of forest fires extinguished during one day

Анализ результата показывает, что отклонение реальной формы распределения значений исследуемой выборки от теоретически ожидаемой параметрической кривой (как было показано выше, для преобразованных логарифмированием значений ожидается нормальное распределение) является статистически значимым (p < 0,01), т. е. гипотезу о нормальности можно отвергнуть.

Как видно из рис. 1, фактическое распределение (столбцы) в правой части гистограмм выступает за границу линии, соответствующей теоретическому распределению, что может свидетельствовать о фактах дробления лесных пожаров. Данный вывод объясняется результатами анализа лесопожарной практики, согласно которым при небольшом количестве лесных пожаров (левая часть гистограмм) горимость обычно низкая и ресурсов для тушения хватает.

Логарифм числа возникших лесных пожаров (в ссзон)

а

Таблица 2

Оценка близости эмпирического распределения (преобразованных значений

горимости лесов) к теоретическому нормальному распределению Estimation of statistical confidence for the empirical distribution (modified values of forest combustibility) to the standard distribution

Критерий Значение логарифма Статистическая значимость

Общее годовое количество лесных пожаров

Колмогорова-Смирнова 0,041408 p < 0,01

Лиллиефорса - p < 0,01

Шапиро-Уилка 0,980150 p « 0

Годовое количество лесных пожаров, ликвидированных в первые сутки

Колмогорова-Смирнова 0,039459 p < 0,01

Лиллиефорса - p < 0,01

Шапиро-Уилка 0,983556 p « 0

В таких условиях дробить лесные пожары для улучшения отчетности не имеет смысла. Кроме того, возможно сокрытие факта некоторых пожаров (о чем косвенно свидетельствуют аномальные провалы в левой части гистограммы). Если лесопожарная ситуация напряженная и из-за нехватки ресурсов площади пожаров существенно растут, участки крупных пожаров могут быть зарегистрированы в качестве отдельного лесного пожара для существенного снижения контролируемого показателя средней площади лесного пожара. Соответственно, такие явления увеличат число ситуаций (наблюдений) с большим количеством лесных пожаров (смещение в правую часть гистограммы). Причем это будет частично заметно и на гистограмме рис 1, б, характеризующей количество пожаров, ликвидированных в первые сутки.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Искусственное искажение показателя «количество пожаров, ликвидированных в первые сутки», имеет смысл только при малой горимости, когда общее количество пожаров невелико. При сложной лесопожарной обстановке количество лесных пожаров большое, ресурсов на тушение чаще всего не хватает. В таких случаях «закрывать» пожары раньше времени нет необходимости: показатель и так низкий и искусственные корректировки существенно статистику не изменят. Зарегистрированные при «дроблении» новые пожары тоже не оказывают ощутимого влияния на отчетность, так как их количество незначительно. Таким образом, приписки отражаются только на левом краю гистограммы рис. 1, б, что подтверждает аномальность провалов в этой части распределения.

Для дополнительного подтверждения неверности предоставляемых данных можно привести итоговую гистограмму доли лесных пожаров, ликвидированных в первые сутки, на которой аномальная часть соотношения 2 выборок более наглядна (рис. 2). При случайном стечении обстоятельств логично предположить, что распределение процента обнаружения будет относительно равномерным. Вместе с тем фактические данные статистики говорят о неестественно большом числе наблюдений, когда показатель близок к 100 %.

0 10 20 30 40 50 60 70 80 90 100

Доля лесных пожаров, ликвидированных в первые сутки, %

Рис. 2. Распределение доли лесных пожаров, ликвидированных в первые

сутки (1969-2021 гг.)

Fig. 2. Proportion distribution of forest fires extinguished within one day

(1969-2021 years)

В табл. 3 приведены данные расчета антирейтинга достоверности сведений об общем количестве лесных пожаров и пожаров, ликвидированных в первые сутки. В таблицу включены только те субъекты Российской Федерации, у которых отклонение от логнормального распределения является статистически значимым (p < 0,05) и количество значений в анализируемой выборке достаточное (n < 30). Для части регионов подобное условие выполняется только по одному из контролируемых показателей. В связи с этим данная строчка в расчете рейтинга (в порядке возрастания критерия Шапиро-Уилка) не участвует. Для регионов с отклонением, значимым по обоим показателям, итоговый рейтинг рассчитан как средний показатель. Результирующий список отсортирован по итоговому рейтингу.

Для визуализации результата в качестве примера приведена гистограмма распределения значений количества лесных пожаров для Карачаево-Черкесской Республики - отклонения в правой части гистограммы одни из самых максимальных по сравнению с другими регионами (вероятные сокрытие при очень малом количестве пожаров и искусственное дробление пожаров при увеличении их количества); и для Новосибирской области -отклонения от теоретического логнормального распределения незначительны (рис. 3). Для Карачаево-Черкесской Республики выявлены статистически значимые отклонения от теоретической формы распределения, т. е. предоставленные данные недостоверны. Для Новгородской области статистически значимых отклонений не выявлено, данные можно считать достоверными.

Таблица 3

U)

о

Расчет антирейтинга достоверности сведений об общем количестве лесных пожаров и пожаров, ликвидированных в первые сутки The negative ranking of the regions according to the validity of information about the total number of forest fires and forest fires extinguished

within one day

Субъект Российской Федерации Оценка среднемноголетней горимости Лесные пожары Лесные пожары, ликвидированные в первые сутки Итоговый антирейтинг

частота лесных пожаров, случаи / млн га относительная горимость, га / 100 тыс. га N W Р Антирейтинг N W Р Антирейтинг

Карачаево-Черкесская Республика 7,0 15,5 18 0,78 0 3 10 0,85 0,05 - 3

Свердловская область 49,3 151,8 112 0,87 0 6 111 0,85 0 1 3,5

Красноярский край 7,2 203,8 110 0,68 0 2 109 0,88 0 6 4

Ставропольский край 26,0 33,2 15 0,89 0,08 - 15 0,88 0,04 4 4

Тюменская область 62,0 229,1 110 0,87 0 7 109 0,87 0 3 5

Хабаровский край 6,1 235,4 127 0,86 0 5 125 0,91 0 8 6,5

Республика Дагестан 8,7 15,1 22 0,89 0,02 12 18 0,86 0,01 2 7

Амурская область 11,2 1146,6 114 0,85 0 4 110 0,92 0 11 7,5

Иркутская область 18,4 427,8 111 0,67 0 1 106 0,93 0 14 7,5

Московская область 47,6 6,2 22 0,88 0,01 11 22 0,88 0,01 5 8

Смоленская область 10,5 4,1 23 0,87 0,01 9 22 0,89 0,02 7 8

Ханты-Мансийский автономный округ - Югра 20,5 156,4 30 0,95 0,14 - 30 0,91 0,02 9 9

Забайкальский край 63,9 1895 112 0,88 0 10 111 0,91 0 10 10

Республика Коми 7,6 45,7 110 0,90 0 13 106 0,98 0,23 13

Республика Саха (Якутия) 2,2 547,9 107 0,87 0 8 107 0,94 0 18 13

Курганская область 286,6 593,5 110 0,91 0 14 108 0,93 0 15 14,5

s

re о H

ю

M

о es

U «

г.

К)

о ы w

Субъект Российской Федерации Оценка среднемноголетней горимости Лесные пожары Лесные пожары, ликвидированные в первые сутки Итоговый

частота лесных пожаров, относительная горимость, Антирей- антирейтинг

N Ш Р Антирейтинг N ш Р

случаи / млн га га / 100 тыс. га тинг

Ленинградская область 31,7 3,1 90 0,93 0 17 88 0,98 0,35 - 17

Республика Хакасия 27,4 115,1 69 0,94 0 21 65 0,92 0 13 17

Псковская область 37,9 7,1 72 0,93 0 19 72 0,93 0 16 17,5

Алтайский край 92,7 112,1 109 0,93 0 18 107 0,98 0,11 - 18

Республика Карелия 22,5 25,0 105 0,94 0 24 105 0,92 0 12 18

Приморский край 27,2 237,2 140 0,92 0 15 134 0,96 0 23 19

Челябинская область 353,4 347,2 106 0,93 0 20 105 0,94 0 19 19,5

Краснодарский край 22,4 22,4 43 0,94 0,03 23 42 0,94 0,02 17 20

Пермский край 20,5 16,0 105 0,93 0 16 103 0,96 0 25 20,5

Сахалинская область 5,6 37,5 66 0,98 0,30 - 64 0,95 0,02 22 22

Еврейская автономная область 53,1 1866,7 87 0,95 0 25 86 0,95 0 21 23

Кемеровская область - Кузбасс 44,8 20,4 103 0,95 0 27 101 0,95 0 20 23,5

Омская область 61,9 209,5 103 0,95 0 28 100 0,96 0 26 27

Томская область 146,2 186,4 106 0,99 0,78 - 106 0,96 0 27 27

Республика Бурятия 32,1 465,8 107 0,94 0 22 106 0,97 0,04 33 27,5

Кировская область 17,2 10,5 103 0,97 0,01 32 103 0,96 0 24 28

Республика Тыва 15,3 281,8 107 0,95 0 26 105 0,97 0,04 32 29

Костромская область 12,0 4,8 90 0,97 0,02 31 89 0,97 0,03 28 29,5

Удмуртская Республика 27,1 1,2 88 0,97 0,02 30 87 0,97 0,03 29 29,5

Республика Башкортостан 27,7 40,3 102 0,98 0,14 - 100 0,97 0,03 31 31

Магаданская область 2,0 191,8 106 0,97 0,03 33 106 0,97 0,02 30 31,5

Новосибирская область 49,1 78,7 107 0,96 0 29 106 0,98 0,05 34 31,5

Г

гс

СЛ

а

о

N

2

а ч

о

Э

о с

к» о ы ы

2 о

Примечание: N - количество сезонов года (число отчетов), включенных в выборку.

0,00 1.28 2.55 3.83 5.10 6.38

Логарифм количества возникших лесных пожаров

б

Рис. 3. Гистограммы распределения логарифма количества лесных пожаров: а - по Карачаево-Черкесской Республике (2008-2021 гг.); б - по Новосибирской области (1969-2021 гг.)

Fig. 3. The distribution histograms of logarithmic values of the number of forest fires: а - in the Karachay-Cherkess Republic (2008-2021 years); б - in the Novosibirsk region (1969-2021 years)

Заключение

Исследования подтверждают логнормальный характер распределения значений количества лесных пожаров в больших выборках. Численная оценка степени отклонения статистических данных от предсказываемого в рамках закона логнормального распределения позволила сформировать рейтинг регионов с точки зрения достоверности архивных данных о лесных пожарах. Предложенный метод в рамках риск-ориентированного подхода может помочь при планировании контрольно-надзорных мероприятий в области лесных отношений.

СПИСОК ЛИТЕРАТУРЫ / REFERENCES

1. Барталев С.А., Егоров В.А., Ефремов В.Ю., Лупян Е.А., Стыценко Ф.В., Флит-ман Е.В. Оценка площади пожаров на основе комплексирования спутниковых данных различного пространственного разрешения MODIS и Landsat-TM/ETM+ // Современные проблемы дистанционного зондирования Земли из космоса. 2012. Т. 9, № 2. C. 9-26.

Bartalev S.A., Egorov V.A., Efremov VYu., Lupyan E.A., Stytsenko F.V, Flitman E.V. Integrated Burnt Area Assessment Based on Combine Use of Multi-Resolution Modis and Landsat-TM/ETM+ Satellite Data. Sovremennye problemy distantsionnogo zondirovaniya Zemli iz kosmosa = Current Problems in Remote Sensing of the Earth from Space, 2012, no. 2, pp. 9-26. (In Russ.).

2. Ковалев Н.А., Лупян Е.А., Балашов И.В., Барталев С.А., БурцевМ.А., Ершов Д.В., Кривошеев Н.П., Мазуров А.А. ИСДМ-Рослесхоз: 15 лет эксплуатации и развития // Современные проблемы дистанционного зондирования Земли из космоса. 2020. Т. 17, № 7. C. 283-291.

Kovalev N.A., Lupyan E.A., Balashov I.V., Bartalev S.A., Burtsev M.A., Ershov D. V, Krivosheev N.P., Mazurov A.A. ISDM-Rosleskhoz: 15 Years of Operation and Evolution. Sovremennye problemy distantsionnogo zondirovaniya Zemli iz kosmosa = Current Problems in Remote Sensing of the Earth from Space, 2020, no. 7, pp. 283-291. (In Russ.). https://doi. org/10.21046/2070-7401-2020-17-7-283-291

3. Коморовский В.С. Модели организации и управления при борьбе с лесными пожарами: моногр. М.: Инфра-М, 2012. 120 с.

Komorovskiy V.S. Models of Organization and Management in Fighting Forest Fires: Monograph. Moscow, Infra-M Publ., 2012. 120 p. (In Russ.).

4. Котельников Р.В., Коршунов Н.А., Гиряев Н.М. Задачи принятия решений в области охраны лесов от пожаров. Основные приоритеты развития информационного обеспечения // Сиб. лесн. журн. 2017. № 5. C. 18-24.

Kotelnikov R.V., Korshunov N.A., Giryaev N.A. Objectives of Decision Making in Protecting Forests from Fires. Main Priorities on Development of Informational Support. Si-birskiy lesnoy zhurnal = Siberian Journal Forest Science, 2017, no. 5, pp. 18-24. (In Russ.). https://doi.org/10.15372/SJFS20170502

5. Котельников Р.В., Мартынюк А.А. Использование закона Бенфорда для оценки достоверности сведений о лесных пожарах // Лесотехн. журн. 2018. Т. 8, № 1(29). C. 28-34.

Kotelnikov R.V, Martynyuk A.A. Application of the Benford Law in Assessment of Wildfire DataAccuracy. Lesotekhnicheskiy zhurnal=Forestry Engineering Journal, 2018, vol. 8, no. 1 (29), pp. 28-34. (In Russ.). https://doi.org/10.12737/article_5ab0dfbb946859.24647128

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: моногр. Новосибирск: НГТУ, 2011. 888 с.

Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N., Chimitova E.V Statistical Data Analysis, Simulation and Study of Probability Regularities. Computer Approach: Monograph. Novosibirsk, NSTU Publ., 2011. 888 p. (In Russ.).

7. Лупян Е.А., Барталев С.А., Балашов И.В., Егоров В.А., Ершов Д.В., Кобец Д.А., Сенько К.С., Стыценко Ф.В., Сычугов И.Г. Спутниковый мониторинг лесных пожаров в 21 веке на территории Российской Федерации (цифры и факты по данным детектирования активного горения) // Современные проблемы дистанционного зондирования Земли из космоса. 2017. Т. 14, № 6. C. 158-175.

Loupian E.A., Bartalev S.A., Balashov I.V., Egorov VA., Ershov D.V., Kobets D.A., Senko K.S., Stytsenko F.V., Sychugov I.G. Satellite Monitoring of Forest Fires in the 21st Century on the Territory of the Russian Federation (Facts and Figures Based on Active Fire Detection). Sovremennye problemy distantsionnogo zondirovaniya Zemli iz kosmosa = Current Problems in Remote Sensing of the Earth from Space, 2017, vol. 14, no. 6, pp. 158-175. (In Russ.). https://doi.org/10.21046/2070-7401-2017-14-6-158-175

8. Пономарев Е.И., Швецов Е.Г. Спутниковое детектирование лесных пожаров и геоинформационные методы калибровки результатов // Исследование Земли из космоса. 2015. № 1. С. 84-91.

Ponomarev E.I., Shvetsov E.G. Satellite Detection of Forest Fires and Geoinformation Methods for Calibrating Results. Issledovaniye Zemli iz kosmosa = Earth Observation and Remote Sensing, 2015, no. 1, pp. 84-91. (In Russ.). https://doi.org/10.7868/S0205961415010054

9. Giglio L., Randerson J.T., Werf G.R. Analysis of Daily, Monthly, and Annual Burned Area Using the Fourth-Generation Global Fire Emissions Database (GFED4): Analysis of Burned Area. Journal of Geophysical Research, Biogeosciences series, 2013, vol. 118, no. 1, pp. 317-328. https://doi.org/10.1002/jgrg.20042

10. Jolly W.M., Cochrane M.A., Freeborn P.H., Holden Z.A., Brown T.J., Williamson G.J., Bowman D.M.J.S. Climate-Induced Variations in Global Wildfire Danger from 1979 to 2013. Nature Communications, 2015, vol. 6, no. 7537, рр. 1-11. https://doi.org/10.1038/ncomms8537

11. Katz R.W., Brush G.S., Parlange M.B. Statistics of Extremes: Modeling Ecological Disturbances. Ecology, 2005, vol. 86, no. 5, pp. 1124-1134. https://doi.org/10.1890/04-0606

12. Kotelnikov R.V, Lupyan E.A., Bartalev S.A., Ershov D.V. Space Monitoring of Forest Fires: History of the Creation and Development of ISDM-Rosleskhoz. Contemporary Problems of Ecology, 2020, vol. 13, no. 7, pp. 795-802. https://doi.org/10.1134/ S1995425520070045

13. Langmann B., Duncan B., Textor C., Trentmann J., Werf G. Vegetation Fire Emissions and Their Impact on Air Pollution and Climate. Atmospheric Environment, 2009, vol. 43, no. 1, pp. 107-116. https://doi.org/10.1016/j.atmosenv.2008.09.047

14. Limpert E., Stahel W.A., Abbt M. Log-Normal Distributions Across the Sciences: Keys and Clues. Bioscience, 2001, vol. 51, no. 5, p. 341. https://doi. org/10.1641/0006-3568(2001)051[0341:lndats]2.0.co;2

15. Loboda T.V., Csiszar I.A. Estimating Burned Area from AVHRR and MODIS: Validation Results and Sources of Error. Contemporary Earth Remote Sensing from Space, 2005, vol. 2, pp. 415-421.

16. Pereira Jr. A.C., Oliveira S.L.J., Pereira J.M.C., Turkman M.A.A. Modelling Fire Frequency in a Cerrado Savanna Protected Area. PloS One, 2014, vol. 9, no. 7, art. no. e102380. https://doi.org/10.1371/journal.pone.0102380

17. Royston J.P. An Extension of Shapiro and Wilk's W. Test for Normality to Large Samples. Journal of the Royal Statistical Society, Series C: Applied Statistics, 1982, vol. 31, no. 2, pp. 115-124. https://doi.org/10.2307/2347973

18. Taylor S.W., Woolford D.G., Dean C.B., Martell D.L. Wildfire Prediction to Inform Fire Management: Statistical Science Challenges. Journal of the Institute of Mathematical Statistics, 2013, vol. 28, no. 4, pp. 586-615. https://doi.org/10.1214/13-sts451

19. Torres-Rojo J.M. Index for the Estimation of the Occurrence of Forest Fires in Large Areas. Revista Chapingo, Serie: Ciencias Forestales Y Del Ambiente, 2020, vol. 26, no. 3, pp. 433-449. https://doi.org/10.5154/rrchscfa.2019.11.082

20. Werf G.R., Dempewolf J., Trigg S.N., Randerson J.T., Kasibhatla P.S., Giglio L., Murdiyarso D., Peters W., Morton D.C., Collatz G.J., Dolman A.J., DeFries R.S. Climate Regulation of Fire Emissions and Deforestation in Equatorial Asia. PNAS, 2008, vol. 105, no. 51, pp. 20350-20355. https://doi.org/10.1073/pnas.0803375105

Конфликт интересов: Авторы заявляют об отсутствии конфликта интересов Conflict of interest: The authors declare that there is no conflict of interest

Вклад авторов: Все авторы в равной доле участвовали в написании статьи Authors' Contribution: All authors contributed equally to the writing of the article

i Надоели баннеры? Вы всегда можете отключить рекламу.