Научная статья на тему 'Статистические методы в прогнозировании самовозгорания углей'

Статистические методы в прогнозировании самовозгорания углей Текст научной статьи по специальности «Математика»

CC BY
133
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЙ АНАЛИЗ / STATISTICAL ANALYSIS / САМОВОЗГОРАНИЕ УГЛЕЙ / SPONTANEOUS COMBUSTION OF COAL / ГЕОЛОГИЧЕСКИЕ ФАКТОРЫ / GEOLOGICAL FACTORS / РАНГОВАЯ МОДЕЛЬ / RANKING MODEL / ЭТАЛОННЫЕ ГРУППЫ / REFERENCE GROUP / НОРМАТИВЫ / STANDARDS / ЭТАЛОННЫЕ ТОЧКИ-КОНЦЕНТРАТОРЫ / REFERENCE POINT / СТЕПЕНЬ ОПАСНОСТИ САМОВОЗГОРАНИЯ / THE DANGER OF SPONTANEOUS COMBUSTION / HUB

Аннотация научной статьи по математике, автор научной работы — Смирнова Ольга Сергеевна, Голынская Фарида Асхатовна

Приведены результаты статистического анализа данных, полученных по результатам геологоразведочных работ, ряда угольных месторождений с целью установления степени опасности самовозгорания углей. Задача исследований состояла в том, чтобы, используя геологические данные об угольном пласте, составить прогноз самовозгорания углей. Авторами была разработана оригинальная методика, в основе которой лежит ранговая модель данных, и идея, состоящая в классификации данных по «близости» к эталонным группам наблюдений. Полученные в каждой точке наблюдений (скважине) данные о степени самовозгораемости углей позволяют показать пространственное распределение разных по степени опасности самовозгорания углей в пределах шахтного поля, отдельного месторождения и пр. путем применения геоинформационных программных продуктов, например, семейства ArcGIS.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Смирнова Ольга Сергеевна, Голынская Фарида Асхатовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STATISTICAL METHODS IN THE PREDICTION OF SPONTANEOUS COMBUSTION OF COAL

The article presents the results of statistical analysis of data obtained from the results of exploration activities, the number of coal deposits with the aim of establishing the degree of danger of spontaneous combustion of coal. The objective of the research was that, using geological data about coal seam, make a prediction of spontaneous combustion of coal. The authors developed an original technique, which is based on ranking the data model, and the idea consisting in the classification data «close» to the reference groups of observations. Obtained at each point of observation (borehole) data on the degree of samovozgoraemost coals allow to show the spatial distribution of different degree of danger of spontaneous combustion of coal within the mine field, private field, etc. through the use of GIS software, such as ArcGIS family.

Текст научной работы на тему «Статистические методы в прогнозировании самовозгорания углей»

© О.С. Смирнова, Ф.А. Голынская, 2016

УДК 552.574

О.С. Смирнова, Ф.А. Голынская

СТАТИСТИЧЕСКИЕ МЕТОДЫ В ПРОГНОЗИРОВАНИИ САМОВОЗГОРАНИЯ УГЛЕЙ

Приведены результаты статистического анализа данных, полученных по результатам геологоразведочных работ, ряда угольных месторождений с целью установления степени опасности самовозгорания углей. Задача исследований состояла в том, чтобы, используя геологические данные об угольном пласте, составить прогноз самовозгорания углей. Авторами была разработана оригинальная методика, в основе которой лежит ранговая модель данных, и идея, состоящая в классификации данных по «близости» к эталонным группам наблюдений. Полученные в каждой точке наблюдений (скважине) данные о степени самовозгораемости углей позволяют показать пространственное распределение разных по степени опасности самовозгорания углей в пределах шахтного поля, отдельного месторождения и пр. путем применения геоинформационных программных продуктов, например, семейства ArcGIS.

Ключевые слова: статистический анализ, самовозгорание углей, геологические факторы, ранговая модель, эталонные группы, нормативы, эталонные точки-концентраторы, степень опасности самовозгорания.

Предотвращение и ликвидация угольных пожаров является частью программы, осуществляемой в соответствии с Киотским протоколом к Рамочной Конвенции ООН об изменении климата, принятым 11 декабря 1997 г. в Киото. В протоколе указано: «Принятое соглашение призвано решить самую важную проблему мировой экологии: в атмосфере постоянно накапливаются газы, вызывающие парниковый эффект. Источником выбросов этих веществ является промышленность, использующая ископаемое топливо» [4]. В Российской Федерации Киотский протокол был ратифицирован и подписан в 2004 г., вступил в силу 16 февраля 2005 г. [3].

Наблюдения в горных выработках показали, что самовозгорание углей может быть вызвано не только горнотехническими условиями разработки угольных пластов (вентиляция, осушение, обрушение кровли и т.д.). Важную роль в этом процессе играют условия залегания угольного пласта и вещественный

состав углей, то есть те характеристики, которые связаны с генетическими условиями формирования угольной залежи. К настоящему времени установлены геолого-генетические факторы, которые, по мнению ученых, могут влиять на самовозгорание углей, которые условно можно разделить на две группы: а) факторы, связанные с условиями залегания угольного пласта — мощность угольного пласта, глубина его залегания и угол наклона, нарушенность, строение угольного пласта, вмещающие породы; б) факторы, связанные с составом и свойствами вещества углей — степень метаморфизма, петрографический состав, зольность, влажность, выход летучих веществ, серни-стость, минеральный состав, газоносность [1, 2].

В результате изучения геологического строения угольных месторождений, физико-химических исследований и анализа статистических данных о самовозгорании углей установлены геологические факторы самовозгорания углей и граничные значения их параметров разной степени опасности самовозгорания для ряда бассейнов и месторождений.

Предварительный анализ собранных данных, произведенный с помощью статистического пакета STATISTICA, показал, что распределения рассматриваемых факторов самовозгорания углей, во-первых, не могут быть признаны нормально распределенными на сколько-нибудь удовлетворительном уровне надежности, во-вторых, эти факторы, как правило, не имеют значимых корреляций. Кроме того, данные имеют разную природу (непрерывные и дискретные с малым числом значений), и различный диапазон значений. Перечисленные причины исключают корректное использование большинства классических методов многомерного статистического анализа. Обычно в подобных ситуациях для анализа данных используются методы непараметрической (ранговой) статистики. Нами была разработана оригинальная методика, в основе которой лежит ранговая модель данных, и идея, несколько напоминающая постановку задачи в классическом дискриминантном анализе, состоящая в классификации данных по «близости» к эталонным группам наблюдений.

С использованием нормативов определения уровней опасности факторов (всего 13) осуществляется переход от исходных данных к ранговой шкале (таблица). Следует заметить, что исходные данные по конкретному месторождению могут содержать не все факторы. При переходе к ранговой шкале пропущенные данные мы заменяем нулями, которые в соответствии

Уровни опасности геологических факторов в ранговой шкале

Регион Мощность, м Угол наклона, град Тектоническая нарушен -ность, м/ км2 Карст Влажность, Сера общая, St\ % Глубина залегания угольного пласта, м Мета-нонос-ность, м3/т Выход летучих компонентов, Инер- тинит, /,% Строение (количество угольных пачек) Зольность, А\% Ви-три-нит, Урове-ньопас-ности самовозгорания

1 2 1 0 1 2 3 1 1 2 1 3 1 М*

Я 2 1 3 0 1 1 1 1 1 2 1 3 1 Н"

« щ о 1 1 3 0 1 1 2 1 1 3 1 3 2 м

о СО ю 2 1 1 0 1 1 2 1 1 1 2 3 1 н

« а м я щ 1 1 1 0 1 1 1 1 2 1 1 3 1 н

1 2 1 0 1 1 3 1 1 1 1 1 1 н

Я й 1 2 3 0 1 1 3 1 2 1 2 1 1 м

1 3 2 0 1 1 1 3 2 2 2 1 2 м

3 3 3 0 1 1 1 3 2 3 3 1 2 О"*

00 СТ1

Подмосковньй бассейн 3 1 1 2 3 2 2 3 3 2 2 2 3 М

2 1 1 2 3 3 2 3 3 2 2 2 3 м

3 1 1 1 3 2 3 3 3 1 2 2 2 м

3 1 1 1 3 2 2 3 3 1 2 2 3 м

3 1 1 1 3 3 2 3 3 1 2 2 3 о

3 1 1 1 3 2 3 3 3 3 2 2 3 о

3 1 1 2 2 2 1 3 3 1 3 2 2 м

3 1 1 2 1 2 1 3 3 1 2 2 3 м

3 1 1 3 3 3 1 3 2 3 3 2 1 о

Вес 6 6 6 6 6 6 5 5 5 5 4 4 4

Точка 1 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 0,75 1 1 1

Точка 2 1,75 1,75 1,75 1,75 1,75 1,75 1,75 1,75 1,75 1,75 2 2 2

Точка 3 2,75 2,75 2,75 2,75 2,75 2,75 2,75 2,75 2,75 2,75 3 3 3

М" — угли, малоопасные по самовозгоранию; Н"" — угли неопасные по самовозгоранию; О""" — угли, опасные по самовозгоранию.

с нормативами преобразованы в уровни опасности: 1 — низкий, 2 — средний, 3 — высокий так же, как все прочие значения. Это позволит нам при необходимости классифицировать точки не только внутри месторождения, но и провести глобальную классификацию с учетом полного набора факторов.

Данные в преобразованной ранговой таблице разобьем на группы, факторам каждой группы мы припишем одинаковый вес — коэффициент тем более высокий, чем больше их значимость для формирования общего уровня опасности. Нулевой вес позволяет игнорировать фактор при расчетах (например, в случае отсутствия данных).

Будем теперь классифицировать точки 13-мерного пространства рангов по близости (минимуму расстояния) к трем эталонным точкам-концентраторам, являющихся центрами тяжести эталонных групп, составленных из «типичных представителей» мало-, средне- и высокоопасных наборов рангов факторов самовозгорания углей. Наша задача состоит в том, чтобы выбрать меру близости (например, метрику в пространстве рангов), весовые коэффициенты значимости и 3 точки-концентратора. Таким образом, мы получаем модель с очень большим числом параметров, от подбора которых будет зависеть качество классификации. Некоторые из этих параметров могут быть вычислены (хотя бы приближенно), если сделать некоторые разумные предположения о желательных свойствах алгоритма классификации, остальные определяются в ходе компьютерного эксперимента, моделирования.

В прикладной статистике широко применяется метод DATA-MINING — «добыча данных» (самым известным примером этого метода является как раз дискриминантный анализ), который заключается в том, что малая часть большой выборки может быть использована для «обучения» метода, оптимальной подгонки параметров модели, возможно с привлечением эксперта. Этим методом мы и воспользовались, сформировав «обучающую» выборку малого объема (58 точек из разных месторождений), обладающую следующим свойством репрезентативности: она включает в себя как точки с очевидной классификацией, так и различные примеры пограничных случаев. Процесс подгонки модели проводится в несколько этапов. Уточнения значений параметров и возможные усложнения модели на каждом следующем этапе подгонки должны сохранять класс опасности для тех точек обучающей выборки, классификация которых на предыдущем этапе была признана успешной.

Будем поэтапно определять параметры модели. Прежде всего, определимся с метрикой. Нами были рассмотрены два типа

расстояний: ,-2

обычное евклидово, р2(х, у) = уХ¡=1(ху - Уу) ,

где х = (хр ..., хп), у = (у1, ..., уп), п — размерность пространства,

и рДх, у) = X .=1 |ху. - Уу | , часто называемое «манхеттенскими

квадратами» — длина пути из точки х в точку у по городу с правильной планировкой. Поскольку мы имеем дело с условными ранговыми данными, более предпочтительным кажется выбор именно этого расстояния. Действительно, как показывают проведенные теоретические исследования и результаты моделирования, алгоритм классификации, построенный на основании этого расстояния, оказывается более чувствительным, зато использование евклидовой метрики позволяет получить простые линейные условия дискриминации в пространстве рангов.

В этом случае мы можем принять низкий уровень опасности для точки г = (гр ..., гп), если

XП= т1г1 (Уу - ХУ) < XП= (Уу2 - х 2)/ 2

высокий, если

Е"=1т уг у(г у- Уу) > Епн ™у(2/- у2)/ 2

и средний во всех остальных случаях. Здесь точки х = (хх,..., хп), у = (у1, ..., уп), г = (г1, ..., zn) - концентраторы для низкого, среднего и высокого уровня опасности, w. — вес, г — вычисленный по нормативам ранг для у-го фактора. Эта модель заслуживает дальнейшего изучения.

В наиболее простой модели естественно положить все веса равными единице, то есть считать все факторы равнозначными, а точки-концентраторы равными (3,3,...,3), (2,2,...,2),

(1,1,___,1). Отправляясь именно от этой модели, мы перешли в

результате компьютерных экспериментам к весам 6, 5, 4 для групп факторов (целый вес w удобно истолковывать как дублирование фактора w раз), после чего начали уточнять координаты концентраторов.

В качестве концентратора в классе наибольшей опасности был выбран центр тяжести облака точек, для которых ранг 3 может быть заменен меньшим не более чем в двух любых позициях. Все координаты этой точки будут равны 3 - 3(2п - 1) / (2п2 +1) ,

п здесь и далее — число факторов. При варьировании 10—13 координат мы получим значения приблизительно в диапазоне 0,72—0,78. Выберем среднее значение 0,75 в качестве стартового для всех координат точки г. Координаты остальных двух точек могут быть получены аналогично, варьированием координат точек х = (1,1,___,1) и у = (2,2,...,2) (причем, только в меньшую сторону), для чего нам будет удобно рассмотреть дополнительный ранг 0 (игнорирование влияния фактора или полная безопасность). Такой выбор точек объясняется тем, что во всех спорных случаях мы всегда «перестраховываемся» — принимаем решение в пользу большей опасности.

Если концентраторы имеют вид х = (х1,_, хп), у = (у1,_, уп), I = (г1,_, гп), то условия минимизации расстояния в обеих рассмотренных метриках преобразуются в простые линейные соотношения, связывающие п1, п2 и п3, где пг — число появлений фактора г. Так как п2 = п — п1 — п3, то фактически мы переходим к двумерным линейным условиям дискриминации, которые формулируются в терминах числа появления «1» и «3» в данном наборе рангов.

Используя этот факт, мы можем вычислить два оставшихся концентратора с помощью следующих простых условий нормировки: а) при п2 = 0 и п1 > Хп, X > 1/2, будем признавать точку малоопасной (то есть допускать, что происходит компенсация малого числа опасных факторов большим числом безопасных значений), б) при п1 = 0 считать точку уже высоко-опасной, если п3 > (1 — Х)п. В наших расчетах мы использовали диапазон значений X от 3/5 до 2/3 (принцип «парламентского большинства»).

Полагая г = 3 —у, у = 2 —р и х = 1 —а выпишем условия дискриминации в случае линейной метрики рд и произвольного набора весов ж Точка мало-опасна при п > п(1 /2 + а / (2(1 - у))) высоко-опасна при п3 > рп1 / (1 - у) + п(1 /2 - р / (2(1 - у))) и имеет средний уровень опасности в остальных случаях. Здесь п. > 0, п > 0 и п. + п ^ м, где т = V . , т! сумма весов всех фак-

1 3 ■ . п1 3 ]—1

торов, пг — V . 1 т -1(т. — г). В модели с единичными весами м> совпадает с п, числом факторов (13), пг является числом появлений ранга г. Условия нормировки дают недоопределенную систему линейных уравнений 2X - р / (1 - у) — 1, 2X - а / (1 - р) — 1. Подставляя в нее полученное ранее значение у, вычислим координаты оставшихся точек-концентраторов. Например, при X = 2/3 и у = 1/4 мы получим решение а = р = 1/4, которое и будем использовать как начальное при подгонке параметров модели, варьируя эти значения на обучающей выборке. В ре-

зультате серии компьютерных экспериментов мы пришли к следующим параметрам: х = (0,75,..., 0,75, 1,1,1), y = (1,75,..., 1,75, 2,2,2), z = (2,75,., 2,75, 3,3,3), то есть, координаты для малозначимых факторов не варьируются, набор весов по группам остался 6, 5, 4. С этим набором параметров мы произвели вычисления уже для полного объема данных.

Все необходимые преобразования исходных данных и вычисления производятся автоматически программой (макросом) на языке Visual Basic для Excel, реализующей предлагаемую методику. Мы сознательно отказались от работы в среде специализированных статистических пакетов в пользу программ Excel MS Office по причине их общедоступности. Данные, подлежащие обработке, собраны в книгу Excel, которая содержит по отдельному листу для каждого месторождения и еще один лист с нормативной информацией.

На основании произведенных вычислений можно сделать следующие выводы:

1. Для определения степени самовозгораемости угольного пласта по данным геологоразведочных работ, ввиду отсутствия между этими данными в точках наблюдений (скважинах) значимых корреляций, наличие у них как непрерывных, так и дискретных значений, целесообразно применение метода многомерной классификации по эталонным точкам, который состоит в классификации данных по «близости» к эталонным группам наблюдений.

2. Все месторождения можно условно разделить на две группы — те, где присутствует большая доля точек, высокоопасных по самовозгоранию углей (Бельцевское, бурые угли) на общем фоне среднего уровня опасности, и те, где, наоборот, много точек с низким уровнем опасности или встречаются лишь единичные очень опасные точки на общем фоне среднего уровня опасности.

3. Полученные в каждой точке наблюдений (скважине) данные о степени самовозгораемости углей позволяют показать пространственное распределение разных по степени опасности самовозгорания углей в пределах шахтного поля, отдельного месторождения и пр. путем применения геоинформационных программных продуктов, например, семейства ArcGIS.

СПИСОК ЛИТЕРАТУРЫ

1. Голынская Ф. А. Самовозгорание углей в пластах и причины его возникновения // Вестник МГУ, серия Геология. — 1998. — № 6. -С. 65-66.

2. Голынская Ф. А. Характеристика наиболее действенных факторов самовозгорание углей в пластах (статья) // Горный информационно-аналитический бюллетень. — 2011. — № 2. — С. 19—23.

3. Федеральный закон «О ратификации Киотского протокола к Рамочной конвенции Организации Объединенных Наций об изменении климата» от 4 ноября 2004 года № 128-ФЗ.

4. Kyoto Protocol to the UN Framework Convention on Climate Change. — http://unfccc.int/2860.php/ - The official Website of the UNFCCC. ЕШ

КОРОТКО ОБ АВТОРАХ

Голынская Фарида Асхатовна — кандидат геолого-минералогических наук, доцент, НИТУ «МИСиС», e-mail: ud@msmu.ru, Смирнова Ольга Сергеевна — кандидат физико-математических наук, старший научный сотрудник, МГУ им. М.В. Ломоносова.

udc 552.574 O.S. Smirnova, F.A. Golynskaya

STATISTICAL METHODS IN THE PREDICTION OF SPONTANEOUS COMBUSTION OF COAL

The article presents the results of statistical analysis of data obtained from the results of exploration activities, the number of coal deposits with the aim of establishing the degree of danger of spontaneous combustion of coal. The objective of the research was that, using geological data about coal seam, make a prediction of spontaneous combustion of coal. The authors developed an original technique, which is based on ranking the data model, and the idea consisting in the classification data «close» to the reference groups of observations. Obtained at each point of observation (borehole) data on the degree of samovozgoraemost coals allow to show the spatial distribution of different degree of danger of spontaneous combustion of coal within the mine field, private field, etc. through the use of GIS software, such as ArcGIS family.

Key words: statistical analysis, the spontaneous combustion of coal, geological factors, the ranking model, the reference group, the standards, the reference point, the hub, the danger of spontaneous combustion.

AUTHORS

Golynskaya F.A., Candidate of Geological and Mineralogical Sciences, Associate Professor, National University of Science and Technology «MISiS», 119049, Moscow, Russia, e-mail: ud@msmu.ru, Smirnova O.S., Candidate of Physical and Mathematical Sciences, Lomonosov Moscow State University, Moscow, Russia.

REFERENCES

1. Golynskaya F. A. Vestnik MGU, seriya Geologiya. 1998, no 6, pp. 65—66.

2. Golynskaya F. A. Gornyy informatsionno-analiticheskiy byulleten'. 2011, no 2, pp. 19—23.

3. Federal'nyy zakon «O ratifikatsii Kiotskogoprotokola k Ramochnoy konventsii Organi-zatsii Ob"edinennykh Natsiy ob izmenenii klimata» ot 4noyabrya 2004goda no 128-FZ(Federal law «On ratification of the Kyoto Protocol to the framework Convention of United Nations on climate change» on November 4, 2004 № 128-FZ).

4. Kyoto Protocol to the UN Framework Convention on Climate Change. http://unfccc. int/2860.php/ The official website of the UNFCCC.

i Надоели баннеры? Вы всегда можете отключить рекламу.