УДК 552.57:550.8
РЕГРЕССИОННЫЕ МОДЕЛИ ПАРАГЕНЕТИЧЕСКИХ ВЗАИМОСВЯЗЕЙ СВОЙСТВ ПЛАСТОВ УГЛЕВМЕЩАЮЩЕГО РИТМА
© 2012 г. Д.Н. Шурыгин, Д.А. Ефимов
Южно-Российский государственный технический университет (Новочеркасский политехнический институт)
South-Russian State Technical University (Novocherkassk Polytechnic Institute)
Рассмотрена задача моделирования взаимосвязей между свойствами пластов горных пород в угле-вмещающем ритме. Предложена модификация метода группового учета аргументов для выявления регрессионных зависимостей на основе метода неотрицательных наименьших квадратов.
Ключевые слова: геометризация месторождения; углевмещающий ритм; регрессионная модель; метод наименьших квадратов; парагенетическая взаимосвязь.
In article the problem of modelling of interrelations between properties of layers of rocks in coal-containing rhythm is considered. Updating of a method of the group account of arguments for revealing regression dependences on the basis of a method of non-negative least squares is offered.
Keywords: deposit geometrization; coal-containing rhythm; regression model; method of the least squares; paragenetic interrelation.
Специфика задач геометризации применительно к использованию алгоритма метода группового учета аргументов (МГУА) [1] состоит в том, что задача построения интерполяционной модели решается при ограниченном числе данных, расположенных неравномерно, иногда на значительной площади, при малой размерности аргументов модели (одно-, двух-, трехмерные поля) и отсутствии априорной информации о виде закономерной составляющей. К тому же вид ее может значительно отличаться в соседних районах поля (локальная закономерность).
При решении задач горно-геометрического моделирования предлагается использовать многорядный алгоритм МГУА, который заключается в следующем.
Для создания внешнего дополнения вся исходная
информация |уг; xi | (I = 1, п) разделяется на обучающую (- = 1, m) и проверочную (- = m +1, п ). Исходная
информация центрируется и нормируется по дисперсии, т. е. с каждым из измеренных значений моделируемого показателя у и возможных аргументов хг выполняется операция
у',=(уг - ту)/ сту;
Х'=( Х- - тщ)/ о х , где ту и тх - математические ожидания измеренных значений у и х-; сту и ст - их стандарты.
Для удобства далее будем считать, что переменные и показатели центрированы и нормированы и
штрихи в приведенных выше формулах могут быть опущены.
Далее на точках обучающей совокупности строится зависимость следующего вида, которая называется опорной функцией (частное описание):
у = а!хч + а2хс .
На первом ряду селекции синтезируется £ = С2 моделей, где п - количество аргументов модели.
У1 = А3!х2), У2 = /^(^хз) — У£ = /i1)(x»-l,Хп),
где (1) - номер ряда селекции.
Для нахождения оценок коэффициентов этих уравнений применяется МНК. На проверочных точках, не участвующих в вычислении оценок коэффициентов этих моделей, проверяется их качество по критерию 5 К
8K = K Е (У " f (x >a))
где К - число точек проверочной совокупности.
Далее все уравнения ранжируются по этому критерию и п лучших из них (по минимальному значению 5^) принимаются в качестве аргументов в принятом уравнении на втором ряду селекции.
После этого на точках обучающей совокупности вычисляются коэффициенты новых зависимостей:
= /Я^ У 2 ), 22 = /^2> (Уl, Уз ) V- = Уn-1, Уп ) .
На точках проверочной совокупности вновь для каждого уравнения вычисляется критерий бК , по нему ранжируются и пропускаются на третий ряд селекции п лучших уравнений. Если З^щ > б^ш , то на третьем ряду селекции описанная процедура повторяется. Построение модели ведется до тех пор,
пока не выполнится неравенство З^т > З^щ .
Построенные описанным способом модели являются оптимальными как по сложности, так и по изученности геометризуемого показателя и связанных с ним аргументов. Метод позволяет выбрать из большого числа элементов системы «месторождение» только те, которые действительно связаны с исследуемым показателем, установив вид и силу этой связи. Полученным уравнением описывается закономерная составляющая размещения показателя. Критерий селекции оценивает ошибку моделирования по найденному уравнению, являясь многомерной дисперсией модели.
Алгоритм МГУА отличается от известных в математической статистике метода шаговой регрессии и метода всех возможных регрессий тем, что в нем используются более целесообразные критерии, непосредственно связанные с целью моделирования, причем благодаря поиску минимума не требуется субъективных способов выбора критериев.
В угольной геологии накоплен и осмыслен большой геологический материал, на основе которого разработаны теоретические представления о возможных механизмах угленакопления. Характеристики угольного пласта находятся в парагенетической взаимосвязи с параметрами углевмещающей толщи пород в пределах углевмещающего ритма [2], границами которого являются ближайшие к угольному пласту пики гранулометрических кривых. Гранулометрическая оценка ритмов отражает условия осадконакопле-ния через коэффициент, учитывающий средневзвешенный размер частиц слагающих их пород - модуль крупности.
Все геологические показатели, характеризующие углевмещающую толщу (мощность и литотип пластов и т.д.) в разрезе скважины могут принимать только неотрицательные значения. Их влияние на характеристики угольного пласта может носить характер прямой или обратной связи. Ниже в таблице приводятся наиболее характерные ограничения на знаки коэффициентов при некоторых независимых переменных ритма (по их влиянию на мощность угольного пласта) в прогнозных моделях, выявленные для угольных месторождений различными исследователями.
Если коэффициент при переменной в частном описании МГУА равен нулю, это означает, что данный фактор не оказывает влияние на показатели угольного пласта. Приведенные ограничения на коэффициенты являются линейными. Для этой задачи в литературе предложено большое число методов.
Взаимосвязь показателей ритма с мощностью угольного пласта
№ п.п. Слагаемое линейной регрессии Знак при коэффициенте регрессии
1 а1тпесчаника a < 0
2 а2таргиллита почвы a2 > 0
3 а3тпесчаника почвы(тип а,р) a3 > 0
4 а4таргиллита кровли a4 > 0
5 а5талевролита a5 < 0
6 абтпесчаника почвы(тип 8,у) a6 > 0
7 а7тпластов почвы(тип а) a7 > 0
8 а8туглистого сланца a8 < 0
9 а9тизвестняка(слюдистого алевролита) a9 > 0
10 а10пколичество пластов a10 < 0
11 апк = Й11(4тпеСч. + 2талевр. + КргиллЛ к - динамичность осадконакопления au < 0
В общем виде постановка задачи формулируется следующим образом. Пусть X, y , G, h - соответственно m х n - матрица, m - вектор, m2 х n - матрица, m2 - вектор. Тогда задачу наименьших квадратов с линейными ограничениями-неравенствами можно сформулировать следующим образом:
||Xa - y|| ^ min , Ga > h .
Условия, характеризующие решение задачи НКН, дает теорема Куна - Таккера. Вектор a размерности n тогда и только тогда будет решением задачи НКН, когда найдутся m2 -вектор ю и такое разбиение множества {1,2,..., m2} на непересекающиеся подмножества L и P , что
GTю = XT (Xa - y); ri = 0, i e L , ri > 0 , i e P ; ai > 0, i e L , ai = 0 , i e P ,
где r = Ga - h .
Вектор ю, участвующий в формулировке теоремы Куна - Таккера, иногда называют двойственным вектором задачи.
Ограничения на знак коэффициента при переменных модели можно привести к одному типу - ограничению на неотрицательное значение коэффициента. Переменные с неотрицательным коэффициентом остаются без изменений. Все переменные с отрицательными коэффициентами заменяются новыми переменными, значения которых противоположны по знаку исходным. После определения оценок коэффициентов методом НКН осуществляется переход к исходным переменным с переменой знаков.
Алгоритм НКН с неотрицательными коэффициентами при переменных хорошо известен. В иностран-
ной литературе он имеет аббревиатуру NNLS (Nonnegative Least Squares) и по существу также является алгоритмом поиска вектора а, который вместе с двойственным вектором ю удовлетворял бы условиям Куна - Таккера [3].
В случае построения регрессионных зависимостей многорядным алгоритмом МГУА на каждом шаге вычисляются оценки коэффициентов при двух независимых переменных. Алгоритм NNLS принимает простой вид и состоит также из двух этапов (по числу переменных). Как было отмечено выше, возможны два случая - обе переменные принимают неотрицательные значения (случай А) или одна переменная неотрицательна и другая неположительная (случай Б).
Этап 1.
1. Положить P = 0, L = {1,2} , а = {0,0} .
2. Вычислить двумерный вектор ю = XTY. В силу того что вектор зависимой переменной Y принимает только неотрицательные значения, выполняется условие соответствия знаков компонент двойственного вектора знакам независимых переменных sign(rot) = sign(Xt), t = 1,2. Кроме того невозможен случай, когда rat = 0 .
3. Найти индекс t е L такой, что rat = max {ю1, ю2}. В случае Б выбирается единственная неотрицательная компонента rat > 0 .
4. Переместить индекс t из множества L в множество P , т.е. либо становится P = {1}, либо P = {2}.
Множество L теперь состоит из одного оставшегося элемента.
5. Вычислить компоненту at вектора а методом наименьших квадратов без ограничений-неравенств на решение Xtat = Y , где Xt - вектор значений независимой переменной с индексом t. Формула для расчета этого коэффициента следующая:
m
IXUY, ™ _ i=1
к ^ f
i=1
где Хи - значения независимой переменной /.
6. Положить а = {а1,0} или а = {0, а 2} в зависимости от индекса /. Перейти к этапу 2.
Этап 2.
1. Вычислить вектор ю = Хт (У - X ¡а 1). Выражение в скобках представляет собой вектор остатков после приближения функции на этапе 1.
2. Переместить единственный индекс 5 из множества L в множество Р . Получим L = 0 , Р = {1,2}.
3. Вычислить двумерный вектор г как приближение вектора а методом наименьших квадратов без ограничений-неравенств на решение
Хг = У .
Вектор коэффициентов при независимых переменных определяется по формуле
г = (ХтХ)-1 ХтУ .
4. Если V/ е Р : Г/ > 0, положить а = г и перейти к пункту 6.
5. Если 3/ е Р: Г/ < 0 , положить а/ = 0 . В этом
случае значение другого ненулевого коэффициента равно значению, вычисленному на первом шаге.
6. Закончить вычисления.
Использование процедуры неотрицательных наименьших квадратов позволяет строить регрессионные зависимости между параметрами углевмещающей толщи с коэффициентами уравнения, имеющими строго определенный геологический смысл. Известные априорные сведения о характере взаимосвязи (прямая или обратная) показателей угольного пласта и свойств вмещающих его пород учитываются при построении оптимального уравнения регрессии.
По результатам проведения Всероссийской конференции «Проблемы геологии, планетологии, геоэкологии и рационального природопользования» ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы».
Результаты работы получены при поддержке Минобрнауки РФ в рамках государственного задания на проведение НИОКР, шифр заявки №5.1354.2011.
Литература
1. Ивахненко А.Г. Индуктивный метод самоорганизации моделей сложных систем. Киев, 1982. 296 с.
2. Иванов Г.А. Угленосные формации. Л., 1967. 342 с.
3. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов : пер. с англ. М., 1986. 232 с.
Поступила в редакцию
25 июня 2012 г.
Шурыгин Дмитрий Николаевич - канд. техн. наук, доцент, Южно-Российский государственный технический университет (Новочеркасский политехнический институт). Тел. (8635)25-53-62. E-mail: [email protected]
Ефимов Дмитрий Александрович - аспирант, Южно-Российский государственный технический университет (Новочеркасский политехнический институт).
Shurygin Dmitry Nikolaevich - Candidate of Technical Sciences, assistant professor, South-Russia State Technical University (Novocherkassk Polytechnic Institute). Ph. (8635) 25-53-56. E-mail: [email protected]
Efimov Dmitry Alexandrovich - post-graduate student, South-Russia State Technical University (Novocherkassk Polytechnic Institute).