© Т.Ю. Панина, 2014
УДК 622.012:658.2.016 Т.Ю. Панина
ФОРМАЛИЗОВАННЫЙ ПОИСК АНАЛОГОВ ПРИ ПРОЕКТИРОВАНИИ ГОРНЫХ ПРЕДПРИЯТИЙ
Исследования посвящены актуальной научной проблеме - формализованному выбору аналогов при проектировании горных предприятий с открытым способом разработки. Предложены алгоритм и математический аппарат для объективного выбора объектов-аналогов.
Ключевые слова: Объекты-аналоги, математический аппарат, индексирование, кластерный анализ, масштабирование.
Сопоставление технико-экономических показателей проектируемого горного предприятия с открытым способом разработки с показателями двух-трех объектов-аналогов является обязательным этапом при принятии технических решений.
Выбор объекта-аналога осуществляется субъективно и основывается на опыте конкретного проектировщика и информационную базу, которой он располагает.
Вероятность ошибочного выбора аналогов при этом очень высока. Исключить ошибки возможно используя формализованный подход, который предполагает следующее:
1. Создание информационного массива действующих и запроектированных предприятий;
2. Подбор и адаптация математического аппарата для объективного подбора объектов-аналогов;
3. Разработка алгоритма поиска.
Информационный массив должен включать в себя:
а) географо-климатические характеристики месторождения, такие как удаленность от пристанционной базы, степень освоенности района месторождения, данные о рельефе местности, пораженность многолетней мерзлотой;
б) геологическая и гидрологическая характеристики - вид полезного ископаемого, запасы полезного ископаемого, содержание, глубина и условия залегания полезного ископаемого, возможные водопритоки;
в) горно-технические параметры - глинистость, трещинноватость, мощность пласта песков и торфов;
г) технологические - глубина отработки, производственная мощность предприятия, виды и количество применяемого оборудования по процессам горных работ, производительность оборудования, расстояние транспортирования.
В общей сложности по каждому предприятию может быть использовано до 60-ти параметров. Собранная информация систематизируется и накапливается в исходный массив для последующего анализа.
Использование всех групп факторов для математической обработки в натуральных единицах измерения не возможно из-за различия единиц измерения, значительного размаха вариации.
100 200 300 400 500
Расстояние до пристанционной базы, км
Рис. 1. Гистограмма распределения предприятий по расстоянию до пристанционной базы
Например, удаленность от пристанционной базы измеряется в км, запасы полезного ископаемого в тыс. т., производственная мощность предприятия в тыс.м3/год, то есть показатели являются несопоставимыми.
Это обуславливает необходимость приведения всех параметров в сопоставимый вид, для этого целесообразно использовать систему индексирования исходных данных. Здесь необходимо соблюсти следующие принципы:
1. Индексы должны соответствовать интервалам статистической группировки, проведенной для показателей в натуральных единицах измерения. Только в этом случае индексы будут отражать истинные характеристики предприятия, а также использоваться для последующего расчета функциональных зависимостей;
2. Необходимость соблюдения направленности индексов предполагает проводить кодирование таким образом, чтобы оно отражало качественную характеристику исследуемого параметра.
Принцип, положенный в его основу предполагает присвоение кода 1 предприятиям, находящимся в более лучших условиях, с ухудшением условий присваивается код 2, 3, 4, 5 и т.д..
Например, удаленность от пристанционной базы изменяется от 1 до 500 км, предварительно производится группировка предприятий с разбиением диапазона на группы рис. 1, с использованием формулы Стерждесса.
Далее каждой группе присваивается свой индекс. Пример индексирования приведен в табл. 1.
После проведения индексирования исходной информации создается электронная база данных для последующей математической обработки.
Наиболее приемлемыми математическими приемами и методами для поиска объектов-аналогов является многомерный анализ [1]. Алгоритм поиска приведен на рис. 2.
Таблица 1
Расстояние до пристанционной базы в индексированном виде
Наименование показателя Расстояние, км Присваиваемый индекс
«от» «до»
Расстояние до ближайшей железнодорожной станции (Ьжд.ст.) 1 100 1
100 200 2
200 300 3
300 400 4
400 500 5
Исходная информация
1
Инде к сир об аи 1е
I
Электронная база Пццексиро
данных ванне
I
Данные о пр о ектируемом объ екте
Многомерный анализ
Определение меры близости
Сопоставление ТЭП II выводы
Рис. 2. Алгоритм поиска объектов-аналогов
d (х г, х ,) =
к =1
Методы многомерного анализа, используемые для поиска аналогов, включают:
1. Многомерную группировку;
2. Многомерное шкалирование.
Наглядно многомерную группировку представим графически в виде денд-рограммы [4] или «диаграммы дерева» на рис. 3.
В качестве меры близости при поиске рекомендуется использовать Евклидово расстояние. В общем виде оно может быть выражено формулой:
(1)
где Х кг и Х к
количественные значения к-го признака, соответственно, для 1-го
и ]-го предприятий; Ь - количество признаков.
Процедуры многомерного шкалирования [2] применяются, когда данные заданы в виде матрицы попарных расстояний между объектами или удаленно-стей их порядковых отношений. В первом случае используются методы так называемого метрического шкалирования, а во втором - неметрического шкалирования [3].
В неметрическом многомерном шкалировании предполагается, что различия (близости) уг]. измерены в ординальной шкале, так что важен только ранговый
порядок различий, а не сами их численные значения. Процедуры неметрического многомерного шкалирования стремятся построить такую геометрическую конфигурацию точек в пространстве заданной размерности р' , чтобы ранговый
«
к к и
О
л
о н о и 5! Й л и 5! о Я
Уаг1 Уаг19 Уаг24 Уаг16 Уаг26 Уаг29 Уаг21 Уаг27 Уаг31 Уаг4 Уаг5 Уаг18 УагЗ Уагб Уаг9 Уаг13 Уаг15 Уаг7 Уаг22 Уаг12 Уаг20 Уаг10 Уаг2 Уаг14 Уаг28 Уаг8 Уаг11 УагЗО Уаг23 Уаг17 Уаг25
Евклидово расстояние Рис. 3. Иерархическая дендрограмма объектов-аналогов
порядок попарных расстоянии между ними, по возможности, минимально отличался от того порядка, которыИ задан матрицей у. Одна процедура неметрического многомерного шкалирования отличается от другоИ выбором вида критерия различия двух разных упорядочении.
Исходная информация об объектах задается в форме матрицы их попарных сравнении, где элемент < этоИ матрицы интерпретируется как евклидово расстояние между объектом Ог и объектом О . (1, ] = 1,2,....,п), т.е.
й22 ...й2п
(2)
Vйп1йп2 ...йпп J
Однако ни координаты объектов х, = (х(1,..., х^)Т , ни даже размерность их
признакового пространства Ь нам не известны. требуется на основании известных данных (2) восстановить неизвестную размерность Ь анализируемого признакового пространства и приписать каждому объекту О г координаты ^ =
)Т , таким образом, чтобы вычисленные по формуле попарные
(X
(1), х(2).
евклидовы расстояния по возможности совпадали с заданными матрицей < При этом речь идет о восстановлении координат х1, х2,..., хп с точностью до
ортогонального преобразования, т.к. при ортогональном преобразовании системы координат попарные расстояния между объектами не меняются. Таким образом, цель методов метрического многомерного шкалирования состоит в том, чтобы отобразить информацию о конфигурации исходных многомерных данных, заданную матрицей расстояний < в виде геометрической конфигурации п точек в соответствующем многомерном пространстве.
Целесообразно рассмотреть центрированную матрицу искомых наблюдений
Хц =
СX(1) - X (1) X(2) - X (2) Xh - X (й) ^
Л^ Л Л^ Л .. ..Л 1 Л'
X (1) - X (1) X (2) - X (2) X h - X (h)
Л' 2 л- Л' 2 л- • • ♦л 2 «"V
X (1) - X (1) X (2) - x 2 Xh - х (h)
V n л Лп Л •••лп Л У
(3)
а также матрицу В = (bj), ij = 1,2,..., п, скалярных произведений
bj = (X - X)T (Xj - X) = У (x(k) - x(k))(xjk) - x(k)) . (4)
к=1
Метод определения искомых координат X1,X2,...,Xn анализируемых объектов и размерности h пространства, в которое они отображаются, основан не на непосредственном использовании матрицы исходных данных d (см. формулу 2), а на преобразовании ее в матрицу В. Можно показать, что элементы матриц d и В связаны между собой соотношением
1 In In Inn
bj = i(-d2 +1У d2 +1У d2-ArУ У d2) (5)
11 2v 11 n £ 1 n j=1 11 n2 t! £ 1 V '
Далее используются следующие свойства матрицы В:
1) матрица В неотрицательно определена;
2) ранг матрицы В равен размерности р искомого пространства отображения;
3) ненулевые собственные числа d1, d 2,..., d матрицы В, упорядоченные в порядке убывания, совпадают с соответствующими собственными числами матрицы S2 = X^X, где матрица Хц определена соотношением (3); важно
Л
отметить, что матрица УX = S / n есть выборочная матрица ковариаций искомого вектора признаков X;
4) пусть lr = (lr1,lr2,...,lrh)Т есть r - й собственный вектор матрицы SI, соответствующий r-му по величине собственному значению dr (r = 1,2,., h); тогда
v(r) i (r) (r) (r) \ T - - w
вектор L = (z\ , z2 ,..., zn ) значений r-й главной компоненты вектора X будет
г(г) = хч ¡г (6)
при этом, если ¡^ = (1Вг1,¡в г г,..., ¡Гп ) - г -й собственный вектор матрицы В, соответствующий тому же собственному числу (т.е. = dr¡вr), то
г(г) =^, г = 1,2,..., Ь (7)
Представление объектов в виде (7) и будет решением проблемы метрического многомерного шкалирования.
Объективность формализованного подхода подтвердили расчеты, выполненные по ряду месторождений, например, при проектировании месторождения «Погромное», в качестве аналогов использовались следующие предприятия
«Даурия» г(г) = (8;20;13) = 2,5, «Бальджа» г(г) = (11;21;15) = 2,7.
При выполнении аналогового поиска в формализованном режиме были
найдены следующие предприятия-аналоги - «Усть-Кара» г(г) = (6;9;14) = 1,5,
«Урюмкан» г(г) = (6;9;17) = 1,8 с очень высокой мерой близостью.
Сопоставление параметров предприятий по географо-климатическим, геологическим, гидрологическим, технологическим характеристикам и горнотехническим параметрам показало высокую сходимость результатов и эффективность предлагаемой методики.
1. Терехина А.Ю. Многомерный анализ субъективных данных о сходствах или различия: учебник / А.Ю. Терехина. - М.: Статистика, 1978. - 143 с.
2. Терехина А.Ю. Метрическое многомерное шкалирование: учебник / А.Ю. Терехина. - М.: Статистика, 1977. - 159 с.
- СПИСОК ЛИТЕРАТУРЫ
3. Терехина А.Ю. Неметрическое многомерное шкалирование: учебник / А.Ю. Терехина. - М.: Статистика, 1977. - 171 с.
4. Кушенский Н. Применение методов кластеризации для сравнительного анализа работы карьерного автотранспорта / Н. Кушенский // 25 лет Читинскому филиалу ВНИПИгорцветмет. - Чита, 1982 - С. 6465. гттттз
КОРОТКО ОБ АВТОРЕ -
Панина Татьяна Юрьевна - ассистент кафедры экономики горного производства и геологоразведки, Забайкальский государственный университет, e-mail: [email protected]
UDC 622.012:658.2.016 FORMAL SEARCH OF ANALOGUES WHEN DESIGNING THE MINING ENTERPRISES
Panina T.Y., Assistant, e-mail: [email protected], Zabaikalskiy State University.
An opencast mine planning requires comparative appraisal of engineering-and-economical performance of the mine under projecting and the analogous mines. The choice of the mines-analogues is often based on the subjective experience, which elevates error probability. This shortcoming is avoidable by means of a formal approach, including: creation of information bases of mines in operation and under projecting, selection of mathematical apparatus for optimized objective selection of mines-analogues and development of search algorithm. The data bases contain information on geographical and climatic features of the mine location, geological and hydrogeological conditions of the deposit, mine-technical and technological parameters. All the grouped factors have different units of measurement, so it is advisable to introduce the input data adjustment system for the convenience of mathematical treatment. The search of the mines-analogues uses the multifac-eted analysis, including multidimensional grouping and multidimensional scaling. Practical application of the proposed formal approach in mine planning in Transbaikalia has shown the high convergence of the results and confirmed the proposed method efficiency. The investigation is devoted to an actual scientific problem of formalized choice of analog enterprises when projecting open pit mines. The steps and mathematic analyses are given for objective choice of analog-objects.
Key words: Analog-objects, mathematic analyses, indexation, cluster analysis, scaling.
REFERENCES
1. Terekhina A.Yu. Mnogomernyi analiz sub"ektivnykh dannykh o skhodstvakh ili razlichiya (Multidimensional analysis of subjective data on similarity and difference). uchebnik. Moscow, Statistika, 1978. 143 p.
2. Terekhina A.Yu, Metricheskoe mnogomernoe shkalirovanie uchebnik (Metric multidimensional scaling). Moscow, Statistika, 1977. 159 p.
3. Terekhina A.Yu, Nemetricheskoe mnogomernoe shkalirovani (Nonmetric multidimensional scaling). uchebnik. Moscow, Statistika, 1977. 171 p.
4. Kushenskii, N. Primenenie metodov klasterizatsii dlya sravnitelnogo analiza raboty karernogo avto-transporta (Application of clustering techniques in comparative analysis of mechanical transport operation at an open pit mine). 25 let Chitinskomu filialu VNlPlgortsvetmet. Chita, 1982. pp. 64-65.
A
РИСУЕТ ДАРЬЯ АБРЕНИНА
Бери, что угодно, а книги не отдам!