Научная статья на тему 'Сравнительный анализ методов регрессии и метода группового учета аргументов при моделировании процессов переработки полезных ископаемых'

Сравнительный анализ методов регрессии и метода группового учета аргументов при моделировании процессов переработки полезных ископаемых Текст научной статьи по специальности «Математика»

CC BY
801
119
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННАЯ МОДЕЛЬ / ИМИТАЦИОННЫЙ ЭКСПЕРИМЕНТ / СЕЛЕКЦИЯ / МНОГОРЯДНЫЙ ПОЛИНОМИАЛЬНЫЙ АЛГОРИТМ / ПОЛЕЗНЫЕ ИСКОПАЕМЫЕ / ИЗМЕЛЬЧЕНИЕ РУДЫ / REGRESSION MODEL / SIMULATION EXPERIMENT / SELECTION / MULTI%ROW POLYNOMIAL ALGORITHM / MINERALS / ORE GRINDING

Аннотация научной статьи по математике, автор научной работы — Баласанян Сейран Шамирович, Геворгян Эрмине Михайловна

Актуальность работы обусловлена необходимостью проведения сравнительного анализа методов регрессии и метода группо% вого учета аргументов с целью оценки эффективности их применения при моделировании процессов переработки полезных ископаемых. Цель работы: оценка эффективности применения методов регрессии и метода группового учета аргументов при построении статистических моделей технологических процессов переработки полезных ископаемых на основании результатов теоретиче% ского исследования, компьютерных имитационных экспериментов и практического применения указанных методов. Методы исследования: методы математической статистики, метод имитационного моделирования, метод индуктивного моде% лирования. Результаты. Проведен сравнительный анализ методов регрессии и метода группового учета аргументов путем их теоретическо% го исследования, компьютерных имитационных экспериментов и практического применения при построении модели, описы% вающей статистическую зависимость прибыли от выходных интервальных характеристик технологической системы измельчения руды Зангезурского медно%молибденового комбината. В результате логического анализа вышеупомянутых методов сделан вы% вод, что сравнительно высокое прогнозирующее свойство моделей, построенных методом группового учета аргументов, обес% печивается как выбором оптимальной структуры модели, так и за счет описания случайной ошибки. С помощью компьютерных имитационных экспериментов исследовано влияние объёма выборки, уровня статистического шума на прогнозирующих спо% собностях моделей, построенных с использованием обоих методов. Установлено, что сравнительно высокое прогнозирующее свойство моделей, построенных методом группового учета аргументов, проявляется особенно при умеренном статистическом шуме и малых выборках, соизмеримых с числом входных переменных. Исследованы также возможности рассмотренных мето% дов с точки зрения выявления физических и системных закономерностей различных объектов с заданными постулированными функциями. Эффективность практического применения рассмотренных методов оценена по результатам построения технико% экономической модели технологической системы измельчения руды. Применение шагового регрессионного метода позволило построить наилучшую с точки зрения компромисса между адекватностью и сложностью модель, что свидетельствует о целесо% образности применения методов регрессии при построении статистических моделей технологических процессов переработки полезных ископаемых.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Баласанян Сейран Шамирович, Геворгян Эрмине Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The relevance of the discussed issue is caused by the need to conduct a comparative analysis of regression methods and the data group accounting method in order to evaluate the effectiveness of their use in modeling mineral processing. The main aim of the study is to assess the effectiveness of application of the regression methods and the data group accounting method in constructing statistical models of minerals processing based on the results of theoretical studies, computer simulation experiments and practical application of these methods. The methods used in the study: methods of mathematical statistics, simulation method, method of inductive modeling. The results. The authors have carried out the comparative analysis of regression methods and the data group accounting method by theoretical investigations, computer simulations and practical applications at the construction of model describing the statistical dependence of profit on the output interval characteristics of the ore grinding technological system of Zangezur Copper and Molybdenum Combine. As a result of the logical analysis of the above mentioned methods the authors concluded that a relatively high predictive property of the models constructed by the data group accounting method is ensured both by the selection of the optimal model structure, and by description of the random error. Using the computer simulation experiments the authors investigated the influence of sample size, level of statistical noise on the predictive ability of the models built using both methods. It was ascertained that a relatively high predictive ability of models constructed by the data accounting group method occurs especially at moderate statistical noise and small samples, comparable to the number of input variables. The possibilities of these methods were studied as well in terms of identifying physical and systemic regularities of various objects with the specified postulated functions. The effectiveness of the practical application of the considered methods is evaluated by the results of construction of techno-economic model of ore grinding technological system. The application of a stepwise regression method allowed constructing the best possible model in terms of a compromise between adequacy and complexity. This indicates the feasibility of applying the regression methods at constructing the statistical models of minerals processing.

Текст научной работы на тему «Сравнительный анализ методов регрессии и метода группового учета аргументов при моделировании процессов переработки полезных ископаемых»

УДК 681.51:622.73

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ РЕГРЕССИИ И МЕТОДА ГРУППОВОГО УЧЕТА АРГУМЕНТОВ ПРИ МОДЕЛИРОВАНИИ ПРОЦЕССОВ ПЕРЕРАБОТКИ ПОЛЕЗНЫХ ИСКОПАЕМЫХ

Баласанян Сейран Шамирович1,

seyran@sunicom.net

Геворгян Эрмине Михайловна1,

hermine79@rambler.ru

1 Капанский филиал Национального политехнического университета Армении, Армения, 3307, г. Капан, ул. Багаберд, 28.

Актуальность работы обусловлена необходимостью проведения сравнительного анализа методов регрессии и метода группового учета аргументов с целью оценки эффективности их применения при моделировании процессов переработки полезных ископаемых.

Цель работы: оценка эффективности применения методов регрессии и метода группового учета аргументов при построении статистических моделей технологических процессов переработки полезных ископаемых на основании результатов теоретического исследования, компьютерных имитационных экспериментов и практического применения указанных методов. Методы исследования: методы математической статистики, метод имитационного моделирования, метод индуктивного моделирования.

Результаты. Проведен сравнительный анализ методов регрессии и метода группового учета аргументов путем их теоретического исследования, компьютерных имитационных экспериментов и практического применения при построении модели, описывающей статистическую зависимость прибыли от выходных интервальных характеристик технологической системы измельчения руды Зангезурского медно-молибденового комбината. В результате логического анализа вышеупомянутых методов сделан вывод, что сравнительно высокое прогнозирующее свойство моделей, построенных методом группового учета аргументов, обеспечивается как выбором оптимальной структуры модели, так и за счет описания случайной ошибки. С помощью компьютерных имитационных экспериментов исследовано влияние объёма выборки, уровня статистического шума на прогнозирующих способностях моделей, построенных с использованием обоих методов. Установлено, что сравнительно высокое прогнозирующее свойство моделей, построенных методом группового учета аргументов, проявляется особенно при умеренном статистическом шуме и малых выборках, соизмеримых с числом входных переменных. Исследованы также возможности рассмотренных методов с точки зрения выявления физических и системных закономерностей различных объектов с заданными постулированными функциями. Эффективность практического применения рассмотренных методов оценена по результатам построения технико-экономической модели технологической системы измельчения руды. Применение шагового регрессионного метода позволило построить наилучшую с точки зрения компромисса между адекватностью и сложностью модель, что свидетельствует о целесообразности применения методов регрессии при построении статистических моделей технологических процессов переработки полезных ископаемых.

Ключевые слова:

Регрессионная модель, имитационный эксперимент, селекция, многорядный полиномиальный алгоритм, полезные ископаемые, измельчение руды.

Введение

Построение математических моделей технологических процессов (ТП) добычи и переработки полезных ископаемых часто осуществляется статистическими методами [1-7]. Одной из основных проблем построения статистических моделей является выбор наилучших входных переменных и определение оптимальной структуры модели. Наряду с широко применяемыми на практике регрессионными методами выбора наилучшего состава входных переменных и структуры модели [8-13] используется также метод группового учета аргументов (МГУА) [14-23], представляющий собой дальнейшее развитие метода регрессионного анализа.

По утверждениям авторов МГУА и его пользователей, модели, построенные с применением этого метода, по своим прогнозирующим свойствам превосходят регрессионные модели, в силу того, что МГУА, благодаря применению эвристических

принципов самоорганизации, обеспечивает автоматический отбор информативных входных переменных и выбор структуры регрессионной модели оптимальной сложности, особенно при зашумлен-ных малочисленных статистических данных.

Регрессионные методы [8-13] также позволяют выбрать наилучший состав входных переменных и структуру регрессионной модели с применением статистических критериев при рассмотрении в качестве дополнительных входных переменных преобразованные исходные переменные и использовании комбинаторного метода порождения моделей. Заметим, что с точки зрения возможности и эффективности применения построенных моделей для целей управления, наряду с прогнозирующим свойством, большое значение имеет степень их соответствия системным закономерностям моделируемого процесса, что, как правило, обеспечивается при использовании регрессионных методов.

В данной работе проведен сравнительный анализ методов регрессии и МГУА с целью оценки эффективности их применения при построении статистических моделей ТП переработки полезных ископаемых.

Теоретическое исследование методов

регрессии и МГУА

При классическом регрессионном анализе постулированная модель представляется в следующем виде [8-13]:

у = О (х, р) + ё, (1)

где х=(х1,х1,...,хт) - вектор входных (независимых) переменных; ~ - случайная выходная (зависимая) переменная; р=(Д),р1,Д»...»Рт) - неизвестный вектор коэффициентов модели; ё - случайная величина (случайное возмущение, ошибка, шум), формально учитывающая влияние случайных факторов. Предполагается что, как переменные модели, так и случайное возмущение распределены нормально с параметрами М[х]=0, сг2=о-2=соп81;.

Очевидно, что в силу действия случайных факторов постулированная модель (1) не может точно прогнозировать значение выходной переменной при заданных значениях входных переменных. Следовательно, нет оснований говорить об «истинной» модели в полном смысле слова. Обычно под «истинным» значением выходной переменной понимают его условное математическое ожидание при заданных значениях входных переменных: М[у / х] = М[о(х, р)] + М[ё] = О(х, р), (2)

где 0(х,р) - линейная модель или модель, которую можно свести к линейной по коэффициентам Р0,Р1,Р2,...,Рт с помощью соответствующего преобразования.

Соотношение (2) представляет собой теоретическую регрессионную модель (уравнение регрессии у относительно х). Основной задачей регрессионного анализа является выявление и приближенное математическое описание причинно-следственной зависимости С(х,Р) между выходной и входными переменными. С этой целью на основании статистических данных (выборки {х1,у1}п) методом наименьших квадратов строится статистический аналог соотношения (2) - эмпирическая регрессионная модель

у = О( х, Ь), (3)

адекватность которой, т. е. степень ее соответствия статистическим данным {х1,у1}п, оценивается с помощью выборочного коэффициента детерминации (коэффициента множественной корреляции)

д = ё (У, - У?/ ё (у,- - у)2. (4)

1=1 / I=1

Показанно [8-10], что при больших выборках статистических данных (п>>т) вместо (4) можно использовать следующую приближенную формулу:

^.2 ^.2/^.2 Я и 1-и/а у .

Коэффициент Я2 показывает, какая часть вариации ~ обусловлена регрессионной моделью. Из соотношения (4) следует, что максимально возможное значение коэффициента Я2 ограничено погрешностью измерений, наличием неучтенных или неконтролируемых факторов и никак не зависит от состава входных переменных и структуры модели. Например, если 10 % вариации выходной переменной модели обусловлено погрешностью измерения переменных, то максимально возможное значение Я2 не может превышать 0,9 при включении в модель всех входных переменных и любой структуре модели.

Однако применение МГУА при аналогичных условиях позволяет обеспечить значение Я2, превышающее его максимально возможное значение, как утверждают авторы метода, за счет селективного выбора информативных входных переменных и оптимального усложнения модели. На наш взгляд, при наличии статистического шума, обусловленного погрешностью измерений и неучтенными факторами, большое значение Я2, превышающее его максимально возможное значение, обеспечивается за счет излишнего усложнения модели, которая вместо существующей закономерности описывает случайные ошибки. Поясним сказанное на следующем простом примере. С целью установления зависимости напряжения участка цепи от сопротивления и силы тока производились эксперименты, в результате которых с определенной точностью измерялись значения силы тока и падения напряжения. Результаты экспериментов приведены на рис. 1.

Рис. 1. Результаты экспериментов Fig. 1. Results of the experiments

Если построить регрессионную модель на основании экспериментальных данных, то полученная зависимость с коэффициентом R2<1 приблизительно будет описывать известный закон Ома для участка цепи U=Ir. Если же усложнить модель, например, используя в качестве аппроксимирующей функции ряд Фурье, то можно увеличить значение R2 до 1. Однако такая модель уже вместо существующей линейной физической закономерности будет описывать ошибки измерений. Примерно то же самое происходит при использовании МГУА,

когда простые по своей физической природе объекты, описываемые линейными или квадратичными регрессионными моделями, с целью повышения прогнозирующего свойства аппроксимируются многочленами высокого порядка (до 10-20).

В связи с вышесказанным заметим, что основной задачей моделирования, в частности идентификации объектов, является выявление и математическое описание закономерности при наличии случайных факторов и статистического шума, а не обеспечение только прогнозирующего свойства модели, на что уделяется основное внимание в МГУА.

МГУА представляет собой дальнейшее развитие регрессионного анализа и является типичным методом индуктивного моделирования, основанным на некоторых принципах теории обучения и самоорганизации, в частности на принципе «селекции» или направленного отбора. Этот метод включает семейство индуктивных алгоритмов, обеспечивающих рекурсивный селективный отбор моделей, на основе которых строятся более сложные модели. Точность моделирования на каждом следующем шаге рекурсии увеличивается за счет усложнения модели. Как правило, исходную выборку разбивают на обучающую (объёмом по6) и проверочную (объёмом ппр) выборки соотношением по6/ппр=3/2. Первая выборка используется для оценки коэффициентов модели методом наименьших квадратов (МНК), а вторая - для определения качества модели с помощью коэффициента детерминации Я2 или среднеквадратического отклонения ошибки (СКО) а2 (остаточной дисперсии). С каждым шагом итерации СКО уменьшается, но после достижения определенного уровня сложности, зависящего от характера и количества данных, а также общего вида модели, СКО начинает расти.

Рассмотрим более подробно процесс синтеза модели оптимальной сложности, широко используемого на практике многорядного полиномиального алгоритма МГУА [20, 22].

1. Выбирается общий вид перебираемых моделей (опорных функций) с т независимыми переменными, используя обобщенный полином Колмогорова-Габора:

т т____т

Г = а0 + ХаЛ + +...,

.=1 ] =1 . <] ] =1 . <] к <

который с высокой точностью может аппроксимировать любую непрерывную на конечном интервале функцию в виде полинома определенной степени (согласно теореме Вейерштрасса). Сложность модели в таком случае определяется количеством коэффициентов а,, (¿,7=1,т, 1<]).

2. Используя опорные функции, строятся различные варианты моделей, включающие попарные комбинации исходных переменных, из которых составляются уравнения решающих функций, как правило, не выше второго порядка:

у = /(х1, х2), у2 = /(х1, хз),..., ух = /(х,., У1).

Обычно в качестве функции / выбираются простые зависимости:

у(х.,xj) = а0 + ах + а2х^/ + аъх1х^/,

или

у (х., х]) = а0 + а1х1 + а 2х] + аъх1х! + а 2 + а5х^.

Используя обучающую выборку, методом наименьших квадратов для каждой модели определяются коэффициенты а0, а!, а2, а3, а4, а5. Набор полученных моделей составляет первый ряд селекции. Среди всех моделей первого ряда селекции выбираются несколько (от 2 до 10) наилучших. Качество моделей определяется коэффициентом детерминации, или СКО ошибки а2, с помощью проверочной выборки.

3. Отобранные частные модели формируют множество новых переменных, которые являются исходными переменными для частных моделей второго ряда селекции: г^/уу), 22=/у1,ук),.... Коэффициенты новых моделей находятся по

МНК, используя обучающую последовательность. Качество моделей оценивается с использованием проверочной последовательности, и среди них выбираются наилучшие, которые используются в качестве переменных моделей следующего, третьего ряда и т. д. Сложность общей модели возрастает от ряда к ряду. Если в качестве опорных функций используются полиномы второй степени, то на каждом шаге итерации степень результирующего полинома удваивается.

Дальнейшее усложнение модели прекращается по достижении минимума СКО а2 (или максимума коэффициента детерминации Я2), определяемого с помощью проверочной выборки, или когда дальнейшее улучшение критерия селекции не будет превышать некоторого числа е (параметр алгоритма).

4. На заключительном этапе, делая последовательную замену переменных, получают модель, включающую исходные переменные.

Сравнительный анализ метода шаговой регрессии и МГУА с помощью имитационных экспериментов

С целью сравнения метода шаговой регрессии и МГУА с точки зрения их возможности выявления и описания существующих зависимостей между выходным и входными переменными различных объектов с заданными функциями О(хф) проводились компьютерные имитационные эксперименты.

Моделирующий алгоритм, блок-схема которого приведена на рис. 2, работает следующим образом. Блок 1 осуществляет ввод исходных данных моделирования: значения параметров л, а, (7=1,т), корреляционную матрицу П(/,1=1,т). Блоки 2-4 осуществляют имитацию функционирования исследуемого объекта с заданной функцией О(хф), т. е. формируют возможные реализации вектора входных переменных Х=(хХ1,Х1,^,хт) методом невырожденного многомерного нормального распре-

деления [26, 27], случайного возмущения (шума) s и в соответствии с соотношением (1) формируют значения выходной переменной у.

Q Пуск (Start)

I

Ввод (Input) | \ \/

ri\I'j 1 = 1 m /

I

Формирование вектора Ы

(formation of vector)

Х= (X1> Xm )

Формирование возмущения (Formation of the disturbance) s

И

пг

Вычисление (Calculation) I 4 I

y= G( x,ß) + £,

I .

Построение регрессионной модели (Construction of a regression model) y = Gp (x,ß) Ш

I

Построение модели методом ГУА (Construction of the model by DAG method) у = Gm (X'P) Ш

Вывод результатов (Output of results)

^Останов (Stop)^

Рис. 2. Блок-схема имитационной модели Fig. 2. Block diagram of simulation model

Далее на основании статистических данных {(xii>x2i>->X»i>y): j=1>n}> полученных в результате имитационного моделирования исследуемого объекта, шаговым регрессионным методом и МГУА строятся регрессионная модель Мр, иерархическая многоуровневая модель ММГУА и вычисляются коэффициенты детерминации Rp2 и R 2МГУА полученных моделей. В процессе имитационных экспериментов были рассмотрены линейные и квадратичные функции G(x,ß), при различных значениях соотношения с?7(72=(0-0,5) и количестве реализаций n=20-200.

При построении регрессионных моделей объектов с квадратичными функциями G(x,ß) были рассмотрены дополнительные переменные, представляющие собой квадратичные формы исходных переменных первого порядка.

Построенные в результате имитационных экспериментов регрессионные модели всегда совпадали с заданными функциями G(x,ß), как первого, так и второго порядка. Значения коэффициента R2 варьировались в пределах 0,5-0,81 в зависимо-

сти от значений коэффициентов корреляции между входными и выходным переменными и величины соотношения с?2/с?2.

Построенные с помощью МГУА модели совпали с заданными функциями О(хф) лишь при отсутствии или незначительном уровне случайного возмущения ё (с?2/(72=0-0,05). При больших значениях соотношения с?2/с?2 модели, построенные методом ГУА, несмотря на достаточно большие значения ДМгуа (>0,9), не совпали с рассматриваемыми функциями 0(х,Р), имели иерархическую многоуровневую (до 3-5 уровней) структуру и довольно большой порядок (6-10) исходных входных переменных. Значение коэффициента ДМГУА уменьшается с увеличением значения с?2/с?2, оставаясь при этом всегда больше значения коэффициента R(,2 регрессионных моделей.

Заметим, что сравнительно высокое прогнозирующее свойство моделей, построенных с помощью МГУА, проявляется особенно при умеренном статистическом шуме и малых выборках, соизмеримых с числом входных переменных.

Практическое применение метода шаговой регрессии и МГУА на примере системы измельчения руды

Возможности и особенности применения шаговой регрессии и МГУА рассмотрим на примере построения технико-экономической регрессионной модели, описывающей статистическую зависимость прибыли, получаемой от производства мед-но-молибденовых концентратов в течение 8-часового интервала (смены), от выходных интервальных характеристик технологической системы измельчения руды Зангезурского медно-молибдено-вого комбината (ЗАО «ЗММК», Армения).

Прибыль, получаемую от производства концентратов в течение смены, можно представить в следующем виде:

Р = Б - - Ь, (5)

где Л - доход от реализации концентратов, выработанных в течение смены; С - условно-переменная часть затрат на переработку 1 т руды; q1C -условно-переменная часть затрат, зависящая от массы переработанной в течение смены руды; Ь - условно-постоянная часть затрат, не зависящая от объема переработки руды.

Согласно [2, 3, 5-7], к условно-переменным затратам можно отнести расходы на реагенты, шары, футеровку и другие технологические материалы, часть энергических и транспортных (внутри-рудничных) затрат.

Условно-постоянные затраты включают амортизационные отчисления, расходы на капитальный ремонт, зарплату, часть энергетических затрат, некоторые статьи цеховых расходов и прочие расходы, которые не вошли в состав условно-переменных затрат.

Строго говоря, условно-переменные затраты, помимо объема переработки руды, зависят (хотя

г= 1. n

слабо) также от таких факторов, как крупность и твердость дробленой руды, крупность помола, минералогический состав и содержание металлов в руде и т. п. Однако учесть влияние этих факторов в настоящее время не представляется возможным [8]. Поэтому допускается, что условно-переменные затраты зависят только от сухой массы переработанной руды.

Таким образом, построение технико-экономической модели сводится к определению коэффициентов С, Ь и отысканию уравнения, описывающего зависимость дохода от реализации концентратов, выработанных в течение смены, от интервальных выходных характеристик ТСИР

в = ФЯ <Ь <?з)- (6)

В настоящее время единственно возможным подходом к построению указанной выше модели является статистический, который основывается на обработке экспериментальных данных, собранных непосредственно на действующем объекте.

С целью построения статистической модели (6) совместно с работниками ЗММК в течение 180 смен было произведено апробирование процесса измельчения и параметров конечного продукта. При этом регистрировались:

• сухая масса руды (д1), переработанной в течение смены (тонн);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• среднесменное процентное содержание класса < 80 мкм в измельченном продукте (д2);

• среднесменная плотность объединенной пульпы (г/л) (&);

• вес готового молибденового концентрата уМо (тонн), выработанного в течение смены, и сред-несменное процентное содержание молибдена (Дмо) в нем;

• вес готового медного концентрата уСи, выработанного в течение смены (тонн), и среднесмен-ное процентное содержание меди (ДСи) в нем. Доход от реализации концентратов, выработанных в течение смены, вычислялся по формуле

Б =

У МоДМо ¡с | УСиДСи 100 Мо 100

с

где СМо, ССи - соответственно рыночные цены на молибден и медь.

Применение метода шаговой регрессии До того как приступить к построению модели, было проверено выполнение следующих условий, обеспечивающих корректность применения корреляционно-регрессионного анализа:

• нормальность и стационарность входного процесса q(t)=(ql(t),q2(t),qi(t));

• нормальность и стационарность выходного процесса Б^).

При проверке гипотезы о нормальном распределении переменных модели был использован критерий х2 Пирсона, а проверка стационарности входного и выходного процессов была выполнена с помощью критерия Шефе [26].

Следующим важным вопросом при построении регрессионной модели Б=^1д2д3) является выбор ее структуры. Опыт практического применения корреляционно-регрессионного анализа для математического описания производственных, в частности обогатительных процессов [1-7], свидетельствует о том, что в качестве статистической модели нормально функционирующего объекта достаточно рассмотреть алгебраический полином не выше второй степени.

На основании вышесказанного, а также учитывая сравнительно невысокие значения коэффициентов вариации (у^=8,7 %, Уг=1 %, уь=0,8 %, уб=8,3%,) переменных, максимальная степень аппроксимирующего полинома была выбрана равной двум.

Таким образом, для построения регрессионной модели имеем следующие исходные и преобразованные переменные: Б - отклик, выходная переменная; q1, q2, q3 - исходные входные переменные;

q4=ql•q2, q5=ql•qз, q6=q2•qз, q7=q22, q8=qз2, q9=ql2 - преобразованные входные переменные. Контрольные данные:

• число наблюдений -180;

• критическое значение общего (частного) ¥■-критерия - ^0,97б(1;170)=3,9;

• уровень риска для доверительных границ - 5 %. При построении регрессионной модели были

использованы расчетные формулы, приведенные в [8-13].

Шаговая регрессионная процедура начинается с построения простой корреляционной матрицы И. Проверка значимости полученных коэффициентов парной корреляции по критерию Стьюдента показала, что все они статистически значимы при уровне значимости а=0,05.

в Я1 Я2 Яъ Я4 Я5 Я„ <к я„ я,

О 1 0,61 0, 18 0, 30 0,82 0, 62 0,22 0,12 0, 25 0,60

Я, 0, 61 1 -0, 30 0, 30 0,50 0, 95 -0,25 -0,31 0, 24 0,95

Я 0, 18 -0,30 1 -0,62 0,45 -0,47 0,95 0,95 -0, 62 -0, 28

Я 0,30 0,30 0,62 1 -0,16 0,30 -0,29 -0,55 0,95 0,24

Я = Я 0,82 0,50 0,45 -0,16 1 0,50 0,41 0,40 -0,15 0,51

Я 0,62 0,95 -0,47 0,30 0,50 1 -0,28 -0,41 0,45 0,95

Я 0,22 -0,25 0,95 -0,29 0,41 -0,28 1 0,95 -0,28 -0,25

Я 0,12 -0,31 0,95 -0,55 0,40 -0,41 0,95 1 -0,53 -0,25

Я 0,25 0,24 -0,62 0,95 -0,15 0,45 -0,28 -0,53 1 0,2 0

Я, 0,60 0,95 -0,28 0,24 0,51 0,95 -0,25 -0,25 0,20 1

Ш аг 1

1. В качестве первой независимой переменной для включения в регрессионную модель выбирается q4, которая наиболее сильно коррелирована с откликом:

тах

{^ОЯ, I:' = 1,9} =

г

= 0,82.

2. Вычисляется значение общего ^-критерия для уравнения Б=/1^4) по формуле

Р я = -

Я

вя4

1 - Я

-(п - т -1) = 365,2,

ОЯ4

где п - число наблюдений; т - число независимых переменных регрессионного уравнения; Я1Ч1=гВд1.

2

Уравнение Б=/^4) является статистически значимым, так как расчетное значение ^-критерия превосходит выбранное критическое значение (3,9). 3. Вычисляются остаточная дисперсия &2 и коэффициент вариации отклика уц по формулам

СГ = cF (1 - R

Dv

V. =С-100 = 5,05 %.

D D

1.

Шаг 2

Вычисляются частные коэффициенты корреляции (табл. 1) между каждой независимой переменной qi (¿=1,9; ¿*4) и откликом, при условии, что переменная q4 включена в регрессионную модель, по формуле

r,

- D

Dq, *q4

d;; d;

где Б/3, Б//, Б/3 - алгебраические дополнения соответствующих элементов корреляционной матрицы Б":

D =

Таблица 1. Коэффициенты частной корреляции Table 1. Coefficients of private corrélation

1 r Dq4 r Dq

r DqA ; r q 4q

r Dq r q4q 1

i 1 2 3 5 6 7 8 9

K'J 0,146 0,136 0,611 0,464 0,052 0,157 0,433 0,22

0,0067 0,00335 - 0,163 0,00441 0,017 0,0016 0,0075

2. Выбирается

тах{|: г = 1Д/ * 4} = ^ J = 0,611.

В соотвтствии с шаговым методом в качестве следующей переменной, претендующей для включения в регрессионную модель, выбирается q3, которая характеризуется наиболее высоким частным коэффициентом корреляции с откликом.

3. Вычисляется множественный коэффициент корреляции для регрессионной модели Б=Ш4^з) по формуле

где

D13

RD.qq =\ А--Л- = 0,9339,

D,?4?3 У D11

D =

4. Вычисляется значение частного ^-критерия

для проверки значимости вклада q3:

•>2 „2 \

1 r Dq4 r Dq3

rDq4 ; r q 4q 3

r Dq3 r q4q3 ;

F.

?з'?4

(RD .q4q3 rD.q 4

; - r2

D*q4q3

(n - m -1) = 276,7.

Как видно, расчетное значение частного ^-кри-терия превосходит табличное значение (3,9). Это свидетельствует о том, что новая переменная q3 дает статистически значимое снижение остаточный суммы квадратов (см. табл. 3). Следовательно, переменная q3 в регрессионной модели сохраняется. 5. Вычисляется значение частного ^-критерия для проверки значимости вклада переменной q4, который имел бы место, если бы в модель была введена сначала q3, затем q4 (вклад q4/q3), по формуле

F q4 q = '

(R

2

d'?4?3

- Г2

Dq

; - r 2

(n - m -1) = 1075.

Поскольку расчетное значение частного ^-кри-терия больше критического, переменная q4 в регрессионной модели сохраняется. 6. Вычисляется значение общего ^-критерия для модели Б=Ш^3):

Fqq _

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

RD .^(n - m -;) (; - RD .qj m

= 400,6.

Общий ^-критерий показывает, что регрессионная модель ¿=/2^4^3) является статистически значимой при уровне значимости а=0,05. 7. Вычисляются остаточная дисперсия и коэффициент вариации отклика по формулам

С = cD (1 - R Vf =-100 = 3,15%.

c. D

Шаг 3

Вычисляются частные коэффициенты корреляции ^ (г = 1,9; г * 3,г * 4) (табл. 2) между

каждой переменной, не включенной в регрессионную модель, и откликом, при условии, что q4 и q3 уже включены в модель, по формуле

r,

- D

Dq , rnq^

Pli ■ D

где

D2 =

; r Dq4 r Dq3 r Dq

r Dq4 ; r q4q 3 r q 4?

rDq3 r q4q3 ; r q q

r Dq, r qq r q q, ;

Выбирается iiax{| r

тах{|: / = 1,9; / * 3;/ * 4} = \гщ„д ^ = °Д63.

Следовательно, следующей переменной, претендующей на включение в регрессионное уравнение, является q5.

2. Вычисляется множественный коэффициент корреляции для регрессионной модели

¿=/3^4,^5):

RD'qtqzq5 4 1

DL

D25

Ml

= 0,935,

где

1 r 1 'D?5

D25 = D13 r ?4?5 r ?5?3

r D?5 r r ?4?5 ?5?3 1

3. Вычисляется значение частного f-критерия для проверки значимости вклада:

F.

?5'?4?3

( R2 — R2 )

_ V D'4443ß5J D «q 4? з >

(1 — RD«?4?3?5 )

(n — m — l) = 2,95.

Поскольку значение частного f-критерия меньше критического, т. е. вклад переменной q5 является статистически незначимым при а=0,05, то она не включается в модель и шаговая регрессионная процедура заканчивается.

Таким образом, в качестве наилучших переменных регрессионной модели выбираются q3 и q4. Процесс выбора наилучших переменных компактно представлен с помощью табл. 2.

Таблица 2. Значения F-критерия и коэффициента R Table 2. Values of F-criterion and coefficient R

Включаемая переменная Included variable 94 93/94 94/93 95/9493

Регрессионная модель на предыдущем шаге Regression model at the previous step A=D A=f(q4) A= /3( 93) A=f2(94,93)

Регрессионная модель на данном шаге Regression model at this step A=f (94) A=f,( 94,93) A=f( 94,93) A= /4( 94,93,95)

Общий F-критерий General F-criterion 365,3 400,6 400,6 408,3

Частный F-критерий Private F-criterion 365,3 276,7 1075 2,95

Коэф. детерминации Coeffic. of determination 0,8199 0,8722 0,8722 0,8742

Коэффициент вариации Coefficient of variation 8,83 5,05 5,05 3,5

Построение регрессионной модели £>=/2^3д4) осуществляется следующим образом.

1. Методом наименьших квадратов определяются оценки стандартизованных коэффициентов выбранной регрессионной модели се1=0,8924 и а2=0,453, которые являются решением следующей системы линейных алгебраических уравнений:

Го1 - 0,16а 2 = 0,82, [-0,16^ + а2 = 0,31.

2. Определяются 95% -е доверительные границы для коэффициентов а и а2 (табл. 3) по формулам:

ан =а - /(п - т - 1;0,975)ста,,

а,в = а, + /(п - т - 1;0,975)ста,,

)/^П(Г

где а

— r2

? 4? 3

) = 0,0271.

Таблица 3. Значения коэффициентов регрессии и их доверительных границ

Table 3. alues of the regression coefficients and their confidence bounds

Независ. перемен. Independ. variables Стандартизованные коэффициенты регрессии Standardized regression coefficients Стандaртная ошибка коэффициентов регрессии Standard error of regression coefficients Дов. границы для коэффициентов Confidence bounds for coefficients (a=0,05) Относительная ошибка вычисления Relative error of calculations

верхний upper нижний lower

94 0,6385 0,0553 0,7465 0,5305 17%

93 0,30554 0,553 0,4134 0,1974 35 %

3. Вычисляются оценки натуральных коэффициентов уравнения регрессии по формулам:

¿1 = а^ Ь2 = дЮпа2; Ь0 = П --Ь

дч, дЧз

4. Определяются 95%-е доверительные границы для коэффициентов Ь1 и Ь2 по формулам:

¿1в/н = ¿1 ± /(п - т -1;0,975) ^ дп, Ь 2в/н = Ь 2 ± /(п - т -1;0,975)д— дп.

дЧз

5. Определяется ширина 95%-го доверительного интервала единичного предсказания для регрессионной модели при значениях q4=-4 и д3=-3 по формуле

AD = t(n — m — 1; 0,975) ст.

n +1

:2<т.

Относительная погрешность единичного предсказания по уравнению регрессии для q4=g4 и q3=-3,

определяемая как ^Б100 %, составляет 6,315 %.

Теперь рассмотрим вопросы оценки адекватности и работоспособности построенной модели. Известно [9, 10, 13], что не всякая статистически значимая регрессионная модель обязательно пригодна для прогнозирования или управления. Действительно, если размах отклика )) незначительно превосходит величину случайной ошибки, предсказание не будет иметь никакой ценности, так как, несмотря на значимость, такая модель будет описывать только ошибки. Поэтому, для того чтобы модель можно было считать удовлетворительной для целей предсказания, расчетное значение общего ^-критерия должно не просто превышать выбранную процентную точку, а превосходить ее примерно в четыре раза [9].

В соответствии с вышесказанным полученная регрессионная модель адекватна, поскольку расчетное значение общего ^-критерия в 200 раз превосходит процентную точку ^0 95( 2;177)=2,95, 1. обладает достаточно хорошей прогнозирующей способностью (Я2=0,8834) и вполне пригодна для предсказания величины дохода ) по заданным значениям интервальных выходных характеристик системы измельчения. 6. Составляется таблица дисперсионного анализа (табл. 4) регрессионной модели.

Таблица 4. Показатели дисперсионного î Table 4. Indicators of variance analysis

Источник рассеяния Source of scattering "епень свободы gree of freedom /мма квадратов >um of squares эедний квадрат Mean square Значение F-критерия The value of F-criterion

u Q и и

Общий Total 179 1 - -

Обусловленный регрессией Due to regression D=f(q4,q3) 3 0,8722 0,291 400,6

Обусловленный q4 Due to variable q4 1 0,6724 0,6724 365,3

Обусловленный q3/q4 Due to variable q3/q4 1 0,1998 0,1998 276,7

Обусловленный q4/q3 Due to variable q4/q3 1 0,776 0,776 1045

Обусловленный q5/q4q3 Due to variable q5/q4q3 1 0,021 0,0021 2,95

Остаток Residue 176 0,1278 0,00073 -

Определив по данным калькуляции себестоимости медного и молибденового концентратов значения С и Ь указанным ранее образом и подставив их в (5), получим технико-экономическую регрессионную модель для прогнозирования прибыли.

В нормированном масштабе эта модель имеет следующий вид:

Р = д1 (0,039д2 - 0,433) +113,7д3 -170499. (7)

Построенная регрессионная модель компактна и с точки зрения компромисса между адекватностью и сложностью обладает структурой оптимальной сложности, что позволяет использовать ее как для целей прогнозирования, так и для управления.

Применение МГУА

Теперь для разработки технико-экономической модели будем использовать описанный ранее многорядный полиномиальный алгоритм МГУА.

При построении модели имеем следующие исходные данные:

) - отклик, выходная переменная; ?1, ?2, ?3 - входные переменные; число наблюдений - 180; объем обучающей выборки - 108; объем проверочной выборки - 72. Выбирается общий вид перебираемых моделей (опорных функций) с т независимыми переменными, используя обобщенный полином Колмогорова-Габора второго порядка:

Y = а0 + £ aiqi + ^ ^aijqiqj.

i=i

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-ЕЕ'

] =1 1<]

Используя опорные функции, строятся возможные варианты моделей, включающие попарные комбинации исходных переменных, из которых составляются уравнения решающих функций не выше второго порядка:

У(Ч,, Ч,) = «0 + + + + «4<22 +

У = /М^ Чг) = а01) + а1(1)41 + а21)4г + +а3(1)чч + а(1)ч2 + а(1)ч2 ,

Уг = /г(4р 43) = а02) + а1(г)41 + а2г)Ч3 +

+a(2)qq + a\"'ql + a\"'q\

(Vr,2

,(2)_2

Уз = /ЗОь qs) = ao(3) + ai(3)

+a.

(з)

)4гЧ3 + а43)4гг + а53) 42.

2. Используя обучающую выборку, методом наименьших квадратов для каждой модели определяются коэффициенты а0", а2к), а34), а44), а54), (¿=1,3).

Набор полученных моделей составляет первый ряд селекции. С помощью проверочной выборки определяются коэффициенты детерминации построенных моделей: ¿^=0,738, ¿^=0,403, Ё2Ыз=0,115, по которым оценивается качество мо-де2л3ей. Среди указанных моделей первого ряда селекции выбираются два наилучшие.

3. Отобранные частные модели формируют множество новых переменных у и у2, которые являются исходными переменными для единственной модели второго ряда селекции:

о = ф( Уl, Уг) = а* + а1*У1 + а**У 2 + а*У1 У 2 + а*У2 + а5*Уг2-Коэффициенты новой модели находятся методом наименьших квадратов, используя обучаю-

q + a2

(з) 2

(з)

qs +

щую последовательность. Качество полученной модели оценивается коэффициентом детерминации, вычис ленным с использованием проверочной выборки (Я2=0,9285).

4. Делая последовательную замену переменных, получается модель с исходными переменными, которая описывает статистическую зависимость дохода от выходных интервальных характеристик ТСИР:

П = а0 + ач + а2ч2 + а3ч3 + а4чч2 + а5чч3 + а6ч2чъ + +апч1 + а%ч 2 + а9ч1 + а^ччч + апч ?ч2 + аХ2ч1чъ +

+а1зЧд1 + а1Ачд1 + а15Ч13 + а1б ч2 + а17 Ч12Ч22 + а18Ч12Чз2 +

+а19?13Ч2 + а20?13Чз + а21?1Чз3 + а22 Ч2 УЗ3 + а23 У4 Чз + +а2,Ч1Ч2Чз2 + а25Ч4 + а2бЧ24 + а27Чз .

Подставляя построенную модель в соотношение (2), получим модель для прибыли, представляющую собой неполный полином четвертого порядка, структура которой намного сложнее по сравнению со структурой регрессионной модели (7).

Очевидно, что с точки зрения компромисса между адекватностью и сложностью построенная методом шаговой регрессии модель (7), безусловно, предпочтительнее модели, полученной с помощью МГУА, которая, обладая достаточно сложной структурой, обеспечивает небольшой прирост (5,1 %) коэффициента детерминации.

Несмотря на несложную структуру, регрессионная модель (7) обладает достаточно хорошей прогнозирующей способностью (Д2=0,8834),что позволяет использовать ее в составе компьютерной модели для оценки и исследования эффективности функционирования ТСИР ЗММК с учетом влияния надежности измельчительного оборудования [6].

Выводы

На основании исследования методов регрессии и МГУА, сравнения полученных результатов проведенных имитационных экспериментов, а также учитывая опыт практического применения указанных методов при построении статистических моделей производственных процессов, в частности процессов переработки полезных ископаемых, можно сделать следующие выводы: 1. Входные и выходные параметры современных автоматизированных технологических процессов изменяются в небольших пределах, при которых вполне достаточно рассмотрение их математических моделей в виде многочлена 0(х,Р) второго порядка. Как показывает практический опыт математического моделирования технологических процессов переработки полезных ископаемых, при указанных условиях более эффективно применение регрессионных методов, используемых во многих современных прикладных программных средствах статистического анализа производ-

ственных процессов (Data Mining, SPSS, Maple, StatGraphics, Statistica, MathCad, Mathlab и т. п.).

2. В результате имитационных экспериментов установлено, что, несмотря на сравнительно невысокое прогнозирующее свойство, регрессионные модели всегда совпадали с заданными функциями G(x,P), независимо от уровня случайного возмущения и объёма выборки, а модели, полученные с помощью МГУА, совпадали с заданными функциями лишь при отсутствии или незначительном уровне случайного возмущения и малых выборках. Следовательно, регрессионные модели более адекватно отражают системные закономерности моделируемых процессов, обладают оптимальной структурой с точки зрения компромисса между сложностью и адекватностью и вполне пригодны для перспективного и оперативного управления технологическими процессами.

3. Применение шагового регрессионного метода позволило выбрать наилучший состав входных переменных и рациональную структуру технико-экономической модели, адекватно описывающей статистическую связь между прибылью и выходными интервальными характеристиками технологической системы измельчения руды, что свидетельствует об эффективности применения методов регрессии при построении статистических моделей технологических процессов переработки полезных ископаемых.

4. МГУА целесообразно использовать в таких случаях, когда невозможно использовать методы регрессионного анализа (при малочисленных выборках, соизмеримых с числом входных переменных, нарушении условия нормальности распределения выборки и т. п.).

5. Сравнительно высокое прогнозирующее свойство моделей, построенных с помощью МГУА, обеспечивается как выбором оптимальной структуры модели, так и за счет описания случайной ошибки. Последнее обстоятельство является основной причиной несовпадения этих моделей с постулированными функциями G(x,P) в имитационных экспериментах.

6. Иерархические многоуровневые модели, построенные с помощью МГУА настолько громоздки и сложны, что, несмотря на их хорошее прогнозирующее свойство, практически малопригодны для использования с целью оперативного управления современными технологическими процессами. Чрезмерная сложность этих моделей, включающих переменные высокого порядка (до 14-20), исключают возможность их исследования аналитическими методами, а применение численных методов оптимизации требует чрезмерно большого времени компьютерной реализации.

СПИСОК ЛИТЕРАТУРЫ

1. King R.P. Modeling and Simulation of Mineral Processing Systems. 2nd ed. - Boston: Butterworth-Heinemann, 2015. - 416 p.

2. JovanoviC I., MiljanoviC I., JovanoviC T. Soft computing-based modeling of flotation processes (review) // Minerals Engineering. - 2015. - V. 84. - P. 34-63.

3. Integrated Optimization for the Automation Systems of Mineral Processing / T. Chai, J. Ding, G. Yu, H. Wang // IEEE Transactions on Automation Science and Engineering.-2014. - V. 11. Iss. 4. - P. 965-982.

4. Пасечник И.А., Шек В.М. Анализ методов моделирования процессов обрушения горных пород при подземной добыче полезных ископаемых // Горный информационно-аналитический бюллетень. - 2010. - № 6. - С. 194-198.

5. Разработка и применение АСУ процессами обогащения полезных ископаемых / В.В. Морозов, В.П. Топчаев, К.Я. Улитен-ко, З. Ганбаатар, Л. Дэлгэрбат. - М.: Изд. дом «Руда и Металлы», 2013. - 512 с.

6. Баласанян С.Ш. Стратифицированное моделирование сложных технологических систем.- Саарбрукен, Германия: LAP Lambert Academic Publishing, 2016. - 385 с.

7. Авдохин В.М. Основы обогащения полезных ископаемых. Т. 1. Обогатительные процессы. - М.: Изд-во «Горная книга», 2014.- 417 с.

8. Weisberg S. Applied Linear Regression. 4th ed. - Hoboken, NJ: Wiley, 2014. -368 p.

9. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. - М.: Изд. дом «Вильямс», 2007. - 912 с.

10. Seber G.A.F., Lee A.J. Linear Regression Analysis. 2nd ed. - Ho-boken, NJ: Wiley, 2003. - 582 p.

11. Hoffmann Jh.P., Shafer K. Linear Regression Analysis. Assumptions and Applications. - Washington: NASW Press, 2015. -240 p.

12. Bingham N.H., Fry J.M. Regression. - London: Springer, 2010.- 284 p.

13. Montgomery D.C., Peck E.A., Vining G.G. Introduction to Linear Regression Analysis. Fifth ed. - New York: Wiley, 2013. - 836 p.

14. Ivakhnenko A.G. Heuristic self-organization on problems of engineering cybernetics // Automatic. -1970. - V. 6 (3). -P. 207-219.

15. Godfrey Onwubolu. GMDH and Implementation in C-Methodolo-gy. - London: Imperial College Press, 2015. - 303 p.

16. Atashrouz S., Pazuki G., Alimoradi Y. Estimation of the viscosity of nine nanofluids using a hybrid GMDH-type neural network system // Fluid Phase Equilibria. - 2014. -V. 372. - P. 43-48.

17. Ahmadi M.H., Ahmadi M.A., Rosen M.A. Using GMDH Neural Networks to Model the Power and Torque of a Stirling Engine // Sustainability. - 2015. - V. 7 (2). - P. 2243-2255.

18. Mueller J-A., Lemke F. Self-Organizing Data Mining. - Hamburg: Libri, 2000. - 225 p.

19. Ivakhnenko A.G., Ivakhnenko G.A., Mueller J.A. Self-Organization of Neuronets with Active Neurons // Pattern Recogn. and Image Analysis. - 1994. - V. 4. - № 4. - Р. 177-188.

20. Ивахненко А.Г., Савченко Е.А. Исследование эффективности метода доопределения выбора модели в задачах моделированием с применением МГУА // Проблемы управления и информатики. - 2008. - № 2. - C. 65-76.

21. Сарычев А.П. Системный критерий регулярности в методе группового учета аргументов // Проблемы управления и информатики. - 2006. - № 6. - С. 25-37.

22. Степашко В.С., Булгакова А.С. Обобщенный итерационный алгоритм метода группового учета аргументов // Управляющие системы и машины. - 2013. - № 2. - С. 9-26.

23. Goharriz M., Marandi S.M. An Optimized Neuro-Fuzzy GMDH System Based on Gravitational Search Algorithm for Evaluation of Lateral Ground // Int. J. Optim. Civil Eng. - 2016. -V. 6 (3). - P. 385-403.

24. Ермаков С.М. Метод Монте-Карло в вычислительной математике. Вводный курс. - СПб.: Невский диалект, 2009. - 192 с.

25. Balasanyan S.Sh., Gevorgyan H.M. The Construction of Statistical Model of a Virtual Object in the LabVIEW Environment // Proc. of 11th International Conference on Remote Engineering and Virtual Instrumentation REV2014. - Porto, 26-28 Feb., 2014. - P. 291-293.

26. Кузнецова О.С. Теория вероятности и математическая статистика. Краткий курс. - М.: Изд-во «Окей-книга», 2013. -191 с.

27. Баласанян С.Ш. Метод стратифицированной формализации сложных технологических систем со многими состояниями // Известия Томского политехнического университета. Инжиниринг георесурсов. - 2016. - Т. 327. - № 1. - С. 6-18.

Поступила 15.01.2016 г.

Информация об авторах

Баласанян С.Ш., доктор технических наук, доцент, заместитель директора по научной работе Капанского филиала Национального политехнического университета Армении.

Геворгян Э.М., преподаватель кафедры «Информационные технологии, информатика и автоматизированные системы» Капанского филиала Национального политехнического университета Армении.

UDC 681.51:622.73

COMPARATIVE ANALYSIS OF THE REGRESSION METHODS AND DATA GROUP ACCOUNTING METHOD IN MODELING MINERAL PROCESSING

Seyran Sh. Balasanyan1,

seyran@sunicom.net

Hermine M. Gevorgyan1,

E-mail: hermine79@rambler.ru

1 Kapan branch of National Polytechnic University of Armenia, 28, Baghaberd Street, Kapan, 3307, Armenia.

The relevance of the discussed issue is caused by the need to conduct a comparative analysis of regression methods and the data group accounting method in order to evaluate the effectiveness of their use in modeling mineral processing.

The main aim of the study is to assess the effectiveness of application of the regression methods and the data group accounting method in constructing statistical models of minerals processing based on the results of theoretical studies, computer simulation experiments and practical application of these methods.

The methods used in the study: methods of mathematical statistics, simulation method, method of inductive modeling. The results. The authors have carried out the comparative analysis of regression methods and the data group accounting method by theoretical investigations, computer simulations and practical applications at the construction of model describing the statistical dependence of profit on the output interval characteristics of the ore grinding technological system of Zangezur Copper and Molybdenum Combine. As a result of the logical analysis of the above mentioned methods the authors concluded that a relatively high predictive property of the models constructed by the data group accounting method is ensured both by the selection of the optimal model structure, and by description of the random error. Using the computer simulation experiments the authors investigated the influence of sample size, level of statistical noise on the predictive ability of the models built using both methods. It was ascertained that a relatively high predictive ability of models constructed by the data accounting group method occurs especially at moderate statistical noise and small samples, comparable to the number of input variables. The possibilities of these methods were studied as well in terms of identifying physical and systemic regularities of various objects with the specified postulated functions. The effectiveness of the practical application of the considered methods is evaluated by the results of construction of techno-economic model of ore grinding technological system. The application of a stepwise regression method allowed constructing the best possible model in terms of a compromise between adequacy and complexity. This indicates the feasibility of applying the regression methods at constructing the statistical models of minerals processing.

Key words:

Regression model, simulation experiment, selection, multi-row polynomial algorithm, minerals, ore grinding.

REFERENCES

1. King R.P. Modeling and Simulation of Mineral Processing Systems. Boston, Butterworth-Heinemann, 2014. 404 p.

2. Jovanovich I., Miljanovich I., Jovanovich T. Soft computing-based modeling of flotation processes (review). Minerals Engineering, 2015, vol. 84, pp. 34-63.

3. Chai T., Ding J., Yu G., Wang H. Integrated Optimization for the Automation Systems of Mineral Processing. IEEE Transactions on Automation Science and Engineering, 2014, vol. 11, Iss. 4, pp. 965-982.

4. Pasechnik I.A., Shek V.M. Analysis methods for modeling the processes of rocks destruction in underground mining. Mining informational and analytical bulletin, 2010, no. 6, pp. 194-198. In Rus.

5. Morozov V.V., Topchaev V.P., Ulitenko K.Ya., Ganbaatar Z., Del-gerbat L. Razrabotka i primenenie avtomatizirovannykh sistem upravleniya protsessami obogashcheniya poleznykh iskopaemykh [The development and application of automated control process of mineral processing]. Moscow, Ruda i Metally Publ., 2013. 512 p.

6. Balasanyan S.Sh. Stratifitsirovannoe modelirovanie slozhnykh tekhnologicheskikh sistem [Stratified modeling of complex technological systems]. Saarbruken, Germany, LAP Lambert Academic Publishing, 2016. 385 p.

7. Avdokhin V.M. Osnovy obogashcheniya poleznykh iskopaemykh. T. 1. Obogatitelnye protsessy [The fundamentals of mineral processing. Vol. 1. Mineral processing]. Moscow, Gornaya kniga Publ., 2014. 417 p.

8. Weisberg S. Applied Linear Regression. 4th ed. Hoboken, NJ: Wiley, 2014. 368 p.

9. Draper N.R., Smith H. Prikladnoy regressionny analiz [Applied regression analysis]. Moscow, Vilyams Publ. house, 2007. 912 p.

10. Seber G.A.F., Lee A.J. Linear Regression Analysis. 2nd ed. Hoboken NJ, Wiley, 2003. 582 p.

11. Hoffmann Jh.P., Shafer K. Linear Regression Analysis. Assumptions and Applications. Washington, NASW Press, 2015. 240 p.

12. Bingham N.H., Fry J.M. Regression. London, Springer, 2010. 284 p.

13. Montgomery D.C., Peck E.A., Vining G.G. Introduction to Linear Regression Analysis. Fifth ed. New York, Wiley, 2013. 836 p.

14. Ivakhnenko A.G. Heuristic self-organization on problems of engineering cybernetics. Automatic, 1970, vol. 6 (3), pp. 207-219.

15. Godfrey Onwubolu. GMDH and Implementation in C-Methodolo-gy. London, Imperial College Press, 2015. 303 p.

16. Atashrouz S., Pazuki G., Alimoradi Y. Estimation of the viscosity of nine nanofluids using a hybrid GMDH-type neural network system. Fluid Phase Equilibria, 2014, vol. 372, pp. 43-48.

17. Ahmadi M.H., Ahmadi M.A., Rosen M.A. Using GMDH Neural Networks to Model the Power and Torque of a Stirling Engine. Su-stainability, 2015, vol. 7 (2), pp. 2243-2255.

18. Mueller J-A., Lemke F. Self-Organizing Data Mining. Hamburg, Libri, 2000. 225 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

19. Ivakhnenko A.G., Ivakhnenko G.A., Mueller J.A. Self-Organization of Neuronets with Active Neurons. Pattern Recogn. and Image Analysis, 1994, vol. 4, no. 4, pp. 177-188.

24. Ermakov S.M. Metod Monte-Karlo v vychislitelnoy matematike [Monte Carlo Method in computational mathematics]. St-Peter-sburg, Nevsky dialekt Publ., 2009. 192 p.

25. Balasanyan S.Sh., Gevorgyan H.M. The Construction of Statistical Model of a Virtual Object in the LabVIEW Environment. Proc. of ll'h International Conference on Remote Engineering and Virtual Instrumentation REV2014. Porto, 26-28 Feb., 2014. pp. 291-293.

26. Kuznetsova O.S. Teoriya veroyatnosti i matematicheskaya stati-stika [Probability theory and mathematical statistics]. Moscow, Okey-kniga Publ., 2013. 191 p.

27. Balasanyan S.Sh. Stratified formalization method of complex multistate systems. Bulletin of the Tomsk Polytechnic University. Geo Assets Engineering, 2016, vol. 327, no. 1, pp. 6-18. In Rus.

Received: 15 January 2016.

pp. 385-403.

Information about the authors

Seyran Sh. Balasanyan, Kapan branch of National Polytechnic University of Armenia. Hermine M. Gevorgyan, Kapan branch of National Polytechnic University of Armenia.

20. Ivakhnenko A.G., Savchenko E.A. Issledovanie effektivnosti metoda doopredeleniya vybora modeli v zadachakh modelirovaniem s primeneniem MGUA [Studying the effectiveness of the method of regularization of a model selection in modeling problems using GMDH]. Problems of control and Informatics, 2008, no. 2, pp. 65-76.

21. Sarychev A.P. Sistemny kriteriy regulyarnosti v metode gruppo-vogo ucheta argumentov [Regularity system criterion in the data group accounting method]. Problems of control and Informatics, 2006, no. 6, pp. 25-37.

22. Stepashko V.S., Bulgakova A.S. Obobshchenny iteratsionny algo-ritm metoda gruppovogo ucheta argumentov [Generalized iterative algorithm of the data group accounting method]. Control systems and machines, 2013, no. 2, pp. 9-26.

23. Goharriz M., Marandi S.M. An Optimized Neuro-Fuzzy GMDH System Based on Gravitational Search Algorithm for Evaluation of Lateral Ground. Int. J. Optim. Civil Eng., 2016, vol. 6 (3),

i Надоели баннеры? Вы всегда можете отключить рекламу.