Научная статья на тему 'МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ ДАННЫХ С ИНТЕРВАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЬЮ'

МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ ДАННЫХ С ИНТЕРВАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЬЮ Текст научной статьи по специальности «Математика»

CC BY
50
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНАЯ РЕГРЕССИЯ / МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ / ИНТЕРВАЛЬНЫЕ ДАННЫЕ / ЗАДАЧИ ЛИНЕЙНОГО И ЛИНЕЙНО-БУЛЕВОГО ПРОГРАММИРОВАНИЯ

Аннотация научной статьи по математике, автор научной работы — Носков Сергей Иванович

В работе описано применение метода смешанного оценивания параметров линейной регрессионной модели для данных с интервальной неопределенностью. Отличительным свойством этого метода является то, что при разбиении исходной выборки данных на две непересекающиеся подвыборки на одной из них он «работает» как метод наименьших модулей, а на другой - как метод антиробастного оценивания. Рассмотрены случаи интервального задания информации либо для зависимой переменной, либо для независимых факторов, либо для всей выборки. Показано, что интервальная модификация метода смешанного оценивания параметров линейной регрессии сводится к задачам линейного или линейно-булевого программирования приемлемой размерности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Носков Сергей Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MIXED ESTIMATION OF LINEAR REGRESSION PARAMETERS FOR DATA WITH INTERVAL UNCERTAINTY

The paper describes the application of the method of mixed estimation of the parameters of a linear regression model for data with interval uncertainty. A distinctive feature of this method is that when the initial data sample is divided into two non-overlapping sub-samples, it “works” on one of them as the method of least modules, and on the other, as an anti-robust estimation method. The cases of interval setting of information either for a dependent variable, or for independent factors, or for the entire sample are considered. It is shown that the interval modification of the method of mixed estimation of linear regression parameters is reduced to linear or linear Boolean programming problems of acceptable dimension.

Текст научной работы на тему «МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ ДАННЫХ С ИНТЕРВАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЬЮ»

Гевало Кирилл Васильевич, инженер, igddvo@yandex.ru, Россия, Хабаровск, Институт горного дела ДВО РАН

INFLUENCE OF BVR PARAMETERS ON THE DETONA TION VELOCITY CHARGE OF EXPLOSIVES A.A. Galimyanov, D.E. Gerasimov, V.I. Mishnev, E.N. Kazarina, A.A. Galimyanov, K.V. Gevalo

During the production of explosive works, it is important not only to control the input of explosive materials when they arrive at the enterprise from the supplier, but also to measure the detonation rate of the charge in the field. The detonation rate of the explosive charge, as one of its most important characteristics affecting the quality of the explosion, depends on many factors, the main of which are: the quality ofpreparation of explosives and their components, the density, diameter and height of the charge column, the parameters of the intermediate detonator and its location along the length of the charge. The correct approach with the use of appropriate preliminary measurements will increase the efficiency and safety of preparing the rock mass for drilling and blasting. The article presents a methodology for measuring the detonation rates of a borehole charge with the corresponding results and conclusions.

Key words: charge detonation velocity measurement, measuring instruments, downhole charge design, time intervals, pulse reflectometry.

Galimyanov Aleksey Almazovich, candidate of technical sciences, leading researcher, head of the sector, azot-1977@mail.ru, Russia, Khabarovsk, Institute of Mining, FEB RAS,

Gerasimov Dmitriy Evgenievich, general director, amur_vzriv_prom@mail. ru, Russia, Khabarovsk, JSC «Amurvzryvprom»,

Mishnev Vladimir Igorevich, engineer, vovchenskiycf@smail.com, Russia, Khabarovsk, Institute of Mining, KHFIC FEB RAS,

Kazarina Elizaveta Nikolaevna, engineer, kazarinaen@mail.ru, Russia, Khabarovsk, Institute of Mining, FEB RAS,

Galimyanov Andrey Almazovich, lead engineer, stanxi@mail.ru, Russia, Khabarovsk, Institute of Mining, FEB RAS,

Gevalo Kirill Vasilevich, engineer, igddvo@yandex.ru, Russia, Khabarovsk, Institute of Mining,

FEB RAS

УДК 330.4

DOI: 10.24412/2071-6168-2022-9-274-277

МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ ДЛЯ ДАННЫХ С ИНТЕРВАЛЬНОЙ НЕОПРЕДЕЛЕННОСТЬЮ

С.И. Носков

В работе описано применение метода смешанного оценивания параметров линейной регрессионной модели для данных с интервальной неопределенностью. Отличительным свойством этого метода является то, что при разбиении исходной выборки данных на две непересекающиеся подвыборки на одной из них он «работает» как метод наименьших модулей, а на другой - как метод антиробастного оценивания. Рассмотрены случаи интервального задания информации либо для зависимой переменной, либо для независимых факторов, либо для всей выборки. Показано, что интервальная модификация метода смешанного оценивания параметров линейной регрессии сводится к задачам линейного или линей-но-булевого программирования приемлемой размерности.

Ключевые слова: линейная регрессия, метод смешанного оценивания параметров, интервальные данные, задачи линейного и линейно-булевого программирования.

Нередко при построении математических моделей регрессионного типа различных объектов исследователям приходится сталкиваться с различного рода неопределенностью в обрабатываемой информации. Так, в работе [1] регрессионный анализ для подобной ситуации применяется при прогнозировании функции плотности вероятности ветра и солнечной энергии. В статье [2] отмечается, что в классической статистике наблюдения часто предполагаются как однозначные данные. Недавние научные исследования показывают, что этого предположения недостаточно, поскольку данные все чаще

274

приобретают новые форматы. Конкретный тип данных, который часто используется, — это данные с интервальными значениями. Первоначально этот конкретный тип данных использовался для устранения неточностей в информации, возникающих из-за пределов измерения и ошибок вычислений. Поскольку данные генерируются с некоторой степенью неопределенности, их лучше представлять интервалами, чем отдельными числами. Поэтому в последние годы стали использоваться так называемые интервальные переменные. Отношения между этими переменными недавно были смоделированы с помощью моделей линейной регрессии. Если интервальные переменные ошибок имеют какие-либо статистические распределения, отношения моделируются в рамках линейных моделей. Предлагается новая оценка коэффициента одной из ковариат в интервальной линейной модели с разными коэффициентами в целом. Исследуются некоторые оптимальные свойства оценки при определенных условиях. В [3] представлен метод интервального регрессионного анализа для моделирования данных о качестве точечной сварки с неопределенным сопротивлением (СНС). Целью этого подхода является поддержка принятия решений с использованием данных о качестве СНС (например, определение условий сварки для комбинации материалов). При этом данные включают различные условия сварки, которые представляет собой характеристики материала и параметры процесса сварки, связанные с ее неопределенным качеством. В работе [4] представлен новый надежный метод построения регрессии для переменных с интервальными значениями, который «штрафует» наличие выбросов в средних точках и/или диапазонах наблюдений с интервальными значениями за счет использования функций ядра экспоненциального типа. Таким образом, вес, присвоенный средней точке и диапазону каждого интервального наблюдения, обновляется на каждой итерации, чтобы оптимизировать подходящую целевую функцию. Сходимость алгоритма оценки параметров гарантируется низкими вычислительными затратами. Также производится сравнительное исследование между предложенным методом и некоторыми другими подходами к построению надежной регрессии для переменных с интервальным значением. Эффективность этих методов оценивается на основе систематической и среднеквадратичной ошибок оценок параметров для средних точек и диапазонов интервалов с учетом наборов синтетических данных. Результаты показывают, что предлагаемый подход обеспечивает конкурентоспособную производительность по сравнению с другими подходами в сценариях обработки выбросов с интервальными значениями, которые сопоставимы с теми, которые встречаются на практике. Применение к реальным наборам данных с интервальными значениями подтверждает полезность предложенного метода.

Безусловно, неопределенность в исходной информации естественным образом вызывает необходимость модификации методов, применяемых для оценивания параметров регрессионных моделей. В настоящей работе такая модификация предлагается для разработанного ранее автором метода смешанного оценивания (МСО) [5-7].

Метод смешанного оценивания параметров линейной регрессии. Рассмотрим линейное регрессионное уравнение (модель)

Ук = atxki + ек, кеР = {1,2.....п], (1)

где у - зависимая, а xt - i-ая независимая переменные; аг - i-ый оцениваемый параметр; ек - ошибки аппроксимации; k - номер наблюдения; n - их количество (длина выборки).

Представим зависимость (1) в векторной форме:

у = Ха+ £, (2)

где у= (у1 ,-,уп)Т, а = (а1,...,ат)т, £= (е1,.,£п)т, X - (nxm)- матрица с компонентами xki.

Пару (Х,у), следуя канонам регрессионного анализа, будем называть выборкой данных (см., например, [8-10]).

Пусть, исходя из некоторых установленных содержательных соображений, выборка данных в простейшем частном случае может быть разбита на две непересекающихся подвыборки с номерами наблюдений Р1 и Р2:

P1 UP2=P, Р1пР2 = 0.

При этом минимизация ошибок аппроксимации на первой из них производится в соответствии с методом наименьших модулей (МНМ):

/1(«)= Ikep^k1 ^т!^ а на второй - с методом антиробастного оценивания (МАО):

]2(а)= max min.

кер2

В совмещении этих двух задач и состоит идея метода смешанного оценивания, реализация которого приводит к необходимости решения следующей задачи линейного программирования (ЛП):

Е™ 1 UiXki + Uk-vk=yk, кеР, (3)

uk+vk-r<0, keP2, (4)

ик >0,vk >0, кеР, (5)

Y,kePl (Цк +vk)/s +r + h ZkeP2(uk +vk)^min, (6)

где s - число элементов в множестве Ръ И - заранее заданное малое положительное число.

Таким образом, на подвыборке с номерами из Р1 МСО «работает» как МНМ, а на подвыборке с номерами из Р2 - как МАО.

Модификация МСО для интервальной выборки. Как уже отмечалось выше, часто при моделировании сложных систем обрабатываемые данные могут обладать интервальной неопределенностью. Способы построения регрессионных моделей в этом случае с функцией потерь /1(а) подробно рассмотрены в работах [11-13].

Рассмотрим модификацию точечной формы МСО при возможных случаях задания такой неопределенности и описанном выше способе разбиения исходной выборки на подвыборки.

а) Имеет место интервальная неопределенность только для зависимой переменной, т.е. выборка имеет вид (Х, [у",у+]), где у~ и у+ - вектора нижних и верхних границ значений у. При этом любые соображения, уточняющие расположение этих значений внутри или на указанных границах, отсутствуют. В этом случае применение МСО приводит к необходимости решения следующей задачи ЛП:

Ха + u > у", (7)

Ха- v < у+, (8)

uk+vk-r<0, keP2, (9)

u>0,v>0, (10)

T,k6Pl (uk +Vk)/s +r + hYlkep2(uk + vk)^min. (11)

б) Имеет место интервальная неопределенность только для независимых переменных, т.е. выборка имеет вид ([Х",Х+], у). В этом случае реализация МСО состоит в решении следующей задачи ли-нейно-булевого программирования (ЛБП):

Х~в -Х+у - u < у, (12)

Х+в ~Х~у + v > у, (13)

0<ft <<г^, (14)

0<п<(1-<тдВ, (15)

o-j6{0,1}, i = 1,m, (16)

«= в - Y, (17)

uk+vk-r <0, keP2, (18)

u>0,v>0, (19)

ZkepMk + Vk)/s +r + h ZkeP2(uk +Vk)^min. (20)

Здесь В - заранее заданное большое положительное число.

в) Имеет место интервальная неопределенность как для независимых, так и для зависимой переменных, т.е. выборка имеет вид ([Х",Х+], [у",у+]). В этом случае применение МСО приводит к необходимости решения следующей задачи ЛБП:

Х~в -Х+у - u < у+, (21)

Х+в -Х~у + v > у~, (22)

0<f>i<OiB, (23)

0<Yi <(1 - ajW, (24)

aiE{0,1}, i = 1,m, (25)

«= в - Y, (26)

uk+vk-r <0, keP2, (27)

u>0,v>0, (28)

ZkerM* +vk)/s +r + hYlkep2(uk + vk)^min. (29)

Таким образом, применение МСО для информации с интервальной неопределенностью сводится к решению задачи ЛП (7) - (11), или задач ЛБП (12) - (20), или (21) - (29).

Заключение. В работе описано применение метода смешанного оценивания параметров линейной регрессионной модели для данных с интервальной неопределенностью. Рассмотрены случаи интервального задания информации либо для зависимой переменной, либо для независимых факторов, либо для всей выборки. Показано, что интервальная модификация МСО сводится к задачам линейного или линейно-булевого программирования.

Список литературы

1. He Y., Yan Y., Xu Q. Wind and solar power probability density prediction via fuzzy information granulation and support vector quantile regression // International Journal of Electrical Power and Energy Systems. 2019. 113. Р. 515-527.

2. Malekfar A.M., Eskandari F. Assessment and Estimation of a Covariate's Coefficient in a Particular Interval Model // Iranian Journal of Science and Technology, Transaction A: Science. 2019. 43(5). Р. 22852298.

3. Park J., Kim K.-Y. Evaluation of interval regression analysis for uncertain resistance spot welding quality data // International Journal of Computer Integrated Manufacturing. 2018. 31(8). Р. 760-768.

4. Lima Neto E.D., de Carvalho F.D. An exponential-type kernel robust regression model for interval-valued variables // Information Sciences. 2018. 454-455. Р. 419-442.

5. Носков С.И. О методе смешанного оценивания параметров линейной регрессии // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. № 1. С. 41-45.

6. Носков С.И. Метод смешанного оценивания параметров линейной регрессии: особенности применения // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2021. № 1. С. 126-132.

7. Носков С.И., Перфильева К.С. Эмпирический анализ некоторых свойств метода смешанного оценивания параметров линейного регрессионного уравнения // Наука и бизнес: пути развития. 2020. № 6 (108). С. 62-66.

8. Айвазян С.А., Енюков И.С, Мешалкий Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985. 488 с.

9. Афифи А., Эйзен С. Статистический анализ: поход с использованием ЭВМ. М.: Мир, 1982.

486 с.

10. Винн Р., Холден И. Введение в прикладной эконометрический анализ. М.: Финансы и статистика, 1981. 294с.

11. Носков С.И. Точечная характеризация множеств решений интервальных систем линейных алгебраических уравнений // Информационные технологии и математическое моделирование в управлении сложными системами. 2018. № 1 (1). С. 8 - 13.

12. Носков С.И. Построение экспертно-статистических моделей по неполным данным // T-Comm: Телекоммуникации и транспорт. 2021. Т. 15. № 6. С. 33-39.

13. Lakeyev A.V., Noskov S.I. A description of the set of solutions of a linear equation with interval defined operator and right-hand side // Russian Acad. Sci. Dokl. Math. 1993. Vol. 47. No. 3. P. 518-523.

Носков Сергей Иванович, д-р техн. наук, профессор, sergey. noskov. 5 7@mail. ru, Россия, Иркутск, Иркутский государственный университет путей сообщения

MIXED ESTIMATION OF LINEAR REGRESSION PARAMETERS FOR DATA WITH INTERVAL

UNCERTAINTY

S.I. Noskov

The paper describes the application of the method of mixed estimation of the parameters of a linear regression model for data with interval uncertainty. A distinctive feature of this method is that when the initial data sample is divided into two non-overlapping sub-samples, it "works" on one of them as the method of least modules, and on the other, as an anti-robust estimation method. The cases of interval setting of information either for a dependent variable, or for independent factors, or for the entire sample are considered. It is shown that the interval modification of the method of mixed estimation of linear regression parameters is reduced to linear or linear Boolean programming problems of acceptable dimension.

Key words: linear regression, mixed parameter estimation method, interval data, linear and linear Boolean programming problems.

Noskov Sergey Ivanovich, doctor of technical sciences, professor, sergey.noskov. 57@mail. ru, Russia, Irkutsk, Irkutsk State Railway University

УДК 621.317

DOI: 10.24412/2071-6168-2022-9-277-282

МОДЕЛЬ ПРОДОЛЖИТЕЛЬНОСТИ ЖИЗНЕННОГО ЦИКЛА ТЕХНИЧЕСКИХ СРЕДСТВ

СПЕЦИАЛЬНОГО НАЗНАЧЕНИЯ

А.В. Свидло, И.В. Наседкин, Н.Н. Зайкин, Е.В. Фатьянова, О.В. Чуприков, О.А. Губская

В статье предложен подход к математическому моделированию жизненного цикла технических средств специального назначения, который позволяет определить оптимальные значения параметров этапов жизненного цикла и тем самым повысить качество планирования разработок технических средств специального назначения и как следствие снизить затраты на их изготовление.

Ключевые слова: жизненный цикл, оптимизация, моделирование, технические средства специального назначения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Существующие подходы к решению задачи оптимизации продолжительности жизненного цикла (ЖЦ) технических средств специального назначения (ТС СН) не в полной мере отражают основные особенности разработки, производства и эксплуатации ТС СН, динамику научно-технического прогресса, а также требования к уровню качества образцов ТС СН.

277

i Надоели баннеры? Вы всегда можете отключить рекламу.