Научная статья на тему 'ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРОСТОЙ ВЛОЖЕННОЙ КУСОЧНО-ЛИНЕЙНОЙ РЕГРЕССИИ С ЛИНЕЙНОЙ СОСТАВЛЯЮЩЕЙ'

ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРОСТОЙ ВЛОЖЕННОЙ КУСОЧНО-ЛИНЕЙНОЙ РЕГРЕССИИ С ЛИНЕЙНОЙ СОСТАВЛЯЮЩЕЙ Текст научной статьи по специальности «Математика»

CC BY
2
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТАЯ ВЛОЖЕННАЯ КУСОЧНО-ЛИНЕЙНАЯ РЕГРЕССИЯ С ЛИНЕЙНОЙ СОСТАВЛЯЮЩЕЙ / МЕТОД НАИМЕНЬШИХ МОДУЛЕЙ / ФУНКЦИЯ ПОТЕРЬ / ЗАДАЧА ЛИНЕЙНОГО-БУЛЕВОГО ПРОГРАММИРОВАНИЯ / ПОДВЫБОРКА / IMPLE NESTED PIECEWISE LINEAR REGRESSION WITH A LINEAR COMPONENT / LEAST ABSOLUTE DEVIATION METHOD / LOSS FUNCTION / LINEAR-BOOLEAN PROGRAMMING PROBLEM / SUBSAMPLING

Аннотация научной статьи по математике, автор научной работы — Носков Сергей Иванович

Предмет исследования: задача оценивания параметров простой вложенной кусочно-линейной регрессии с линейной составляющей. Цель исследования: применить эффективный аппарат линейно-булевого программирования для решения этой задачи. Методы и объекты исследования: объектом исследования является минимизация ошибок аппроксимации простой вложенной кусочно-линейной регрессии с линейной составляющей, методами линейный регрессионный анализ и аппарат математического программирования. Основные результаты исследования: описан подход к определению оценок параметров простой вложенной кусочно-линейной регрессии с линейной составляющей посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-булевого программирования. Решен численный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ESTIMATING THE PARAMETERS OF SIMPLE NESTED PIECELE-LINEAR REGRESSION WITH A LINEAR COMPONENT

Subject of research: the problem of estimating the parameters of a simple nested piecewise linear regression with a linear component. Purpose of research: to apply an effective linear-Boolean programming apparatus to solve this problem. Methods and objects of research: the object of research is the minimization of approximation errors of simple nested piecewise linear regression with a linear component, methods linear regression analysis and mathematical programming apparatus. Main results of research: an approach to determining parameter estimates for simple nested piecewise linear regression with a linear component is described using the least modulus method, which allows us to reduce this problem to a linear-Boolean programming problem. A numerical example has been solved.

Текст научной работы на тему «ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРОСТОЙ ВЛОЖЕННОЙ КУСОЧНО-ЛИНЕЙНОЙ РЕГРЕССИИ С ЛИНЕЙНОЙ СОСТАВЛЯЮЩЕЙ»

0 математическое моделирование i и информационные технологии

УДК 519.6

DOI 10.18822/byusu20240119-21

оценивание параметров простой вложенной кусочно-линейной регрессии с линейной составляющей

Носков Сергей Иванович

доктор технических наук, профессор,

Иркутский государственный

университет путей сообщения,

Иркутск, Россия

Предмет исследования: задача оценивания параметров простой вложенной кусочно-линейной регрессии с линейной составляющей.

Цель исследования: применить эффективный аппарат линейно-булевого программирования для решения этой задачи.

Методы и объекты исследования: объектом исследования является минимизация ошибок аппроксимации простой вложенной кусочно-линейной регрессии с линейной составляющей, методами - линейный регрессионный анализ и аппарат математического программирования.

Основные результаты исследования: описан подход к определению оценок параметров простой вложенной кусочно-линейной регрессии с линейной составляющей посредством применения метода наименьших модулей, что позволяет свести эту задачу к задаче линейно-буле-вого программирования. Решен численный пример.

Ключевые слова: простая вложенная кусочно-линейная регрессия с линейной составляющей, метод наименьших модулей, функция потерь, задача линейно-го-булевого программирования, подвыборка.

estimating the parameters of simple nested piecele-linear regression with a linear component

Sergey I. Noskov

Doctor of Technical Sciences, Professor,

Irkutsk State Transport University,

Irkutsk, Russia

Subject of research: the problem of estimating the parameters of a simple nested piecewise linear regression with a linear component.

Purpose of research: to apply an effective linear-Boolean programming apparatus to solve this problem.

Methods and objects of research: the object of research is the minimization of approximation errors of simple nested piecewise linear regression with a linear component, methods - linear regression analysis and mathematical programming apparatus.

Main results of research: an approach to determining parameter estimates for simple nested piecewise linear regression with a linear component is described using the least modulus method, which allows us to reduce this problem to a linear-Boolean programming problem. A numerical example has been solved.

Keywords: simple nested piecewise linear regression with a linear component, least absolute deviation method, loss function, linear-Boolean programming problem, subsampling.

ВВЕДЕНИЕ

При построении регрессионной модели исследуемого объекта характер его функционирования может вызвать необходимость в использовании не какой-либо одной модельной конструкции, а некоей составной, комбинированной ее формы. Так, в работе [1] разработана многовариантная регрессионная модель прогнозирования профиля водной поверхности для различных сложных русел с непризматической поймой. Модели нелинейной регрессии разработаны с использованием соответствующих экспериментальных данных, полученных в ходе лабораторных экспериментов. Было проведено три серии экспериментов для выявления берегового стока в сходящихся поймах. В [2] разнородные регрессионные модели используются для изучения связи между индексом абразивности в горнодобывающей промышленности и гражданском строительстве и химическими соединениями и петрографическими свойствами андезитовых пород центральной части Эквадора. Статья [3] посвящена исследованию общей модели непараметрической регрессии, называемой также составной моделью. В качестве особых случаев она включает в

себя разреженную аддитивную регрессию и непараметрическую (или линейную) регрессию со многими ковариатами, но, возможно, с небольшим количеством соответствующих ковариат. Составная модель характеризуется тремя основными параметрами: параметром структуры, описывающим «макроскопическую» форму составной функции, параметром «микроскопической» разреженности, указывающим максимальное количество соответствующих ковариат в каждом компоненте, и обычным параметром гладкости, соответствующим сложности сочленения. При этом определяется неасимптотическая минимаксная скорость сходимости оценок в такой модели, как функция этих трех параметров. Показано, что эта скорость может быть достигнута адаптивным путем. В работе [4] предлагается иерархическая, или многоуровневая, версия регрессионных моделей со структур и рован-ным аддитивным предиктором, в которой коэффициенты регрессии конкретной нелинейной составляющей могут зависеть от другой модели регрессии со структурированным аддитивным предиктором. В этом смысле модель состоит из иерархии сложных структурированных моделей аддитивной регрессии. Предложенную модель можно рассматривать

ВЕСТНИК ЮГОРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА У V 19 Том 20, выпуск 1 (2024) > г

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ESTIMATING THE PARAMETERS OF SIMPLE NESTED PIECELE-LINEAR REGRESSION WITH A LINEAR COMPONENT

Sergey I. Noskov

как расширенную версию многоуровневой модели с нелинейными ковариатными членами на каждом уровне иерархии. Структура модели также является основой для обобщенного моделирования случайных наклонов, основанного на мультипликативных случайных эффектах. Вывод является полностью байесовским и основан на методах моделирования цепей Маркова. Дается подробное описание нескольких высокоэффективных схем формирования выборки, которые позволяют оценить сложные модели с несколькими уровнями иерархии и большим количеством наблюдений за малое время. В [5] предлагается новая модель нейронной сети ансамблевой свертки на основе регрессии для определения чувствительности лекарств на основе множественных фармацевтических данных и устранения гетерогенности при выборе характеристик для субфармакогеномных параметров. Сеть свертки ансамбля описывает значимость метрик, связанных с т. н. соседскими зависимостями, связанными с отношениями лекарственной терапии. В работе [6] рассматривается новая модель квантильной регрессии, объединяющая несколько наборов несмещенных уравнений. Этот подход может учитывать корреляции между повторными измерениями и давать более эффективные оценки. Поскольку целевая функция является дискретной и невыпуклой, предлагается индуцированное сглаживание для быстрого и точного вычисления оценок параметров, а также их асимптотической ковариации, используя метод Ньютона-Рафсона.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ

В работе [7] введены вложенные кусочно-линейные регрессионные модели двух типов:

ук=тт{тт.11{а1.хк},..., тт.^р{а°хк},

тах^/р/ хк},...,тах.^{вН х^+г^Т^

и

ук=тах{тт.11{а1.хк},..., тгх.е1о{а°хк},

тах^1{в/ хк},...,тах^{вн хк}}+£к,к=1^.

Здесь у - зависимая, а х. — г'-ая независимая переменные, к - номер наблюдения, п - длина выборки, индексные множества 1',1=1,0,31,1=1,И являются подмножествами исходного множества номеров независимых переменных {1,2,..,т} и могут иметь непустые попарные пересечения, ар/ - подлежащие оценке параметры.

В работе [8] решена задача идентификации с помощью метода наименьших модулей (МНМ) параметров простой формы вложенной кусочно-линейной модели:

yk=mix{min.El{a.xJ,maxiEj{ß.xj}+£k,\k=1,n. (1)

Эта задача сводится к следующей задаче линейно-булевого программирования (ЛБП): hk<at xki, k = m, tel, (2)

a, xki - h<(1 - su )M, k = ТП, tel, (3)

= 1,k = Tï. (4)

xki, k = Tn, teJ, (5)

ßt xki - gt>(pki -1)M, k = Tn, teJ, (6)

ZjPki = h k = ТП, (7)

tk<hk, k = Tn, (8)

^ k = ^ (9)

hk - tk+Mrk<M, k = Tn, (10)

gk- tk - Mrk<0, k = ТП, (11)

tk+uk- vk = y^ k = ^ (12)

uk> 0,vk> 0,hk> 0,gk> 0,tk> 0, k = ТП, (13)

skie{0,1}, k = ТП, tel, (14)

pkie{0,1}, k = т, teJ, (15)

rke{0,1}, k = ЦП, (16)

ZUuk+vk ) ^ mm. (17)

По аналогии с рассмотренной в работе [9] комбинированной кусочно-линейной моделью введем в рассмотрение некоторое расширение модели (1) - простую вложенную кусочно-линейную регрессию с линейной составляющей:

У= ZteD ^Ы + mtx{mtniEI{axki},

maxiJei xJ} + Ч^1".

Поставим задачу оценивания параметров модели (18) также с помощью МНМ, т. е. посредством минимизации функции потерь (суммы модулей ошибок аппроксимации):

Zü=1\tk\ ^ mtn. (19)

Это может быть сделано путем соответствующей корректировки задачи ЛБП (2)-(17). Действительно, изменим ограничения (12) следующим образом:

(18)

^ieDdiXki + h +Uk - Vk = yk>k = 1,n-

(20)

Скорректируем также целевую функцию (17) с тем, чтобы исключить множественность решений задачи (19), воспользовавшись приемом, описанным в [10]:

) + 52,7у, a, - SZjr, ß, ^ min. (21)

Здесь 5 - малая положительная константа, а числа у. отражают масштаб независимых переменных, например, следующим образом:

ВЕСТНИК ЮГОРСКОГО 20 /Ч ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА > ' Том 20, выпуск 1 (2024)

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ОЦЕНИВАНИЕ ПАРАМЕТРОВ ПРОСТОЙ ВЛОЖЕННОЙ КУСОЧНО-ЛИНЕЙНОЙ РЕГРЕССИИ С ЛИНЕЙНОЙ СОСТАВЛЯЮЩЕЙ

Носков С.И.

Y i =

, i = 1, m

maXk=ïn Xki

Таким образом, решение задачи (19) сводится к решению задачи ЛБП (2)-(11), (20), (13)-(16), (21).

Рассмотрим численный пример, скорректировав исходные данные из [9] путем изменения значений зависимой переменной:

Г2 4 3^ Г 2 >

71 9 8

, У =

б 5B 3

v 3 B 4 J v 7 ,

(22)

X =

Поставим задачу оценивания параметров простой вложенной кусочно-линейной регрессии с линейной составляющей:

Уk=do + dl хы + тт{тт.е1{а.

max.jp. хк}} + гк,к=14,

где множества I и / имеют вид:

I = {1,2}, / = {2,3}.

После решения задачи ЛБП (2)-(11), (20), (13)-(16), (21) получим следующие результаты:

ук= -8 + 0.463 + тт{тт{4.53хк1,12.7хк2}, тах{ 2.27хк2,1.42хк3}, к = (9, 12.7, 27, 13.6), Е = (9, 2.3, 11.3, 18), t = (9, 12.7, 11.3, 13.6),

Е Ы=3-12-

к=1

ЗАКЛЮЧЕНИЕ И ВЫВОДЫ

В работе на основе применения полученных ранее результатов автора описан алгоритмический способ идентификации параметров простой вложенной кусочно-линейной регрессии с линейной составляющей методом наименьших модулей, сводящийся к решению задачи линейно-булевого программирования приемлемой при анализе реальных объектов размерности.

СПИСОК ЛИТЕРАТУРЫ

in Ecuador from chemical compounds and petrographical properties using regression analyses // Bulletin of Engineering Geology and the Environment. - 2019. - V. 78. - P. 2331-2344.

3. Dalalyan A., Ingster Y., Tsybakov A.B. Statistical inference in compound functional models // Probability Theory and Related Fields. - 2014. - V. 158. - P. 513-532.

4. Lang S., Umlauf N., Wechselberger P., Harttgen K., Kneib T. Multilevel structured additive regression // Statistics and Computing. - 2014. - V. 24. - P. 223-238.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Gadde S., Charkravarthy A. S. N., Satyanarayana S., Murali M. Automatic identification of drug sensitivity of cancer cell with novel regression-based ensemble convolution neural network model // Soft Computing. - 2022. - V. 26. - P. 5399-5408.

6. Leng C., Zhang W. Smoothing combined estimating equations in quantile regression for longitudinal data // Statistics and Computing. - 2014. - V. 24. - P. 123-136.

7. Носков, С. И. Подход к формализации вложенной кусочно-линейной регрессии / С. И. Носков. - Текст : непосредственный // Международный журнал гуманитарных и естественных наук. - 2023. - № 1-2 (76). - С. 218-220.

8. Носков, С. И. Идентификация параметров простой формы вложенной кусочно-линейной регрессии. - Текст : непосредственный // Ученые записки Комсомольско-го-на-Амуре государственного технического университета. - 2023. - № 3 (67). - С. 57-61.

9. Носков, С. И. Идентификация параметров комбинированной кусочно-линейной регрессионной модели / С. И. Носков. - Текст : непосредственный // Вестник Югорского государственного университета. - 2022. - № 4 (67). - С. 115-119.

10. Носков, С. И. Уточнение способов идентификации параметров некоторых кусочно-линейных регрессий / С. И. Носков, М. С. Жукова, Т. К. Кириллова, Ю. О. Купит-ман, А. А. Хоняков. - Текст : непосредственный // Электронный сетевой политематический журнал «Научные труды КубГТУ». - 2023. - № 2. - С. 75-81.

Naik B., Khatua K. K. Water Surface Profile Computation for Compound Channels with Narrow Flood Plains // Arabian Journal for Science and Engineering. - 2017. - V. 42. - P. 941-955.

Torrijo F. J., Garzón-Roca J., Company J., Cobos J. Estimation of Cerchar abrasivity index of andesitic rocks

1

ВЕСТНИК ЮГОРСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА У V 21 Том 20, выпуск 1 (2024) > г

i Надоели баннеры? Вы всегда можете отключить рекламу.