УДК 330.4
DOI: 10.24412/2071-6168-2023-3-467-470
НЕКОТОРЫЕ ФОРМЫ ВЛОЖЕННОЙ КУСОЧНО - ЛИНЕЙНОЙ РЕГРЕССИИ
С.И. Носков
В статье вводятся некоторые формы предложенной ранее автором вложенной кусочно-линейной регрессии: простая вложенная кусочно-линейная регрессия первого и второго типов, а также однородная вложенная кусочно-линейная регрессия первого и второго типов. Показано, что обычная кусочно-линейная регрессия и кусочно-линейная функция риска являются частными случаями вложенной кусочно-линейной регрессии. Оценивание параметров предложенных форм вложенной кусочно-линейной регрессии может быть основано на приемах, применяемых при идентификации параметров обычной кусочно-линейной регрессии и функции риска, и сведен, таким образом, к решению специальным образом сформированных задач линейно-булевого программирования.
Ключевые слова: кусочно-линейная регрессия, функция риска, простая и однородная вложенные кусочно-линейные регрессии, задача линейно-булевого программирования.
При построении математических моделей технических, социально- экономических и других систем весьма часто используются кусочно-линейные регрессионные зависимости. Так, в работе [1] кусочно-линейная регрессия применяется при анализе пространственного размещения популяционных группировок. В [2] она используется для прогнозирования глубины заражения территории при чрезвычайной ситуации с выбросом в воздух ядовитого вещества. Этот подход к моделированию эффективен в случае, когда совокупность данных при достижении критического момента меняет форму и динамику изменений. В статье [3] кусочно-линейная регрессионная модель с точкой разрыва применяется при анализе несущей способности колесной пары железнодорожного вагона. В [4] кусочно-линейные модельные формы привлекаются для оценки качества питьевой воды в зависимости от физико-химических показателей источника водоснабжения и управляемых параметров, характеризующих работу системы очистки. При этом установлено, что целесообразно использовать такие модели по выборке объемом 30-50 наблюдений. Эти модели могут быть использованы для своевременного предупреждения аварийной ситуации, когда показатели качества воды выходят за допустимые пределы. Работа [5] посвящена исследованию проблемы перевозки пассажиров железнодорожным транспортом в зависимости от показателей, характеризующих результаты деятельности туристической отрасли. В результате получены кусочно-линейные модели пассажирских перевозок для Российской Федерации в целом и некоторых федеральных округов. В [6] представлена эффективная методика мониторинга и прогнозирования цен на продукты питания, позволяющая в условиях высокой волатильности цен определять наблюдаемые тенденции на рынках сбыта и составлять адекватные прогнозы динамики цен. Представлен ее прогноз, основанный на адаптивном методе рекурсивного прогнозирования с применением кусочно-линейных регрессий и критерия Чоу. В статье [7] исследуется взаимосвязь электропотребления и температуры окружающей среды по статистическим данным 64 российских регионов. Для выделения однородных по климатическим условиям групп регионов используется иерархический и неиерархический кластерный анализ, который позволяет разделить исходную выборку на три температурных кластера. Для каждого из них строится кусочно-линейная регрессия с эндогенной точкой переключения базовой температуры. В каждом кластере явно выражен как эффект охлаждения, так и эффект обогрева, при этом базовый уровень температуры различен. В кластерах с умеренным и жарким климатом преобладает эффект охлаждения, а в кластере с холодным климатом - эффект обогрева. Учет этих эффектов при планировании потребления может привести к повышению точности прогноза, что особенно важно для повседневной деятельности агентов оптового рынка электроэнергетики и функционирования энергетической системы страны в целом.
Конкретизация вложенной кусочно-линейной регрессии. Рассмотрим кусочно-линейную регрессию (модель) вида:
ук = тт{а1хк1,а2хк2,..., атхкт} + £к, к=1,п, __(1)
где у -зависимая переменная, = 1,т— независимые переменные, аг,1 = 1 ,т— подлежащие оцениванию параметры, ек, к = 1,п, - ошибки аппроксимации, п - количество наблюдений (длина выборки). Без потери общности будем предполагать неотрицательность всех переменных модели (1).
Заметим, что при использовании модели (1) для анализа экономических систем (в этом случае она называется производственной функцией Леонтьева, или функцией с постоянными пропорциями, см., например, [8-11]) переменная у обычно представляет собой выпуск продукции, а = 1,т - ресурсные показатели. При этом он всегда ограничен лимитирующим ресурсом, и любое наращивание объемов других ресурсов не приводит к увеличению выпуска.
В работе [12] рассмотрена противоположная по смыслу модели (1) так называемая функция
риска
Ук =тах{[>1хк1,Р2хк2,—, £>тхкт} + £/с. (2)
Здесь все переменные имеют негативный по отношению к исследуемому объекту характер, например, риск, уязвимость, угрозы, потери и т.д.
Известия ТулГУ. Технические науки. 2023. Вып. 3
В работах [13-15] описаны способы идентификации неизвестных параметров регрессий (1) и (2) методом наименьших модулей [16], сводящимся для каждой из этих двух моделей к решению соответствующих задач линейно-булевого программирования.
В работе [17] предложен подход к обобщению кусочно-линейных регрессий (1) и (2) путем введения двух типов вложенных кусочно-линейных регрессий:
- вложенной кусочно-линейной регрессии первого типа
ук =тЫ{тЫШ1{а1хы},...,тЫшс{а'1хк1}, тах1Е]1{р1хк1},...,тах<]Н{р?хк1}} + ек; (3)
- вложенной кусочно-линейной регрессии второго типа
ук = тах{ттШ1{а\хк1},...,тЫшс{а1хы}, тах1е]1 {р1хк1},...,тах1е1н{р?хк1}} + ек, (4)
где индексные множества = 1, С, ]1,1 = 1,Н являются подмножествами множества {1,2,.. ,,т} и могут (но совсем не обязательно должны) иметь непустые всевозможные попарные пересечения.
Замечание. Разумеется, тот факт, что в регрессиях (3) и (4) использованы одинаковые обозначения для индексных множеств, вызван лишь стремлением избежать ненужного нагромождения символов. Очевидно, что эти множества в (3) и (4) в общем случае различны.
Легко видеть, что имеют место следующие очевидные утверждения.
1. При 11= {1}, /2= {2}, ..., 1т= {т}, С = т, ]1 = 0,1 = 1,Н вложенная кусочно-линейная регрессия первого типа (3) совпадает с кусочно-линейной регрессией (1).
2. При ]г= {1}, /2= {2}, ...,/т = {т}, Н = т,11 = 0,1 = 1,в вложенная кусочно-линейная регрессия первого типа (3) также совпадает с кусочно-линейной регрессией (1).
В отношении вложенной кусочно-линейной регрессии второго типа (4) очевидны аналогичные утверждения.
3. При 11= {1}, /2= {2}, ..., 1т= {т}, С = т, ]1 = 0,1 = 1,Н вложенная кусочно-линейная регрессия второго типа (4) совпадает с кусочно-линейной функцией риска (2).
4. При ]г= {1}, /2= {2}, ...,/т= {т}, Н = т,11 = 0,1 = 1,в вложенная кусочно-линейная регрессия второго типа (4) также совпадает с кусочно-линейной функцией риска (2).
Частными случаями обоих типов вложенной регрессии (3) и (4) являются следующие: простая вложенная кусочно-линейная регрессия первого типа
ук = т1п{т1п1е1{а1хк1},тах1е]{р1хк1}} + ек; (5)
простая вложенная кусочно-линейная регрессия второго типа
ук =тах{ттш{а1хк1},тах1е]{р1хы}} + ек; (6)
однородная вложенная кусочно-линейная регрессия первого типа
ук = тт{тт1<£11 {а1хк1},...,тще1с{а?хк1}} + £к; (7)
однородная вложенная кусочно-линейная регрессия второго типа
ук = тах{тах1е]1{р1хк1},...,тах1е]н{р?хк1}} + ек. (8)
Заметим, что сделанное выше замечание справедливо и по отношению ко всем индексным множествам вложенных кусочно-линейных регрессий (5) - (8). При этом I, ],11 £ (1,2, ...,т},1 = 1,0, Г £ {1,2,.,т}, 1 = 1/Н.
Можно сформировать и другие частные модификации вложенных кусочно-линейных регрессий (3) и (4). Так, в [17] отмечается, что в этих формулах отражен лишь первый порядок вложенности. Он может быть также вторым, третьим и т.д. Кроме того, нетрудно формализовать аддитивные и мультипликативные вложенные кусочно-линейные регрессионные конструкции обоих типов.
Оценивание параметров вложенных кусочно-линейных регрессий (3) - (8) может быть основано на приемах, применяемых при идентификации параметров регрессий (1) и (2), и сведен, таким образом, к решению специальным образом сформированных задач линейно-булевого программирования.
Заключение. В работе вводятся некоторые формы вложенной кусочно-линейной регрессии: простая вложенная кусочно-линейная регрессия первого и второго типов, а также однородная вложенная кусочно-линейная регрессия первого и второго типов. Констатировано, что обычная кусочно-линейная регрессия и кусочно-линейная функция риска являются частными случаями вложенной кусочно-линейной регрессии.
Список литературы
1. Михалап С.Г. Применение кусочно-линейной регрессии при анализе пространственного размещения популяционных группировок // Современные тенденции развития особо охраняемых природных территорий. Материалы научно-практической конференции, посвящённой 20-летию Государственного природного заповедника «Полистовский». 2014. С. 105-110.
2. Жижин К.С., Благородова Н.В. Использование кусочно-линейной регрессии в прогнозировании чрезвычайных ситуаций // Международный журнал экспериментального образования. 2016. № 5-3. С. 337-338.
3. Кротов С.В. Нелинейное оценивание площади зон скольжения в прессовом соединении колесной пары вагона // Научные проблемы транспорта Сибири и Дальнего Востока. 2011. № 2. С. 91-94.
4. Бубырь Д.С., Булыжев Е.М., Грехов Ю.А., Клячкин В.Н., Орлов Г.А. Система прогнозирования качества питьевой воды // Водоснабжение и канализация. 2014. № 7-8. С. 103-107.
5. Носков С.И., Хоняков А.А. Кусочно-линейные регрессионные модели объемов перевозки пассажиров железнодорожным транспортом // Модели, системы, сети в экономике, технике, природе и обществе. 2021. № 4 (40). С. 80-89.
6. Воротников И.Л., Розанов А.В., Котова М.В. Анализ и прогнозирование динамики цен на продукты питания (на примере Саратовской области) // Экономика сельскохозяйственных и перерабатывающих предприятий. 2016. № 5. С. 59-62.
7. Гордиенко А.С., Лозинская А.М., Тетерина Д.В., Шенкман Е.А. Исследование зависимости потребления электроэнергии и температуры в России: региональный разрез // Известия Российской академии наук. Энергетика. 2019. № 1. С. 15-27.
8. Воронина И.Д. Задача управления организационной структурой в условиях глобального инновационного процесса // Управление большими системами. 2006. № 12-13. С. 51-59.
9. Воронин А.А., Харитонов М.А. Модель адаптации операционного ядра организации // Вестник Волгоградского государственного университета. Серия 1: Математика. Физика. 2016. № 4 (35). С. 44-65.
10. Ершов Э.Б. Композитные производственные функции // Экономический журнал Высшей школы экономики. 2013. Т. 17. № 1. С. 108-129.
11. Абрамов А.П. Математические модели экономики дефицита. 2004.- М: Вычислительный центр им. А. А. Дородницына РАН (ВЦ РАН). 142 с.
12. Носков С.И. Идентификация параметров кусочно-линейной функции риска // Транспортная инфраструктура Сибирского региона. 2017. Т. 1. С. 417-421.
13. Ильина Н.К., Лебедева С.А., Носков С.И. Идентификация параметров некоторых негладких регрессий // Информационные технологии и проблемы математического моделирования сложных систем. 2016. №17. С.111-114.
14. Носков С.И., Хоняков А.А. Программный комплекс построения некоторых типов кусочно-линейных регрессий // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. № 3 (4). С. 47-55.
15. Носков С.И. Построение производственной функции с постоянными пропорциями методом антиробастного оценивания // Известия Тульского государственного университета. Технические науки. 2022. № 3. С. 383-387.
16. Носков С. И. О методе смешанного оценивания параметров линейной регрессии // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. № 1. С. 41-45.
17. Носков С.И. Подход к формализации вложенной кусочно-линейной регрессии // Международный журнал гуманитарных и естественных наук. 2023. № 1-2.
Носков Сергей Иванович, д-р. техн. наук, профессор, sergey. noskov. 5 7@mail.ru, Россия, Иркутск, Иркутский государственный университет путей сообщения
SOME FORMS OF NESTED PIECE-LINEAR REGRESSION S.I. Noskov
The article introduces some forms of nested piecewise linear regression proposed earlier by the author: simple nested piecewise linear regression of the first and second types, as well as homogeneous nested piecewise linear regression of the first and second types. It is shown that ordinary piecewise linear regression and piecewise linear risk function are special cases of nested piecewise linear regression. Estimation of the parameters of the proposed forms of nested piecewise linear regression can be based on the techniques used to identify the parameters of the usual piecewise linear regression and the risk function, and thus reduced to solving specially formed problems of linear Boolean programming.
Key words: piecewise linear regression, risk function, simple and homogeneous nested piecewise linear regression, linear Boolean programming problem.
Noskov Sergey Ivanovich, doctor of technical sciences, professor, sergey.noskov. 57@mail. ru, Russia, Irkutsk, Irkutsk State Railway University