Научная статья на тему 'МОДИФИКАЦИЯ НЕПРЕРЫВНОЙ ФОРМЫ МЕТОДА МАКСИМАЛЬНОЙ СОГЛАСОВАННОСТИ ПРИ ПОСТРОЕНИИ ЛИНЕЙНОЙ РЕГРЕССИИ'

МОДИФИКАЦИЯ НЕПРЕРЫВНОЙ ФОРМЫ МЕТОДА МАКСИМАЛЬНОЙ СОГЛАСОВАННОСТИ ПРИ ПОСТРОЕНИИ ЛИНЕЙНОЙ РЕГРЕССИИ Текст научной статьи по специальности «Математика»

CC BY
44
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННАЯ МОДЕЛЬ / МЕТОД МАКСИМАЛЬНОЙ СОГЛАСОВАННОСТИ / НЕПРЕРЫВНАЯ ФОРМА / КРИТЕРИИ АДЕКВАТНОСТИ / МЕТОД ИДЕАЛЬНОЙ ТОЧКИ

Аннотация научной статьи по математике, автор научной работы — Носков Сергей Иванович, Бычков Юрий Александрович

В статье представлен алгоритм модификации непрерывной формы метода максимальной согласованности при разработке регрессионных моделей. Он базируется на использовании часто применяемого в теории принятия решений метода идеальной точки при выборе оптимального значения числа, задающего уровень компромисса между методом наименьших модулей и непрерывной формой метода максимальной согласованности. В качестве критериев адекватности модели используются сумма модулей ошибок аппроксимации, средняя относительная ошибка и значение непрерывного критерия согласованности поведения. Разработанный алгоритм использован при построении модели количества поступающих заявок на выдачу патентов в Российской Федерации. В качестве независимых переменных используются: валовый внутренний продукт, численность аспирантов, среднемесячная номинальная начисленная заработная плата работников, численность профессорско-преподавательского состава.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Носков Сергей Иванович, Бычков Юрий Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODIFICATION OF THE CONTINUOUS FORM OF THE MAXIMUM CONSISTENCY METHOD IN CONSTRUCTING LINEAR REGRESSION

The article presents an alsorithm for modifyins the continuous form of the maximum consistency method in the development of regression models. It is based on the use of the ideal point method, often used in decision theory, when choosing the optimal value of a number that sets the level of compromise between the least moduli method and the continuous form of the maximum consistency method. As criteria for the adequacy of the model, the sum of the modules of approximation errors, the average relative error, and the value of the continuous criterion for the consistency of behavior are used. The developed algorithm was used to build a model for the number of incoming patent applications in the Russian Federation. The following are used as independent variables: gross domestic product, number of graduate students, average monthly nominal accrued wages of employees, number of teaching staff.

Текст научной работы на тему «МОДИФИКАЦИЯ НЕПРЕРЫВНОЙ ФОРМЫ МЕТОДА МАКСИМАЛЬНОЙ СОГЛАСОВАННОСТИ ПРИ ПОСТРОЕНИИ ЛИНЕЙНОЙ РЕГРЕССИИ»

The article discusses the existing methods of organizing data storage systems, as well as the main problems of popular approaches to controlling the integrity of information in the conditions of destructive influences of an attacker. A software implementation is presented and a study of the developed method for controlling the integrity of multidimensional data arrays based on the use of a cryptographic hash function, excluding a number of known disadvantages, is carried out.

Key words: data storage system, data integrity control, hash function.

Alyamkin Alexander Vladimir ovich, employee, alexandralyamkin@,yandex. ru, Russia, Krasnodar, Krasnodar Higher Military School named after S.M.Shtemenko,

Dorofeev Andrey Alexandrovich, employee, [email protected], Russia, Krasnodar, Krasnodar Higher Military School named after S.M. Shtemenko,

Shevtsov Nikita Igorevich, employee, nikirot@,gmail. com, Russia, Krasnodar, Krasnodar Higher Military School named after S.M. Shtemenko,

Zubarev Yaroslav Igorevich, employee, Zubarev-bk@,mail. ru, Russia, Krasnodar, Krasnodar Higher Military School named after S.M. Shtemenko,

Goloyad Maxim Viktorovich, employee, macsimgoloyad@mail. ru, Russia, Krasnodar, Krasnodar Higher Military School named after S.M. Shtemenko,

Dichenko Sergey Alexandrovich, candidate of technical sciences, employee, [email protected], Russia, Krasnodar, Krasnodar Higher Military School named after S.M. Shtemenko

УДК 330.4

DOI: 10.24412/2071-6168-2022-5-88-95

МОДИФИКАЦИЯ НЕПРЕРЫВНОЙ ФОРМЫ МЕТОДА МАКСИМАЛЬНОЙ СОГЛАСОВАННОСТИ ПРИ ПОСТРОЕНИИ ЛИНЕЙНОЙ РЕГРЕССИИ

СИ. Носков, Ю.А. Бычков

В статье представлен алгоритм модификации непрерывной формы метода максимальной согласованности при разработке регрессионных моделей. Он базируется на использовании часто применяемого в теории принятия решений метода идеальной точки при выборе оптимального значения числа, задающего уровень компромисса между методом наименьших модулей и непрерывной формой метода максимальной согласованности. В качестве критериев адекватности модели используются сумма модулей ошибок аппроксимации, средняя относительная ошибка и значение непрерывного критерия согласованности поведения. Разработанный алгоритм использован при построении модели количества поступающих заявок на выдачу патентов в Российской Федерации. В качестве независимых переменных используются: валовый внутренний продукт, численность аспирантов, среднемесячная номинальная начисленная заработная плата работников, численность профессорско-преподавательского состава.

Ключевые слова: регрессионная модель, метод максимальной согласованности, непрерывная форма, критерии адекватности, метод идеальной точки.

Введение. Современные методы математического моделирования успешно применяются для решения сложных и многоуровневых проблем, возникающих в самых различных предметных областях. Так, в работе [1] проводится корреляционно-регрессионный анализ динамики стоимости акций компании «Лукойл, построено

88

уравнение регрессии, позволяющее прогнозировать их будущие котировки. Полученная модель линейной регрессии, по мнению автора, отражает влияющие на них факторы. Полученные прогнозы могут быть использованы для принятия инвестиционных решений в долгосрочном периоде. В [2] выдвинута гипотезу, о том, что между факторами, указанными в Государственной программе Российской Федерации «Развитие электронной и радиоэлектронной промышленности на 2013-2025 год», существует линейная связь. В результате проведенных исследований предложена регрессионная модель, в которой определены линейные зависимости, влияющие на реализацию Программы. Вызывает интерес работа [3], посвящённая исследованию влияния ряда показателей на развитие как регионов Российской Федерации, так и страны в целом. Автором построены несколько регрессионных факторных моделей валового регионального продукта, а также проведена оценка их параметров. Сделаны выводы о значимости каждого фактора для экономического развития субъектов РФ. В статье [4] представлены результаты исследовательской работы по выявлению зависимости чистой прибыли крупной газовой компании от показателей её инновационной деятельности. В качестве математического аппарата применяется корреляционно-регрессионный анализ. Полученная регрессионная модель обладает хорошими аппроксимационными качествами, на что указывают значения коэффициента детерминации и критерия Фишера. Авторы делают вывод, что использование модели позволило определить тесноту линейной связи между показателями инновационного развития компании и чистой прибылью, а спрогнозировать размер чистой прибыли компании в случае благоприятной динамики инновационных показателей. В [5] построена линейная четырехфакторная регрессионная модель, описывающая зависимость инновационного развития ВУЗа от ряда влияющих факторов. В работе [6] регрессионный анализ применятся для исследования инновационного потенциала Северного Кавказа и формирования стратегии развития Южного федерального округа.

В статье [7] анализируется статистическая информация, касающаяся количества патентов, уровня изобретательской активности и количества нобелевских лауреатов. Автором выявлены проблемы, которые влияют на патентную деятельность в России, на основе чего предложены возможные направления инновационного развития национальной экономики. Авторами работы [8] выявлена зависимость количества патентов от затрат на финансирование научных исследований и разработок. Построено несколько регрессионных моделей - линейная, квадратичная и экспоненциальная. По результатам оценок адекватности и аппроксимационных свойств моделей принято решение о применении квадратичной модели для прогнозирования исследуемого показателя. В [9] проведено исследование влияния широкого спектра различных факторов на внутренние изменения институциональной экономики. По мнению автора, одним из наиболее весомых факторов такого влияния является демографический. Делается вывод о необходимости вовлечения трудоспособного населения в инновационную экономику, что в дальнейшем будет определять эффективность экономики как на национальном, так и на мировом уровне.

В настоящей работе приводится модификация непрерывной формы метода максимальной согласованности в регрессионном анализе (НММС), подробно описанного в работах [10-14]. В качестве примера практического применения предложенной модификации рассмотрена задача построения регрессионной модели количества поступающих заявок на выдачу патентов в Российской Федерации.

Формирование компромисса между НММС и методом наименьших модулей. Рассмотрим линейное регрессионное уравнение (модель) вида:

Ук = Ш1 а1хк1 + , к = 1, п, (1)

где у - зависимая; х^ - 1-ая независимая переменные; а^ - /-ый подлежащий оцениванию параметр; ек - ошибки аппроксимации; к - номер наблюдения; п - число наблюдений (длина выборки).

Линейную модель (1) можно представить в виде:

^ Ук=Ук + £к, к = 1,п,

где ук и у^ - соответственно фактические (наблюдаемые) и расчетные (вычисленные по модели) значения зависимой переменной у.

Рассмотрим ситуацию, описанную в работе [12]. Допустим, после построения модели (1) для произвольных номеров наблюдений s и h изучаемой выполняется следующее неравенство:

(Уз -Уп)( у5 -уй) <

Оно означает, что на паре номеров наблюдений ^ линейная модель (1) неудовлетворительно описывает исследуемый процесс, что не может быть компенсировано малостью величин |г5|, и Подобное обстоятельство негативно влияет на результат исследования, особенно тогда, когда с помощью модели анализируются динамические процессы. Формализуются такие ситуации с помощью подробно описанного в работах [13, 14] критерия согласованности поведения (КСП). В работе [15] предложена, а в [16] апробирована непрерывная форма КСП (НКСП), состоящая в решении задачи оптимизации:

L=lnkZ11l1¡=k+1lks -шп, (2)

где

1 =\1$к (у к -Уз)(9к -&)< 0 (Д в противном случае.

Введем в рассмотрение числа шк5, к=1, п — 1, 5 = к + 1, п по правилу:

( 1, Ук-Уз> 0 Ук~Уз<0 0 Ук~Уз = 0.

В работе [13] показано, что задача (2) сводится к следующей задаче линейного

программирования (ЛП):

Г Гк=1(ик +рк) + (1-г) 22=1 - ш1и, (3)

а1хы + ик-рк = ук, к = 1, п, __(4)

^кз Щ (хы -х5{) + 1к5 >0, к= 1,п - 1, 5 = к + 1,п, (5)

ик >0, рк >0, к = 1,п, 1кз >0, к=1,п — 1, 5 = к + 1,п. (6)

Здесь г Е (0,1] - заранее выбранное число, устанавливающее сравнительный приоритет (компромисс) в целевой функции (3) между функцией потерь М= =2к=11ек1 = 2к=1(.ик + рк), соответствующей методу наименьших модулей (МНМ) и НКСП, 8 - малая положительная константа. Легко видеть, что при г= 1 задача ЛП (3) - (6) реализует МНМ, а при г, близком к 0, она позволяет определить оценки параметров модели (1), обеспечивающие максимальную согласованность поведения расчетных и фактических значений выходной переменной, как это предложено в работе [10].

Для оценки адекватности полученных линейных регрессионных моделей, построенных с помощью НММС, будем, наряду с М и L, использовать среднюю относительную ошибку аппроксимации Е=100%2к=11£к/Ук1/п-

Процесс построения при помощи НММС линейной регрессионной модели (1) подробно описан в [14]. При этом производилось варьирование числа г на отрезке [г*,1], где г* - минимальное значение г, обеспечивающее получение нетривиального решения задачи ЛП (3) - (6). Представляется, что для однозначного выбора этого числа на указанном отрезке может быть использован прием, основанный на известном в теории принятия решений методе идеальной точке и примененный в работе [15] при построении дискретной модели производства алюминия в Российской Федерации.

Как и в [14], определим число г , представляющее собой округление г* в большую сторону до ближайшего десятичного разряда. После этого решим задачу (3) -(6) со значениями г = гу, равными узлам равномерной сетки на отрезке [ г ,1] с шагом

0.1, т.е. гг = гЛ, г2 = гл+ 0.1,..., Гд = 1. Для каждого вектора параметров ry), i = 1, m рассчитаем значения критериев адекватности M( ry), L( ry), E( ry). Определим максимальные значения каждого критерия:

М=max М( ту), L= max L( ту), E=max Е( ry).

j=i,g j=i,e i=ha

После этого вычислим нормированные значения критериев:

Mj = M(ry)/ М, !у = L(ry)/ I, Е} = E(rj)/ Ё. Очевидно, что наихудшее значение каждого нормированного критерия равно единице, т.е. вектор (1,1,1) представляет собой «антиидеальную» точку в критериальном пространстве в данной задаче принятия решений. Рассчитаем расстояние до нее гу для каждого вектора (My, Ly,£y):

Tj = (1 - My) + (1 -!,) + (1 - £}), j = 1^. Таким образом, лучшим значением r следует считать тот, который наиболее удален от «антиидеальной» точки, т.е. соответствует максимальному значению гу.

Применение НММС с компромиссным значением числа r для построения регрессионной модели количества поступающих заявок на выдачу патентов в Российской Федерации.

Введем следующие обозначения:

у - количество заявок на выдачу патента в Российской Федерации (шт.);

х1 - ВВП в текущих ценах (млрд. руб.);

х2 - численность аспирантов на конец года (чел.);

х3 - среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций в целом по экономике Российской Федерации (руб.); х4 - численность профессорско-преподавательского состава (тыс. чел.). В качестве исходных данных для проведения исследования воспользуемся открытой статистической информацией за 2000 - 2020 гг., размещенной на официальных порталах Федеральной службы по интеллектуальной собственности [16] и Федеральной службы государственной статистики [17] (табл. 1).

Таблица 1

Исходные данные для моделирования

Количество заявок на вы- ВВП в теку- Численность аспирантов на конец года Среднемесячная номинальная начисленная заработная плата ра- Численность про-фессорско-

Период дачу патента РФ щих ценах ботников по полному кругу организаций в целом по экономике РФ преподавательского состава

шт. млрд. руб чел. руб. тыс. чел.

t у X, Х4

2000 28688,0 7305,6 117714,0 2223,0 307,4

2001 29989,0 8943,6 127420,0 3240,0 319,6

2002 29225,0 10830,5 136242,0 4360,0 339,6

2003 30651,0 13080,2 140741,0 5499,0 354,1

2004 30192,0 17027,2 142662,0 6740,0 364,3

2005 32254,0 21609,8 142899,0 8555,0 387,3

2006 37691,0 26917,2 146111,0 10634,0 409,0

2007 39439,0 33247,5 147719,0 13593,0 419,2

2008 41849,0 41276,8 147674,0 17290,0 378,8

2009 38564,0 38807,2 154470,0 18638,0 377,8

2010 42500,0 46308,5 157437,0 20952,0 356,8

2011 41414,0 60114,0 156279,0 23369,0 348,2

2012 44211,0 68103,4 146754,0 26629,0 342,0

2013 44914,0 72085,7 132002,0 29792,0 319,3

2014 40308,0 79030,0 119868,0 32495,0 299,8

2015 45517,0 83087,4 109936,0 34030,0 279,8

2016 41587,0 85616,1 98352,0 36709,0 261,0

2017 36454,0 91843,2 93523,0 39167,0 245,1

2018 37957,0 103861,7 90823,0 43724,0 236,1

2019 35511,0 109608,3 84265,0 47867,0 229,3

2020 34984,0 107315,3 87751,0 51344,0 223,1

С помощью описанного выше алгоритма будем строить линейную регрессионную модель

у = а0 + а1х1 + а2х2 +а3х3 + а4х4. (7)

В табл. 2 представлены результаты применения НММС при построении модели (7) при различных значениях г £ [ г , 1].

Таблица 2

Результаты моделирования

г а0 а1 а2 а3 а4 Ё,- М,

0,42 31335,85 0,05 0,02 -0,04 7,90 11,30 84158,03 7607,85

0,5 6947,23 0,24 0,07 -0,20 39,09 5,69 45324,07 36374,30

0,6 6876,17 0,24 0,07 -0,20 38,88 5,68 45250,18 36450,60

0,7 4721,53 0,36 0,10 -0,47 34,57 5,31 41783,50 44021,46

0,8 3048,39 0,40 0,14 -0,55 21,60 4,96 38998,47 52414,36

0,9 -3450,88 0,41 0,14 -0,51 35,89 4,89 38347,89 57139,02

1 -3936,20 0,42 0,14 -0,52 36,70 4,89 38309,27 57562,75

В табл. 3 размещены нормированные значения критериев адекватности.

Таблица 3

Нормированные значения критериев адекватности

г Ё, М, Ч

0,42 1 1 0,132

0,5 0,504 0,539 0,632

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,6 0,503 0,538 0,633

0,7 0,470 0,496 0,765

0,8 0,439 0,463 0,911

0,9 0,433 0,456 0,993

1 0,433 0,455 1

Наконец, в табл. 4 представлены расстояния от г} до «антиидеальной» точки (1,1,1) в критериальном пространстве.

Таблица 4

Расстояния от Т7 до «антиидеальной» точки

г г

0,42 0,868

0,43 1,312

0,5 1,326

0,6 1,326

0,7 1,269

0,8 1,187

0,9 1,119

1 1,112

Из табл. 4 следует, что лучшему варианту соответствует значение г = 0.6, указанное расстояние для которого составляет величину, равную 1,326. Поэтому вектор параметров а = (6876,17; 0,24; 0,07; -0,20; 38,88) и следует считать соответствующим модифицированной непрерывной форме метода максимальной согласованности.

Заключение. В работе описан модифицированный вариант непрерывной формы метода максимальной согласованности при построении регрессионных моделей. Он основан на применении известного в теории принятия решений метода идеальной точки при выборе оптимального значения числа, являющегося мерой компромисса между методом наименьших модулей и непрерывной формой ММС. Разработанный при этом алгоритм использован при построении модели количества поступающих заявок на выдачу патентов в Российской Федерации.

Список литературы

1. Бабенок А.В. Регрессионный анализ в задачах анализа данных мирового финансового рынка // 76-я научная конференция студентов и аспирантов Белорусского государственного университета: материалы конференции: в 3-х частях, Минск, 13-24 мая 2019 года / Белорусский государственный университет. Минск: Белорусский государственный университет, 2019. С. 267-270.

2. Ганин А.Н. Регрессионная модель индикаторов модернизации радиоэлектронной промышленности России // Успехи современной науки и образования. 2016. Т. 2. № 6. С. 45-49.

3. Горидько Н.П., Рослякова Н.А. Факторы развития российских регионов: роль инноваций и транспортной инфраструктуры / под редакцией Р.М. Нижегородцева. -Москва: Некоммерческая автономная организация высшего образования «Национальный институт бизнеса», 2014. 440 с.

4. Низамова Г.З., Мусина Д.Р. Прогнозирование инновационной деятельности нефтегазовых компаний // Интернет-журнал Науковедение. 2016. Т. 8. № 4(35). С. 5.

5. Миролюбова Т.В., Соломатова Л.О. Методические подходы к анализу факторов, влияющих на развитие инновационной системы университета // Фундаментальные исследования. 2012. № 11-4. С. 1004-1010.

6. Гуриева Л.К., Шапка И.С. Анализ инновационной ситуации в регионах Южного федерального округа // Известия высших учебных заведений. СевероКавказский регион. Общественные науки. 2005. № 4 (132). С. 51-57.

7. Маркова Е.Г. Количество патентов и проблемы патентоспособности в России // Сборники конференций НИЦ Социосфера. 2015. № 22. С. 98-101.

8. Дмитриева О.А., Батова Т.Н. Регрессионная модель зависимости количества патентов от объема затрат на финансирование научных исследованийи разработок // Альманах научных работ молодых ученых Университета ИТМО: в 5 т., Санкт-Петербург, 02-06 февраля 2016 года. - Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, 2016. С. 40-42.

9. Омельченко Е.В. Эффективность экономической системы: демографическая проекция // Научный результат. Серия: Экономические исследования. 2016. Т.2. № 1. С. 26-31. DOI 10.18413/2409-1634-2016-2-1-26-31.

10. Носков С.И. Метод максимальной согласованности в регрессионном анализе // Известия Тульского государственного университета. Технические науки. 2021. Вып. 10. С. 380-385.

11. Носков С.И. Обобщенный критерий согласованности поведения в регрессионном анализе // Информационные технологии и математическое моделирование в управлении сложными системами. 2018. № 1 (1). С. 14-20.

12. Носков С.И. Оценивание параметров линейной регрессии посредством максимизации числа совпадений знаков приращений фактических и расчетных значений зависимой переменной // Информационные технологии и математическое моделирование в управлении сложными системами. 2021. № 2 (10). С. 109-111.

13. Носков С.И. Применение непрерывного критерия согласованности поведения при построении регрессионных моделей // Известия Тульского государственного университета. Технические науки. 2021. Вып. 6. С. 74-78.

14. Носков С.И., Бычков Ю.А. Вычислительные эксперименты с непрерывной формой метода максимальной согласованности в регрессионном анализе // Вестник Воронежского государственного технического университета. 2022. Т.18. № 2. С. 7-12. DOI 10.36622/VSTU.2022.18.2.001.

15. Носков С.И. Дискретная модель производства алюминия в Российской Федерации // Вестник Технологического университета. 2022. Т.25. № 2. С. 80-82. DOI 10.55421/1998-7072 2022 25 2 80.

16. Официальный портал Федеральной службы по интеллектуальной собственности. [Электронный ресурс] URL: https://rospatent.gov.ru (дата обращения: 29.04.2022).

17. Официальный портал Федеральной службы государственной статистики [Электронный ресурс] URL: https://rosstat.gov.ru (дата обращения: 29.04.2022).

18. Свидетельство о государственной регистрации программы для ЭВМ № 2022618082 РФ. Программа оптимизации непрерывного критерия согласованности поведения при построении регрессионных моделей / С.И. Носков, Ю.А. Бычков. Опубл. 28.04.2022.

Носков Сергей Иванович, д-р техн. наук, профессор, [email protected], Россия, Иркутск, Иркутский государственный университет путей сообщения,

Бычков Юрий Александрович, аспирант, bychkov ya'a,internet.ru, Россия, Иркутск, Иркутский государственный университет путей сообщения

MODIFICATION OF THE CONTINUOUS FORM OF THE MAXIMUM CONSISTENCY METHOD IN CONSTRUCTING LINEAR REGRESSION

S.I. Noskov, Y.A. Bychkov

The article presents an algorithm for modifying the continuous form of the maximum consistency method in the development of regression models. It is based on the use of the ideal point method, often used in decision theory, when choosing the optimal value of a number that sets the level of compromise between the least moduli method and the continuous form of the maximum consistency method. As criteria for the adequacy of the model, the sum of the modules of approximation errors, the average relative error, and the value of the continuous criterion for the consistency of behavior are used. The developed algorithm was used to build a model for the number of incoming patent applications in the Russian Federation. The following are used as independent variables: gross domestic product, number of graduate students, average monthly nominal accrued wages of employees, number of teaching staf.

Key words: regression model, maximum consistency method, continuous form, adequacy criteria, ideal point method.

Noskov Sergey Ivanovich, doctor of technical sciences, professor, [email protected], Russia, Irkutsk, Irkutsk State Railway University,

Bychkov Yury Alexsandrovich, postgraduate, bychkov_ [email protected]. ru, Russia, Irkutsk, Irkutsk State Railway University

i Надоели баннеры? Вы всегда можете отключить рекламу.