Научная статья на тему 'Построение регрессионных моделей кривых обучения для промышленных предприятий'

Построение регрессионных моделей кривых обучения для промышленных предприятий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
181
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИВЫЕ ОБУЧЕНИЯ / LEARNING CURVES / РЕГРЕССИОННЫЕ МОДЕЛИ / REGRESSION MODELS / ОСВОЕНИЕ НОВОЙ ПРОДУКЦИИ / NEW PRODUCTS DEVELOPMENT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Павлов О. В.

Рассматривается задача построения регрессионных моделей кривых обучения по статистическим данным предприятия АО «Салют» о производстве новых изделий. С помощью нелинейного метода наименьших квадратов определяются параметры пяти моделей кривых обучения заданного вида: Райта, Стэнфорда B, Дейонга, логистической и экспоненциальной. В результате анализа статистических характеристик построенных моделей выбирается регрессионная зависимость, наилучшим образом аппроксимирующая данные.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONSTRUCTION OF REGRESSION MODELS OF LEARNING CURVES FOR THE INDUSTRIAL ENTERPRISES

The problem of constructing regression models of learning curves is considered based on the statistical data of the Salyut JSC enterprise on the production of new products.Using the nonlinear method of least squares, the parameters of five models of learning curves of a given type are defined: Wright's, Stanford-B, Deyong's, logistic and exponential.As a result of the statistical characteristics analysis of the constructed models, the regression dependence is chosen that best approximates the data.

Текст научной работы на тему «Построение регрессионных моделей кривых обучения для промышленных предприятий»

УДК 330.4

О.В. Павлов*

ПОСТРОЕНИЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ КРИВЫХ ОБУЧЕНИЯ ДЛЯ ПРОМЫШЛЕННЫХ ПРЕДПРИЯТИЙ

Рассматривается задача построения регрессионных моделей кривых обучения по статистическим данным предприятия АО «Салют» о производстве новых изделий. С помощью нелинейного метода наименьших квадратов определяются параметры пяти моделей кривых обучения заданного вида: Райта, Стэнфорда - В, Дейонга, логистической и экспоненциальной. В результате анализа статистических характеристик построенных моделей выбирается регрессионная зависимость, наилучшим образом аппроксимирующая данные.

Ключевые слова: кривые обучения, регрессионные модели, освоение новой продукции.

Введение

В проектах по освоению новой продукции на промышленных предприятиях проявляется эффект кривой обучения. Эффект кривой обучения заключается в том, что затраты времени работников на выполнение многократно повторяющихся производственных задач снижаются. Впервые эффект кривой обучения был описан инженером Т. Райтом в авиастроительной отрасли [1]. При каждом удвоении кумулятивного объема производства затраты времени на его производство снижаются на 10-20 процентов. Под кумулятивным объемом производства понимается количество изделий, изготовленных с начала производства продукции нарастающим итогом.

Большое количество научных публикаций, в основном иностранных, посвящено исследованию феномена кривой обучения и построению различных моделей, количественно описывающих снижение времени и затрат на выполнение производственных операций с увеличением кумулятивного объема производства.

Наиболее полно обзор, обсуждение и сравнение различных моделей кривых обучения представлены в научных публикациях [2-4].

Целью данной работы является построение регрессионных (эконометрических) моделей кривых обучения на основе статистических данных АО «Салют» об изменении трудоемкости изделий «Отсек» и «Балка» с увеличением кумулятивного объема производства. Построенные регрессионные модели имеют большое практическое значение для принятия управленческих решений о производственной деятельности предприятия. Модели кривых обучения используются для постановки различных динамических оптимизационных и игровых задач управления производственной деятельностью предприятия.

Постановка задачи и метод решения

По статистическим данным АО «Салют» о динамике изменения трудоемкости изделий «Отсек» и «Балка», с увеличением кумулятивного объема производства необходимо найти наилучшее уравнение приближенной регрессии из нескольких моделей, оценить допускаемую при этом ошибку, статистическую значимость и надежность модели.

Математически задача формулируется следующим образом. Необходимо найти уравнение регрессии заданного вида:

У х = / ( X),

где ух - трудоемкость изделия, теоретическое значение зависимой переменной, х - кумулятивный объем производства, независимая переменная.

Для решения задачи применяются методы регрессионного и корреляционного анализа [5]. Построение уравнения регрессии заданного вида сводится к определению его параметров. Для нахождения

* © Павлов О.В., 2017

Павлов Олег Валерьевич (pavlov@ssau.ru), заместитель директора, Институт экономики и управления, Самарский национальный исследовательский университет имени академика С.П. Королева, 443086, Российская Федерация, г. Самара, Московское шоссе, 34.

параметров регрессионной зависимости /(в) применяется нелинейный метод наименьших квадратов [4-5]:

Е(У - Ух,тт, (1)

1=1

где у. - фактические значения трудоемкости в 1-м наблюдении, у -расчетные (теоретические) значения трудоемкости, рассчитанные по уравнению регрессии, п - число наблюдений.

Метод наименьших квадратов заключается в поиске оценок параметров уравнения регрессии, минимизирующих сумму квадратов отклонений фактических значений у. от расчетных значений у Рассматриваемые в работе уравнения регрессии внутренне нелинейны по оцениваемым параметрам, поэтому для решения оптимизационной задачи (1) используется численный итеративный метод Ньютона.

Для выбора наилучшей регрессионной зависимости кривой обучения рассматриваются пять различных моделей, описанных в научной литературе [1-4].

1. Модель Райта:

У = С^, (2)

где у - трудоемкость изделия, С1 - трудоемкость производства первого изделия, х - кумулятивный объем производства, Ь - индекс обучения, характеризует скорость снижения трудоемкости изделия при увеличении кумулятивного объема производства.

2.МодельСтэнфорда - В,которая является модификацие ймодели Райта:

у = С1(х + В)"\ (3)

где В - параметр, соответствующий количеству изделий предшествующего производства.

3. Модель Даймлеа:

у = С1 [М + (1 - М ) в ~ъ ]

+ (1 - М ) в~" (4)

где М - коэф фициеит илажимоэммсти, который учитывает,чта часть кйботы, выполняется машинами. Если АК я 0, ео ииобота ак задойствовкио овтоммгизированиое кртруцоваийв, р атли М = 0, то работа порнптяаю выпалоясоая мотамаоям и кбучеиля де грюисеодиа. Рж Логистиотскж модели:

У Утт + ( Утах Утт )

1

1 + в

(5)

где ут1п, тВгх _ минимальные с ]^;ся(^им^льг[ые зночения ттyдоeмтоати изделия, а, о - параметры логи-стииявтял IV! оде л У.

5.Экспоне яйиaябиaеcом еят:

^„■овТ ав, (6)

где Се, а,М_ плромeяpыткcпмйВлаиальнoй модели.

Выболо иае^.лс''Я1е^-у[ модрки ик постряенжых вюдяс^еЯ0 иривыхобумения осущтствляется на основе ратч-таоерашрноЦ

п

сОат = Е(У - Увг ). (7)

1=1

Для оценки тесноты связи между зависимой и независимой переменными в построенных регрессионных меде лях отcелиоестaeття икдеяс пярной киклопащис

Ку =

п 2

И(у, - у,)

1" ^-", (8)

ё(у, - у)2

1=1

где у - средняя величина зависимой переменной (трудоемкостью), определяемая по формуле

y = Ёя. i=1

Чем ближе индекс парной корреляции к 1, тем 0 о ye е тесная связь между зависимой переменной (трудоемкостью) и независимой переманноа (кумулятивным объемом производства изде-

Для оценки качества построенных регрессионных мод елей вычисляетсяиндекс детерминации как квадрат индекса парнсЧ внррчллцти:

в

Е(ал С

R2=RPC = 1-^-г, (9)

1=1

Индекс детсрмин^синия покснесвает долю изменения зачиримой переменной (трудоемкости), обусловленную измененчнм ^еневвсамвй перемсннон (чис^улв^товслягс оДчемомнроизаодсчсе)^ем ближе индекс детерминялинл в ),онле луин^с качеслво ростроснкой регрессионной меряли.

Для постросмных деерессиенны1х моделен провод-няя оцсн-аис нсзачсмос™ с пвмощью F-критерия Фишера. Призаовс лыдсл^г^^^ся гипотеза о статистичнсной мсвнечимояти рлнтнрссм^ неерессии и показателя тесноты связи. Выполняется сравнение факыического К, и табличного К ° значений К-кри-

А т факт табл 1

терия.

Величина фаогирeслoгг-И-рямдинанI связане с ивдзксон детерсмнацвеч

P - ЯК- n-m-в (10)

Кааке — _с , (10)

я 1 -с Rc m

где m - число параметров прине зааняимо й я.

Табличное значение Ктабл определяется по таблице критических значений при уровне значимости а и двух степонрх свободы ^ = м, -2 в:в - сс - 1. В расчвтдч урооерь змнчимнcтинявинчмается равным 0,01.

Если фактическое значение больше табличного, то гипотеза о случайной природе оцениваемых переменных отквснятнст и признается статистическая значимость и надежность уравнения регрессии. В противном слувае гипотеед все отклрнверся и признается статистическая незначимость, ненадежность построеннойрегрессионноймодели.

Качество анализируемых нелинейных уравнений регрессии также оценивается по средней ошибке аппроксимации;

Я н1уСв л-в )i00%

т,=1 y, . (11)

Значение средней ошибки аппроксимации до 10 % свидетельствует о высокой точности регрессионной модели.

Результаты построения регрессионной модели кривой обучения по данным производства изделия «Отсек»

Статистические данные о динамике трудоемкости изделия «Отсек» от кумулятивного объема производства напредприятииОА«Салют» представлены на рис. 1.

На графике рис. 1 видно, что точки выстраиваются в кривую линию, соответствующую некоторому нелинейному регрессионному уравнению f(x). В результате решения оптимизационной задачи (1) с использованием инструмента «Поиск решения электронной таблицы Excel» были определены параметры пяти моделей кривых обучения (2)-(6) по статистическим данным производства изделия «Отсек».

1. Модель Райта: y = 205,45x 02510.

2. Модель Стэнфорда - B: y = 266,87(x + 10)03005.

3. Модель Дейонга: y = 238,76(0,10 + 0,9x-0-3617).

4. Логистическая модель: y = 515,10 + 3 6,(51

1

1 + 0,017e°'°561x

5. Экспоненциальная модель: y = 49,85 + 59,51e 0,0138x.

120

100

80

g 60 §

■■и

| 40

20

О 20 40 60 80 100 120 140 160 180 200 Кумулятивный объём производства, шт.

Рис. 1. Зависимость трудоемкости изделия «Отсек» от кумулятивного объема производства

Построенные регрессионные модели по статистическим данным производства изделия «Отсек» представлены на рис. 2-6.

120

100

5 80

60

О

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 40

20

20 40 60 80 100 120 140 160 180 200 Кумулятивный объём производства, шт.

Рис. 2. Регрессионная модель Райта кривой обучения по данным производства изделия «Отсек»

Рис. 3. Регрессионная модель Стэнфорда - В кривой обучения по данным производства изделия «Отсек»

Рис. 4. Регрессионная модель Дейонга кривой обучения по данным производства изделия «Отсек»

Рис. 5. Регрессионная логистическая модель кривой обучения по данным производства изделия «Отсек»

20

о -I----------

о 20 40 60 80 100 120 140 160 180 200 Кумулятивный объём производстве, шт.

Рис. 6. Регрессионная экспоненциальная модель кривой обучения по данным производства изделия «Отсек»

В таблице 1 для построенных моделей по данным производства изделия «Отсек» приводятся рассчитанные по формулам (7)-(11) значения остаточной дисперсии о2т, индекса парной корреляции Яу, индекса детерминации Я2, фактического значения F-критерия Фишера Fфaкт, средней ошибки аппроксимации А.

Таблица 1

Расчет статистических характеристик моделей кривых обучения по данным производства изделия «Отсек»

№ Модель Остаточная дисперсия Индекс парной корреляции Индекс детерминации Фактическое значение F-критерия Фишера Средняя ошибка аппроксимации

1 Райта 14,7890 0,9579 0,9175 89,0187 4,08%

2 Стэнфорда - B 12,2224 0,9653 0,9319 109,3917 3,79%

3 Дейонга 17,1486 0,9510 0,9044 75,6691 4,61%

4 Логистическая 4,8268 0,9865 0,9731 289,2602 2,74%

5 Экспоненциальная 8,2415 0,9768 0,9540 166,0952 3,12%

Анализируя данные таблицы 1, приходим к выводу, что у логистической модели по сравнению с другими моделями остаточная дисперсия о2ост и средняя ошибка А наименьшие, индекс парной корреляции R , индекс детерминации Ry наибольшие. Таким образом, наиболее хорошо статистические данные по производству изделия «Отсек» аппроксимирует логистическая модель.

Для оценки значимости построенной логистической модели было определено табличное значение F-критерия Фишера Fma6ji = 11,2586. Так как фактическое значение больше табличного значения F-кри-терия Фишера F m > Fma&, то гипотеза о случайной природе оцениваемых переменных отклоняется и признается статистическая значимость и надежность экспоненциальной модели.

Значение средней ошибки аппроксимации А = 2,74 % , меньшее 10 %, свидетельствует о высокой точности построенной логистической модели.

Результаты построения регрессионной модели кривой обучения по данным производства изделия «Балка»

Статистические данные зависимости трудоемкости изделия «Балка» от кумулятивного объема производства на предприятии АО «Салют» представлены на рис. 7.

Из анализа рис. 7 видно, что точки выстраиваются в кривую линию, соответствующую некоторому нелинейному регрессионному уравнению f(x). В результате решения оптимизационной задачи (1) с использованием инструмента «Поиск решения электронной таблицы Excel» были определены параметры пяти моделей кривых обучения (2)-(6) по статистическим данным производства изделия «Балка».

1. Модель Райта: y = 20,68х 01469.

2. Модель Стэнфорда - B: y = 22,57(х + 5)-0 1630.

3. Модель Дейонга: y = 21,38(0,1 + 0,9x-01813).

1

4. Логистическая модель: y = 9,10 + 5,2 0

1 + 0,119e°'0341x

5. Экспоненциальная модель: у = 9,17 + 6Д6е~°,0169х.

Построенные регрессионные модели по статистическим данным производства изделия «Балка» представлены на рис. 8-12.

20

О ^-------

О 50 100 150 200 250 300 350

Кумулятивный объём производства, шт.

Рис. 7. Зависимость трудоемкости изделия «Балка» от кумулятивного объема производства

Рис. 8. Регрессионная модель Райта кривой обучения по данным производства изделия «Балка»

Рис. 9. Регрессионная модель Стэнфорда - В кривой обучения по данным производства изделия «Балка»

Рис. 10. Регрессионная модель Дейонга кривой обучения по данным производства изделия «Балка»

Кумулятивный объём производства, шт.

Рис. 11. Регрессионная логистическая модель кривой обучения по данным производства изделия «Балка»

о ^-------

О 50 100 150 200 250 300 350

Кумулятивный объём производства, шт.

Рис. 12. Регрессионная экспоненциальная модель кривой обучения по данным производства изделия «Балка»

В таблице 2 для построенных моделей по данным производства изделия «Балка» приводятся рассчитанные по формулам (7)-(11) значения остаточной дисперсии о2ост1, индекса парной корреляции Rxy, индекса детерминации Rо, фактического значения F-критерия Фишера Fфaкт, средней ошибки аппроксимации А.

Таблица 2

Расчет статистических характеристик моделей кривой обучения по данным производства изделия «Балка»

№ Модель Остаточная дисперсия Индекс парной кореляции Индекс детерминации Фактическое значение F-критерия Фишера Средняя ошибка аппроксимации

1 Райта 0,0304 0,9947 0,9894 747,3331 1,39%

о Стэнфорда-В 0,0354 0,9938 0,9877 640,9246 1,53%

3 Дейонга 0,0294 0,9949 0,9898 772,5261 1,33%

4 Логистическая 0,1135 0,9800 0,9605 194,3788 2,27%

5 Экспоненциальная 0,0100 0,9983 0,9965 2286,3202 0,79%

Анализируя данные таблицы 2, приходим к выводу, что у экспоненциальной модели по сравнению с другими моделями остаточная дисперсия о2ост и средняя ошибка А наименьшие, индекс парной корреляции Rxy, индекс детерминации Rxy наибольшие. Таким образом, наиболее хорошо статистические данные по производству изделия «Балка» аппроксимирует экспоненциальная модель.

Для оценки значимости построенной экспоненциальной модели определяется табличное значение F-критерия Фишера Fтaбл 11,2586. Так как фактическое значение больше табличного значения F-кри-

терия Фишера Fфaкт > Fтafk, то гипотеза о случайной природе оцениваемых переменных отклоняется и признается статистическая значимость и надежность экспоненциальной модели.

Значение средней ошибки аппроксимации А 0,79 %, меньшее 10 %, свидетельствует о высокой точности построенной экспоненциальной модели.

Заключение

В данной работе на основе статистических данных предприятия АО «Салют» о производстве новых изделий «Отсек» и «Балка» построены регрессионные (эконометрические) модели кривых обучения. Для имеющихся статистических данных построены пять моделей: Райта, Стэнфорда-В, Дейонга, логистическая и экспоненциальная. Для каждой модели были рассчитаны статистические характеристики. Из анализа графиков регрессионных уравнений и рассчитанных статистических характеристик моделей были сделаны следующие выводы:

1. Наиболее хорошо статистические данные по производству изделия «Отсек» аппроксимирует логистическая модель следующего вида:

у = 55,10 = 3 6,(51

1

1 + 0,017е°'0561х

2. Наиболее хорошо статистические данные по производству изделия «Балка» аппроксимирует экспоненциальная модель следующего вида:

у = 9,17 + 6,16е~°,М69х.

3. Проведенное исследование показало статистическую значимость и надежность выбранных логистической и экспоненциальной моделей.

4. Расчеты свидетельствуют о высокой точности построенных моделей.

Построенные регрессионные модели кривых обучения будут использованы автором для постановки различных динамических оптимизационных и игровых задач управления производственной деятельностью предприятий.

Благодарности

Исследование выполнено при финансовой поддержке РФФИ и Самарской области в рамках научного проекта № 17-46-630606.

Библиографический список

1. Wright T.P. Factors affecting the cost of airplanes // Journal of the aeronautical sciences. 1936. V 3.№ 4. P. 122-128.

2. Badiru A. Computational survey of univariate and multivariate learning curvemodels // IEEE Transactions on Engineering Management. 1992. V 39. № 2. P. 176-188.

3. Yelle L.E. The learning curve: Historical review and comprehensive survey // Decision Sciences. 1979. V 10. № 2. P. 302-328.

4. Learning Curves: Theory, Models, and Applications / ed. by Mohamad Y Jaber. Boca Raton: CRC Press, 2011. 476 p.

5. Эконометрика: учебник / под ред. И.И. Елисеевой. М.: Финансы и статистика, 2003. 344 с.

References

1. Wright T.P Factors affecting the cost of airplanes. In: Journal of the aeronautical sciences, 1936, vol. 3, no. 4, pp. 122-128 [in English].

2. Badiru A. Computational survey of univariate and multivariate learning curvemodels. In: IEEE Transactions on Engineering Management, 1992, vol. 39, no. 2, pp. 176-188 [in English].

3. Yelle L.E. The learning curve: Historical review and comprehensive survey. In: Decision Sciences, 1979, vol. 10, no. 2, pp. 302-328 [in English].

4. Learning Curves: Theory, Models, and Applications.Edited by Mohamad Y. Jaber. Boca Raton: CRC Press, 2011, 476 p. [in English].

5. Ekonometrika: uchebnik [Econometrics: a textbook]. Ed. by I.I. Yeliseyeva. Moscow: Finansy I statistika, 2003. 344 p. [in Russian].

O.V. Pavlov *

CONSTRUCTION OF REGRESSION MODELS OF LEARNING CURVES FOR THE INDUSTRIAL ENTERPRISES

The problem of constructing regression models of learning curves is considered based on the statistical data of the Salyut JSC enterprise on the production of new products.Using the nonlinear method of least squares, the parameters of five models of learning curves of a given type are defined: Wright's, Stanford-B, Deyong's, logistic and exponential.As a result of the statistical characteristics analysis of the constructed models, the regression dependence is chosen that best approximates the data.

Key words: learning curves, regression models, new products development.

Статья поступила в редакцию 4/IX/2017.

The article received 4/IX/2017.

* Pavlov Oleg Valerievich (pavlov@ssau.ru), Vice Director, Institute of Economics and Management, Samara National Research University, 34, Moskovskoye shosse, Samara, 443086, Russian Federation.

i Надоели баннеры? Вы всегда можете отключить рекламу.