Сер. 10. 2009. Вып. 1
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
ИНФОРМАТИКА
УДК 519.24:[62-05:629.41]
Руслан С. Кударов
СТАТИСТИЧЕСКАЯ МОДЕЛЬ ЗАВИСИМОСТИ КОЛИЧЕСТВА БРАКА В РАБОТЕ ПЕРСОНАЛА ОТ ПРОФЕССИОНАЛЬНОЙ ПОДГОТОВКИ
Введение. Успешная деятельность железнодорожного транспорта определяется его конкурентоспособностью на рынке транспортных услуг, которая обеспечивается высоким уровнем качества и безопасностью предоставляемых услуг. Как известно, безопасность движения поездов напрямую зависит от профессиональной подготовки машинистов локомотивного депо. По данным ОАО «Российские железные дороги» именно в работе локомотивных депо зафиксировано более 50% случаев брака всей сети железных дорог за последние годы. Поэтому изучение зависимости количества брака в работе машинистов локомотивного депо от показателей профессиональной подготовки является актуальной задачей.
До настоящего времени изучение зависимости количества брака в работе машинистов локомотивного депо от показателей их профессиональной подготовки осуществлялось [1-3] на базе классических регрессионных моделей, где наблюдения предполагаются независимыми и одинаково распределенными по нормальному (гауссовскому) закону.
В настоящей работе установлено, что эмпирическая гистограмма количества брака в работе машинистов локомотивного депо хорошо аппроксимируется теоретическим распределением вероятностей Пуассона. Опираясь на теорию обобщенных линейных моделей [4-6], была построена статистическая модель зависимости количества брака в работе машинистов локомотивного депо от показателей их профессиональной подготовки, которая не ограничивается предположением о нормальности распределения наблюдений.
Статистическая модель зависимости количества брака в работе персонала от показателей профессиональной подготовки. Примем, что профессиональная подготовка персонала, в соответствии с [7], формируется имеющимся образованием, периодическим совершенствованием полученных теоретических знаний и практических навыков, необходимых для работы по специальности, и производственным опытом. А именно, различаются четыре составляющие профессиональной подготовки персонала:
Кударов Руслан Серикович — аспирант электротехнического факультета Санкт-Петербургского государственного университета путей сообщения. Количество опубликованных работ: 15. Научные направления: математическое моделирование, производственный и обслуживающий персонал, безопасность движения железнодорожного транспорта. E-mail: kruslans@mail.ru.
© Руслан С. Кударов, 2009
стаж в должности (х(1)), класс (разряд) квалификации (х(2)), количество лет после получения образования (х(3)) и после прохождения курсов повышения квалификации (х(4)).
Исходные данные исследуемых показателей фиксируются в виде матрицы
P = (У„Х1, Хпх 4 ) *)
где У„х1 - вектор экспериментальных наблюдений количества брака, допущенного за исследуемый период Ъ лет, случайным образом отобранных п работников;
Хпх4 =
(X,
(1)
^(4)
V'
пх 1, пX 1)
^х(1) . . х(4)
х(.) ' \хП . х(4) . хп
матрица экспериментальных наблюдений рас-
сматриваемых показателей профессиональной подготовки п работников.
Искомые параметры статистической модели вычисляются по усредненным элементам матрицы Р. Усреднение производится путем разделения п обследуемых работников на I групп по их стажу и определения выборочного математического ожидания элементов матрицы Р для каждой группы. При этом, поскольку в матрице Р первый столбец содержит данные о количестве брака в работе персонала за исследуемый период Ъ лет, то расчет среднего количества брака в работе персонала за 1 год для каждой группы выполняется согласно соотношению
Я
Е Уг
г = 1
д*
Я
Ё Уг
г = 1
Я
' Е х
г =1
(1)
г
Яг
при
при
(1)
г
Яг
ё ^ г = 1
Иг
< Ъ,
где г - номер группы персонала (г = 1, ...,1); Яг - количество работников в г-й группе персонала.
Усредненные экспериментальные данные записываются в матрице Р = (У/хЬ1/хЬХ^1х)1,...,Х^4х)1) = (У/хЬХ/х5)") .
Построение статистической модели предполагает, что количество брака в работе персонала распределено по закону Пуассона, математическое ожидание (интенсивность брака) которого зависит от показателя профессиональной подготовки персонала. Проверка согласия эмпирической гистограммы количества брака в работе персонала с теоретическим распределением вероятностей Пуассона осуществляется с помощью критерия х2.
+ ) Запись (УпхъХпХ4) означает матрицу, полученную присоединением матрицы Хпх4 к вектору
X1 • ^ ^
++) В качестве символа усреднения матрице 1? и вектору "V/х1 присвоен символ «~», поскольку не все их элементы вычислены как выборочное математическое ожидание. Матрица X/хб получена присоединением векторов Х;1^,...^^ к вектору 1/хЪ в которой единичный столбец обозначается
X(0)
Х/х1-
Ъ
В принятых обозначениях предлагается моделировать изучаемую зависимость согласно [6] в виде условного распределения вероятностей Пуассона случайной величины количества брака в работе персонала:
/Poisson(п = ы\ln A(X)) = eyiln *(Xi)-*(Xi)-ln(5i!), (1)
где ln A(Xi) - натуральный логарифм теоретической интенсивности брака в работе г-й группы персонала с набором Xi показателей профессиональной подготовки.
Линейная комбинация элементов г-й строки матрицы Xi обозначается как ji и ставится в соответствие натуральному логарифму теоретической интенсивности брака в работе персонала:
ji = ln A(X i).
Таким образом, выбирается логарифмический вид функции связи теоретической интенсивности брака в работе персонала с показателями их профессиональной подготовки, и теоретическая интенсивность брака в работе персонала выражается через ji следующим образом:
A(Xi) =
здесь B - вектор искомых регрессионных параметров размерности 5x1, оценки которых вычисляются методом максимального правдоподобия.
Получение вектора 13 оценок регрессионных параметров также позволяет записать статистическую модель зависимости количества брака в работе персонала от показателей их профессиональной подготовки в виде функции распределения
yforecast
P{п < yforecast\X • B} = F(yforecast\X • B) = ek X'B-X B-ln(k!), (2)
k=0
в которой yforecast - теоретическое (прогнозируемое) количество брака в работе персонала (yforecast = о, 1, 2, ...); 0.5 < x(1) < 40; x(2) = 1, 2,...; 0.5 < x(3) < 40; 0 < x(4) < 37.
Проверка статистической значимости построенной модели осуществляется по критерию x2 [4] с помощью вычисления девиации, которая для случайной величины с распределением вероятностей (1) имеет вид
DE\poisson = 2 • ( • ln ( ) + (Â(Xi) - Vi) ) ,
Vi=1
где А(Х*) = сх*в.
Построенная модель признается статистически значимой на уровне значимости а, если Р(БЕУро^оп <Х2(! - 5)) < а.
Статистическую модель (2) можно применять для краткосрочного прогнозирования вероятности, с которой персонал допустит в своей работе количество брака за выбранный период не больше указанной величины при заданных показателях его профессиональной подготовки.
Статистическое моделирование зависимости количества брака в работе машинистов локомотивного депо от показателей их профессиональной подготовки. Моделирование количества брака в работе машинистов локомотивного депо
производилось по экспериментальным данным показателей профессиональной подготовки и количества брака в работе (за последние 5 лет) машинистов одного из локомотивных депо Октябрьской железной дороги.
Согласно классификации нарушений безопасности движения в поездной и маневровой работе на железных дорогах России, в качестве брака в работе машинистов локомотивного депо рассматриваются не устраненные машинистами неисправности локомотива, вызвавшие задержку в пассажирском движении на 1 ч и больше или в результате которых потребовался вспомогательный локомотив для пассажирского поезда.
Оценка согласия эмпирической гистограммы количества брака в работе обследованных 63 машинистов с теоретическим распределением вероятностей Пуассона /poisson(?? = у) = °'33°Уу<!- (где г/ — случайная величина количества брака в рабо-
те машинистов за 5 лет) осуществлена с помощью критерия х2. Поскольку расчетное
значение х2 = Е Пу 6363 Ру ^ = 0.004 (где пу - количество машинистов, допустивших у
y=0 Py
брака за 5 лет, py - соответствующая у бракам частота) меньше х0л(3) = 0.584, то согласие эмпирической гистограммы количества брака в работе обследованных машинистов с теоретическим распределением вероятностей Пуассона является статистически значимым на уровне а = 0.1.
Оценки регрессионных параметров B для имеющейся выборки вычислены в Excel методом Ньютона с точностью до е = 0.001 на 6-й итерации и представляют собой вектор B = (-9.266,1.071, 3.511, -1.297,0.332).
Выборочное значение девиации равно 0.009. Использование критерия х2 позволило установить, что построенная модель является статистически значимой на уровне а = 0.1, поскольку P(0.009 < х2(1)) = 0.074.
Как показал проведенный анализ разностей девиаций, ни один из показателей профессиональной подготовки машинистов не может быть исключен из 4-факторной статистической модели без существенной потери адекватности модели на уровне а = 0.1, поскольку DEVpjsson - DEVPoisson > Xo.i(1) для всех j = 1, 2, 3, 4, где DEVpo\sson есть девиация вновь построенной 3-факторной статистической модели по имеющимся выборочным данным без учета j-го показателя профессиональной подготовки машинистов.
Приведем показатели профессиональной подготовки трех (выбранных из 63 обследованных) машинистов и соответствующие величины вероятностей, с которыми они допустят не больше одного брака в своей работе за 2009 г.:
Машинист 1 2 3
г(1) 25 25 0.66
г(2) 3 3 4
x(3) 23 27 4
г(4) 11 22 2
p(п < 1), % 97 55 21
Заключение. В статье на базе теории обобщенной линейной модели произведено статистическое моделирование зависимости распределенного по закону Пуассона количества брака в работе персонала от показателей его стажа, класса квалификации, количества лет после получения образования и прохождения курсов повышения квалификации.
Построение статистической модели осуществлено методом максимального правдоподобия в предположении логарифмической функции связи интенсивности брака в работе персонала с показателями их профессиональной подготовки.
По экспериментальным данным одного из локомотивных депо Октябрьской железной дороги вычислены оценки регрессионных параметров статистической модели методом Ньютона с точностью до е = 0.001. Достаточно близкое к нулю значение девиации и подтвержденная статистическая значимость построенной модели на уровне а = 0.1 свидетельствуют о возможности ее практического применения.
Установлено, что построенная модель позволяет осуществлять краткосрочное прогнозирование вероятностей, с которыми отдельные машинисты допустят в своей работе количество брака не больше заданного значения за указанный период. Такое прогнозирование может быть использовано руководителями локомотивных депо для более обоснованного планирования мероприятий, связанных с повышением профессиональной подготовки машинистов.
Summary
Kudarov Ruslan S. The statistical model of a spoilage quantity in the personnel work from the vocational training.
The work contains a statistical model of a spoilage quantity dependence in the personnel work on the activities of vocational training. The construction of this model by a maximum-likelihood method is based on generalized linear models (GLIM). On the basis of this statistical model the dependence of a spoilage quantity in the locomotive depot work on the activities of vocational training is constructed. Basic data are obtained in a locomotive depot of the October railway. This statistical model is tested for statistical significance by x2 criterion. This model allows calculating the probability of a preset maximal spoilage quantity in the locomotive driver work.
Key words: a spoilage in the locomotive driver work, a generalized linear model, a maximum-likelihood method.
Литература
1. Козубенко В. Г. Корреляционный анализ снижения эффективности управляющей деятельности машиниста локомотива. Ростов н/Д.: Изд-во РИИЖТ, 1991. 100 c.
2. Козубенко В. Г. Повышение квалификации локомотивной бригады и безопасность движения. Ростов н/Д.: Изд-во РИИЖТ, 1991. 23 c.
3. Айзинбунд С. Я., Козубенко В. Г., Курков В. Н. Машинист и безопасность. М.: Транспорт, 1992. 48 c.
4. Ллойд Э., Ледерман У. Справочник по прикладной статистике: В 2 т. / Пер. с англ.; Под ред. Ю. Н. Тюрина. М.: Финансы и статистика, 1989. Т. 2. 510 с.
5. Lindsey J. K. Applying Generalized Linear Models. New York: Springer-Verlag, 1997. 257 p.
6. Dobson A. J. An Introduction to Generalized Linear Models. Herston: Ckapman&Hall/CRC, 2008. 320 p.
7. Большая энциклопедия: В 62 т. / Гл. ред. С. А. Кондратов. М.: Терра, 2006. Т. 39. 590 с.
Статья рекомендована к печати проф. Л. А. Петросяном.
Статья принята к печати 7 октября 2008 г.