УДК 519.25: 658.5: 621.771 Девятченко Л. Д.
многомерный анализ соответствий организационных признаков и результативности труда в прокатном производстве
В данной работе анализировались категориро-ванные данные готовой продукции широкополое -ного стана 2500 холодной прокатки ОАО ММК, производимой в условиях сменно-бригадной формы организации труда. Для измерения категорий организационно- производстве иных признаков ис -пользовались номинальные и порядковые шкалы. Статистические данные, представляющие собой частотные таблицы или так называемые таблицы сопряженности [1, 8], предопределили метод их обработки - анализ соответствий. Приложение в металлургии данного метода для обработки данных двухвходовых таблиц рассматривалось ранее [2].
Для многомерного анализа соответствий сбор первичной информации удобно было осуществить в формате бинарной (индикаторной) матрицы, элементами которой являются индикаторы 1 и 0, используемые для обозначения принадлежности или не принадлежности какого-либо объекта (на-блюдения) к той или иной категории. В табл. 1 приведен фрагмент бинарной матрицы размера 273х 16, пред назначенной для изучения взаимосвя-зи организационных признаков (С - смены, В -бригады) на результативные признаки производ-ства (W - уровни выпуска продукции, S - уровни брака, N - уровни выпуска несортной продукции). Для исследуемых признаков по результативности труда и смен использовалась трехуровневая градация, а для бригад - четырехуровневая. Общий объем многомерной выборки составил 273 смены (три калевдарных месяца наблюдений). Обработка данных выполнена в системе STATISTICA [4].
Индикаторная матрица - удобный формат для сбора информации, однако оказывается совершенно непригодной даже для обозрения собранного материала, особенно при большом объеме наблюдений. В многомерном анализе соответствий в ка-честве входного формата данных, предназначенных для обработки, используют так называемую [4] матрицу Берта (Burt table), которая представляет собой результат произведения исходной бинарной матрицы (обозначим ее X) слева на транспонированную матрицу XT, т.е. XTX является матрицей Берга, основные свойства которой следующие:
• Матрица Берта XTX - симметричная матрица порядка m, где X - бинарная матрица размера nхm, n >> m, n - число наблюде-
ний, т - общее число категорий по всем К признакам.
• Ячейки матрицы содержат пу частоты, вычисляемые как скалярное произведение /-строки матрицы X и ^-столбца матрицы X.
• Квадратная матрица ХТ X состоит из К2 блоков (подматриц), образующихся в ре -зультате взаимного пересечения исследуемых признаков.
• Блоки, сформированные на главной диагонали матрицы Берта, - диагональные под -матрицы со следом, равным п, где п - общий объем выборки.
Для многомерного ивдикаторного массива, фрагмент которого дан в табл. 1, получена матрица Берта размера 16x16 (табл. 2). Массив мно-говходовых данных, представленный в ввде матрицы Берта и предназначенный для многомерного анализа соответствий, предполагает также свободный выбор переменных и для двухвходовых таблиц сопряженности.
Матрица Берта сама по себе даже без какой-либо математической обработки представляет интерес для исследователя. Любая строка (точно как и столбец) этой матрицы дает исследователю предварительную информацию о характере влияния на данную категорию какого-либо фактора каждой категории других факторов, учтенных в данном эксперименте. Как следует из данных табл. 2, напр., для бригады 51 (4 строка матрицы Берта) за наблюдаемый период (п=273 смены) было 67 выходов на работу, из них 20, 23 и 24 раза
Таблица 1
Фрагмент первичной информации в виде бинарной (индикаторной) матрицы размера 273x16
№ C B W S N
п/п 1 2 3 1 2 3 4 1 2 3 1 2 3 1 2 3
1 1 0 0 0 0 0 1 0 1 0 0 1 0 1 0 0
2 0 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0
3 0 0 1 0 1 0 0 1 0 0 1 0 0 0 0 1
272 0 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0
273 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0
ОБРАБОТКА МЕТАЛЛОВДАВЛЕНИЕМ
Таблица 2
Матрица Берта размера 16x16 для многомерного анализа соответствий точек-столбцов бинарной матрицы размера 273x16
нальными частотами (нижняя строка и правый столбец соответственно).
Для проверки Н0-гипотезы о независимости многоуровневых признаков Ж и В следует вычислить ожидаемые частоты
С1 С2 С3 В1 В2 В3 В4 Ж1 Ж2 Ж3 51 52 53 N1 N2 N3
С1 91 0 0 20 21 26 24 26 30 35 31 24 36 30 27 34
С2 0 91 0 23 22 22 24 49 29 13 26 34 31 30 33 28
С3 0 0 91 24 26 20 21 16 32 43 34 33 24 31 31 29
В1 20 23 24 67 0 0 0 23 30 14 29 14 24 27 21 19
В2 21 22 26 0 69 0 0 19 21 29 28 23 18 22 21 26
В3 26 22 20 0 0 68 0 16 20 32 20 24 24 16 27 25
В4 24 24 21 0 0 0 69 33 20 16 14 30 25 26 22 21
Ж1 26 49 16 23 19 16 33 91 0 0 28 31 32 32 29 30
Ж2 30 29 32 30 21 20 20 0 91 0 32 28 31 31 28 32
Ж3 35 13 43 14 29 32 16 0 0 91 31 32 28 28 34 29
51 31 26 34 29 28 20 14 28 32 31 91 0 0 33 26 32
52 24 34 33 14 23 24 30 31 28 32 0 91 0 25 38 28
5 3 36 31 24 24 18 24 25 32 31 28 0 0 91 33 27 31
N1 30 30 31 27 22 16 26 32 31 28 33 25 33 91 0 0
N2 27 33 31 21 21 27 22 29 28 34 26 38 27 0 91 0
N3 34 28 29 19 26 25 21 30 32 29 32 28 31 0 0 91
п.п ■ п,
е.. = -
У
о 1
затем
статистику
(п.. -е ..) V у у)
соответственно в 1, 2 и 3 смены. На эту бригаду выпадает в основном средний Ж2 уровень выпуска продукции (с частотой 30) и у нее чаще всего (29) самый низкий 51 уровень брака и самый низкий уровень N1 несоответствующей заказу продукции (частота 27). Для бригады В2, примерно при тех же условиях выхода на работу, наибольшая частота (29) приходится на высокий уровень Ж3 выпус-ка продукции и на низкий 51 уровень брака (частота 29), однако для нее характерен высокий уровень N3 несоответствующей заказу продукции (частота 29) и т.д.
Табл. 2 содержит 20 блоков симметричных относительно главной диагонали матрицы Берта
или всего (К2 — К) /2 = 10 разных двухвходовых подтаблиц (число сочетаний из К элементов по 2). Каждая из этих двухвходовых таблиц сопря-женности может представлять интерес для проверки Н0-гипотезы о независимости данной пары признаков с имеющимися у них категориями или уровнями. Для этого следует применить методику, рассмотренную ранее [2]. В качестве примера представим один из таких блоков в табл. 3 (соответствующий блок расположен в табл. 2 на пересечении 8-10 строк и 4—7 столбцов). Кстати, по свойствам матрицы Берта маргинальные частоты подтаблиц, определяемых как блок в матрице Берта, в /-строке и в '-столбце будут совпадать соответственно с диагональными (/, /) и (',у) элементами матрицы Берта. В табл. 3 приведены частоты сопряженных признаков В и Же марги-
где для фактора В
"=1 1=1 еу
число уровней./=4, адля фактора Жчисло уровней 1=3.
По данным наблюдаемых частот Пу, приведенным в табл. 3, и ожидаемых частот ец, вычисленных при независимости признаков Ж и В, эмпирический критерий Х2=21,1832 с числом степеней свободы к=6, определяемых как к=(/-1)(/-1).
Принимая во внимание, что на уровне значимости а=0,05 табличное [3] значение 0,05 = 12,59 < X2 = 21,183 Я0-гипотезу о
независимости признаков Ж и В отвергаем и принимаем альтернативную гипотезу И\ о значимой зависимости наблюдаемых признаков. Декомпозиция данного -критерия представлена в табл. 4.
Данные табл. 4 показывают, что наибольший локальный вклад в отклонение от независимости, наряду с ячейкой (Ж3, В3), дает ячейка (Ж\, В4). Если теперь дополнить выявленные категории Ж\ и В4 противоположными категориями Ж1 и
Таблица 3
Категорированные данные по выпуску продукции и бригадной формы организации труда
Обозначении е уровни выпуска продукции БРИГАДЫ Сумма
В1 В2 Вэ В4
Ж\ - нижний 23 19 16 33 91
Ж2 - средний 30 21 20 20 91
Ж3 - высший 14 29 32 16 91
Сумма 67 69 68 69 273
Таблица 4
Декомпозиция ^-критерия, вычисленного по данным табл. 3
Обозначенны е уровни выпуска продукции БРИГАДЫ Сумма
В1 В2 В3 В4
Ж\ - нижний Ж2 - средний Ж3 - высший 0,0199 2,6318 3,1094 0,6956 0,1739 1,5652 1,9607 0,3137 3,8431 4,3478 0,3913 2,1304 7,0241 3,5107 10,648
Сумма 5,7611 2,4347 6,1176 6,8695 21,183
п
00
B4, то можем построить и анализировать полученную при этом простейшую дихотомическую таблицу 2x2, представленную в табл. 5 вместе с результатами проверки Н0-гипотезы.
Таким образом, отклонение Н0-гипотезы под -тверждает локальный вывод о существенном влиянии бригады B4 на низкий уровень W\ выпуска металлопродукции. Аналогично можно подтвердить и значимость влияния B3 на W3.
Из 10 блоков матрицы Берта значительный интерес представляет также блок, связывающий уровни брака и последовательности смен по времени работы (ночная, дневная, вечерняя). Напр., нужно проверить Н0-гипотезу о незначимом влиянии работы в ночную смену (C1) на высокий уровень брака (53).
Составим дихотомическую матрицу 2х2, общий вид которой для наблюдаемых и ожидаемых частот приведен в табл. 6.
Комментарий к составлению табл. 6. Из объема выборки n =273 одинаковое число, равное 91, приходится на каждую смену, в том числе и на смену C1. В смену C1 высокий уровень брака огме-чалгя 36 раз. Значит, в смену C1 не было высокого
уровня брака 91-36=55 раз - это для категории S3, а также, если по всем сменам 91 раз наблюдался высокий уровень брака S3, то не в смену C1, т.е. для
категории C1 приходится 91-36=55 случаев S3. Число случаев S3, т.е. когда высокий уровень брака не отмечался при работе двух других смен C1, составляет 273-91-55=127.
Примечание. Приведенные вычисления в компьютерной программе STA TIS TICA [4] выполняются автоматически путем ввода в бинарную матрицу для каждого индикаторного столбца дополнительного столбца с противоположной индикацией. В результате матрица Берта в своих размерах увеличивается вдвое, т.к. каждая категория в такой расширенной матрице как бы представляется в ввде дихотомического фактора (свойство присутствует и свойство отсутствует).
Итак, возвращаясь к табл. 6, отметим , что расчетное значение X2-статистики оказалось равным 2,303, что не позволяет отклонить H0-гипотезу, т.к. табличное значение -критерия с одной степенью сво-боды на уровне значимости а=0,05
Таблица 5
32
30
28
26
24
22
20
18
16
14
12
Двойная дихотомизация данных из табл. 3 для изоляции ячейки (W1, B4)
Категории в, B4 Сумма Комментарии
W1 58 33 91 X2 = 8,727; p - 0,003; H0 отклонена
W1 146 36 182
Сумма 204 69 273
Таблица 6
Наблюдаемые и ожидаемые частоты таблицы сопряженности 2x2, составленной по данным матрицы Берта
Категории Наблю даемые частоты Ожидаемые частоты
S 3 S 3 Итог S 3 S 3 Итог
C1 36 55 91 30,004 60,666 91,000
C1 55 127 182 60,666 121,334 182,000
Итог 91 182 273 91,000 182,000 273,000
Таблица 7
Двухвходовая таблица сопряженности признаков В - бригады и Б - уровни брака
Категории S1 S2 S3 Итоги
B1 29 14 24 67
B2 28 23 18 69
B3 20 24 24 68
B4 14 30 25 69
Итоги 91 91 91 273
Interaction Plot: b x s Multiple identical responses were ignored
s1
s2
'-Й-- ---b
1 b1
b
b2
b
b3
-1- b
s3
b4
Рис. 1. Графики взаимосвязи сопряженных признаков в табл.7
Таблица 8
Наблюдаемые частоты в таблице с тремя входами: В - бригады, W - уровни производства, С -рабочие смены
С B W Всего по
Wi W2 W3 строкам
Bi 7 9 4 20
Ci B2 7 3 11 21
Вз 3 8 15 26
В4 9 10 5 24
Всего по столбцам 26 30 35 91
Bi 12 8 3 23
C2 В2 11 10 1 22
B3 11 4 7 22
B4 15 7 2 24
Всего по столбцам 49 29 13 91
Bi 4 13 7 24
Сз B2 1 8 17 26
B3 2 8 10 20
B4 9 3 9 21
Всего по столбцам 16 32 43 91
оказалось 0 05 = 3,84 > 2,303 .
Характер влияния отдельных бригад на уровни брака проявляется из данных подтаблицы (табл. 7), отвечающей блоку BxS матрицы Берта.
По частотным данным табл. 7 построены соответствующие графики (рис. 1). Наиболее очевидный вывод, который следует из визуального анализа графиков на рис. 1: точка s2 для всех бригад, кроме b2, является как бы экстремальной. В этой точке для бригад Ь3 и Ь4 средний уровень бра -ка достигает «Max», а для бригады b1 - «Min», при этом только в бригаде Ь2 с повышением уровня брака от s1 к s3 равномерно снижается частота его появления.
Теперь перейдем от частных задач, вытекающих из двухвходовых под -матриц матрицы Берта, к задачам многомерного анализа соответствий, для которого упомянутая матрица служит входным форматом при обработ-ке данных на ЭВМ.
Если число категорированных переменных M>3, то сразу же возникают сложности в наглядности таких таблиц, т.к таблица с размерностью IxJx...xK, где I, J, ..., K - числа категорий для соответствующих A1, A2, ..., AM факторов, входящих в многомерную таблицу
сопряженности, физически может быть представлена только в M-мерном пространстве. В простейшем случае, когда M=3, таблицу можно предста-вигь в ввде прямоугольного параллелепипеда со строками, столбцами и слоями, где слои - это двух-входовые таблицы сопряженности. Воспользуемся такой формой представления частот (табл. 8) для анализа влияния сменно-бригадной формы организации труда на уровни выпуска продукции.
По данным табл. 8 для проверки #о-гипотезы вычисляются ожвдаемые частоты (табл. 9), а затем Х2-статистика, распределенная по ячейкам таблицы 4x3x3 (табл. 10).
Бесспорно, из анализа данных табл. 8-10 следует, что Д)-гипотеза на уровне значимости а=0,05 отвергается, т.к. при обозначенном числе степеней свободы й^=4-3-3-1=35 табличное [3] значение ^25; 0,05 = 49,80185 < 77,27193.
Матрица Берта содержит пересечения каждой категории с любой другой категорией, в том числе и с их отрицанием (в случае расширения матрицы за счет дополняющих столбцов). Следовательно, если использовать метод декомпозиции ^-критерия, то в каждой ячейке матрицы (i,j)-компоненга -критерия будет указывать на роль данного пересечения в формировании оценок общей сопряженности исследуемых признаков (их категорий).
В рассмотренном случае для M=3 признаков, когда еще не теряется наглядность за счет послойного представления двухвходовых таблиц, стано-
Inte raction Plot: c x b x w Multiple identical responses were ignored
i i
\
\ ; 1 \ : \
V л;
......i J/УА \ / \ \ ■ ч\ «
■■■<>..... \\ \\
Ь
-O- c
c1
-L' c c1
"O" c c1
Рис. 2. Диаграммы для визуального анализа данных с тремя входами (факторы В, С и W)
w3
w2
w3
w2
w3
вигся очеввдным, какие именно пересекаемые категории обеспечивают связь наблюдаемых признаков . Так, напр., данные табл. 10 показывают, что наибольший вклад в X -статистику обеспечивает ячейка (Сз, В2, Щ3), т.е. связь третьей смены, второй бригады и максимального уровня выпуска продукции существенно значима, значительный вклад в значимость выявляемых взаимосвязей дают ячейки (Сх, Вз, Щз), (С2, В4, Ж{) и др.
Какой ввд имеют сформировавшиеся взаимосвязи категорированных признаков, пред -ставленных в табл. 8, можно наблюдать на диа-грамме рис. 2.
Оценка связи категорированных факторов, как отмечалось выше, является первейшей задачей анализа как двухвходовых, так и многовхо-довых таблиц сопряженности. Отметим, что мера связи, аналогичная парному коэффициенту корреляции Пирсона, определяющая положительное или отрицательное направление этой связи, не имеет смысла для факторов, измеряемых в номинальных шкалах, но не в порядковых шкалах. В случае дихотомических факторов (также и категорий, отражающих отсутствие и присутствие конкретного свойства) мера связи, используемая в порядковой (ранговой) статистике Кендалла, Спирмена, а также Гудмена-Краскала, становится вполне приемлемой [8].
Заметим, что изучаемые категорироваиные факторы (см. табл. 8 и рис. 2) измерены в разных шкалах: фактор В - в номинальной шкале, а фак-
торы C и W - в порядковых шкалах. Следователь -но, для категорий факторов C и W можно получить оценки корреляционных связей, используя подпрограммы [4], где реализованы соответст-вующие алгоритмы [7, 8]. В табл. 11 приведена ранговая корреляция Спирмена (Spearman) для блока дихотомических переменных (категорий порядковых факторов C и W), а также статистические характеристики, в частности t(N—2)-статис-тика Стьюденга и p-level - уровень значимости для проверки #о-гипотезы о независимости той или иной пары сопряженных признаков.
Как показывают данные табл. 11, статистически значимыми оказываются следующие пары категорий c2 & w1, c2 & w3, c3 & w1 и c3 & w3, т.к. по умалчиванию значимой признается лишь t -статистика Стьюденга с N-2 степенями свободы, если p-level < 0,05. При этом обратим внима-ние, что две пары дихотомических переменных (c2 & w1, c3 & w3) имеет значимую положительную корреляцию, а две других (c2 & w3, c3 & w1) - отрицательную, т.е. смена c2 является как бы «переломной».
Если принять во внимание 3-уровневую категоризацию факторов C и W, то гипотеза о существенной значимости рассматриваемых факторов подтверждается на основе ^2-статиг-тики Пирсона, т.к. эмпирическое значение
X2 = 34,9451 > 0,05 = 9,4877 при числе степеней свободы (3-1)(3-1)=4 и уровне значимости
Таблица 9
Ожидаемые частоты в таблице с тремя входами: В - бригады, W - уровни производства, С - рабочие смены
С B W Всего по
Wi W2 W3 строкам
Bi 7,44 7,44 7,44 22,33
Ci B2 7,67 7,67 7,67 23,01
B3 7,55 7,55 7,55 22,65
B4 7,67 7,67 7,67 23,01
Всего по столбцам 30,33 30,33 30,33 91
Bi 7,44 7,44 7,44 22,33
C2 B2 7,67 7,67 7,67 23,01
B3 7,55 7,55 7,55 22,65
B4 7,67 7,67 7,67 23,01
Всего по столбцам 30,33 30,33 30,33 91
Bi 7,44 7,44 7,44 22,33
C3 B2 7,67 7,67 7,67 23,01
B3 7,55 7,55 7,55 22,65
B4 7,67 7,67 7,67 23,01
Всего по столбцам 30,33 30,33 30,33 91
Таблица 10
Распределение Х2-статистики по ячейкам таблицы 4х3х3, (использованы данные табл. 7 и 8)
С B W Всего по
Wi W2 W3 строкам
Bi 0,026021 0,327097 1,590538 1,943656
Ci B2 0,058527 2,843403 1,445750 4,347680
B3 2,742053 0,026821 7,351324 10,12020
B4 0,230626 0,707809 0,929452 1,867887
Всего по столбцам 3,057227 3,905131 11,31706 18,27942
Bi 2,794839 0,042150 2,649677 5,486666
C2 B2 1,445750 0,707809 5,800378 27,95394
B3 1,445750 1,669205 0,040066 3,155021
B4 7,005072 0,058527 4,191512 11,25511
Всего по столбцам 12,69141 2,477691 12,68163 27,85073
Bi 1,590538 4,155054 0,026021 5,771613
C3 B2 5,800378 0,014198 11,34927 17,16385
B3 4,079801 0,026821 0,795033 4,901655
B4 0,230626 2,843403 0,230626 3,304655
Всего по столбцам 11,70134 7,039475 12,40095 31,14177
а=0,05. Однако ранговый коэффициент корреля-ции тК Кендалла [8], вычисленный для 3-уров-невых порядковых факторов С и оказался, как и следовало ожвдать статистически незначимым (гК=0,08839) из-за «переломного» характера категории с2 (дневная смена). Данный факт подтвержден опять же с помощью рангового коэф-
Таблица 11
Ранговая корреляция Спирмена для исследуемого блока дихотомических переменных
УаШ Бреагтап К1\1-2) р-!еуе!
с1 & 273 -0,071429 -1,17887 0,239482
с1 & ш2 273 -0,005495 -0,09045 0,927995
с1 & ш3 273 0,076923 1,27008 0,205147
с2 & ш1 273 0,307692 5,32352 0,000000
с2 & ш2 273 -0,021978 -0,36189 0,717715
с2 & ш3 273 -0,285714 -4,90804 0,000002
с3 & ш1 273 -0,236264 -4,00271 0,000081
с3 & ш2 273 0,027473 0,45243 0,651324
с3 & ш3 273 0,208791 3,51460 0,000516
Таблица 12
Раздельное рассмотрение таблиц сопряженности уровней выпуска продукции W1, W2, Wз для смен С1, С2 и С2, Сз
Отрицательная связь рангов Положительная связь рангов
Уровни Ш2 Ш3 Сумма Уровни Ш2 Ш3 Сумма
С1 26 30 35 91 С2 49 29 13 91
С2 49 29 13 91 С3 16 32 43 91
Сумма 75 59 48 182 Сумма 65 61 56 182
Таблица 13
Основные числовые характеристики, вычисленные по данным табл. 2, для многомерного анализа соответствий
Номер размерности Сингулярные числа Д Собственные числа ^ Процент от общей инерции I = 2 2 ±0 Кумулятивный процент инерции 110, стагис-тика
1 0,542768 0,294597 13,39078 13,3908 426,5197
2 0,512295 0,262446 11,92937 25,3201 379,9712
3 0,484770 0,235002 10,68192 36,0021 340,2378
4 0,463264 0,214613 9,75514 45,7572 310,7183
5 0,461318 0,212814 9,67338 55,4306 308,1140
6 0,444334 0,197433 8,97422 64,4048 285,8445
7 0,421788 0,177905 8,08660 72,4914 257,5725
8 0,417944 0,174677 7,93988 80,4313 252,8992
9 0,410215 0,168277 7,64894 88,0802 243,6322
10 0,385451 0,148572 6,75328 94,8335 215,1939
11 0,337139 0,113663 5,16649 100,0000 164,5618
фициенга корреляции гК Кевдалла при соответствующей группировке категорий фактора С, представленной в табл. 12.
Коэффициент ранговой корреляции тК Кевдалла, вычисленный по данным левой части табл. 12, оказался отрицательным, гК=-0,28665, а по данным правой части - положительным, гК=0,40133. Асимптотическая ставдартная ошибка, одинаковая для представленных в табл. 12 обоих сопряжений, равна 0,05. Следовательно, выдвинутые ранее предположения относительно наличия линейной корреляции с противоположными алгебраическими знаками подтверждены.
Таким образом, с помощью ранговой корреляции тК Кевдалла и г3 Спирмена получена оценка не только меры связи сопряженных признаков и их категорий, но и направление действия этойсвя-зи, подобно коэффициенту корреляции Пирсона.
Следуя логике анализа двухвходовых таблиц сопряженности [1, 2], далее следует определить собственные числа и соответствующие им собственные векторы, чтобы затем отобразить исход -ную информацию, содержащуюся в матрице Берта , в пространство выбранной размерности [5, 9]. В табл. 13 приведены вычисленные по данным табл. 2 основные числовые характеристики для выбора и построения удобной координатной сис-темы выполняемых многомерных преобразований.
Использование матрицы Берта в многомерном анализе соответствий не позволяет исследователю выбрать максимальную размерность для точного воспроизведения заданного М-мерного пространства для отображения его в преобразованном ортогональном пространстве по следующим причинам.
Во-первых, не следует забывать, что основной целью анализа соответствий, тем более многомерного, является представление расстояний между точками-столбцами, изучаемыхМ категорий по всем К факторам в пространстве более низкой размерности.
Поэтому мы не стремимся к увеличению размерности отображаемого пространства даже в ущерб информационной ценности получаемого отображе ния.
Во-вторых, напомним, что собственные числа Л / = 1, т , т<М, располагаемые в порядке убывания
Л -Ап^ ^ ^3, • • •,
А =А_
последовательно
характеризуют долю ^ Л{ информационной
/ 1 =1
ценности /-размерности отображения. Поэтому мы стремимся использовать для построения отображений только первые А, более близкие к Лпах.
В-третьих, в выбранном пространстве более низкой размерности в основном, пусть даже с искажением, будут сохраняться пропорции расстояний между точками-столбцами. Это позволяет в некоторой степени все же «распознать» сформированные сгустки отдельных категорий, пусть даже немного «размытыми» на границах их соприкосновений, в зависимости от выбираемых /-размерностей, используемых в ортогональных преобразованиях [6, 9].
Таким образом, размерность выбираемого пространства для отображения информации, содержащейся в матрице Берта, как правило, равна двум (реже трем) для удобства наглядного представления информации по сопряженности изучаемых факторов.
На рис. 3 представлено отображение информации, содержащейся в матрице Берта (см. табл. 2), в двумерное пространство с координатными осями, определяемыми на основе Хх и Я2, в системе аккумулируется 25,32% инерции. При этом на рис. 3 просматриваются немного «размытыми» сформированные 3 сгустка точек. Возможно, что эти сгустки инициируются на фоне рабочих смен, однако смены хорошо разделены только для ¡-размерности, для 2-размерности они практически находятся на одном уровне. Скорее всего, формирование групп инициируется определенным уровнем выпуска продукции, а также не последнюю роль в этом играют производственные бригады.
Примем во внимание слабую крутизну убывания собственных чисел матрицы Берта, отражающей специфику взаимосвязи данных по организа-ции производства и показателям выпуска продукции, и представим исходную информацию опять же в двумерных ортогональных пространствах, но в других ракурсах. При этом будем использовать другие варианты сочетания собственных чисел. На рис. 4 представлено отображение, основанное на Х\ и А3, (аккумулирование 24,07% инерции), а на рис. 5 - отображение, основанное на Х2 и Х3 (аккумулирование 22,61% инерции).
Сравнивая во всех представленных на рис. 3-5 ракурсах полученную информацию о «близости» друг к другу некоторых категорий, заметим, что формирование сгустков из отдельных категорий в основном носит устойчивый характер, однако некоторые точки (см. рис. 3-5) все же «перескакивают» из одного сгустка в другой в зависимости от ис -пользуемого преобразования. Во всех трех ракурс ах двумерных пространств очень близкими всегда оказываются группы точек: (С2,В4^1); (С3,В2); (С 1,83). К этим группам примыкают и другие точ-ки, однако констатировать это по отдельным двумерным отображениям затруднительно.
На рис. 6 представлено трехмерное пространство, в основе построения которого использованы максимально возможные в данном случае собственные числа Ах, Х2 и А3. Система, построенная на их основе, аккумулирует более 36% инерции.
2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 16 x 16 (Burt Table)
B:B1
:
j » j W:W2 N N1 j
:
C:C3 B:B2 CNCN3 S:S3
0 i
C:W?\ A/1
W:W3
B:B3 i N: N2 •j
S:S2
• :
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Dimension 1; Eigenvalue: ,29460 (13,39% of Inertia)
Рис. 3. Отображение исходной информации в двумерное пространство, определяемое на основе
Х1 и Х2
2D Plot of Column Coordinates; Dimension: 1 x 3 Input Table (Rows x Columns): 16 x 16 (Burt Table)
1,0
о
£ 0,8 CO (D
о 0,6
C:C3 ■ B:B2 . N S:S2
N2
> B:B1 I ! г ° Г
;;г;т::г W:W2 N:N1 "T~b~b! W:W1
■ W:W3 f .__JL.._ J___I____L_ _J___L_ J___i_.ll.
:—i—|— N:N3 "—1—-- H—:
| ^ | " 1 [
BB3 ~'i r~ S:S —i :
: C:„C1 "Г JLJ_JL
-0,8 -1,0 -1,2
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 Dimension 1; Eigenvalue: ,29460 (13,39% of Inertia)
Рис. 4. Отображение исходной информации в двумерное пространство, определяемое на основе Х1 и Х3
2D Plot of Column Coordinates; Dimension: 2 x 3 Input Table (Rows x Columns): 16 x 16 (Burt Table)
S:S2 ' ! " i C:C3 BnB2 1 I I ...j 1 L.._ 1 I
. |----1 N: N2 . ..Д C:C2 S:S1 _KB1„
■ B:B4:W3 ■ hf-H" ■ W:W1 ""I---1"--1~ N:N3 -h-f-f-
■ r-i BB "1 "1 Г" .... 1 - 1 - t ~f~
: _J S:S3 C: C1 i i i
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 Dimension 2; Eigenvalue: ,26245 (11,93% of Inertia)
Рис. 5. Отображение исходной информации в двумерное пространство, определяемое на основе I2 и
-0,2
-1,0
-1,2
-0,2
-0,4
-0,6
-1,2
3D Plot of Column Coordinates; Dimension: 1 x 2 x 3 Input Table (Rows x Columns): 16 x 16 (Burt Table)
Рис. 6. Отображение исходной информации в трехмерное пространство, определяемое на основе Аь А2 и А3
Таблица 14
Оценка состава групп, объединяющих близкие по свойствам категории организационно-производственных признаков
На рис. 6 уже более четко разделяются обозначенные ранее сгустки точек, которые характеризуют сходство отдельных категорий (проявляется общность интересов, коллективная ответственность , обобщенный уровень качества работы, потенциальные, моральные, интеллектуальные возможности и т.п.), объединяемых в однородные по свойствам не пересекаемые классы. Обобщение результатов по анализу соответствий и выявлению принадлежности категорированных
данных к определенным однородным по свойст-вам группам сведены в табл. 14.
Резюме по многомерному анализу соответствии. Сгустки точек, самопроизвольно объединяемых в не пересекаемые классы, позволяют констатировать их схожесть, однородность присущих им свойств. В этом случае поиск меры связи уже тесно связанных категорий становится излишним.
Результаты, полученные с помощью многомерного анализа соответствий (см. рис.6 и табл. 14), выявляют следующее:
• В условиях сменно-бригадной формы орга-низации труда сформировались практически устойчивые 3 группы, связывающие категории признаков результативности труда (характеристики количества и качества выпускаемой продукции):
1. В смену С1 (ночную) превалирует максимальный уровень выпуска W3 продукции с максимальным уровнем нековдиционной N3 и в большинстве случаев с максимальным уровнем брака Б3, что наблюдается в основном в бригаде В3 (иногда в В2).
2. В смену С2 (дневную) превалирует минимальный W1 уровень выпуска продукции (изредка W3) и в основном со средними уровнями брака Б2 и некондиционной продукции N2, что наблюдается в бригаде В4 (и очень редко в В1 и В2).
3. В смену С3 в основном наблюдается толь -ко средний уровень выпуска продукции W2 и низкие уровни брака Б1 (изредка Б2 и Б3) и нековдиционной продукции N1 (изредка N2), что сопутствует только бригадам В1 и чуть реже В2.
• Обнаружены значимые изменения в структу-ре качества труда бригад при переходе с ночной смены через дневную на вечернюю смену работы. В частности, наблюдается «перелом » (снижение - рост) по уровням выпуска продукции, при этом выпуск нековдиционной и отбракованной продукции монотонно снижается.
• Для визуального анализа результатов - достигаемых уровней выпуска продукции (W1, W2, W3), а также характеристик качества выпускаемой продукции (нековдиционной N1, N2, N3 и брака Б1, Б2, Б3) по бригадам (В1, В2, В3, В4) в разные смены (С1, С2, С3) целесообразно использовать координатное пространство меньшей размерности, чем наблюдаемое многомерное пространство. При этом для уточнения выявляемых связей нелишне будет представление отображенной инфор-
Группа Вариант формирования Размерность Выявляемыйсостав группы
Ai, 1x2 C1,C3 B2,B3 W3 N3
& СП Ai, Аз 1x3 C1 B3 W3 S3 N3
CD 1= Л-2, Аз 2x3 C1 B3 S3 N3
Ai, А2, A3 1x2x3 C1 B3 W3 S3 N3
Ai, А2 1x2 C2 B4 W1 S2 N2
£ Ai, A3 1x3 C2 B4 W1
1— Ш А2, A3 2x3 C2 B4 W1,W3 S2 N2
Ai, A2, A3 1x2x3 C2 B4 W1 S2 N2
Ai, A2 1x2 B1 W2 S1,S3 N1
сс _а Ai, A3 1x3 C3 B1,B2 W2 S1,S2 N1,2
CD 1— A2, A3 2x3 C3 B1,B2 W2 S1 N1
Ai, A2, A3 1x2x3 C3 B1,B2 W2 S1 N1
мации в разных ракурсах, особенно в случаях, когда собственные числа матрицы связей изменяются практически монотонно.
• Для наиболее полного анализа информации, сосредоточенной в матрице Берта, наряду с многомерным анализом соответствий следует выполнять анализ двухвходовых таблиц сопряженности, а также простейших дихотоми-
ческих таблиц, особенно при уточнении на -правления связи при изучении порядковых переменных.
• Многомерный анализ соответствий может служить полезным инструментом для классификации номинальных и порядковых категорий наблюдаемых признаков.
Библиографический список
1. Аптон Г. Анализтаблиц сопряженности / Пер. с англ. и предисл. Ю.П. Адлера. М.: Финансы и статистика, 1982. 143 с.
2. Анализ сопряженности технологических нарушений и состояний аварийности на машинах непрерывной разливки ста -ли / Л.Д. Девятченко, Л.Ш. Тимиргалеева // ВестникМГТУим. Г.И. Носова. 2006. № 3. С. 15-23.
3. БольшевЛ.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с.
4. Боровиков В. БТАИБИСА. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. (+00). СПб.: Питер, 2003. 268 с.
5. Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. М.: Наука, 1984. 320 с.
6. Девятченко Л.Д. Признаки классификации. Введение в дискриминантный анализ: Учеб. пособие. Магнитогорск: МГТУ, 2001. 127 с.
7. Енюков И.С. Методы, алгоритмы, программы многомерного статистического анализа: Пакет ППСА. М.: Финансы и статистика, 1986. 232 с.
8. Кендалл М., Стьюарг А. Статистические выводы и связи. М.: Наука, 1976. 736 с.
9. Прикладная статистика. Классификация и снижение размерности / Айвазян С.А., Бухшгабер В.М., Енюков Н.С., Мешал-кинЛ.Д. М.: Финансы и статистика, 1989. 606 с.
УДК 658.562:621.771
Румянцев М.И., Шубин И.Г., Завалищин А.Н., Корнилов В.Л., Буданов А.П., Цепкин A.C., Пантелеева H.A.
оценивание качества тонких горячекатаных полос
для определения возможности замещения
_ _ _ Ä
холоднокатаной листовои стали общего назначения
В настоящее время в мировой практике стала реальностью и продолжает усиливаться тевденция к производству тонких горячекатаных полос, часть из которых является самостоятельной товарной продукцией, а часть используется для замещения холоднокатаного металла. В типичном сортаменте холоднокатаной конструкционной стали более 30% составляют полосы толщиной 1,2-2,5 мм и выше (рис. 1, б). При этом в сортаменте широкополосных станов горячей прокатки (ШСГП) доля полос толщиной 1,2-3,0 мм составляет около 58% (рис. 1, а). В качестве предпосылок указанной тевденции можно отметить повышение оперативности выполнения заказов и снижение издержек производства [1-3].
По нашему мнению [4], наиболее перспективным является применение тонких горячекатаных полос для замешрния холоднокатаного листового
* В работе принимали участие студентки Оплачко Т.В., Питр енина М А.
проката общего назначения. Анализ портфеля заказов ЛПЦ-5 ОАО «ММК» показал, что около 20% составляют холоднокатаные полосы толщиной 1,23,0 мм, поставляемые по ГОСТ 16523 с качеством отделки поверхности групп 2 и 3. При этом доля полос толщиной 1,5-1,8 мм составляет около 35% от этого количества (или около 7% от годового объема производства цеха), а полос толщиной 2,03,0 мм - примерно 50% (около 9% от годового производства) (рис. 2, а). До 80% металла в рассматриваемой сортаменгной группе поставляется со свойствами категории вытяжки Г и около 16% - со свойствами категории вытяжки Н (рис. 2, б).
Для повышения объективности и достоверности оценок соответствия качества горячекатаных полос требованиям к холоднокатаному прокату разработали дифференциальные оценки единичных показателей качества, унифицированные с широко используемыми в системах менеджмента качества ивдексами процесса [5]: