Научная статья на тему 'ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ПРИ ИССЛЕДОВАНИИ ПРОДУКТИВНЫХ ПОКАЗАТЕЛЕЙ У ОВЕЦ'

ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ПРИ ИССЛЕДОВАНИИ ПРОДУКТИВНЫХ ПОКАЗАТЕЛЕЙ У ОВЕЦ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
76
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТОРНЫЙ АНАЛИЗ / ФАКТОРНАЯ НАГРУЗКА / МАТРИЦА СЧЕТОВ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Катков К.А., Скорых Л.Н.

Современные биометрические измерения, проводимые в области животноводства в процессе научных исследований, селекционной работы, обладают достаточно большой размерностью. Одновременный анализ большого количества взаимосвязанных величин представляет довольно сложную задачу. При этом стоит учитывать, что исходные измерения имеют различную размерность, а также могут значительно различаться по уровню дисперсии значений. В этой связи актуальной является задача анализа структуры связей между измеряемыми биометрическими параметрами животных. Для решения этой задачи используется метод факторного анализа, позволяющий сократить размерность исходного вектора измерений и перейти к новым переменным (факторам), корреляция между которыми равна нулю. Полученные факторы позволяют объединить между собой исходные параметры по принципу наибольшей корреляции. В представленной статье с помощью факторного анализа исследуются биометрические данные, полученные для выборки животных в количестве 40 голов. Подробно проведена интерпретация результатов факторного анализа. Исследованы абсолютные значения матрицы факторных нагрузок. На основании данного исследования выделены латентные факторы, объединяющие в себе несколько исходных параметров, имеющих максимальную корреляцию. Определены уникальные параметры, не входящие ни в один из выделенных факторов. Также проведен анализ полученной матрицы счетов. На основании анализа определены животные с максимальными и минимальными значениями выделенных факторов. При подготовке статьи и проведении расчетов использовались такие средства компьютерной математики, как табличный процессор MS Excel, математические пакеты Matlab и SPSS Statistics.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF FACTOR ANALYSIS IN THE STUDY OF PRODUCTIVE CHARACTERISTICS IN SHEEP

Modern biometric measurements which are carried out in animal husbandry in the process of scientific research, breeding work have rather high dimensionality. Simultaneous analysis of a large number of interrelated quantities is quite a difficult task. At the same time, it is worth considering that the initial measurements have different dimensionality, and can also vary significantly in variance of values. In this regard, the task of analyzing the structure of connections between the measured biometric parameters of animals is relevant. In order to solve this problem, the technique of factor analysis is used. This technique allows you to reduce the dimension of the original measurement vector and move to new variables (factors), the correlation between which is zero. The obtained factors make it possible to combine the initial parameters according to the principle of the highest correlation. In the presented article, biometric data, which are obtained for an animal sample in the amount of 40 head, are examined using factor analysis. The interpretation of the factor analysis results is carried out in detail. The absolute values of the factor loadings matrix are examined. Based on this study, latent factors have been identified that combine several initial parameters with maximum correlation. Unique parameters that are not included in any of the selected factors are determined. Furthermore, the analysis of the resulting scores is carried out. Based on this analysis, animals with the maximum and minimum level of the selected factors are determined. During the preparation of the article and performing calculations, computer mathematical tools such as the MS Excel spreadsheet, Matlab and SPSS Statistics mathematical software packages were used.

Текст научной работы на тему «ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ПРИ ИССЛЕДОВАНИИ ПРОДУКТИВНЫХ ПОКАЗАТЕЛЕЙ У ОВЕЦ»

DOI 10.25930/2687-1254/006.4.14.2021 УДК 636.3.033 / 004.021

ПРИМЕНЕНИЕ ФАКТОРНОГО АНАЛИЗА ПРИ ИССЛЕДОВАНИИ ПРОДУКТИВНЫХ ПОКАЗАТЕЛЕЙ У ОВЕЦ

К.А. Катков, Л.Н. Скорых

Современные биометрические измерения, проводимые в области животноводства в процессе научных исследований, селекционной работы, обладают достаточно большой размерностью. Одновременный анализ большого количества взаимосвязанных величин представляет довольно сложную задачу. При этом стоит учитывать, что исходные измерения имеют различную размерность, а также могут значительно различаться по уровню дисперсии значений. В этой связи актуальной является задача анализа структуры связей между измеряемыми биометрическими параметрами животных. Для решения этой задачи используется метод факторного анализа, позволяющий сократить размерность исходного вектора измерений и перейти к новым переменным (факторам), корреляция между которыми равна нулю. Полученные факторы позволяют объединить между собой исходные параметры по принципу наибольшей корреляции. В представленной статье с помощью факторного анализа исследуются биометрические данные, полученные для выборки животных в количестве 40 голов. Подробно проведена интерпретация результатов факторного анализа. Исследованы абсолютные значения матрицы факторных нагрузок. На основании данного исследования выделены латентные факторы, объединяющие в себе несколько исходных параметров, имеющих максимальную корреляцию. Определены уникальные параметры, не входящие ни в один из выделенных факторов. Также проведен анализ полученной матрицы счетов. На основании анализа определены животные с максимальными и минимальными значениями выделенных факторов. При подготовке статьи и проведении расчетов использовались такие средства компьютерной математики, как табличный процессор MS Excel, математические пакеты Matlab и SPSS Statistics.

Ключевые слова: факторный анализ, факторная нагрузка, матрица счетов.

APPLICATION OF FACTOR ANALYSIS IN THE STUDY OF PRODUCTIVE

CHARACTERISTICS IN SHEEP

K.A. Katkov, L. N. Skorykh

Modern biometric measurements which are carried out in animal husbandry in the process of scientific research, breeding work have rather high dimensionality. Simultaneous analysis of a large number of interrelated quantities is quite a difficult task. At the same time, it is worth considering that the initial measurements have different dimensionality, and can also vary significantly in variance of values. In this regard, the task of analyzing the structure of connections between the measured biometric parameters of animals is relevant. In order to solve this problem, the technique of factor analysis is used. This technique allows you to reduce the dimension of the original measurement vector and move to new variables (factors), the correlation between which is zero. The obtained factors make it possible to combine the initial parameters according to the principle of the highest correlation. In the presented article,

biometric data, which are obtained for an animal sample in the amount of 40 head, are examined using factor analysis. The interpretation of the factor analysis results is carried out in detail. The absolute values of the factor loadings matrix are examined. Based on this study, latent factors have been identified that combine several initial parameters with maximum correlation. Unique parameters that are not included in any of the selected factors are determined. Furthermore, the analysis of the resulting scores is carried out. Based on this analysis, animals with the maximum and minimum level of the selected factors are determined. During the preparation of the article and performing calculations, computer mathematical tools such as the MS Excel spreadsheet, Matlab and SPSS Statistics mathematical software packages were used.

Key words: factor analysis, factor loading, scores.

Актуальность работы. Овцеводство является важной отраслью мирового продуктивного животноводства. Основное преимущество данной отрасли состоит в том, что овцы способны наиболее продуктивно использовать природные кормовые угодья, обеспечивая товарное производство разнообразной продукцией [1-4]. Однако в области животноводства при проведении исследований приходится иметь дело с достаточно большим объемом измеряемых параметров, к которым относятся в том числе и фено-типические признаки. В настоящее время существует ряд методов, позволяющих провести комплексную оценку одновременно по нескольким параметрам [5-8]. При этом все методы имеют один существенный недостаток - ограничение размерности вектора исходных параметров. Для получения наиболее полной картины, характеризующей животное, все измеренные параметры необходимо проанализировать. Одним из методов исследования эмпирических данных является факторный анализ [9-10].

Очевидно, что все измерения, полученные в процессе сбора биометрических данных, в той или иной степени зависимы между собой. Можно предположить, что существуют какие-то скрытые факторы, которые будут объединять в себе высокие коррелятивные связи между признаками. Задача факторного анализа состоит в существенном сокращении размерности исходного вектора измерений, а также в выделении латентных факторов, объединяющих в себе наиболее ярко выраженную корреляционную взаимосвязь между признаками. Другими словами, основная цель факторного анализа -определение структуры связи исходных параметров. При факторном анализе происходит переход к новым переменным, называемым главными факторами, которые будут независимыми друг от друга.

Возможно, такой подход позволит исследователю «измерить не измеримое», то есть для каждого выявленного фактора получают числовое значение, которое позволяет характеризовать животное отдельно по нескольким исходным параметрам.

Цель данной статьи - анализ возможности использования факторного анализа при исследовании фенотипических признаков на примере овец.

Постановка задачи. Имеется выборка из n количества животных, в нашем случае овец. Имеются измерения m параметров, проведенные для каждого животного. Требуется провести факторный анализ, выявить латентные факторы, объединяющие в себе исходные параметры, определить уникальные параметры, интерпретировать результаты.

Условия, материалы и методы. Для решения поставленной задачи используются следующие средства компьютерной математики: табличный процессор MS Excel, математические пакеты Matlab и SPSS Statistics. Исходные данные готовятся в таблич-

ном процессоре MS Excel, а затем экспортируются в математические пакеты Matlab и SPSS, обладающие встроенными функциями, позволяющими провести факторный анализ и визуализировать результаты [11, 12].

Результаты. В качестве примера проведения факторного анализа воспользуемся выборкой, состоящей из 40 голов ярок, полученных в результате скрещивания овцематок породы советский меринос с баранами пород австралийский меринос и австралийский мясной меринос. Набор исходных измеряемых параметров приведен в табли-це1. В таблице 1 параметр «Тонина шерсти» представлен как величина, обратная собственно тонине (1/мкм). Это сделано для удобства интерпретации результатов факторного анализа.

Сначала необходимо проанализировать корреляционную матрицу исходных параметров. Ее визуализация представлена на рисунке 1.

Таблица 1 - Набор исходных измеряемых параметров

№ параметра Измеряемый параметр Единица измерения Среднее значение параметра

1 Живая масса кг 41,870±0,725

2 Высота в холке см 61,963±0,660

3 Высота в крестце см 64,330±0,588

4 Косая длина туловища см 65,375±0,539

5 Обхват груди см 88,550±0,613

6 Глубина груди см 32,600±0,272

7 Ширина груди см 23,600±0,231

8 Обхват пясти см 9,263±0,103

9 Масса немытой шерсти кг 5,038±0,106

10 Масса чистой шерсти кг 3,013±0,065

11 Выход чистой шерсти % 59,025±0,264

12 Тонина шерсти 1/мкм 0,0539±0,001

13 Длина шерсти см 9,575±0,109

Correlation matrix

2 4 6 8 10 12

Parameter number

Рисунок 1. Визуализация корреляционной матрицы

Анализ данных, представленных на рисунке 1, показывает, что ряд параметров обладает достаточно сильной взаимной корреляцией. На этом основании можно предположить, что существует некоторое число факторов, позволяющих объединить данные параметры.

Теперь необходимо определить число главных факторов, которые необходимо оставить. Удобнее всего это сделать в математическом пакете SPSS Statistics. Для определения числа выделяемых главных факторов воспользуемся критерием Кайзера, а также критерий «каменистой осыпи» (рисунок 2). Оба эти критерия предлагают оставить четыре главных фактора. Проверка адекватности такого выбора по методу Кайзера - Майера - Олкина (КМО) дает значение 0,84. Обычно считается, что если значение КМО больше 0,5, то модель с выделенным количество главных факторов является адекватной. В нашем случае значение КМО говорит о том, что четыре главных фактора вполне удовлетворительно опишут представленную выборку.

График собственных значений

1 2 3 4 5 6 7 8 9 10 11 12 13 Номер фактора

Рисунок 2. График собственных значений, иллюстрирующий критерий «каменистой осыпи»

Запустив процедуру факторного анализа, получим вектор точечных оценок остаточных дисперсий исходных параметров при использовании факторного анализа (¥). Чем меньше значение остаточной дисперсии, тем лучше исходный параметр описывается применяемой факторной моделью. Остаточная дисперсия варьируется в диапазоне от 0 до 1. Исходные параметры, у которых остаточная дисперсия близка к единице, называются уникальными. Их рекомендуется не включать в факторный анализ, а оставить «так, как есть».

В таблице 2 представлены значения остаточной дисперсии для исследуемого набора исходных параметров при оставлении четырех главных факторов. Анализ данных, представленных в этой таблице, показывает: 11 из 13 исходных параметров достаточно хорошо будут описаны факторной моделью из четырех главных факторов. В то же время параметр «Тонина шерсти» имеет значение ¥ = 0,784, а параметр «Длина шерсти» - ¥ = 0,7308. Выявленная закономерность свидетельствует о достаточно высокой степени уникальности этих параметров. Следовательно, при интерпретации результатов нужно с осторожностью относится к распределению параметров к тому или иному фактору. Возможно, что их вообще придется исключить из анализа.

Таблица 2 - Набор исходных измеряемых параметров

№ параметра Измеряемый параметр Остаточная дисперсия ¥

1 Живая масса 0,0857

2 Высота в холке 0,0226

3 Высота в крестце 0,0050

4 Косая длина туловища 0,1649

5 Обхват груди 0,1984

6 Глубина груди 0,1296

7 Ширина груди 0,2292

8 Обхват пясти 0,4373

9 Масса немытой шерсти 0,1275

10 Масса чистой шерсти 0,0393

11 Выход чистой шерсти 0,2284

12 Тонина шерсти 0,7840

13 Длина шерсти 0,7308

При проведении факторного анализа использовалось вращение Varimax, сохраняющее ортогональность при повороте осей факторов. Визуализация абсолютных значений факторных нагрузок представлена на рисунке 3.

Данные, представленные на рисунке 3, показывают, как распределились исходные параметры по выделенным главным факторам.

Фактор № 1 - параметры: «Высота в холке» (№ 2), «Высота в крестце» (№ 3), «Косая длина туловища» (№ 4). Этому фактору можно дать название «Рослость».

Фактор № 2 - параметры: «Живая масса» (№ 1), «Обхват пясти» (№ 8), «Масса немытой шерсти» (№ 9), «Масса чистой шерсти» (№ 10).

Фактор № 3 - параметры: «Обхват груди» (№ 5), «Глубина груди» (№ 6), «Ширина груди» (№ 7). Этот фактор можно назвать «Развитие грудной клетки».

Фактор № 4 - параметры: «Выход чистой шерсти» (№ 11), возможно «Длина шерсти» (№ 13).

Load matrix

12 3 4

Factors

Рисунок 3. Визуализация абсолютных значений факторных нагрузок

Как было указано выше, параметры с номерами 12 и 13 являются уникальными и отнесение их к тому или иному фактору может быть сомнительным. Таким образом, вместо 13 исходных измеренных параметров выявлены четыре главных фактора и два уникальных параметра.

Теперь есть возможность проанализировать полученную в результате факторного анализа матрицу счетов. Эта матрица позволяет определить животных с высокими и с низкими значениями выявленных главных факторов. Визуализация этой матрицы представлена на рисунке 4.

Е

с

12 3 4

Factors

Рисунок 4. Визуализация матрицы счетов

Данные, показанные на рисунке 4, свидетельствуют о том, что наивысшие значения фактора № 1 будут у животных с номерами 8, 23, 26, 30, 36, 40. Можно предположить, что эти животные - наиболее высокорослые. Низкие значения первого фактора имеют животные с номерами 1, 4, 9, 12, 31, 39.

Для фактора № 2 можно отметить, что здесь наивысшие значения имеют животные с номерами 15, 20, 25, имеющие высокую живую массы и высокие значения настрига шерсти. Минимальные значения этого фактора наблюдаются у животных с номерами 21, 22, 24, 27, 28, 35.

Более развитой грудной клеткой (фактор № 3) характеризуются животные с номерами 5, 13, 17, 18, 26, 39, низкие значения этого фактора - у животных с номерами 8, 10, 15, 34.

Лидерами по выходу чистой шерсти (фактор № 4) являются животные с номерами 11, 12, 14-20.

Заключение. Факторный анализ - мощное средство, позволяющее определить структуру связи между измеряемыми исходными параметрами. Также с помощью такого вида анализа можно выделить скрытые латентные факторы и сократить размерность исходного вектора измерений. Следует отметить, что для успешного факторного анализа необходимо соблюдать ряд требований:

1. Исходная выборка измерений должна не иметь аномальных измерений.

2. Количество животных в анализируемой выборке должно быть, как минимум, в два раза больше, чем число исходных измеряемых параметров.

3. Выявленные уникальные измерения должны с аккуратностью интерпретироваться исследователем. Как правило, их лучше исключить из факторного анализа.

Можно предположить, что выделенные в ходе факторного анализа главные факторы позволят уточнить стратегию селекционной работы.

Литература

1. Скорых Л.Н., Вольный Д.Н., Абонеев Д.В. Рост и развитие молодняка овец, полученных в результате промышленного скрещивания // Зоотехния. 2009. № 11. С. 26-28.

2. Пелиховская Т.Н., Омаров А.А., Скорых Л.Н. Влияние аэроионизации на качество шерсти овец // Овцы, козы, шерстяное дело. - 2011. № 1. С. 41-43.

3. Погодаев В.А., Арилов А.Н., Сергеева Н В. Биохимические показатели крови баранчиков породы дорпер в период адаптации к природно-климатическим условиям // Известия Санкт-Петербургского государственного аграрного университета. 2017. № 1 (46). С.112-116.

4. Рост и экстерьерные особенности баранчиков породы дорпер в период адаптации в условиях Республики Калмыкия / А.Н. Арилов, В.А. Погодаев, Б.К. Адучиев, Н В.Сергеева // Зоотехния. 2017. № 03. С.28-32.

5. Два подхода к формированию селекционных индексов в овцеводстве / К.А. Катков, Л.Н. Скорых, П.С. Остапчук, С.А. Емельянов, А.В. Паштецкая // Вестник АПК Ставрополья. 2019. № 2 (34). С. 8-14.

6. Михальский А.И., Новосельцева Ж.А. Методы компьютерного анализа данных в задачах по мониторингу и совершенствованию управления стадом // Проблемы биологии продуктивных животных. 2019. № 1. С. 95-111.

7. Михайлов Н.В., Кабанов В.Д., Каратунов Г.А. Селекционно-генетические аспекты оценки наследственных качеств животных. Новочеркасск: ДонГАУ, 1996. 63 с.

8. Катков К.А., Омаров А.А. Использование метода обобщенного показателя качества при оценке мелкого рогатого скота // Вестник аграрной науки. 2020. № 4 (85). С. 56-65.

9. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. — М.: Мир, 1982. 488 с.

10. Факторный анализ в SPSS. Практика. URL: https://ru.coursera.org/lecture/trendy-klassifikatsii/3-6-faktornyi-analiz-v-spss-praktika-RSkAV. (дата обращения 27.08.2021).

11. Порядок выполнения факторного анализа // Техническая библиотека lib.qrz.ru. URL: https://lib.qrz.ru/node/11396 (дата обращения 27.08.2021).

12. Информационные технологии: учебное пособие / К.А. Катков, И.П. Хвостова, В.И. Лебелев и др. Ставрополь: Изд-во СКФУ, 2014. 254 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

References

1. Skorykh L.N., Volnyi D.N., Aboneev D.V. Growth and development of young sheep which were obtained as a result of industrial crossing // Animal sience. 2009. No. 11. P. 2628.

2. Pelikhovskaya T.N., Omarov A.A., Skorykh L.N. Influence of aeroionization on the quality of sheep wool // Sheep, goats, wool business. - 2011. No.1. P. 41-43.

3. Pogodaev V.A., Arilov A.N., Sergeeva N.V. Biochemical blood parameters of Dorper young rams during the adaptation period to environmental and climatic conditions // Bulletin of the St. Petersburg State Agrarian University. 2017. No. 1 (46). P. 112-116.

4. Growth and exterior features of Dorper young rams during the adaptation period in the

Republic of Kalmykia / A.N. Arilov, V.A. Pogodaev, B.K. Aduchiev, N.V. Sergeeva // Animal sience. 2017. No. 03. P. 28-32.

5. Two approaches to the formation of selection indices in sheep breeding / K.A. Katkov, L.N. Skorykh, P.S. Ostapchuk, S.A. Emelyanov, A.V. Pashtetskaya // Bulletin of the agro-industrial complex of Stavropol. 2019. No. 2 (34). P. 8-14.

6. Mikhalskiy A.I., Novoseltseva Zh.A. Methods of computer analysis of data in monitoring tasks and improving herd management // Problems of productive animals biology. 2019. No.

I. P. 95-111.

7. Mikhailov N.V., Kabanov V.D., Karatunov G.A. Selection and genetic aspects of assessing the inherited traits of animals. Novocherkassk: Don State Agrarian University, 1996. 63 p.

8. Katkov K.A., Omarov A.A. The use of the quality composite index method in assessing small cattle // Bulletin of Agrarian Science. 2020. No. 4 (85). P. 56-65.

9. Afifi A., Eisen S. Statistical analysis: An approach with the use of computers - M.: Mir, 1982. 488 p.

10. 10.Factor analysis in SPSS. Practice. URL: https://ru.coursera.org/lecture/trendy-klassifikatsii/3-6-faktornyi-analiz-v-spss-praktika-RSkAV. (date of access 27/08/2021).

II. The procedure of performing factor analysis // Technical library lib.qrz.ru. URL: https://lib.qrz.ru/node/11396 (date of access 27/08/2021).

12. Information technologies: learning guide / K.A. Katkov, I.P. Khvostova, V.I. Lebelev et al. Stavropol: Publishing House of NCFU, 2014.254 p.

Катков Константин Александрович, кандидат технических наук, доцент, ведущий научный сотрудник ФГБНУ «Северо-Кавказский ФНАЦ», 355000 г. Ставрополь, пер. Зоотехнический,15, тел. 89188619802, E-mail:kkatkoff@mail.ru

Скорых Лариса Николаевна, доктор биологических наук, доцент, главный научный сотрудник отдела овцеводства и козоводства ФГБНУ «Северо-Кавказский федеральный научный аграрный центр», 355017, г. Ставрополь, пер. Зоотехнический, 15, 8(8652)71-81-55, е-mail: smu.sniizhk@yandex.ru

Katkov Konstantin Aleksandrovich, Candidate of Technical Sciences, Associate Professor, Leading Researcher of FSBSI "North Caucasus FARC", 355017 Stavropol, Zootekhnicheskii Ln., 15, tel. 89188619802, E-mail:kkatkoff@mail.ru

Skorykh Larisa Nikolaevna, Doctor of Biological Sciences, Associate Professor, Chief Researcher of the Sheep and Goat Breeding Department, FSBSI "North Caucasus FARC", 355017 Stavropol, Zootekhnicheskii Ln., 15, tel. 8 (8652) 71-81-55, e-mail: smu.sniizhk@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.