Многомерная идентификация плюсовых деревьев сосны обыкновенной (Ртив ву!уввМв L.) в кластерном анализе по параметрам шишек
В.П. Бессчётнов, д.б.н., профессор,
Н.Н. Бессчётнова, к.с-х.н., Нижегородская ГСХА
Проблема формирования оптимального ассортимента объектов постоянной лесосеменной базы (ПЛСБ) и единого генетико-селекционного комплекса (ЕГСК) рассматривается как одна из сложных в современной лесной селекции [1—4]. Для решения связанных с ней задач требуется многосторонняя оценка многочисленных клонов, входящих в их состав [4—6]. Существующая система массового отбора плюсовых деревьев по фенотипу может быть в значительной мере усовершенствована посредством расширения перечня признаков, используемых в качестве селекционных критериев и маркеров, и совершенствования методов и средств их исследования и многостороннего тестирования [1—3, 5]. Такой подход к оценке результатов селекции требует активного привлечения методов многомерного комплексного анализа биологических объектов [7—10]. Важными характеристиками лесосеменных плантаций (ЛСП) признаны показатели репродуктивной активности составляющих их плюсовых деревьев [3—5]. Рассмотрению обозначенных вопросов посвящено немало работ отечественных специалистов [1—5]. На территории Нижегородской области дислоцировано большое число ЛСП первого порядка и повышенной генетической ценности, архивов клонов, испытательных и географических культур важнейших древесных пород, однако указанных сведений о них ещё недостаточно [6, 7].
Объекты и методы. В соответствии с этим на кафедре лесных культур Нижегородской государственной сельскохозяйственной академии предпринято изучение объектов ПЛСБ, развёрнутых в регионе, и выполнены многомерные сравнения элементов их ассортимента. Тестировались одновозрастные клоны плюсовых деревьев сосны обыкновенной (Ртыэ нуЬенМн Ь.). С них одновременно собирали нормально развитые неповреждённые шишки, у которых фиксировали длину, боковое наклонное расстояние от вершины до плоскости максимального диаметра, максимальный диаметр и массу. Параметры были пронумерованы от одного до четырёх соответственно. Используя данные непосредственных учётов, дополнительно устанавливали значения одиннадцати производных показателей, которым были присвоены литеры от 5 до 15.
Факторный анализ [9, 11], выполненный по указанным морфометрическим параметрам шишек с использованием программного обеспечения 8ТЛТ18Т1СА у.6.0, позволил добиться обоснованной редукции числа независимых переменных многомерного статистического комплекса с группировкой их по трём главным компонентам (табл. 1).
Исходные признаки отнесены к трём комплексным факторам вполне логично. К первой компоненте причислены признаки прямого учёта параметров шишек (массы и максимального диаметра), а также оценки объёмов геометрических тел, вписанных в контуры шишки. Вторая компонента объединила характеристики, влияющие на длину шишки (длина от вершины до основания и боковое расстояние от вершины до плоскости максимального диаметра), а также оценки их отношения к максимальному диаметру. Третью компоненту составили относительные признаки, связанные с формой шишки, а также удельный показатель плотности. В указанных случаях нагрузки фактора превышают принятый минимум собственных значений, равный единице. Обоснованность такой редукции числа эффективных факторов подтверждена большой долей общей дисперсии, приходящейся на полученные в ходе факторного анализа три главные компоненты (95,269%), что заметно выше критического 70-процентного порога [9]. Они сформировали собственный блок многомерных характеристик сравниваемых объектов, представленных нормированными величинами. Последние служили основой проведения кластерного анализа [8, 9, 12], процедура которого представлена в таблице 2 и на дендрограммах.
Результаты исследований. В таблице 2 отражена последовательность этапов объединения плюсовых деревьев в кластеры, соответствующая этому величина евклидовой дистанции и адекватное ей значение расстояния, выраженное в масштабных единицах 25-разрядной шкалы, принятой для графического представления дендрограмм.
На графике древовидной гистограммы, построенной по результатам преобразования в ходе факторного анализа 15 исходных независимых характеристик шишек в три главные компоненты (рис. 1), удаётся заметить ряд хорошо оформленных группировок — кластеров, составляющих иерархическую систему. Большая часть плюсовых деревьев объединяется на уровне 13,5 масштабных единиц в крупный макрокластер,
1. Матрица повёрнутых компонент исходных значений параметров шишек
Признаки шишек Компоненты
№ название 1 2 3
1. Длина от вершины до основания 0,7169
2. Боковое расстояние до линии максимального диаметра 0,7639
3. Максимальный диаметр 0,9590
4. Масса 0,9116
5. Осевое расстояние до линии максимального диаметра 0,8028
6. Отношение длины к максимальному диаметру 0,9773
7. Отношение осевого расстояния к диаметру 0,9935
8. Заострённость формы 0,9460
9. Выпуклость основания 0,9058
10 Высота основания 0,7356
11. Отношение высоты основания к осевому расстоянию 0,7277
12. Объём конуса 0,9581
13. Объём сегмента 0,6965
14. Суммарный объём конуса и сегмента 0,7791
15. Плотность - отношение массы к суммарному объёму -0,6745
Начальные собственные значения компонент 8,3948 3,6822 2,2135
Доля дисперсии компонент, % 55,965 24,547 14,757
Общая доля дисперсии главных компонент, % 95,2689803
2. Схема осуществления кластеризации 36 плюсовых деревьев (три главные компоненты)
с использованием квадрата евклидова расстояния
Шаги агломерации Коэффициенты Этапы появления первого кластера Следующий этап
Этап объединение кластеров дистанция примыкания единицы масштаба
кластер 1 кластер 2 кластер 1 кластер 2
1 5 34 0,08950 0,2 0 0 8
2 1 36 0,08989 0,2 0 0 9
3 22 29 0,14657 0,3 0 0 13
4 21 30 0,15308 0,3 0 0 9
5 2 16 0,15518 0,3 0 0 15
6 4 31 0,19235 0,4 0 0 10
7 6 15 0,31548 0,6 0 0 11
8 5 13 0,33206 0,7 1 0 10
9 1 21 0,37598 0,8 2 4 24
10 4 5 0,45876 0,9 6 8 20
11 6 28 0,54543 1,1 7 0 21
12 17 20 0,75030 1,5 0 0 25
13 22 33 0,78387 1,6 3 0 24
14 8 12 0,80479 1,6 0 0 25
15 2 7 0,84687 1,7 5 0 22
16 3 32 0,89763 1,8 0 0 23
17 14 25 0,90450 1,8 0 0 23
18 10 19 0,94955 1,9 0 0 22
19 11 24 1,28150 2,6 0 0 31
20 4 18 1,42531 2,9 10 0 21
21 4 6 1,77313 3,6 20 11 26
22 2 10 2,10485 4,3 15 18 27
23 3 14 2,10834 4,3 16 17 29
24 1 22 2,16375 4,4 9 13 28
25 8 17 2,33451 4,7 14 12 27
26 4 35 2,65664 5,4 21 0 28
27 2 8 3,40658 6,9 22 25 32
28 1 4 3,44856 7,0 24 26 32
29 3 27 3,48456 7,1 23 0 31
30 23 26 3,84024 7,8 0 0 34
31 3 11 4,39977 8,9 29 19 33
32 1 2 5,90652 12,0 28 27 33
33 1 3 6,65998 13,5 32 31 34
34 1 23 11,00948 22,4 33 30 35
35 1 9 12,31238 25,0 34 0 0
Клон №
К-17 5
К-206 34
К-38 13
К-14 4
К-172 31
К-45 18
К-18 6
К-40 15
К-109 28
К-210 35
К-3 1
К-215 36
К-95 21
К-170 30
К-96 22
К-121 29
К-199 33
К-5 2
К-41 16
К-19 7
К-22 10
К-47 19
К-44 17
К-49 20
К-20 8
К-30 12
К-29 И
К-99 24
К-6 3
К-173 32
К-39 14
К-101 25
К-108 27
К-98 23
К-106 26
К-21 9
10 12 _1___________1_
14 16
_1__________1_
18
_1_
Дистанция присоединения
20 22 24
_|--------1-------|_*
1Н
1Ь
Р
1Н
Рис. 1 - Дендрограмма сходства плюсовых деревьев, построенная по трём главным компонентам параметров шишек (2009 г.)
содержащий в своём составе ряд группировок меньшего порядка. В нем отчётливо выделяется кластер с объектами К-17, К-206, К-38, К-14, К-172, К-45, К-18, К-40, К-109, К-210, порог агломерации которых 5,4 ед. Это заметно ниже рубежа его последующего слияния с другими (7,0 ед.). Следующий кластер (К-3, К-215, К-95, К-170, К-96, К-121, К-199) возник на уровне 4,4 ед. Третий кластер (К-5, К-41, К-19, К-22, К-47, К-44, К-49, К-20, К-30) сравнительно симметричен, образован на уровне 6,9 ед., имеет численность и плотность структуры, соответствующие первым двум, с которыми он объединяется на уровне 12,0 ед.
Четвёртый кластер (К-29, К-99, К-6, К-173, К-39, К-101, К-108) меньше по численности и плотности (дистанция различий составляет 7,1 ед.). Остальные плюсовые деревья (К-98, К-106, К-21) контрастно отличаются от перечисленных выше и входят в иерархическую систему на уровнях 22,4 и 25,0 ед. При этом деревья с индексами
К-98 и К-106 предварительно объединяются в сравнительно неплотную пару. Дендрограмма, созданная по главным компонентам, принципиально не отличается от графических фигур, полученных на основе всего массива исходных признаков (рис. 2).
Таким образом, состав анализируемых плюсовых деревьев, размещённых на ЛСП № 24 государственного бюджетного учреждения Нижегородской области «Семёновский спецсемлесхоз», был дифференцирован по принципу «наиболее сходные — наиболее различающиеся» и представлен их группировками, в той или иной степени удалёнными друг от друга по установленному перечню признаков. Аналогичные материалы были получены и на других объектах исследования. Повторение опытов в разные годы подтвердило устойчивость наблюдаемых тенденций.
Заключение. Информация о степени комплексной близости объектов позволяет обосновать формирование состава родительских
0
4
№
1
36
30 21
5
34 4
31
13 18 10
19 2
7 16
14
25 З
32 22 29
33 11 24
6 28
15
35 9
23
26
8 12 17
20 27
2 4
J____L
1O
_І_
12
_І_
14 1б J___________І_
18
_І_
2O 22 24
_J-----------1-----------1—
Ьі
Дистанция присоединения
*}
ь-
сходства плюсовых деревьев, построенная по нормированным
O
б
Клон К-3 К-215 К-170 К-95 К-17 К-206 К-14 К-172 К-38 К-45 К-22 К-47 К-5 К-19 К-41 К-39 К-101 К-6 К-173 К-96 К-121 К-199 К-29 К-99 К-18 К-109 К-40 К-210 К-21 К-98 К-106 К-20 К-30 К-44 К-49 К-108
Рис. 2 - Дендрограмма
значениям 15 исходных признаков (2009 г.)
пар и диаллельных комплексов, что важно для планирования и проведения мероприятий по гибридизации. При комплектовании групп из растений, близких по морфологическим характеристикам шишек, в них следует включать плюсовые деревья, которые входят в один кластер. При осуществлении стратегии использования отдалённых по своим признакам родителей целесообразно ориентироваться на их принадлежность к разным кластерам. Это может иметь отношение как к гетерозисной селекции, так и к работам по гибридологическому анализу, необходимому для оценки селекционного качества плюсовых деревьев, отобранных по фенотипу. Контрастность проявления и наследственный характер многопараметрических различий между плюсовыми деревьями сосны обыкновенной по морфологическим признакам шишек предопределяет целесообразность привлечения данных показателей для осуществления многомерной идентификации объектов лесной селекции.
Литература
1. Потылев В.Г. Проблемы лесного селекционного семеноводства // Лесохозяйственная информация. 1997. № 3. С. 14—30.
2. Царев А.П., Лаур Н.В. Вопросы и проблемы плюсовой селекции // Лесной вестник. 2006. № 5. С. 118—123.
3. Сахаров В.И. Методы оценки эколого-генетической структуры популяций древесных видов для выбора модели селекции. Алматы, 2006. 384 с.
4. Рогозин М.В. К вопросу об отборе урожайных деревьев сосны обыкновенной. Известия вузов // Лесной журнал. 1978. № 6. С. 8-11.
5. Ефимов Ю.П. Семенные плантации в селекции и семеноводстве сосны обыкновенной. Воронеж: Истоки, 2010. 253 с.
6. Рутковский И.В. Состояние лесного семеноводства и перспективы его развития // V всероссийский съезд лесоводов (25-27 февраля 2003 г.). М.: ВНИИЛМ, 2003. С. 190-194.
7. Бессчётнова Н.Н. Сосна обыкновенная (Pinus sylvestris L.). Селекционный потенциал плюсовых деревьев. Saarbrucken: LAP LAMBERT Academic Publishing GmbH & co. KG. (ISBN 978-3-8443-5608-3), 2011. 402 c.
8. Булыгин Ю.Е. Комплексная оценка экотипов древесных пород // Лесное хозяйство. 1978. № 12. С. 30-32.
9. Никитин К.Е., Швиденко А.З. Методы и техника обработки лесоводственной информации. М.: Лесная промышленность, 1978. 272 с.
10. Петров С.А. Рекомендации по использованию генетикостатистических методов в селекции лесных пород на продуктивность. Воронеж, 1984.
11. Харман Г. Современный факторный анализ. М.: Статистика, 1972. 488 с.
12. Мандель И.Д. Кластерный анализ. М.: Финансы и статистика, 1988. 176 с.