Научная статья на тему 'Теория ошибок идентификации генотипов отдельных растений по их фенотипам по количественным признакам в расщепляющихся популяциях на ранних этапах селекции'

Теория ошибок идентификации генотипов отдельных растений по их фенотипам по количественным признакам в расщепляющихся популяциях на ранних этапах селекции Текст научной статьи по специальности «Сельское хозяйство, лесное хозяйство, рыбное хозяйство»

CC BY
269
105
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по сельскому хозяйству, лесному хозяйству, рыбному хозяйству, автор научной работы — Кочерина Н. В.

Рассматривается проблема селекционной идентификации лучших генотипов растений по их фенотипам. Представлено обоснование принципа фоновых признаков для эффективной работы селекции. Анализировали теорию ошибок линии регрессии с целью применения в качестве теории ошибок идентификации генотипов растений по их фенотипам. Охарактеризована возможность использования достоверности средних величин для подбора родительских пар при гибридизации. Оценивали эффективность применения принципа фоновых признаков в решении задач идентификации в F2 уникального растения родоначальника будущего сорта.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по сельскому хозяйству, лесному хозяйству, рыбному хозяйству , автор научной работы — Кочерина Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Theory of errors of genotypes identification of individual plants on their phenotypes on quantitative determinants in segregated populations at the early stages of selection

The author considers the problem of selection identification of the best plant genotypes on their phenotypes. The basis of background determinants principle for productive selective work was presented. The theory of errors of regression line with the purpose of use as the theoiy of errors of identification of plant genotypes on their phenotypes was analyzed. The possibility of use of reliability of average for picking out of parent pairs during hybridization was characterized. The efficiency of background determinants principle was estimated for identification in F2 unique plant ancestor of future variety.

Текст научной работы на тему «Теория ошибок идентификации генотипов отдельных растений по их фенотипам по количественным признакам в расщепляющихся популяциях на ранних этапах селекции»

СЕЛЬСКОХОЗЯЙСТВЕННАЯ БИОЛОГИЯ, 2007, № 1

В порядке обсуждения

УДК 633/635:575.1:57.011

ТЕОРИЯ ОШИБОК ИДЕНТИФИКАЦИИ ГЕНОТИПОВ ОТДЕЛЬНЫХ РАСТЕНИЙ ПО ИХ ФЕНОТИПАМ ПО КОЛИЧЕСТВЕННЫМ ПРИЗНАКАМ В РАСЩЕПЛЯЮЩИХСЯ ПОПУЛЯЦИЯХ НА РАННИХ ЭТАПАХ СЕЛЕКЦИИ

Н.В. КОЧЕРИНА

Рассматривается проблема селекционной идентификации лучших генотипов растений по их фенотипам. Представлено обоснование принципа фоновых признаков для эффективной работы селекции. Анализировали теорию ошибок линии регрессии с целью применения в качестве теории ошибок идентификации генотипов растений по их фенотипам. Охарактеризована возможность использования достоверности средних величин для подбора родительских пар при гибридизации. Оценивали эффективность применения принципа фоновых признаков в решении задач идентификации в F2 уникального растения — родоначальника будущего сорта.

До создания принципа фоновых признаков (1, 2) сама возможность разработки методов быстрой оценки (без испытания по потомству) индивидуальных генотипов по их фенотипам по количественным признакам категорически отрицалась на основании утверждений ряда исследователей. Так, Кренке отмечал: «Начиная от первых стадий развития, не существует константно особого феногенетического выражения для модификаций и для наследственных признаков» (3). По мнению Плохинского: «Для одной особи бессмысленно определять, какая часть ее фенотипа обусловлена наследственностью и какая условиями жизни. Генетическая информация, полученная одним индивидуумом, реализуется в таком взаимодействии с условиями жизни, при котором обе причины неотделимы друг от друга» (4). Никоро с соавт. писали: «Для оценки генотипа необходимо знать величину генотипического отклонения данной особи от средней величины популяции (g), однако нет способа отделить gt от е{ — экологического отклонения той же особи» (5). Уильямс утверждал: «В продуктивности одного организма невозможно разделить генетические и внешние воздействия на признаки со слабой наследуемостью и отбор в F2 ненадежен» (6). По Рокицкому, «Фенотип особей — это единый целостный организм. О генотипе особей непосредственно, без анализа их потомства, судить невозможно» (7). По Савченко, «Вычленить непосредственно для каждого организма влияние на развитие признака генотипа и среды не представляется возможным» (8).

Эти положения, возможно, верны, но лишь в том случае, если отслеживать один признак. По данным Драгавцева, если одновременно следить за двумя признаками, то вышеперечисленные постулаты становятся неточными (1, 2). Ауэрбах подчеркивала, что самым важным для генетики был третий закон Менделя — свободного комбинирования аллелей (9). Расщепление по каждой паре аллелей происходит независимо, если гены родительских форм находятся в разных парах хромосом. Этот закон Мендель открыл, как известно, только потому, что одновременно следил за расщеплением двух признаков семян гороха.

Если в любой популяции растений (дикой или F2) найти количественный признак с нулевой (или близкой к нулю) генетической дисперсией, то варьирование этого признака будет только экологическим. Тогда особь, имеющая плюсовое отклонение по этому признаку от средней по- 96

96

пуляционной — есть модификация, попавшая в лучшую микроэкологическую нишу (этот признак был назван фоновым, ФП). Если другой, селекционный, признак (СП) сдвинут у этой особи в плюс-сторону соответственно фоновому, то это — модификация, и отбирать эту особь не следует. Если у другой особи ФП выражен на уровне средней популяционной величины, а СП сдвинут в плюс-сторону, то это — рекомбинация (или мутация), необходимая для продуктивной селекционной работы.

Принцип ФП даже на этом упрощенном способе хорошо работает в системах парных скрещиваний, которые широко применяют в селекции. Для этого достаточно у обеих родительских форм найти одинаковый по среднему уровню количественный признак, формирующийся в те же фазы онтогенеза,

2

что и СП. Дадим определение ФП для случая, когда ст « 0 .

g ФП

Фоновый признак — это такой экологически подвижный признак, который не имеет в конкретных популяциях и среде генотипической изменчивости (или она крайне низка) и положительно экологически коррелирует с СП. Вскоре после создания и испытания принципа ФП было открыто явление разнонаправленности сдвигов количественного признака отдельной особи под влиянием генетических и средовых причин. Это событие практически исключает требование нулевого генетического разнообразия для ФП. Благодаря феномену разнонаправленности ФП появилась возможность оценить генетическую собственную дисперсию, которая не мешает идентификации генетических сдвигов СП, идущих почти в ортогональном направлении (10, 11).

Применительно к отдельной особи явление разнонаправленности сдвигов количественных признаков формулируется следующим образом: существует возможность количественно оценить, в какой мере отклонение признака особи от популяционной средней определяется ее генотипом и в какой — факторами среды (оценка проводится экспрессно без смены поколений). Суть явления разнонаправленности заключается в том, что генетические и средовые отклонения количественных признаков индивидуальных организмов популяции становятся разнонаправленными при рассмотрении их в определенных двумерных системах координат, построенных на основании СП и ФП.

2

Теперь охарактеризуем ФП для случая, когда ст > 0, и иденти-

g ФП

фикацию проводят с учетом разнонаправленности генетических и экологических сдвигов признаков.

Фоновый признак — это такой признак, который чувствителен к N-причинам изменчивости, вызывающим сдвиги СП, кроме одной генетической причины, которая влияет на СП, но к которой ФП либо не чувствителен, либо смещается в противоположном СП направлении.

Рассмотрим модель Фишера-Райта-Лаша, описывающую генетическую организацию количественного признака: ф = и + y + щ, где ф — фенотипическое значение признака у i-й особи популяции, и — средняя величина признака всех особей популяции, yi — генотипическое отклонение от популяционной средней, щі — средовое отклонение от популяционной средней.

Разнонаправленность сдвигов количественного признака индивидуального организма под влиянием генетических и средовых факторов свидетельствует о более сложной структуре организации количественного признака у растений. Это отражено в следующей модели Драгавцева-Дьякова: ф и + yattr i + Yad i + Yimm i + Ymic i + Yef i + Ytol i + Yont i + щ + scom i + 97

97

+Ycom і + лш h где у — генетические, л и є — экологические отклонения признака, которые определяются следующими системами: yattr— «всасывания» (аттракции) продуктов фотосинтеза из стеблей и листьев в колос (корзину); ymic — аттрагированной пластики между зернами и мякиной в колосе (между ядром и лузгой у подсолнечника); yad — адаптивности (общей адаптивности к конкретным полю и зоне испытания или адаптивности в случае организации провокационного фона — засуха, холод, жара, засоление, рН почвы и т.д.; yimm — горизонтальной устойчивости (горизонтальный иммунитет); yef — «оплата» лимитирующего фактора почвенного питания (N, Р, К и т.п.); ytoi — толерантности к загущению; yont — генетической вариабельности продолжительности фаз онтогенеза.

Вышеперечисленные генотипические параметры при их использовании в селекционной работе способствуют генетическому повышению урожая. Какими именно «рычагами» будет пользоваться селекционер — это зависит от типичной динамики лимитирующих факторов среды в конкретной зоне селекции и наличия достаточного генетического полиморфизма по всем или некоторым из перечисленных семи физиологогенетических систем.

Далее, усот относится к «шумам» (как и лі, єсот, лоп), поэтому должно быть элиминировано при идентификации генотипа, хотя является генотипической компонентой. Рассмотрим эти «шумы», мешающие идентификации генотипа конкретной особи по ее фенотипу: лі — средовое отклонение, вызываемое вариациями индивидуальных микроэкологических ниш; єсот — отклонение негенетической (стартовой) конкуренции, возникающей за счет неодинакового стартового роста проростков одного генотипа (разные глубина заделки семян и ориентация последних в почве); Усот — отклонение генетической конкуренции, вызываемое разной генетической агрессивностью растений в борьбе за влагу, азот, свет и т.д.; лопі — отклонение, вызванное сменой лимитирующих факторов в онтогенезе в период закладки и развития признака.

Теперь рассмотрим положения теории регрессионного анализа, так как этот математический инструмент поможет дать ответ на интересующий нас вопрос теории ошибок линий регрессии (12).

Корреляционную зависимость между признаками можно описывать различными способами. В частности, любая форма связи может быть выражена уравнением общего вида y = f(x), где признак у — зависимая переменная, или функция от независимой переменной х. Известно, что изменение функции в зависимости от изменений одного или нескольких аргументов называется регрессией. Для выражения регрессии служат эмпирические и теоретические ряды, их графики (линии регрессии), а также корреляционные уравнения (уравнения регрессии) и коэффициент линейной регрессии.

Отметим, что показатели регрессии отражают корреляционную связь двусторонне (исключение — односторонняя связь рядов динамики), учитывая изменение среднего показателя у признака Y при изменении

X

значений xi признака X, и наоборот, и показывают изменение среднего

показателя X признака X по измененным значениям yi признака Y. В

у

общем случае признак Y рассматривается как функция многих аргументов, однако на практике учитываются не все, в простейшем случае (как при описании линейной регрессии) всего один: у = a + bx, где а — свободный член, в системе координат Оху (графически он представляет отрезок ор- 98

98

динаты), b — коэффициент регрессии.

Коэффициент регрессии можно вычислить, минуя расчет средних квадратических отклонений и коэффициента корреляции, по формулам

, (У. - У)(x. - x) Е(y - y)(x. - x)

byx ----------2— • bxy ---------------2—.

(x - x)2 Е(y - y)2

i i

Если говорить о связи между коэффициентами регрессии и корреляции, то известно, что коэффициент корреляции равен средней геометрической коэффициентов регрессии — r = ^by bx . Заметим, как и коэффициент корреляции, коэффициент регрессии характеризует только линейную связь и сопровождается знаком (+) при положительной и знаком (—) при отрицательной связи.

Следует отметить, что параметры линейной регрессии можно определить способом наименьших квадратов, основанным на требовании, чтобы сумма квадратов отклонений вариант от линии регрессии была наименьшей, то есть этому условию удовлетворяет следующая система нормальных уравнений: an + bEx = Ey; aEx + bEx2 = Exy.

Эмпирические показатели регрессии служат оценками соответствующих генеральных параметров. При этом возникают статические ошибки, так как значения этих показателей являются случайными. Из теории математической статистики известно, что ошибка выборочного коэффициента регрессии выражается в виде следующих формул:

S,

ЬУх

2 [E(У. - У)(x. - x)]2

(у. - У)2-------?----------?-------

1 E(x. - x)2

(n - 2)E(x - x)2

i

Sbx =

г:м2

2 [E(У. - У)(x. - x)]

Е(x - x)2--------.------f------

. E(y. - y)2

(n - 2)E(y - y)2

i

где Sby — ошибка коэффициента регрессии Y по Х; Sbx — ошибка коэффициента регрессии X по Y; x и у — средние арифметические суммы

всех вариант выборки.

Если мы знаем коэффициент корреляции между признаками X и Y (rxy) и средние квадратические отклонения Sx и Sy, то ошибку коэффициента регрессии можно определить по формулам

Sby

' х

S і

У У

S і

x x

1 - r 2 V n-2

• Sbx

y

S i

x x

S i

У У

1 - r 2

І n-2

где ij — порядковый номер варианты.

Достоверность выборочного коэффициента регрессии b проверяется с помощью ^-критерия с числом степеней свободы к = n — 2 и принятым уровнем значимости а. Нулевая гипотеза сводится к предположению, что в генеральной совокупности коэффициент регрессии равен нулю. 99

99

Статистические ошибки регрессии, которые возникают при решении эмпирических уравнений линейной регрессии, Svx и Sxy, вычисляют

по формулам Syx = SyiJ 1 _ r2 и Sxy = S^j 1 _ r2 , а также

Syx =

(y. y)2

I

n -2

Sx

'xy

1

(x _ x )2

i У

n - 2

где y и x — средние значения зависимых переменных соответственно Y

x У

и Х, рассчитанные по уравнениям регрессии.

Важность определения ошибки линий регрессии обусловлена тем, что она отражает величину возможных отклонений эмпирически найденных значений переменных Y и X от линий регрессии, построенной по значениям

у или x . Статистическая ошибка линейной регрессии позволяет с той

x У

или иной вероятностью устанавливать границу, содержащую определенную часть всех эмпирически найденных значений переменных величин. Для этого используются следующие уравнения: у = (a + bVx) + tSVx, x =

x *x * у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= (a + bxy) + tSxy. Если оценке подвергают не отдельные индивиды, а целые выборочные группы с их средними характеристиками, границы доверительного интервала линейной регрессии устанавливаются по уравнению

tS

у = (a + bVx) + —, где п — численность выборки. x Vn

Обращаем внимание на то, что применение метода линейной регрессии к анализу оценки значений переменных Y и X применимо лишь в тех ситуациях, когда исходные данные распределяются нормально или их распределение не очень сильно отклоняется от нормального закона. Это позволяет нам использовать эту теорию в качестве теории ошибок идентификации генотипов растений по их фенотипам. Если окажется, что генеральная совокупность, из которой взята выборка, распределяется явно асимметрично, что бывает крайне редко, то этот подход не сработает и должен быть заменен соответствующим непараметрическим методом.

Графики разнонаправленности, подробно описанные Драгавцевым (13), могут быть использованы для решения двух задач: идентификации генотипов отдельных растений в расщепляющих популяциях по их фенотипам, когда на графики наносят показатели СП и ФП отдельных растений; подбора родительских пар при гибридизации, когда на графики наносят средние показатели СП и ФП сортов из рабочей (стартовой) коллекции селекционера. В первом случае теория ошибок идентификации рассматривается как теория ошибок линии регрессии, выраженной зоной ошибок, ограниченной двумя параболами, идущими вдоль линий регрессии. Точки, выходящие за пределы параболы, достоверно являются надежными генетическими сдвигами по одной из физиологических систем (аттракции, микрораспределений, адаптивности, полигенного иммунитета, «оплаты» лимитирующего фактора почвенного питания, толерантности к загущению и генетической вариабельности продолжительности фаз онтогенеза) в зависимости от СП и ФП, выбранных для построения графика в двумерных координатах. Во втором случае, когда на графике СП—ФП нанесены средние показатели признаков сортов, очень хорошо работает из-

100

вестная формула достоверности различий средних величин:

D = х - х ; mD = ± 1 2 D

m2 + m2 ; t = 1 2 ’

D

-> 3,

m

D

где D — разность двух средних величин (х1 и х 2), mD — ошибка разности

средних, m1 и m2 — ошибки средних арифметических, где т = ±—j= (ст —

4п

среднее квадратическое отклонение, п — число растений при расчете среднего показателя) (14).

Рассмотрим эффективность применения принципа фоновых признаков в решении задач идентификации в F2 (или М2) уникального растения — родоначальника будущего нового сорта. По Allard, в среднем для количественных признаков растений около 80 % изменчивости — экологическая и лишь «20 % — генотипическая (15). Как видим, превышение лучшего генотипа в лучшей нише над худшим генотипом в лучшей нише составит примерно 20 %. Превышение же худшего генотипа в лучшей нише над лучшим генотипом в худшей равно 80 % — 20 % = 60 %. Ясно, что в отбор по фенотипам попадут в основном генетически средние образцы, а генетически уникальное растение будет утеряно.

Для безошибочного отбора по фенотипу лучших генотипов необходимо, чтобы часть из них попала в лучшие микроэкологические ниши. Вероятность попадания любого лучшего генотипа, лежащего за пределами +2ст генотипического распределения, то есть любого из 2,5 % лучших генотипов в любую нишу, составит р\ = 2,5:100 = 0,025. Вероятность встречи в любой точке делянки лучшего генотипа с лучшей (одной из 2,5 %) микронишей составит рх = 0,025-0,025 = 0,000625 (16, 17). Отсюда видим, что только 6 из 10000 растений с лучшими фенотипами будут генетически лучшими, то есть важными для эффективной селекции.

Отобрав лучшее по фенотипу растение, мы отберем лучший уникальный генотип с вероятностью 6:10000. Поскольку вероятность попадания лучшего генотипа в среднюю микронишу составляет 0,95-0,025 « 0,023 (в 38,3 раза выше, чем в лучшую нишу), то при «вылавливании» уникального генотипа случайный отбор часто может быть эффективнее отбора по «плюсовым» фенотипам.

Этот пример с генетической точки зрения рассматривает количественный признак, определяемый примерно тремя локусами, так как в F2 одна полная гомозигота по доминантным положительным аллелям трехлокусного признака встречается один раз среди 64 растений. Среди 128 растений будет две доминантно полных гомозиготы, что составляет около 2 % от всех особей популяции (в нашем примере мы хотим отобрать 2,5 % особей, лежащих за пределами +2стг).

Если система идентификации генотипов, основанная на принципе фоновых признаков работает идеально (а она работает так при наличии идеального ФП и всегда при ортогональной идентификации), то ее эффективность можно оценить следующим образом:

ЕФП

10000

раст.

6

раст.

1000,

то есть она работает эффективнее интуитивно-глазомерной в 1000 раз при оценке каждого поколения популяции.

Система фоновых признаков может быть наложена не только на F2

101

(или М2), но и на F3, F4 и т.д., и тогда ее общая эффективность возрастает еще в 2 или 3 раза.

Заметим, что эта эффективность рассчитана для трехлокусного признака. Однако генотипические различия большинства количественных признаков определяются 6-20 и более локусами. Для 6 локусов одна гомозигота должна встречаться на 4096 растений (на 64 в трехлокусном случае), то есть мы должны отобрать не 2,5 % особей, а всего лишь 0,024 %. При этом эффективность работы принципа ФП возрастает еще в 2,5:0,024 и 100 раз.

Л И Т Е Р А Т У Р А

1. Д р а г а в ц е в В.А. Метод оценки роли наследственности и среды в развитии признаков древесных растений, не требующей смены поколений. Бот. журн., 1966, 7: 939-946.

2. Д р а г а в ц е в В.А. О возможности элиминации межиндивидуальной средовой компоненты дисперсии при оценке коэффициента повторяемости у растений. Генетика, 1969, 5, 2: 30-35.

3. К р е н к е Н.П. Феногенетическая изменчивость. М., 1933-1935, 1: 167.

4. П л о х и н с к и й Н.А. Наследуемость. Новосибирск. 1964: 5.

5. Н и к о р о 3.С., Х а р и т о н о в а 3.Н., Р е ш е т н и к о в а Н.Ф. Различные спо-

собы определения племенной ценности животных. В кн.: Теоретические основы селекции животных. М., 1968: 300.

6. У и л ь я м с У. Генетические основы и селекция растений. М., 1968: 350.

7. Р о к и ц к и й П.Ф. Введение в статическую генетику. Минск, 1974: 200.

8. С а в ч е н к о В.К. Генетический анализ в сетевых пробных скрещиваниях. Минск, 1984: 19.

9. А у э р б а х Ш. Генетика. М., 1966.

10. Д ь я к о в А.Б., Д р а г а в ц е в В.А., Б е х т е р А.Г. Конкурентоспособность расте-

ний в связи с селекцией. Новый принцип анализа дисперсии продуктивности. В сб.: Теория отбора в популяциях растений. Новосибирск, 1976: 237-251.

11. Д р а г а в ц е в В.А., Д ь я к о в А.Б. Разнонаправленность сдвигов количественного признака индивидуального организма под влиянием генетических и средовых причин в двумерных системах признаковых координат. В кн.: Эколого-генетический скрининг генофонда и методы конструирования сортов сельскохозяйственных растений по урожайности, устойчивости и качеству. СПб, 1998.

12. Л а к и н Г.Ф. Биометрия. М., 1980: 181-200.

13. Д р а г а в ц е в В.А. К проблеме генетического анализа полигенных количественных

признаков растений. СПб, 2003.

14. Ф е д о р о в А.И. Методы математической статистики в биологии и в опытном деле. Алма-Ата, 1967.

15. A l l a r d R.W. Principles of plant breeding. N-Y-London, 1960.

16. Г н е д е н к о Б.В. Курс теории вероятностей. М., 1954.

17. Ф е л л е р В. Введение в теорию вероятностей и ее приложения. М., 1967, 1-2.

ГНЦ Всероссийский НИИ растениеводства Поступила в редакцию

им. Н.И. Вавилова, 190000, С.-Петербург, 19 июня 2006 года

ул. Большая Морская, 44; e-mail: kns@lsi.ru

THEORY OF ERRORS OF GENOTYPES IDENTIFICATION OF INDIVIDUAL PLANTS ON THEIR PHENOTYPES ON QUANTITATIVE DETERMINANTS IN SEGREGATED POPULATIONS AT THE EARLY

STAGES OF SELECTION

N.V. Kocherina S u m m a r y

The author considers the problem of selection identification of the best plant genotypes on their phenotypes. The basis of background determinants principle for productive selective work was presented. The theory of errors of regression line with the purpose of use as the theory of errors of identification of plant genotypes on their phenotypes was analyzed. The possibility of use of reliability of average for picking out of parent pairs during hybridization was characterized. The efficiency of background determinants principle was estimated for identification in F2 unique plant — ancestor of future variety.

102

i Надоели баннеры? Вы всегда можете отключить рекламу.