промышленности
УДК 634.1:57.087.1
Анализ фенотипа ягодных культур с применением компьютерных технологий обработки массивов данных
Analysis of the phenotype of crops with the use of computer
Профессор Л.В. Бобрович, доцент E.B. Пальчиков, ст. преподаватель Э.Н. Аникьева,
(Мичуринский государственный аграрный университет) кафедра агрохимии, почвоведения и агроэкологии, тел. 8(47545)9-46-48 E-mail: bobrovich63@mail.ru
профессор А.А. Аникьев (Московский государственный технический университет имени Н.Э. Баумана)
Professor L.V. Bobrovych, Assistant Professor E.V. Palchikov, Senior Lecturer E.N. Anikeva,
(Michurinsk State Agrarian University) chair of agrochemistiy, soil science and agroecology, tel. 8(47545)9-46-48 E-mail: bobrovich63@mail.ru Professor A.A. Anikiev (Moscow State Technical University name Bauman)
Реферат. Представлены результаты исследований, задача которых заключалась в выявлении определенных закономерностей между различными фенотипическпми и морфометрическнмн признаками растений, что представляет интерес с точки зрения их связи с последующими изменениями в росте и развитии, вызванными и антропогенным воздействием. Такие изменения можно выявить, в частности, по признаку «форма листовой пластины», которая является одним из наиболее ярких признаков принадлежности растений к конкретному виду, сорту. Приведены практические примеры использования компьютерных технологий обработки изображений в методике проведения оценки корреляций между морфометрическнмн признаками листовых пластин различных сортов ягодных культур. Представлены возможные подходы для решения поставленной задачи применительно к ягодным культурам. Для примера в работе взяты некоторые сорта кизила, смородины и жимолости. Показано, что компьютерные технологии на современном этапе позволяют определять для сканированного изображения в течение 1 мин площадь, перпметр, длину центральной жилки и всех жилок с погрешностью не более 2 %, что для обычных биологических измерений является технически недостижимым. В то же время авторы подчеркивают, что такие методы обработки данных требуют весьма тщательного подхода к подготовке исходных выборок для исследования с целью адекватного проведения анализа признаков фенотипа растений. Листья для такого анализа должны быть типичными, без признаков болезней, деформаций, различных размеров, из всех ярусов растений, отбираться случайно, чтобы наиболее полно охватить диапазон модпфикацпонной изменчивости, проявляющийся в фенотипе внутри одного сорта.
Summary. Presents research results of the authors, whose task was to identify specific patterns among different phenotypic and morphometric characteristics of plants that is of interest from the point of view of their connection with the subsequent changes in growth and development caused by, including, and anthropogenic influence. Such changes can be identified, in particular, on the basis of «form sheet plate», which is one of the most striking features of plants belonging to a particular form, variety. In the article the authors present practical examples of the use of computer image processing technology in the method of assessing correlations between the morphometric characteristics of leaf plates of different varieties of crops. Possible approaches for the solution of the tasks with regard to berry crops are presented. For example, in the work taken, some varieties of dogwood, currant and honeysuckle. It is shown that computer technology at the present stage allows to determine the scanned image within 1 minute area, perimeter, length, midrib and all the veins with an error of not more than 2 % of that for conventional biological measurements is technically unattainable. At the same time, the authors emphasize that such methods of data processing require a very careful approach to the preparation of the original samples for the study in order to adequately analyse the characteristics of the phenotype of plants. Leaves for analysis must be normal, without signs of disease, deformities, and selected by chance, of various sizes, from all parts of plants, in order to more fully cover the range of modification variability, which is manifested in the phenotype within one species.
С Бобрович A.B., Пальчиков Е.В., Аникьева Э.Н., Аникьев A.A., 2017
technologies of processing of data arrays
Ключевые слова: ягодные культуры, фенотип, генотип, изменчивость, листовые пластины, корреляция, морфометрические индексы, разрешение, площадь листа, компьютерные технологии.
Keywords: berry crops, phenotype, genotype, variability, leaf plate, correlation, morphometric indices, resolution, area of sheet, computer technology.
Применение методов статистики к биологическим объектам имеет свои особенности. Биологический объект как система в своем развитии имеет конечную цель, состоящую в создании аналогичного себе объекта или множества объектов и последующего завершения жизненного цикла. В процессе выполнения цели развитие объекта в пространстве и во времени подчиняется закону, заданному набором генов - генотипом данного вида. Различные признаки объекта претерпевают вариации в процессе жизненного цикла, связанные с наследованием признаков и адаптацией к окружающей среде - это так называемая модификационная изменчивость вида.
Объекты неживой природы отличаются тем, что при определенных внешних условиях они стремятся остаться в равновесии бесконечно долго, оставаясь в неизменном состоянии с минимумом энергии, поскольку они не обладают наследственной памятью о прошлых состояниях. Биологическая система, являясь открытой, старается сохранить равновесие с максимумом энергии. Это равновесие неустойчиво, поэтому системе приходится постоянно меняться, чтобы сохранить неустойчивое равновесие. В неживой природе основным признаком правильности закона является его повторяемость, в то время как в биологическом мире законы эволюции системы и сами признаки варьируются в определенных пределах, как в сезонных, так и в жизненном циклах. Мы не найдем статической заданной повторяемости ни у одного куста малины, смородины, крыжовника или боярышника ни по одному из признаков фенотипа, пока не определим количественно корреляцию между признаками для генотипа данного вида, сорта и интервалы внутрисортовой изменчивости в динамике, в процессе периода вегетации.
Одним из наиболее ярких признаков принадлежности растений к данному виду, сорту является форма листовой пластины. В литературе имеются различные точки зрения на роль листового аппарата в урожайности культурных растений в разные периоды вегетации. В период пробуждения и цветения этот аппарат работает на прирост зеленой массы, на продуктивность растения. В период созревания плодов он вносит свой вклад в урожайность наряду с другими системами растения [3, 5]. При этом вклад этих систем нельзя разделить, надо рассматривать растение как единую развивающуюся систему. Наша задача - выявить определенные закономерности между различными фенотипическими и морфометрическими признаками растения и связать их с направлением последующих изменений, вызванных и антропогенным фактором. Такие изменения можно определить по форме листовой пластины.
К настоящему времени известны работы по способам оценки площади листовых пластин некоторых плодовых, например, яблони, вишни, основанные на получении коэффициентов перевода площадей простых геометрических фигур в площадь листьев. Обычно используются площади четырёхугольника и окружности ввиду простоты замеров линейных параметров листовой пластинки: для четырёхугольника - это длина и ширина, для окружности - длина. Впервые этот метод был применен Н.К. Поляковым [4], на листьях яблони, затем продолжен И.Г. Фулгой (1960). A.C. Овсянников нашел более 100 переводных коэффициентов для некоторых сортов яблони и вишни и вычислил их средние значения для каждого сорта. В.А. Потапов [4] усовершенствовал метод Н.К. Полякова для определения площади листьев яблони, применяя прозрачный планшет с нанесёнными сантиметровыми делениями, а также предложил способ подсчета площади листа через его периметр.
Однако никто не задавался целью проводить количественную оценку листовых пластин, их изменчивость внутри сорта и оценивать сортоспецифичность. Возможно, такие задачи и ставились, но техническая возможность их решения появилась только с развитием компьютерных технологий обработки изображений. Развитые ранее методы можно было бы применять и для ягодных культур, однако здесь мы имеем некоторые трудности. Во-первых, ягодные растения имеют небольшое количество листьев на куст и большой разброс их размеров, что приводит к увеличению погрешности измерения суммарной площади, если пользоваться усредненным переводным коэффициентом. Во-вторых, у большинства ягодных растений листья имеют сложную форму, зубчики по периметру листовых пластин, что вносит дополнительные погрешности при расчете переводных коэф фициентов. В-третьих, исследования активности фотосинтеза у ягодных растений ужесточают требования к точности оценки плошади листовой поверхности именно из-за их малого количества.
Казалось бы, возникает парадокс, чем меньше листьев, тем больше погрешность. Однако мы имеем дело со статистическими ансамблями, в которых объём выборки существенно влияет на величину дисперсии. Для плодовых деревьев с их высокой степенью облиственности плотность распределения линейных размеров пластинок имеет в максимуме на ширине дисперсии большое количество листьев с размерами, близкими к средним - более 60 % от общего количества. В то же время у ягодных кустарников количество листьев мало, а разброс размеров велик, поэтому плотность распределения имеет большую ширину (дисперсию). Вследствие этого на ширине дисперсии имеется всего 30-40 % листьев, близких к среднему значению. Соответственно 60-70 % листьев имеют размеры далекие от среднего значения. Такой тип распределения, очевидно, приводит к з^величению погрешности измерений площади, если использовать среднее значение коэффициента перевода.
Возможны два подхода к решению этой задачи применительно к ягодным культурам. Первый состоит в нахождении таких коэффициентов пересчета, которые имеют минимальный разброс значений вокруг среднего (минимальную дисперсию) и используют масштабную инвариантность листовых пластин. Второй подход предполагает установление корреляционной зависимости в общем случае нелинейной, между плошадью листьев и какими-либо линейными морфометрическими индексами листовой пластины. Данные подходы требуют проведения измерений площади и индексов пластин с высокой точностью. Такую точность могут обеспечить только новые компьютерные технологии.
В настояшей работе представлены оба подхода на примере анализа морфомет-рических индексов у листовых пластин различных ягодных культур. Данная методика без труда может быть распространена на другие сорта и ягодные культуры, имеющие сложную форму листовых пластин и малое количество листьев на куст. Для примера мы взяли сорта малины, смородины, жимолости и кизила.
Все топологические измерения проводились на выборках объемом по 100 листьев каждого из указанных сортов. Листья отбирались случайно различных размеров из всех ярусов растений в целях наиболее полного охвата диапазона модификационной изменчивости, проявляющегося в фенотипе внутри одного сорта. Листья, взятые у растений в различные вегетационные периоды, проявляли хорошо выраженное свойство самоподобия по основным топологическим параметрам. В то же время некоторые характерные признаки, такие, как форма петель сети жилок, угол между главной жилкой и нижними боковыми жилками, визуально мало изменялись в пределах одного сорта.
Линейные размеры, в частности, длины жилок листовой пластинки, измерялись с помощью курвиметра КУ-А, имеющего погрешность 0,5 см на 50 см длины. Прямые измерения плошади листа проводились с помошью миллиметровой бумаги подсчетом квадратных ячеек, попадающих внутрь контура листа. Приграничная площадь оценивалась по правилу: количество ячеек, попадающее на границу, умноженное на количество узлов без одного. Данная оценка вносит погрешность в определение площади порядка 5-7 %.
В целях устранения недостатка обычных методов измерений нами была разработана программа измерения длины контура и площади изображений любой формы, получен-
ной сканированием реального объекта с заданным разрешением [2]. Аистовая пластинка предварительно сканируется с заданным разрешением, и изображение записывается в виде файла в формате bmp. Затем изображение в виде массива точек определенного цвета обрабатывается на поиск граничных точек цвета, отличного от фона, и количество этих точек подсчитывается. После того как количество пикселей в контуре будет известно, можно провести пересчет из пикселей в сантиметры. Аналогично подсчитывается количество пикселей внутри замкнутого контура, и после пересчета получаем площадь в квадратных сантиметрах. Проверка работы данной программы на известных эталонных контурах различной формы показала, что погрешность определения длины контура составляет величину 0,25 %, а площади - 0,15 %. Формулы пересчета длины и площади из пикселей в сантиметры:
£={N-V)d = iN_iyS£
N,
?
.2
S = (N-1)-= (N-l)-5L-ЗГ,
Ni • Nj J
где N - количество пикселей; d = 2,539 см - перевод дюйма в сантиметры;
SI
- разрешение сканирующего прибора (расстояние между пикселями); Ni, Nj-разрешение сканера в точках на дюйм по горизонтали и вертикали. Естественно, разрешение сканера также не является полностью отвечающим тем цифрам, которые приводятся в технических характеристиках. Увеличение разрешения достигается средствами аппроксимации участков изображения и вычислением дополнительных точек на изображении реально несканируемых из-за ограничений оптического разрешения. Следовательно, сам процесс сканирования вносит дополнительные погрешности, учтенные нами в итоговой оценке.
Площадь и периметр листовых пластин были измерены с помощью разработанной нами программы [2] сканированием листьев с различным разрешением. Длина центральной жилы измерялась курвиметром. Максимальная ширина листа измерялась в направлении, перпендикулярном длине центральной жилки с помощью циркуля; раствор циркуля наносился на миллиметровую бумагу и замерялся. Измерения проведены на выборках объемом 50, 100, 180 листьев из совокупности в 200 листьев по каждому изученному сорту в целях выявления минимального объёма выборки для получения достоверных результатов [1]. Результаты исследований показали, что наименьшую дисперсию имеют значения переводных коэффициентов в эллиптической модели листовой пластины (табл. 1).
Таблица 1
Коэффициенты корреляции между отдельными признаками листовых пластин кизила
Сорт Коэффициент корреляции, г
Площадь - длина центральной жилки Площадь -ширина Площадь -длина + ширина Площадь -длина х ширина
Азербайджанский 0,866 0,949 0,948 0,961
Азовский 0,859 0,962 0,947 0,960
Болгарский 0,627 0,875 0,851 0,885
Волгоградский 0,884 0,919 0,936 0,935
Волгоградский грушевидный 0,848 0,937 0,950 0,959
Крымский 0,724 0,897 0,848 0,883
Мосвир грушевидный 0,522 0,511 0,734 0,737
Мосвир, 2013 0,816 0,942 0,918 0,938
Находка 0,839 0,953 0,938 0,955
Николка 1 0,759 0,922 0,921 0,973
На рис. 1 в качестве примера приведена калибровочная кривая связи между площадью листовых пластин и периметром в модели эллиптической пластины.
40,о т________.кизил - Азербайджанский
30,0 ^у:
: 0,0984х^'1075
♦54яд1
а ли
Рис. 1. Зависимость площади листовых пластин кизила сорта Азербайджанский от их длины и ширины
Достоверность полученной аппроксимации степенным законом составляет 92,7 %, что является очень высоким соответствием. Коэффициент формы листовых пластин рассчитывается из полученного закона и является сортоспецифичным.
В качестве примера полученной неправильно корреляционной зависимости приведем соотношение между площадью и длиной центральной жилки кизила сорта Болгарский. Выборка содержит выпадающие варианты, которые не позволяют построить хорошую регрессию и определить коэффициент формы (рис. 2), однако корреляция между другими признаками позволила это сделать (рис. 3).
кизил-Болгарский
20,0
18,0
16,0
г и 14,0
л ч 12,0
о 3 10,0
о ? 8,0
6,0
4,0
2,0
0,0
♦
V
1« %
♦
♦
0,0
I ♦ Ряя I
2,0 4,0 6,0
длина центральной жилки, см
8,0
Рис. 2. Эмпирические данные зависимости площади от длины центральной жилки кизила сорта Болгарский
20,0 18,0 16,0
0 14,0
1 12,0 | 10,0
кизил - Болгарский
8,0 6,0 4,0 2,0 0,0
*
п2
к = 0,7 001 / \
♦У
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0
♦ Ряд1 длина + ширина, см
■^—Степенной (Ряд1)
Рис. 3. Зависимость площади от периметра листовых пластин кизила сорта Болгарский (аппроксимация показана сплошной линией)
Несмотря на то что калибровочную кривую удалось построить, разброс точек велик. Очевидно, исходя из большой величины дисперсии для данного сорта наиболее предпочтительно брать выборку в 100 вариантов.
В качестве недобросовестной подготовки выборки можно привести пример оценки площади и длины центральной жилки сорта Светлячок (рис. 4).
40,0
0,0
/5274х1,2085 - 0,2312 х V
- -1
0,0
♦ Р^ГИна центр&Яйюй жилкй^сйл
2
Рис. 4. Попытка аппроксимации эмпирических данных степенным законом
Из рис. 4 видно, что для листовых пластин с длиной центральной жилки 5,5 см имеются площади 8, 33 и 35 см2, что явно не соответствует действительно-
Методы компьютерной обработки требуют весьма тщательного подхода к подготовке выборок. Необходимо собирать типичные листья без признаков болезней, деформаций, поровну с каждого яруса кустов.
В качестве примера адекватной подготовки выборок приведем обработку данных по смородине. В табл. 2 приведены коэффициенты корреляции между некоторыми метрическими признаками листовых пластин смородины.
Таблица 2
Коэффициенты корреляции между площадью и индексами листа сортов смородины
Сорт, форма Коэффициент корреляции, г
Площадь -длина центральной жилки Площадь - длина черешка Площадь - сумма длин центральной + боковых жилок Площадь длина + ширина листа
Оджебнн 0,921 0,299 0,939 0,953
Зелёная дымка 0,902 0,945 0,957
Маленький принц 0,879 0,908 0,894
Маленький принц, шпалера 0,859 0,470906 0,907 0,959
Провинциалка 0,693 - 0,769
Черный жемчуг 0,785 - 0,889 0,941
Тамерлан 0,776 - 0,881 0,892
Тамерлан, палера 0,847 - 0,861 0,930
На рис. 5 приведены зависимости между признаками смородины Изумрудное ожерелье. Как видим, аппроксимация полиномом второй степени дает высокую достоверность и позволяет вычислить коэффициент формы листа для данного сорта.
В то же время выборка в 50 вариантов, как, например, в случае изучения площади листа жимолости сорта Томичка, не позволяет построить регрессию однозначно. Более того, распределение плотности вероятности данных по площади листьев существенно отличается от нормального закона, что говорит о неправильной подготовке выборки, в которой, вероятно, смешаны листья разных сортов или имеются листья поврежденные, например, с признаками болезни и т.д. (рис. 6).
S(L+W) сорт Изумрудное ожерелье
У = 0,234х
R - 0.9СС J*
] у - О.За. 1 ■ |R2 = 0,912 г ♦ 1 « У
*
распределение площади листьеЕ
• S(L+W]
- Power <S(L«W)>
■ Poly.<S(L+W»
Длина + ширина
Рис. 5. Зависимость площади листовой пластины от периметра смородины (пунктиром показана аппроксимация полиномом второй степени)
О
0 5 ИнтШвалы
Рис. 6. Плотность распределения площади листовых пластин
жимолости сорта Томичка
На рис. 7 показаны данные зависимости площади от периметра для данного сорта. Как видно из приведенных кривых аппроксимации, достоверность низкая, следовательно, невозможно однозначно определить коэффициент формы для исследуемого сорта, используя выборку в 50 вариантов.
Зависимость длины центр. Жилки от площади
*
0.4 i
ф о
з-З
пз
I
I2
а
1
о
у = 0,015х2 0,03Sx + 3,705
R2 = 0,647
♦ ♦
♦ ♦ ♦
♦ y= 0,238x + 2,593
R2 = 0,619
0 5 10 15 20
Площадь
Рис. 7. Зависимость площади от длины центральной жилки сорта Томичка
Компьютерные технологии на современном этапе позволяют практически за минуту определить площадь, периметр, длину центральной жилки и всех жилок для сканированного изображения с погрешностью не более 2 %, что для обычных биологических измерений является технически недостижимым. Однако для адекватного проведения анализа признаков фенотипа растений необходимо уделять особое внимание подготовке выборок для исследования.
ЛИТЕРАТУРА
1. Аникьев, A.A. Компьютерные технологии обработки массивов данных при анализе фенотипа ягодных культур [Текст]/ A.A. Аникьев, А.И. Завражнов, Э.Н. Аникьева, Л.В Бобрович // Матер. Междунар. науч.-практ. конф. «В.И. Вернадский: устойчивое развитие регионов» .- 2016. - 4.1. - С. 103-108.
2. Аникьев, A.A. Фрактальная размерность листовой пластинки в качестве сортовой селекции земляники [Текст]/ A.A. Аникьев, Н.И. Федоряка, С.А. Пчелин-цев // Труды Междунар. юбил. науч.-практ. конф., посвящ. 70-летию образования Мичуринского государственного аграрного университета. - 2001. - Т. 3. - С. 194196.
3. Неуймин, Д.С. Особенности государственной поддержки и регулирования рынков сельскохозяйственной продукции в условиях импортозамещения [Текст]/ Д.С. Неуймин, А.В. Бекетов, В.А. Кувшинов, А.И. Трунов // Достижения науки и техники АПК,- 2016.- Т. 30,- № 5,- С. 12-15.
4. Соколов, О.В. Проблемы развития садоводства и рынка плодово-ягодной продукции в условиях импортозамещения [Текст]/ О.В. Соколов, Д.С. Неуймин, А.И. Трунов // Технологии пищевой и перерабатывающей промышленности АПК -продукты здорового питания,- 2016.- № 5 (13).- С. 135-142.
REFERENCES
1. Anik'ev А.А., Zavrazhnov A.I., Anik'eva E.N., Bobrovich L.V. Komp'yuternye tekhnologii obrabotki massivov dannykh pri analize fenotipa yagodnykh kul'tur [Computer technologies of processing of data arrays in the analysis of a phenotype of berry cultures] Mater. Mezhdunar. nauch.-prakt. konf. «V.I. Vernadskiy: ustoychivoe razvitie regionov», 2016, Ch.l, pp. 103-108 (Russian).
2. Anik'ev A.A., Fedoiyaka N.I., Pchelintsev S.A. Fraktal'naya razmernost' listovoy plastinki v kachestve sortovoy selektsii zemlyaniki [Fractal dimension of a sheet plate as high-quality selection of a wild strawberry] Trudy Mezhdunar. yubil. nauch.-prakt. konf., posvyashch. 70-letiyu obrazovaniya Michurinskogo gosudarstvennogo agrarnogo universiteta, 2001, T. 3, pp. 194-196 (Russian).
3. Neuymin D.S., Beketov A.V., Kuvshinov V.A., Trunov A.I. Osobennosti gosu-darstvennoy podderzhki i regulirovaniya rynkov sel'-skokhozyaystvennoy produktsii v usloviyakh importozameshcheniya [Features of the state support and regulation of the markets of agricultural production in the conditions of import substitution] Dosti-zheniya nauki i tekhniki APK, 2016, T. 30, No 5, pp. 12-15 (Russian).
4. Sokolov O.V., Neuymin D.S., Trunov A.I. Problemy razvitiya sadovodstva i ryn-ka plodovo-yagodnoy produktsii v usloviyakh importozameshcheniya [Problems of development of gardening and the market of fruit and berry production in the conditions of import substitution] Tekhnologii pishchevoy i pererabatyvayushchey promyshlen-nosti APK - produkty zdorovogo pitaniya, 2016, No 5 (13), pp. 135-142 (Russian).