Научная статья на тему 'КЛАССИФИКАЦИЯ СОДЕРЖАНИЯ ФОСФОРА МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ ПО ДАННЫМ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ'

КЛАССИФИКАЦИЯ СОДЕРЖАНИЯ ФОСФОРА МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ ПО ДАННЫМ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ Текст научной статьи по специальности «Прочие технологии»

CC BY
285
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
The Scientific Heritage
Область наук
Ключевые слова
фосфор / макроэлементы / точное земледелие / машинное обучение / случайный лес / дерево решений / метод опорных векторов / дистанционное зондирование / вегетационные индексы / спектральные каналы / Sentinel 2. / phosphorus / macronutrients / precision agriculture / machine learning / random forest / decision tree / support vector machine / remote sensing / vegetation indexes / spectral bands / Sentinel 2.

Аннотация научной статьи по прочим технологиям, автор научной работы — Бекбаева А.М., Мажренова Ш.К., Ермеков Ф.К., Токбергенов И.Т., Куришбаев А.К.

Технологии точного земледелия направлены на оптимизацию управления полями для повышения урожайности сельскохозяйственных культур, снижения воздействия на окружающую среду и потенциального усиления плодородности почв. Успех точного земледелия в значительной степени зависит от эффективного и точного метода определения свойств почвы. Целью данного исследования является оценка применения методов машинного обучения для определения уровня содержания фосфора в почве по космическим снимкам. Преимуществами данных дистанционного зондирования Земли (ДЗЗ) являются их актуальность, доступность, площадь покрытия. В данной статье, по проведенным ранее исследованиям для Северного Казахстана, была выявлена необходимость в проведении анализа содержания фосфора. Для достижения цели исследования был проведен отбор и анализ почвенных образцов по 1 га сетке, были выявлены основные вегетационные индексы важные для классификации, также проведено сравнение методов машинного обучения. Так в 2019 на площади 5236 га паровых полей агрохимический анализ был проведен по определению содержания фосфора. При моделировании методами машинного обучения на основе выявленных показателей классификация фосфора метод дерева решений показал 65,79% точности, метод опорных векторов – 68,5% и случайный лес – 71,8%. Входным параметрами являются рельеф, полученный по данным SRTM (Shuttle Radar Topography Mission), 9 спектральных каналов и 5 вегетационных индексов по снимку Sentinel 2. Также, были выявлены наиболее важные показатели для метода случайный лес с целью увеличения точности: рельеф, NDVI (Нормализованный вегетационный индекс), PSSRB (простой пигментный рацион для хлорофилла), NDRE (Нормализованный разностный красный краевой индекс), NDWI (Стандартизованный индекс различий увлажненности), каналы SWIR 2 (cредний коротковолновый инфракрасный) и синий. Таким образом, можно сделать вывод, что классификация содержания уровня фосфора в почве методами машинного обучения на основе данных ДЗЗ показывает относительно высокий результат и в дальнейшем разработанные модели могут быть усовершенствованы для получения более высокой точности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим технологиям , автор научной работы — Бекбаева А.М., Мажренова Ш.К., Ермеков Ф.К., Токбергенов И.Т., Куришбаев А.К.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLASSIFICATION OF PHOSPHORUS CONTENT USING MACHINE-LEARNING METHODS BASED ON REMOTE SENSING DATA

Precision farming technologies aim to optimize field management to increase crop yields, reduce environmental impacts, and potentially enhance soil fertility. The success of precision farming considerably depends on an efficient and accurate method for determining soil properties. The purpose of this study is to evaluate machine learning methods to determine the level of phosphorus in the soil from satellite images. The advantages of remote sensing data are their relevance, availability, and coverage area. In this article, based on the research conducted for Northern Kazakhstan earlier, the need for analysis of the phosphorus content was identified. To achieve the goal of the study, soil samples were selected and analyzed for 1 ha grid, the main vegetation indices important for classification were identified, and machine learning methods were compared. In 2019, an agrochemical analysis was carried out to determine the phosphorus content on an area of 5236 hectares of fallow fields. The modeling using machine learning methods based on the identified indicators of phosphorus classification showed accuracy 65.79% in the decision tree method, the support vector machine – 68.5%, and the random forest 71.8%. The input parameters are the digital elevation model (DEM) obtained from the SRTM (Shuttle Radar Topography Mission), 9 spectral bands, and 5 vegetation indices from the Sentinel 2 image. In addition, the feature important score for the random forest method was identified in order to increase accuracy: DEM, NDVI (Normalized vegetation index), PSSRB (Pigment Specific Simple Ratio for chlorophyll b), NDRE (Normalized difference red edge index), NDWI (Normalized Difference Water Index), SWIR 2 (short-wave infrared) and blue bands. Thus, we can conclude that the classification of the phosphorus content in the soil using machine learning methods based on remote sensing data shows a relatively high result and in the future, the developed models might be improved to obtain higher accuracy

Текст научной работы на тему «КЛАССИФИКАЦИЯ СОДЕРЖАНИЯ ФОСФОРА МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ ПО ДАННЫМ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ»

GEOGRAPHICAL SCIENCES

КЛАССИФИКАЦИЯ СОДЕРЖАНИЯ ФОСФОРА МЕТОДАМИ МАШИННОГО ОБУЧЕНИЯ ПО ДАННЫМ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ

Бекбаева А.М.,

зам.заведующего центра ГИС-технологий, Казахский Агро Технический университет им. С. Сейфуллина,

Нур-Султан, Казахстан Мажренова Ш.К., заведующий Центра ГИС-технологий, Казахский Агро Технический университет им. С. Сейфуллина,

Нур-Султан, Казахстан Ермеков Ф.К.,

декан факультета управление земельными ресурсами, архитектуры и дизайна, Казахский Агро Технический университет им. С. Сейфуллина,

Нур-Султан, Казахстан Токбергенов И.Т.,

зампредседателя Правления по науке, инновационной деятельности и международным связям,

Казахский Агро Технический университет им. С. Сейфуллина,

Нур-Султан, Казахстан Куришбаев А.К.

Руководитель проекта «Трансферт и адаптация технологий по точному земледелию при производстве продукции растениеводства по принципу «демонстрационных хозяйств» (полигонов) в Северо-Казахстанской области»

Казахский Агро Технический университет им. С. Сейфуллина,

Нур-Султан, Казахстан

CLASSIFICATION OF PHOSPHORUS CONTENT USING MACHINE-LEARNING METHODS

BASED ON REMOTE SENSING DATA

Bekbayeva A.,

Deputy Director of the GIS technology center, S. Seifullin Kazakh Agro Technical University, Nur-Sultan, Kazakhstan

Mazhrenova Sh., Director of the GIS technology center, S. Seifullin Kazakh Agro Technical University, Nur-Sultan, 010000, Kazakhstan

Yermekov F.,

Dean of the faculty of land management, architecture and design, S. Seifullin Kazakh Agro Technical University, Nur-Sultan, Kazakhstan

Tokbergenov I.,

Deputy Chairman of the Board for science, innovation and international relations, S. Seifullin Kazakh Agro Technical University, Nur-Sultan, Kazakhstan

Kurishbayev A. Project Manager "Transfer and adaptation of precision farming technologies in the production of crop production on the principle of demonstration farms "(polygons) in the North Kazakhstan region» S. Seifullin Kazakh Agro Technical University, Nur-Sultan, Kazakhstan

Аннотация

Технологии точного земледелия направлены на оптимизацию управления полями для повышения урожайности сельскохозяйственных культур, снижения воздействия на окружающую среду и потенциального усиления плодородности почв. Успех точного земледелия в значительной степени зависит от эффективного и точного метода определения свойств почвы. Целью данного исследования является оценка применения методов машинного обучения для определения уровня содержания фосфора в почве по космическим снимкам. Преимуществами данных дистанционного зондирования Земли (ДЗЗ) являются их актуальность, доступность, площадь покрытия. В данной статье, по проведенным ранее исследованиям для Северного Казахстана, была выявлена необходимость в проведении анализа содержания фосфора. Для достижения цели исследования был проведен отбор и анализ почвенных образцов по 1 га сетке, были выявлены основные вегетационные индексы важные для классификации, также проведено сравнение мето-

дов машинного обучения. Так в 2019 на площади 5236 га паровых полей агрохимический анализ был проведен по определению содержания фосфора. При моделировании методами машинного обучения на основе выявленных показателей классификация фосфора метод дерева решений показал 65,79% точности, метод опорных векторов - 68,5% и случайный лес - 71,8%. Входным параметрами являются рельеф, полученный по данным SRTM (Shuttle Radar Topography Mission), 9 спектральных каналов и 5 вегетационных индексов по снимку Sentinel 2. Также, были выявлены наиболее важные показатели для метода случайный лес с целью увеличения точности: рельеф, NDVI (Нормализованный вегетационный индекс), PSSRB (простой пигментный рацион для хлорофилла), NDRE (Нормализованный разностный красный краевой индекс), ND WI (Стандартизованный индекс различий увлажненности), каналы SWIR 2 (средний коротковолновый инфракрасный) и синий. Таким образом, можно сделать вывод, что классификация содержания уровня фосфора в почве методами машинного обучения на основе данных ДЗЗ показывает относительно высокий результат и в дальнейшем разработанные модели могут быть усовершенствованы для получения более высокой точности.

Abstract

Precision farming technologies aim to optimize field management to increase crop yields, reduce environmental impacts, and potentially enhance soil fertility. The success of precision farming considerably depends on an efficient and accurate method for determining soil properties. The purpose of this study is to evaluate machine learning methods to determine the level of phosphorus in the soil from satellite images. The advantages of remote sensing data are their relevance, availability, and coverage area. In this article, based on the research conducted for Northern Kazakhstan earlier, the need for analysis of the phosphorus content was identified. To achieve the goal of the study, soil samples were selected and analyzed for 1 ha grid, the main vegetation indices important for classification were identified, and machine learning methods were compared. In 2019, an agrochemical analysis was carried out to determine the phosphorus content on an area of 5236 hectares of fallow fields. The modeling using machine learning methods based on the identified indicators of phosphorus classification showed accuracy 65.79% in the decision tree method, the support vector machine - 68.5%, and the random forest - 71.8%. The input parameters are the digital elevation model (DEM) obtained from the SRTM (Shuttle Radar Topography Mission), 9 spectral bands, and 5 vegetation indices from the Sentinel 2 image. In addition, the feature important score for the random forest method was identified in order to increase accuracy: DEM, NDVI (Normalized vegetation index), PSSRB (Pigment Specific Simple Ratio for chlorophyll b), NDRE (Normalized difference red edge index), NDWI (Normalized Difference Water Index), SWIR 2 (short-wave infrared) and blue bands. Thus, we can conclude that the classification of the phosphorus content in the soil using machine learning methods based on remote sensing data shows a relatively high result and in the future, the developed models might be improved to obtain higher accuracy.

Ключевые слова: фосфор, макроэлементы, точное земледелие, машинное обучение, случайный лес, дерево решений, метод опорных векторов, дистанционное зондирование, вегетационные индексы, спектральные каналы, Sentinel 2.

Keywords: phosphorus, macronutrients, precision agriculture, machine learning, random forest, decision tree, support vector machine, remote sensing, vegetation indexes, spectral bands, Sentinel 2.

Введение

Несмотря на то, что Казахстан обладает богатыми стратегическими ресурсами, доля ВВП сельского хозяйства не превышает 5%. Государством направлен курс на диверсификацию посевных площадей и переходу к производству высокорентабельных культур и в последние годы начинает проявляться тенденция на увеличение площадей посевов сельскохозяйственных культур и повышения их урожайности. Казахстан находится в первой 20 стран в мире по площадям посевов, однако по урожайности сельскохозяйственных культур значительно отстает. Кроме того, изменения климата значительно повялияло на деградацию почв и многие пахотные земли не подлежат возделыванию. Также, в связи с тем, что большинство фермерских хозяйств занимались «нулевой» технологией производства, то есть без внесения удобрений, значительная часть посевных площадей потеряла питательные вещества. Традиционно сельское хозяйство является консервативной отраслью экономики, но влияние мировых тенденций постепенно увеличивает использование информацион-

ных технологий. При этом, существенным пробелом информации являются данные по химическому составу почв. Почва является одним из важнейших компонентов сельскохозяйственного производства и может оказывать доминирующее влияние на урожайность и качество сельскохозяйственных культур. Эффективное управление сельским хозяйством практически недостижимо без аргументированного и доказательного обоснования норм внесения удобрений.

К высокотехнологическим системам управления сельским хозяйством относятся технологии точного земледелия включающие глобальное позиционирование, географические информационные системы (ГИС), данные дистанционного зондирования Земли (ДЗЗ), искусственный интеллект, промышленный интернет вещей, распределенные реестры, машинное обучение и др. Успех точного земледелия в значительной степени зависит от эффективного и точного метода определения свойств почвы. Отбор проб по сетке, как традиционный способ изучения изменений почвы в полевых условиях, больше не считается целесообразным, поскольку этот способ трудоемкий, время затратный

и не обладает пространственной исчерпываемо-стью. Дистанционное зондирование представляет собой новый инструмент для сбора информации о точном земледелии и обладает преимуществами низкой стоимости, оперативности и относительно высокого пространственного разрешения ^е, Thomasson, Sui, 2011).

Под дистанционным зондированием понимается мониторинг и измерение энергетических и поляризационных характеристик излучения объектов в различных диапазонах электромагнитного спектра и целью выявления местоположения, вида, свойств и временных изменений объектов окружающей среды. ДЗЗ широко применяется во многих дисциплинах, связанных с окружающей средой, включая экологию, океанографию, климатологию, геологию и сельское хозяйство (Токарева, 2010). Стоит отметить, что большой массив агрономически важных свойств почвы (включая текстуру, содержание органического и неорганического углерода, макро-и микроэлементов, содержание влаги, катионообменную способность, электропроводность, рН и железо) был в различных степенях успешно оценен с помощью ДЗЗ. Большое количество исследований было проведено для изучения свойств почв с помощью различных технологий ДЗЗ начиная от полевого спектрометра до спутниковых гиперспектральных изображений ^е, Thomasson, Sui, 2011).

Самая ранняя попытка использовать ДЗЗ для почвенных исследований была предпринята в 1930-х годах, когда черно-белые аэрофотоснимки были подготовлены в качестве базовых карт для почвенных исследований в США (Baumgardner et а1, 1986). С развитием мультиспектральных сенсоров в конце 1960-ых появилась возможность очертить различия поверхности почв (Кжй^ 1971). Ранняя попытка количественной оценки коэффициента отражения почвы и определения различий между спектрами отражения с помощью проксимального зондирования была предпринята СоМй (1970, 1972). Stoner et а1. (1980) собрали дубликаты образцов почвы, представляющих более 240 почвенных серий из 17 различных температурно-влажностных режимов, и измерили видимое и инфракрасное отражение (0.52

2,36 мкм). Они разделили спектральные кривые на пять основных форм и связали их с пятью типами почв (преобладание органики, изменение минералов, воздействие железа, органическое воздействие и преобладание железа). Ben-Dor (2002) и Ben-Dor et al. (2003) рассмотрели количественные свойств почвы с помощью гиперспектральных датчиков. Также, с помощью ДЗЗ исследовали средства и методы выявления степени эродированности почв (Zeng et al, 2013; Fan et al, 2004; Gaffer, 2008). Lopez-Granados et al. (2003) применяли геостатистические методы и линейную регрессию для картографирования свойств почв таких как, текстура, органическое вещество, рН, фосфор и калий. Ми-хайленко и Тимошин (2018) провели оценивание химического состояния почвенной среды и влагоза-паса методами математического моделирования. При этом среднеквадратическая ошибка разработанных алгоритмов меньше расчетных значений на 20-25%. Haider провел оценку 12,7 % пригодности земель для возделывания сельскохозяйственных культур по таким показателям как текстура, pH, органический углерод, азот, фосфор и калий на основе ГИС в Индии (2013). Azizan et al. (2019) геостатистические методы картировали уровни содержания азота, фосфора и калия в Малайзии. Patel et al. применяли метод производного анализа и лабораторного гиперспектрометра для определения уровня содержания глины, азота, фосфора и калия (NPK) в компосте с достоверностью 0.932 и 0.926 для глины и NPK (2020). Также, были продемонстрированы результаты 94%, 89% и 96% точности зонирования почв по таким показателям как рН, содержание органического вещества в почве и глины по данным Sentinel-1 и Sentinel-2 с применением метода машинного обучений случайный лес (Yuzugullu et al, 2020). Целью данного исследования является оценка применения методов машинного обучения для определения уровня содержания фосфора в почве по данным Sentinel 2.

Материалы и методы исследования На рисунке 1 представлена структурная схема исследования классификация почв по уровню содержания фосфора на основе спутниковых снимках

Рис. 1. Структурная схема исследования

Спутниковые снимки В данном исследовании применялись спутниковые снимки Sentinel 2, проекта Европейского космического агентства. Мультиспектральные снимик с 13 каналами в видимом, ближнем инфракрасном и коротковолновом инфракрасном диапазонах спектра.

Цифровая модель рельефа Радиолокационная топографическая миссия шаттла - международный исследовательский проект по созданию цифровой модели высот Земли с помощью радарной топографической съёмки её поверхности. Полученная цифровая модель охватывает 80% земной суши, от 56° ю. ш. до 60° с. ш. (Nikolakopoulos, Kamaratakis, Chrysoulakis, 2006). В данном исследовании использовались обновленные данные ASTER GDEM.

Google Earth Engine Для этого исследования снимки Sentinel-2 были загружены с помощью Google Earth Engine (GEE) API Java. Компания GEE была создана в 2010 году с целью предоставления онлайн-платформы для доступа, анализа и визуализации современных данных дистанционного зондирования Земли. В

рамках платформы GEE изображения S2 загружаются как значения отражения поверхности уровня обработки 2a (Gorelick, et.al, 2017).

Территория исследования Исследование проводилось в Аккайынском районе Северо-Казахстанской области (Рис. 2). Климат в северной части Казахстана резко континентальный с продолжительной снежной зимой и теплым летом. Средняя температура самого холодного месяца (январь) составляет около -18,6 °с, самого жаркого месяца (июль) - +19,0 °С, количество осадков составляет 350 мм в год, 80-85% из них выпадает в теплое время года (апрель-октябрь). Отличительной чертой региона является высокопродуктивный тип почвы - чернозем. Сельское хозяйство в регионе играет важную роль в его экономике. Основным видом культуры, возделываемой в регионе, является пшеница. Рельеф территории в основном равнинный, без сильных перепадов высот. Средняя высота над уровнем моря составляет около 133,7 метра с постепенным подъемом высоты с северо-запада на юго-восток. Уклон небольшой, однако на некоторых участках достигает 1,590.

Рис 2. Территория исследования

Отбор и анализ почвенных образцов В 2019 году на площади 5236 га был проведен отбор почвенных образцов по гектарной сетке. С 1 га (элементарный участок) отбирались 20 уколов, которые смешивались в один образец. Расстояние

между уколами составляло 10 метров. По данному образцу был проведен агрохимический анализ по определению содержания фосфора. Результаты анализа были разгруппированы на 4 класса (Таблица 1, Рис. 2).

Таблица 1.

Содержание фосфора в почве ^Р5)

№ Значения фосфора (мг/кг) Кол-во, га %

1 0-10 1 244 23,76

2 10-20 3 551 67,82

3 20-30 433 8,3

4 30-40 8 0,15

Вегетационные индексы и спектральные каналы

В исследовании применялись следующие индексы:

NDVI - нормализированный разностный вегетационный индекс, показывающий содержание хлорофилла в растениях. Формула для расчета: NDVI = (NIR - RED)/(NIR + RED),

NDRE - нормализированный разностный красный краевой индекс, также показывающий содержание азота в растениях. Формула расчета NDRE = - RedEdge)/(NIR + Red.Ed.ge), NDWI - стандартизованный индекс различий увлажненности, показывающий содержание влаги в растениях. Формула расчета NDWI =

^т - шт)/№т + шт),

SIPI - структурный нечувствительный пигментный индекс, оценивает отношение каротинои-дов к хлорофиллу. Формула расчета SIPI = (NIR - Blue)/(NIR + RED),

PSSRB - простой пигментный рацион для хлорофилла, показывающий сильную корреляцию с концентрацией хлорофилла b. Формула расче-таPSSRB = NIR/(RED), где NIR - отражение в ближней инфракрасной области спектра, RED- отражение в красной области спектра, RedEdge- отражение в красной краевой области спектра, Blue -отражение в синей области спектра, SWIR - отражение в средней (коротковолновом) инфракрасной области спектра. Спектральные каналы Sentinel 2: band 2 - синий (0,443 мкм), band 3 - зеленый (0,49 мкм), band 4 - красный (0,665 мкм), band 5 - Растительный крайний красный 1 (0,705 мкм), band 6 -Растительный крайний красный 2 (0,74 мкм), band 7 - Растительный крайний красный 3 (0,783 мкм), band 8 - Ближний инфракрасный (0,842 мкм), band 8а - Ближний инфракрасный 2 (0,865 мкм), band 9 -Водяной пар (0,945 мкм), band 11 - Средний (коротковолновый) инфракрасный (1,61 мкм), band 12 -Средний (коротковолновый) инфракрасный 2 (2,19 мкм).

Методы машинного обучения Машинное обучение - является компонентом искусственного интеллекта, изучающим методы построения алгоритмов, способных обучаться. Существует 2 типа обучения: индуктивное обучение, по прецедентам, и дедуктивное. Дедуктивное обучение подразумевает формализацию знаний экспертов и базы знаний для создания экспертной системы. Индуктивное обучение по прецедентам, базируется на установлении общих закономерностей по эмпирическим данным. Для решения задач классификации применяются индуктивные методы обучения с учителем (Журавлев, Рязанов, Сенько, 2006). Методы машинного обучения были осуществлены на языке программирования Python. В исследовании проводилась оценка 3-х методов: дерево решений, метод опорных векторов, случайный лес. Для осуществления обучения по прецедентам формируются обучающая и тестовая выборки. Обучающая выборка - выборка по которой производится настройка моделей зависимости, тестовая выборка - выборка, по которой проводится оценка качества построенных моделей (Mitchell, 1997). Для

выбора наилучшей модели методов обучения оценивание проводилось по тестовой выборке. Выборка была сформирована случайным образом, с целью проведения независимой оценки методов обучения в процентном отношении 70:30 и 80:20 для обучающей и тестовой выборок соответственно.

Дерево Решений CART (DT) - алгоритм действует путем разделения на каждом шаге множества примеров ровно напополам - по одной ветви идут те примеры, в которых правило выполняется (правый потомок), по другой - те, в которых правило не выполняется (левый потомок). В процессе «роста» на каждом узле дерева алгоритм проводит перебор всех атрибутов, и выбирает для следующего разбиения тот, который максимизирует значение показателя, вычисляемого по математической формуле и зависящего от отношений числа примеров в правом и левом потомке к общему числу примеров (Левитин, 2006).

Метод опорных векторов (SVM) - алгоритм основан на переводе исходных векторов в пространство более высокой размерности и поиск разделяющей гиперплоскости с максимальным зазором в этом пространстве. Разделяющей гиперплоскостью будет гиперплоскость, максимизирующая расстояние до двух параллельных гиперплоскостей. Алгоритм работает в предположении, что чем больше разница или расстояние между этими параллельными гиперплоскостями, тем меньше будет средняя ошибка классификатора.

Случайный лес (RF) - алгоритм применения большого ансамбля решающих деревьев, каждое из которых само по себе даёт очень невысокое качество классификации, но за счёт их большого количества результат получается хорошим. В данном методе возможно выбрать индикаторы, которые не имеют никакой ценности и исключить их из модели, применяя важный функционал модели (Breiman, 2001).

Результаты

Результаты классификации представлены в таблицах 2, 3 и 4. Факт того, что класс с уровнем содержания фосфора в почве 30-40 мг/кг представлен в небольшом количестве, повлияет на общую точность моделей. Значения в таблицах были усреднены более 10 итерациями случайным разделением на обучающие и тестовые выборки.

Таблица 2.

Матрица неточностей по результатам модели классификации методом дерево решений

Прогнозируемое/ Фактическое содержание фосфора 1 2 3 4 Итого

1 203 154 8 0 365

2 165 793 114 4 1076

3 0 88 31 0 119

4 0 0 1 0 1

Итого 368 1035 154 4 1561

Точность, % 65,79

Таблица 4.

Матрица неточностей по результатам модели классификации методом случайный лес

Таблица 3.

Матрица неточностей по результатам модели классификации методом опорных векторов_

Прогнозируемое/ Фактическое содержание фосфора 1 2 3 4 Итого

1 13 220 1 0 234

2 21 698 6 0 725

3 3 74 2 0 79

4 0 3 0 0 3

Итого 37 995 9 0 1041

Точность, % 68,49

Прогнозируемое/ Фактическое содержание фосфора 1 2 3 Итого

1 19 215 0 234

2 6 725 0 731

3 0 76 0 76

Итого 25 1016 0 1041

Точность, % 71,469

В методе случайный лес были выбраны индикаторы, которые не имеют никакой ценности и исключить их из модели. Со значениями содержания фосфора большую взаимосвязь имеют: рельеф, N0^, PSSRB, NDRE, NDWI, каналы SWIR и синий. После выбора функции точность модели составила 71,8 %. Автоматический выбор функции может снизить сложность модели, но не всегда повышает точность. Для получения необходимой точности процесс выбора функций был выполнен вручную.

Выводы

По результатам исследования демонстрируется относительно высокая возможность применения методов машинного обучения на основе данных ДЗЗ для классификации химического состава почв в точном земледелии. Новые методы картирования питательных веществ почв, полученные в этом исследовании, дают новый взгляд на концепцию управления сельским хозяйством с точки зрения внесения удобрений. Таким образом, применение методов машинного обучения сократит затраты, если проводить отбор и анализ почвенных проб только на площадках для формирования обучающей выборки и создания модели классификации по всей территории. Использование метода периодического отбора проб с тестовых площадок снизит издержки труда и позволит осуществить адаптацию моделей машинного обучения к реальным условиям. В то же время, представленная методика частично ограничена тем, что агрохимический анализ был проведен по 1 га сетке. При более детальном отборе почв существует вероятность увеличения точности моделей. Также, исследования можно расширить для изучения содержания азота, калия, влагозапаса и других свойств почв с применением различных спектральных индексов и спутниковых снимков. В свою очередь, применение методов машинного обучения на основе данных ДЗЗ может быть адаптировано на другие поч-венно-климатические зоны.

Признательность

Исследование выполнено в рамках проекта «Трансферт и адаптация технологий по точному земледелию при производстве продукции растениеводства по принципу «демонстрационных хозяйств» (полигонов) в Северо-Казахстанской области».

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

1. Михайленко, И.М., Тимошин, В.Н. Математическое моделирование и оценивание химического состояния почвенной среды по данным дистанционного зондирования земли // Международный научно-исследовательский журнал. 2018. № 92 (75). С.26-38.

2. Токарева, О.С. Обработка и интерпретация данных дистанционного зондирования Земли: учебное пособие. Томск: Изд-во Томского политехнического университета. 2010. 148 с.

3. Левитин, А.В. Алгоритмы: введение в разработку и анализ. Издательский дом Вильямс. 2006. 574 с.

4. Журавлев, Юрий Иванович, В. В. Рязанов, и О. В. Сенько. Распознавание. Математические методы. Программная система. Практические применения. 2006. 176 с.

5. Azizan, F.A., Roslan, N., Ruslan, R., Aznan, A.A. and Yusoff, A.Z.M. Soil NPK Variability Mapping for Harumanis Mango Grown in Greenhouse at Perlis, Malaysia, International Journal on Advanced Science, Engineering and Information Technology. 2019. № 9(2), pp.495-501.

6. Baumgardner M F, Silva L F, Biehl L L, Stoner E R. Reflectance properties of soils, Adv Agron, 1986. № 38. pp. 1-44

7. Ben-Dor E. Quantitative remote sensing of soil properties, Adv Agron. 2002. №75. pp 173-243

8. Ben-Dor E, Irons J R, Epema G F. Soil reflectance, In Remote Sens for the Earth Sciences: Manual of Remote Sens. New York: John Wiley & Son Inc. 2003. 3rd ed. 3. pp. 111-188.

9. Breiman, L. 2001. Random forests, Machine learning. №45 (1), pp.5-32.

10. Condit H. R. The spectral reflectance of American soils, Photogramm Eng Remote Sensing. 1970. №36. pp. 955-966

11. Condit H. R. Application of characteristic vector analysis to the spectral energy distribution of daylight and the spectral reflectance of American soils, Appl Opt. 1972. № 11(1). pp. 74-86

12. Fan, J.R., Zhang, J.H., Zhong, X.H., Liu, S.Z. and Tao, H.P. Monitoring of soil erosion and assessment for contribution of sediments to rivers in a typical watershed of the Upper Yangtze River Basin, Land Degradation & Development. 2004. № 15(4), pp.411421.

13. Gaffer, R.L., Flanagan, D.C., Denight, M.L. and Engel, B.A. Geographical information system erosion assessment at a military training site, Journal of soil and water conservation. 2008. № 63(1), pp.1-10.

14. Ge, Y., Thomasson, J.A. and Sui, R. Remote sensing of soil properties in precision agriculture: A review, Frontiers of Earth Science. 2011.5(3), pp.229238.

15. Halder, J.C. Land suitability assessment for crop cultivation by using remote sensing and GIS, Journal of geography and Geology. 2013. №5 (3), pp.65.

16. Kristof S. J. Preliminary multispectral studies of soils, J Soil Water Conserv. 1971. № 26: pp. 15-18

17. López-Granados, F., Jurado-Expósito, M., Peña-Barragán, J.M. and García-Torres, L. Using geo-statistical and remote sensing approaches for mapping soil properties, European Journal of Agronomy. 2005. №23 (3). pp.279-289.

18. Mitchell, T.M. Does machine learning really work? AI magazine. 1997. № 18(3), pp.11-11.

19. Patel, A.K., Ghosh, J.K. and Sayyad, S.U. Fractional abundances study of macronutrients in soil using hyperspectral remote sensing, Geocarto International. 2020. pp.1-20.

20. Yuzugullu, O., Lorenz, F., Fröhlich, P. and Liebisch, F. Understanding Fields by Remote Sensing: Soil Zoning and Property Mapping, Remote Sensing. № 2020. № 12(7). p.1116.

21. Zeng, Z.Y., Cao, J.Z., Gu, Z.J., Zhang, Z.L., Zheng, W., Cao, Y.Q. and Peng, H.Y. Dynamic monitoring of plant cover and soil erosion using Remote Sensing, mathematical modeling, computer simulation and GIS techniques, American Journal of Plant Sciences. 2013. № 4(07). p.1466.

i Надоели баннеры? Вы всегда можете отключить рекламу.