Научная статья на тему 'ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАЗРАБОТКИ МОДЕЛИ РАСПОЗНАВАНИЯ ПОРАЖЕНИЙ КУЛЬТУРНЫХ РАСТЕНИЙ'

ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАЗРАБОТКИ МОДЕЛИ РАСПОЗНАВАНИЯ ПОРАЖЕНИЙ КУЛЬТУРНЫХ РАСТЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
658
115
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОКЛАССОВАЯ КЛАССИФИКАЦИЯ / НЕЙРОННЫЕ СЕТИ / ТЕХНОЛОГИИ РЕГУЛЯРИЗАЦИИ / ПЕРЕОБУЧЕНИЕ / ПОРАЖЕНИЕ КУЛЬТУРНЫХ РАСТЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Янишевская Наталья Александровна, Болодурина Ирина Павловна

В Российской Федерации агропромышленный комплекс является одной из лидирующих отраслей экономики с объемом внутреннего валового продукта 4,5 %. России принадлежат 10 % всех пахотных земель мира. Согласно данным о посевных площадях по культурам в 2020 году, большую часть сельскохозяйственных площадей России занимает пшеница. Российская Федерация занимает третье место в рейтинге стран-лидеров по производству данного вида зерновых культур, а также лидирующие позиции по ее экспорту. Бурая (листовая) и линейная (стеблевая) ржавчина - наиболее вредоносная болезнь зерновых культур. Она является причиной изреженности посевов пшеницы и приводит к резкому снижению урожайности. Поэтому одной из главных задач аграриев является сохранение урожая от заболеваний. Помочь справиться с этой задачей способно применение таких областей искусственного интеллекта, как компьютерное зрение, машинное обучение и глубокое обучение. Данные технологии искусственного интеллекта позволяют успешно решать прикладные задачи агропромышленного комплекса при помощи автоматизированного анализа фотоматериалов. Цель исследования. Рассмотреть применение методов компьютерного зрения для задачи классификации поражений культурных растений на примере пшеницы. Материалы и методы. Набор данных CGIAR Computer Vision for Crop Disease для задачи распознавания поражений культурных растений взят из открытого источника Kaggle. Предлагается использовать подход к распознаванию поражений культурных растений с использованием известных нейросетевых моделей ResNet50, DenseNet169, VGG16 и EfficientNet-B0. На вход нейросетевым моделям поступают изображения пшеницы. Выходом нейронных сетей является класс поражения растения. Для преодоления эффекта переобучения нейронных сетей исследуются различные техники регуляризации. Результаты. Приводятся результаты качества классификации, оцениваемые с использованием метрики F1-score, являющейся среднегармоническим между мерами Precision и Recall. Заключение. В результате проведенного исследования установлено, что наилучшую точность распознавания показала модель DenseNet c применением комбинации технологии трансферного обучения и технологий регуляризации DropOut и L2 для преодоления эффекта переобучения. Применение данного подхода позволило достичь точности распознавания 91 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Янишевская Наталья Александровна, Болодурина Ирина Павловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF COMPUTER VISION TECHNOLOGIES FOR THE DEVELOPMENT OF A MODEL FOR THE RECOGNITION OF LESIONS OF CULTIVATED PLANTS

In the Russian Federation, the agro-industrial complex is one of the leading sectors of the economy with a volume of domestic product of 4.5%. Russia owns 10 % of all arable land in the world. According to the data on the sown areas by crops in 2020, most of the agricultural area of Russia is occupied by wheat. The Russian Federation ranks third in the ranking of leading countries in the production of this type of grain crops, as well as leading positions in its export. Brown (leaf) and linear (stem) rust is the most harmful disease of grain crops. It is the reason for the sparseness of wheat crops and leads to a sharp decrease in yield. Therefore, one of the main tasks of farmers is to preserve the crop from diseases. The application of such areas of artificial intelligence as computer vision, machine learning and deep learning is able to cope with this task. These artificial intelligence technologies allow us to successfully solve applied problems of the agro-industrial complex using automated analysis of photographic materials. Aim. To consider the application of computer vision methods for the problem of classification of lesions of cultivated plants on the example of wheat. Materials and methods. The CGIAR Computer Vision for Crop Disease dataset for the crop disease recognition task is taken from the open source Kaggle. It is proposed to use an approach to the recognition of lesions of cultivated plants using the well-known neural network models ResNet50, DenseNet169, VGG16 and EfficientNet-B0. Neural network models receive images of wheat as input. The output of neural networks is the class of plant damage. To overcome the effect of overfitting neural networks, various regularization techniques are investigated. Results. The results of the classification quality, estimated by the software using the F1-score metric, which is the average harmonic between the Precision and Recall measures, are presented. Conclusion. As a result of the conducted research, it was found that the DenseNet model showed the best recognition accuracy using a combination of transfer learning technology and DropOut and L2 regulation technologies to overcome the effect of retraining. The use of this approach allowed us to achieve a recognition accuracy of 91%.

Текст научной работы на тему «ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАЗРАБОТКИ МОДЕЛИ РАСПОЗНАВАНИЯ ПОРАЖЕНИЙ КУЛЬТУРНЫХ РАСТЕНИЙ»

Информатика и вычислительная техника

УДК 004.93 DOI: 10.14529/ctcr210301

ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ РАЗРАБОТКИ МОДЕЛИ РАСПОЗНАВАНИЯ ПОРАЖЕНИЙ КУЛЬТУРНЫХ РАСТЕНИЙ

Н.А. Янишевская, И.П. Болодурина

Оренбургский государственный университет, г. Оренбург, Россия

В Российской Федерации агропромышленный комплекс является одной из лидирующих отраслей экономики с объемом внутреннего валового продукта 4,5 %. России принадлежат 10 % всех пахотных земель мира. Согласно данным о посевных площадях по культурам в 2020 году, большую часть сельскохозяйственных площадей России занимает пшеница. Российская Федерация занимает третье место в рейтинге стран-лидеров по производству данного вида зерновых культур, а также лидирующие позиции по ее экспорту. Бурая (листовая) и линейная (стеблевая) ржавчина - наиболее вредоносная болезнь зерновых культур. Она является причиной изреженности посевов пшеницы и приводит к резкому снижению урожайности. Поэтому одной из главных задач аграриев является сохранение урожая от заболеваний. Помочь справиться с этой задачей способно применение таких областей искусственного интеллекта, как компьютерное зрение, машинное обучение и глубокое обучение. Данные технологии искусственного интеллекта позволяют успешно решать прикладные задачи агропромышленного комплекса при помощи автоматизированного анализа фотоматериалов. Цель исследования. Рассмотреть применение методов компьютерного зрения для задачи классификации поражений культурных растений на примере пшеницы. Материалы и методы. Набор данных CGIAR Computer Vision for Crop Disease для задачи распознавания поражений культурных растений взят из открытого источника Kaggle. Предлагается использовать подход к распознаванию поражений культурных растений с использованием известных нейросетевых моделей ResNet50, DenseNet169, VGG16 и EfficientNet-B0. На вход нейросетевым моделям поступают изображения пшеницы. Выходом нейронных сетей является класс поражения растения. Для преодоления эффекта переобучения нейронных сетей исследуются различные техники регуляризации. Результаты. Приводятся результаты качества классификации, оцениваемые с использованием метрики F1-score, являющейся среднегармоническим между мерами Precision и Recall. Заключение. В результате проведенного исследования установлено, что наилучшую точность распознавания показала модель DenseNet c применением комбинации технологии трансферного обучения и технологий регуляризации DropOut и L2 для преодоления эффекта переобучения. Применение данного подхода позволило достичь точности распознавания 91 %.

Ключевые слова: многоклассовая классификация, нейронные сети, технологии регуляризации, переобучение, поражение культурных растений.

Введение

В настоящее время довольно сложно представить какую-либо отрасль экономики, в которой бы не использовались информационные технологии. Отрасль сельского хозяйства не является исключением, хотя и занимает последнее место по уровню проникновения новейших технологий согласно данным центра по развитию инноваций McKinsey.

Согласно данным о посевных площадях по культурам в 2020 году, большую часть сельскохозяйственных площадей России занимает пшеница. Российская Федерация занимает третье место в рейтинге стран-лидеров по производству данного вида зерновых культур, а также лидирующие позиции по ее экспорту. Поэтому одной из главных задач аграриев является сохранение урожая от заболеваний. Бурая листовая ржавчина пшеницы - наиболее вредоносная болезнь растения. Она является причиной изреженности посевов пшеницы и приводит к резкому снижению урожайности.

Помочь справиться с этой задачей способно применение таких областей искусственного интеллекта, как компьютерное зрение, машинное обучение и глубокое обучение, которые позволяют успешно решать прикладные задачи агропромышленного комплекса при помощи автоматизированного анализа фотоматериалов.

Таким образом, становится актуальной задача применения технологий компьютерного зрения для разработки модели распознавания поражений культурных растений.

1. Обзор исследований

Исследователи изучили различные решения для прогнозирования заболеваний на основе данных сельскохозяйственных культур. Некоторые из этих работ, предложенных за последние несколько лет, представлены ниже.

В статье [1] разработан алгоритм выявления болезней на таком лекарственном растении, как куркума. Для этого была создана и обработана база данных, состоящая из 200 различных изображений листьев куркумы, с использованием сегментации изображений методом k-средних и проведен текстурный анализ изображений листьев с использованием матрицы совпадения уровня серого (GLCM). Для классификации объектов был использован SVM-классификатор. Объекты предварительно были извлечены из изображений, а также проведено ранжирование атрибутов с использованием критерия прироста информации (Information Gain, IG). Выявлено, что точность SVM-классификатора составила 91 %.

Работа [2] описывает подход к выявлению болезней риса с помощью применения искусственного интеллекта (ИИ) и эффективных методов компьютерного зрения. В данной статье авторы рассмотрели гибридную модель, объединив метод вектора опорных векторов (SVM) и свер-точную нейронную сеть (CNN) под названием Deep CNN (DCNN) для классификации изображений болезни риса. Для улучшения предложенной модели была использована методика трансфертного обучения. После этого 1080 изображений набора данных, включающих изображения девяти различных болезней риса, используются для повторного обучения предложенной модели. Затем классификатор SVM обучается с помощью признаков, извлеченных из модели DCNN. Предложенная модель идентифицировала и классифицировала 270 изображений тест-набора данных болезней риса и достигла точности 97,5 %.

В статье [3] приведено сравнение производительности использования семи предварительно обученных глубоких сверточных нейронных сетей (AlexNet, GoogLeNet, ResNet18, ResNet101, InceptionV3, InceptionResNetV2, SqueezeNet), которые использовали метод тонкой настройки для сохранения последних трех полных слоев соединения и получения модели классификации. Авторы применили предложенный метод к классификации набора данных листьев Cinnamomum Camphora, и экспериментальные результаты показали, что рассмотренный метод является достаточно эффективным и выполнимым. Из экспериментальных результатов можно сделать вывод, что изучение признаков с помощью сети глубокого обучения может обеспечить лучшую точность классификации изображений листьев по сравнению с обработанными вручную признаками. Кроме того, показано, что различная структура является важным фактором для идентификации различных видов растений с точностью от 69,8 до 95,3 %.

Ряд работ посвящен рассмотрению набора данных Plant Village Dataset. Так, в работе [4] авторами разработано приложение dCrop, определяющее заболевание сельскохозяйственных культур на основе фотографии. Предложена модель прогнозирования болезней сельскохозяйственных культур с использованием глубоких сверточных нейронных сетей. В работе использован набор данных Plant Village Dataset, в котором содержится 54306 изображений, содержащих фотографии как зараженных листьев (38 различных заболеваний культурных растений), так и здоровых. Обученная модель глубокого обучения, а также приложение подвергаются серии тестов, чтобы обеспечить использование предлагаемой системы для производства. Обученная модель достигла точности 99,24 % и может идентифицировать 14 видов сельскохозяйственных культур и 26 болезней.

Предлагаемый в исследовании [5] метод фокусируется на реализации усовершенствованной техники сегментации с использованием комбинации пороговых и морфологических операций. Для классификации авторы использовали глубокую нейронную сеть. Предложенный ими метод достиг точности 99,25 %.

В работе [6] также исследуется открытый набор данных Plant Village Dataset, который включает 15 200 изображений листьев сельскохозяйственных культур. Числовые значения таких характеристик, как средняя взвешенная точность (Avg Weighted Précision) и точность (Accuracy) для предложенной авторами остаточной сетевой модели ResNet34 составили 96,51 и 99,40 % соответственно. Кроме того, в рамках исследования авторами проведен сравнительный анализ данных показателей производительности для модели ResNet и методами SVM, k-NN, Decision Tree и Logistic Regression. В результате исследования установлено, что предложенная модель показала лучшие результаты классификации.

В исследовании [7] реализовано глубокое обучение для обнаружения и классификации того, является ли лист сахарного тростника больным или здоровым. Архитектура использовала простую CNN с 7 различными классами для классификации листьев сахарного тростника. Достигнутая точность составила 95 %.

Таким образом, анализ источников зарубежных авторов показал, что исследования в агро-секторе с применением компьютерного зрения актуальны на сегодняшний день. Кроме этого, выявлено, что для задач компьютерного зрения широко применяются сверточные нейронные сети.

2. Постановка задачи

Пусть X œ Rd - пространство признаков, Y = ¡1.....А:} - множество классов, F = {X х7 —>Щ -

параметрическое семейство функций. Задана простая выборка L = . i'(x;jjj с X х Y . Задача

классификации состоит в выборе функции из F, доставляющей минимум функционала качества классификации:

/ =argminJ-^(/(x;),nL

feF [n г=1 J

где l : Y xY —>R+- функции потерь. Классификатором тогда будет

h е H = < hf : X ^ Y, hf (х) = argmax f (х,y) | f e F l.

I yeY J

При |Y| = 2 классификация называется бинарной, при |Y| > 2 - многоклассовой.

3. Классификация поражений культурных растений

3.1. Описание набора данных

Основная часть набора данных CGIAR Computer Vision for Crop Disease [8] собрана международным центром улучшения урожая кукурузы и пшеницы (International Maize and Wheat Improvement Center, CIMMYT) и его партнерами в Эфиопии и Танзании. Остальные данные получены из общедоступных изображений, найденных в Google Images.

На основе данного набора данных необходимо построить модель машинного обучения, позволяющую точно классифицировать пшеницу на изображениях на 3 класса: здоровую пшеницу, пшеницу, зараженную бурой (листовой) или линейной (стеблевой) ржавчиной.

Некоторые изображения могут содержать как стеблевую, так и листовую ржавчину, однако всегда есть один тип ржавчины, который является более доминирующим, чем другой. Цель состоит в том, чтобы классифицировать изображение в соответствии с типом пшеничной ржавчины, которая появляется наиболее заметно на изображении.

Описание набора данных представлено в табл. 1.

Таблица 1

Описание набора данных

Table 1

Description of the data set

Год создания Кол-во классов Сол-во изображений

Healthy wheat Leaf rust Stem rust

2019 3 118 304 246

3.2. Архитектуры нейронных сетей

Для проведения классификации поражений культурных растений будем использовать существующие архитектуры сверточных нейронных сетей. В табл. 2 представлены их характеристики.

Таблица 2

Характеристики сверхточных нейронных сетей

Table 2

Characteristics of convolutional neural networks

Структура Год Top-1 Top-5 Количество

модели создания Accuracy, % Accuracy, % слоев

VGG16 [9] 2014 74,4 91,90 16

DenseNet169 [10] 2016 76,2 93,15 169

ResNet50 [11] 2019 83,2 96,50 50

EfficientNet-B0 [12] 2020 84,3 97,10 237

3.3. Многоклассовая классификация с применением технологии Transfer Learning Поскольку набор данных содержит небольшое количество изображений, применим технологию трансферного обучения [13, 14]. Идея трансферного обучения строится на том, что знания, накопленные в модели, подготовленной для выполнения одной задачи, могут быть перенесены на другую модель, чтобы помочь в построении прогнозов для другой, родственной задачи. Применим рассмотренные выше архитектуры нейронных сетей к набору данных.

В табл. 3 представлены значения метрик Precision, Recall и F1-score для рассматриваемых архитектур нейронных сетей.

Таблица 3

Значения метрик для различных архитектур CNN

Table 3

Metric values for different CNN architectures

Структура модели Precision Recall F1-score

healthy wheat leaf rust stem rust healthy wheat leaf rust stem rust healthy wheat leaf rust stem rust

ResNet 0,97 0,73 0,81 0,74 0,83 0,85 0,84 0,77 0,83

DenseNet 0,91 0,87 0,85 0,82 0,84 0,93 0,86 0,85 0,89

VGGNet 0,95 0,71 0,89 0,74 0,89 0,83 0,83 0,79 0,86

EfficientNet 0,88 0,76 0,81 0,81 0,85 0,83 0,84 0,88 0,86

Согласно данным табл. 3, можно сделать следующие выводы. Наилучшую точность классификации изображений здоровой пшеницы показала модель DenseNet (82 %), с поражением листьев - модель VGGNet (89 %), с поражением стеблей - модель DenseNet (93 %). Наихудшую точность классификации изображений здоровой пшеницы показали модели ResNet и VGGNet (74 %), с поражением листьев - модель ResNet (83 %), с поражением стеблей - модели VGGNet и EfficientNet (83 %).

На рис. 1-4 представлены графики точностей и потерь на этапах обучения и валидации.

Обратим внимание на графики точностей и потерь на этапах обучения и проверки. На них четко наблюдается эффект переобучения [15]. Ошибки на обучающих данных уменьшаются и приближаются к 0, тогда как ошибки на проверочных данных после некоторой итерации прекращают уменьшаться и замирают на одной отметке. Если происходит переобучение, то модель утрачивает способность к обобщению - возможности распространять обнаруженные на обучающем множестве зависимости и закономерности на новые данные. Поэтому для избежания данного явления будем использовать методы регуляризации: Early Stopping, L1 и Ь2-регрессии, DropOut.

Trair-Val Асс uracyf Epoch Trairi-Val Loss/Epoch

epochs epochs

Рис. 1. График точностей и потерь на этапах обучения и проверки (модель ResNet50) Fig. 1. Graph of accuracy and loss at the training and validation stages (ResNet50)

Рис. 2. График точностей и потерь на этапах обучения и проверки (модель DenseNet169) Fig. 2. Graph of accuracy and loss at the training and validation stages (DenseNet169)

Trsin-Val ДI IM[y'-fni: I Train-Val Loss/Epoch

epochs epochs

Рис. 3. График точностей и потерь на этапах обучения и проверки (модель VGG16) Fig. 3. Graph of accuracy and loss at the training and validation stages (VGG16)

Train-Val Accuracy/Epoch Trairi-Val Loss/Epoch

epochs epochs

Рис. 4. График точностей и потерь на этапах обучения и проверки (модель EfficientNet-B0) Fig. 4. Graph of accuracy and loss at the training and validation stages (EfficientNet-B0)

3.4. Оценка качества применения методов регуляризации

На рис. 5 приведена диаграмма - изменение разности логарифмической функции потерь на этапах обучения и проверки на последней эпохе обучения.

Поскольку не существует определенного числового значения, характеризующего преодоление эффекта переобучения, будем считать, что модели удалось снизить эффект переобучения при значении разности между логарифмическими функциями потерь 0,05.

Рис. 5. Разности логарифмической функции потерь с порогом у = 0,05 Fig. 5. Differences of the logarithmic loss function with a threshold of у = 0,05

В табл. 4 приведены средневзвешенные значения метрики F1-score для рассматриваемых архитектур нейронных сетей.

Таблица 4

Средневзвешенные значения метрики F1-score для различных CNN

Table 4

Weighted average values of the F1-score metric for various CNNs

CNN TL ES L2 L2+ES L1 DropOut DropOut + L1 DropOut + L2

ResNet 0,81 0,79 0,86 0,82 0,87 0,80 0,87 0,88

DenseNet 0,87 0,84 0,89 0,87 0,87 0,90 0,87 0,91

VGGNet 0,83 0,81 0,83 0,85 0,81 0,84 0,87 0,88

EfficientNet 0,86 0,88 0,87 0,86 0,85 0,86 0,87 0,88

Согласно данным табл. 4, можно сделать следующие выводы.

1. Применение всех методов регуляризации, кроме ранней остановки, для модели ResNet помогло снизить эффект переобучения. Однако применение метода DropOut незначительно, но снизило значение F1-меры.

2. Снизить переобучение для модели DenseNet помогли такие техники, как DropOut совместно с применением L1 и Ь2-регуляризации, при этом значение F1-меры не ухудшилось.

3. Для модели VGGNet ни одна из рассмотренных методик регуляризации не помогла снизить эффект переобучения.

4. Применение всех методов регуляризации, кроме ранней остановки и DropOut для модели EfficientNet, помогли снизить эффект переобучения, однако L1-регуляризация при этом уменьшила значение F1-меры.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Отметим, что совместное применение технологии DropOut и L2-регуляризации помогло не только снизить эффект переобучения, но и повысить показатель F1-меры на наибольшее количество процентов относительно показателей при трансферном обучении. Кроме этого, для модели ResNet наблюдается повышение данной характеристики на 7 %, что является наибольшим приростом среди рассмотренных моделей.

6. Модель DenseNet показала наилучшие результаты классификации со значением F1-меры, равным 91 %.

Заключение

В рамках данного исследования проведена многоклассовая классификация поражений культурных растений на примере пшеницы. Применение технологии трансферного обучения для решения проблемы недостаточного количества данных помогло достичь достаточно высоких показателей точности. Так, наилучшую точность классификации здоровой пшеницы (82 %) и пшеницы с поражением стеблей (93 %) показала модель DenseNet, модель VGGNet верно классифицировала 89 % изображений с поражением листьев. Однако анализ графиков точностей и потерь на этапах обучения и проверки показал, что на всех моделях наблюдается эффект переобучения, что снижает их обобщающую способность. В данной работе рассмотрены следующие технологии для снижения эффекта переобучения: Early Stopping, L1 и L2-регуляризация, DropOut.

В результате проведенного исследования установлено, что наилучшую точность распознавания показала модель DenseNet c применением комбинации технологии трансферного обучения и технологий регуляризации DropOut и ридж-регрессии (L2) для преодоления эффекта переобучения. Применение данного подхода позволило достичь значения F1-меры 91 %.

Литература/References

1. Kuricheti G., Supriya P. Computer Vision Based Turmeric Leaf Disease Detection and Classification: A Step to Smart Agriculture. 3rd International Conference on Trends in Electronics and Informatics (ICOEI), 2019, pp. 545-549. DOI: 10.1109/ICOEI.2019.8862706

2. Md. Jahid Hasan, Shamim Mahbub, Md. Shahin Alom, Md. Abu Nasim. Rice Disease Identification and Classification by Integrating Support Vector Machine with Deep Convolutional Neural Network. 1st International Conference on Advances in Science, Engineering and Robotics Technology (ICASERT 2019), 2019, pp. 1-6. DOI: 10.1109/ICASERT.2019.8934568

3. Huang Z.-K., He C.-Q., Wang Z.-N., Xi J.-M., Huan W., Hou L.-Y. Cinnamomum Camphora Classification Based on Leaf Image Using Transfer Learning. IEEE 4th Advanced Information Technology, Electronic and Automation Control Conference (IAEAC), 2019, pp. 1426-1429. DOI: 10.1109/IAEAC47372.2019.8997791

4. Pallagani V., Khandelwal V., Chandra B., Udutalapally V., Das D., Mohanty S. dCrop: A Deep-Learning Based Framework for Accurate Prediction of Diseases of Crops in Smart Agriculture. IEEE International Symposium on Smart Electronic Systems (iSES) (Formerly iNiS), 2019, pp. 29-33. DOI: 10.1109/iSES47678.2019.00020

5. Md. Arifur Rahman, Md. Mukitul Islam, G.M. Shahir Mahdee, Md. Wasi Ul Kabir. Improved Segmentation Approach for Plant Disease Detection. 2019 1st International Conference on Advances in Science, Engineering and Robotics Technology (ICASERT), 2019, pp. 1-5. DOI: 10.1109/ICASERT.2019.8934895

6. Kumar V., Arora H., Harsh, Sisodia J. ResNet-based approach for Detection and Classification of Plant Leaf Diseases. In Proc. of the International Conference on Electronics and Sustainable Communication Systems (ICESC 2020), 2020, pp. 495-502. DOI: 10.1109/ICESC48915.2020.9155585

7. Militante S., Gerardo B., Medina R. Sugarcane Disease Recognition using Deep Learning. IEEE Eurasia Conference on IOT, Communication and Engineering (ECICE), 2019, pp. 575-578. DOI: 10.1109/ECICE47484.2019.8942690

8. Kaggle Inc. CGIAR Computer Vision for Crop Disease. Available at: https://www.kaggle.com/ shadabhussain/cgiar-computer-vision-for-crop-disease (accessed 24.12.2020).

9. Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition. CoRR, 2015, vol. 1409.1556, pp. 1-14.

10. He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 770-778. DOI: 10.1109/CVPR.2016.90

11. Huang G., Liu Zh., van der Maaten L., Weinberger K. Densely Connected Convolutional Networks. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 22612269. DOI: 10.1109/CVPR.2017.243

12. Tan M., Le Q. EfficientNet-B0: Rethinking Model Scaling for Convolutional Neural Networks. ArXiv, 2019, vol. 1905.11946.

13. Valverde J., Imani V., Abdollahzadeh A., De Feo R., Prakash M., Ciszek R., Tohka J. Transfer Learning in Magnetic Resonance Brain Imaging: A Systematic Review. Journal of Imaging, 2021, vol. 7, no. 66, pp. 1-21. DOI: 10.3390/jimaging7040066

14. Zhuang F., Qi Zh., Duan K., Xi D., Zhu Y., Zhu H., Xiong H., He Q. A Comprehensive Survey on Transfer Learning. Proceedings of the IEEE, 2020, pp. 1-34. DOI: 10.1109/JPROC.2020.3004555

15. Xue Ying. An Overview of Overfitting and its Solutions. Journal of Physics: Conference Series, 2019, vol. 1168, pp. 1-7. DOI: 10.1088/1742-6596/1168/2/022022

Янишевская Наталья Александровна, студент кафедры прикладной математики, Оренбургский государственный университет, г. Оренбург; natalia.yanishevskaya1997@yandex.ru.

Болодурина Ирина Павловна, д-р техн. наук, профессор, заведующий кафедрой прикладной математики, Оренбургский государственный университет, г. Оренбург; prmat@mail.osu.ru.

Поступила в редакцию 22 июня 2021 г.

DOI: 10.14529/ctcr210301

APPLICATION OF COMPUTER VISION TECHNOLOGIES

FOR THE DEVELOPMENT OF A MODEL FOR THE RECOGNITION

OF LESIONS OF CULTIVATED PLANTS

In the Russian Federation, the agro-industrial complex is one of the leading sectors of the economy with a volume of domestic product of 4.5%. Russia owns 10 % of all arable land in the world. According to the data on the sown areas by crops in 2020, most of the agricultural area of Russia is occupied by wheat. The Russian Federation ranks third in the ranking of leading countries in the production of this type of grain crops, as well as leading positions in its export. Brown (leaf) and linear (stem) rust is the most harmful disease of grain crops. It is the reason for the sparseness of wheat crops and leads to a sharp decrease in yield. Therefore, one of the main tasks of farmers is to preserve the crop from diseases. The application of such areas of artificial intelligence as computer vision, machine learning and deep learning is able to cope with this task. These artificial intelligence technologies allow us to successfully solve applied problems of the agro-industrial complex using automated analysis of photographic materials. Aim. To consider the application of computer vision methods for the problem of classification of lesions of cultivated plants on the example of wheat. Materials and methods. The CGIAR Computer Vision for Crop Disease dataset for the crop disease recognition task is taken from the open source Kaggle. It is proposed to use an approach to the recognition of lesions of cultivated plants using the well-known neural network models ResNet50, DenseNet169, VGG16 and EfficientNet-B0. Neural network models receive images of wheat as input. The output of neural networks is the class of plant damage. To overcome the effect of overfitting neural networks, various regularization techniques are investigated. Results. The results of the classification quality, estimated by the software using the Fl-score metric, which is the average harmonic between the Precision and Recall measures, are presented. Conclusion. As a result of the conducted research, it was found that the DenseNet model showed the best recognition accuracy using a combination of transfer learning technology and DropOut and L2 regulation technologies to overcome the effect of retraining. The use of this approach allowed us to achieve a recognition accuracy of 91%.

Keywords: multiclass classification, neural networks, regularization technologies, overfitting, damage to cultivated plants.

N.A. Yanishevskaya, natalia.yanishevskaya1997@yandex.ru,

I.P. Bolodurina, prmat@mail.osu.ru

Orenburg State University, Orenburg, Russian Federation

Received 22 June 2021

ОБРАЗЕЦ ЦИТИРОВАНИЯ

FOR CITATION

Янишевская, Н.А. Применение технологий компьютерного зрения для разработки модели распознавания поражений культурных растений / Н.А. Янишевская, И.П. Болодурина // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». - 2021. - Т. 21, № 3. - С. 5-13. Б01: 10.14529/йсг210301

Yanishevskaya N.A., Bolodurina I.P. Application of Computer Vision Technologies for the Development of a Model for the Recognition of Lesions of Cultivated Plants. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics, 2021, vol. 21, no. 3, pp. 5-13. (in Russ.) DOI: 10.14529/ctcr210301

i Надоели баннеры? Вы всегда можете отключить рекламу.