Методы обработки сигналов : сб. науч. тр. - Вып.
№ 94. - Моск. энерг. ин-т. - М. : 1986. - С. 41-44.
Надшшла 27.03.2009 Шсдя доробки 29.04.2009
Розглядаеться задача визначення середньоквадра-тичноЧ висоти нер1вностей рельефу земно! поверхт за допомогою частотного радю вим1рювача. Подат основт результати теоретичного анал1зу кореляцшног функцИ
eid6umozo cmna^y, ompuManoi 3 ypaxyeannMM ennuey napaMempie pyxy nociM.
A problem is considered for the terrain roughness root mean square height measurement with the FM radio altimeter. Basic results of theoretical analysis of received signal correlation function in view of the carrier motion parameters influence are presented.
УДК 621.384.3
С. В. Морщавка, Д. М. Пиза, Е. Л. Белоусов
ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ ОБРАБОТКИ ПРОПАШНЫХ КУЛЬТУР. РАДИОМЕТРИЧЕСКИЕ АСПЕКТЫ1
Проведены полигонные экспериментальные исследования спектральных характеристик растений с высокой разрешающей способностью. Произведен выбор приемлемого алгоритма распознавания. Показано, что предложенный метод дискриминационного анализа позволяет реализовать среднюю вероятность правильной классификации более 80 %. Полученные результаты показывают принципиальную возможность реализации интеллектуальных технологий в сельскохозяйственном производстве.
ВВЕДЕНИЕ
Известно, что существующие технологии защиты пропашных культур используют механический способ обработки междурядий и механический метод обработки растений в рядке. При этом распыление гербицидов для уничтожения сорных растений производят непрерывно, независимо от того, есть ли на данном участке рядка сорные растения или нет. Недостатки такой технологии очевидны. Во-первых, неоправданно растет количество используемых гербицидов, что приводит к существенному росту затрат на обработку пропашных культур, а также к тотальному загрязнению окружающей среды (грунты, водоемы, атмосфера Земли). Во-вторых, распыление гербицидов на участках, где нет сорных, но есть полезные растения, приводит к накоплению в продуктах питания применяемых гербицидов и продуктов их разложения.
Вполне очевидно, что при современном развитии информационных технологий, теории распознавания, адаптивных методов управления представляется возможным существенным образом изменить технологию возделывания пропашных культур.
© Морщавка С. В., Пиза Д. М., Белоусов Е. Л., 2009
В работах [1-3] предложена и запатентована информационная технология обработки пропашных культур. Предложенная технология базируется на идее распознавания растений с классификацией их на два класса: полезные и сорные. Апостериорная информация, полученная в результате распознавания, используется для реализации адаптивного управления рабочими органами сельскохозяйственной машины. При этом при химическом методе обработки гербициды вносятся только на тех интервалах, где есть сорняки.
ПОСТАНОВКА ЗАДАЧИ
В работе [1] была разработана методика получения данных о спектральных характеристиках отражения от растений. Она заключается в том, что для получения этих характеристик растение в рядке зондируется с бокового направления световым излучением разных длин волн (рис. 1). Отраженное от растения излучение принимается и обрабатывается приемником. Из рис. 1 следует, что система является би-статической [3]. Пространственное разрешение достигается за счет использования перекрещивающихся диаграмм направленности излучателя и приемника. В ранее опубликованных работах [1, 2] предпринимались попытки оценить как возможность классификации растений, так и определить вероятностные характеристики качества распознавания. Однако, разрешающая способность экспериментальной установки, с помощью которой осуществлялся набор отраженных сигналов, была недостаточной. Поэтому, а также
1. Статья написана по результатам совместного украинско-египетского научно-технического проекта «Информационная технология обработки пропашных культур с использованием методов распознавания растительных объектов».
Рисунок 1 - Принцип исследований спектральных характеристик отражения в полевых условиях
Рисунок 2 - Структурная схема устройства
в связи с появившейся возможностью повысить разрешающую способность установки до 2 нм, целесообразно провести более точную оценку потенциальных возможностей распознавания растительных объектов.
АППАРАТНОЕ ОБЕСПЕЧЕНИЕ
ИССЛЕДОВАНИЙ
Используемое для полевых исследований спектральных характеристиках растений устройство не обеспечивало работу в режиме реального времени. Однако это было допустимым, поскольку исследуемые характеристики использовались для выбора оптимального алгоритма распознавания. Структурная схема такой установки показана на рис. 2.
Видеокамера использовалась для автоматической мар-кировки выборок (полезные и сорняки). Необходимость маркировки объясняется тем, что для распознавания классов могут быть использованы алгоритмы с обучением, а для оценки качества - вероятности правильного распознавания, при этом появляется необходимость в априорных знаниях о классе растений.
В качестве датчика изображения использована USB камера - Genius VideoCamEye. При компактных размерах камера обеспечивает разрешающую способность до 640х480 с возможностью программного управления яркостью и контрастностью и выдачей видеоданных в разных форматах.
Датчик местоположения предназначен, с одной стороны, также для маркировки, а с другой стороны, наличие геопространственных отметок позволит в по-
следующем по результатам экспериментальных исследований создать локальную карту засоренности посевов. Для реализации датчика местоположения использован приемник BT-Q920 фирмы QSatarz. Он имеет компактные размеры и позволяет передавать информацию к блоку регистрации данных с помощью Bluetooth интерфейса.
В качестве излучателя использована компактная галогенная лампа с рефлектором мощностью 20 Вт и напряжением питания 12 В.
Спектрометр USB650 фирмы Ocean Optics необходим для измерения мощности спектральных компонент излучения, отраженных от растений. Кроме самого спектрометра предусмотрены интерфейсы к устройству регистрации и оптическая система для улучшения энергетических характеристик устройства (чувствительности, в первую очередь) и согласования поля зрения с размерами растений.
В оптическую систему вошли: волоконно-оптический кабель и коллимирующая линза. Оптический кабель типа P200-2-UV-VIS (на волокне диаметром 200 мкм), производства фирмы Ocean Optics предназначен для соединения спектрометра с линзой 74-VIS. Рабочий диапазон оптического кабеля и линзы избран таким же, как и у спектрометра - 350-1100 нм.
Устройство регистрации необходимо для сохранения полученных характеристик с дополнительной информацией о виде растения и его местоположении. Устройство питания использовано для автономного питания всех узлов и блоков схемы.
Внешний вид собранного устройства изображен на рис. 3.
Рисунок 3 - Внешний вид устройства
г Misrosoft Exel -VideoOCX ■SJ'JÖ
1 4 BMPca5re | One JPG б |
а сл Documents and Sellings Administrator Мои документы f^l videoocx -j Ш Projects ' ■J bmp logger t3Proiekt1.NET2 v
Get GPS data ö
Г Scaled Diiplaii 2 Format 3
Рисунок 4 - Основное окно программы регистрации данных
При разработке программы регистрации использовались программные компоненты, входящие в базовый комплект программного обеспечения спектрометра USB Red Tide 650 фирмы Ocean Optics. В такой комплект вошли как готовые программы SpectraSuite и OOI_base32, так и динамическая библиотека, которая содержит модули для управления спектрометром.
Окно, с помощью которого можно управлять программой регистрации информации, изображено на рис. 4.
Оно содержит следующие поля:
-окно видеоинформации (поз. 1);
- поле управления масштабом изображения в поле 1 (поз. 2);
- кнопка вызова окна настройки формата видеоинформации (поз. 3);
- поле для вывода спектрограмм в графическом виде (поз. 4);
- кнопка запуска автоматического сохранения информации (поз. 5);
- кнопка однократного сохранения изображения в формате JFIF (поз. 6);
- поле выбора папки для сохранения файлов в автоматическом режиме (поз. 7);
- кнопка включения/отключения отображения геопространственной информации (поз. 8).
Программная оболочка активизируется лишь двумя кнопками 5 и 8 (если нужно сохранять геопространственную информацию).
ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
Экспериментальные исследования проводились в два этапа:
- полевые исследования спектров отражения от растений;
- обработка результатов исследований спектров.
На первом этапе с помощью разработанного и изготовленного устройства для исследования спектров растений измерялись относительные спектральные характеристики в автоматическом режиме с периодом 1с с сохранением как текущей спектрограммы, так и дополнительной информации о местоположении и внешнем виде растения.
Характеристики растений в строке снимались последовательно, объектив приемника (спектрометрического блока) перемещался вдоль рядка плавно, без рывков и остановок.
Полученные спектральные зависимости содержат в себе, кроме характеристик, которые с точностью до множителя и постоянной составляющей отвечают спектральным характеристикам отражения, еще и информацию о спектральной яркости излучателя и пропускной способности оптического тракта.
Для того чтобы максимально уменьшить влияние сдвига за счет темнового заряда матрицы ПЗС и линейных искажений, проводилась предварительная обработка полученных спектрограмм:
K = Kh - min ( K%) (1) max ( K) - mi n(Kx), ( )
где Kx н, Kx - нормируемый и измеренный коэффициенты яркости на длине волны соответственно; max(Kx), min(Kx) - максимальный и минимальный измеренные коэффициенты, соответственно.
Поскольку реальное распределение спектральных коэффициентов яркости растений в видимом и ближнем инфракрасном диапазоне можно достаточно точно описать с помощью нормального распределения, то использование непараметрических методов неоправданно из-за плохого соотношения скорости и качества классификации.
Поэтому был выбран класс алгоритмов, которые относятся к оптимальным за Байесом. Одним из таких классификаторов [4], является классификатор, использующий метрику Махаланобиса. В этом случае
Рисунок 5 - Линейный классификатор с использованием метрики Махаланобиса
расстояние между вектором класса, который классифицируется Хк, и средним вектором и определяется как:
тг(Хк) = (Хк - и/ ■ У-1(Хк - и), I = 1,2. (2)
Если допустить, что ковариационные матрицы для обоих классов (полезное растение и сорняки) одинаковы, то решающие границы будут линейными (для многомерного пространства - определяются гиперплоскостью). Тогда вычисления можно существенно упростить.
После несложных превращений можно выделить дискриминирующую функцию в виде:
дг(Хк) = Ш ■ Хк + Шю, { = 1,2, (3)
где
^ = У4 ■ и{, I = 1, 2, = -0, 5 ■ и1 ■ У4 ■ и1. (4)
Структурная схема такого классификатора, известного, как классификатор по метрике Махалонобиса (рис. 5), аналогична линейному классификатору, при этом используется такое же количество операций и нужен такой же объем памяти. С точки зрения соотношения скорости работы и качества распознавания применение такого классификатора является наиболее приемлемым [2], так как по количеству операций он приближается к линейному классификатору, а качество его работы заметно лучше.
РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНЫХ
ИССЛЕДОВАНИЙ
Для проведения экспериментальных исследований был избран тестовый полигон, который расположен вблизи г. Запорожья (рис. 6). Полигон представляет собой несколько полей, на которых подсолнечник высевался в разное время и потому присутствовали растения разных сроков вегетации.
В последующем из полученных экспериментальных данных было отобрано 1355 наборов по 2048 спек-
тральным точкам. Критерием отбора была возможность дешифрации вида растений по изображениям и форме спектральной кривой (отсутствие ограничений и избыточной зашумленности).
Виды растений, которые попали в объектив, их полные названия и количество образцов каждого класса приведены в табл. 1.
В отобранных выборках содержится информация о трех классах, два из которых - растения, а третий -чистая почва. Решение не отсеивать выборки третьего класса на первом этапе было вызвано тем, что наличие трех классов отвечает реальной ситуации при работе сельхозтехники. При работе в поле классификация сначала будет осуществляться на две категории (наличие растений первого и второго класса, их отсутствие - третий класс). И только потом, первая категория разделяется на сорняки и полезные растения.
Есть фактор, который налагает ограничение на количество учебных выборок, - необходимость получить невырожденную ковариационную матрицу. Для этого необходимо, чтобы количество выборок было не меньше количества признаков. При этом количество спектральных коэффициентов будет больше или
Рисунок 6 - Тестовый полигон
Таблица 1 - Видовой состав исследуемых образцов
Вид растения Латинское название Класс и количество выборок
Подсолнух Heliantus cultus 1 (полезная) - 401
Амарант Amaranthus retroflexus 2 (сорняк) - 576
Лебеда Shenopodium album
Молочай Euphorbia falcate
Миший Setaria viridis
Осот Sonchus arvensis
Пырей Agropyrum repens
Участки без растений - 3 (почва) - 378
Вместе: Всего 1355
равняться квадрату признаков и, если между выборками не будет линейных зависимостей, то можно будет без дополнительных мероприятий найти обратную ковариационную матрицу. Как видно из табл. 1, для всей совокупности сорняков можно использовать не больше 576 признаков, для культурных растений не больше 401 признака.
Поскольку аналогово-цифровой преобразователь спектрометра выдает 2048 спектральных коэффициентов, то практически имеет смысл использовать из них не больше 400. С другой стороны, оптика спектрометра обеспечивает разграничение на уровне 2 нм (650 независимых спектральных коэффициентов). Поэтому было решено уменьшить количество коэффициентов до 256 путем усреднения значений соседних 8 спектральных точек. При этом спектральное разрешение снижается до 3,048 нм и, что существенно, уменьшается влияние шумовых компонент.
Нормированные спектральные выборки коэффициентов яркости были подвергнуты разведывательному анализу для того, чтобы выяснить, как соотносится
предложенное количество классов и их реальное количество. Для этих целей проводилась кластеризация данных с использованием разных метрик и объединительных правил. Результаты кластеризации в виде зависимостей объединительных расстояний от количества классов показаны на рис. 7. Как следует из этих графиков, результаты экспериментальных исследований правильнее всего отнести к трем или четырем классам (наибольшие приросты на графике объединительных расстояний). Это значит, что классификация на три класса может дать хорошие результаты.
Еще одним оценочным методом является кластеризация по методу к-ближайших соседей. Средние значения классов, которые были сформированы с помощью такого метода, изображены на рис. 8. Один из классов, которые образовались, четко отвечает участкам без растительности (Cluster 1), а два других приблизительно отвечают растениям разных классов - сорняков (Cluster 2) и полезных (Cluster 3).
Сверив результаты кластеризации с информацией о внешнем виде растений можно оценить качество
Рисунок 7 - Результаты кластеризации: а - по правилу Уорда; б - по простому объединительному правилу
Таблица 2 - Классификационная матрица
Апостериорные данные (в результате классификации) 1(cluster 2) 2 (cluster 3) 3 (cluster 1) Всего
1 259 307 6 572
2 124 255 0 379
3 18 14 372 404
Априорные данные Всего 401 576 378 1355
Достоверность правильной классификации 64,5 % 44,3 % 98,4 %
летворяются все обязательные условия, экспериментальные данные позволяют достаточно успешно классифицировать выборки [5]. Для проверки возможности классифицировать растительные объекты по экспериментальным данным использован блок дискриминационного анализа программы 81аЙ8Йса. Проведение дискриминационного анализа необходимо для того, чтобы определить возможность классификации растительных объектов по спектральным характеристикам, а также оценить качество распознавания. Сначала, согласно методике проведения анализа, проводился отбор заданного количества наиболее значимых признаков.
Поведение характеристик качества распознавания в зависимости от количества использованных признаков обобщено на рис. 9. Из приведенной иллюстрации видно, что качество распознавания до определенного момента слабо изменяется при уменьшении количества использованных признаков, а затем начинается резкое ухудшение вероятности правильного распознавания.
Исходя из этого, можно определить оптимальное количество признаков для распознавания с точки зрения соотношения скорости и качества обработки - 64 (ближайшая степень двойки). Для улучшения качества распознавания количество признаков следует увеличивать, хотя при этом вероятность правильного распознавания увеличивается практически линейно.
На рис. 10 показаны максимально досягаемые показатели распознавания. Если построить дерево классификации так, чтобы сначала отделить участки без растений (где разбрызгивать гербициды нет необходимости), а затем разделять растения на два класса,
p.ii—
78 7G 74 72 70
256 240 224 209 132 17Е 1Е0 144 129 112 9Е 90 Е4 49 32 llll
Рисунок 9 - Изменение вероятности правильного распознавания в зависимости от количества признаков
Рисунок 8 - Результаты кластеризации по методу к-ближайших соседей
распознавания «вслепую» без априорных данных о растениях. Результаты проверки показаны в табл. 2. Из таблицы видно, что такое распознавание возможно, но качество будет низким. Исключением является класс, который отвечает участкам без растений с показателем в 98,4 %. Такая точность определения этих участков позволяет разделить одну задачу классификации с тремя классами на две двухклассовые задачи.
Проверка закона распределения вероятности на нормальность была проведена для оценки возможности применения методов дискриминационного анализа, модели Фишера, метрики Махаланобиса. Иногда в задачах классификации, даже если не совсем удов-
Class Classification Matrix (data in Workbook2.sb Rows: Observed classifications Columns: Predicted classifications
Percent Correct 1 p= ,2959 2 3 0=4251 n=,2790
1 73,31671 88,02083 98,14815 294,0000 63,0000 5,0000 104,0000 3,0000
2 3 507,0000 6,0000 2,0000 371,0000
Total 06,49446 362,0000 613,0000 300,0000
Class Classification Matrix (data in Workbook2.stw) Rows: Observed classifications Columns Predicted classifications
Percent Collect 1 p= ,4104 2 n=,5896
1 76,60796 300,0000 93,0000
2 9027778 56,0000 520,0000
Total 84,749231 3B4,0000 813,0000
Рисунок 10 - Классификационные матрицы для распознавания по полной системе признаков: а - на три класса; б - на два класса
Рисунок 11 - Гистограммы значений дискриминирующих функций
то можно достичь высоких показателей качества распознавания. Участки, на которых отсутствуют растения, будут распознаваться с достоверностью близкой к единице (98,1 %), сорняки с достоверностью 90 %, а полезные с достоверностью 76,8 %.
На практике это значит, что гербициды практически всегда будут экономиться на участках без растений и только 10 % сорняков могут не быть обработанными. Однако, количество необработанных сорняков может быть и меньше, поскольку большая часть из этих 10 % относится к смешанным случаям, когда в объектив спектрометра попадает отражение от смеси полезных растений и сорняков. Причем соотношение между их вкладами в суммарный сигнал приближается к единице, то есть сорные растения не доминируют. При приближении к участкам, где соотношение смещается в сторону сорняков, классификатор относит их к правильному классу.
В процессе исследований оценены распределения значений дискриминирующих функций для двух классов, которые показаны на гистограммах (рис. 11). Очевидно, что они достаточно точно отвечают нормальному.
Поэтому, можно считать, что использование методов линейного дискриминационного анализа в этой задаче правомерно. Кроме того, классы достаточно четко разделяются в пространстве значений дискриминирующих функций.
ВЫВОДЫ
Проверка возможности использования линейного дискриминационного анализа (тесты на нормальность распределений та возможность обращения ковариационной матрицы) обнаружила, что не на всех участках спектра распределение можно считать нормальным, но многомерное распределение, в целом, отвечает нормальному закону, что и позволяет получить обратную матрицу.
Исследования с помощью дискриминационного анализа обнаружили принци
пиальную возможность выделения участков без растительности с достоверностью свыше 98 % и последующей классификации на полезные и сорные со средней вероятностью правильной классификации 84 % (90 % для сорняков и 75 % для подсолнечни-
ка). Такие результаты показывают принципиальную возможность реализации интеллектуальных сельскохозяйственных технологий, использующих классификацию растений на поле.
ПЕРЕЧЕНЬ ССЫЛОК
1. Пиза Д. М. Повышение вероятности распознавания растительных объектов за счет увеличения разрешающей способности лидаров / Д. М. П1за, С. В. Морщав-ка // Кибернетика и вычислительная техника. -1999 г. - Вип. 117. - С. 14-17.
2. Пат. 33759 Украша. МПК (2006) А01 В 39/00. Споаб прополки просапних культур / П1за Д. М., Мор-щавка С. В.; заявник та патентовласник Запор1зький нацюнальний техшчний ушверситет; заявл. 03.03.07; опубл. 10.07.08, Бюл. № 13.
3. Пиза Д. М. Выбор наборов признаков для распознавания растительных объектов / Д. М. П1за, С. В. Мор-щавка // Системний анал1з, управлшня \ ¡нформа-ц1йн1 технологи: В1сник Харювського державного по-л1техшчного ушверситету. Зб1рка наукових праць. Ви-пуск 97. - Харюв: ХДПУ. - 2000. - С. 69-74.
4. Кузнецов А. С. Синтез формы радиолокационного сигнала для распознавания объектов / Кузнецов А. С.
// Зарубежная радиоэлектроника. - 1992. - № 10. -C. 49-60.
5. Боровиков В. П. Популярное введение в программу STATISTICA / Боровиков В. П. - М. : Компьютер Пресс, 1998. - 238 с.
Надшшла 14.05.2009 Шсля доробки 18.05.2009
Проведено пол1гонт експерименталът досл1дження спектральних характеристик рослин з високою розд1лъ-ною здаттстю. Виконано виб1р прийнятного алгоритму розтзнавання. Показано, що запропонований метод дис-крим1нацшного анал1зу дозволяе реал1зувати середню в1рог1дтстъ правилъноЧ класиф1кацп б1лъше тж 80 %. Отримат резулътати показали принципову можлив1стъ реал1зацп ттелектуалъних технологш в с1лъсъкогоспо-дарсъкому виробництв1.
Proving ground experimental studies of high resolution spectral characteristics of plants have been conducted. Appropriate algorithm of recognition has been successfully selected. It has been shown that the proposed method of discriminatory analysis allows to achieve average probability of proper classification exceeding 80 %. The results show that intellectual technologies can be basically used in agricultural production.