Научная статья на тему 'Классификация риса на основе спектрального анализа контура изображения зерен'

Классификация риса на основе спектрального анализа контура изображения зерен Текст научной статьи по специальности «Сельское хозяйство, лесное хозяйство, рыбное хозяйство»

CC BY
354
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по сельскому хозяйству, лесному хозяйству, рыбному хозяйству , автор научной работы — Шаззо А. Ю., Усатиков С. В., Мацакова Н. В., Афанасьев А. С., Хуснутдинов И. Р.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация риса на основе спектрального анализа контура изображения зерен»

543.42.633.18.002.612

КЛАССИФИКАЦИЯ РИСА НА ОСНОВЕ СПЕКТРАЛЬНОГО АНАЛИЗА КОНТУРА ИЗОБРАЖЕНИЯ ЗЕРЕН

А.Ю. ШАЗЗО, С.В. УСАТИКОВ, Н.В. МАЦАКОВА,

А.С. АФАНАСЬЕВ, И.Р. ХУСНУТДИНОВ, О.Г. ГРИЦЕНКО

Кубанский государственный технологический университет

Решение актуальных задач селекции и семеноводства, управления технологическими процессами обусловливает необходимость разработки высокоточных способов анализа признаков качества злаковых, бобовых и масличных культур. Так, в селекции и семеноводстве генетически наследуемыми признаками могут быть геометрическая форма и цветовая окраска плода зерновки; а в процессе шлифования крупяных культур важную роль играет отслеживание изменения геометрической формы зерновки, белизны ядра и наличия необработанных участков на ее поверхности.

Основное внимание исследователей было уделено способам идентификации состава зерновой массы, определению состава и массовой доли посторонних примесей [1, 2]; при этом погрешность результатов состав -ляет несколько процентов. Так, созданная промышленная установка Grain Check™ 310 [3, 4] анализирует

Рис. 1

цветные изображения с видеосистемы методами нейронных сетей и определяет состав подаваемой на транспортер зерновой массы различных культур с погрешностью в несколько процентов. Такая точность является предельной при подобном подходе, отличительной особенностью которого можно назвать поиск «особых примет» в очертаниях контура зерновок различных культур и их цветовой раскраске. Интуитивное экспертное выделение параметров или обученная по выборке нейросеть не могут гарантировать распознавание сортов и культур по мелким и внешне малозаметным деталям изображения зерновки с заданной степенью точности. Недостатком нейросетей является также отсутствие детерминированного алгоритма распознавания и теоретической оценки точности проводимой классификации

Перспективность в указанном смысле спектрального Фурье-анализа контура изображения зерновок показана в [1, 2]. Отдельные гармоники спектра можно трактовать как соответствующие тем или иным геометрическим параметрам. Так, первая гармоника спектра соответствует эквивалентному радиусу окружности, третья - степени вытянутости эквивалентного эллипса (окружности « с двумя лепестками»), четвертая -добавлению трех «лепестков»), пятая - четырех (сдвоенного эллипса) и т. д. Любая мелкая деталь контура может быть передана набором гармоник соответствующей частоты. Таким образом, спектр контура позволяет восстанавливать его изображения с любой требуемой точностью и распознавать зерна различных сортов и культур не по отдельным «особым приметам», а по совокупности признаков в целом, в том числе ряду мелких малозаметных деталей контура. Основанная на Фурье-анализе и статистической теории распознавания образов методика идентификации зерновок по геометрической форме их контуров имеет погрешность десятые-сотые доли процента и ниже, в перспективе - любую требуемую точность. Апробация метода проведена на двух выборках (объемом 250 каждая) из двух сортов риса - Альтаир и Краснодар-ский-424 [1].

В данной работе показано, что общепринятая мето -дика классификации риса на ветви, группы, классы по генеральным средним значений показателя отношения длины к ширине Ь/И является необъективной. При оценке закона распределения показателя Ь/И выявлено, что исследуемые сорта риса охватывают смежные классы, группы и даже ветви. Предложен усовершенствованный метод ботанической классификации риса на основе оценки закона распределения показателя Ь/И. Теоретически обоснован метод товароведной оценки риса на основе Фурье-анализа. Разработаны средства для реализации задач идентификации компонентного состава зерновой массы.

а

б

Разработанное программное обеспечение (рис. 1) и созданная экспериментальная установка реализуют следующие этапы спектрального анализа контура зерновок [1]. Рассмотрим контур плоского изображения некоторого компонента зерновой массы, заданный в виде дискретного набора (х,-, у), 1 < I < п, декартовых координат точек на плоском замкнутом контуре без самопересечений. На рис. 1 показаны несколько контуров зерен риса сорта Краснодарский-424: исходные изображения (из цифровой фотографии) с калибрующим кругом диаметром 10 мм (а) и сохраненные в базе данных автоматически вычисленные точки контура (б). После применения стандартного периодического сплайна к каждой координате параметрически заданной плоской кривой получены уравнения х(), у(1), 1 < t < п, где роль параметра t может играть как длина дуги кривой, так и полярный угол (рис. 1, а). Первый позволяет описывать контур любой конфигурации, но дает неустойчивые к «шумам» результаты, второй позволяет описывать только выпуклые области, но устойчив к «шумам».

Поскольку один и тот же контур на плоскости может быть представлен бесконечным числом способов в бесконечном числе систем координат Оху, производился переход к канонической системе координат О’хкук с началом в центре масс плоской фигуры О, ограниченной контуром, и с осями вдоль главных осей инерции. Если масштабировать координаты хк/Ь и укЬ, обезразмерить параметр кривой 5 = МЬ (0 < 5 < 1), а начальную точку при значении параметра р = 0 перенести в точку пересечения контура с осью О'хк, то такое представление в системе координат О 'ху будет единственным.

Спектральная функция к = 0, 1,..., N12 - 1, конту-

ра рассчитывалась с помощью алгоритма быстрого преобразования Фурье, где N - число точек (х у ) на контуре, снятых с равным шагом к = 1^ по параметру 5. Требуется N, равная степени двойки (в данной работе принималось N = 1024), поэтому точки на контуре пересчитывались с равным шагом к. Амплитудный спектр вычислялся как модуль спектральной функции

1к = к = 0, 1,..., N/2 - 1; а фазовый спектр - как ее

противоположный по знаку аргумент 2к=- а^ ($к - №2), к = N/2,..., N - 1. Заметим, что определяющим является амплитудный спектр, поскольку фазовый показывает только угол поворота исходного изображения зерновки и после перехода к канонической системе координат нивелируется. Таким образом, рассчитываются амплитудный и фазовый спектры 2 = {20 , ..., - 1} кон-

тура плоского изображения любого единичного представителя какого-либо компонента зерновой массы.

В связи с высокой вариабельностью геометричег ских размеров и формы рисовой зерновки спектры 2 компонентов зерновой массы представлялись случай-ш>ім ^-мерным вектором, построенным на основе

2У, ... , 2п объема выборки п («обучающей выборки»),

гарантирующей требуемую точность идентификации. После подсчета эмпирического распределения вероятностей случайного вектора 2, доверительных интервалов его центра рассеивания М = {Мо, ... , MN-1} и дисперсии О = {о20 , ... , a2N- 1}, проводилась проверка статистических гипотез о нормальности распределения, значимости.коэффициентов корреляции гд для і-й ид-й координат 2.

Проводимое далее построение эллипсоидов рассеяния опирается только на требование нормальности генеральной совокупности. Поверхности уровня плотности распределения вероятностей нормального случайного вектора 2 задаются уравнением второго порядка

Е

Zk-Mk

Л-1 N-1 Z -M Z:-M:

- 2) Е Ml J J

(І)

=const

i = 0 J = 0, J ( i

о,

и являются эллипсоидами рассеяния [1]. При достаточно большой константе в правой части (1) по правилу «трех сигм» вероятность попадания спектра в эллипсоид рассеяния практически равна единице. Следовательно, если удастся выделить те гармоники в 2 каж-

Таблица 1

Сортриса Ветвь Группа Класс

Краснодарский-424 Китай с ко-яп онская На < 3 Округл озерны е І/а £ 2 Средние 1,8 > І/а > 1,6 І/а = 1,75

Лиман Китайско-японская На < 3 Округлозерные На £ 2 Крупные 2,0 > І/а > 1,8 На = 1,94

Кулон Китайско-японская І/а < 3 Продолговато-зерные 2,0 > На > 3,0 Средние 2,6 > На > 2,3 І/а = 2,5

Регул Китайско-японская І/а < 3 Продолговато-зерные 2,0 > І /а > 3,0 Узкие 2,9 > І/а > 2,6 На = 2,61

Изумруд Индийская І/а > 3 Отсутствует Средние 4 > На > 3,5 На = 3,73

Рис

'j?

2

k = 0

Таблица 2

Сорт риса Статистическая характеристика

среднее генеральное доверительный интервал минимум максимум дисперсия стандартное откло нение стандартная ошибка

нижний верхний

Краснодарский-424 1,75 1,73 1,77 1,50 2,06 0,01 0,10 0,01

Лиман 1,94 1,94 1,98 1,68 2,31 0,01 0,11 0,01

Кулон 2,50 2,48 2,53 1,89 2,77 0,02 0,14 0,01

Регул 2,61 2,53 2,65 1,84 3,58 0,08 0,28 0,03

Изумруд 3,73 3,70 3,79 2,80 4,77 0,07 0,27 0,03

дого сорта каждой культуры, чьи эллипсоиды рассеяния не пересекаются, погрешность такой идентификации будет практически равна нулю.

Объектами исследований являлись элитные сорта риса Краснодарский-424, Лиман, Кулон, Регул, Изумруд, произведенные на сортоучастках ВНИИ риса. В табл. 1 приведена традиционная классификация исследуемых сортов риса по генеральным средним показателя отношения длины к ширине На = Ь/Н. Представлены все ветви, группы и практически все классы (табл. 1), поскольку исследуемые сорта риса, согласно традиционной классификации профессора Г.Г. Гущина, относятся к китайско-японской ветви, за исключением сорта Изумруд из индийской ветви.

В табл. 2 приведены результаты статистической обработки отношения Ь/Н. Анализ экспериментальных данных свидетельствует, что показатель Ь/Н у исследованных сортов риса варьирует в широком диапазоне. При сопоставлении показателей уровня варьирования Ь/Н и доверительных интервалов обнаружены существенные отличительные особенности. Пределы варьирования показателя Ь/Н существенно превышают пределы доверительной области, что не позволяет точно осуществлять идентификацию риса.

Учитывая изложенное, можно сделать вывод, что традиционная классификация риса на ветви, классы и группы по генеральным средним значений показателя Ь/Н не является в полной мере объективной. Для подтверждения данного вывода дополнительно проведена классификация риса по результатам оценки нормальности распределения показателя Ь/Н.

Установлено, что пределы варьирования Ь/Н у всех без исключения сортов таковы, что значительное количество фракций переходит в смежные группы и классы, а в некоторых случаях (сорта Регул и Изумруд)

- ветви.

Экспериментальная проверка закона нормальности распределения показателя Ь/Н также подтвердила эти выводы. На примере исследований риса сорта Регул показано, что по генеральным средним значениям показателя Ь/Н данный сорт относится к китайско-японской ветви (Ь/Н < 3), группе продолговатозерных (3 < Ь/Н < 2) и классу узкозерных (2,6 < Ь/Н < 2,9). При анализе области варьирования вышеперечисленных классификационных характеристик указанный сорт относится к соседней группе округлых зерен, классу крупных, и другой ветви - индийской, классу мелких.

На основе приведенных данных можно заключить, что существующая система классификации не отража-

ет особенностей законов распределения отношения длины риса к ширине.

Указанные особенности дали основание для проведения дальнейших исследований с целью совершенствования методов классификации риса на ветви, группы, классы, а также разработки высокоточных экспрессных методов определения состава зерновой массы, включая идентификацию сортов и определение их количественного содержания в сортосмесях. В ходе исследований одновременному анализу подвергали пробы массой по 25 г и более, при этом сигналы из фотокамеры поступали в компьютер, где осуществлялось преобразование реальных контуров изображений в дискретный набор декартовых координат точек на плоском замкнутом контуре (рис. 1).

Экспериментальная проверка метода проводилась в несколько этапов. На первом этапе осуществляли статистический анализ спектральных функций, полученных на экспериментальной установке. Дана оценка метода воспроизводства контура единичных зерновок в анализируемой пробе на основе нарастающей совокупности гармоник. Важным результатом данного этапа исследований была оценка чувствительности предлагаемого метода при восстановлении сложных участков на поверхности риса в местах примыкания остей и сростка стебля с зерновкой.

На основе сенсорной оценки установлено, что геометрические размеры, форма остей и сростков стебля с зерновкой являются характерными для каждой ветви, группы, сорта. Немаловажным также являлось эффективное решение задачи описания контура зерновки на вентральном и дорсальном участках. В ходе экспериментальных исследований установлено, что чем выше сферичность контура зерновки, тем меньше диаметр нулевой гармоники. Максимальное значение нулевой гармоники обнаружено у длиннозерных сортов риса Кулон, Регул, Изумруд, имеющих сложную конфигурацию остей и сростка стебля с зерновкой. Предлагаемый метод обладает высокой чувствительностью при восстановлении базового контура зерновки за минимальное количество гармоник: на третьей - для округлозерных и пятой - для длиннозерных сортов. Экспериментальные исследования за пределами вышеприведенных гармоник позволили выявить не только характерные признаки идентификации, изложенные выше, но также экспрессно определить длину, ширину и толщину зерновки, ее объем, площадь поверхности, остистость, форму и размеры остей, степень повреждения оболочек в результате самосогревания или механического воздействия.

а

7 8 9 10

А1

в

А,

П -К

(1-3:

0.4:

0.6:

0.Е

>.

1,2^^

1.6

2.8

Рис. 2

Спектры исследуемых сортов, представленные в виде цифровой информации, позволяют хранить и воспроизводить базовые показатели качества в графических файлах, а также из графических файлов вновь восстановить спектральные функции в виде цифровой

информации. Статистический анализ полученных функций позволил сформировать уникальную базу данных, которая в последующем была использована для идентификации компонентного состава зерновой массы на основе Фурье-анализа.

При обобщении результатов исследований дана экспериментальная оценка чувствительности разработанных методов для решения следующих задач:

высокоточное определение принадлежности зерна риса к китайско-японской или индийской ветвям;

возможность идентификации сорта риса и определение его количественного содержания в сортосмеси;

наличие дефектов и внешних повреждений на поверхности зерновки;

наличие посторонних примесей в зерновой массе и их идентификация;

идентификация в зерновой массе обрушенных, целых и дробленых ядер.

При решении задачи высокоточного определения принадлежности к ветвям использовали модельные образцы, состоящие из смеси в известной пропорции рисовых зерновок исследуемых сортов. На рис. 2 (сорта риса: 1 - Краснодарский-424, 2 - Лиман, 3 - Кулон, 4

- Регул, 5 - Изумруд; безразмерные амплитуды гармоник: А0 - нулевой, А1 - первой, А2 - второй) показан ва -риант идентификации модельного образца, в состав которого были включены все исследуемые сорта. На рис. 2, а представлена плотность распределения веро -ятностей амплитуд гармоник нулевой и первой, после проверки нормальности. На рис. 2, б показаны эллипсы рассеяния (1) для нулевой и первой гармоник. При попадании спектра в область пересечения эллипсов 1-5 на рис. 2, б идентификация невозможна, но вероятность этого (и соответственно ошибка) составляет несколько процентов. На рис. 2, в показаны трехмерные эллипсоиды рассеяния (1) для нулевой, первой и третьей гармоник. Идентификация невозможна только при попадании спектра в область пересечения эллипсоидов 1-5 на рис. 2, в. Вероятность этого и соответственно ошибка распознавания составляет доли процента.

При реализации программы идентификации получены графические изображения спектральной функции каждого сорта, представленной в виде плотности вероятности распределения спектральных функций, отражающих любой из анализируемых признаков качества. Для идентификации принадлежности сортов риса к индийской и китайско-японской ветвям достаточно использовать минимальное число гармоник -нулевую и первую, затем с помощью предложенного метода построить плотность вероятности распределения указанных гармоник и провести процедуру идентификации.

Метод позволяет проводить идентификацию принадлежности к ветвям с высокой точностью, несмотря на наличие общих областей у спектров исследуемых сортов, за счет использования в качестве критерия идентификации совокупной функции. В результате идентификации разработанным методом зафиксирован каждый сорт и его количественное содержание в смеси.

При проведении корреляционного анализа установлены высокие значения коэффициентов парной

корреляции между численными значениями амплитуд гармоник, полученных на основе Фурье-анализа, и целым рядом показателей, характеризующих технологические и потребительские свойства зерна риса и продуктов его переработки. В частности, обнаружена тесная корреляционная зависимость между численными значениями амплитуд гармоник 2к и показателями Ь/Н.

В заключение рассмотрим целесообразность применения вейвлет-преобразования для идентификации видов и сортов сельскохозяйственных культур.

Как показано выше, преобразование Фурье для анализа плоского контура зерновок дает неплохие результаты и пока является базовым методом идентификации сортов. Но решение актуальных задач распознавания ставит следующие проблемы:

вариабельность контуров внутри одного сорта может быть очень велика, в результате чего некоторые объекты могут пересекаться при схожести плоских контуров с объектами, принадлежащими другому сорту и даже виду;

при поиске примесей среди зерновой массы не все примеси могут быть определены исходя только из контурного анализа, поскольку их плоское изображение может походить на изображение исследуемой культуры.

Решение указанных проблем возможно, если при анализе каждого объекта учитывать не только его контур, но и цветовые характеристики - общий цветовой фон, локальные всплески отдельных оттенков и т. д. Для анализа цветовой составляющей исследуемых объектов перспективен метод двумерного дискретного вейвлет-преобразования, зарекомендовавший себя в работах по сжатию изображений.

Алгоритм применения преобразования, достигающий полной нормализации результатов вне зависимости от изначального положения объекта на плоскости относительно произвольной системы координат, следующий:

исходя из результатов применения преобразования Фурье, установить центр масс объекта, угол поворота относительно начальной системы координат и размеры изображения, полностью характеризующие объект;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

перенести начало координат в центр масс объекта и произвести поворот осей координат таким образом, чтобы ось абсцисс проходила вдоль максимального удлинения объекта;

нормализовать размеры объекта таким образом, чтобы вне зависимости от разрешения анализируемого изображения геометрические размеры всех объектов совпадали;

провести преобразование цветовых составляющих всех точек, принадлежащих выделенной в предыдущих пунктах области, так, чтобы вместо трех составляющих цвета (ЯвВ) была одна; провести вейвлет-преобразование; упорядочить полученные коэффициенты; отбросить незначащие элементы упорядоченного массива;

сохранить полученные данные.

На основе массива коэффициентов возможно про -водить сравнение результатов преобразования для двух и более объектов. Сравнение также можно проводить по полученному аппроксимирующему ряду.

ВЫВОДЫ

1. Показано, что общепринятая методика классификации риса на ветви, группы, классы по генеральным средним значений показателя отношения длины к ширине L/H является необъективной. При оценке закона распределения показателя L/H выявлено, что исследуемые сорта риса охватывают смежные классы, группы и даже ветви.

2. Предложен усовершенствованный метод ботанической классификации риса на основе оценки закона распределения показателя L/H. Теоретически обоснован метод товароведной оценки риса на основе Фу-рье-анализа. Разработаны средства для реализации задач идентификации компонентного состава зерновой массы, реализованные в компьютерном программном обеспечении и созданной экспериментальной установке.

3. Проведена экспериментальная оценка метода идентификации на модельных образцах. Установлена высокая точность разработанного метода при идентификации на принадлежность к ветвям, группам, классам и сортам с определением количественного содержания компонентов; определении дефектов и внешних повреждений на поверхности зерновки; оценке компонентного состава зерновой массы.

4. Дальнейшее развитие метода предполагает учет не только контура, но и цветовых характеристик объекта. Для анализа цветовой составляющей исследуемых объектов перспективен метод двумерного дискретного вейвлет-преобразования, зарекомендовавший себя в работах по сжатию изображений.

ЛИТЕРАТУРА

1. Шаззо А.Ю., Усатиков С .В., Мацакова Н.В.,Чуб А .Н.

Теоретические и прикладные аспекты спектрального анализа конту -ра изображения злаковых и масличных культур // Изв. вузов. Пище -вая технология. - 2003. - № 1. - С. 53-58.

2. Мацакова Н.В. Теоретическое обоснование и разработка метода определения потребительских свойств риса: Дис. ... канд. техн. наук. - Краснодар: КубГТУ, 2004. - 160 с.

3. Svenson E., Egelberg P., Nordh E., Peterson C. Assessing grain quality using image analysis // Cereal96: Source ND Future Civ.:10th Int. Cereal and Bread Congr., Port Carras (Chalkidiki), June 9-12, 1996: Book Abstr. - Port Carras (Chalkidiki), 1996. - P. 198.

4. Svenson E., Egelberg P., Peterson C., Oste R. "Image" analiza u kontroli kvaliteta zrna // Zito-hleb. - 1999. - 26. - № 6. -P. 198-208.

Кафедра общей математики

Кафедра пищевой инженерии и высоких технологий

Поступила П.07.05 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.