Научная статья на тему 'Теоретические и прикладные аспекты спектрального анализа контура изображения злаковых и масличных культур'

Теоретические и прикладные аспекты спектрального анализа контура изображения злаковых и масличных культур Текст научной статьи по специальности «Сельское хозяйство, лесное хозяйство, рыбное хозяйство»

CC BY
117
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по сельскому хозяйству, лесному хозяйству, рыбному хозяйству , автор научной работы — Шаззо А. Ю., Усатиков С. В., Мацакова Н. В., Чуб А. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Теоретические и прикладные аспекты спектрального анализа контура изображения злаковых и масличных культур»

634.7.001.4

ТЕОРЕТИЧЕСКИЕ И ПРИКЛАДНЫЕ АСПЕКТЫ СПЕКТРАЛЬНОГО АНАЛИЗА КОНТУРА ИЗОБРАЖЕНИЯ ЗЛАКОВЫХ И МАСЛИЧНЫХ КУЛЬ ТУР

А.Ю. ШАЗЗО, С.В. УСАТИКОВ, Н.В. МАЦАКОВА, А.Н. ЧУБ

Кубанский государственный технологический университет

Применение компьютерных методов анализа изображений на основе цифровых технологий открыло широкую перспективу их практического использования при определении ботанических характеристик, технологических свойств и других признаков качества злаковых, бобовых и масличных культур. До настоящего времени основное внимание исследователей было уделено способам идентификации состава зерновой массы, определению состава и массовой доли посторонних примесей. Важная роль в разработке методов идентификации отводится геометрии формы зерновок (см. [1]) [1-13].

Исторически первым, по-видимому, было использование спектрального анализа формы зерновок [4] в начале 1970-х гг. но на несколько десятилетий эти методы были незаслуженно забыты. Основные усилия исследователей в 1980-х гг. были сосредоточены на поиске и выделении набора характеристик геометрии контура, позволяющих за минимальное время идентифицировать состав зерновой смеси. В [5] использовались девять параметров (таких как отношение длины к ширине, квадрата периметра к площади, объем эквивалентного конуса и др.), снимаемых с видеокамеры для дискриминантного анализа. Погрешность для двух сортов пшеницы составила около 2%. Основной целью

[6] было минимизировать количество геометрических параметров для функций классификации. Среди шести используемых параметров введены длина параболического сегмента и тригонометрические функции угла при вершине, но погрешность для двух сортов озимой и яровой пшеницы увеличилась до 23%. В [7-9] в дополнение к набору геометрических параметров для дискриминантного и канонического анализа использованы оттенки серого и других цветов на двумерном изображении зерновок с видеокамеры. Погрешность не превысила 2%, но констатирована необходимость выделения примесей (камней) путем сепарирования

[7]. Сочетание цифровой видеокамеры и лазерного дальномера в [10-11] позволило полупить ооъсмкос трехмерное изображение зерновок и ввести такие геометрические параметры, как размеры бороздки, зародыша и др. Погрешность снизилась до 1,7%, но на двух сортах мягкой пшеницы составила 10%».

Следует отметить, что данную проблему в настоящее время можно считать принципиально решенной в связи с созданием промышленной установки Grain Check™ 310 [12-13], анализирующей цветные изображения с видеосистемы методами нейронных сетей и определяющей состав подаваемой на транспортер зерновой массы различных культур с погрешностью не выше нескольких процентов.

Заметим, что такая точность является предельной при подобном подходе, отличительной особенностью которого можно назвать поиск «особых примет» в очертаниях контура зерновок различных культур. Интуитивное экспертное выделение параметров не может гарантировать приближение контура с любой требуемой точностью, а также распознавание сортов и культур по мелким и внешне малозаметным деталям контура зерновки.

На перспективность в указанном смысле спектрального Фурье-анализа контура указано в [1] в начале 1990-х гг., где предложен экспрессный метод идентификации состава зерновой массы на основе спектра контура изображения и коэффициента отражения компонентов зерновой массы. Отдельные гармоники спектра можно трактовать как соответствующие тем или иным геометрическим параметрам. Так, первая гармоника спектра соответствует эквивалентному радиусу окружности, третья - степени вытянутости эквивалентного эллипса (окружности с двумя «лепестками»), четвертая - добавлению трех «лепестков», пятая

- четырех (сдвоенного эллипса) и т. д. [1]. Любая мелкая деталь контура может быть передана набором гармоник соответствующей частоты. Таким образом, спектр контура в целом может приближать контур с любой требуемой точностью, а набор коэффициентов Фурье - распознавать зерна различных сортов и культур не по отдельным «особым приметам», а по совокупности признаков в целом, в том числе по ряду мелких малозаметных деталей контура.

Попытки установить связи между геометрическими параметрами зерновок и их технологическими характеристиками (среднее содержание белка, средняя масса зерновки и т. д.) дали отрицательный результат [14], но успешно были решены задачи прогноза выхода муки [15], обнаружения различий фракций промежуточных продуктов помола пшеницы [16], оценки качества зерна (распределение крахмальных зерен, струк-

тура белковой матрицы и др.) [17], фракционирования неполированного риса. Хорошие результаты дает сочетание с методом отражательной спектроскопии [18].

Проведенный обзор имеющихся литературных данных показывает, что для решения ряда актуальных задач селекции и семеноводства, управления технологическими процессами и т. д. отсутствуют разработанные методы идентификации, имеющие требуемую точность. Так, в селекции и семеноводстве генетически наследуемыми признаками могут быть геометрическая форма и цветовая окраска плода зерновки. А в процессе шлифования крупяных культур важную роль играет отслеживание изменения геометрической формы зерновки, белизны ядра и наличия необработанных участков на ее поверхности. Перечисленные и целый ряд других задач делают актуальной разработку высокоточных (погрешность - доли процента) способов анализа признаков качества злаковых, бобовых и масличных культур.

В данной работе предлагается основанная на Фу-рье-анализе и статистической теории распознавания образов методика идентификации зерновок по геометрической форме их контуров, имеющая погрешность десятые-сотые доли процента и ниже (в перспективе любую требуемую точность). Апробация метода про-

0° ^ С7

Рис. 1

ведена на двух выборках (объемом 250 зерен каждая) из двух сортов риса - Альтаир и Краснодарский-424.

Рассмотрим контур плоского изображения некоторого компонента зерновой массы, заданный в виде дискретного набора (х„ у,), 1 < /' < п, декартовых координат точек на плоском замкнутом контуре без самопересечений. На рис. 1 показаны несколько контуров сорта Альтаир (а) и Краснодарский-424 (б). Для восстановления остальных точек на контуре применялась линейная и сплайн-интерполяция. Линейная интерполяция давала положительные результаты при наличии у исследуемых объектов изломов и острых углов (для отдельных групп примесеи), а для плавных участков контура необходимо применение сплайн-интерполя-ции. В области расположения зародыша достаточно точные результаты давало только сочетание линейной и сплайн-интерполяции. Способ интерполяции указывается при вводе каждой из пары координат (х„ у,)

Таким образом, аналогично [1], после применения стандартного периодического сплайна к каждой координате параметрически заданной плоской кривой получены уравнения

1 <(<п, (1)

У=Ж),

описывающие контур плоского изображения данного компонента зерновой массы. Заметим, что в (1) предполагается такое количество и расположение опорных точек, которое устраняет ошибку маскировки частот выше частоты Найквиста.

Поскольку один и тот же контур на плоскости может быть представлен бесконечным числом способов (1) в бесконечном числе систем координат Оху, производился переход к системе координат О'хфС началом в центре масс плоской фигуры П, ограниченной контуром, и с осями вдоль главных осей инерции. Координаты центра масс О' вычисляются по известным соотношениям:

= “ Я = (0 • У «Ж

& *** *

I %=’ цу&ф-=~| /(‘И<2>

■ С I

л

5 -1| скёу = | л(/) • у (г)с?г

I '5 I

с помощью численного интегрирования методом Симпсона.

Главные центральные моменты инерции Р\ являются корнями квадратного уравнения [1]

{/■', ь\, )Х- - К-)

где моменты инерции относительно осей О'х’ и О'У и центробежный моменты инерции вычисляются с помощью численного интегрирования по соотношениям:

К =}} угск<їу = \ У2(і)х(і)у(і)с1і,

О 1

■ Руу =|| х2сіхс!у =

й I

= Я\xydxdy = ~ Іх2(ґ)>(/)у (і)ск. і:

Для перехода к главным осям инерции производился поворот системы координат на угол а:

г 2Р„

і єщ а - ■

соБа -

Рг Р1 ~'Р2

(5)

где при /■', = Р2 считается а = 0. Таким образом, (2)—(5) однозначно определяет каноническую систему координат 0'хъук.

Чтобы избежать множественности параметрических представлений контура, в (1) производился переход к единственному параметру р вместо I, имеющему смысл длины дуги кривой:

(6)

.,N-1, (8)

где Аг— число точек (л), у/) на контуре, снятых с равным шагом к = 1 /Ыпо параметру 5. Требуется Ы, равная степени двойки (в данной работе принималось N =512), поэтому точки на контуре пересчитывались по (7) с шагом /?.

Из (8) амплитудный спектр вычислялся как модуль спектральной функции 7.к = |5у. к = 0,1, N12 -1, а фазовый спектр как ее противоположный по знаку аргумент 2к=- а^ (&*.№), к = N12, ... ,М-1.

АЇ

Ш

ИМ-(/)’<*•

Здесь Ь — общая длина контура, характеризующая как геометрические размеры контура, так и то расстояние, с которого он наблюдается. При обработке изображений со сканера расстояние наблюдения (при фиксированном известном разрешении) постоянно и вычисляется, а для цифровой фотокамеры важно знать ее фокусное расстояние и расстояние от фотокамеры

до объекта наблюдения.

Если масштабировать координаты х^/Ь иу^/Ь, обез-

размерить параметр кривой £-р/Ь, (0 <« < 1), а начальную точку при значении параметра р = 0 перенести в точку пересечения контура с осью О'хк, то такое представление в системе координат О'ху будет единственным:

I

Ы5)

0<5< 1.

(7)

Спектральная функция контура рассчитывалась с помощью алгоритма быстрого преобразования Фурье [19, 20]

У>

мм

-4

X, мм

б

Рис. 2

Таким образом, (Т)~(8) позволяет рассчитывать амплитудный и фазовый спектры 2= {/!0,} контура плоского изображения любого единичного представителя какого-либо компонента зерновой массы.

Хорошо известно, что зерновка даже определенного сорта любой культуры обладает широко вариабельными свойствами, в том числе и геометрической формы. Широкая вариабельность признаков зерновок -одна из основных проблем при идентификации. Необ-

ходимо привлечение методов математической статистики [19, 20], Спектр 2 зерновки является случайным //-мерным вектором. Следовательно, необходимо получить выборку 2,, 2побъема п, гарантирующую

требуемую точность для каждого сорта каждой культуры, которую можно назвать «обучающей выборкой». После подсчета эмпирического распределения вероятностей случайного вектора 2, доверительных интервалов его центра рассеиванияМ = {М0, }

и дисперсии £) = {сг0, . • •, 0^-1} проводилась проверка статистических гипотез о нормальности распределения, значимости коэффициентов корреляции координат^.

Проиллюстрируем предлагаемую методику на примере выборок зерен риса сортов Альтаир (рис. 1, а) и Краснодарский-424 (рис.1, б). На рис. 1 показаны плоские изображения нескольких зерен этих двух сортов, полученные на сканере. Изображения со сканера подвергались компьютерной обработке разработанным программным обеспечением в следующей последовательности.

После дискретного преобразования Фурье (8) были рассчитаны спектры контуров каждой зерновки, затем эмпирические распределения вероятностей для каждой гармоники каждого сорта. На рис. 2, а показаны амплитудные спектры центров рассеивания, первые 16 гармоник (от 0 до 15) из 512.

Сплошная лиши соответствует сорту Альтаир, пунктир - Краснодарский-424. Проверка гипотезы нормальности распределения гармоник показывает, что наблюдения не противоречат гипотезе о распределении Гаусса вплоть до уровней значимости выше 0,5.

На рис. 2, б для сорта Альтаир показан контур, восстановленный по 1 -й и 3-й гармоникам спектра и нулевым остальным (кривая 3), в сравнении с исходным (кривая 1) и восстановленным по 1,3 и 5-й гармоникам (кривая 2). Как отмечалось выше, 1-я гармоника соответствует радиусу эквивалентного контура окружности, 3-я - вытянутости эллипса, 5-я - наложению двух эллипсов.

Для сравнения с предлагаемой ниже методикой первоначально используем метод пошагового исклю-

чения наиболее часто используемого в литературе дискриминантного анализа. Среди первых 16 гармоник оказались значимыми для распознавания сортов Альтаир и Краснодарский-424 по линейным показателям классификации только гармоники 1, 3, 8, 11 и 15-я.

Рассчитанные функции классификации для сортов Альтаир (А) и Краснодарский-424 (К) имеют вид

А = -359,608 + 9,784- А1 + 11,921 • АЗ + 16,096 ■ А8 + + 5,904 -А11 +27,885- А15; (9)

К = - 262.766 + 9,021- И1 + 2,841 ■ КЗ + 5.428 • Я8 -

- 5,912- И11 +8,217 -К15. (10)

Здесь А1 - гармоника 1 для сорта Альтаир, НЛ - Краснодарский-424. Погрешность (процент неправильно классифицированных зерен) составила 1,6.

Согласно процедуре дискриминантного анализа, для идентификации какой-либо зерновки вычисляются показатели классификации А и Я по (9)—(10) и зерновка относится к тому сорту, чей показатель максимален. Указанная процедура геометрически означает разделение возможных значений гармоник на два полупространства гиперплоскостью, полученной из усло-

Гл^. 1

55 60 65 А1 70 К1

Рис. 5

вия равенства правых частей (9) и (10). В случае, когда изменяются только две гармоники (например, 1-я и 3-я), а остальные фиксированы, данная гиперплоскость является прямой (рис. 3, прямая ММ). Функция (9) показана на рис. 3 плоскостью 2, (10) - плоскостью 1. Если значения 1-й и 3-й гармоник зерновки попали в полупространство 4 плоскости аргументов, то ее следует считать сортом Альтаир, а в полупространство 3 -Краснодарский-424.

Несмотря на удобство и простоту алгоритма распознавания по функциям классификации, его точность не может быть значительно увеличена, некоторые исходные требования не всегда выполняются. Если требование нормальности генеральной совокупности не вызывает сомнений (в силу применимости центральной предельной теоремы), то требование однородности ковариационных матриц в разных группах не выполняется (отличие между группами не только в математических ожиданиях, но и в дисперсиях и коэффициентах корреляции). Наконец, большие ограничения налагает линейность функций классификации.

Предлагаемая в данной работе методика опирается только на требование нормальности генеральной совокупности. Поверхности уровня плотности распределения вероятностей нормального случайного вектора 2 задаются уравнением второго порядка

I V - Л' Л--1 А1'-’ 7

I 4 *

■21 Ъ,

(л 0 0,^*/

■м.

(11)

и являются эллипсоидами рассеяния [20]. Здесь - коэффициенты корреляции /-й и у-й координат 7. '. При достаточно большой константе в правой части (11) по правилу' «трех сигм» вероятность попадания спектра в эллипсоид рассеяния практически равна единице . Следовательно, если удастся выделить те гармоники в 2 каждого сорта каждой культуры, чьи эллипсоиды рассеяния не пересекаются, погрешность такой идентификации будет практически равна нулю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для выборки из двух сортов риса одномерные эллипсоиды рассеяния (11) и соответствующие одномерные плотности распределения вероятностей показаны на рис. 4: 2 - сорт Альтаир, 1 - Краснодарский-424. Приведены только гармоники 1 (а), 3 (б) и 5 (в), наиболее значимо различающиеся. Видно, что при попадании спектра в окрестность точки В идентификация невозможна. Распознавание по отдельным гармоникам дает ошибку в несколько процентов и выше. Заметим, что эта погрешность не может быть значительно снижена путем совместного использования гармоник из-за их сильной коррелированности.

На рис. 5 показаны двумерные эллипсоиды рассеяния (11) для 1-й и 3-й гармоник (б) и соответствующие двумерные плотности распределения вероятностей (а): 2 - сорт Альтаир, 1 -- Краснодарский-424. При попадании спектра в область пересечения эллипсов 1 и 2 на рис.5, б идентификация также невозможна, но вероятность этого (и соответственно ошибка) С НИЖЛСТС 51 уже до долей процента.

При анализе трехмерных эллипсоидов рассеяния (11) для 1,3 и 5-й гармоник исследованных сортов риса установлено, что идентификация невозможна только при попадании спектра в область пересечения эллипсоидов 1 и 2. Вероятность этого и соответственно ошибка распознавания составляет сотые доли процента.

Таким образом, подбирая такие гармоники спектра, чьи эллипсоиды рассеяния (11) пересекаются по минимуму', для двух сортов риса - Альтаир и Краснодарский-424 при общем количестве 512 гармоник спектра распознавание по 1, 3 и 5-й гармоникам дает погрешность в разделении укачанных сортов в пределах 0,05-0,1%.

выводы :

1. При решении задач селекции, семеноводства, управления технологическими процессами и т. п. для

повышения объективности анализа признаков качества семян злаковых и масличных культур необходима разработка высокоточных методик распознавания их изображений.

2. Предложена методика идентификации семян злаковых и масличных культур по геометрической форме их конгуров, основанная на Фурье-анализе и статистической теории распознавания образов, с погрешно-стью более чем на порядок ниже известных способов.

"X А гт*''^сттда Х'ГЛт'Аттг.тхгт^ uq rrn\/v ш.тгчгчг\_

.UVlVflllAll ilpV/X<V^VU(l 1>U Л ULUW|/ ■

ках (объемом по 250 зерен) для сортов риса Альтаир и Краснодарский-424, При общем количестве 512 гармоник спектра распознавание по 1,3 и 5-й гармоникам давало погрешность в разделении указанных сортов в пределах 0,05-0,1%.

ЛИТЕРАТУРА '

1. Шаззо А.Ю. Интенсификация крупяного производства на основе моделирования технологических процессов: Дис. ... докт. техн. наук, - Краснодар: КубГТУ, 1995. - 380 с.

2. Егоров Г.А. Управление технологическими свойствами зерна. - Воронеж: Изд-во ВГУ, 2000. - 348 с.

3. Мамбиш И.Е. О разделяемости зерновой смеси пшеницы по линейным размерам // Тр. ВНИИЗ. - 1956. - Вып. 31. - С. 33-37,

4. Segerling L.J., Weinberg В. Grain kernel identification by profile analysis II Trans. ASAE, 1973. - P. 324-327,

5. Zayas L, Pomeranz Y., Lai F.S. Discrimination between Arthur and Arkan wheats by image analysis // Cereal Chem. - 1985. - 62. -№6. -P. 478-480.

6. Zayas I., Lai F.S., Pomeranz Y. Discrimination between wheat classes and varieties by image analysis // Cereal Chem. - 1986. -63.-№1.-P. 52-56.

7. Zayas I., Pomeranz Y., Lai F.S. Discrimination of wheat and nonwheat components in grain samples by image analysis // Cereal Chem. - 1989. - 66, - № 3. - P. 233-237.

8. Devaux M.F., Bertrand D., Robert P., Rousset M.

Caracterisation de varietes de bles tendres par analyse d1 image sur grains entiers Premiers resultats // Ind. cereal. — 1991. - 69. — P. 19—23.

9. Devaux M.F., Bertranil D., Robert P., Rousset M. Caratterizzazione di varieta di grano con analisis deliimmagene su chicchi interi // Teen. Molit. - 1992. - 43, - № 12, - P. 1106-1116.

10. Chen C., Chaiang Y.P., Pomeranz Y. Image analysis and characterization of cereal grains with a laser range finder and camera contour extractor // Cereal Chem. - 1989. - 66. - № 6. - P. 466-470.

11. Thomson W.H., Pomeranz Y. Classification of wheat kernels using three-dimensional image analysis // Cereal Chem. - 1991. - 68. -№

4. - P. 357-361.

12. Svenson E., Egelberg P., Nordh E., Peterson C. Assessing grain quality using image analysis // Cereal"96: Source ND Future Civ.:10m Int. Cereal and Bread Congr., Port Carras (Chalkidiki), June 9-12, 1996: Book Abstr.- Port Carras (Chalkidiki), 1996. - P. 198.

13. Svenson E., Egelberg P., Peterson C., Oste R. “Image” analiza u kontroli kvaliteta zma // Zitohleb. - 1999. - 26. - № 6. - P. 198-208.

14. Kubiak A., Fomal S. The application of computer image analysis system in clasification of wheat grains // Acta Acad, agr, ac techn. olsten. Technoi. aliment, - 1994,- № 27. - P. 21-31.

15. Berman М., Bason M.L., Ellison F., Peden G., Wrigley C.W. Image analysis of whole grains to screen for Slour milling yield in wheat breeding // Cereal Chem. - 1996. - 73. - № 3. - P. 338-345.

16. Zavas I.Y., Steele J.L. Image texture analysis for discrimination of mill fractions of hard and soft wheat// Cereal Chem. - 1996. - 73. - № 1.-P. 136-142.

17. Fomal J., Quattrucci E., Jelinskl T. Application of digital

image analysts to durum wheat quality evaluation // Cereal'96: Source ND Future Civ. :10th Int.

Cereal and Bread Congr,, Port Carras (Chalkidiki), June 9-12,1996: Book Abstr.- Port Carras (Chalkidiki),1996. - P. 33.

18. Williams Phi., Morgan Joan E., Cordiero Helena M. Software for comprehensive rapid analysis of cereals and derived products by near-infrared reflectance spectroscopy // Ibid, - P. 57.

19. Гольденберг Л.М., Матюшкин Б.Д., Полик М.И. Цифровая обработка сигналов. - М.: Радио и связь, 1985. - 312 с,

20. Фомин Я.А., Тарловский М.С. Статистическая теория распознавания образов. - М.: Радио и связь, 1986. - 467 с.

Кафедра общей математики

Кафедра технологии переработки зерна и комбикормов

Поступила 23.08.02г.

633.85.539.1.001.4

ОПРЕДЕЛЕНИЕ ВЛАЖНОСТИ И МАСЛИЧНОСТИ СЕЛЬСКОХОЗЯЙСТВЕННЫХ МАТЕРИАЛОВ МЕТОДОМ ЯДЕРНОЙ МАГНИТНОЙ РЕЛАКСАЦИИ

С.М. ПРУДНИКОВ, Б.Я. ВИТЮК, JI.B. ЗВЕРЕВ

Всероссийский научно-исследовательский институт масличных культур им. B.C. Пустовойта

Проблема повышения точности и экспрессное™ измерений основных показателей качества является ключевой при приемке, хранении и переработке сельскохозяйственных материалов. В полной мере это относится и к контролю масличности и влажности мас-лосемян и продуктов их переработки.

По ряду объективных причин в последние годы эта проблема стала наиболее актуальна. Значительно увеличилась разнокачественность масличных семян. Из-за несоблюдения оптимальных сроков уборки се-

мена, поступающие на заготовительные и маслодобывающие предприятия, имеют влажность до 20% и более. С другой стороны, резко возросло количество сдатчиков мелких партий семян, с которыми предприятия должны проводить индивидуальные расчеты с учетом количества и качества сдаваемого сырья. На крупных и даже средних предприятиях число таких сдатчиков достигает иногда нескольких сотен.

Физический износ активной части основных промышленно-производственных фондов маслодобывающих предприятий превышает сегодня 50%, что соответственно снижает эффективность переработки масличных семян. В этих условиях особенно необходим

i Надоели баннеры? Вы всегда можете отключить рекламу.