Научная статья на тему 'Эффективность распознавания скрытой зараженности зерновок по изображениям в инфракрасном спектре'

Эффективность распознавания скрытой зараженности зерновок по изображениям в инфракрасном спектре Текст научной статьи по специальности «Медицинские технологии»

CC BY
300
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОДЫ РАСПОЗНАВАНИЯ / СКРЫТАЯ ЗАРАЖЕННОСТЬ НАСЕКОМЫМИ ЗЕРНОВЫХ И БОБОВЫХ / ИЗОБРАЖЕНИЕ В БЛИЖНЕМ ИНФРАКРАСНОМ ДИАПАЗОНЕ ИЗЛУЧЕНИЯ

Аннотация научной статьи по медицинским технологиям, автор научной работы — Шаззо А. Ю., Усатиков С. В.

Для выявления скрытой зараженности зерна перспективно применение ближнего инфракрасного излучения (БИК, англ. NIR) с получением изображения на длине волны 0,75-1,1 мкм. Погрешность известных методов распознавания исследуемых объектов, основанных на дискриминантном, кластерном и факторном анализах, а также с применением нейронных сетей, составляет 5-10%. Для снижения погрешности и увеличения скорости распознавания в данной работе предложены нейросетевые модели и статистический классификатор с признаковым пространством из гармоник вейвлет-спектра. Показана более высокая по точности и скорости эффективность распознавания на выборке из приведенных в литературе NIR-изображений размером 640 × 480 пикселей, при длине волны 1305,05 нм, для: здоровой пшеницы, зараженной долгоносиком, зерновым точильщиком, мукоедом, хрущаком.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Шаззо А. Ю., Усатиков С. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Эффективность распознавания скрытой зараженности зерновок по изображениям в инфракрасном спектре»

664:004.931

ЭФФЕКТИВНОСТЬ РАСПОЗНАВАНИЯ СКРЫТОЙ ЗАРАЖЕННОСТИ ЗЕРНОВОК ПО ИЗОБРАЖЕНИЯМ В ИНФРАКРАСНОМ СПЕКТРЕ

А.Ю. ШАЗЗО, С.В. УСАТИКОВ

Кубанский государственный технологический университет,

350072, г. Краснодар, ул. Московская, 2; электронная почта: sv@usatikov.com

Для выявления скрытой зараженности зерна перспективно применение ближнего инфракрасного излучения (БИК, англ. ЫЖ) с получением изображения на длине волны 0,75-1,1 мкм. Погрешность известных методов распознавания исследуемых объектов, основанных на дискриминантном, кластерном и факторном анализах, а также с применением нейронных сетей, составляет 5-10%. Для снижения погрешности и увеличения скорости распознавания в данной работе предложены нейросетевые модели и статистический классификатор с признаковым пространством из гармоник вейвлет-спектра. Показана более высокая - по точности и скорости - эффективность распознавания на выборке из приведенных в литературе МЯ-изображений размером 640 х 480 пикселей, при длине волны 1305,05 нм, для: здоровой пшеницы, зараженной долгоносиком, зерновым точильщиком, мукоедом, хрущаком.

Ключевые слова: методы распознавания, скрытая зараженность насекомыми зерновых и бобовых, изображение в ближнем инфракрасном диапазоне излучения.

В семенах зерновых и бобовых различают явную и скрытую форму зараженности насекомыми-вредителя-ми. Наибольшие трудности представляет борьба со скрытой формой, при которой вредители в разных стадиях развития находятся внутри зерна и повреждений на его поверхности незаметно. Выявление скрытой зараженности традиционно осуществляют с помощью специальных анализов: просмотр семени после его разреза, химические реактивы, рентгенография, электроакустика и другие методы [1, 2].

В последнее время для выявления скрытой зараженности используют ближнее инфракрасное излучение (БИК) (англ. Near Infrared, сокращенно NIR) в ближней ИК-области спектра с длиной волны 0,75-1,1 мкм. Представляет интерес разработка методов сплошной экспресс-диагностики скрытой зараженности зерновой массы, а также распространение этих методов на получивший в настоящее время большое распространение принцип фотосепарации, реализованный в ряде отечественных и зарубежных промышленных установок.

В данной работе рассмотрены возможности повышения - по точности и скорости - эффективности распознавания скрытой зараженности зерна пшеницы на выборке из приведенных в литературе NIR-изображений. Предложены нейросетевая (НС) модель и разновидность статистического классификатора с признаковым пространством из гармоник вейвлет-спектра. Отметим, что метод сплошной экспресс-диагностики скрытой зараженности зерновой массы требует также выработки процедуры получения NIR-изображений, пригодной для промышленного применения принципа фотосепарации. Это задача дальнейших исследований и в настоящей работе не рассматривается.

Особенностью применения ИК-излучения в пищевой промышленности является возможность проник-

новения электромагнитной волны в такие капиллярно-пористые продукты, как зерно, крупа, мука и т. п. на глубину до 7 мм. Эта величина зависит от характера поверхности, структуры, свойств материала и частотной характеристики излучения. Так, метод ИК-анали-затора зерна основывается на измерении спектра, получаемого при прохождении БИК-излучения через образец (цельное зерно и мука), т. е. спектров пропускания в БИК-области, и обработки результатов с использованием методов множественного регрессионного анализа.

Для обнаружения насекомых в зерне МИ-технология была применена в 1990-хгодах [3]. Точность скоростной идентификации личинок паразитических ос в рисе составляла до 90%, а точность идентификации куколки до 100%. Отраженное БИК-излучение успешно использовано для диагностики скрытой зараженности живым или мертвым рисовым долгоносиком в твердой озимой пшенице 2-месячного срока хранения [4]. Автоматизированными МИ-системами удалось обнаружить малые, средние и крупные личинки и куколки насекомых с точностью 62, 84, 92 и 94% соответственно. Для создания калибровок внутренние насекомые могут быть убиты, калибровки могут быть созданы в более позднее время без ущерба для точности. Для определения наличия внутренних насекомых в ядре пшеницы важны длины волн: около 990, 1135, 1210, 1325, 1370, 1395, 1425, 1510, 1610 и 1670 нм. Длина 990 нм, в согласии с выводами [3], указывает на способность обнаруживать зерно, содержащее насекомых, по потере крахмала, который был заменен или потреблен развивающимися личинками. Область длин волн около 1425 нм, вероятно, реакция на влажность насекомых; 1510 нм соответствует азотно-водородному обертону колебаний и частично связано с изменением содержания белка в пшенице. Пики на1130и 1670 нм - оберто-

ны углеродно-водородных колебаний, возможно связанные с наличием у рисового долгоносика кутикуляр-ных липидов. Физические или биохимические различия, обнаруженные для живых насекомых, как правило, те же, что и для мертвых насекомых (в течение 2 мес срока хранения зерна).

В основном применяются методы распознавания, основанные на дискриминантном, кластерном и факторном анализах, при устоявшемся мнении, что нейронные сети не дают никакого улучшения в производительности по сравнению со статистическими классификаторами [5, 6]. Так, в [5] исследованы образцы канадской западной красной яровой пшеницы влажностью около 15%. Взрослые насекомые каждого вида были смешаны с 50 г пшеницы и хранились в течение 4 недель при температуре 30°С и относительной влажности 70%. Поврежденные зерна были выбраны визуально и сохранялись при той же температуре и относительной влажности до съемки. Для работы с изображениями были отобраны 300 здоровых и 300 поврежденных зерен. Статистические характеристики БИК-изо-бражений при 1101,69 и 1305,05 нм были введены в Ма1ЬаЪ для статистических классификаторов - дискриминантного анализа (линейный, квадратичный, Махаланобиса). Правильно классифицированы 85-100% здоровых и поврежденных насекомыми зерен пшеницы.

Результаты [6] показали, что БИК-изображения в сочетании с функциями цветовых характеристик изображения обладают потенциалом очень высокой точности обнаружения поврежденных насекомыми зерен в пробах пшеницы. Размерность БИК-спектра сокращена в Ма1ЬаЪ факторным анализом, распознавание проведено тремя статистическими классификаторами дискриминантного анализа (линейный, квадратичный, Махаланобиса) и нейронной сетью (ВРКЫ). Авторы утверждают, что ВРКМ не дает улучшения в производительности по сравнению со статистическими классификаторами. Квадратичный дискриминантный анализ имеет лучшую точность: 96,4% распознавания здо-

Рис. 1

ровых зерен и 91-100% зараженных - при использовании 10 лучших функций классификаций, выбранных из 123 особенностей цветов и 230 комбинированных признаков (цветовых, текстурных и морфологических).

Отметим, что указанные результаты относятся к экспресс-диагностике скрытой зараженности, в той или иной стадии развития насекомых-вредителей, выборочных образцов зерновок. Представляет интерес разработка методов сплошной экспресс-диагностики скрытой зараженности зерновой массы, что требует снижения погрешности и увеличения скорости распознавания изображений.

Нами была использована выборка готовых NIR-изображений [5] размером 640 х 480 пикселей при длине волны 1305,05 нм (рис. 1) для пшеницы, зараженной долгоносиком (1), мукоедом (2), зерновым точильщиком (3), хрущаком (4) и здоровой пшеницы (5). Обработку NIR-изображений и подготовку признакового пространства из гармоник вейвлет-спектра проводили по алгоритмам и с помощью программного обеспечения [7-11]. Разработку НС-модели распознавания осуществляли по методикам [8-10], для разработки нейросети применяли нейроимитатор STATISTICA Neural Networks (SNN) [12].

Заполнение базы данных признакового пространства для распознавания из гармоник вейвлет-спектров плоских NIR-изображений зерен проводили по алгоритмам и с помощью программного обеспечения [8, 9]. На рис. 2 показан пример обработки фрагмента

Рис. 2

МИ-кадра: а - необработанный кадр; б - объекты отделены от фона, определены реальные размеры; в - база данных дискретных вейвлет-спектров каждого единичного зерна. Первоначально отделен фон (рис. 2, а, б), затем получен дискретный вейвлет-спектр каждого единичного зерна, представляющий собой свертку исходного сигнала с низкочастотными и высокочастотными фильтрами, порождающими детализирующие коэффициенты (гармоники):

PH PW

ac,r = E К2Г- h)E l(2C _ W) ,

h= 0 w = 0

PH

PW

iH

c,r

f

c,r

E l(2r - h)E h(2c - W) fw,

h= 0 w = 0

PH PW

Ё h(2r- h)E l(2c — w) fw.

(1)

h= 0 PH

w= 0 PW

dZ = E h(2r- h)E h(2c - w) fw

c = 0...

PW

2

0...

PH

2

признаков объекта в доверительную (1 - а = 99% и выше) область пространства признаков, для объектов природного происхождения определяемую из гипотезы нормальности как эллипсоид рассеивания:

= const.

(2)

Признаковое пространство из гармоник вейвлет-спектров плоских МИ-изображений зерен использовано как вход в НС-моделях распознавания, изученных с помощью нейроимитатора БКЫ". Оптимальным оказался двухслойный персептрон МЬР 19-7-5, у которого функция активации - сигмоидная (логическая), функция ошибки - БОБ (равна сумме, взятой по всем наблюдениям, квадратов разностей целевых и фактических значений). МЬР 19-7-5 означает, что многослойный персептрон имеет на входе 19 нейронов, промежуточный слой содержит 7 нейронов, на выходе 5 нейронов. Работа МЬР 19-7-5 показала, что на имеющейся обучающей выборке нейронная сеть дает практически 100%-ю правильную классификацию по всем видам зараженности. Таким образом, на указанной выборке показана более высокая эффективность - по точности и скорости - нейросетевого распознавания в сравнении с известными статистическими классификаторами.

Однако статистические методы распознавания обладают, в отличие от нейросетевых, возможностью теоретического предсказания точности и явного получения алгоритма. Это позволяет разработать методы идентификации с заданной точностью объектов, обладающих высокой визуальной внутриклассовой вариабельностью при близости самих классов. Проведены теоретические и экспериментальные исследования с разновидностью статистического классификатора [7, 11], использующего в алгоритме распознавания построение эллипсоида рассеяния в признаковом пространстве (при нормальном распределении); а также вырожденности матрицы ковариации признаков и особенностей вейвлет-спектра для расширения признакового пространства.

В качестве критерия принадлежности к какому-либо классу используется проверка на попадание вектора

Здесь х - вектор признаков из гармоник вейвлет-спектра; цх - центр рассеяния (вектор мат. ожиданий); В - ковариационная матрица; определение константы в правой части (2) через а сводится к алгебраическому уравнению.

Как видно из (1), коэффициенты вейвлет-спектра представляют собой линейные комбинации пиксельных значений. На границе объекта фильтр может захватить лишь часть изображения объекта. Тогда измерения становятся зависимыми: a = dH, dV = ^г’, и форма распределения искажается. Анализ таких распределений сильно затруднен, поэтому при создании эталона не учитываются коэффициенты вейвлет-спектра, полученные на границе объекта.

Между признаками, оставшимися после их отсеивания на границе объекта, могут существовать множественные линейные зависимости. Мультиколлинеарность признаков делает матрицу ковариации В вырожденной (в вычислениях - плохо обусловленной). Но характер этой мультиколлинеарности, в значительной степени привязанный к конкретному распознаваемому объекту, позволяет говорить о маске линейных зависимостей, повышающей точность распознавания. Для выявления этих множественных зависимостей В преобразуется к диагональному виду с помощью элементарных преобразований над строками по методу Якоби:

\bk,t = cbk,i + sbl i; = -sbk, + cb,

(3)

где c = , bk * ; s = b

bl + bfk

k = 1...(n — 1); l = (k + 1)...;

V ь1к + ьа л/ ьк,к +

1 = к... п.

Использование метода Якоби более оправдано, поскольку он не вызывает лавинообразного увеличения модулей коэффициентов, характерного для метода Гаусса.

Преобразования (3) над строками В в матрицу Р производятся, пока на каком-то шаге т не окажется, что последние п - £ строк матрицы содержат нулевые элементы. В этом случае п - £ строк преобразованной матрицы Р содержат коэффициенты линейной комбинации строк исходной матрицы, позволяющие получить исходные, перешедшие в нулевые строки:

Г Т Т

' " п п !

[ т] А — п\"^Р[ т] Л _П ^ Р[ т]

E P‘f A = 0, E PlA = 0,--,E C] A, = 0

i = 1

i = 1

i = 1

Из

этой системы выражаются п - £ зависимостей между строками. Для каждого из зависимых признаков вычисляется максимальная разница между наблюдаемым

h= 0

w= 0

r

и расчетным значением /шах = шах^| Хк — хк |, V х € Егу

где Е1 - эталонная выборка, а хк и Хк - наблюдаемое и расчетное значения признака. При распознавании проверяется, что отклонение наблюдаемого значения зависимого признака от его расчетного значения не превышает эталонной величины: |Хк — хк|< /шах.

Работа алгоритма распознавания опробована на разрешениях изображений единичных объектов-зерен: 64 х 64, 32 х 32,16 х 16и8 х 8 пикселей, на зернах пшеницы, зараженных следующими вредителями: хрущак, мукоед, зерновой точильщик и рисовый долгоносик. При разрешении 8 х 8 на одно зерно метод позволяет различить только самые общие приметы объекта -средние цвета участков изображения - и обладает недостаточной для распознавания детализацией изображений. При остальных разрешениях все 100% зараженных зерен имеющейся обучающей выборки были отделены от здоровых.

Таким образом, рассмотрены возможности повышения - по точности и скорости - эффективности распознавания скрытой зараженности зерна пшеницы по изображениям в ближнем инфракрасном диапазоне. Предложены нейросетевая модель и разновидность статистического классификатора с признаковым пространством из гармоник вейвлет-спектра. Статистический классификатор использует в алгоритме распознавания построение эллипсоида рассеяния в признаковом пространстве (при нормальном распределении), а также вырожденности матрицы ковариации признаков и особенностей вейвлет-спектра для расширения признакового пространства. Показана более высокая производительность распознавания на выборке из приведенных в литературе МИ-изображений размером 640 х 480 пикселей, при длине волны 1305,05 нм для: здоровой пшеницы, зараженной зерновым точильщиком, долгоносиком, мукоедом, хрущаком.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований и администрации Краснодарского края, грант № 11-08-96519-р_юг_ц.

ЛИТЕРАТУРА

1. ГОСТ 28666.1-90. Зерновые и бобовые. Определение скрытой зараженности насекомыми. Ч. 1^. - М., 1990.

2. Буханцов В.А., Шаззо А.Ю. Вредители хлебных запасов, распространенные в Российской Федерации: Атлас вредителей. - Краснодар, 2007. - 158 с.

3. Ridgway C., Chambers J. Detection of insects inside wheat kernels by NIR imaging // J. Near-Infrared Spectroscopy. - 1998. -6 (2). - Р. 115-119.

4. Maghirang E.B., Dowell F.E., Baker J.E., Throne J.E. Automated detection of single wheat kernels containing live or dead insects using near-infrared reflectance spectroscopy // Trans American Society of Agricultural Engineers (ASAE). - 2003. - 46 (4). -Р. 1277-1282.

5. Singh C.B., Jayas D.S., Paliwal J., White N.D.G.

Detection of insect-damaged wheat kernels using near-infrared hyperspectral imaging // Journal of Stored Products Research. - V. 45. -Issue 3. - July 2009. - P. 151-158.

6. Chandra B. Singh, Digvir S. Jayas, Jitendra Paliwal, Noel D.G. White Identification of insect-damaged wheat kernels using short-wave near-infrared hyperspectral and digital colour imaging // Computers and Electronics in Agriculture. - V. 73. - Issue 2. - August

2010. - P. 118-125.

7. Горонков К.А., Руденко О.В., Усатиков C.B. База данных обучающей выборки для высокоточного распознавания плоских изображений сортов злаковых и масличных культур // Фундаментальные исследования. - 2011. - Вып. 8, ч. 2. - С. 342-346.

8. Руденко О.В., Усатиков C.B. Нейросетевое распознавание в технических системах зерноперерабатывающей и пищевой промышленности // Современные проблемы науки и образования. -

2011. - № 3 (Электронный журнал). - www.science-education.ru/ 97-4668 (дата обращения 15.11.2011).

9. Горонков К.А., Руденко О.В., Усатиков C.B. О точности распознавания по контуру изображений злаковых культур при помощи нейронных сетей // Обозрение прикладной и промышленной математики. - 2009. - Т. 16, вып. 3. - С. 567-569.

10. Горонков К.А., Руденко О.В., Усатиков C.B. Топология нейронной сети высокоточного распознавания сортов зерновых культур // Обозрение прикладной и промышленной математики. -2010. - Т. 17, вып. 5. - С. 780-781.

11. Блок распознавания растительного сырья экспертной системы мониторинга показателей безопасности и качества при производстве консервов / А.С. Бородихин, К.А. Горонков, О.В. Руденко и др. // Фундаментальные исследования. - 2011. - Вып. 8, ч. 3. -С. 607-612.

12. Нейронные сети. Statistica Neural Network. Методология и технологии современного анализа данных / Под ред. В.П. Боровикова. - М.: Горячая линия-Телеком, 2008. - 392 с.

Поступила 18.06.12 г.

DETECTION EFFICIENCY OF HIDDEN INFESTATION OF KERNELS BY THE IMAGES IN THE INFRARED SPECTRUM

A.YU. SHAZZO, S.V. USATIKOV

Kuban State Technological University,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2, Moskovskaya st., Krasnodar, 350072; e-mail: sv@usatikov.com

For detection of the hidden infestation of grain is perspective application of near infrared (NIR, eng. NIR), to obtain images at a wavelength of 0,75-1,1 microns. The error of the known methods of detection of the objects based on the discriminant, cluster and factor analysis, as well as the use of neural networks is 5-10%. To reduce errors and increase speed of recognition in this paper we propose neural network models and statistical classifier with feature space of the harmonic wavelet spectrum. It is shown that the higher - in terms of accuracy and speed - the efficiency of recognition, on a sample of the literature cited in the NIR-images of size 640 x 480 pixels, at a wavelength of 1305,05 nm, for: a healthy wheat contaminated with grain beetles, weevils, Sitophilus oryzae, Rhyzopertha dominica, Cryptolestes ferrugineus and Tribolium castaneum.

Key words: detection methods, hidden insect infestation of grains and legumes, the image in the near infrared radiation.

i Надоели баннеры? Вы всегда можете отключить рекламу.