Научная статья на тему 'Применение видеокомпьютерной техники для исследования морфометрических параметров рыбы. Часть 2. Разработка программного обеспечения видеокомпьютерного устройства'

Применение видеокомпьютерной техники для исследования морфометрических параметров рыбы. Часть 2. Разработка программного обеспечения видеокомпьютерного устройства Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
451
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЫБА / FISH / MECHATRONICS / ВИДЕОКОМПЬЮТЕРНОЕ УСТРОЙСТВО / VIDEOCOMPUTER DEVICE / VIDEOCAMERA / VIDEOSENSOR / ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЯ / IMAGE FILTERING / РЕКОНСТРУКЦИЯ ИЗОБРАЖЕНИЯ / IMAGE RECONSTRUCTION / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ / IMAGE SEGMENTATION / МОРФОЛОГИЧЕСКИЙ АНАЛИЗ / MORPHOLOGICAL ANALYSIS / РАСПОЗНАВАНИЕ ОБРАЗОВ / IMAGE RECOGNITION / СВЕТОДИОД / ВИДЕОКАМЕРА / ВИДЕОДАТЧИК / МИКРОЭВМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Агеев О. В., Фатыхов Ю. А.

Научно обоснован выбор методов оцифровки, улучшения, реконструкции и сегментации изображения рыбы. Проанализированы методы распознавания образов рыбы с целью исследования её основных морфометрических параметров. Приведена последовательность цифровой обработки видеоинформации на ЭВМ с использованием алгоритмов гистограммной эквализации, фильтрации, дилатации, поиска контуров, заливки, вычитания изображения, замыкания контуров, выборки полос, выделения областей, расчёта координат головы и тушки рыбы. Проанализированы перспективные методы распознавания образов рыбы на основе нейронных сетей с целью измерения её основных морфологических параметров. Приведены результаты работы программного обеспечения видеокомпьютерного устройства.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Агеев О. В., Фатыхов Ю. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using of videocomputer technique for research of morphometric parameters of fish. Part 2. Development of software of videocomputer device

The choice of methods for digitizing, improving and reconstructing image is scientifically based. The choice of methods for image segmentation and fish species recognition for the purpose of measuring its basic morphological parameters is scientifically based. The sequence of digital video processing by computer algorithms histogram equalization, filtering, dilation, search paths, fills, subtraction images, closing the loop, sample strips highlight areas and calculate the coordinates of head of fish are analyzed. Promising methods of pattern recognition fish based on neural networks for measuring its morphological parameters is described. The results of module operation are demonstrated.

Текст научной работы на тему «Применение видеокомпьютерной техники для исследования морфометрических параметров рыбы. Часть 2. Разработка программного обеспечения видеокомпьютерного устройства»

УДК 681.518.3

Применение видеокомпьютерной техники для исследования морфометрических параметров рыбы. Часть 2. Разработка программного обеспечения видеокомпьютерного устройства

Канд. техн. наук О.В. Агеев, procyon@mail.ru д-р техн. наук Ю.А. Фатыхов, elina@klgtu.ru Калининградский государственный технический университет 236022, Калининград, Советский пр., д. 1

Научно обоснован выбор методов оцифровки, улучшения, реконструкции и сегментации изображения рыбы. Проанализированы методы распознавания образов рыбы с целью исследования ее основных морфометрических параметров. Приведена последовательность цифровой обработки видеоинформации на ЭВМ с использованием алгоритмов гистограммной эквализации, фильтрации, дилатации, поиска контуров, заливки, вычитания изображения, замыкания контуров, выборки полос, выделения областей, расчета координат головы и тушки рыбы. Проанализированы перспективные методы распознавания образов рыбы на основе нейронных сетей с целью измерения ее основных морфологических параметров. Приведены результаты работы программного обеспечения видеокомпьютерного устройства.

Ключевые слова: рыба, видеокомпьютерное устройство, светодиод, видеокамера, видеодатчик, микроЭВМ, фильтрация изображения, реконструкция изображения, сегментация изображения, морфологический анализ, распознавание образов.

Using of videocomputer technique for research of morphometric parameters of fish. Part 2. Development of software of videocomputer device

Ph.D. O.V. Ageev, procyon@mail.ru D.Sc. J.A. Fatychov, elina@klgtu.ru

Kaliningrad state technical university 236022, Kaliningrad, Sovetsky Ave, 1

The choice of methods for digitizing, improving and reconstructing image is scientifically based. The choice of methods for image segmentation and fish species recognition for the purpose of measuring its basic morphological parameters is scientifically based. The sequence of digital video processing by computer algorithms histogram equalization, filtering, dilation, search paths, fills, subtraction images, closing the loop, sample strips highlight areas and calculate the coordinates of head of fish are analyzed. Promising methods ofpattern recognition fish based on neural networks for measuring its morphological parameters is described. The results of module operation are demonstrated.

Key words: fish, mechatronics, videocomputer device, videocamera, videosensor, image filtering, image reconstruction, image segmentation, morphological analysis, image recognition.

Методы

Известны алгоритмы оцифровки изображений на основе глобального порога бинаризации, локального и динамического порогов [1, 2]. Получение многоградационных изображений позволяет точнее локализовать объекты в рабочей зоне и рассчитать большее количество классифицирующих признаков. В этой связи целесообразно использовать подход, предложенный в работе [3]. Значение локального порога вычисляется c помощью операторов, работающих в сравнительно небольшом окне, накладываемое на окрестность анализируемого пиксела.

Перед программной обработкой изображения в ЭВМ требуется его улучшение путем коррекции искажений, улучшения контрастности, удаления шумов. Геометрические искажения вызваны

отклонением объектива от перпендикуляра к плоскости рабочей зоны и аберрациями оптической системы.

Алгоритмы коррекции геометрических искажений основаны на двумерных преобразованиях изображения. Преимущественно применяется упрощенная методика коррекции систематических искажений изображения [2]. При этом считается, что воспринимаемая функция G(i, j) представима в виде F (i, jE )(i, j ), где F (i, j) - «истинное» изображение, а E (i, j) - искажения в узлах сетки. Функция E(i, j) формируется экспериментально путём введения калибровочного изображения однотонового фона. Затем видеопроцессором рассчитывается F (i, j) с поэлементным устранением вклада искажений E (i, j) в функцию G(i, j) . Подбором вспомогательного преобразования шкалы яркости вида G ' = ф(0 ) обеспечивается повышение контрастности изображения в требуемом диапазоне значений яркости.

Применяются алгоритмы, устраняющие «размытость» изображения за счет обострения границ однородных областей. Это выполняется путём усиления уровня высокочастотных компонент пространственного спектра. Хорошо реализуемым методом фильтрации изображения при «зашумлении» является Фурье-преобразование [1, 4], предусматривающее как аналоговую, так и цифровую реализацию. Выполняя дискретное преобразование Фурье, видеопроцессор формирует спектр функции яркости. В случае периодического образа шума, спектр содержит изолированные пики. После обратного преобразования Фурье, пики выделяются, а их значения заменяются на локальные средние амплитуды, рассчитанные путем усреднения по соседним точкам. Таким образом, устраняются высокочастотные шумы и формируется сглаженное изображение.

Для предотвращения потерь мелких деталей и размывания границ объектов используются следующие методы [5, 6]:

- усреднение проводится лишь по тем элементам выбранного окна, которые лежат вблизи границы между фоном и объектом;

- при усреднении учитываются лишь те пикселы выбранного окна, яркость которых отличается от яркости рассматриваемого элемента не более чем на заданную величину;

- в выбранном окне выделяется подмножество элементов, лежащих по разные стороны от рассматриваемого пиксела и дающих минимальный разброс значений яркости, после чего усреднение проводится только по этому подмножеству;

- при сглаживании яркость рассматриваемого пиксела заменяется не средним, а медианным значением яркости элементов выбранного окна. Такой медианный фильтр упорядочивает элементы в соответствии с их яркостями в неубывающую последовательность G\,G2,G3---GLM-\,Glm , где L xM -

размер выбранного окна. Медианное значение соответствует номеру m = [(LM + \)¡2\ пикселов без

размывания границ изображения.

Поскольку основные функции по обработке изображения возложены на ЭВМ, проанализированы форматы цифрового представления графической информации [5, 6]. Поскольку видеодатчик формирует растровое изображение, рассмотрены следующие растровые форматы [2]: TIFF (англ. Tagged Image File Format); JPEG (англ. Joint Photographic Experts Group); RAW (англ. raw - «необработанный»); BMP (англ. Bitmap Picture); PCX (англ. Personal Computer Exchange); PNG (англ. Portable Network Graphics); GIF (англ. Graphics Interchange Format).

Формат TIFF позволяет хранить графические данные в следующих видах: бинарном; полутоновом; с индексированной палитрой; RGB; CMYK; YCbCr; CIE Lab [2]. Имеется возможность хранения информации без сжатия и со сжатием. Обеспечивается глубина цвета 8, 16, 32, 64 бит. Формат позволяет хранить данные без потерь, однако при этом требуется значительный объем памяти.

Формат JPEG характеризуется высокой степенью сжатия изображения [2]. При сжатии изображение преобразуется из цветового пространства RGB в пространство YCbCr. Для каналов изображения Cb и Cr, отвечающих за цвет, выполняется преобразование, которое заключается в том,

что каждому блоку из 4 пикселов (2*2) яркостного канала Y ставятся в соответствие усредненные значения Cb и Cr (схема прореживания «4:2:0»). При этом для каждого блока 2*2 вместо 12 значений используется всего 6. Далее яркостный компонент Y и отвечающие за цвет компоненты Cb и Cr разбиваются на блоки 8*8 пикселов. Каждый такой блок подвергается дискретному косинусному преобразованию. Формат JPEG предусматривает два следующих основных способа представления кодируемых данных: последовательный и прогрессивный.

Формат JPEG обладает существенным недостатком: появление характерных артефактов на восстановленных изображениях при высоких степенях сжатия. На областях с плавными изменениями яркости изображение распадается на блоки размером 8*8 пикселей. В областях с высокой пространственной частотой возникают артефакты в виде шумовых ореолов.

Формат RAW содержит графическую информацию, поступающую напрямую с КМОП-матрицы видеокамеры. Данные в формате RAW сжимаются без потери качества. Объем занимаемой памяти для формата RAW меньше, чем при использовании формата TIFF.

В формате BMP хранятся однослойные растры [2]. Каждому пикселу соответствует различное количество бит (глубина цвета). Цвет задается только в цветовом пространстве RGB. При разрядности 16 и 32 можно получить полутоновую шкалу с глубиной градаций до 16 и 32 бит соответственно. Частичная прозрачность реализована альфа-каналом различной разрядности, но при этом прозрачность без градаций возможно косвенно получить RLE-кодированием [2]. Альфа-канал - алгоритм комбинирования изображения с фоном для создания эффекта частичной прозрачности.

Формат PCX использует стандартную палитру цветов, рассчитан на хранение 24-разрядных изображений. Предназначен для хранения информации в файле в таком же виде, как и в видеопроцессоре. Алгоритм сжатия очень быстрый, занимает небольшой объём памяти, однако считается неэффективным для детальных изображений. Используется сжатие без потерь.

Формат PNG также использует сжатие без потерь. Имеется поддержка альфа-канала, предусматривается возможность хранения неограниченного количества цветов. PNG сжимает данные без потерь, что делает его удобным для хранения промежуточных версий обработки изображений.

Формат GIF способен хранить сжатые данные без потери качества в формате до 256 цветов [2]. Включает алгоритм сжатия без потерь информации, позволяющий снизить объем требуемой памяти в несколько раз. Изображение в формате GIF хранится построчно, поддерживается только формат с индексированной палитрой цветов. Допускается чересстрочное хранение данных.

На основе вышеизложенного, для представления данных в видеокомпьютерном устройстве выбран формат RAW. Его применение позволяет передавать графическую информацию в ЭВМ без потери качества. Кроме того, формат RAW хранит полную информацию об изображении, что существенно повышает гибкость системы обработки видеоинформации. Это обусловлено тем, что выбор алгоритмов обработки осуществляется на программном уровне, при этом не требуются какие-либо изменения аппаратной части. Следует также отметить, что данный формат не защищён международными патентами, поэтому может использоваться без ограничений, хотя и не имеет единой спецификации.

Полное цифровое изображение размерами Mх N записывается в виде следующей матрицы:

f ( X y ) =

foo foi "' fo,N-1 1 ^

5

ïm- 1,0 ïm- 1,1 ' ' ' ïm- 1,n-1

После формирования соответствующей матрицы в памяти ЭВМ требуется улучшение изображения. Рассмотрены следующие методы улучшения изображения: пространственные и частотные. Пространственные методы применяются к плоскости изображения, и манипулируют

3

непосредственно пикселами. Частотные методы осуществляют модификацию цифрового сигнала, который формируется путем применения к изображению преобразования Фурье. Для улучшения изображения в видеокомпьютерном устройстве выбраны пространственные методы, поскольку частотные методы связаны со сложностью алгоритмизации и требуют значительных вычислительных ресурсов.

В общем виде методы пространственного улучшения изображения описываются следующим выражением [2]:

(2)

ё (х, у ) = Т [ / (х, у)

где /(х, у) - входное изображение; ё(х, у) - обработанное изображение; Т - оператор над /(х, у) , определенный в некоторой окрестности точки (х, у). Вместе с тем, оператор Т может обрабатывать последовательность изображений. Оператор Т выполняется в каждой точке (х, у), формируя выходное значение ё для данной точки.

Оператор Т имеет наиболее простой вид, когда окрестность имеет размеры 1*1 (один пиксел). При этом функция ё зависит только от значения функции / в точке (х, у). Таким образом, Т является функцией градационного преобразования (функцией преобразования интенсивностей яркости). Наряду с этим, увеличение размеров окрестности приводит к улучшению результатов пространственной обработки изображения. В этом случае используются маски, представляющие собой небольшие двумерные массивы (чаще 3*3 элемента).

Рассмотрены следующие виды градационных преобразований: линейное (негатив и тождественное преобразование); логарифмическое (логарифм и обратный логарифм); степенное (п -ая степень и корень п -ой степени). Как показывает анализ, целесообразно усиливать контраст изображения с помощью степенных преобразований. Процедура, используемая для коррекции степенной характеристики, известна в видеотехнике как гамма-коррекция [3, 5, 6]. Следует отметить, что выполнение гамма-коррекции на аппаратном уровне предусматривается в видеокамере.

Существенное улучшение изображения в видеокомпьютерном устройстве достигается методом видоизменения гистограммы. Согласно [2] гистограммой цифрового изображения с уровнями яркости в диапазоне [0, Ь -1] является дискретная функция ^ (гк) = пк, где Гк является к -ым уровнем яркости, Пк является числом пикселей изображения, имеющих яркость гк. Принято, что уровни яркости являются непрерывными величинами, распределёнными в диапазоне [0, 1]. Уровни яркости элементов изображения преобразуются в соответствии со следующим выражением:

г

5 = Т (г) = 1 Рг (w)dw, (3)

0

где 5 - уровень яркости изображения; рг (г) - функция плотности распределения вероятности;

w - переменная интегрирования.

Показано [5, 6], что функция распределения плотности выходных уровней является равномерной:

Г1 при 0 < 5 < 1,

Р5 (5) =ГП (4)

[0 иначе.

Таким образом, преобразование (3) формирует изображение, уровни яркости которого являются равновероятными и покрывают весь интервал [0,1]. Процесс эквализации изображения заключается в увеличении динамического диапазона уровней яркости, что повышает контрастность выходного изображения. Функция преобразования является функцией кумулятивного (накопленного) распределения.

В отличие от непрерывного случая при обработке гистограммы методом эквализации выполняется преобразование дискретных величин. Обозначим гистограмму уровней яркости изображения как р (г ),1 = 1,...,Ь . Эквализация гистограммы выполняется согласно следующему выражению [2]:

к

л

^ = т(гк) = Хрг(гк) =Х П , (5)

1=1 1=1

где к = 1,..., Ь; $к - уровень яркости выходного изображения, соответствующий уровню яркости гк входного изображения.

Для построения выходного изображения с заданной гистограммой, то есть приведения гистограммы, с учётом выражения (3) задается дополнительная переменная 2 со следующим свойством [2]:

2

н (2 )=! =^. (6)

0

Из выражений (3) и (6) следует, что

2 = н-1 (5 ) = н "1[т (г )]. (7)

На практике в случае непрерывных величин сложно получить аналитические выражения для Т(г) и Н 1 (5). Однако в случае дискретных величин выражение (6) приобретает следующий вид:

н(2к)=ЕР2(2к) = 5к. (8)

1=1

Процедура эквализации гистограммы со спецификацией (приведением гистограммы к заданному виду) выполняется в следующей последовательности:

1. Получение исходной гистограммы изображения.

2. Вычисление значения отображений гк в 5к .

3. По заданным значениям рг (2к) вычисляется функция преобразования Н .

4. Вычисление методом итераций значений 2к для каждого .

5. Для каждого пиксела исходного изображения, имеющего значение г к, отображение г к в соответствующее значение 5к .

6. Отображение значения 5к в результирующее значение 2к .

Метод слепой деконволюции использован для итерационного нелинейного восстановления изображения. Он построен на основе известного алгоритма Ричардсона-Люси [2], использующего метод максимального правдоподобия с моделированием изображения в виде статистик Пуассона. Особенность метода слепой деконволюции заключается в игнорировании информации о функции разброса точек. Функция правдоподобия выражена через вышеупомянутые функции ё (х, у), / (х, у) ,

при этом осуществляется поиск максимума функции правдоподобия.

Следующим этапом после восстановления изображения является морфологический анализ, основанный на математическом аппарате теории множеств. Для существенного упрощения алгоритмов такого анализа предварительно осуществляется бинаризация изображения. Операция дилатации [2] позволяет устранить разрывы линий путем их перекрытия. Способ и степень перекрытия разрывов задана структурообразующим множеством, представленным в виде матрицы из нулей и единиц. Дилатация является коммутативной операцией. При этом могут использоваться структурообразующие множества различных форм. Наряду с формой квадрата применяются формы ромба, круга, шестиугольника, прямоугольника.

После морфологического анализа выполняется сегментация изображения. Особенностью методов сегментации является то, что на вход процесса обработки подается изображение, а результатом служат свойства и атрибуты, извлекаемые из изображения. Алгоритмы сегментации используют свойства яркости изображения - разрывность и однородность. Осуществляется поиск резких перепадов значений яркости, которые чаще происходят на границах объектов, а также разделяются области изображения, однородные по заданным критериям. В общем виде алгоритмы сегментации применяются к полутоновым изображениям, однако представление изображения в бинарном виде сокращает затраты на вычисление и повышает точность.

Задача формирования контура объекта заключается в поиске протяжённого перепада яркости. Решение этой задачи связано с вычислениями в изображении производных первого и второго порядков. Вычисление первой производной цифрового изображения осуществляется на основе дискретных приближений двумерного градиента [2]. Градиентом изображения / (х, у) в точке (х, у) является вектор [2]:

УЕ =

Ох

Оу

дх

ж

.ду.

(9)

Устройство вектора (9) определяется следующим выражением:

у/ = |уе| = ^ ох+о2у.

Направление вектора градиента выражается следующим образом:

а(х, у ) = arctg

V Оу ;

(10)

(11)

где а(х, у) - угол между направлением вектора УЕ в точке (х, у) и осью х.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вторые производные цифрового изображения вычисляются при помощи оператора Лапласа.

При этом обнаружение перепадов осуществляется путём поиска участков изображения, где первая производная яркости превышает по модулю некоторый заданный порог, а также участков, где вторые производные изображения имеют пересечения нулевого уровня.

Вычисление градиента изображения заключается в получении величин частных производных д//дх и д//ду для каждой точки [2]. Для решения этих задач проанализированы следующие методы

поиска контура [2]: метод перекрёстного градиентного оператора Робертса; метод оператора Превитта; метод оператора Собела; метод оператора Канни; метод лапласиан гауссиана. На основе проведенного сравнительного анализа выбран метод оператора Канни.

Поиск контуров объектов на изображении методом оператора Канни осуществляется следующим образом. Изображение сглаживается гауссовым фильтром с заданным стандартным отклонением для устранения шума. В каждой точке вычисляется градиент (10) и направление контура (11). Точки перепада вызывают рост гребней на изображении устройства градиента. Отслеживаются максимумы гребней, присваивается нулевое значение точкам, не лежащим на гребнях. Результатом процесса немаксимального подавления является тонкая линия контура. Пикселы гребней подвергаются пороговой обработке, после чего пикселы соединяются в линию. Поскольку изображение представлено в бинарном виде, поиск контуров выполняется с высокой точностью.

Для сглаживания найденных контуров и устранения небольших разрывов целесообразно повторно использованы операции морфологического анализа. Острые зубцы и тонкие выступы на контурах

устраняются методом морфологического замыкания, включающим применение операции эрозии (утончения) к результатам дилатации [2]. Кроме того, выполняются заливка контуров для сглаживания краев и подавления точечных деталей, а также вычитание изображения для подавления фона. Выборка полос различной ширины осуществляется для поиска и анализа областей, содержащих искомые объекты. Таким образом, на этапе сегментации происходит промежуточная подготовка изображения к поиску и распознаванию объектов.

Поскольку для распознавания объектов требуются критерии для их поиска и выделения, то дальнейшая обработка изображения связана с формализованным описанием признаков областей. При формализованном описании областей возможно использовать два способа представления признаков: совокупностью внешних характеристик (границ области) и совокупностью внутренних характеристик (цвета и текстуры).

Область описывается совокупностью признаков, называемых дескрипторами области [5, 6]. Для поиска частей тела рыбы могут использоваться различные подходы к построению дескрипторов, такие как метод цепных кодов, метод аппроксимации ломаной линией, метод сигнатур, метод сегментации границ, метод построения остова области.

Поскольку голова, хвост и плавники рыбы представлены на изображении в виде областей, то возможно описать их простыми дескрипторами - площадью и краевыми точками. В результате сегментации на изображении выделяются замкнутые области, содержащие изображения головы и тушки без головы. Для такого выделения следует использовать дескриптор, определяющий количество пикселов в области (площадь). Для измерения длины головы и тушки обезглавленной целесообразно использовать дескриптор в виде вектора 1х4, определяющий наименьший прямоугольник, содержащий указанные области. Таким образом, стороны многоугольника соответственно определяют длину и ширину частей тела рыбы. Вместе с тем, применение таких дескрипторов имеет ряд ограничений, основными из которых являются необходимость ориентации тушки рыбы по координатным осям и высокая чувствительность точности измерения к повороту тушки. Эти недостатки могут компенсироваться укладкой и фиксацией тушек в кассетах.

Для обеспечения инвариантности измеряемых морфометрических параметров рыбы к ориентации тушки на конвейере целесообразно наряду с простыми дескрипторами использовать более сложные топологические дескрипторы. В качестве топологических дескрипторов возможно использовать признак окружности в области (глаз рыбы), наличие приголовного плавника, спинного плавника, треугольной формы хвоста. Эти признаки инвариантны относительно размеров и ориентации тушки. Признаки могут быть описаны: матрицей р*2, определяющей наименьший выпуклый многоугольник, содержащий заданную область; матрицей 8*2, состоящей из координат экстремальных точек области, которые записаны по строкам.

Наряду с вышеуказанными топологическими дескрипторами целесообразно использовать такой топологический дескриптор, как число связных компонент области. Области представляются в виде многоугольных сетей, описываемых вершинами, ребрами, гранями, количеством связных компонент. Каждая область характеризуется числом Эйлера, которое вычисляется как разность между числом связных компонент и числом отверстий. Применение метода топологических дескрипторов приводит к построению графического остова тушки рыбы, позволяющего получить информацию об ориентации сырья на конвейере.

Для дальнейшего развития программного обеспечения видеокомпьютерного устройства возможно указать следующее. Разрешающая способность видеодатчика позволяет использовать текстурные дескрипторы областей. При обработке рыбы целесообразно использовать статистический метод описания текстуры до операции эквализации гистограммы. Это позволяет охарактеризовать текстуру как гладкую, грубую и зернистую. Для описания текстуры используются статистические характеристики, определяемые по гистограмме яркости областей. Для определения вида рыбы и

выделения частей тела требуется предварительное формирование в памяти ЭВМ характерных значений текстурных дескрипторов. Исследуемая текстура интересующей области определяется при помощи критерия, характеризующего близость вычисленных дескрипторов к наборам значений для известных текстур определённых видов рыб.

Области изображения с точки зрения гладкости, шероховатости и периодичности оцениваются следующими текстурными мерами: средняя яркость области; средняя контрастность области; относительная гладкость яркости области; третий момент (асимметричность гистограммы яркости); мера однородности области; энтропия области (мера случайности значений пикселов).

Упорядоченная совокупность вышеуказанных дескрипторов изображения формирует образ. Класс образов - совокупность образов, обладающих общими свойствами. В результате формирования совокупностей дескрипторов, описывающих морфологическую структуру тела рыбы, создается практическая основа для распознавания образов. При распознавании образов используются методы, позволяющие ЭВМ относить исследуемые образы к различным классам. Среди методов распознавания образов наиболее известны две основные категории: структурные методы и методы, основанные на теории решений. Для распознавания частей тела рыбы наиболее подходят методы, основанные на теории решений, поскольку используют количественные дескрипторы областей (длина, площадь, текстура). При этом в распознавании образов в основном используется принцип обучения на выборке известных образов.

Известны методы распознавания, основанные на использовании выборочной совокупности образов для оценивания статистических параметров каждого класса. Это методы, основанные на сопоставлении [5, 6], в которых используются классификатор по минимуму расстояния, а также корреляционный классификатор. Также известны методы, использующие статистически оптимальные классификаторы [5, 6], в частности байесовский классификатор для классов с нормальным распределением. В этих методах обучающие функции каждого класса используются для вычисления параметров дискриминантной (решающей) функции, соответствующей данному классу. После получения оценок необходимых параметров структура классификатора фиксируется. Поскольку качество классификатора зависит от адекватности статистических предположений реальным совокупностям образов, такие методы обладают рядом недостатков. Это связано с тем, что статистические свойства классов образов не всегда известны или не поддаются оценке. В этом случае наиболее эффективны методы, в которых необходимые дискриминантные функции строятся непосредственно в процессе обучения [5, 6]. В связи с этим, при дальнейшей разработке программного обеспечения видеокомпьютерного устройства предполагается использование метода многослойных нейронных сетей [5, 6]. Нейронная сеть (нейросеть) используется в качестве среды, в которой осуществляется адаптивная настройка параметров дискриминантных функций путём последовательного предъявления обучающих выборок образов из различных классов.

Результаты

В результате работы программного обеспечения видеокомпьютерного устройства уверенно выделяются изображения головы и хвоста рыбы. Измеряется длина головы, длина тушки обезглавленной, длина хвоста, длина тушки без головы и хвоста, общая длина тушки.

На рис. 1 показано исходное изображение тушки рыбы на полотне подающего конвейера после захвата видеокадра.

На рис. 2 показано обработанное ЭВМ видеокомпьютерного устройства изображение после выполнения следующих операций: гистограммная эквализация изображения со спецификацией; фильтрация изображения методом слепой деконволюции; обработка изображения медианным фильтром перевод изображения из пространства RGB в пространство оттенков серого цвета; бинаризация изображения; заливка бинарного изображения для подавления мелких деталей; дилатация изображения.

На рис. 3 показано изображение тушки после дальнейшего выполнения следующих операций: поиск контуров на изображении методом Канни; заливка контуров для сглаживания краев; вычитание изображения для подавления фона; замыкание контуров на изображении.

На рис. 4 показаны изображения тушки после дальнейшего выполнения следующих операций: выборка полос различной ширины для поиска и анализа областей; сегментация; выделение областей на изображении; вычисление параметров выделенных областей; формирование критерия поиска головы рыбы; критериальный выбор области, содержащей изображение головы рыбы; построение многоугольников, содержащих вписанные псевдоцветные изображения головы рыбы и всей тушки; вычисление координат головы и тушки рыбы; вычисление длины головы и тушки рыбы.

Следует отметить, что уверенное обнаружение и распознавание объектов сложной формы в поле зрения видеодатчика позволяют использовать видеокомпьютерный устройство не только в мехатронном комплексе, но и при выполнении финишных технологических операций в рыбоконсервных линиях. Связанная с этим высокая универсальность устройства и гибкость его программного обеспечения создаёт основу для интеграции разрабатываемого устройства с мехатронными манипуляторами различных кинематических схем.

Рис. 1. Исходное изображение тушки рыбы

Рис. 2. Изображение тушки рыбы после эквализации, фильтрации бинаризации и заливки

Рис. 3. Изображение тушки рыбы после поиска, заливки и замыкания контуров

Рис. 4. Изображения тушки рыбы после выборки полосы, инверсии, сегментации,

выделения областей, построения многоугольников, содержащих вписанные псевдоцветные

изображения головы рыбы и всей тушки

Выводы

1. Сформулированы основные задачи по обработке графической информации в видеокомпьютерном устройстве. Научно обоснован выбор математических методов для оцифровки, улучшения и реконструкции изображений в ЭВМ.

2. Научно обоснован выбор методов морфологического анализа изображений, а также методов распознавания образов рыбы. Применение нейросетевых методов обусловливает достоверное выделение изображений головы и хвоста, а также высокую точность измерения морфометрических параметров рыбы (длины, высоты, толщины тушки, длины головы, длины хвоста).

3. Разработан алгоритм работы видеокомпьютерного устройства в автоматическом режиме.

4. Разработка видеокомпьютерного устройства позволяет улучшить качество обработки сырья и полуфабрикатов, а также улучшить прослеживаемость рыбообрабатывающих производств. Создается практическая основа для адаптивного управления технологическим потоком.

Литература (References)

1. Сергиенко А.Б. Цифровая обработка сигналов. СПб.: Питер, 2002. 608 с.

2. Gonzalez R.C. Digital Image Processing. Woods. New Jersey, Prentice Hall, 2002, 190 p.

3. Абрамова В.В. Методы цифровой обработки сигналов для решения прикладных задач: монография / под ред. В.И. Марчука. М.: Радиотехника, 2012. 128 с.

4. Фрайден Дж. Современные датчики. Справочник. М.: Техносфера, 2006. 592 с.

5. СовлуковА.С. Датчики: справочное пособие. М.: Техносфера, 2012. 624 с.

6. Смит С. Цифровая обработка сигналов. М.: Додэка XXI, 2008. 720 с.

7. Lyons R. G. Understanding Digital Signal Processing. New Jersey, Prentice Hall, 2010, 984 p.

8. Proakis J.G. Digital Signal Processing: Principles, Algorithms and Applications. New Jersey, Prentice Hall, 2006, 1004 p.

9. Шуманова М.В., Фатыхов Ю.А., Шуманов В.А. К вопросу математической модели процесса посола мяса сельди // Международная академия холода. 2015. № 1.

i Надоели баннеры? Вы всегда можете отключить рекламу.