Научная статья на тему 'Обеспечение инвариантности системы распознавания образов морских судовых систем в процессе промысла'

Обеспечение инвариантности системы распознавания образов морских судовых систем в процессе промысла Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
138
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ ВИДЕОИНФОРМАЦИЯ / РЫБНЫЙ КОСЯК / ИДЕНТИФИКАЦИЯ / ИНФОРМАЦИОННАЯ СИСТЕМА / КЛАСТЕРИЗАЦИЯ / DIGITAL VIDEO INFORMATION / FISH SHOAL / IDENTIFICATION / INFORMATION SYSTEM / CLUSTERING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Железняк А.А., Каторин Ю.Ф., Сметюх Н.П., Доровской В.А., Черный С.Г.

На основе усовершенствованной математической модели выделения объекта из видео изображения, основанной на обобщенной математической модели повышения контраста, фильтрации и результатах компьютерного моделирования, удалось снизить ошибку выделения объекта интереса из фона цифрового фотоизображения. Разработан способ автоматизированной сегментации объектов путем анализа цифрового видео изображения на примере силуэта рыбного косяка

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Ensuring the invariance of the pattern recognition system of the marine vessel systems in the process of fishing

Analysis of the existing algorithms for processing and transmitting video information for decision-making in information systemsclient-server applications for systems of decision making support. has shown that the existing algorithms do not consider the objective identification moments on the fishing fleet vessels. The problems of the impossibility of visualization of real images, clear separation of the object and the background, spatial arrangement of the points in the automated segmentation of digital images are displayed through the dependence by the features of adjacent frames in feature description methods. This necessitated the development of more detailed algorithms for the digital video data analysis, devoid of these shortcomings. This method involves the extraction of the contours of the object, which allowed to obtain a set of features and served as a basis for its analysis and recognition. Using the module of the normalized scalar product enabled to effectively solve the basic recognition problems transfer, rotation and zooming of the object image. The assessment methods of digital video information were investigated. The main result of this study was the development of a tool for an integrated objective quality assessment of the data transmitted. The feature of the developed tool is that it is integrated into the Scanmar model that allows to simulate the multimedia processing and transmission networks with the assessment of quality losses in real time. The experiments, conducted using the developed tool, to assess the quality of video encoded by existing compression algorithms have shown that H.264 codec, which showed a higher video quality level than in similar compression by MPEG-4 and MJPEG codecs appears the most effective.

Текст научной работы на тему «Обеспечение инвариантности системы распознавания образов морских судовых систем в процессе промысла»

-□ □-

На основi вдосконаленог мате-матичног моделi видшення об'екта з видео зображення, заснованог на узагальненш математичнш моде-лi пидвищення контрасту, фшьтра-ци та результати комп'ютерно-го моделювання, вдалося знизити помилку видшення об'екта ттересу з фону цифрового фотозображення. Розроблено споыб автоматизованог сегментацИ об'ектiв шляхом анал^ зу цифрового зображення видео на прикладi силуету рибного косяка

Ключовi слова: цифрова вiдеоiн-формащя, рибний косяк, iдентифi-кащя, тформацшна система, кластеризация

□-□

На основе усовершенствованной математической модели выделения объекта из видео изображения, основанной на обобщенной математической модели повышения контраста, фильтрации и результатах компьютерного моделирования, удалось снизить ошибку выделения объекта интереса из фона цифрового фотоизображения. Разработан способ автоматизированной сегментации объектов путем анализа цифрового видео изображения на примере силуэта рыбного косяка

Ключевые слова: цифровая видеоинформация, рыбный косяк, идентификация, информационная система, кластеризация -□ □-

УДК 004.048; 681.5

|DOI: 10.15587/1729-4061.2015.55696|

ОБЕСПЕЧЕНИЕ ИНВАРИАНТНОСТИ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ МОРСКИХ СУДОВЫХ СИСТЕМ В ПРОЦЕССЕ ПРОМЫСЛА

А. А. Железняк

Ассистент* E-mail: zheleznyak13@mail.ru Ю. Ф. Катори н

Доктор технических наук, доцент Кафедра «Комплексное обеспечение информационной безопасности» Государственный университет морского и речного транспорта им. адм. С. О. Макарова ул. Двинская, 5/7, г. Санкт-Петербург, Россия, 198035

E-mail: sokolovss@gumrf.ru Н. П. Сметюх Аспирант* Е-mail: golosa @mail.ru В. А. Доровской Доктор технических наук, профессор* E-mail: dora1943@mail.ru С. Г. Черный Кандидат технических наук, доцент* E-mail: sergiiblack@gmail.com *Кафедра электрооборудования судов и автоматизации производства Керченский государственный морской технологический университет ул. Орджоникидзе, 82, г. Керчь

1. Введение

Сложность и высокая интенсивность процессов в морских сферах деятельности часто требует автоматической обработки визуальной информации. Одновременно с интенсификацией процессов все более остро становится проблема обеспечения безопасности персонала, связанного с деятельностью системы в условиях моря. Естественным решением данной проблемы является замена судоуправленца роботизированными комплексами и системами, способными выполнять требуемые операции в зоне повышенного риска. Для функционирования роботизированных систем необходим компьютерный анализ изображений в системах машинного зрения, обеспечивающий обработку информации и идентификацию изображений. Задачи идентификации возникают в гидро- и радиолокации,

обработке изображений, распознавания косяков рыбы, особенно при прицельном глубоководном лове рыбы.

2. Анализ литературных данных и постановка проблемы

Для функционирования роботизированных систем необходим компьютерный анализ изображений, обеспечивающий обработку информации и идентификацию изображений [1-3]. Такие задачи возникают в задачах обработки изображений, поиска заданного участка моря на аэрофотоснимке. Для решения задач данного класса необходимо создание информационной системы, реализующей технологию анализа информации и идентификации различных видов изображений и способной управлять объектом в условиях существенных

©

помех (возмущений), что требует разработки соответствующих методов, моделей, алгоритмов и программно-аппаратных средств [1-4]. Кроме того, технология идентификации изображений должна быть инвариантной по отношению к возмущениям, порождаемым движениями и деформациями объектов, требует разработки критериев оценивания количества информации и близости образов в задаче идентификации объектов в оптическом диапазоне. Использование термина «идентификация» связано с тем, что идентификация относительно модели, как отождествление объекта и его модели, подчёркивает роль знаний об объекте и более точно отражает суть процесса «узнавания» объекта.

Основными факторами [1-3], снижающими эффективность идентификации, являются неопределённости в составе анализируемой сцены - наличие фоновых объектов, являющихся помехами для системы, и эволюции идентифицируемых объектов, выступающие как возмущения в пространстве объектов.

Задача идентификации в оптическом диапазоне предполагает наличие объекта, сигнал от которого воспринимается оптоэлектронной системой и преобразуется в электрический сигнал, определяющий скалярное поле отклика на изображение данного объекта [1]. Идентификация [2] или распознавание объекта производится системой относительно имеющихся знаний об объекте. Обычно эти знания представлены как некие «эталоны» [3]. Собственно это может быть физический эталон или описание эталонного объекта, либо знание особенностей - признаков объекта [4]. Существенную роль в данной задаче играют отклонения условий наблюдения объекта от идеальных условий, при которых формировались эталонные знания [5-7]. Естественно наличие возмущений может снижать качество работы системы, которое оценивается заданным критерием или оценкой.

Таким образом, следуя анализу литературных источников [3, 8], задача построения информационной технологии идентификации в оптическом диапазоне с анализом и оптимизацией информационных взаимодействий элементов системы технического зрения, целесообразно представлена в виде, приведенном на рис. 1

Объект

Решение о

Приём

Принятие принадлежности

решения

Л к

Эталонная

информация

Рис. 1. Информационная структура системы технического зрения

Объект в данной задаче - это физически реализованный объект, информация о котором 1т воспринимается через канал приёма информации, устройством принятия решения о принадлежности объекта [8]. Реально в задаче идентификации всегда существует влияние внешней среды в виде информации поступающей в канал приёма и усложняющей работу си-

стемы идентификации, принимающей решение о принадлежности объекта тому или иному классу согласно эталонной информации [9]. Оценка качества работы системы производится по результатам испытаний и существенно зависит от влияния возмущений морской среды [10-12].

Для такой схемы целесообразно рассматривать задачу идентификации, более широкую, чем распознавание образа. В этом случае кроме методов, развитых в теории распознавания образов, включается арсенал методов структурной, непараметрической и параметрической идентификации, что позволяет использовать понятия идентифицируемости, наблюдаемости [10, 13] в задачах распознавания.

Арсенал методов распознавания образов, накопленный за время развития данного направления, ориентирован на решение задачи создания систем, работоспособных при значительных изменениях условий наблюдения или предъявления объекта. Такая постановка задачи прослеживается с момента начала развития теории распознавания [3]. Естественно, включая изменения условий наблюдения в возмущения со стороны внешней среды, получаем структуру задачи, приведенную на рис. 1.

Приведенная в работе [10, 11, 14, 15] современная классификация методов распознавания проще, чем приведенная в более ранних источниках [3], но соответствует современным подходам к решению задач распознавания, отражая наиболее эффективные методы.

Собственно вопросы восприятия изображения, предобработки, фильтрации решаются при приёме сигнала [1], в то время как вопросы сегментации и распознавания связаны с выбором метода распознавания [1].

Задача идентификации предполагает информацию об объектах в виде их описания, полученную априори или в процессе изучения объектов [2]. Так как рассматриваем оптический диапазон, отнесём эти знания к эталонным описаниям, или эталонам, что резко упрощает структуру задачи и подчёркивает роль измерений в процессе идентификации.

Одним из важнейших факторов, вызывающих основные трудности при решении задачи, является наличие возмущений. Возмущения связаны с нестационарностью объекта, изменением условий предъявления, оптическими помехами и электронными шумами в тракте приёмника. К возмущениям целесообразно отнести и начальную неопределённость положения объекта в поле зрения приёмника [10, 14-16].

Современные методы построения систем идентификации [2-5] подразумевают наличие критерия качества, что позволяет не только сравнивать методы и решения, но и рассматривать задачу как задачу оптимизации. Используемые критерии опираются либо на эффективность, оцениваемую средними штрафами, либо оценками производительности. Совершенствование и усложнение алгоритмов распознавания позволяют рассматривать динамику процесса классификации, что ведет к использованию функционалов при оценке качества [2].

Рассматривая развитие методов идентификации, прослеживается желание создать фильтр, просто преобразующий сигналы образа в коды его обозначения, причем естественно фильтр стационарный или в луч-

шем случае перестраиваемый [2]. Однако возмущения, связанные с изменениями в изображении, заставили искать методику вычисления инвариантов, позволяющих не замечать изменения в пространстве объектов [2]. Желание учесть возмущения в пространстве объекта прослеживаются от признаковых систем [3], к корреляционным методам [3] и от модели нейрона [3] к нейросетевым алгоритмам [4]. Развитие теоретических основ определило задачу распознавания как оптимизационную задачу [4] с учётом некорректности задач данного класса [4]. Как следствие, значительные усилия направлялись на поиск методов определения оценок близости образов [4] и образов и эталонов [3].

Требование практического использования систем для решения задач анализа сцен в условиях неопределенности, требовал перехода от постановки, ведущей к синтезу стационарного фильтра, к адаптивным системам с перестраиваемыми или обучаемыми алгоритмами [5, 11]. С другой стороны развивались методы, связанные с явной процедурой сравнения с эталоном [5], здесь и корреляционные процедуры, и методы эластического эталона [5], и интеллектуальные системы [5, 8, 11], где эталон представлялся как изображение. Возможность получения характеристик независящих от тех или других возмущений в пространстве объекта определило группу методов, основанных на анализе моментов, инвариантных характеристик и нормализации изображений [5].

Следует отметить, что группа методов, связанных с непосредственным сравнением с эталоном, прекрасно работает только при полном отсутствии возмущений - это и всевозможные коды, ключи и специальные системы [3]. В случае возмущений в пространстве объекта известные системы прямого сравнения с эталоном дают ошибку [4]. Развитие методов идентификации связано с использованием обратной связи, рис. 2. В общем случае информация об объекте 1ю из внешней среды сравнивается с информацией полученной от интерпретации принятого решения, и информация 1е об отклонении используется для уточнения решения ^

Рассматривая оптические образы ю^й, объекта как распределение оптической энергии по матрице ^(х) и модели ^*(х)) их можно представить моделью эталона:

Рис. 2. Обратная связь в структуре задачи идентификации

При анализе методов и средств идентификации существенно разделить понятие образа и объекта. Образ характеризуется вероятностью, признаками, принадлежностью к классу и так далее, но воспринимается системой реальный сигнал, порождаемый объектом и характеризующийся измеряемыми величинами.

В таком случае можно выделить операции сравнения с эталоном, проводимые в пространстве объекта (рис. 4). Существует значительное количество работ, посвященных методам совмещения эталона и изображения. Здесь методы поиска оптимальных алгоритмов определения расстояния [1], методы второго порядка, просто градиентные процедуры управления совмещением [6].

^(х) = ^(х) - ад.

Первые члены регрессии 1

^(х) = а0 +— а1х +... + И.

(1)

(2)

Нулевой член регрессии (2) описывает среднее отклонение эталона и объекта, а вектор коэффициентов первого приближения состоит из коэффициентов корреляции распределений объекта и эталона.

Отсюда видно единство методов, метод прямого сравнения использует ао непосредственно как оценку отклонения, эластичный эталон и нормализация используют ао для оценки совмещения эталона и объекта, а корреляционные методы используют оценку взаимодействия эталона и объекта - коэффициенты корреляции а.

Очевидно, что возможен учет и старших членов регрессии, но гарантию совпадения объекта и эталона дает только совпадение объекта и эталона, хотя каждый из методов даёт определённые преимущества в реализации.

Методы, использующие обратную связь, видим в принципе обратного распространения ошибки [6]. Резонансные сети, генетические алгоритмы [7] и множество других методов используют принцип обратной связи. Однако операция нахождения отклонения от желаемого и использования величины ошибки для дальнейшего улучшения результата везде воспринимается как существенная особенность именно данного метода, хотя это операция общая для всех методов.

Следует различать системы с обратной связью по решаемой задаче. Так для оценки в оператора системы W=W(а,u), зависящего от вектора параметров а и вектора управления и, эталона Р^х) и объекта ^(Ах+х0) возмущённого аффинным преобразованием А, и смещением х0 ставятся задачи:

- в(£(Ах+х0), ^(х)) - перебор эталонов;

- А*, х0*^тт в(£(Ах+х0),Р^х)) - метод нормализации;

- А*, х0*^тт в(£(х), £*^Ах+х0)) - метод эластичного эталона;

- для вектора образа р, вектора решения и оператора W найти W*^mm в(W Р, £*) - обучение сети;

- а*^ W* - адаптация сети, метод обратного распространения ошибки;

- а*, и W* - оптимальное управление сетью, генетические алгоритмы, резонансные сети.

Задача создания устройств, работоспособных при внешних возмущениях, возникла в теории автоматического управления и была успешно решена в теории инвариантных систем [7]. Отличие ситуации в этих областях только в объекте - в теории управления динамическая система - это реальный аппарат, механизм или процесс, а в теории распознавания - система обработки информации. Но большинство систем идентификации - это системы без обратной связи и, как следствие, системы, не могут быть инвариантны.

Системы, построенные по отклонению, имеют проблемы с устойчивостью или сходимостью, имеют более длительный процесс достижения результата - переходный процесс, зависят от вида объекта, но при этом принципиально могут не зависеть от возмущений объекта. Собственно согласно принципу многоканаль-ности инвариантная система распознавания должна содержать минимум два канала: канал по возмущению и по отклонению.

Таким образом, возможно построение системы как оператора без обратной связи и систем с обратной связью, причём критерии, используемые при оценке расстояния между образом и эталоном, являются необходимыми условиями соответствия объекта эталону. Достаточным условием является совпадение сигнала объекта и эталона. Однако задача реализации метода сравнения с эталоном осложняется неопределённостью состояния объекта. Из выявленных нерешенных задач в вышеизложенных исследованиях следует, что для дальнейших исследований необходимо решение задач повышения качества противостояния помехам и возмущению.

3. Цель и задачи исследования

С целью повышения качества противостояния помехам и возмущению необходимо разработать методы и информационные технологии, позволяющие выполнять идентификацию объектов в оптическом диапазоне и способные противостоять воздействию помех и возмущений при прицельном глубоководном траловом лове. Поэтому целью исследований является разработка методов и информационных технологий идентификации оптических объектов, способных противостоять воздействию помех и возмущений при прицельном траловом лове.

Для достижения поставленной цели были писследо-ваны и решены следующие задачи:

- идентификации объектов в оптическом диапазоне;

анализ возмущения, снижающие эффективность

систем идентификации;

- повышение устойчивости системы идентификации к возмущениям;

- анализ контуров объектов в оптическом диапазоне, способных противостоять воздействию помех и возмущений при прицельном глубоководном траловом лове.

4. Идентификация методов визуализации образов морского промысла

Методическая составляющая исследования может быть представлена такими методами. В случае, если класс характеризуется перечнем входящих в него членов, построение системы распознавания может быть основано на принципе принадлежности к этому перечню - этот метод сравнения с эталоном [8]. Согласно этому методу, множество образов, принадлежащих одному классу, запоминается системой идентификации. При предъявлении системе новых образов она последовательно сравнивает их с эталонными образами, хранящимися в памяти. Система относит новый образ

к тому классу, к которому принадлежал эталонный образ. Этот метод работает, когда выборка близка к идеальной, или идеальны условия предъявления изображений.

Следующим используемым методом системы распознавания является метод, когда для элементов одного класса существуют некие общие признаки. Он строится на принципе общности свойств [8], которые хранятся в памяти системы. В процессе обработки изображений система выделяет признаки из предъявленного изображения и работает с ними. Система зачисляет вновь предъявленное изображение в класс, признаки которого подобны признакам, выделенным у нового изображения.

5. Разработка и оптимизация модели идентификации образов

Пусть существует N классов, обозначенных к1, а>2...Щ. В таком случае задача распознавания может рассматриваться как задача построения границ, разделяющих классы в пространстве признаков, исходя из зарегистрированных векторов измерений. Эти границы определяются некими решающими функциями d1(x), d2(x)...dм(x), которые представляют собой скалярные и однозначные функции образа х. Если di(x)> ^(х) для всех 1, ]=1, 2 ... М Щ, то образ х принадлежит классу о . Другими словами, если решающая функция di(x) имеет наибольшее значение, то хек^.

Для классов, в состав которых не входят идентичные векторы образов, находятся разделяющие границы, которые колеблется от линейных до нелинейных значений. Иногда на практике из-за трудностей в точном определении границ применяются приближенные решающие функции вида [1]:

К+1

= ^(х) + ^2(х) + ... + ^К(Х) + ^+1 = X(Х) (3)

1=1

где £(х), 1=1,2,...К - действительные однозначные функции образа х, ^+1(х)=1, а К+1 - число членов разложения. Это выражение представляет собой бесконечный ряд решающих функций, вид которых зависит от ^(х) и количества членов использованных в разложении. Используя простую подстановку:

Цх) f2(x)

^с(х)

(4)

можно записать

d(x) = w'x*,

(5)

где w =(ж1,^,..^к,^К+1) .

Теперь, когда вычислены все значения ^(х), d(x) по отношению к новому представлению х* является линейной функцией, что резко упрощает задачу. При этом в исходном пространстве функции сохраняют свой нелинейный характер.

Для двумерного случая решающая функция примет следующий вид:

^х)=£■^х2+X X +X'■

(6)

]=1

] Н+1

]=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

dr(x)=

XX... X

V Р1 =1Р2 = Р1 Рг = Рг-1

Расстояние Махаланобиса для образов х и т является полезной мерой, когда статистические характеристики образов заданы в явном виде (С-1 ковариационная матрица совокупности образов, т - вектор средних значений) [10]:

Данное соотношение может быть распространено на многомерный случай:

D = (х - т)'С-1(х - т),

(9)

а также не метрические функции сходства [10], например функцию:

+ dr-1(x), (7)

8(х,г) = |

(10)

где г указывает степень нелинейности и d0(x)=wn+1. Это соотношение дает удобный способ построения решающих функций произвольного конечного порядка.

Следующим подходом к построению систем идентификации оптических образов является использование для классификации образов функций расстояния [10]. Такой подход обусловлен интуитивным представлением о расстоянии как о мере близости точек в евклидовом пространстве. Можно рассчитывать на получение удовлетворительных практических результатов при использовании для классификации функций расстояния только в тех случаях, когда классы обнаруживают тенденцию к проявлению кластериза-ционных свойств [8]. Этот метод построения систем идентификации называют классификацией образов по критерию минимума расстояния. Изменчивость классов при этом должна находиться в разумных пределах. Если образы внутри класса имеют тенденцию к группировке около некоторого образа, который является типичным для данного класса, тогда задача решается довольно просто. Этот случай возможен, когда изменчивость образов невелика, а помехи легко устранимы - например, распознавание специализированных символов на банковских чеках.

Классификатор, построенный по принципу минимума расстояния, вычисляет расстояние между неклассифицированным образом х и эталонами и зачисляет этот образ в ближайший класс. Другими словами, образ х приписывается классу ю1, если условие Di<Dj выполняется для всех Случаи равенства расстояний разрешаются произвольно. Частными случаями этого решающего правила будут являться правила «ближайшего соседа» - когда образ зачисляется в тот класс, к которому принадлежит его ближайший сосед. Практическим препятствием при реализации этого метода является большой объем вычислений в случае большого количества эталонов - необходимо рассчитать расстояния между образом и всеми эталонами.

Также представляет определенный интерес задача выявления кластеров - т. е. выявления эталонных (центральных) образов в классе. Для определения кластера в пространстве образов, прежде всего, необходимо ввести меру сходства образов, которая позволила бы отнести данный образ к области, характеризуемой неким центром кластера. С этой целью используются различные функции расстояния, например евклидова мера расстояния между образами х и г [3]:

D = х - г .

(8)

представляющую собой косинус угла, образованного векторами х и г, и достигающую максимума, когда их направления совпадают. Этой мерой сходства удобно пользоваться, когда кластеры располагаются вдоль главных осей пространства образов.

После того, как определена мера, остается проблема определения порогового значения расстояния, т. е. определения фактической величины (диаметра) кластера в пространстве. Для этого применяются различные критерии: сумма квадратов ошибки, среднее квадратов расстояний между образами в кластере, минимум и максимум дисперсии, и другие [10].

Для нахождения центров кластеров используются несколько различных алгоритмов кластеризации, среди них можно выделить как относительно простые (алгоритм максиминного расстояния), так и более сложные (алгоритм К внутригрупповых средних, алгоритм Isodata [3]. После проведения операции кластеризации необходимо уточнить, правильно ли прошел процесс, т. е. все ли предъявленные образы правильно распределены по кластерам, так как кластеризация проводится практически «вслепую», то есть мы не в состоянии зрительно оценить геометрические особенности многомерного пространства, существуют определенные трудности с оценкой результатов кластеризации. Для этого полезно знать расстояния между центрами полученных кластеров, дисперсии образов внутри кластера, информацию о ближайшей и наиболее удаленной точке кластера, среднее расстояние между центрами кластеров. Следовательно, задачу кластеризации можно сформулировать как задачу идентификации классов в заданном множестве образов.

Для решения задач распознавания образов в ситуациях, когда в рассматриваемых данных отсутствуют значительные фрагменты информации, а имеющаяся информация предельно зашумлена, использовали нейронные сети.

В исследованиях использовались три вида обучения [1]:

1. Обучение с учителем - для каждого ц-того входного вектора х(ц) мы заранее знаем желаемый выходной вектор ^ц) и используем сигнал разности между действительным выходом и желаемым е для коррекции в нужном направлении вектора весов W. Веса изменяются таким образом, чтобы минимизировать разность.

2. Обучение с подкреплением - применяется в случае недостаточности априорной информации о выходе - то есть выходные вектора известны не полностью.

Управление весами связей производится при помощи внешнего подкрепляющего сигнала.

3. Обучение без учителя - в этом случае заранее не известна реакция системы на заданный входной вектор х(т) и, следовательно, невозможно использовать вектор ошибки для коррекции весов. В этом случае сеть должна самостоятельно выделить признаки, на основе которых образы группируются в классы.

На сегодняшний день в литературе [11, 14, 16] описаны различные конфигурации нейронных сетей со следующими достоинствами:

1. Простой персептрон - представляет собой простую однослойную сеть без обратных связей с пороговой активационной функцией. Сети такой конфигурации способны идентифицировать объекты классов, которые могут быть разделены гиперплоскостью. Обучение является глобальным, т. е. проводится на всем множестве примеров.

2. Сети с двумя и более слоями без обратных связей - сети такого типа уже не имеют ограничений на выпуклость области решений (кроме двухслойной сети), и способны решать гораздо более сложные задачи [1, 3, 9].

3. Сети с обратными связями - обладают более широкими возможностями, чем сети без обратных связей, но при этом возникает проблема устойчивости сети. Сеть с обратными связями обладает свойствами ассоциативной памяти - то есть по заданной части нужной информации вся информация извлекается из «памяти». Сеть с обратными связями является устойчивой, если ее матрица симметрична и имеет нули на главной диагонали.

Но искусственные нейронные сети обладают и целым рядом недостатков:

- непредсказуемость реакции - всегда сохраняется вероятность, что какой-либо входной сигнал сеть обработает неправильно, т.к. мощность обучающего множества конечна, а объекты внешней среды изменчивы и зашумлены;

- продолжительность обучения - в некоторых случаях процесс обучения сети может слишком затянуться, или сеть не обучится вообще;

- при достаточно большом количестве разделяемых классов возможны патологические ситуации, когда объем памяти, необходимый для хранения весов растет быстрее экспоненты;

- значения весов в процессе обучения могут стать слишком большими и привести сеть к потере чувствительности - параличу;

- искусственная нейронная сеть чувствительна к условиям предъявления объектов на ее вход - изображения обязательно должны быть нормализованы по размерам и интенсивности.

6. Практическое применение моделей распознавания и анализа объектов в промысле биоресурсов

С точки зрения распознавания и анализа объектов на изображении наиболее информативными являются не значения яркостей объектов, а характеристики их границ - контуров. Другими словами, основная информация заключена не в яркости отдельных областей, а в их очертаниях. Задача выделения контуров

состоит в построении изображения именно границ объектов и очертаний однородных областей.

Будем называть контуром изображения совокупность его пикселов, в окрестности которых наблюдается скачкообразное изменение функции яркости. Изображение, которое поступает на вход функции обработки, можно представить в виде функции fRGB (x,y,z), где x и y - размеры изображения, а z - количество цветов (принимает значение 3 - Red, Green, Blue цвета). Каждый элемент функции может принимать значение в диапазоне от 0 до 256.

fGray (x,y) = ]TfRG^.

(11)

Для обнаружения контуров на изображении, применим метод Канни. Детектор Канни - метод обнаружения контуров объектов, основанный на принципе определения контрастных перепадов, используя некоторые пороговые значения, с которыми сравнивают длину вектора градиента.

Шаг 1. Произведем фильтрацию серого изображения, используя фильтр размытия Гаусса:

£ £ fGray (x + i,y + j)'Gaus (i,j) fGaus (х,У) = ^-

Gaus (i,j) =

1

2 ■ N +1

(i-N-1)2+(j-N-1)2

2 no2

(12)

(13)

где G (у) - маска Гаусса, N - размер ядра маски, о -среднеквадратическое отклонение гауссиана (чем больше значение, тем больше размытие).

Шаг 2. Найдем края силы путем взятия градиента изображения, используя оператор Собеля.

|FSobel | = |GxSobel | + GySobel

££fGaus (X + i,y + .)■ GX (i,j)

G

-1j=-1

G = i=-1j=-1 ySobel _

££fGaus (X + i,y + .)■ GY (i,j)

(14)

(15)

(16)

где GX (у) и GY (у) - маски свертки для оценки градиента в направлении столбцов (х) и строк (у). Имеют размерность 3x3. |Р5оЫ| - величина края силы. Шаг 3. Нахождение края градиента:

Gx (i,j) = 0, а = 0, Gy (i, j) = 0, а = 90, Gy (iJ)

а = arctg

Gx (i,i)

Значения угла находим при ненулевых значениях градиента направления столбцов.

Шаг 4. Связывание направления края с направлением, которое может быть прослежено в изображении.

Шаг 5. После того как известны направления краев, применяем не максимальное подавление. Оно используется для отслеживания вдоль края в направлении края и подавлении любых значений пикселя (устанавливая их равным 0), которые не считаются краем. Это даст тонкую линию в результирующем изображении.

Шаг 6. Гистерезис используется в качестве средства устранения полос. Полоса - это разбиение контура края, вызванное оператором выходного колебания выше и ниже порогового уровня. Если единственный порог, Т1 применяется к изображению и край имеет среднюю силу, равную Т1, то из-за шума, будут случаи, когда край опускается ниже порогового уровня. В равной степени он будет также распространяться выше порога принятия края, похожего на пунктирную линию. Чтобы избежать этого, гистерезис использует 2 порога, высокий и низкий. Любой пиксель в изображении, который имеет значение большее, чем Т1 предположительно является краевым пикселем, и немедленно обозначается как таковой. Затем любые пиксели, которые соединяются с этим краевым пикселем, и которые имеют значение, большее, чем Т2, также выбираются как краевые пиксели. Для начала движения вдоль края необходим градиент Т2, а для окончания - градиент ниже Т1.

Изображение, полученное после применения метода Канни, содержит контуры объектов. Анализ изображения, полученного после применения метода Канни, показывает возможность использования этого метода распознавания оптических объектов эхограмм для качественного глубоководного прицельного тралового лова.

6. Выводы

Рис. 3. Визуализация результатов после применения метода Канни

На рис. 3 показано изображение, полученное после применения метода Канни для распознавания эхо-грамм глубоководного прицельного тралового лова. Следовательно, применения метода Канни позволяет упростить и повысить качество распознавания рыбных косяков в процессе промысла биоресурсов.

1. Задача идентификации объектов в оптическом диапазоне содержит три подзадачи:

- анализ событий в пространстве образов;

- анализ и обработка сигналов, соответствующих образам объектов, в пространстве сигналов;

- анализ структурных свойств системы идентификации в информационном пространстве.

2. Возмущения, снижающие эффективность систем идентификации, вызываются следующими причинами:

- изменением состава сцены, в которой предъявляется идентифицируемый образ;

- нестационарностью образа по отношению к эталону;

- изменением положения объекта в сцене;

- влияние шумов тракта обработки сигнала.

3. Проблема повышения устойчивости системы идентификации к возмущениям связана с необходимостью обеспечения инвариантности системы идентификации по отношению к возмущениям.

4. Обеспечить инвариантность системы возможно только в том случае, когда выполнены условия структурной и параметрической инвариантности, что требует переосмысливания подхода к созданию систем идентификации и распознавания образов.

5. Анализ контуров объектов позволил эффективно решить (рис. 3) основные проблемы распознавания образов - перенос, поворот и изменение масштаба изображения объекта, по аналогии с современными системами рыбопромыслового промысла как Scanmar, но экономией денежных средств на покупку компонентов специализированного ПО. Данная технология не решает полностью проблемы оптимизации изображения, но значительно улучшает получение модели.

Литература

1. Дуда, Р. Х. Распознавание образов и анализ сцен [Текст] / Р. Х. Дуда. - М.: Мир, - 1976. - 511 с.

2. Бравермана, Э. М. Автоматический анализ сложных изображений [Текст] / Э. М. Бравермана. - М.: Наука, 1969. - 310 с.

3. Ту, Дж. Принципы распознавания образов [Текст] / Дж. Ту, Р. Гонсалес. - М.: Мир, 1978. - 416 с.

4. Гонзалес, Р. Цифровая обработка изображений в среде МА^АВ [Текст] / Р. Гонзалес, Р. Вудс, С. Эддинс. - М.: Техносфера, 2006. - 616 с.

5. Васильев, К. К. Оценка параметров деформации многомерных изображений, наблюдаемых на фоне помех [Текст] / К. К. Васильев, А. Г. Ташлинский // Труды НТК РОАИ-4. - Новосибирск, 1998. - С. 261-264.

6. Форсайт, Д. Компьютерное зрение. Современный подход [Текст] / Д. Форсайт, Ж. Понс - М. : Вильямс, 2004. - 928 с.

7. Дюкова, Е. В. Поиск информативных фрагментов описаний объектов в дискретных процедурах распознавания [Текст] / Дюкова Е. В., Песков Н. В. // Вычисл. матем. и матем. физ. - 2002. - Т. 42, № 5. - С. 741-753.

8. Hertz, T. Boosting Margin Based Distance Functions for Clustering [Текст] / T. Hertz, A. Bar-Hillel, D. Weinshall // Proceedings of the twenty-first international conference on Machine learning. - New York, 2004. - 50 p. doi: 10.1145/1015330.1015389

9. Розенфельд, А. Распознавание и обработка изображений [Текст] / А. Розенфельд. - М.: Мир, 1987. - 274 с.

10. Хемминг, Р. В. Цифровые фильтры [Текст] / Р. В. Хемминг. - М.: Наука, 1990. - 268 с.

11. SCANMAR [Электронный ресурс]. - Режим доступа: http://www.scanmar.no/en/Manuals/

12. Chemyi, S. G. Elements of the introspective analysis to evaluate software in navigation [Text] / S. G. Chernyi, V. Yu. Budnik // Proceedings 22nd Saint Petersburg International Conference on Integrated Navigation Systems ICINS 2015. - Saint Petersburg, 2015. - P. 147-150.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13. Zhang, D. A comparative study of curvature scale space and Fourier descriptors for shape-based image retrieval [Text] / D. Zhang, G. Lu // Journal of Visual Communication and Image Representation. - 2003. - Vol. 14, Issue 1. - P. 39-57. doi: 10.1016/s1047-3203(03)00003-8

14. Chernyi, S. The implementation of technology of multi-user client-server applications for systems of decision making support [Text] / S. Chernyi // Metallurgical and Mining Industry. - 2015. - Vol. 3. - P. 60-65.

15. Zhilenkov, A. Investigation performance of marine equipment with specialized information technology [Text] / A. Zhilenkov, S. Chernyi // Energy Procedia. - 2015. - Vol. 100. - P. 1247-1252. doi: 10.1016/j.proeng.2015.01.490

16. Chernyi, S. Analysis of complex structures of marine systems with attraction methods of neural systems [Text] / S. Chernyi, A. Zhilenkov // Metallurgical and Mining Industry. - 2015. - Vol. 1. - P. 37-44.

i Надоели баннеры? Вы всегда можете отключить рекламу.