Научная статья на тему 'ИСПОЛЬЗОВАНИЕ КЛАССИЧЕСКИХ МЕТОДОВ И НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ПЫЛЬЦЕВЫХ ЗЕРЕН'

ИСПОЛЬЗОВАНИЕ КЛАССИЧЕСКИХ МЕТОДОВ И НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ПЫЛЬЦЕВЫХ ЗЕРЕН Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
152
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ / IMAGE RECOGNITION / OPENCV / НЕЙРОННАЯ СЕТЬ ХЭММИНГА / HAMMING NETWORK / ТОД ОСОБЫХ ТОЧЕК / ПЫЛЬЦЕВЫЕ ЗЕРНА / ЛИНГВИСТИЧЕСКИЙ МЕТОД / FEATURE POINT METHOD / LINGUISTIC PATTERN RECOGNITION / POLLEN-GRAINS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ханжина Н. Е., Замятина Е. Б.

Рассматривается проблема автоматизированного процесса распознавания изображений пыльцевых зерен, полученных с помощью микроскопа. Задача является актуальной, по­скольку позволяет автоматизировать рутинный процесс отнесения пыльцевых зерен к тому или иному классу и тем самым, например, определить период пыления растений. Своевре­менное определение момента пыления растений, вызывающих аллергические реакции у лю­дей, очень важно для предупреждения острых аллергических заболеваний. Авторы попыта­лись применить для распознавания как классические методы (лингвистический), так и при­шедшим на смену классическим методы распознавания с помощью нейронных сетей. Для распознавания авторы используют нейронную сеть Хэмминга. На этапе предварительной обработки изображения (устранение шума, бинаризация, сегментация) применены функции библиотеки OpenCV и метод особых точек (также реализованный в библиотеке OpenCV). Результаты экспериментов показали относительную эффективность применяемых методов. Выводы об эффективности сделаны на основе подсчета ошибок первого и второго рода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

POLLEN-GRAINS RECOGNITION USING CLASSICAL METHODS AND NEURAL NETWORKS

This paper describes the problem of automated pollen-grains image recognition using images from microscope. This problem is relevant because it can help to automate a complex process of pollen-grains classification and to determine the beginning of plants pollinating which are cause of allergy. The main recognition method is Hamming network and linguistic approach. The paper includes Hamming network advantages over Hopfield network. The step of preprocessing (noise filtering, binarization, segmentation) uses OpenCV functions and the feature point method. The paper describes both preprocessing algorithms and main recognition methods. The experiments results showed relative efficiency of these methods. The conclusions about methods productivity are based on errors of type I and II. The paper includes alternative recognition methods which are planning to use in the follow up researches

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ КЛАССИЧЕСКИХ МЕТОДОВ И НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСПОЗНАВАНИЯ ПЫЛЬЦЕВЫХ ЗЕРЕН»

2014

Вып. 4(27)

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика

УДК 004.932.2

Использование классических методов и нейронных сетей для распознавания пыльцевых зерен

Н. Е. Ханжина, Е. Б. Замятина

Пермский государственный национальный исследовательский университет Россия, 614990, Пермь, ул. Букирева, 15 nehanzhina@gmail .com, e_zamyatina@mail. ru

Рассматривается проблема автоматизированного процесса распознавания изображений пыльцевых зерен, полученных с помощью микроскопа. Задача является актуальной, поскольку позволяет автоматизировать рутинный процесс отнесения пыльцевых зерен к тому или иному классу и тем самым, например, определить период пыления растений. Своевременное определение момента пыления растений, вызывающих аллергические реакции у людей, очень важно для предупреждения острых аллергических заболеваний. Авторы попытались применить для распознавания как классические методы (лингвистический), так и пришедшим на смену классическим методы распознавания с помощью нейронных сетей. Для распознавания авторы используют нейронную сеть Хэмминга. На этапе предварительной обработки изображения (устранение шума, бинаризация, сегментация) применены функции библиотеки OpenCV и метод особых точек (также реализованный в библиотеке OpenCV). Результаты экспериментов показали относительную эффективность применяемых методов. Выводы об эффективности сделаны на основе подсчета ошибок первого и второго рода.

Ключевые слова: распознавание изображений; OpenCV; нейронная сеть Хэмминга; метод особых точек; пыльцевые зерна; лингвистический метод.

Введение

Автоматизированное распознавание пыльцевых зерен - часть активно развивающейся и популярной в настоящее время области знаний - распознавания образов и компьютерного зрения. Задача распознавания пыльцевых зерен является актуальной, поскольку при правильном отнесении пыльцевых зерен к тому или иному классу можно сделать соответствующие выводы и решить задачи, стоящие перед специалистами в области биологии (определение качества меда, определение периода пыления растений), геологии (определение залегания пластов полезных ископаемых) и другими категориями профессионалов-специалистов в той или иной области знаний. Задача автоматизированного распознавания пыльцевых зерен включает два этапа - это предварительная обработка

© Ханжина Н. Е., Замятина Е. Б., 2014

изображения и отнесение его к какому-либо предварительно определенному классу (идентификация).

В настоящее время существуют открытые библиотеки программных средств, предназначенные для выполнения того или иного этапа или алгоритма распознавания образов. Одно из них - ОрепСУ - открытая библиотека компьютерного зрения и обучения машин. Библиотека имеет более 2500 оптимизированных алгоритмов, как классических, так и самых современных. Они могут быть использованы для обнаружения и распознавания лиц, идентификации объектов, отслеживания движения и многого другого и, в том числе, для классификации объектов на изображении.

Основные этапы анализа пыльцевых зерен: сбор пыльцевых зерен (использование специализированных ловушек), химическая обработка образцов (скопления зерен в ло-

вушке), получение фотографических изображений пыльцевых зерен после обработки специалистами с помощью микроскопа и, наконец, подсчет зерен в каждом образце [1]. На последнем этапе эксперт самостоятельно определяет семейство растений, к которому относится пыльцевое зерно и вид растения. Определение семейства является достаточно простой задачей, тогда как определение вида внутри этого семейства нередко представляет собой проблему. Для определения таксономической принадлежности пыльцевых зерен специалисты-биологи используют определители и атласы, что занимает немало времени. Предполагаем, что на этом этапе целесообразна автоматизация процесса распознавания.

Таким образом, программа-распознаватель должна уметь по входному образу (фотографическому изображению, полученному после обработки микроскопом) определить количество пыльцевых зерен того или иного вида, выделить их на исходном изображении и отнести к тому или иному классу (определенному семейству).

Этап предварительной обработки изображения проводится с использованием функций библиотеки ОрепСУ, он включает:

1. Устранение шумовых помех на изображении, в том числе с использованием метода особых точек.

2. Бинаризацию изображения.

3. Сегментацию выделенных пыльцевых зерен с целью отнесения образа к тому или иному классу.

Для дальнейшего распознавания решено осуществить попытку применения лингвистического метода и нейронной сети. Авторы [2] уже пытались применить классические методы распознавания пыльцевых зерен, однако они не дали желаемых результатов с точки зрения процентного содержания верно распознанных изображений (54 %).

Исходные данные

Микроскоп, используемый для обработки пыльцевых зерен, подключен к компьютеру, так что у эксперта, получающего фотографические изображения пыльцевых зерен, есть возможность динамически просматривать результат на экране компьютера. Любое изменение настроек микроскопа отображается в программе. В результате обработки можно по-

лучить фотографические изображения оболочки пыльцевого зерна с сторон.

На рис. 1 представлены изображения одного и того же пыльцевого зерна, с двух сторон. Правое изображение выглядит более размытым, имеет менее четкие очертания.

Рис. 1. Изображения оболочки пыльцевого зерна клевера

На рис. 2 приведено изображение одного и того же зерна с разных точек и под разным углом зрения.

Рис. 2. Изображение пыльцевого зерна гречихи с разных точек под разным углом зрения

На изображениях возможны разводы, см. рис. 3.

Рис. 3. Изображение с разводами

Разводы, различный вид одного и того же зерна с разных точек зрения затрудняют распознавание. По этой причине необходимо провести тщательную предварительную обработку фотографических изображений. Рассмотрим этапы предварительной обработки, а именно: устранение шумов, бинаризацию, сегментацию и т.д.

Предварительная обработка

Предварительную обработку изображений целесообразно начать с устранения шума. Устранение шума

Первая операция по устранению шумов - это сглаживание. Сглаживание или размытие - простая и часто используемая операция обработки изображений. Есть множество причин для применения сглаживания, но обычно его применяют именно для снижения уровня шумов.

Для задачи устранения шума изображения методом сглаживания применяется функция, осуществляющая гауссово сглаживание. Гауссовская фильтрация, или сглаживание, проводится путём свёртки каждого пикселя во входном массиве и суммирования для получения выходного. Фильтр меняет каждую точку текущего слоя или выделения, делая её значение равным среднему значению всех точек в определённом радиусе от рассматриваемой точки (соответствующем размеру окна).

После сглаживания следующим действием по устранению шума является применение функций сужения и расширения (Dilate, Erode).

Суть операции сужения заключается в том, что вкрапления и шумы на изображении размываются, в то время как большие, и соответственно, более значимые регионы изображения не затрагиваются. Идея операции расширения - найти регионы аналогичного цвета и интенсивности и попытаться их объединить. Полезность операции расширения возникает по той причине, что во многих случаях большая область обрабатываемого изображения может быть разбита на несколько более мелких шумами, тенями и т.д. Применение функции расширения должно привести к тому, что эти области сливаются в одну [3].

Наглядный пример применения функций сужения и расширения показан на рис. 4.

Рис. 4. Применение функций сужения и расширения

Применение данных функций несколько раз к одному и тому же изображению приводит к значительному уменьшению шума. Бинаризация

Практически одновременно с операциями устранения шума к изображению применяется функция порогового преобразования.

Для решения этой задачи в программе применяется следующий алгоритм:

1. Изображение конвертируется из цветовой модели RGB (англ. Red, Green, Blue - красный, зеленый, голубой) в HSB (англ. Hue, Saturation, Brightness - тон, насыщенность, яркость).

2. Изображение делится на несколько каналов. В нулевой канал попадают все пиксели, удовлетворяющие соответствующему тону (в конкретном случае - от бордового до фиолетового тона, так как краситель, используемый при обработке пыльцевых зерен всегда имеет цвет из этого диапазона). Нулевой канал конвертируется в черный цвет. Фактически реализуется бинаризация с двойным ограничением, применяемая для выделения областей, в которых значения тона пикселей могут меняться в известном диапазоне согласно формуле (1)

0, f (m,n) > ti;

f '(m, n) = jl, ti < f (m, n) < 12; (1) 0, f (m, n) > 12,

где ti,t2 - величины порогов, f - исходное изображение, f' - преобразованное, m,n -координаты пикселя, t1<t2.

3. В первом канале все пиксели, чья насыщенность более 30 (из 255), переводятся в максимальную насыщенность (т.е. 255), остальные - в минимальную. Таким образом, реализуется бинаризация с нижним порогом.

Она является наиболее простой операцией, в которой используется только одно значение порога, согласно формуле

/' (т п)

(2)

[255,/(m,п) > г ; |0, /(m, п) < г ,

где г - величина порога, / - исходное изображение, /' - преобразованное, т, п - координаты пикселя.

4. Вычисляется конъюнкция двух каналов (пиксели нужного тона и нужной яркости).

После выполнения процедуры бинаризации необходимо применить к фотографическому изображению пыльцевых зерен процедуру сегментации. Сегментация

Сегментация делит изображение на составные части и объекты. Степень детализации этого деления зависит от решаемой задачи. Иными словами, сегментацию следует остановить, когда интересующие объекты уже выделены или изолированы [4]. В данной задаче выделения отдельных зерен будет достаточно.

В целях сегментации на изображении выделяются контуры. Для поиска контуров в ОрепСУ существует несколько методов, один из них - детектор границ Канни. Наиболее значимым дополнением алгоритма Канни является то, что он пытается собрать независимые пиксели в целые контуры. Эти контуры формируются путем применения к пикселям пороговой функции с гистерезисом. Одним словом, существуют два порога, - верхний и нижний. Если градиент пикселя имеет значение большее, чем верхний порог, значит, он включается в грань. Если градиент ниже, чем нижний порог, то данный пиксель отбрасывается. Если градиент пикселя находится между порогами, то он будет рассматриваться как грань, только если он соединен с пикселем, который лежит выше верхнего порога [3].

Используя найденные края, можно найти контуры пыльцевых зерен. Для дальнейшей сегментации применяется рекурсивный алгоритм, формирующий из дерева контуров список тех, которые являются хорошими кандидатами на роль контура пыльцевого зерна:

1. Для начала отсеиваются те контуры, чьи области не соответствуют заданному размеру.

2. Область, содержащая контур, сравнивается с эталонными образцами пыльцы,

уже прошедшими предобработку. Эта функция сравнивает объекты с помощью Ни-моментов. Для черно-белого изображения или контура вычисляется его момент, затем моменты сравниваются.

3. Для области каждого оставшегося в списке контура строится маска, заполняющая этот контур черным.

4. Прямоугольные области, содержащие кандидатов, добавляются в список. Эти прямоугольники обрисовываются на исходном изображении, тем самым все найденные пыльцевые зерна выделяются прямоугольными рамочками.

Рассмотрим примеры изображений, прошедших предварительную обработку (рис. 5-7):

Рис. 5. Результат предобработки изображения дудника

Рис. 6. Результат предобработки изображения клевера

ЧЧ

Рис. 7. Результат предобработки изображения дудника с разводами в среде

Масштабирование

Для тех методов распознавания, которые не являются инвариантными к масштабу изображения, понадобится провести еще один этап предварительной обработки изображения - масштабирование.

Для простоты все изображения зерен, полученные после сегментации, приводятся к размеру 200x200. Это обеспечивает, например, возможность сравнения изображения с образцами по расстоянию Хэмминга - числу различающихся битов в двумерном векторе, представляющем изображение.

Методы распознавания изображений

Существует достаточно много классических методов распознавания образов, которые известны еще с 70-х гг.в прошлого столетия. К этим методам относятся такие, как метод потенциалов, метод секущих, структурный (или лингвистический) методы. Некоторые пыльцевые зерна имеют ярко выраженные очертания, поэтому целесообразно провести операции по оконтуриванию фотографического изображения и выявлению пыльцевых зерен с «особенными» контурами с целью отнесения их к классам распознаваемых пыльцевых зерен с достаточно высокой степенью вероятности. Подчеркнем еще раз, что этот метод хорошо будет работать только для некоторого числа классов.

Ниже приводится модификация лингвистического метода, использованного в библиотеке ОрепС^

Лингвистический метод

Этот метод также называют структурным. В лингвистическом методе оперируют образом, который задается грамматикой, а не вектором признаков. Распознавание состоит в грамматическом разборе "предложения", описывающего данный объект.

При распространении этого подхода на двумерные объекты возникают трудности. Во-первых, отсутствуют очевидные принципы выбора простых терминальных элементов. Во-вторых, двумерность изображения порождает затруднения при разработке правил подстановки [5].

В качестве модификации лингвистического метода выбрано представление изображения в виде кода Фримана. Терминальными элементами здесь являются цифры от 0 до 7, обозначающие шаг при обходе контура в од-

Рис. 8. Направления обхода

Таким образом, код Фримана - это последовательность цифр, описывающая обход контура изображения. Пример такого обхода приведен на рис. 9, обход начат с красной стрелки.

Рис. 9. Цепочка обхода контура

На рис. 10 показано, как обход контура выглядит в реальной программе, в круг выделена область начала обхода:

обратная связь

Рис. 10. Обход контура пыльцевого зерна, результаты выполнения программы

В ОрепСУ для работы с кодом Фримана существуют две функции:

cvStartReadChainPoints и cvReadChainPoint. Первая принимает в качестве аргумента уже созданную цепь, или код, полученный на последнем этапе предобработки - сегментации. Код можно получить, задав в функции поиска контуров цепь Фримана в качестве возвращаемого результата. Далее с помощью приведенных функций цепь тестируемого изображения сравнивается с цепями изображений-эталонов, среди них выбирается наиболее близкая (по евклидову расстоянию).

Перейдем к следующему методу распознавания - нейронной сети.

Нейронная сеть Хэмминга

Построение нейронной сети, распознающей изображение по эталонному образцу, является одним из неклассических способов распознавания. В качестве обучающего множества, или эталонных образцов, необходимо взять фотографии пыльцевых зерен каждого семейства при различных приближениях микроскопа, так как одно и то же пыльцевое зерно с разных ракурсов может выглядеть по-разному.

Для данной задачи реализована сеть Хэмминга. Эта сеть характеризуется, по сравнению, например, с сетью Хопфилда, меньшими затратами на память и объемом вычислений, что становится очевидным из ее структуры (рис. 11).

Вход

1 слой

2 слой

Выход

Рис. 11. Структурная схема сети Хэмминга

Емкость сети Хемминга не зависит от размерности входного сигнала, она в точности равна количеству нейронов. Достоинством сети Хэмминга считается небольшое количество взвешенных связей между нейронами. Сеть Хопфилда с входным сигналом размерностью 100 может запомнить 10 образцов, при этом у нее будет 10000 синапсов. У сети Хемминга с такой же емкостью будет всего лишь 1000 синапсов [6].

Сеть состоит из двух слоев. Первый и второй слои имеют по т нейронов, где т -число образцов. Нейроны первого слоя имеют по п синапсов, соединенных со входами сети (образующими фиктивный нулевой слой). Нейроны второго слоя связаны между собой ингибиторными (отрицательными обратными) синаптическими связями. Единственный синапс с положительной обратной связью для каждого нейрона соединен с его же аксоном.

Идея работы сети состоит в нахождении расстояния Хэмминга от тестируемого образа до всех образцов. Расстоянием Хэмминга называется число отличающихся битов в двух бинарных векторах. Сеть должна выбрать образец с минимальным расстоянием Хэмминга до неизвестного входного сигнала, в результате чего будет активизирован только один выход сети, соответствующий этому образцу.

На стадии инициализации весовым коэффициентам первого слоя и порогу актива-ционной функции присваиваются следующие значения:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х*

м>к = , i=0...n-1, к=0...т-1, (3)

Tk = n / 2, k = 0...m-1, (4)

где Xik - i-й элемент k-го образца.

Весовые коэффициенты тормозящих синапсов во втором слое берут равными некоторой величине 0 < £ < 1/m. Синапс нейрона, связанный с его же аксоном имеет вес +1.

Алгоритм функционирования сети Хэмминга следующий [7]:

На входы сети подается неизвестный вектор X = {xi:i=0 ... n-1}, исходя из которого рассчитываются состояния нейронов первого слоя (верхний индекс в скобках указывает номер слоя):

у(1)= s(0=gWjXi + Tj, j=0...m-1. (5)

1=0

После этого полученными значениями инициализируются значения аксонов второго слоя:

yj(2) = yj(1), j = 0...m-1. (6)

Вычислим новые состояния нейронов второго слоя:

m—1

s(j2;(p + 1) = Уj(p) — eXyk2; (p),kj,j = 0...m — 1, (7)

k=0

и значения их аксонов:

yj2 J P + 1 ) = f [sj2 J (p + 1)\j = 0...m — 1. (8)

Активационная функция f имеет вид порога, причем величина F должна быть достаточно большой, чтобы любые возможные значения аргумента не приводили к насыщению.

Проверим, изменились ли выходы нейронов второго слоя за последнюю итерацию. Если да - перейдем к шагу 2. Иначе - завершение алгоритма.

Единственная проблема, связанная с сетью Хемминга, проявляется в случае, когда зашумленные образы находятся на одинаковом (в смысле Хемминга) расстоянии от двух или более эталонов. В этом случае выбор сетью Хемминга одного из эталонов становится случайным [6].

Метод особых точек

Следующий метод, применяемый для распознавания изображений - метод особых точек.

В данном подходе изображение представлено в виде набора особых, или ключевых, точек. Особая точка сцены или точечная

особенность (point feature) - это такая точка изображения, окрестность которой можно отличить от окрестности любой другой точки изображения в некоторой другой окрестности особой точки [8].

Упрощенно можно определить особые точки как точки в местах резкого перепада градиента на изображении по x и по y (угловые точки).

Особые точки сравниваются друг с другом на основании их дескрипторов. Входными данными дескриптора является изображение и набор особых точек, выделенных на заданном изображении. В OpenCV существует класс для описания особых точек - дескриптор SURF (Speeded up Robust Features), он относится к числу тех дескрипторов, которые одновременно выполняют поиск особых точек и строят их описание, инвариантное к изменению масштаба и вращения. Кроме того, сам поиск ключевых точек обладает инвариантностью в том смысле, что объект, фотографическое изображение которого получено с другой точки зрения, имеет тот же набор особых точек, что и образец [9].

Сам по себе метод особых точек не дал хороших результатов - из 244 изображений пыльцевых зерен верно было распознано лишь 86, т. е. 35 %. На рис. 12, 13 приведены примеры детектирования особых точек, но на рис. 11 сравнение особых точек дало верный ответ, на рис. 12 - неверный.

Рис. 12. Пример корректного распознавания методом особых точек

Рис. 13. Пример некорректного распознавания методом особых точек

Метод особых точек оказался менее эффективен в задаче отнесения изображения пыльцевых зерен конкретному семейству, но достаточно хорош для отсеивания случайных разводов, которые не являются пыльцевыми зернами, но имеют тот же цвет. Возможно, малая эффективность связана с тем, что во многом пыльцевые зерна разных семейств имеют схожую округлую форму. Таким образом, данный метод завершает этап предварительной обработки изображения.

Тестирование и анализ результатов

Для оценки эффективности работы методов используются меры ошибок первого и второго рода.

Ошибка первого рода - это "ложный пропуск" (false negative), когда интересующее нас событие ошибочно не обнаруживается. Ошибка второго рода - "ложное обнаружение" (false positive), когда при отсутствии события ошибочно выносится решение о его присутствии [10].

Результаты тестирования, представлены в таблице. Что касается лингвистического метода, самые высокие результаты были получены при распознавании дудника лекарственного, а именно: процент ошибок первого рода составляет 44 %, второго рода - 0 %, доля верно распознаваемых пропусков соответственно составляет 100 %, а доля верно распознаваемых обнаружений - 56 %.

Результаты тестирования нейронной сети

Дудник Клевер Гречиха Иван-чай Гвоздика Средние характеристики

Количество зерен 122 135 53 74 73 452

Нормированный уровень ошибок первого рода 20 % 36 % 26 % 23 % 32 % 28 %

Нормированный уровень ошибок второго рода 28 % 5 % 0 % 0 % 0 % 7 %

Доля верно распознаваемых пропусков 72 % 95 % 100 % 100 % 100 % 93 %

Доля верно распознаваемых обнаружений 80 % 64 % 74 % 77 % 68 % 72 %

Совокупная доля верных распознаваний по пяти видам - 42 %.

Можно сделать вывод, что сочетание двух выше описанных методов и метода особых точек дает хороший результат по количеству ошибок второго рода, в среднем их доля составляет 7 % для нейронной сети и 0 % для лингвистического метода.

Средняя доля правильно распознаваемых изображений составляет 72 % для нейронной сети и 42 % для лингвистического метода.

Среди ошибок первого рода, когда распознаватель ошибочно не обнаруживает пыльцевое зерно, подавляющее большинство случаев приходится на зерна, снятые с внешнего слоя оболочки.

Заключение

Метод особых точек хорошо подходит для исключения из списка кандидатов на роль пальцевого зерна тех объектов, которые не являются пыльцевыми зернами. Обычно это случайные разводы в среде. Нейронная сеть и лингвистический метод не способны отличить

разводы от зерен, в этом их главный недостаток. Совместное использование основных методов с методом особых точек позволяет максимально исключить разводы из списка кандидатов для дальнейшего распознавания нейронной сетью.

Такой подход дает следующие результаты для нейронной сети: в среднем доля ошибок первого рода составляет 27 %, второго рода - 7 %. Соответственно, верно распознается около 72 % пыльцевых зерен. Лингвистическим методом верно распознается 42 % пыльцевых зерен.

Из пыльцевых зерен, которые не детектируются или распознаются ошибочно, большинство сфотографировано с внешней стороны оболочки, т. е. их границы сильно размыты, а форма плохо определяется. Также проблемными для распознавания являются слипшиеся пыльцевые зерна, но их в выборке крайне мало, порядка двух пар слипшихся зерен из 250 зерен.

В дальнейшем планируется использовать возможности OpenCV по бустингу, процедуре построения композиции алгоритмов, в котором каждом алгоритм стремится компенсировать недостатки композиции предыдущих. Также планируется применять распознавание на основе текстур, метода опорных векторов. Исследования в области нейронных сетей еще не завершены: в планах, к примеру, использование комбинации сетей, каждая из которых определяет для конкретного семейства, принадлежит ли ему распознаваемый образ.

Одним из недостатков применяемых методов является довольно низкая скорость обработки и распознавания. В среднем требуется 40 сек. на обработку изображения, содержащее одно пыльцевое зерно. Очевидно, программе требуется оптимизация. Поэтому один из следующих этапов разработки программного комплекса автоматизированного распознавания пыльцевых зерен - переход к параллельной обработке (использование GPU).

Список литературы

1. Сладкое А.Н. Введение в спорово-пыльцевой анализ. М.: 1967.

2. Черных А.Н., Замятина Е.Б. Проблемы применения классических методов распознавания образов для фотографических изображений пыльцевых зерен. Докл. все-рос. науч. конф. "Анализ изображений, сетей и текстов" (АИСТ'2013), Екатеринбург. Россия, 4-6 апреля 2013 г. М: Национальный Открытый Университет "ИНТУИТ", 2013. ISBN 978-5-9556-0148-9. С.160-168.

3. Bradsky G., Kaehler A. . "Leaming OpenCV. Computer Vision with the OpenCV Library". 2008.

4. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. М.: Техносфера, 2005.

5. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977.

6. Осовский С. Нейронные сети для обработки информации / пер. с польского И.Д. Ру-динского. М.: Финансы и статистика, 2002. С. 176-186.

7. Короткий. С. "Нейронные сети Хопфилда и Хэмминга". URL: http://www.shestopaloff. ca/kyriako/Russian/Artificia_Intelligence/Som e_publications/ Korotky_Neuron_network_ Lectures.pdf (Дата обращения: 28.11.2014).

8. Bay H, Ess A., Tuytelaars T., Van Gool L. Speeded-Up Robust Features (SURF) / Scientific publication - Zurich,Switzerland; Leuven, Belgium.

9. Бовырин А, Дружков П, Ерухимов В. "Детекторы и дескрипторы ключевых точек. Алгоритмы классификации изображений. Задача детектирования объектов на изображениях и методы её решения". URL: http://www.intuit.ru/studies/courses/10621/11 05/lecture/17983?page=2 (Дата обращения: 28.11.2014).

10. Вежневец В. Оценка качества работы классификаторов // Сетевой журнал "Компьютерная графика и мультимедиа". URL: http://cgm.сomputergraphics. ru/content/view/1 06 (Дата обращения: 28.11.2014).

Pollen-grains recognition using classical methods and neural networks

H. E. XaHMUHa, E. E. SaM^muHa

N. Е. Khanzhina, Е. B. Zamyatina

Perm State University, Russia, 614990, Perm, Bukirev st., 15 nehanzhina@gmail .com, e_zamyatina@mail. ru

This paper describes the problem of automated pollen-grains image recognition using images from microscope. This problem is relevant because it can help to automate a complex process of pollen-grains classification and to determine the beginning of plants pollinating which are cause of allergy. The main recognition method is Hamming network and linguistic approach. The paper includes Hamming network advantages over Hopfield network. The step of preprocessing (noise filtering, binarization, segmentation) uses OpenCV functions and the feature point method. The paper describes both preprocessing algorithms and main recognition methods. The experiments results showed relative efficiency of these methods. The conclusions about methods productivity are based on errors of type I and II. The paper includes alternative recognition methods which are planning to use in the follow up researches.

Key words: image recognition; OpenCV; Hamming network; feature point method; pollengrains; linguistic pattern recognition.

i Надоели баннеры? Вы всегда можете отключить рекламу.