Научная статья на тему 'Методы и модели автоматической классификации объектов по признакам на основе иммунокомпьютинга'

Методы и модели автоматической классификации объектов по признакам на основе иммунокомпьютинга Текст научной статьи по специальности «Математика»

CC BY
259
79
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННАЯ ИММУННАЯ СИСТЕМА / ОТРИЦАТЕЛЬНЫЙ ОТБОР / HYPERCELL

Аннотация научной статьи по математике, автор научной работы — Зайцев С. А., Субботин С. А.

Проведен анализ основных моделей искусственных иммунных систем. Экспериментально оценена работа различных видов детекторов применительно к решению задачи автоматической классификации сельскохозяйственных растений по результатам дистанционного зондирования. Предложен метод классификации растений на основе моделей иммунокомпьютинга, позволяющий проводить обучение на экземплярах только одного класса и обеспечивающий необходимый уровень точности распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Зайцев С. А., Субботин С. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы и модели автоматической классификации объектов по признакам на основе иммунокомпьютинга»

УДК 004.93

Зайцев С. А.1, Субботин С. А.2

1 Аспирант Запорожского национального технического университета 2Канд. техн. наук, доцент Запорожского национального технического университета

МЕТОДЫ И МОДЕЛИ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ОБЪЕКТОВ ПО ПРИЗНАКАМ НА ОСНОВЕ ИММУНОКОМПЬЮТИНГА

Проведен анализ основных моделей искусственных иммунных систем. Экспериментально оценена работа различных видов детекторов применительно к решению задачи автоматической классификации сельскохозяйственных растений по результатам дистанционного зондирования. Предложен метод классификации растений на основе моделей иммунокомпьютинга, позволяющий проводить обучение на экземплярах только одного класса и обеспечивающий необходимый уровень точности распознавания.

Ключевые слова: искусственная иммунная система, отрицательный отбор, Нурегсеіі.

ВВЕДЕНИЕ

Проблема автоматизации разделения объектов на классы по признакам актуальна для разнообразных приложений в технической и биомедицинской диагностике, а также находит свое применение в растениеводстве при решении проблемы борьбы с сорными растениями [1].

При традиционном подходе обработка пропашных культур ядохимикатами для уничтожения сорных растений осуществляется путем поверхностного внесения гербицидов. При этом большое количе -ство ядохимикатов попадает в окружающую среду, загрязняя почву, поверхностные и подземные воды, а также попадая через культурные растения и влияя негативным образом на человека и животных. При этом эффективность традиционного подхода является весьма невысокой вследствие дороговизны ядохимикатов, потерь из-за загрязнения окружающей среды, а также способности ядохимикатов бороться преимущественно только с растениями одного класса (например, в случае использования гербицидов селективного действия необходимо классифицировать однодольные и двудольные сорняки).

В [1] предлагается способ обработки пропашных культур, направленный на индивидуальную обработку сорных растений и основанный на использовании автоматической классификации растений по их биологическим особенностям, проявляющимся при дистанционном зондировании в спектрах отражения. В качестве признака для процедуры распознавания принимается измеряемая величина, соответствующая коэффициенту спектральной яркости (КСЯ).

© Зайцев С. А., Субботин С. А., 2010

Ранее для решения задачи разделения растений на культурные и сорные применялись многослойные [2] и радиально-базисные [3] нейронные сети. Недостаток полученных моделей заключается в том, что методы их обучения требуют наличия экземпляров каждого класса, в т. ч. и сорных растений. Однако получение информации обо всех возможных видах сорных растений в разных фазах роста для построения распознающих моделей является затруднительным.

В качестве системы классификации растений перспективным является использование моделей искусственных иммунных систем (ИИС), поскольку одна из основных задач биологической иммунной системы - разделение объектов на классы, а именно на «свои» (self) и «чужие» (non-self) клетки. При этом существует возможность обучения с помощью экземпляров только одного класса. Используя иммунную память, иммунная система поддерживает идеальный баланс между экономией ресурсов и выполнением своих задач за счет сохранения минимально необходимых знаний, получаемых в процессе обучения. Поскольку формирование иммунного ответа всегда происходит случайным образом, детектор может определять инородные тела даже в тех случаях, когда не существует явных представлений об их структуре.

Исходя из этого, для решения задачи классификации растительных объектов по результатам дистанционного зондирования авторами предлагается использование ИИС, которые обладают свойствами обучаемости распознаванию образов даже в случае сложно разделимых классов [4].

Цель работы заключается в построении такой модели ИИС для классификации растений, которая позволяла бы выполнять наиболее точное распознавание

с минимальными временными затратами, основываясь на экземплярах растений только одного класса.

1. ПОСТАНОВКА ЗАДАЧИ

Пусть задана выборка X с В, каждый экземпляр

.-у ^ г

которой описывается п признаками х = {XJ}, где 5 -номер экземпляра, ] - номер признака, х5 е X. Для экземпляров х5 обучающей выборки известны номера классов экземпляров у = {у }. Тогда задача автоматической классификации может быть представлена как задача построения модели зависимости номера класса у от значений признаков экземпляра х е В по обучающей выборке данных (х, у).

Применительно к задаче классификации растений на основе методов иммунокомпьютинга необходимо синтезировать соответствующую модель ИИС, которую в общем виде можно описать кортежем (В, М,А), где В - область допустимых значений входных данных, М - множество детекторов, представляющих иммунную память, А - правило, позволяющее распознавать экземпляры, полагаясь на знания, хранящиеся в иммунной памяти.

В рассматриваемой задаче множество В определяет возможные значения спектров растений, а классификацию необходимо провести для выделения культурных и сорных (однодольных и двудольных) растений.

2. СИНТЕЗ ИММУННОЙ МОДЕЛИ

Построение иммунного классификатора на основе ИИС, как правило, происходит в три этапа [5].

Вначале следует определить способ описания структуры исследуемого объекта. Их существует два - с помощью вектора вещественных чисел и с помощью битовых строк.

Следующим этапом будет определение меры для оценки подобия (аффинности) двух объектов. В качестве данной меры используются различные метрики. В случае вектора вещественных чисел аффинность элементов можно измерить, используя Евклидово расстояние или расстояние Манхэттена, для битовых строк мерой аффинности выступает расстояние Хемминга, гсЬ-метрика, метрика г-сИипкБ.

Завершающим этапом является выбор модели ИИС, которая и будет проводить процесс классификации. Среди основных моделей ИИС выделяют модель клональной селекции, модель отрицательного отбора и искусственные иммунные сети.

Поскольку описание признаков в рассматриваемой задаче определяется значениями КСЯ, при проведении синтеза иммунной модели для классифика-

ции растений в качестве представления детектора предлагается использовать вектор вещественных чисел. В качестве меры аффинности в таком случае используется Евклидово расстояние, т. к. эта метрика отличается простотой и наглядностью. «Своими» экземплярами будем считать культурные растения, а «чужими» - сорные.

Исходные данные, использованные для оценки работоспособности методов, с разрешения автора взяты из [6], а сравнимые показатели качества распознавания - из работы [7]. Особенностью решаемой задачи является то, что исходное пространство признаков характеризуется высокой размерностью - значения КСЯ измерялись в 55 диапазонах. Кроме того, в случае исходной выборки ограниченного объема (248 экземпляров), сложно выполнить эффективное обучение, поскольку при малом объеме обучающей выборки, которая является частью исходной, снижается вероятность построения адекватной модели для распознавания.

Для решения задачи использовались две основные иммунные модели - модель отрицательного отбора и модель клональной селекции. Рассмотрим особенности каждой из них.

Модель отрицательного отбора была предложена С. Форрест [8]. Основным компонентом данной модели является специфическая область иммунной памяти, хранящая информацию только о «своих» клетках. В биологической иммунной системе ей соответствует тимус. Работа модели отрицательного отбора происходит в два этапа и включает в себя обучение и классификацию. В процессе обучения создаются случайные детекторы, и выполняется сопоставление каждого сгенерированного детектора набору «своих» клеток. В случае совпадения новый детектор удаляется из популяции. Детекторы, не совпадающие ни с одной из «своих» клеток, пополняют иммунную память и становятся частью ИИС, определяющей область «чужих» клеток. Создание случайных детекторов и их последующий отбор проводится до тех пор, пока не будет получено требуемое число детекторов. Для обеспечения необходимого уровня точности распознавания производится вероятностная оценка количества детекторов.

Процесс классификации устроен таким образом, что поступающая клетка считается «чужой», если она попадает в область детекторов иммунной памяти, и «своей» - в противном случае.

Модель отрицательного отбора широко используется в задачах обнаружения аномалий, например, сетевых атак, при двухклассовом распознавании образов и во многих других приложениях [9]. Это объясняется

простотой, гибкостью и относительно высоким быстродействием данной модели.

Модели, основанные на теории клональной селекции, способны улучшать свои характеристики во время обучения за счет этапа «усиления аффинности» [10]. Модели клональной селекции, как правило, реализуют парадигму положительного отбора, т. е. детекторы, хранящиеся в иммунной памяти, описывают пространство «своих» клеток. Метод обучения модели включает в себя следующие этапы.

1. Задается обучающая выборка Ag, состоящая из антигенов. Антигенами будем считать такие экземпляры из обучающей выборки, которые принадлежат к классу «своих». Создается временная популяция из n случайных клеток D = {db d2, dn}, dt = rand(), где rand() - функция, возвращающая вектор х е B, состоящий из случайных элементов, i = 1, n.

2. Рассчитывается матрица взаимной аффиности элементов обучающей выборки и детекторов в популяции Aff = D х Ag.

3. Детекторы популяции подвергаются клонированию и мутации, при этом для детектора создается тем больше клонов, чем выше его аффинность антигенам (что приводит к повышению вероятности покрытия антигена), а степень мутации созданных клонов обратно пропорциональна аффинности (что снижает область поиска для более оптимальных детекторов). Процесс клонирования приводит к созданию некоторого числа детекторов, идентичных родительскому. Процесс мутации случайным образом изменяет эти детекторы, как правило, с помощью случайной или неравномерной (non-uniform) мутации.

4. Из полученных клонов отбираются элементы с максимальным уровнем аффинности, и они заменяют родительский детектор в популяции.

Элементы из популяции с наиболее высоким уровнем аффинности переносятся в иммунную память, после чего этапы 1-4 повторяются, пока не будет достигнут критерий останова. В качестве критерия останова, как правило, применяют ограничение на время обучения, на максимальное количество итераций, на размер популяции или на предельное количество неэффективных итераций (т. е. итераций, ко -торые не приводят к добавлению новых детекторов в память).

Благодаря высокой скорости сходимости метода обучения, модель клональной селекции находит широкое применение в задачах оптимизации, поскольку она нечувствительна к локальным оптимумам. Ее использование в качестве классификатора также оправдано

высоким быстродействием и способностью обучаться на экземплярах только одного класса («своего»).

Применительно к задаче распознавания растений обучающую выборку получаем из исходной путем случайного выбора из нее около трети экземпляров (от 81 до 87). Однако построение модели зависимости номера класса от значений всех 55 признаков экземпляра выборки не дало удовлетворительных результатов. Даже при различных параметрах (критериях останова, максимальном размере популяции, пороге минимальной аффинности, различных схемах мутации) показатели точности классификации оставались в диапазоне 27-33 %.

Причина такого снижения эффективности распознавания описана в [11]. Как известно, объем гиперсферы радиусом г в п-мерном пространстве можно вычислить как

V(n, r) =

n n/ 2

r П

ГI 2 + 1

где Г(п + 1) = n!, n є N и Г\п + ;-| = 1, 3, 5, ..., ^ \

2J 2n 4П

для вещественных аргументов.

Из данной формулы видно, что объем п-мерной гиперсферы стремится к нулю, если размерность стремится к бесконечности. Также установлено, что при больших размерностях точки, равномерно распределенные в гиперсфере, преимущественно сосредоточены в тонком слое у поверхности гиперсферы. Это объясняет тот факт, что, например, гиперсфера единичного радиуса обладает сравнительно большим объемом по отношению к радиусу лишь при размерности пространства менее 15.

В работе [12] предлагалось использовать в качестве меры аффинности нормы большего порядка, чем у Евклидовой метрики. С другой стороны, такой подход усилит влияние шумов при обучении. Незначительные отклонения будут многократно усилены за счет вознесения в большую степень.

Таким образом, для построения модели зависимости классов растений от значений КСЯ является актуальным снижение размерности задачи за счет отбора признаков. Поскольку оценка информативности признаков в случае использования ИИС тесно связана с характеристиками иммунной модели, которая будет применяться во время классификации, то для отбора признаков был использован подход «надстройки» (wrapper). В частности, применялся метод QuickReduct [13], поскольку он прост в реализации и приводит к хорошим результатам при небольшом количестве

Таблица 1. Результаты одномерной классификации растений с помощью моделей ИИС

Модель ИИС I II III

№ признака Е, % № признака Е, % № признака Е, %

Отрицательный отбор 4 27,82 3 32,26 1 33,47

Клональная селекция 3 32,26 1 33,47 5 41,94

Таблица 2. Результаты классификации растений с помощью моделей ИИС по двум признакам

Модель ИИС I II III

№ признака Е, % № признака Е, % № признака Е, %

Отрицательный отбор 3, 8 41,94 2, 3 42,34 2, 9 43,55

Клональная селекция 1, 6 11,69 1, 9 12,90 3, 7 16,13

признаков в результирующем множестве. При этом данный метод в процессе работы не генерирует избыточное количество больших наборов признаков, а, начиная с пустого множества, «жадным» способом добавляет по одному признаку в набор до тех пор, пока добавление очередного признака не перестанет улучшать точность классификации.

В табл. 1 приведены результаты одномерной классификации растений с помощью моделей ИИС. В столбцах, описывающих точность классификации, указаны значения для трех наиболее информативных признаков с точки зрения моделей: указывается номер признака, по которому проводилась классификация, и процент ошибочных решений Е.

Анализируя полученные данные, следует отметить, что поскольку обе модели ИИС в равной степени хорошо справляются с разделением нелинейно разделимых классов, их использование приводит к близким результатам. В частности, одномерная классификация позволила установить, что наилучшее разделение по одному признаку происходит при анализе спектров низких частот. Однако количество ошибочных решений в этом случае достаточно высоко, следовательно, требуется выполнить отбор еще одного признака для классификации.

Проведенные эксперименты показали, что дальнейший перебор комбинаций признаков является вычислительно сложным. Поскольку все признаки однотипные, то снижение размерности задачи возможно за счет выполнения линейной свертки групп по пяти признакам.

В табл. 2 приведены результаты классификации растений по двум признакам. Обучающая выборка отбиралась аналогично предыдущему случаю.

Очевидно, что модель отрицательного отбора показывает гораздо менее точные результаты по сравнению с моделью клональной селекции. Этот факт

объясняется тем, что размер допустимого пространства признаков значительно превышает область, покрываемую «своими» детекторами.

Так, если радиус детектора г, то область, покрываемая им в двухмерном пространстве имеет площадь

л • г2. В то время как допустимая область значений признаков нормирована и её площадь равна единице. В рассматриваемой выборке насчитывается в среднем около 30 уникальных (отдаленных более чем на г) «своих» экземпляров. Соответственно, при пороге аффинности, равном радиусу детектора, их площадь составляет 30 -л- г2. Иными словами, для полного покрытия «своей» области детекторами радиуса г необходимо около 30 детекторов, а для покрытия чужой области такими же детекторами их количество должно быть около 100, если принять радиус детектора равным 0,05.

Увеличивая радиус детектора, можно восстановить баланс между «своими» и «чужими» областями, однако в этом случае ошибка классификации все равно останется высокой, поскольку увеличение радиуса детектора неизбежно приводит к снижению точности распознавания.

3. ОПТИМИЗАЦИЯ МОДЕЛИ ИИС

ДЛЯ РЕШАЕМОЙ ЗАДАЧИ

Для использования парадигмы отрицательного отбора в дальнейших исследованиях необходимо использовать улучшенные модели, которые позволили бы сократить число детекторов без существенного снижения точности распознавания. В следующих тестах будут применяться модели У-Бйейог [14] и Нурегсе11.

Основная идея первой модели заключается в том, что детекторы могут обладать варьирующимися ха-

рактеристиками, в частности, для вещественных детекторов такой характеристикой является их радиус.

Метод обучения такой модели может выглядеть следующим образом.

1. Установить иммунную память М = 0.

2. Сгенерировать случайный детектор ё радиусом гё.

3. Определить расстояние до ближайшего антигена га^

4. Уменьшить радиус детектора таким образом, чтобы он не перекрывал ни один из антигенов гё =

= гё - ^

5. Если гл > 0, т. е. если детектор не перекрывает ни один антиген, то добавить его в иммунную память М = М и { ё}.

Изложенный метод предполагает, что большие участки, не принадлежащие к «своей» области, будут покрыты более крупными детекторами, в то время как более детальные контуры области будут «уточняться» детекторами меньшего радиуса. Данный метод отличается высокой скоростью сходимости и при этом обеспечивает высокую точность распознавания.

Альтернативой для такой модификации модели отрицательного отбора может служить предложенная авторами модель Нурегсе11, которая представляет собой объект, объединяющий свойства детектора и модели и способный автономно принимать решение о том, какие свойства в данный момент лучше применять. Когда Нурегсе11 ведет себя как детектор, она может вычислять аффинность другим детекторам и антигенам. В случае поведения модели, Нурегсе11 может создавать внутри себя другие Нурегсе11 и контролировать их популяцию за счет метадинамики - генерации новых детекторов или удаления неэффективных. Таким образом, модель Нурегсе11 представляет собой древовидную иерархию, в которой листья имитируют детекторы, а остальные узлы - модели. Древовидная структура определяет сильные стороны модели Нурегсе11,

такие как высокая скорость работы, снижение негативного эффекта оверфиттинга (запоминания) за счет отсечения избыточных узлов дерева. Двойственное поведение элементов дерева обеспечивает адаптивность модели и её способность обучаться. В табл. 3 и 4 приведены результаты классификации растений с помощью описанных выше моделей по одному и двум признакам, соответственно.

Исходя из табл. 3 и 4, рассмотренные выше модели отличаются высокой скоростью и эффективностью по сравнению с моделью отрицательного отбора. В то же время они так же обучаются с использованием экземпляров одного класса и толерантны к «своим» клеткам.

Для подтверждения качества обучения моделей был использован метод случайных подвыборок [15]. Идея этого метода заключается в том, что для обучения модели формируется подвыборка путем случайного независимого отбора экземпляров исходной выборки, при этом вероятность отбора для каждого экземпляра одинакова. Поскольку используются различные части выборки, то случайные закономерности в различных подвыборках отбрасываются, в то время как действительно устойчивые закономерности на различных подвыборках только «подтверждаются».

Такое преобразование исходной выборки позволило оценить способность моделей аппроксимировать входные данные. Выяснилось, что в моделях клональной селекции и У-Бе1ейог наблюдалось явление оверфиттинга. Рассмотрим причины этого явления.

Основная идея модели клональной селекции заключается в генерации случайных детекторов таким образом, чтобы на каждой итерации расстояние между детекторами в иммунной памяти и экземплярами обучающей выборки сокращалось. При большом количестве итераций такой подход приводит к тому, что детекторы памяти фактически «запоминают» обучающую выборку, что ухудшает способность модели искать зако-

Таблица 3. Результаты одномерной классификации растений с помощью моделей У-Бе1ес1;ог и Нурегсе11

Модель ИИС I II III

№ признака E, % № признака E, % № признака E, %

V-Detector З З2,26 2 ЗЗ,06 1 ЗЗ,47

Hypercell 2 З2,26 З ЗЗ,87 4 З7,90

Таблица 4. Результаты классификации растений с помощью моделей У-Бе1ейог и Нурегсе11 по двум признакам

Модель ИИС I II III

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

№ признака E, % № признака E, % № признака E, %

V-Detector 1, З 5,26 1, 4 10,89 З, 7 14,11

Hypercell 1, З 8,06 1, 2 10,48 З, 8 16,94

номерности в выборке. Снизить влияние этого эффекта можно, уменьшив число итераций.

Модель У-Бе1ейог склонна к переобучению, поскольку плотность покрытия пространства признаков детекторами постоянна и не зависит от концентрации антигенов. Иными словами, любой детектор покрывает область, вплотную прилегающую к его зоне. В процессе обучения покрытие детекторов описывает все пространство за исключением элементов обучающей выборки, т. е. происходит явление овер-фиттинга, при котором запоминаются области, комплементарные обучающей выборке (дополняющие её до области допустимых значений В). Возможным решением этой проблемы может стать случайная вариация радиуса детектора - увеличивать радиус не до момента обнаружения антигена, а на некоторую случайную величину, близкую к данной.

Данные обучения с учетом предложенных модификаций приведены в табл. 5. Отбрасывая заведомо непригодные признаки, в тесте выполнялся отбор их комбинаций в группах 0, 1 и 4. Как видно из табл. 5, исследуемые модели ИИС показывают хорошие результаты классификации для решаемой задачи, что позволяет рекомендовать их для применения на практике. Следует отметить, что ошибка классификации в большей степени зависит от правильности распознавания экземпляров «чужого» класса. Объясняется это тем, что обучение производится с помощью экземпляров культурных растений, т. е. «своего» класса, а значит и ошибка распознавания таких растений минимальна (как правило, 1-2 экземпляра). Наиболее информативные признаки, согласно результатам, соответствуют длинам волн в 310-320, 360-370, 410 нм.

Поскольку иммунная система по своей природе предназначена для проведения двухклассовой классификации, наиболее очевидное решение проблемы разделения сорных растений на однодольные и двудольные заключается в использовании метода дихотомии. Поэтому вначале необходимо выделить только сорные растения. Эти данные являются исходными для построения еще одной модели ИИС. «Своими» экземплярами можно считать однодольные растения, а «чужими» - двудольные. Несмотря на свою простоту, такой подход существенно сокращает репрезентативность обучающей выборки, формируемой из исходной выборки малого объема, что в условиях решаемой задачи недопустимо.

Вместо этого предлагается построение нескольких моделей. Первая производит распознавание однодольных сорных растений («своих») и остальных («чужих») растений. Вторая модель отличает только двудольные растения от прочих, а третья определяет культурные растения. Каждый экземпляр тестовой выборки проходит классификацию с помощью всех трех моделей. Таким образом, получаем многослойную иммунную систему, в которой каждый слой принимает решение об отнесении экземпляра к определенному классу. Решение является однозначным, если только одна модель отнесла экземпляр к «своему» классу, в противном случае система не может классифицировать объект, и, соответственно, определить класс можно только с определенной вероятностью пропорционально значениям меры аффинности различных моделей.

В табл. 6 приведены результаты классификации сорных растений на однодольные и двудольные с применением описанной выше схемы.

Таблица 5. Результаты классификации растений с помощью модифицированных моделей по двум признакам

Модель ИИС I II III

№ признака E, % № признака E, % № признака E, %

V-Detector 1, 7 8,87 1, 2 9,68 1,6 10,08

Hypercell 1, 6 8,06 1, 10 10,08 1, 2 10,48

Клональная селекция 1,7 8,06 1, 6 10,08 1, 23 10,48

Таблица 6. Результаты классификации сорных растений на однодольные и двудольные с помощью многослойной модели ИИС

Модель ИИС I II HI

№ признака E, % № признака E, % № признака E, %

V-Detector 1, 6 10,48 1, 2 10,89 1, 7 11,69

Hypercell 1, 7 10,48 1, 6 11,29 1, 23 12,10

Клональная селекция 1, 7 11,29 1, 2 11,69 7, 23 12,90

Полученные результаты позволяют рекомендовать модели V-Detector, Hypercell и клональной селекции для классификации растений не только на культурные и сорные, но и для дальнейшего разделения сорных растений на однодольные и двудольные.

Вышеизложенные методы были программно реализованы в виде библиотеки для синтеза моделей иммунокомпьютинга JAIMS (Java Artificial Immune Systems). Библиотека написана на языке программирования Java и позволяет выполнять построение различных моделей иммунокомпьютинга, а также проводить их обучение и использование на практике. Данная библиотека использовалась для проведения экспериментов, результаты которых приведены в табл. 3 и 4.

Проведенные эксперименты подтвердили работоспособность разработанного математического обеспечения и позволяют рекомендовать его для использования на практике, в частности, при решении задачи автоматизации классификации растений.

ЗАКЛЮЧЕНИЕ

С целью решения актуальной проблемы автоматизации процесса классификации растительных объектов по признакам разработано математическое обеспечение, позволяющее синтезировать распознающие модели на основе методов иммунокомпьютинга.

Научная новизна работы заключается в том, что впервые предложен метод классификации растительных объектов на основе модели Hypercell. Получили дальнейшее развитие модели V-Detector и клональной селекции, использующие для обучения экземпляры только одного класса растений (культурные на первом уровне дихотомии, сорные однодольные - на втором), что позволяет помимо разделения на сорные и культурные классифицировать также однодольные и двудольные сорные растения. Предложенный метод дает высокую точность распознавания растений.

Практическая ценность работы состоит в том, что разработана программа для классификации объектов на основе иммунокомпьютинга, а также получены модели принятия решений в задачах дистанционного зондирования сельскохозяйственных растений с помощью отрицательного отбора и клональной селекции, позволяющие определять зависимость номера класса растений от спектральных признаков.

Разработанное математическое обеспечение успешно прошло стадию тестирования, обладает высокими показателями точности и может быть рекомендовано для использования на практике. Использование способа [1] в совокупности с предложенным

математическим обеспечением позволит сократить расход ядохимикатов для уничтожения сорных растений, снизить их влияние на окружающую среду, повысить урожайность культурных растений.

Дальнейшие исследования могут быть сосредоточены на исследовании влияния различных мер аффинности на точность классификации растений с помощью моделей иммунокомпьютинга, а также на повышении скорости построения модели Hypercell за счет нахождения оптимального соотношения размеров детекторов на разных уровнях иерархии модели.

Работа выполнена в рамках госбюджетной научноисследовательской работы кафедры программных средств Запорожского национального технического университета «Информационные технологии автоматизации распознавания образов и принятия решений для диагностики в условиях неопределенности на основе гибридных нечеткологических, нейросете-вых и мультиагентных методов вычислительного интеллекта» (номер государственной регистрации 0109U007673).

СПИСОК ЛИТЕРАТУРЫ

1. Патент 27425 Україна МПК2006 А 01 В 39/00. Спосіб прополки просапних культур і пристрій для його здійснення / Д. М. Піза, О. Д. Піза, І. М. Татарчук. - Запор. держ. техн. ун-т. Заявл. 17.12.1992. Заявка № 94010291. Опубл. 15.09.2000. Бюл. № 4, 2000. - 6 с.

2. Дубровин В. И. Распознавание растений по результатам дистанционного зондирования на основе многослойных нейронных сетей / В. И. Дубровин, С. В. Мор-щавка, Д. М. Пиза, С. А. Субботин // Математические машины и системы. - 2000. - № 2, 3. - С. 113-119.

3. Дубровин В. И. Применение радиально-базисных нейронных сетей для обработки данных дистанционного зондирования растений / В. И. Дубровин, С. В. Морщав-ка, Д. М. Пиза, С. А. Субботин // 3-я Международная конференция и выставка «Цифровая обработка сигналов и ее применение» : сборник трудов. Москва, 29 ноября - 1 декабря 2000 г. - М. : РНТОРЭС им. А. С. Попова, 2000. - Т. 3. - С. 48-53.

4. Искусственные иммунные системы и их применение / под ред. Д. Дасгупты ; пер. с англ. А. А. Романюхи. -М. : Физматлит, 2006. - 344 с.

5. Tarakanov A. O. Immunocomputing: Principles and Applications / A. O. Tarakanov, V. A. Skormin, S. S. Sokolova. - New York : Springer-Verlag, 2003. - P. 195.

6. Морщавка С. В. Радиоэлектронная система распознавания растительных объектов: дис. ... канд. техн. наук: 05.12.17 / Морщавка Сергей Владимирович. -Запорожье, 2004. - 162 с.

7. Піза Д. М. Вибір ефективного методу розпізнавання рослин за коефіцієнтами спектральної яскравості / Д. М. Піза, С. В. Морщавка, Ю. В. Скоробогатов // Радіоелектроніка. Інформатика. Керування. - 1999. -Vol. 1. - С. 83-87.

8. Forrest S. Self-nonself discrimination in a computer /

S. Forrest, A. S. Perelson, L. Allen, R. Cherukuri // IEEE Computer Society Symposium «Research in Security and Privacy»: Proceedings, Oakland, May, 16-18, 1994. - Los Alamitos : IEEE Computer Society Press, 1994. - P. 202-212.

9. Stibor T. A Comparative Study of Real-Valued Negative Selection to Statistical Anomaly Detection / T. Stibor,

J. Timmis, C. Eckert // 4thInternational Conference on Ar-tifical Immune Systems (ICARIS): Proceedings / Eds.: C. Jacob et al., Banff, Alberta, Canada, August, 14-17, 2005. - Berlin : Springer-Verlag, 2005. - P. 262-275.

10. De Castro L. N. The clonal selection algorithm with engineering applications / L. N. de Castro, F. J. von Zuben // Genetic and Evolutionary Computation Conference (GECC0’00) : proceedings, Las Vegas, July 2000. - California : Morgan Kaufmann Publishers, 2000. - P. 36-37.

11. Stibor T. On the Use of Hyperspheres in Artificial Immune Systems as Antibody Recognition Regions / T. Stibor, J. Timmis, C. Eckert // 5thInternational Conference on Ar-tifical Immune Systems (ICARIS): Proceedings / Eds.: H. Bersini, J. Carneiro, Oeiras, September 4-6, 2006. -New York : Springer-Verlag, 2006. - P. 215-228.

12. Verleysen M. Learning high-dimensional data / M. Ver-leysen // Limitations and future trends in neural computation. - 2003. - Vol. 186. - P. 141-162.

13. Jensen R. Computational Intelligence and Feature Selection: Rough and Fuzzy Approaches / R. Jensen, Q. Shen. -UK : IEEE Press and Wiley & Sons, 2008. - P. 340.

14. Ji Z. V-Detector: An Efficient Negative Selection Algorithm with «Probably Adequate» Detector Coverage / Z. Ji, D. Dasgupta // Information Sciences. - 2009. -Vol. 179. - P. 1390-1406.

15. Buhlmann P. Analysing Bagging / P. Buhlmann, B. Yu // The Annals of Statistics. - 2002. - Vol. 30. - P 927-961.

Надійшла 29.03.2010

Зайцев С. О., Субботін С. О.

МЕТОДИ ТА МОДЕЛІ АВТОМАТИЧНОЇ КЛАСИФІКАЦІЇ ОБ’ЄКТІВ ЗА ОЗНАКАМИ НА ОСНОВІ ІМУ-НОКОМП’ЮТИНГУ

Проведено аналіз основних моделей штучної імунної системи. Експериментально оцінено роботу різних видів детекторів у вирішенні задачі автоматичної класифікації сільськогосподарських рослин за результатами дистанційного зондування. Запропоновано метод класифікації рослин на основі моделей імунокомп’ютингу, що дозволяє проводити навчання на екземплярах лише одного класу та забезпечує необхідний рівень точності розпізнавання.

Ключові слова: штучна імунна система, негативна селекція, Hypercell.

Zaitsev S. A., Subbotin S. A.

METHODS AND MODELS OF AUTOMATED OBJECTS CLASSIFICATION BY FEATURES BASED ON IMMUNO-COMPUTING

Basic artificial immunity models have been analyzed. Experiments were carried out and various detectors were estimated by solving the problem of plants recognition on remote sensing results. The method based on the immunocomputing principles was proposed. It allows to perform learning procedure using single class exemplars and ensures necessary recognition accuracy.

Key words: artificial immune system, negative selection, Hypercell.

УДК 681.3.06

Халимов Г. З.

Канд. техн. наук, доцент Харьковского национального университета радиоэлектроники

ОЦЕНКА ЧИСЛА РЕШЕНИЙ УРАВНЕНИЯ ГУРВИЦА В КОНЕЧНОМ ПОЛЕ

Представлены результаты по оценкам числа решений уравнения Гурвица в конечном поле и практический алгоритм нахождения решений.

Ключевые слова: кривая Гурвица.

ВВЕДЕНИЕ

Алгеброгеометрический подход при решении ряда задач в кодировании и криптографии связывается с полем рациональных функций на многообразиях, которые во многих случаях определяются точками алгебраических кривых. Можно отметить, например, традиционные исследования по эллиптическим кривым в криптографии цифровой подписи или по кривым Эрмита, Сузуки для задач универсального хеширования и помехоустойчивого кодирования. Кривые Гурвица относятся к классу замечательных кривых с большим числом точек.

Основные результаты по кривым Гурвица представлены в работах F. Torres [1, 2], P. Carbonne,

© Халимов Г. З., 2010

T. Henocq в [3], R. Pellikan, P. Beelen [4, 5] и автора статьи [6, 7]. В работе [1] введено определение обобщенных кривых Гурвица и установлен морфизм между обобщенными кривыми Гурвица и Ферма. Здесь же определены условия максимальности для обычных кривых Гурвица и обобщенных кривых при ограничении на выбор показателей степени кривой. Связь между кривыми Гурвица и Ферма представлена P. Carbonne, T. Henocq в [3]. В работе [4] предложена техника построения кривых на основе формального полинома и определен класс кривых Гур-вица, как обобщение квартики Клейна. В работе [5] представлены соотношения для рода кривой. Некоторые оценки числа решений кривой Гурвица для про-

i Надоели баннеры? Вы всегда можете отключить рекламу.