Научная статья на тему 'Классификация состояний биоценозов с использованием нейросетевых технологий'

Классификация состояний биоценозов с использованием нейросетевых технологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
46
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ / КЛАССИФИКАТОР / НЕЙРОННАЯ СЕТЬ / БИОЦЕНОЗ / РАДИАЛЬНО-БАЗИСНЫЕ ФУНКЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Носков К.М.

Рассматривается проблема классификации состояний биоценозов как многомерных объектов. Предлагается алгоритм построения классификатора многомерных объектов, в частности классификации биоценозов, с применением нейронных сетей. Рассмотрена структура нейронной сети на радиально-базисных функциях. Описан алгоритм обучения нейронной сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Носков К.М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLASSIFICATION OF BIOCENOSIS STATES USING NEURAL NETWORK TECHNOLOGIES

Presented problem of classification biocenosis states as multidimensional objects. An algorithm with the use of neural networks for constructing a classifier for multidimensional objects, in particular, classification of biocenoses, is proposed. The structure of a neural network based on radial-basis functions is considered. Described neural network training algorithm.

Текст научной работы на тему «Классификация состояний биоценозов с использованием нейросетевых технологий»

CLASSIFICATION OF BIOCENOSIS STATES USING NEURAL NETWORK TECHNOLOGIES

Noskov K.M.

Alexeev Nizhni Novgorod State Technical University, master

Nizhni Novgorod

КЛАССИФИКАЦИЯ СОСТОЯНИЙ БИОЦЕНОЗОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЙ

Носков К.М.

Нижегородский Государственный Технический Университет им Р.Е. Алексеева, магистр

Нижний Новгород

ABSTRACT

Presented problem of classification biocenosis states as multidimensional objects.

An algorithm with the use of neural networks for constructing a classifier for multidimensional objects, in particular, classification of biocenoses, is proposed.

The structure of a neural network based on radial-basis functions is considered. Described neural network training algorithm.

АННОТАЦИЯ

Рассматривается проблема классификации состояний биоценозов как многомерных объектов. Предлагается алгоритм построения классификатора многомерных объектов, в частности классификации биоценозов, с применением нейронных сетей. Рассмотрена структура нейронной сети на радиально-базисных функциях. Описан алгоритм обучения нейронной сети.

Keywords: Classification, classifier, neural network, biocenosis, radial basis functions.

Ключевые слова: Классификация, классификатор, нейронная сеть, биоценоз, радиально-базисные функции.

Введение

Медико-биологический объект (биоценоз) -это совокупность разных видов микроорганизмов, связанных между собой определенными отношениями и населяющими определенную биологическую нишу. Частным случаем биоценоза является микрофлора желудочно-кишечного тракта (ЖКТ) человека. Путем сравнения состояния микрофлора ЖКТ пациента с эталонными значениями можно выявить риск возникновения опасных заболеваний. Качественные и количественные изменения в составе микрофлоры кишечника не могут пройти незаметно без отражения на состояние как самой микрофлоры кишечника, так и на состояние всего организма в целом. Правильная трактовка результата может иметь решающий вклад в постановку диагноза и выбора соответствующего метода лечения.

Классификация - группировка множества объектов по некоторым классификационным признакам, отражающая степень сходства объектов между собой и принадлежность к заранее определенным классам.

Цель процесса классификации состоит в построении математической модели, которая принимает на вход прогнозирующие атрибуты (признаки), а в качестве результата на выходе класс, которому принадлежат такие атрибуты. Процесс классификации заключается в создании связей между множеством признаков объектов и множеством классов и состоит из двух основных этапов: конструирование модели и её использование.

Классификатор - реализация процесса классификации, которая определяет объект в один из предопределенных классов по входному вектору признаков.

Базовая модель

Базовая модель, описывающая состояния ЖКТ, представляет собой п-мерное пространство признаков, которые априорно разделены на 4 класса, соответствующие степени дисбактериоза пациентов.

Единицы измерения признаков не должны влиять на результаты нейросетевого моделирования. Поэтому следует провести предварительную нормировку исходных данных, т.е. привести все исходные данные к заданному диапазону.

Один из способов нелинейной нормировки - с использованием сигмоидной логистической функции или гиперболического тангенса. Переход от традиционных единиц измерения к нормированным осуществляется следующим образом:

при нормализации в пределах [0, 1]: х^ =

1

e-a(xik-xci) + i

при нормализации в пределах [-1, 1]: x^ =

e-a(xik-xci)-i

e-a(xik-xci) + i

где xc

- центр нормализуемого

интервала измерения входных переменных;

+ x

x

2

а - параметр, влияющии на степень нелинейности изменения переменной в нормализуемом интервале.

Способ представления выходных значений

Одним из способов представления выходных значений является вектор, компоненты которого соответствуют классам. Результатом классификации будет класс под номером максимального компонента выходного вектора. Такой подход позволяет получить наряду с результатом уверенность в принадлежности этому классу.

При классификации состояний микрофлоры ЖКТ, выходной вектор может принимать следующий вид:

?={здоров; болен} - при разделении на 2 класса.

У={здоров; 1 степень; 2 степень; 3 степень} -при разделении на 4 класса.

Структура сети

В качестве классификатора использована нейронная сеть на радиально-базисных функциях. Нейронные сети такого типа широко применяются при аппроксимации функций с множеством переменных и в качестве классификаторов.

Структура сети (рис. 1) содержит два слоя нейронов. Выходы первого (скрытого) слоя определяют степень близости входных значений к центрам радиально-базисных функций. Выходы нейронов второго слоя - это линейные комбинации выходов скрытого слоя.

Рис. 1. Архитектура используемой нейронной сети на радиально-базисных функциях

Наиболее широко применяющиеся на практике Гауссовские функции (1), имеют локальный характер и принимают значения отличные от 0 только вокруг центра радиального элемента. Это позволяет установить зависимость между областью данных в многомерном признаковом пространстве и конкретным радиальным элементом. И(х) = ехр(—а • \\х-с\\2), (1) Где с - вектор центров множества радиально симметричных функций;

\\х — с\ - норма вектора отклонений входной переменной от центров радиально-симметричных функций. Параметр а связан с радиусом рассеяния

входных переменных г и может быть заменен в выражении (1) на соответствующее отношение: а =

1

ЧГ2

Норма разности векторов рассчитывается как евклидово расстояние:

\\Х — с\\ = 7(х — С1)2 + (х— Сч)2+...+(х — О2

Алгоритм обучения нейронной сети

На стадии обучения можно выделить три этапа: подбор центров и радиусов радиально-сим-метричных функций и оптимизация синоптических коэффициентов линейного выходного слоя.

Рис. 2. Блок-схема алгоритма обучения нейронной сети

Подбор центров радиально-симметричных функций

При большом объеме обучающих примеров можно воспользоваться несколькими способами подбора центров радиальных элементов.

• В качестве центров можно использовать отдельные случайные входные вектора из обучающей выборки

• Подбор наилучших центров из множества обучающих примеров, основанный на выборе максимально далеко расположенных друг от друга векторов из обучающей выборки.

• Использование различных алгоритмов кластеризации в том числе другие нейронные сети, например, сеть Кохонена.

Подбор радиусов радиальных элементов

Выбор радиусов определяется требуемым видом радиально-симметричной функции. При больших значениях параметра а график функции слишком острый, а это значит, что сеть не сможет корректно интерполировать данные между известными точками на достаточно большом удалении от них, так как теряет способность к обобщению обучающих данных. Наоборот, при чрезмерно малых значениях параметра а сеть становится невосприимчивой к отдельным деталям.

Оптимизация весовых коэффициентов

Использование псевдообратной матрицы является наиболее простым и быстрым алгоритмом оптимизации весовых коэффициентов.

1. Рассчитывается характеристическая матрица H значений радиально-симметричных элементов всех обучающих примеров:

H =

h

1(xi)

h

2(xi)

hl(X2) h2(x2) Lhi(x„) h2 (xn)

■■■ hm(x1) ■■■ hm(x2)

hm(Xn)-

Где п - количество обучающих примеров; т -количество радиальных элементов

2. Методами линейной алгебры рассчитывается матрица весовых коэффициентов выходного слоя нейронов :

\н = (нт-н)-1-Нт-У

Где H - матрица выходов обучающих приме-

ров.

Y =

У11 y21 y12 y22

yin У2П

Ук1 Ук2

Укп.

п - количество обучающих примеров; к - количество выходов нейронной сети.

Результаты

Для тестирования классификатора, построенного на основе нейронной сети создана программная реализация. В качестве обучающих и тестовых примеров использованы данные по бактериологическому исследованию микрофлоры кишечника, предоставленные Нижегородским научно-исследовательским институтом эпидемиологии и микробиологии им. Академика И. Н. Блохиной.

100%

1 I I I I I I I I

¡5 0-23 часа 24-167 7-29 суток 1-11 1-6 лет 7-17 лет 18-59 лет 60 лет и

О часов месяцев более

Возрастные группы

По степени ■ По типу диагноза (болен/здоров)

Рис. 3. Точность классификации по возрастным группам.

Точность построенного классификатора различается в зависимости от возрастных групп пациентов, а также от количества обучающих примеров. Общая точность классификации по всем возрастным группам: 62.55% при классификации по степени дисбактериоза (4-х компонентный выходной вектор) и 83.69% при классификации по типу диагноза (2-х компонентный выходной вектор)

Заключение

Рассмотрена возможность применения нейронных сетей на радиально-базисных функциях для построения классификатора многомерных объектов, в частности биоценозов.

Описана структура и алгоритм обучения используемой нейронной сети на радиально-базис-ных функциях.

Список использованной литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Ломакина Л.С., Соловьева И.В., Зеленцов С.А., Пожидаева А.С. Модели и алгоритмы диагностирования состояний биоценоза на основе априорных статистических данных // Научно-технический

вестник Поволжья. 2013. № 5. Казань: НИКГУ. С. 251-256.

2. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. -М.: Финансы и статистика, 2002. - 344 с.

3. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия - Телеком, 2006. — 452 с. ISBN 978-5-9912-0320-3

4. Хливенко Л.В. Практика нейросетевого моделирования: монография / Л.В. Хливенко. - Воронеж: ФГБОУ ВО «Воронежский государственный технический университет», 2015. -214с. ISBN 9785-7731-0429-2

5. Ломакин Д.В., Пожидаева А.С., Блажнов И.Д. Модели и алгоритмы классификации состояний биоценозов на основе структурных свойств многомерных данных // Системы управления и информационные технологии, №3(61), 2015. - С. 2227

i Надоели баннеры? Вы всегда можете отключить рекламу.