Научная статья на тему 'Исследование bagging подхода при построении ансамбля моделей для повышения точности классификации'

Исследование bagging подхода при построении ансамбля моделей для повышения точности классификации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
109
41
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Синяев И.Ф., Шестернева О.В.

Приводится исследование bagging подхода при построении ансамбля моделей с целью повышения точности классификации на тестовой задаче. Выделяются положительные и отрицательные стороны подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование bagging подхода при построении ансамбля моделей для повышения точности классификации»

Актуальные проблемы авиации и космонавтики - 2014. Информационные технологии

УДК 669.713.7

И. Ф. Синяев Научный руководитель - О. В. Шестернева Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИССЛЕДОВАНИЕ BAGGING ПОДХОДА ПРИ ПОСТРОЕНИИ АНСАМБЛЯ МОДЕЛЕЙ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ КЛАССИФИКАЦИИ

Приводится исследование bagging подхода при построении ансамбля моделей с целью повышения точности классификации на тестовой задаче. Выделяются положительные и отрицательные стороны подхода.

Под ансамблем моделей понимается набор базовых классификаторов, результаты классификации которых объединяются и формируют прогноз агрегированного классификатора. Целью создания ансамбля моделей является повышение точности агрегированного классификатора по сравнению с точностью каждого индивидуального базового классификатора в отдельности.

Существует немало подходов к формированию ансамбля моделей. Одним из наиболее популярных является Bagging подход (Bootstrap Aggregating, Leo Breiman) (1). Метод основан на манипулировании обучающим множеством с последующим построением базовых классификаторов на различных его подмножествах. Каждый базовый классификатор использует общий алгоритм, но обучается на различных подмножествах. Прогноз ансамбля формируется путем комбинирования результатов каждого отдельного классификатора при помощи усреднения или голосования.

В качестве базового алгоритма классификации используется метод k-ближайших соседей (kNN). Основным принципом метода k-ближайших соседей является то, что объект присваивается тому классу, который является наиболее распространенным среди данного элемента.

Тестирование метода проводилось на задаче «StumbleUpon Evergreen Classification Challenge» (2), которая заключается в разделении множества объектов на 2 класса. Тестовая выборка содержит 3131 объектов и 26 признаков, по которым необходимо провести классификацию. На тестовой выборке при использовании алгоритма kNN ошибка классификации составила 35,1 %. При решении задачи ансамблем моделей ошибка составила 26,4 %.

В ходе работы были получены следующие результаты: bagging подход улучшает результаты классификации (до 25 % при использование алгоритма kNN) по сравнению с индивидуальными базовыми классификаторами; имеет преимущество в простоте реализации. К недостаткам можно отнести недетерминированность результата (обучающие выборки формируются случайно) и сложность интерпретации результатов по сравнению с индивидуальными моделями.

Библиографические ссылки

1. Leo Breiman, Bagging Predictors // Statistics Departmen, University of California, Berkeley, 1994.

2. URL: https://www.kaggle.eom/c/stumbleupon/data (дата обращения: 18.03.2014).

© Синяев И. Ф., 2014

УДК 004.896

Д. А. Суханов Научный руководитель - О. В. Шестернева Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

АДАПТИВНОЕ УПРАВЛЕНИЕ ВЕНТИЛЯТОРОМ В УСЛОВИЯХ ГАЗОВО-СМЕСИТЕЛЬНОЙ НЕСТАБИЛЬНОСТИ

Описывается проблема эффективного управления вентиляционным оборудованием полупромышленного уровня. Рассматриваются способы формирования управляющего воздействия в зависимости от состава воздушной смеси в помещении. Эффективность различных подходов была исследована на тестовом приборе.

Условия работы, а также разрешенный вид деятельности производственного предприятия зависит от состава газовой среды в помещении, где работают сотрудники. К основным показателем относятся процентные составляющие: углекислого газа, кислорода, угарного газа, тяжелых элементов, а также примесь азота.

Качественно вентилятор уменьшает наличие вредных примесей, а также увеличивает приток кислорода и азота. Для упрощения регулирования, был сформи-

рован обобщенный сигнал рассогласования для управления по формуле [1]

(Жн!!^ , (1)

I " ]

где е'! - требуемый по стандартам показатель примеси в воздухе 1-го газа; - фактический показатель примеси в воздухе /-го газа; N - общее число газов.

i Надоели баннеры? Вы всегда можете отключить рекламу.