Научная статья на тему 'Экспериментальное сравнение методов автоматической классификации по данным эксплуатации обогатительной центрифуги'

Экспериментальное сравнение методов автоматической классификации по данным эксплуатации обогатительной центрифуги Текст научной статьи по специальности «Математика»

CC BY
69
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОМЕХАНИЧЕСКАЯ СИСТЕМА / КАРТА КОХОНЕНА / ЦЕНТРЫ СГУЩЕНИЙ / КЛАСТЕР / ELECTROMECHANIC SYSTEM / CARD KOHONENA / THE CENTRES OF THE THICKENINGS / CLASTER

Аннотация научной статьи по математике, автор научной работы — Шпрехер Дмитрий Маркович

Показано преимущество обработки большого числа примеров в нейросетевом базисе, заключающееся в более высокой достоверности решения задач автоматической классификации слоем (картой) Кохонена по сравнению с традиционными методами динамических сгущений и кластер-анализа и обеспечивающее большую оперативность функционирования классификационных моделей в контуре управления и диагностики данного типа электромеханических систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPERIMENTAL COMPARISON OF THE METHODS AUTOMATIC CATEGORIZATION AS OF USAGES PROCESSING CENTRIFUGES

It is shown advantage of the processing the large number example in neuronetwork base, concluding in more high validity of the decision of the problems to automatic categorization layer (the card) Kohonena in contrast with traditional methods of the dynamic thickenings and claster-analysis and providing greater speed operating the taxonomic models in sidebar of management and diagnosticses given type of the electromechanic systems.

Текст научной работы на тему «Экспериментальное сравнение методов автоматической классификации по данным эксплуатации обогатительной центрифуги»

УДК 519.1: 621

ЭКСПЕРИМЕНТАЛЬНОЕ СРАВНЕНИЕ МЕТОДОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ПО ДАННЫМ ЭКСПЛУАТАЦИИ ОБОГАТИТЕЛЬНОЙ ЦЕНТРИФУГИ

© 2012 г. Д.М. Шпрехер

Новомосковский институт Российского Novomoskovsk Institute of Russian

химико-технологического университета Chemical Engineering University,

им. Д.И. Менделеева named after D. Mendeleyev

Показано преимущество обработки большого числа примеров в нейросетевом базисе, заключающееся в более высокой достоверности решения задач автоматической классификации слоем (картой) Ко-хонена по сравнению с традиционными методами динамических сгущений и кластер-анализа и обеспечивающее большую оперативность функционирования классификационных моделей в контуре управл е-ния и диагностики данного типа электромеханических систем.

Ключевые слова: электромеханическая система; карта Кохонена; центры сгущений; кластер.

It is shown advantage of the processing the large number example in neuro- network base, concluding in more high validity of the decision of the problems to automatic categorization layer (the card) Kohonena in contrast with traditional methods of the dynamic thickenings and claster-analysis and providing greater speed operating the taxonomic models in sidebar of management and diagnosticses given type of the electromechanic systems.

Keywords: electromechanic system; card Kohonena; the centres of the thickenings; claster.

Автором ранее был предложен способ прогнозирования технического состояния электромеханических систем (ЭМС), предусматривающий использование классифицирующей нейросетевой модели для обработки массивов измеряемых параметров ЭМС. Модель позволяет осуществить классификацию технических состояний на группы в зависимости от степени работоспособности ЭМС. На основании проведенных аналитических исследований предложена структура гибридной нейросетевой схемы, отвечающая поставленной задаче [1].

Основная идея прогнозной классификации состояний ЭМС на основе нейросетевого классификатора заключается в отыскании такого нелинейного ней-росетевого преобразования массива измеряемых сигналов, при котором увеличивается компактность массивов данных одного класса (сближает более близкие в одном классе массивы) и относит к другим классам -более далекие. Затем, на заключительном этапе работы классифицирующей схемы, нелинейно преобразованные массивы измерительной информации классифицируются картой Кохонена.

В целях сравнения достоверности решения задач автоматической классификации картой Кохонена, например с традиционным методом динамических сгущений, использованы данные наблюдений 14 параметров непрерывно действующей обогатительной центрифуги ГШ-12М, применяемой для обогащения зернистых и труднообогатимых углей крупностью менее 1,3 мм.

В ходе наблюдений регистрировались стандартные количественные параметры электротехнического оборудования, сформированные в обучающую выбор-

ку размером [14x600], где число параметров М = 14, число наблюдений N = 600.

В качестве основного алгоритма для сравнения с картой Кохонена рассмотрим метод динамических сгущений. Общее количество центров сгущения равно числу кластеров L . Суть метода состоит в итерационной (последовательной) оценке центров областей сгущения в соответствии с процедурой, представленной на рис. 1.

Случайный выбор L нз М мерных центров аущения О in обд;нти Д

Разнесение все! реализаций X', ■ ' по L массивам по

критерию их близости к текущим центрам аущения ' 1/. ■ ^ -

Оценка параметров положения новых центров сгущения С<1: L > i

Заключительная классификация и оценка ошиоок разнесения

Рис. 1. Последовательность метода динамических сгущений

Имеется N реализаций М-мерного диагностического вектора X = |Xi (x1, x2.. .хМ)., I = 1,..., N|. Каждый параметр имеет свою область определения Ху еДу,у = 1,...,М . Предполагается, что параметры

Ху,] = 1,...,М распределены в многомерном пространстве Д = | Ду не равномерно, но имеют локаль-

]

ные центры сгущения. Параметры областей сгущения (или кластеры) априори неизвестны. Требуется выявить параметры областей сгущения и соотнести каждую из реализаций X с одним из выявленных кластеров. Таким образом, имеем задачу кластерного анализа - классификацию «без учителя», т.е. при отсутствии достоверных обучающих данных.

Определение начальных параметров центров сгущения C из области Д может осуществляться путем случайного выбора из М-мерной области Д в соответствии со следующим алгоритмом:

Cj = тт(Д j + [тах(Д j) - тт(Д j )]rand ,

где rand eU[0,1] - случайная величина с равномерным распределением U на интервале [0, 1]. Однако более устойчивое приближение дает регуляризован-ный выбор. Например, начальные центры сгущений задаются совпадающими с наблюдениями, расположенными в серединах интервалов, упорядоченными по возрастанию значениями модулей наблюдений.

Далее осуществляется разнесение всех реализаций

|Xi (x1,x2...xM).,i = 1,....Nj по L массивам по критерию их близости к текущим центрам сгущения С < 1 :L >. При этом в качестве варианта метрик близости можно рассматривать метрику Евклида

Входные векторы

Р* =Л (ХУ - CJ )2

di (xik-Wjk)

О.э

У

Исходные весовые коэффициенты

Распределительный

Слой Кохонена

В каждом из вновь образованных классов осуществляется оценка параметров положения новых центров сгущения С < 1Х >, после чего операция по перераспределению классов и оценок новых центров сгущения итерационно повторяется Nc раз. Результат

последней итерации рассматривается как окончательная оценка параметров положения существующих кластеров.

Сравниваемая с методом динамических сгущений классификационная схема - карта Кохонена состоит из четырех входов, четвертый из которых отвечает за представление дополнительного параметра, имеющего вес в 100 раз больший, чем остальные признаки. Выходной слой карты Кохонена (рис. 2) включает три вычислительных элемента, максимальное значение выхода одного из которых означает принятие одного из трех технических состояний ЭМС: «не в норме, нижняя граница», «в норме», «не в норме, верхняя граница».

В качестве правила вычисления расстояния между вектором весов и входным вектором обучающей выборки использовалась формула евклидового расстояния

где di - расстояние на одной итерации обучения; х^ -I -я компонента входного вектора; -]-я компонента вектора весов нейрона слоя (карты) Кохонена.

Рис. 2. Классификационная схема в виде карты Кохонена

Использовалось правило настройки вектора весов нейрона с минимальным значением разности:

- ), /=1,..,3, ] =1,... ,14.

= Щ + ^ - щ), I = 1Д } = 14,

где - значение компоненты входного вектора, ^ -

скорость коррекции весов [2].

Архитектура слоя Кохонена и алгоритм его настройки предполагает, что для каждого входного вектора будет активизирован лишь один нейрон (нейрон-победитель). Для данного входного вектора один и только один нейрон Кохонена выдает логическую единицу, все остальные выдают ноль. Слой Кохонена классифицирует входные векторы в группы схожих векторов. Это достигается с помощью такой подстройки весов и смещений, что близкие входные векторы активизируют один и тот же нейрон данного слоя. Слой Кохонена обучается без учителя. В результате обучения слой приобретает способность разделять несхожие входные векторы. Класс нейрона-победителя соответствует классу наблюдения и состоянию ЭМС. Если образец не относится ни к одному из двух классов - выявляется его новизна.

На рис. 3 представлены зависимости относительной погрешности кластеризации тремя различными методами от размера обучающей выборки электрооборудования центрифуги ГШ-12М. Когда известна истинная принадлежность каждого измерения к тому или иному классу, ошибку классификации можно рассчитать как отношение числа неверных классификаций к общему числу векторных наблюдений.

В качестве метода с неизвестным числом кластеров (классов состояний ЭМС) на рис. 3 использовался метод динамических сгущений с последовательным наращиванием L , с остановкой в случае, когда в результате классификации число наименьшей группы не превышает 10 % от общей суммы. За искомое число кластеров принимается количество сгущений на предыдущей итерации. При этом целесообразно вводить штраф за увеличение размерности. Штраф может задаваться путем увеличения величины допустимой погрешности на каждом шаге на 5 %.

2

Число примеров обучающей выборки N

Рис. 3. Зависимости относительной погрешности кластеризации тремя различными методами

от размера обучающей выборки

Анализ графиков (рис. 3) показывает относительное преимущество использования карт Кохонена при малых объемах обучающей выборки, при этом выигрыш снижается при увеличении выборки (результаты погрешностей близки).

Особенностью представленного алгоритма кластеризации с использованием архитектуры карты Кохонена является введение весового коэффициента, назначаемого любому из коэффициентов синаптиче-ских связей между входным вектором признаков и слоем Кохонена. Данный коэффициент обеспечивает трансформацию пространства признаков предметной области в соответствии с функцией «доверия» к тому

или иному признаку. Таким образом достигается повышение достоверности правильной классификации входных векторов признаков.

Литература

1. Шпрехер Д.М. Способ прогнозирования технического состояния электромеханических систем на основе нейро-сетевого классификатора // Изв. вузов. Электромеханика. 2011. № 2. С. 22 - 27.

2. Хайкин С. Нейронные сети: полный курс; 2-е изд.; пер. с англ. М., 2006. 1104 с.

Поступила в редакцию 1 июля 2011 г.

Шпрехер Дмитрий Маркович - канд. техн. наук, доцент, кафедра «Электротехника», Новомосковский институт РХТУ им. Д.И. Менделеева. Тел. 8(487-62) 6-89-20. E-mail: [email protected]

Shprekher Dmitriy Markovich - Candidate of Technical Sciences, assistant professor, department «Electrical Engineering», Novomoskovsk Institute of Russian Chemical Engineering University, named after D. Mendeleyev. Ph. 8(487-62) 6-89-20. E-mail: [email protected]_

i Надоели баннеры? Вы всегда можете отключить рекламу.