Научная статья на тему 'Непараметрический алгоритм распознавания образов для элементов и устройств систем управления'

Непараметрический алгоритм распознавания образов для элементов и устройств систем управления Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
99
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМ / ОБРАЗ / ИЗМЕРИТЕЛЬНАЯ СИСТЕМА / НЕПАРАМЕТРИЧЕСКИЙ МЕТОД / КЛАССИФИКАТОР / ALGORITHM / IMAGE / MEASUREMENT SYSTEM / NONPARAMETRIC METHOD / CLASSIFIER

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Домрачев В. Г., Гавриков В. А., Котов Ю. Т.

Достоверность принимаемых решений о характеристиках исследуемого объекта при использовании технических средств контроля и диагностики зачастую определяется выбором метода проведения исследования состава и значений этих характеристик. В статье описан непараметрический метод, включающий адекватную образу исследуемого объекта математическую модель конкретной физической ситуации, на основании которой предложен классификатор, отображающий исследуемые характеристики в наглядной и удобной для оператора форме.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The reliability of the decisions taken on the characteristics of the object using hardware monitoring and diagnostics is often determined by the choice of the method of studying the composition and the values of these characteristics. This paper describes a nonparametric method, which includes an adequate image of the object-specific mathematical model of the physical situation on the basis of which the proposed classifier, showing the studied characteristics in an intuitive and easy for the operator of the form.

Текст научной работы на тему «Непараметрический алгоритм распознавания образов для элементов и устройств систем управления»

- выбросов случайного процесса. Пороговые уровни определяются через требуемые по условию задачи вероятности ошибок 1-го и 2-го родов а и в соответственно [5]

Cl (n) = [ln(\ / ^)] - 1 [ln (Х0 - \) +

+ ln (в / 1 - а)]; (4)

с2 (n) = [ln(\ / ^)] - 1 [In (^ - \) +

+ ln (1 - в / а)]; (5)

Рассмотренный здесь алгоритм распространяется и на сумму независимых случайных величин, распределенных по закону Пуассона, так как результирующий процесс, на основании теории вероятностей, будет также распределен по этому закону.

Наличие у МП и МК аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов позволяет вести обработку встроенной аппаратной частью данных вычислительных устройств, что существенно снижает потребность в вычислительных ресурсах и значительно увеличивает скорость обработки информации.

Одновременно выполняется компрессия измерительной информации, так как обработка ведется только ее существенной, значимой части.

В заключение следует отметить, что алгоритмы обработки измерительной информации базирующихся на характеристиках выбросов случайных процессов отвечают следующим основным требованиям:

1. Адекватность модели реальному измерительному процессу.

2. Небольшая потребность в вычислительных ресурсах (быстродействии, разрядности данных, объемах памяти).

3. Высокая скорость обработки информации.

4. Высокая степень сжатия измерительной информации.

5. Возможность использования встроенных устройств (аналого-цифровых преобразователей, счетчиков-таймеров реального времени, широтно-импульсных модуляторов) микроконтроллеров для снижения потребность в вычислительных ресурсах и значительного увеличения скорости обработки измерительной информации.

Библиографический список

1. Тихонов, В.И. Выбросы случайных процессов / В.И. Тихонов. - М.: Наука, 1987. - 303 с.

2. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М: Связь, 1980. - 216 с.

3. Левин, Б.Р. Вероятностные характеристики выбросов случайных процессов. - В кн.: Нелинейные и оптимальные системы / Б.Р. Левин, Я.А. Фомин.

- М.: Наука, 1971. - С. 381-392.

4. Рембовский, А.М. Распределение числа пересечений порога случайным процессом / А.М. Рембовский, Я.А. Фомин. - М.: Радиотехника и электроника, 1979. - Т. 24. - № 3. - С. 632-635.

5. Фланаган, Д.Л. Анализ, синтез и восприятие речи / Д.Л. Фланаган. - М.: Связь, 1968. - 397 с.

6. Фу, К. Последовательные методы в распознавании образов и обучении машин. Пер. с англ. / К. Фу.

- М.: Наука, 1971. - 256 с.

НЕПАРАМЕТРИЧЕСКИЙ АЛГОРИТМ РАСПОЗНАВАНИЯ ОБРАЗОВ ДЛЯ ЭЛЕМЕНТОВ И УСТРОЙСТВ СИСТЕМ УПРАВЛЕНИЯ

В.Г. ДОМРАЧЕВ, проф. каф. электроники и микропроцессорной техникиМГУЛ, д-р техн. наук, В.А. ГАВРИКОВ, доц. каф. электроники и микропроцессорной техники МГУЛ, канд. техн. наук, Ю.Т. КОТОВ, проф. каф. электроники и микропроцессорной техники МГУЛ, д-р техн. наук

Применение в системах управления процедур распознавания образов повышает качество и скорость принимаемых человеком решений [1, 2]. Для правильного выбора алгоритма классификации, позволяющего разделять входные образы на классы, не-

domrachev@mgul.ac.ru обходимо учитывать следующие основные факторы:

- совокупность априорных сведений о

нем;

- характер получения информации об исследуемом объекте.

84

ЛЕСНОЙ ВЕСТНИК 6/2012

На практике, однако, часто неизвестен даже тип функций плотностей вероятностей f (X/TOj) и никакие упрощающие предположения не могут быть обоснованы вследствие недостаточной априорной информации об исследуемом объекте или вследствие изменения статистик рабочей среды. Это приводит к необходимости использовать различные модели, например, аппроксимацию аналитических выражений многомерной плотности вероятности f (x,, ... ,x ,t,, ... , t), что является очень сложной задачей. Вместе с тем, использование полученных выражений приводит к неточным, весьма приближенным результатам [3].

В данном случае целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора. При этом не предполагается знание законов распределения, связанных с каждым классом образов, а используются более фундаментальные свойства случайных величин. Это обычно некоторые относительные характеристики - ранги, серии, различные порядковые отношения и т.п.

Непараметрические методы обладают рядом перечисленных ниже преимуществ перед параметрическими [1, 2, 3]:

- более широкое поле приложений, так как они могут применяться для обработки данных, не обладающих количественной природой (нечисловой информации);

- меньшая чувствительность к «засорениям» статистических данных и влиянию грубых ошибок;

- процедуру классификации можно проводить по малым выборкам;

- математические средства здесь намного проще, чем в параметрических методах.

При этом алгоритмы классификации образов в вычислительном отношении не сложны и для их применения не требуется быстродействующий персональный компьютер с большим объемом оперативной памяти. Обработка поступающей информации может осуществляться микропроцессорами и программируемыми микроконтроллерами в реальном масштабе времени.

Так как в ряде случаев, в силу особенностей исследуемого объекта, информация о нем не может быть получена сразу, когда процедура классификации образов протекает во времени. Здесь принятие решения делается не сразу на основании всей полученной информации, а последовательно, шаг за шагом.

В непараметрической процедуре последовательной классификации вектор замеров признаков X = [x1, x2, ... , xn]T заменяется вектором рангов S = [Sp S2, ... , Sn]T.

Измерения признаков x1, x2, ... , xn в системах управления производятся последовательно, и после каждого нового измерения необходимо переопределить ранги для всего множества замеров. «Последовательный ранг» замера xn по отношению к множеству замеров (x1, x2, ... , xn) равен Sn, если xn является S -й наименьшей величиной в этом мно-

n

жестве. Здесь необходимо отметить, что каждый раз при новом измерении, определение ранга осуществляется без переопределения их во всем векторе признаков, т.е. он сохраняется в информации, которая была получена при переопределении рангов всех предшествующих замеров.

Такой порядок определения рангов замеров естественным образом согласуется с процедурой последовательного принятия решений, когда измерения производятся последовательно в соответствии с определенным правилом остановки.

Между множеством и! возможных расстановок x, < x.„ < x.. ... < x и множеством n! возможных векторов последовательных рангов [S1, S2, . , Sn] для вектора замеров X = [x1, x2, ... , xn]T имеется взаимно однозначное соответствие [4].

В непараметрических статистиках между порядком замеров (следовательно, и вектором простых рангов) и вектором последовательных рангов существует взаимно однозначное соответствие. Отсюда следует, что можно вычислить распределение векторов последовательных рангов [4]

= \ -JfHfo). (i)

-oo<^<---<Xjn<oo 7-1

ЛЕСНОЙ ВЕСТНИК 6/2012

85

фйстД

где Р.х.) - функция распределения независимых переменных х...

В случае, когда функции распределения P. (х) удовлетворяют альтернативам Лемана (r. > 0), получим

г Pt(xt)=Pr- (х)=[P(х)]r, (2)

откуда, дифференцируя (2), получим

dp(х )=dPr (х)=rP 1 (х)dP(x). (3)

Подставим (3) в (1), будем иметь

Р(х1<х2<...<хп)=

= 1 (4) -оо<Х1<-"<Хи<оо 1-1

Введем обозначение y. = P(x) и подставим (4) в (3), получим

Р(х,<х,<-<х„)=

Г Ггт ПЧ

S -jrbw-TfW (5)

П 2>,

-азйуй-"<,у<«> *-1

,=1 у j=1 J

Из выражения (5) можно найти вероятность для любой расстановки величин х;, переставляя их в формуле соответственным образом, а из соотношения (1) определить распределение векторов последовательных рангов.

В качестве основной модели для разработки непараметрического алгоритма последовательной классификации рассмотрим задачу последовательного испытания двух выборок. Допустим, что при проведении распознавания электропроводящих объектов имеется два вектора замеров

X = [хр ^ ... , х/ и Y = [урУ2, ... , ynY, (6) каждый из которых представляет собой выборку из ансамбля случайных величин с некоторым распределением вероятностей. При этом должно использоваться как можно меньшее число измерений.

Далее предполагается, что последовательные замеры х1, х2, ... , хп и у1, y2, ... yn - независимые случайные величины. Такое предположение вполне допустимо, так как при наличии «сильной» взаимосвязи между признаками можно применить метод агрегирования параметров, т.е. укрупненное представление группы показателей в виде одного обобщенного признака [1, 3]. Указанный подход позволяет оценивать информативность

различных групп признаков раздельно, как бы расчленяя пространства описаний большой размерности на ряд подпространств меньшей размерности.

Испытывается гипотеза, что оба этих распределения одинаковы

H : G = P(X) (6)

и альтернатива, что они различны H1: G = fP(X)) = Pr(X)в предположении, что P(X) - функция распределения X и f (P(X)) - функция распределения Y. Для использования последовательного критерия отношения вероятностей (ПКОВ) Вальда, основанного на последовательных рангах, расставим замеры в таком порядке, чтобы они чередовались: х

У1, x2, У 2:) "' , xn, Уп.

Обозначим объединенные замеры на k-м шаге вектором

V(k) = [Vl, V2,...,VkL (7)

где v1 = х1, v2 = у 1 и т.д.

Пусть S(k) = [S1, S2, , Sk] есть вектор последовательных рангов для V(k).

\ = ртщм Pk(S(k)/H0)l (8)

Выражение (8) представляет собой последовательное отношение вероятностей на k-м шаге процедуры классификации. Если верна гипотеза H то для произвольного вектора S из S(k) имеем

P[S(k) = S/ H0] = 1/k!

Из выражения (8) для четных k получим

P(S (k у H) = P(S, S2 ..... Sk/H,) =

где

k/ 2

k ( i \

П Z4

1 =1 V 1 =1 J

(10)

Aj =

1, если Vj есть х, г, если Vj есть у.

(11)

Тогда, последовательное отношение вероятностей на (k+1) - м шаге можно определить из выражений: для четных k

-

(k +1) !• r

(k+1у 2

k+1 St+l -1 ( i \ k ( i

П Z 4 • П r+14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1-1 V1-1 J i-Sk+1-1 V 1-1 J

Mf-e|. (12)

86

ЛЕСНОЙ ВЕСТНИК 6/2012

для нечетных к,

Х1г М —

(к +1) !• rk/ 2

к+1 SM-1 ( , \ к ( ,

П Л A • П 1+Л a

'—1 V j—1 У '—Sk+i-1V j—1 У

. (13)

Для завершения непараметрической процедуры достаточно иметь только пару останавливающих границ, с которыми сравниваются последовательные отношения вероятностей

A = (1 - Р01) / Рю и B = Р01 / (1 - Рш)> (14) где p.. - вероятность принятия гипотезы H,,

когда в действительности верна гипотеза H.

j

Таким образом, непараметрическая процедура ПКОВ сводится к следующим шагам.

Получить последовательный ранг (к+ 1)-го замера.

Образовать вектор A(k+1) = [A1, A2, ..., AZ1, A*, AZ+V ..., Ak], содержащий (k+1) элементов, где A* = 1, если (к+1)-й замер есть x, и A* = r, если у, из Ak = [A 1, A2, ..., Ak] и вычислить ^к+1-

Вычислить последовательное отношение вероятностей Хк+1 по формуле (12) или (13) и сравнить с останавливающими границами (14).

На рисунке представлена блок-схема алгоритма непараметрической процедуры распознавания образов.

Правильный выбор альтернативы Лемана существенно влияет на качество алгоритма последовательной классификации. Между параметром г и средним числом измерений существует определенная зависимость [4]

(r-V2 + r12 У-1

E,. (к) —

log-

2

X

e10 • log (1 -‘° Ч + 0 - e10 (1 e01)

)• log

(1- ei0 )

e°1

. (15)

Если выполняется условие e1° « i, то (9) можно записать в виде

E,. (k) s

l°g[(l - e1° )/ e01 ]

, (r ~'/2 + У2)’

log--------------

(16)

выражение (15) дает приближенную связь между средним числом измерений Er(k) и параметром альтернативы Лемана r при заданных вероятностях e01 и e10.

Из (15) и (16) можно сделать вывод, что при r > 1 и r < 1 среднее число измерений Er(k) уменьшается по мере удаления от значения r = 1.

Рассмотрим числовой пример непараметрической процедуры классификации, данные для которого были получены с матричного электромагнитного преобразователя с размерами 100 х 100 мм и имеющего 16 х 16 ячеек. В результате проведенных измерений было получено две выборки образов X и Y, каждая выборка представлена 16-мерным

Рисунок. Блок-схема алгоритма непараметрической процедуры распознавания образов

ЛЕСНОЙ ВЕСТНИК 6/2012

87

фйстД

вектором, элементы которого последовательно измеряются классификатором. Выборки получены для различных контролируемых объектов.

X = [x^ X2, "' , Х16] =

[6,3; 6,9; 7,3; 7,5; 7,4; 6,8; 6,2; 6,7; 8,6; 9,5; 8,2; 7,2 ;7,2; 9,0; 10,8; 9,9];

Y = -V-У16] =

[6,0; 7,0; 8,0; 9,0; 9,0; 8,0; 7,0; 7,0; 8,0; 9,0; 8,0; 7,0; 7,0; 10,0; 10,0; 9,0]. Объединенная выборка замера имеет

вид

V (32) = К V",V32] = [xl, Ур x2, , У2,",xl6, У16]-

Допустим, что вектор Y принадлежит классу образов Q. Задача состоит в проверке, принадлежит ли вектор X тому же классу, что и вектор Y. используя как можно меньше измерений. Положим r = 0,5 в альтернативе Лемана против гипотезы Н0 (г = 1), а вероятности р10 = р01 = 0,1. Тогда останавливающие границы в последовательном критерии отношения вероятностей (ПКОВ) Вальда равны

А = (1 - Ро1) /Рю = 9,0 и В = Ро1 / (1 - Р10) = 0,11.

Из (12) и (13) с помощью последовательных рангов объединенных замеров вычисляются последовательные отношения вероятностей

V(1) = [6,3]; S(1) = [1];

A(1) = A = [1]; * = 1,00;

V(2) = [6,3;6,0]; S(2) = [2;1];

A (2) = [0,5;1]; A1 = 0,5; A2 = 1; * = 1,33; V(3) = [6,3;6,0;6,9];

S(3) = [2;1;3]; A(3) = [0,5;1;1];

A1 = 0,5; A2 = 1; A3 = 1; * = 1,60;

V(4) = [6,3;6,0;6,9;7,0];

S(4) = [2;1;3;4]; A(4) = [0,5;1;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5; * = 1,07; V(5) = [6,3;6,0;6,9;7,0;7,3]; S(5) = [2;1;3;4;5]; A(5) = [0,5;1;1;0,5;1];

A1 = 0,5; A2 = 1; A3 = 1;

A4 = 0,5; A5 = 1; * = 1,33;

V(6) = [6,3;6,0;6,9;7,0;7,3;8,0];

S(6) = [2;1;3;4;5;6];

A(6) = [0,5;1;1;0,5;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;

A5 = 1; A6 = 0,5; * = 0,89;

V(7) = [6,3;6,0;6,9;7,0;7,3;8,0;7,6];

S(7) = [2;1;3;4;5;7;6];

A(7) = [0,5;1;1;0,5;1;1;0,5];

A1 = 0,5; A2 = 1; A3 = 1; A4 = 0,5;

A5 = 1; A6 = 1; A7 = 0,5; * = 1,0, аналогично, получим

*8 = 0,68; * = 0,74; Xw = 0,49;

*11 = 0,44; \2 = 0,30; ^ = 0,27;

*14 = 0,23; Д5 = 0,20; ^ = 0,16;

*17 = 0,19; Д8 = 0,18; = 0,18;

*20 = 0,12; *21 = 0,14 *22 = 0,10. Поскольку *22 < B = 0,11, классификатор принимает на одиннадцатом замере выборки X неизвестного образа гипотезу H0. В результате можно сделать вывод о том, что образ принадлежит классу Q т.е. является линейно протяженным изделием.

По полученным результатам можно сделать следующие основные выводы.

- При недостаточной априорной информации об исследуемом объекте целесообразно использовать непараметрические методы, для того чтобы получить более адекватную математическую модель конкретной физической ситуации для построения классификатора.

- Процедуру классификации можно проводить по небольшим выборкам.

- Математические процедуры в данном случае намного проще, чем при параметрических методах классификации.

- Полученные количественные результаты контроля позволяют отображать их в наглядной и удобной для оператора форме.

- Применение непараметрических методов классификации позволяет повысить достоверность и скорость принимаемых человеком решений.

Библиографический список

1. Ту, Дж. Принципы распознавания образов / Дж. Ту, Р. Гонсалес. - М.: Мир, 1978. - 410 с.

2. Гублер, Е.В. Применение непараметрических критериев статистики в медико-биологических исследованиях / Е.В. Гублер, А.А. Генкин. - Л.: Медицина, 1973. - 128 с.

3. Рунион, Р. Справочник по непараметрической статистике / Р. Рунион. - М.: Финансы и статистика, 1982. - 142 с.

4. Фу, К. Последовательные методы в распознавании образов и обучении машин / К. Фу. - М.: Наука, 1971. - 226 с.

5. Фомин, Я.А. Теория выбросов случайных процессов / Я.А. Фомин. - М.: Связь, 1987. - 215 с.

88

ЛЕСНОЙ ВЕСТНИК 6/2012

i Надоели баннеры? Вы всегда можете отключить рекламу.