Научная статья на тему 'Синтез робастных правил коллективного распознавания объектов'

Синтез робастных правил коллективного распознавания объектов Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
62
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Коллективные статистические решения / процедура сужения множества альтернатив / Collective statistical solutions / the procedure of narrowing the set of alternatives

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Омельченко Анатолий Васильевич

Синтезируются робастные правила коллективного распознавания объектов, заданных обучающими выборками. Обосновывается процедура взвешенного голосования при многоальтернативном распознавании объектов. Предлагается способ взвешенного голосования в расширенном множестве решений и показывается, что при отклонении от модельных предположений он позволяет обеспечить меньшую вероятность ошибки распознавания объектов по сравнению с известными способами голосования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Омельченко Анатолий Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Synthesis of robust rules for collective object recognition

Synthesize robust rules for collective recognition of objects specified by training samples. The procedure of weighted voting for multi-alternative recognition of objects is substantiated. A method of weighted voting in an expanded set of solutions is proposed and it is shown that if you deviate from the model assumptions, it allows you to provide a lower probability of object recognition errors compared to known voting methods.

Текст научной работы на тему «Синтез робастных правил коллективного распознавания объектов»

ных выше. Показатели с нулевыми значениями встречаются только в больших схемах. Например, при точности вычислений 10-31 в схеме с50000 ISCAS'85 2% линий из 49996 имеют показатели с нулевыми значениями. Рассчитываемые по методу TADATPG показатели позволяют простым способом выбирать участки схемы для ее модификации в целях сведения к минимуму непроверяемых неисправностей. Однако корреляция между значениями тестопригодности и числом проверяемых неисправностей (качеством теста) не всегда имеет место, поэтому минимизация аппаратурных затрат по рассчитываемым показателям не представляется возможной.

Преимущества методов TADATPG и кубического метода анализа тестопригодности:

1) простота при анализе последовательностных схем (не нужно решать систему линейных уравнений);

2) простота в выборе точек для модификации схемы;

3) простота и регулярность способа модификации схемы, что упрощает автоматизацию процесса ее анализа и синтеза (модификации);

4) полная проверка добавляемых ячеек независимо от остальной части схемы;

5) возможность обеспечить высокий уровень тестируемости схемы (минимум или ноль непроверяемых линий) до генерации теста.

Недостаток: увеличение времени тестирования за счет чередования SP и F режимов для продвижения части тестового вектора к внутренним точкам схемы и сдвига откликов на тест к наблюдаемому выходу.

Список литературы: 1. Abramovichi M., Breuer M.A., Friedman A.D. Digital systems testing and testable design. IEEE Inc. New York, 1998. 760p. 2. TeresaMcLaurin, Souvik Ghosh. ETM10 Incorporates Hardware Segment of IEEE P1500 // IEEE Design & Test of Computers. 2002. Р. 8-13. 3. Rutman R. A. Fault Detection Test Generation for Sequential Logic Heuristic Tree Search. IEEE Computer Repository Paper, 1972. R-72-187. 4. IEEE P1500/D11. January 2005. Draft Standard Testability Method for Embedded Core-based Integrated Circuits. New York, 2005. 138p. 5. Hahanov V., Hyduke S. Topological BDP faultsimulation method. Proceeding of EuroMicro Symposium. France, Rennes: INRIA. 2004. P. 3 56-3 59. 6. IEEE Std 1149.6-2003. Standard for Boundary-Scan Testing of Advanced Digital Networks. New York, 2003. 139p.

Поступила в редколлегию 26.08.2006

Гузь Олеся Алексеевна, аспирантка кафедры АПВТ ХНУРЭ. Научные интересы: проекти-роание и верификация цифровых систем на кристаллах. Увлечения: плавание. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-326.

УДК 519.23

А.В. ОМЕЛЬЧЕНКО

СИНТЕЗ РОБАСТНЫХ ПРАВИЛ КОЛЛЕКТИВНОГО РАСПОЗНАВАНИЯ ОБЪЕКТОВ

Синтезируются робастные правила коллективного распознавания объектов, заданных обучающими выборками. Обосновывается процедура взвешенного голосования при многоальтернативном распознавании объектов. Предлагается способ взвешенного голосования в расширенном множестве решений и показывается, что при отклонении от модельных предположений он позволяет обеспечить меньшую вероятность ошибки распознавания объектов по сравнению с известными способами голосования.

Введение

Для распознавания объектов различной природы разработано множество решающих правил. Эффективность распознавания объектов может быть повышена за счет согласования решений, принимаемых отдельными правилами. Пути повышения достоверности решений при распознавании объектов коллективом автоматов рассмотрены в работе [1].

Однако в большинстве случаев априорное описание распределений признаков, представляющих распознаваемые объекты, является неполным. Зачастую имеются лишь обучающие выборки признаков, а относительно законов их распределения сформулированы только некоторые предположения. В этих условиях эффективность решений, выносимых

решающими правилами, может резко снижаться. Поэтому актуальна задача согласования решений отдельных правил распознавания с учетом их фактической эффективности при неполном и неточном априорном описании.

Целью настоящей работы является синтез робастных правил коллективного распознавания объектов, заданных обучающими выборками. Решения таких правил должны быть устойчивыми (робастными) к отклонениям от модельных предположений [2]. Для достижения поставленной цели в работе решаются следующие задачи:

1) разрабатывается процедура взвешенного голосования при многоальтернативном распознавании объектов, использующая оценки вероятностей ошибок распознавания объектов различными решающими правилами, найденные на этапе обучения;

2) разрабатывается способ взвешенного голосования коллектива решающих правил в расширенном множестве решений.

Постановка задачи.

Будем полагать, что на распознавание предъявляется выборка X, которая с вероятностью Pj может принадлежать одному из м объектов (классов). Распределение вектора X

для каждого из объектов задано обучающими выборками XV , v = 1, nj , j = 1, M . Задана

также некоторая совокупность решающих правил распознавания объектов rk (X), k = 1, K. Требуется создать результирующее правило, объединяющее частные решения к правил и обеспечивающее минимум средней вероятности ошибки распознавания объектов (в общем случае минимум среднего риска).

1. Коллективные статистические решения

Наиболее распространенным способом объединения решений является нахождение для каждого из классов взвешенной суммы вида [1]

к

еj(X) = £ aik • rik(X), (1)

k=1

где rik (X), i = 1, M , k = 1, K - решения распознающих автоматов, принимающие значение 1, если k-й автомат принял решение в пользу i -го класса, и 0 - в противном случае; aik -коэффициенты, характеризующие достоверность решения k -го автомата в пользу i -го класса. Окончательное решение должно быть вынесено в пользу того из классов, для которого сумма (1) максимальна.

В зависимости от способа задания коэффициентов в (1) различают [1]: простое голосование; взвешенное голосование и оптимальное голосование. При простом голосовании

весовые коэффициенты aik , i = 1,M, k = 1,K равны единице. При взвешенном голосовании эти коэффициенты являются постоянными и зависят только от вероятностей ошибок распознавания соответствующих распознающих автоматов. При оптимальном голосовании

весовые коэффициенты выбираются на основе апостериорных вероятностей гипотез w k (i / X),

i = 1,M, k = 1,K таким образом, чтобы минимизировать среднюю вероятность ошибки распознавания выборки. В последнем случае весовые коэффициенты должны выбираться как функции апостериорных вероятностей [1]

a jk = V(wk(i/X), i = 1,M}, j = 1,M,k = 1K. (2)

Предположим, что разные решающие правила используют статистически независимые

признаки, образующие векторы Xk , k = 1,K и X = (Xjtr ,...,Xk tr). Для данного случая показано [1], что правило оптимального голосования имеет следующий вид:

к

j = argmaX{ £ln w(i/Xk) - (K - 1)lnPi} (3)

i k=1

где w(i/ хк) - апостериорная вероятность для ¡- й гипотезы, полученная к-м решающим правилом. Правило (3) обеспечивает такую же среднюю вероятность ошибки распознавания, что и правило идеального наблюдателя.

Рассмотрим теперь, какой выбор коэффициентов а ¡к, i = 1,М, к = 1,К в (1) является оптимальным для взвешенного голосования. В данном случае на автомат, реализующий взвешенное голосование, поступают статистически независимые решения к правил распознавания ]к е{1,2,...,М}, к = 1,К . Для каждого из правил известны вероятности РкСк/О вынесения решения в пользу ]к -го класса, в то время как была предъявлена выборка к-го класса. Очевидно, что правило взвешенного голосования, оптимальное по критерию минимума средней вероятности ошибки распознавания, в рассматриваемом случае имеет следующий вид:

К

j = агетах{ £ 1пР^к/0 + 1пPi} (4)

i к=1

В работе [1] обоснован частный вариант правила голосования (4) для двух гипотез и показано, что в этом случае верхняя граница вероятности ошибки распознавания объектов всей системой в целом минимальна.

Правило оптимального голосования обеспечивает меньшую вероятность ошибки распознавания по сравнению с правилом взвешенного голосования. Однако оно является и более чувствительным к точности модели, чем правило взвешенного голосования, в котором весовые коэффициенты пропорциональны оценкам вероятностей принятия частных решений при распознавании сигналов и отражают отклонения законов распределения выборок от модельных предположений.

Для повышения эффективности правила взвешенного голосования расширим множество решений, выносимых каждым из частных решающих правил. Для этого откажемся от принятия каждым из правил решения только в пользу одного из классов. Будем считать допустимыми такие решения, когда предъявленная выборка относится к некоторому подмножеству классов. Это увеличивает количество информации, используемой на этапе взвешенного голосования, что должно повлечь повышение достоверности результирующего решения.

2. Процедура сужения множества альтернатив

Формализуем постановку задачи. Будем полагать, что предъявляется выборка х, которая с вероятностью Р; может принадлежать одному из М сигналов. Требуется по данным наблюдений сузить множество возможных гипотез Н = {1,2,...,М} до некоторого подмножества R = {^ j,...} с Н . В качестве критерия оптимальности используется критерий минимума среднего риска при функции потерь вида

с1,я =

сь|, если i е R ,

4 если i г R ,

(5)

где d > сМ > сМ-1 >... > с2; с1 = 0 ; |я| - мощность множества R .

В соответствии с (5) штраф тем выше, чем более неопределенным является решение. Максимальный штраф, равный d, накладывается за неправильное решение. Средний риск определятся выражением [3]

_ М

с = £ Р £ с 1Д • Р(я /0. (6)

¡=1 я

Таким образом, в рассматриваемом случае средний риск является взвешенной суммой вероятностей решений Р(Я Л), ! = 1,М с весовыми коэффициентами, возрастающими по мере увеличения неопределенности выносимых решений.

Очевидно, что средний риск будет минимальным для решающего правила

M

R = arg min{£q,R -P;-w(X/i)} (7)

R ' V '

i=l

которое может быть представлено в следующем виде:

- C|R|

R _ arg max{[1 —Li] £ P; -w(X/i)}. (8)

R d i£R

В случае, когда С > d(1 -1), i _ 2,3,..., правило (8) принимает известный вид

j _ arg max{Pi-w(X/i)}. (9)

i

Если же только c2 _ c <d/2 , а ci > d(1-y), i _ 3,4,..., то решающее правило принимает вид

{i}, если P; -w(X /i) >P: -w(X /j) - [d-1]

c

{i, j}, если P; -w(X/i) <P;-w(X/j)-[d-1] , (10)

c

R _

где i, j - номера классов, для которых обеспечиваются наибольшие значения статистик Pk-w(X/k), причем P;-w(X/i)>Pj-w(X/j).

3. Объединение решений от различных решающих правил по результатам их

испытаний

Будем полагать, что предъявляется выборка X, которая с вероятностью Pj может принадлежать одному из M классов. По данным наблюдений с помощью решающих правил rk, k _ 1,K сужено множество гипотез H _ {1,2,...,M} до некоторых подмножеств Rk с H . Необходимо вынести результирующее решение в пользу одного из M классов по критерию максимума апостериорной вероятности.

Для решения сформулированной задачи воспользуемся формулой Байеса, согласно которой апостериорные вероятности

p(i/Rk) _ p(Rk/i) - Pi/P(Rk), i _ Ш; k _ 1K. (11)

Аналогично результирующая (по всем решающим правилам) апостериорная вероятность определяется так:

p(i/R1 ,...,Rk) _p(R1 ,...,Rk/i)-P;/P(R1,...,Rk), i_ 1M; k _ 1K. (12)

В случае, когда решения, вынесенные различными правилами независимы, то

p(i/R1 ,...,Rk) _ Pi Пp(Rk /i)/P(R1 ,...,Rk). (13)

k_1

С учетом (13) оптимальное в смысле критерия максимума апостериорной вероятности решающее правило примет следующий вид:

K

j _ argmaX{ £lnp(Rk/i) + lnPj} (14)

j k_1

где p(Rk /i) - вероятность вынесения решения Rk k-м решающим правилом в случае справедливости i-й гипотезы. Вероятности p(Rk /i), i _ 1,M; k _ 1,K могут быть определены аналитически или методом статистического моделирования.

4. Исследование синтезированных правил методом статистического

моделирования

Сравнение эффективности взвешенного и оптимального голосования выполнено на примере распознавания трех гауссовских сигналов с известными единичными дисперсиями и математическими ожиданиями ц _ 3 ; ц 2 _ -3 ; Н-э _ 0 . При распознавании сигналов их

математические ожидания считались неизвестными, однако задавались обучающие выборки. Число решающих правил распознавания выбрано равным 2. Каждое из решающих правил строилось как адаптивное байесовское и обрабатывало статистически независимые отсчеты сигналов. Таким образом, на распознавание предъявлялась пара отсчетов сигналов: по одному отсчету для каждого из правил. Объемы обучающей и контрольной выборок каждого из сигналов равнялись 10000 реализаций.

В результате моделирования были получены оценки средней вероятности ошибки распознавания заданных сигналов коллективом из двух решающих правил. Оценки средних вероятностей ошибок распознавания составили:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- для каждого из решающих правил в отдельности - 0,090;

- при оптимальном голосовании согласно (3) - 0,036;

- при взвешенном голосовании согласно (4) - 0,083;

- при взвешенном голосовании в расширенном множестве решений согласно (8), где с1 = 0 ,с2 = 0,25,с3 = 0,317,d = 1, и (14) - 0,045.

Из представленных результатов следует, что разработанный способ взвешенного голосования с расширением множества решений, выносимых каждым из правил, является весьма эффективным. Для ситуаций, когда выполняются модельные предположения о законах распределения сигналов, он способен обеспечить результаты распознавания близкие к тем, которые достигаются при оптимальном голосовании. Но все же эффективность оптимального голосования остается выше.

При нарушении модельных предположений ситуация может измениться. Для того чтобы подтвердить это, в настоящей работе были смоделированы сигналы с независимыми отсчетами и одномерными плотностями вероятности:

2 2 . ... 1 ,(х - а; + А) , 1 ,(х - а;-А) ,

и(х/0=2/2П ехр{2 !+2/2Л(|5)

где а1 = 3 ; а2 = -3; а3 = 0 ; А = 1,5 . Выборки трех сигналов с плотностями вероятности вида (15) были подвергнуты распознаванию коллективами решающих правил, синтезированными в рамках предположения о гауссовском законе распределения. При этом оценки средних вероятностей ошибок распознавания, найденные по описанной выше методике, составили:

- для каждого из решающих правил в отдельности - 0,332;

- при «оптимальном» голосовании согласно (3) - 0,177;

- при взвешенном голосовании согласно (4) - 0,169;

- при взвешенном голосовании в расширенном множестве решений согласно (8), где с1 = 0 ,с2 = 0,25,с3 = 0,317,d = 1, и (14) - 0,038.

В данном случае «оптимальное» голосование обеспечило наихудшее качество распознавания из-за нарушения модельных предположений, в рамках которых синтезировались решающие правила. Обычное взвешенное голосование дало несколько лучший результат из-за того, что частные решения каждого из правил взвешивались с учетом реальных вероятностей ошибок распознавания сигналов каждым из правил. Взвешенное голосование в расширенном множестве решений позволило обеспечить меньшую вероятность ошибки распознавания по сравнению с другими способами голосования.

Выводы

Научная новизна работы определяется тем, что в ней синтезированы правила коллективного распознавания объектов, устойчивые к отклонениям от модельных предположений. В статье обоснована процедура взвешенного голосования при многоальтернативном распознавании объектов коллективом решающих правил и предложен способ взвешенного голосования в расширенном множестве решений.

По результатам исследования решающих правил распознавания сделаны следующие выводы.

1. Если выполняются модельные предположения о законах распределения сигналов, то предложенный способ взвешенного голосования с расширением множества решений, выносимых каждым из правил, обеспечивает качество распознавания близкое к тем, которое достигается при оптимальном голосовании.

2. При отклонении от модельных предположений взвешенное голосование в расширенном множестве решений позволяет обеспечить меньшую вероятность ошибки распознавания сигналов по сравнению с известными способами голосования.

Практическая значимость работы определяется тем, что разработанные методы построения коллективов правил могут быть использованы при распознавании объектов различной природы в условиях их неполного и неточного априорного описания.

Дальнейшая перспектива исследований состоит в применении разработанных правил распознавания для решения прикладных задач, в частности для задачи идентификации дикторов.

Список литературы: 1. Барабаш Ю.Л. Коллективные статистические решения при распознавании. М.: Радио и связь, 1983. 244 с. 2.ХьюберДж. П. Робастность в статистике. М.: Мир, 1984. 304 с. 3. Фомин Я.А., ТарловскийГ.Р. Статистическая теория распознавания образов. М.: Радио и связь, 1986. 264 с.

Поступила в редколлегию 23.09.2006 Омельченко Анатолий Васильевич, канд. техн. наук, доцент кафедры «Сети связи» ХНУ-РЭ. Научные интересы: методы обработки сигналов и распознавания образов. Адрес: Украина, 61075, Харьков, ул. 3-го Интернационала, 7, кв. 38.

УДК 681.32:515.682.1

Н.И. СЛИПЧЕНКО, В.А. ПИСЬМЕНЕЦКИЙ, С.В. ПЕРЕЯСЛОВЕЦ, А.В. ФРОЛОВ, С.К. НОВОСЕЛОВА

АНАЛИЗ ПРИОРИТЕТНОСТИ ВЫВОДА ИНФОРМАЦИИ О РЕЖИМАХ РАБОТЫ ТРАНСПОРТНОГО СРЕДСТВА

Рассматривается задача приоритетного вывода на монитор страниц информации о режимах работы различных узлов и систем транспортного средства. Анализируется механизм возможной потери информации при ее последовательном постраничном выводе. Показывается целесообразность введения динамического приоритета и его оптимального назначения на базе динамического программирования с применением уравнения Беллма-на и минимизируемой функции риска. Для приближенного аналитического решения используется представление функции Беллмана и функции риска с помощью полиномов второго порядка. По результатам вычисления приоритета предлагается структура устройства приоритетного постраничного вывода информации на экран.

1. Актуальность

При управлении различными видами транспорта (наземного, воздушного и морского) необходима оперативная информация о текущем состоянии всех его устройств и систем. В настоящее время десятки информационных потоков передаются от датчиков (сенсоров) на приборный пульт (поле) с помощью сотен (а иногда и нескольких тысяч) соединительных проводов и кабелей.

Большой объем одновременно индицируемой информации в пределах рабочего пульта (поля, пространства) затрудняет работу по управлению транспортом. С учетом зарубежного опыта для более компактного отображения поступающей информации целесообразно использовать монитор.

В соответствии с принятой в практике процедурой отображения информации необходим показ на дисплее одной из нескольких страниц, состоящих из заданного числа строк.

Существенной особенностью такого представления информации является то обстоятельство, что при появлении нового изменения отдельного параметра оно замещает в соответствующей строке предыдущее значение, которое может быть так и не выведено на экран из-за задержки в показе нужной страницы. Это крайне нежелательно, так как в этом случае кроме задержки возможна потеря информации.

Может возникнуть ситуация, когда в некоторых строках непоказанных и хранящихся в памяти ЭВМ страниц появятся новые сообщения о возникновении опасных режимов работы и параметров движения, превышающих критические. При увеличении числа выводимых на один экран страниц различной важности такой способ становится неэффективным.

i Надоели баннеры? Вы всегда можете отключить рекламу.