Научная статья на тему 'Распознавание динамических образов на основе предсказывающих фильтров'

Распознавание динамических образов на основе предсказывающих фильтров Текст научной статьи по специальности «Математика»

CC BY
648
116
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ / ДИНАМИЧЕСКИЕ ОБРАЗЫ / ИНВАРИАНТНЫЕ ФУНКЦИИ / PATTERNS RECOGNITION / DYNAMIC PATTERNS / INVARIANT FUNCTIONS

Аннотация научной статьи по математике, автор научной работы — Фаворская М. Н.

Построена модель распознавания динамических образов из видеопоследовательностей на основе допустимых отображений в пространстве изображений и пространстве признаков. Введено понятие максимального динамического инварианта. Рассмотрен метод определения максимальных динамических инвариантов на основе фильтров, предсказывающих поведение траектории в многомерном пространстве признаков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Фаворская М. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The dynamic patterns recognition based on predicating filters

The model of dynamic patterns recognition from video sequences based on allowable mapping into images space and features space is realized. The term of maximum dynamic patterns recognition function is introduced. The method of maximum dynamic invariant functions based on filters, predicating a trajectory behavior in multivariate feature space is regarded.

Текст научной работы на тему «Распознавание динамических образов на основе предсказывающих фильтров»

УДК004.931; 004.932

М. Н. Фаворская

РАСПОЗНАВАНИЕ ДИНАМИЧЕСКИХ ОБРАЗОВ НА ОСНОВЕ ПРЕДСКАЗЫВАЮЩИХ ФИЛЬТРОВ

Построена модель распознавания динамических образов из видеопоследовательностей на основе допустимых отображений в пространстве изображений и пространстве признаков. Введено понятие максимального динамического инварианта. Рассмотрен метод определения максимальных динамических инвариантов на основе фильтров, предсказывающих поведение траектории в многомерном пространстве признаков.

Ключевые слова: распознавание, динамические образы, инвариантные функции.

Постановка задачи распознавания видеопоследовательностей несколько отличается от распознавания изображений тем, что видеопоследовательность представляет собой некоторую совокупность последовательных во времени изображений (кадров) с возможно изменяющимися сценами наблюдения, иными словами само понятие «изображение» теряет статичность, обладает предысторией и становится возможным прогнозирование поведения интересующих нас объектов. В этом случае производится анализ некоторого множества идеальных последовательных изображений РУ, на котором задано разбиение на подмножества У^У^, ..., У^, называемые классами разбиения (см. таблицу). При этом оператор ф74:Р®0, представляющий собой отображение множества объектов наблюдения Р в различных проекциях на множество нормализованных объектов 0 приобретает качественно иную структуру и становится оператором фу74:РУ®0У, отражающим динамику поведения объекта наблюдения. Оператор фу{ь играет существенную роль и при отображении фУ74 множества нормализованных объектов ОУ на множество эталонов 2У, так как помимо традиционных признаков статических изображений используется информация о признаках движения, что повышает точность распознавания объектов и характеризует их поведенческие аспекты. Особенностью распознавания видеопоследовательностей является то, что они могут состоять как из плавно изменяющихся сцен (задачи сопровождения объектов), так и из множества не связанных между собой сцен (анализ видеофильмов). При анализе видеофильмов требуется возобновлять процедуру распознавания объектов в каждой сцене. Сложность отображения фу{ь также связана с понятием многоуровневого движения в кадре. Задача автоматического разбиения сцены последовательных кадров на уровни движения является очень полезной с точки зрения практичес-

кого применения, но весьма далекой от решения на уровне модели.

Изображения объектов в видеопоследовательности представляют собой либо результат движения, либо процесс их развития. При этом объекты переходят из одного состояния в другое, последовательность или совокупность которых определяет принадлежность объекта тому или иному образу. Каждое состояние объекта определяется набором признаков (в том числе мгновенными значениями скоростей и ускорений и их направлениями), а вектор, соответствующий описанию объекта, может изменяться при различных ракурсах съемки и одновременно формировать определенную траекторию в пространстве признаков. Таким образом, задачу распознавания динамических образов можно определить как классификацию совокупностей состояний, как классификацию траекторий, так и то, и другое одновременно. При смене ракурсов изменяется описание объекта, но всегда существует некоторая закономерность смены его состояний, по которой и определяется образ, которому принадлежит наблюдаемый объект. Иногда для распознавания достаточно определить некую совокупность состояний, которую принимал объект относительно наблюдателя, иногда этих сведений оказывается недостаточно и приходится учитывать не только совокупность наблюдаемых состояний, но и динамику их проявления (предыстория поведения). Для случая учета предыстории поведения объекта окончательное решение о принадлежности объекта тому или иному образу формируется в результате продолжительного наблюдения за поведением объекта. Такую процедуру в некоторых случаях можно рассматривать как известную последовательную процедуру принятия решений [1].

Функции фу/:0У®гУ, фу/:РУ®0У, >/:РУ®РУ, у74:КУ®ТУ характеризуют процессы порождения мно-

Допустимые отображения при распознавании объектов в видеопоследовательностях

Отображения в ространстве изображений Отображения в ространстве признаков Краткая характеристика

уу/:ЯУ®РУ Низший уровень обработки. Пространственная и временная фильтрация видеопоследовательностей, выявление зон интереса

/у/:РУ®РУ ^4:Х^®ХЖ Средний уровень - сегментация. Вычисление глобальных и локальных признаков изображений проекций объектов с учетом предыстории

<К/:РУ®ОУ <у3ь:Хрг®Хог Средний уровень - сегментация. Вычисление глобальных и локальных признаков изображений объектов с учетом предыстории

фу/:Х0Г®Х2Г Высший уровень - распознавание и понимание. Анализ глобальных и локальных признаков изображений объектов с учетом предыстории

жества изображений нормализованных объектов OV из множества эталонов ZV, множества объектов наблюдения PV в произвольных проекциях из множества нормализованных объектов OV, множества идеальных изображений FV из множества изображений объектов наблюдения PV и реальных изображений RV из идеальных изображений FV. Особенность рассматриваемого класса задач состоит в том, что в них отображение fvj и соответствующее ему обратное отображение fv{b зависят не только от мешающего параметра р, но и от времени t. Обозначим функцию отображения fvj, изменяющуюся во времени как fv/)p t, а изображение

RV. = yv;(FVfh), FV. = fv/)p, tfv/Cjv^Z.))) называют динамическим изображением (видеопоследовательностью) объекта наблюдения, принадлежащего образу V.. При этом h е H - шум, возникающий в процессе отображения (H - множество возможных значений h). Можно рассмотреть упрощенную модель при а = const, однако, следует помнить, что преобразование ф становится намного сложней из-за концепции многоуровневого движения в видеопоследовательности. Тогда

RV. = yv/(FV.,h), FV. = fv/)p, t(fv/(Z.)). (1)

Такая модель, отображающая динамические характеристики видео объектов, существенно отличается от модели статического изображения [2]. Предполагалось, что множество переходов Pk®Pv порождает множество Bc, которое в свою очередь порождает множество преобразований ge G пространства самого на себя, т. е. для любого перехода Pk®Pv найдется такое ge G, при котором выполняется равенство

gFVk = gjv/fyPV.)) = cpv/(fv;)pv(PV.)) = FVv, (2)

где FV, FVeFV.

Обобщенная модель (1) отличается тем, что любые переходы (Pk®bv)eBc обладают свойством (2), но переходы tn®tn+ 1 этим свойством не обладают, т. е. между множествами переходов (t®t + 1)etc и множеством порождаемых ими преобразований на множестве FV нельзя установить соответствие вида (2). Именно эта особенность видеопоследовательностей не позволяет применять обычные методы распознавания для их классификации, хотя постановка задачи формально не изменяет своего содержания.

Если при распознавании статических объектов модель порождения изображений можно было рассматривать как совокупность траекторий, состоящих из всех точек множества XFV, окруженных облаком, расположение ко -торого определяется распределением шума h, а сами эти точки (включая и точкиXFVkeXFV) образуют множество XRV, то при распознавании движущихся объектов эта модель существенно усложняется. Если при распознавании одного объекта модель динамического изображения представляет собой некую гиперплоскость, соответствующую одному образу и окруженную облаком, расположение которого зависит от характера шума, то при распознавании нескольких образов существует несколько таких гиперплоскостей, взаимное расположение которых практически не позволяет провести какие-либо границы между ними. Такие гиперплоскости строятся при значениях

Р = var, t = var. Даже если существенно упростить задачу и считать, что р = const, то решение нельзя найти классическими методами теории распознавания образов. Дело в том, что переходы tn ® tn + 1 порождают такие преобразования изображений FV, относительно которых невозможно восстановить максимальные инварианты известными способами.

Введем понятие динамического максимального инварианта. Пусть {RV} - последовательность кадров {RVt, RV+ 1, ..., RVt+N), где t- начальный, а t + 1, t + 2, ..., t + N - последующие моменты наблюдения, причем t может быть выбрано в любой точке гиперповерхности. При этом любые две точки XFVk,t и XFVv,t, соответствующие одному и тому же образу, должны лежать на гиперповерхности, соответствующей заданному значению t. Тогда динамической инвариантной функцией будем называть любую функцию от { RV}, если она не изменяется при изменении параметров р и t. Предположим, что для динамической инвариантной функции E при достаточно длинных последовательностях {RV} и {RV}c равенство E{RV}=E{RV}c (3)

выполняется только тогда, когда для каждой пары из серии наблюдений {RV} и { RV}c существует такое преобразование ge G и всегда найдутся такие значения t и t°, что

RVk, t = gRVvtc ,

, RVk, t + gRVv, , + 1, (4)

RVk, t + N = gRVv, , + N .

Такую функцию назовем максимальным динамическим инвариантом, причем ge G - преобразования, порожденные всевозможными переходами из Bc. Условия

(3) и (4) выполняются только тогда, когда либо все наблюдения {RV} и {RV}c принадлежат гиперплоскости при отсутствии шума, либо все они сосредоточены в окрестности гиперплоскости, определяемой распределением шума h, и всегда существует возможность сдвинуть наблюдения во времени так, чтобы выполнялись равенства

(4). Если помеха h постоянна на всем интервале наблюдения, то условия (4) будут выполняться на некоторой равноудаленной гиперплоскости. Отсюда следует, что некоторая функция от совокупности наблюдений обладает свойством максимального динамического инварианта только тогда, когда она постоянна на любой траектории или является совокупностью точек, принадлежащих гиперповерхности или лежащих в окрестности этой гиперповерхности.

Если наблюдения {RV} и {RV}c достаточно продолжительны, то функции E{RV} и E{RV}c, обладающие свойствами максимального динамического инварианта, различаются только в том случае, если наблюдения {RV} и {RV}c находятся на гиперповерхностях различных образов. Для решения задачи распознавания достаточно указать номер гиперповерхности, из которой произошла наблюдаемая последовательность, а максимальный динамический инвариант постоянен именно на тех точках, которые произошли из некоторой гиперповерхности. Тогда для построения решающей функции, инвариантной к параметрам р и t, достаточно построить такую функцию,

которая зависела бы от наблюдений только через максимальный динамический инвариант. Сформулируем задачу распознавания динамических образов в общем виде, используя свойства максимального динамического инварианта.

Предположим, что любое изображение формально описывается выражением (1). Задана обучающая выборка, состоящая из N последовательностей наблюдения. Для каждой последовательности наблюдений {RV}k, k = 1, 2, ., N*, указана ее принадлежность определенному образу. Требуется по данным обучающей выборки восстановить любой максимальный инвариант Ep t{RV} относительно параметров р и t по всем . и построить решающую функцию ^{RV}, зависящую от изображений RV только через найденный максимальный инвариант (j - номер образа). Эта функция должна принимать одинаковые значения на множестве изображений одного образа и различные значения на множествах разных образов.

В общем случае по заданной обучающей выборке требуется определить множество преобразований G, соответствующее множеству возможных переходов Bc или множеству возможных значений Ре Б. Такая задача очень сложна. Ее можно упростить, считая, что заранее задается множество преобразования G или восстанавливается такая функция E{RV}, которая обладает свойствами максимального динамического инварианта только относительно последовательностей, входящих в обучающую выборку. При обучении распознаванию динамических образов задача определения полного множества преобразований существенно усложняется и практически не может быть решена без дополнительных ограничений. Процесс определения преобразований G, восстановления максимального динамического инварианта и выбора решающей функции, зависящей от наблюдения только через найденный максимальный динамический инвариант, называется процессом обучения. Применение полученной решающей функции для принятия решений

о принадлежности образам новых наблюдений называется процессом распознавания.

Рассмотрим модель порождения изображений (1) более подробно. Предположим, что в этой модели отсутствуют помехи, т. е. h = 0 и р = const. Тогда каждому образу динамического объекта будет соответствовать единственная траектория в некотором пространстве признаков. Траектории, соответствующие различным интервалам наблюдения за объектами одного и того же образа, будут представлять собой отрезки траектории этого образа. Процесс распознавания заключается в определении принадлежности наблюдаемого объекта тому или иному образу, т. е. по серии наблюдений требуется указать номер той траектории, на которой лежат наблюдаемые точки. При этом траектории различных образов могут пересекаться. Однако задача усложняется тем, что проекции движущегося объекта, отображаемые во фронтальной плоскости (плоскости реальных изображений или кадров), могут кардинально изменяться при движении объекта. В этом случае нахождение обобщенного максимального динамического инварианта становится еще более трудной, а в некоторых случаях и невозможной задачей, или

следует принять, что траектория объекта размывается. В последнем варианте можно говорить о принадлежности наблюдаемого объекта некоторому образу с некоторой долей вероятности.

Вернемся к более простому варианту, когда проекции объектов подвержены группе аффинных преобразований. Предположим, что точки траекторий образов установлены в процессе обучения. Однако мгновенного наблюдения (в результате которого будет получена одна точка, принадлежащая той или иной траектории) за движущимся объектом будет недостаточно, потому что траектории образов могут пересекаться, и возникает неоднозначность. Таким образом, для распознавания движущихся объектов требуется учитывать совокупность наблюдений, определяющих поведение объекта в предыдущие моменты времени, т.е. предысторию изображений {RV}0N на некотором интервале времени t0, tN. При появлении шума в модели (1) и при р = var принцип учета предыстории приобретает еще большее значение, так как при этом для распознавания динамических образов требуется еще большее количество точек наблюдения из предыстории. Таким образом, максимальный динамический инвариант зависит от предыстории, а решающая функция должна зависеть от наблюдений только через максимальный динамический инвариант. По определению, максимальный динамический инвариант обладает особым свойством, заключающимся в том, что для достаточно длинных последовательностей наблюдений {RV}0N он принимает одно и то же значение только в том случае, когда эти последовательности принадлежат одной и той же гиперповерхности. Если же сравниваемые последовательности принадлежат различным гиперповерхностям, то их максимальные инварианты не равны между собой. Основная трудность при решении задачи распознавания динамических образов состоит в определении максимальных динамических инвариантов: если они будут найдены, то и задача распознавания динамических образов будет решена.

Рассмотрим один из методов определения максимальных динамических инвариантов. Предположим, что известны аналитические зависимости

XRVt+ 1 = 0.(XRVt, XRVt- „ ...,XRVt-N)J = 1, 2, ...,m, (5) где XRVt + j, XRVt, XRVt - j, ., XRVt - N - точки в пространстве, соответствующие наблюдениям за динамическим объектом в моменты времени t + 1, t, t- 1, ..., t- N. Функцию Ф можно рассматривать как предсказывающий фильтр, который по предыдущим значениям XRV определяет его будущие значения. Кроме того, функция Ф. является некоторой моделью, адекватной гиперповерхности .-го образа. Если модель (5) достаточно точная и если последовательность {XRV} лежит в окрестности k-й поверхности, то

£( XR+',-(Xf!', )k )2 =

t= 0 ' '

¥ / . \ 2

= minх(XRV+.-(XRV.).) ,

. t =0 v ’

где (XRVt+ ) - координаты точки XRVt+ , вычисленные k-м фильтром; (XRVt + ^ - координаты точки XRVt + вычисленные ]-м фильтром; XRVt + 1 - действительные координаты точки. Равенство

¥ / . \ 2 ацти. Х( X",-(X",)') =

1 ¥=0 ' '

= агя т!п £ ((х^ , )с - (х"+'1)1)

1 /=0 ' ' достигается тогда, когда последовательности {ЯУ} и { КУ}С

лежат в окрестности одной и той же поверхности, и только тогда, когда выполняются равенства (4). Значит,

¥ I . \ 2

ш^тт £( х^ 1 -(х^1)) (6)

1 г=0у '

обладает свойством максимального динамического инварианта. Построив решающее правило, зависящее от наблюдений через выражение (6), можно решить задачу распознавания динамических образов.

С точки зрения математической статистики задача распознавания образов полностью совпадает с задачей различения гипотез. Каждому образу ставится в соответствие вероятностная мера, а параметром, по которому различаются эти меры, является номер образа. На основании наблюдений следует предпочесть одну их гипотез. В классической постановке задачи различения гипотез считаются известными условные распределения вероятностей. В задаче распознавания эти распределения можно определить в процессе обучения. Предположим, что в процессе обучения определены значения вероятностей Р({ХР^}'/К) для всех значений V и 1 (V = 1, 2, ..., £ - номера состояний). Предположим, что существует возможность определить вероятности Р({ХР¥ }/V) для любой совокупности состояний {ХР¥ } и для всех/. Тогда, на каждом шаге наблюдения можно вычислить отношения вероятностей р^рш где рш = ({Х^}', {хРу ,{^ВД;

Р.м = ({Хр^1} {Хру, {Хру/V); {XР¥1}' - состояние,

которое принял динамический объект в момент первого наблюдения; {ХР¥2}' - состояние, которое принял динамический объект в момент второго наблюдения и т. д. Используя отношение Р^РШ для решения задачи распознавания, можно применить известные последовательные процедуры. Но отношение Р^РШ и есть тот функционал, который зависит от наблюдений через совокупности тех состояний, который принимает динамический объект в процессе наблюдения. Последовательные процедуры могут дать удовлетворительный результат, поскольку в них не просто используется перечисление состояний, а учитываются вероятности попадания представляющей точки в ту или иную область пространства признаков.

Простое перечисление совокупности пройденных состояний не всегда приводит к положительному результату: для классификации можно использовать более детальные свойства траекторий, а именно порядок смены состояний. Присвоим каждой области пространства определенный вес так, чтобы веса областей различались. Рассмотрим систему координат, в которой по оси абсцисс откладываются значения времени, а по оси ординат - вес той области, в которой находится представляющая точка в данный момент. Тогда в процессе наблюдения за объектом вычерчиваются кривые линии, каждая из которых соответствует определенной траектории в пространстве признаков. Траекториям, прошедшим через одни и те же области, но в различных последовательностях, соответствуют различные кривые в новой плоской системе координат. Таким образом, задачу классификации слож-

ных пространственных траекторий можно свести к более простой задаче классификации плоских кривых.

Используя новую систему координат, задачу классификации пространственных кривых можно решить и другим способом. Построим координатную сетку, где по оси абсцисс отложены определенные отрезки времени, а по оси ординат - веса, присвоенные различным областям. Если считать, что факт попадания представляющей точки в один из прямоугольников этой сетки является одним из множества несовместных событий, то достаточно провести классификацию траекторий как совокупности всех состояний, принадлежащих этой траектории. Такая процедура позволяет выносить решение о принадлежности наблюдаемого изображения объекта тому или иному образу по неполным наблюдениям.

Для обучения системы необходимо оценить вероятности вида Р({ХР^}' /V), где v= 1, 2, ..., £, 1= 1, 2, ..., т; {Хр^}' - событие, характеризующееся попаданием представляющей точки в один из прямоугольников координатной сетки; V - образы, на которые необходимо разделить все входные изображения. Когда такие вероятности определены, задача классификации траекторий сводится к задаче классификации совокупностей состояний, т. е. такой метод позволяет перейти от учета порядка следования состояний к учету совокупности состояний, что значительно упрощает решение задачи. В данном случае специфическую сложность представляет выбор масштаба времени. Масштаб времени и интервалы на оси абсцисс должны выбираться в соответствии со скоростью изменений местоположения объекта.

Задачу распознавания динамических образов с учетом последовательности состояний можно решить с использованием максимально инвариантных свойств выражения (6). В этом случае задача распознавания динамических образов формулируется следующим образом. Предположим, что любое изображение может быть формально описано выражением (1). Задана обучающая выборка, состоящая из N последовательных наблюдений {КУ}к, к= 1, 2, ., ^*, указана ее принадлежность определенному образу. Требуется для каждого образа построить такой предсказывающий фильтр, который на основании некоторой последовательности предыдущих состояний указывал бы будущее состояние динамического объекта. Решение должно зависеть от сравнения предсказанных и действительных состояний на (/ + 1)-м шаге наблюдения. Таким образом, задача распознавания динамических образов сводится к задаче построения фильтра, предсказывающего поведение траектории в многомерном пространстве. Методы, основанные на такой постановке задачи распознавания динамических образов, называются методами обучающихся предсказывающих фильтров.

Задачу распознавания динамических объектов с учетом порядка следования состояний можно свести к задаче классификации многомерных процессов. Общим функциональным выражением предыстории функции времени в ограниченном частотном диапазоне является зависимость

N N N

Ф (х ()) = -■ +ХХа,,.2X-чх> -2 +..., (7)

1=0 4 = 0 12 =0

где х{ _. - значения функции в моменты времени ^ t - 1, / - 2, .; а. - соответствующие коэффициенты. Выраже-

ние (7), называемое оператором Колмогорова-Г абора, используется для прогноза временных последовательностей. Первая сумма в этом операторе представляет собой линейный предсказывающий фильтр. Коэффициент а. определяет влияние дискретного значения функции х, которое она принимает на .-м интервале из предыстории. Вторая сумма состоит из квадратичных комбинаций дискретных значений х. Коэффициенты а.1, .2 определяют веса пар значений функции в моменты t - 1Х и t - 12 из предыстории.

Для решения полинома (7) целесообразно использовать метод группового учета аргументов, основная особенность которого состоит в том, что нормальные уравнения составляются и решаются не относительно всего полинома (7), а относительно более простых полиномов с небольшим количеством членов, учитывающих только некоторые группы аргументов. При этом каждый упрощенный полином рассматривается как самостоятельный и независимый предсказывающий фильтр, коэффициенты которого определяются путем решения нормальных уравнений с небольшими матрицами коэффициентов. После настройки каждый фильтр (каждый упрощенный полином) проверяется на специальной проверочной последовательности, после чего отбираются лишь несколько наилучших в смысле результата предсказывания фильтров и выход каждого из них используется в качестве аргумента для построения более сложного фильтра и т. д. После нескольких отборов образуется гибкая математическая структура, которая, с одной стороны, дает удовлетворительное предсказывание, а с другой стороны -может быть сравнительно легко реализована при сравнительно небольших обучающих последовательностях.

Рассмотрим метод группового учета аргументов на примере попарного учета аргументов. Пусть задана функция х(^ на некотором интервале наблюдения Т. Этот интервал разбивается на два интервала Т1 и Т2. Пусть в качестве обучающей последовательности используется интервал Т1, а в качестве проверочной последовательности -интервал Т. При этом учитывается только N точек из предыстории х, х1 - 1, ., х1 - + 1. Для каждой пары аргументов х{ - и х{ - составляются упрощенные полиномы первого уровня типа у]Л(х, - ы, х{ - к), и определяются неизвестные коэффициенты. После этого полиномы считаются обученными. С помощью проверочной последовательности оценивается качество предсказания каждого из обученных фильтров, определяемое, например, по величине среднеквадратичной ошибки. Из этих фильтров выбирается несколько лучших в смысле выбранного критерия, и составляются полиномы второго уровня вида ^(Уд^Ум). Далее составляются нормальные уравнения

относительно полиномов I,, в результате решения которых определяются коэффициенты а (2). Обученные фильтры (полиномы) проверяются на проверочной последовательности Т, и из них отбираются лучших в смысле

выбранного критерия качества. После этого значения, получаемые на выходах отобранных фильтров, используются для построения более сложных полиномов следующего ряда13 и т. д. Наращивание сложности полиномов прекращается тогда, когда хотя бы один полином последнего ряда дает удовлетворительные предсказания. Этот полином используется в качестве предсказывающего фильтра.

Такая процедура может быть легко применена при распознавании динамических объектов. Для этого методом группового учета аргументов нужно построить столько предсказывающих фильтров по каждой координате, на сколько образов требуется разделить динамические объекты. В процессе распознавания предпочтение следует отдавать тому образу, для которого

п

ек =тп Хё2,

1 1=1

где ё.2 - среднеквадратичная ошибка по /-й координате фильтра, обученного на объектах 1-го образа.

Таким образом, в статье предложена упрощенная модель, отображающая динамические характеристики объектов в видеопоследовательности. Показано, что при распознавании нескольких динамических образов существует несколько гиперплоскостей в многомерном пространстве признаков, взаимное расположение которых не позволяет провести какие-либо границы между ними, что приводит к невозможности нахождения решения классическими методами теории распознавания образов. Сформулирована задача распознавания динамических образов с использованием функции максимального динамического инварианта и рассмотрен более простой вариант, когда проекции объектов подвержены группе аффинных преобразований. Показано, что метод определения максимальных динамических инвариантов на основе предсказывающих фильтров может быть реализован по схеме метода группового учета аргументов.

Библиографический список

1. Васильев, В. И. Распознающие системы : справ. / В. И. Васильев. Киев : Наукова думка, 1983.

2. Фаворская, М. Н. Инвариантные решающие функции в задачах распознавания статистических изображений / М. Н. Фаворская // Вестник СибГАУ. Красноярск, 2007. Вып. 1(14).

M. N. Favorskaya

THE DYNAMIC PATTERNS RECOGNITION BASED ON PREDICATING FILTERS

The model of dynamic patterns recognition from video sequences based on allowable mapping into images space and features space is realized. The term of maximum dynamic patterns recognition function is introduced. The method of maximum dynamic invariant functions based on filters, predicating a trajectory behavior in multivariate feature space is regarded.

Keywords: patterns recognition, dynamic patterns, invariant functions.

i Надоели баннеры? Вы всегда можете отключить рекламу.