Научная статья на тему 'Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик'

Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
466
107
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ СИМВОЛОВ / ОЦЕНКА ЭФФЕКТИВНОСТИ РАСПОЗНАВАНИЯ / OPTICAL CHARACTER RECOGNITION / AN ESTIMATION OF EFFICIENCY OF RECOGNITION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Воскресенский Евгений Михайлович, Царев Владимир Александрович

В статье предложен метод оценки эффективности систем распознавания текстовых меток на сложном фоне, структура которых включает в себя алгоритмы локализации, сегментации, распознавания и принятия решений. Процесс обработки системой отдельных изображений представлен как последовательность событий вида «алгоритм дал правильный (неправильный) ответ», на основе которых сформирована диаграмма всех возможных последовательностей этих событий - дерево вероятностных характеристик. С использованием дерева определена функциональная зависимость вероятностных характеристик и производительности всей системы распознавания от характеристик отдельных алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Воскресенский Евгений Михайлович, Царев Владимир Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD OF ESTIMATION OF TEXT LABELS RECOGNITION SYSTEMS EFFICIENCY PARAMETERS WITH USE OF LIKELIHOOD CHARACTERISTICS TREE

In article the method of estimation of text label recognition systems efficiency is offered. Processing of input images is presented as sequence of events of a kind «algorithm has returned the correct (wrong) answer». On this basis the diagram of all possible sequences of these events is generated. It is tree of likelihood characteristics. With use of the tree functional dependence of recognition system characteristics from characteristics of separate algorithms is determinated.

Текст научной работы на тему «Метод оценки эффективности систем распознавания текстовых меток на сложном фоне с использованием дерева вероятностных характеристик»

МЕТОД ОЦЕНКИ ЭФФЕКТИВНОСТИ СИСТЕМ РАСПОЗНАВАНИЯ ТЕКСТОВЫХ МЕТОК НА СЛОЖНОМ ФОНЕ С ИСПОЛЬЗОВАНИЕМ ДЕРЕВА ВЕРОЯТНОСТНЫХ ХАРАКТЕРИСТИК

Е.М. Воскресенский, В.А. Царев Институт Менеджмента и Информационных Технологий (филиал) Санкт-Петербургского Государственного Политехнического Университета

Аннотация

В статье предложен метод оценки эффективности систем распознавания текстовых меток на сложном фоне, структура которых включает в себя алгоритмы локализации, сегментации, распознавания и принятия решений. Процесс обработки системой отдельных изображений представлен как последовательность событий вида «алгоритм дал правильный (неправильный) ответ», на основе которых сформирована диаграмма всех возможных последовательностей этих событий - дерево вероятностных характеристик. С использованием дерева определена функциональная зависимость вероятностных характеристик и производительности всей системы распознавания от характеристик отдельных алгоритмов.

Ключевые слова: распознавание символов, оценка эффективности распознавания.

Введение

В настоящее время распознавание текстовых меток (ТМ) на сложном фоне является одной из важных прикладных задач компьютерного зрения. Обычно оно применяется для идентификации объектов контроля, имеющих регистрационные надписи. Идентификация осуществляется посредством обработки и анализа изображений объектов. Примерами таких объектов могут служить наземные транспортные средства, грузовые контейнеры, денежные купюры, документы и др.

Системы распознавания текстовых меток (СРТМ) имеют множество особенностей, отличающих их от OCR-систем, широко используемых для распознавания текста. Во-первых, OCR-системы не рассчитаны на распознавание текста на сложном, неоднородном фоне, а фон текстовых меток на входных изображениях СРТМ может быть самым разным. Во-вторых, условия функционирования СРТМ предполагают влияние множества факторов, снижающих качество изображения ТМ, например, солнечные блики, тень, дождь, снег и т.п. OCR-системы, в свою очередь, успешно обрабатывают только качественные изображения, поэтому внесение шума на изображение используется как средство защиты текста от автоматического распознавания. В-третьих, СРТМ предназначены для функционирования в заданном режиме быстродействия. К OCR-системам жесткие требования такого рода, как правило, не предъявляются. В-четвертых, OCR-системы представляют собой сугубо программные системы. СРТМ, напротив, тесно интегрированы с разнообразным аппаратным обеспечением, служащим для ввода видеоинформации, сигналов от датчиков, радаров и др.

Техническая база оптоэлектронных средств, которые могут применяться для формирования изображений объектов контроля, в настоящее время достаточно развита и подробно описана в технической литературе. Однако значительная часть про-

блем, возникающих при разработке алгоритмического обеспечения СРТМ, связана с недостаточным развитием теории, методов и средств проектирования подобных систем [1,4].

Типичная СРТМ состоит из аппаратного и программного обеспечения. ПО, как правило, включает в себя интерфейс пользователя и алгоритмы распознавания. Основной частью алгоритмического обеспечения СРТМ является модуль обработки и анализа изображений (МОАИ, модуль ОАИ). МОАИ осуществляет поиск метки на изображении (локализацию), выделение на метке отдельных символов (сегментацию), распознавание символов и принятие решения по результатам распознавания.

Входные изображения СРТМ часто зашумлены и имеют низкое разрешение, вследствие чего создание алгоритмов, гарантирующих правильное решение, затруднительно. Поэтому на практике применяются эвристические алгоритмы, ответы которых являются правильными с некоторой вероятностью. В таких случаях важной составляющей процесса разработки алгоритмического обеспечения будущей системы является методика оценки качества функционирования системы.

Процесс разработки практически любого МОАИ определяется постоянным поиском компромисса между характеристиками производительности и вероятностными характеристиками модуля, что приводит к тестированию эффективности множества его конфигураций. Чтобы оценить эффективность функционирования заданной конфигурации МОАИ, необходимо рассчитать отношение количества правильных ответов модуля к общему количеству ответов на относительно большом объеме тестовых данных. Проводить такое тестирование при каждом изменении алгоритмов или их настроек неэффективно из-за больших затрат времени. В то же время характеристики эффективности алгоритмов модуля обычно известны разработчикам. Поэтому возможным решением является установление функциональной

зависимости эффективности функционирования МОАИ от характеристик алгоритмов модуля.

Второй важной задачей является необходимость достаточно наглядно представить структуру процесса обработки изображения, чтобы визуально отобразить влияние эффективности алгоритмов модуля на промежуточные и конечные результаты. В статье предлагается решить обе указанные задачи посредством использования событий вида «алгоритм дал правильный (неправильный) ответ» и сформированной на их основе диаграммы всех возможных последовательностей таких событий - дерева вероятностных характеристик.

1. Критерии оценки эффективности функционирования СРТМ

Основными критериями эффективности функционирования МОАИ (далее - эффективности МОАИ) являются вероятностные характеристики и характеристики быстродействия.

К вероятностным характеристикам относятся: вероятность правильного распознавания метки объекта Pright, вероятность «пропуска метки» Plost и

«ложных срабатываний» системы Perr. В соответствии с общепринятым подходом к оценке качества классификаторов Plost является вероятностью ошибки первого рода (false negative), а Perr - ошибкой второго рода (false positive).

Оценка значений указанных вероятностных критериев обычно выполняется с использованием методов математической статистики. Тестовый набор изображений, множество правильных ответов и множество ответов МОАИ являются исходными данными для расчета Pright, Plost и Perr. Такой способ

оценки эффективности МОАИ применяется в тех случаях, когда эффективность его алгоритмов неизвестна. Однако в процессе разработки МОАИ вероятностные характеристики алгоритмов обычно известны. В этом случае вероятностные характеристики МОАИ предлагается рассчитывать аналитически, на основе характеристик алгоритмов. Естественным условием возможности такого расчета является соответствие компонентов МОАИ архитектуре, описание которой приведено ниже.

Значимым дополнительным требованием к МОАИ является способность модуля функционировать в требуемом режиме быстродействия. Поэтому к указанным характеристикам целесообразно добавить время задержки T в выдаче результатов распознавания с момента появления изображения. Время задержки предлагается оценивать на основе задержек отдельных алгоритмов, а также их вероятностных характеристик.

2. Модуль обработки изображений СРТМ и его компоненты

МОАИ осуществляет обработку поступающих на вход изображений. Выходом модуля является строка

символов, соответствующая графическому образу найденной текстовой метки, или решение об отсутствии метки на изображении. В данной статье описан простейший вариант МОАИ. Предполагается, что модуль выдает одно решение по каждому изображению, ТМ состоят из фиксированного числа символов N, алгоритм локализации всегда возвращает некоторую зону и на изображении может присутствовать только одна ТМ.

Задачей МОАИ является выполнение целого ряда нетривиальных вычислений над изображениями, поэтому модуль, как правило, представляет собой достаточно сложную систему. Часто для решения сложных задач используют прием декомпозиции. Деление задачи на части позволяет упростить решение и «локализовать» логику каждой из подзадач в отдельных компонентах, взаимодействующих друг с другом через четко определенные интерфейсы. Это справедливо и для модуля ОАИ, который можно представить как набор взаимосвязанных алгоритмов, каждый из которых производит конкретную операцию.

1. Алгоритм локализации (АЛ) определяет границы образа текстовой метки на изображении. Входом АЛ является изображение 1тхп, которое возможно содержит образ объекта идентификации с ТМ на нем. Выходом АЛ являются координаты прямоугольной зоны (х1, у1, х2, у2) на исходном изображении. Сама

локализованная зона представляет собой фрагмент исходного изображения, содержащий образ ТМ и ничего более.

2. Алгоритм сегментации (АС) определяет границы каждого символа на локализованной зоне. Входом АС является локализованная зона или само изображение и координаты зоны на нем. АС возвращает список координат сегментов:

{(ХЦ, У1,1, Х1,2, У1,2 ) ,..., ( Х„д, у.,1, Х.,2, У й,2 )} . Если сегмент есть изображение символа, то будем назвать его сегмент-символ, а в противном случае - сегмент-шум.

3. Алгоритм распознавания (АР) производит распознавание (классификацию) изображений отдельных символов. Выход АР - это код распознанного символа, то есть класс, к которому отнесено изображение. Помимо классов символов (цифр и букв) в МОАИ используется класс шумов, его составляют изображения, не содержащие корректно сегментированного символа.

4. Алгоритм принятия решений (АПР) формирует окончательный результат распознавания. На вход АПР поступают распознанные сегменты и их координаты. Выходом АПР является код текстовой метки в виде строки символов или решение об отсутствии метки на изображении. Обычно использование АПР обусловлено относительно высоким уровнем ошибок второго рода алгоритма распознавания.

Важно отметить, что на вход МОАИ могут поступать изображения двух видов: информативные и не-

информативные. Информативные изображения содержат образ текстовой метки, в отличие от неинформативных. Будем называть неинформативными данными результаты обработки неинформативных изображений. Как правило, алгоритмы МОАИ обрабатывают данные обоих видов и только АР может «отличать» их.

Сократить затраты процессорного времени на обработку не содержащих ТМ изображений возможно путем применения функций фильтрации, встраиваемых в алгоритмы МОАИ, однако это усложняет алгоритмы и может оказаться дополнительным источником ошибок первого рода.

3. Вероятностные характеристики алгоритмов МОАИ СРТМ

Для задания спецификаций алгоритмов и программных модулей для «плохо формализованных» задач предложен метод описания спецификаций алгоритмов при помощи формируемого экспертом массива «прецедентов», т.е. пар вида «входная информация - выходная информация» (Inp, E). Подробно метод описан в [1]. 7пр - это множество входных данных (в данном случае их формат не важен):

1пр = {1пр1, 1ПР2,..,1пра} .

Е - множество выходных данных, сформированное экспертом для 1пр :

Е = Е, е2,..,Е^} .

«Идеальный» алгоритм должен выдавать аналогичные выходные данные на заданном наборе 1пр . Но создание «идеальных» алгоритмов модуля ОАИ, всегда выдающих правильное решение, часто затруднено из-за неопределенности условий формирования входных данных. На практике это приводит к усложнению алгоритмов, но даже сложный эвристический алгоритм не гарантирует правильность результата. Поэтому важнейшей характеристикой алгоритма является вероятность события X = «алгоритм дал правильный ответ», оцениваемая статистически.

Обозначим результаты обработки множества входных данных 1пр алгоритмом А как А[1пр], а

отдельного входа 7пр1 как А[7пр1 ]. Пусть выходом

алгоритма является один - единственный ответ. На практике часто используются списки возможных ответов, такой подход подробно описан в [3].

Вероятность события X рассчитывается как отношение правильных ответов алгоритма А к общему количеству ответов:

|{А[!пр,]|А[!пр,]~ Е1 }|

Р( X)

Е

(1)

Ответ на вопрос «является ли ответ А[7пр1 ] правильным» определяется сравнением Е1 и А[7пр1 ]. Корректность выходных данных А[7пр1 ] зависит от требований ко входным данным алгоритма, к которому А[7пр1 ] поступают на вход. В алгоритмах сег-

ментации и распознавания такие требования могут быть достаточно гибкими, заданными в виде интервала допустимых значений для входных координат. Поэтому возможно существование срезу нескольких эквивалентных друг другу правильных ответов.

События, соответствующие возможным ответам алгоритмов МОАИ СРТМ, представлены в следующей таблице:

Таблица. События в МОАИ

Алгоритм

Локализация

Сегментация

Распознавание

АПР

События

L = «текстовая метка корректно локализована»;

L = «текстовая метка локализована некорректно»;_

£ = «зона корректно сегментирована (все символы корректно сегментированы)»;

£ = «зона не сегментирована корректно»;

0£ = «на зоне сегментировано N и

более сегментов (требуется распознавание)»;

0£ = «на зоне сегментировано менее N сегментов»;

R = «все сегменты (сегменты-шумы и сегменты-символы) корректно распознаны»;

R = «не все сегменты корректно распознаны»;

Rs = «все сегменты-символы корректно распознаны (а сегменты-шумы - не обязательно)»;

Rs = «не все сегменты-символы корректно распознаны»; GR = «распознано N и более сегментов»;

GR = «распознано менее N сегментов»;

D = «АПР сформировал правильный код ТМ»;

Б = «АПР сформировал неправильный код ТМ»;

Бг = «АПР сформировал некоторый код ТМ»;

Бг = «АПР принял решение об отсутствии ТМ на входном изображении».

Помимо событий вида X предлагается использовать уточняющие события. Уточнение X событиями

X и X"1, где X = X '+ X , X X = 0 ,

Р^) = Р( X') + Р^'), позволяет детализировать

некоторые вероятностные характеристики МОАИ. Поясним назначение уточняющих событий.

События GS, GR означают, что алгоритмами сегментации и распознавания найдено количество объектов (сегментов, символов) п > N . При наступлении GS , ОЯ принимается решение об отсутствии текстовой метки. Указанные события дают возможность оценить вероятность того, что неинформативные данные будут отсеяны на этапах сегментации или распознавания.

Событие Я на практике происходит относительно редко, поскольку достаточно сложно создать алгоритм распознавания, способный абсолютно правильно классифицировать сегменты-шумы. Объясняется это тем, что ввиду практически бесконечного разнообразия изображений «не символов» невозможно создать набор признаков для их распознавания. Поэтому более показательной характеристикой АР является вероятность события Ях.

Использование событий Бг и Бг определяется способностью АПР принимать решение об отсутствии текстовой метки на зоне, их вероятности особенно показательны при обработке неинформативных изображений.

P(GSL)

Важно заметить, что некоторые из описанных событий обозначают результат обработки информативных входных данных и не имеют смысла для обозначения результатов обработки неинформативных данных.

В числе таких событий: L , L , £ , £ , ЯS , ЯS ,

Б, О . В качестве характеристик алгоритмов при обработке неинформативных данных предлагается использовать вероятности событий GS, GS , GЯ,

ёЯ, о, .

4. Дерево вероятностных характеристик МОАИ СРТМ

В МОАИ процесс обработки данных можно представить различными последовательностями событий вида X. Совокупность всех таких последовательностей представляет собой двоичное дерево -дерево вероятностных характеристик (ДВХ). Узлы ДВХ помечены вероятностями соответствующих событий (рис.1).

L

P(L)

Image input

L P(L)

GjL P(GsL)

GSL GSL

P(GsL) P(GsL)

1

grgsl grgsl

P(GRGSL) P(GrGsL)

GcL

S

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис.1. Дерево вероятностных характеристик модуля ОАИ для информативных изображений

Корень дерева обозначает событие «на вход МОАИ поступило изображение», вероятность этого события считается равной 1 и не используется при расчетах.

Вершины-листья символизируют события, после наступления которых обработка изображения завершается. Часть из них соответствует алгоритму

принятия решений. Оставшаяся часть символизирует события вида ё =«алгоритм выдал недостаточное количество данных для принятия решения о наличии метки». Возможно построить ДВХ и без использования уточняющих событий. Но поскольку одной из целей построения ДВХ является получение максимально подробной информации о функциони-

ровании МОАИ, то используются все уточняющие события.

Заметим, что на рисунке 1 представлено дерево событий, которые могут наступить при обработке информативного изображения. Будем называть такое дерево - ДВХ модуля ОАИ для информативных изображений (ДВХ ИИ). Для оценки эффективности обработки неинформативных изображений предлагается использовать видоизмененное ДВХ (рис. 2), поскольку в контексте обработки таких изображений левое поддерево ДВХ ИИ не имеет смысла. ДВХ для неинформативных изображений (ДВХ НИ) представляет собой правое поддерево ДВХ ИИ, поскольку на неинформативных изображениях АЛ всегда возвращает координаты неинформативных зон.

GR Gs GRGS

P(GRGs) Р(^3)

Рис.2. Дерево вероятностных характеристик модуля ОАИ для неинформативных изображений

Важно отметить, что исходными данными для статистического расчета вероятностных характеристик алгоритмов, демонстрируемых на этих двух деревьях, являются, соответственно, информативные и неинформативные изображения.

5. Вычисление вероятностных характеристик МОАИ

Рассмотрим методы расчета характеристик Р^ы , Рш, и Регг для информативных и неинформативных изображений.

5.1 Расчет эффективности МОАИ по ДВХ ИИ

Вероятности правильных ответов алгоритмов локализации, сегментации, распознавания и приня-

тия решений: Р^, Р£ , Р(Я), Р(Б) - рассчитываются по формуле (1). События, символизируемые вершинами, лежащими на произвольном пути от корня ДВХ к листьям, являются независимыми и совместными. Поэтому их совместные вероятности рассчитываются как произведение их вероятностей, например: P(DRSL) = Р(Б) х Р(Я) х Р£ х Р(Ь) .

Характеристики Р^ , Рш, и Регг МОАИ в таком

случае можно легко выразить через вероятностные характеристики отдельных алгоритмов модуля, воспользовавшись разметкой листьев ДВХ ИИ:

Р*Ф, = Р(БЯ£Ц + P(DRRsSL) (2)

Р = 1 - Р

lost гщЫ

Регг = Р (DRRsSL )+ Р ( DzRsGRSL ) + +Р (DzRGRGsL) + Р (DzGRSL).

(3)

(4)

ДВХ ИИ наглядно демонстрирует, что ошибка второго рода появляется каждый раз, когда АПР принимает решение «метка распознана», имея на входе неинформативные данные.

5.2 Расчет эффективности МОАИ по ДВХ НИ

На практике часто встречаются ситуации, когда количество неинформативных входов МОАИ на порядок и более превосходит количество информативных. В таких случаях первостепенное значение приобретают характеристики МОАИ, отображаемые на ДВХ НИ.

Способности алгоритмов отсеивать неинформативные входы определяются вероятностями событий Gs , GR , Dz . Как правило, алгоритмы локализации и сегментации не имеют функций распознавания и принятия решений, следовательно, они не отличают информативные входы от неинформативных. Поэтому большая часть неинформативных изображений отсеивается алгоритмом распознавания и АПР, а наиболее важными характеристиками

выступают вероятности событий GR и Dz .

Исходными данными для статистического расчета вероятностных характеристик алгоритмов на неинформативных изображениях является множество 7пр^18в, формируемое экспертом из изображений, не содержащих текстовых меток. Эти изображения являются входом АЛ. Для остальных алгоритмов неинформативные входные данные могут быть заданы экспертом или создаются непосредственно алгоритмами вышележащих уровней путем обработки 7npNoise модулем ОАИ. Полученные данные служат для расчета вероятностей событий Gs, Gs , GR ,

~Оя , Dz , ДГ.

Основным показателем эффективности функционирования МОАИ на неинформативных изображениях является вероятность Рш события «тексто-

вая метка на изображении не найдена». ДВХ НИ наглядно демонстрирует, что это событие есть сумма событий, соответствующих листьям ДВХ НИ, за исключением вершины, символизирующей наступле-

ние события 0г0Я08:

Рш = Р(ЯОв) + Р(Оа) +

+Р(~яОв) + Р{О2ОкО,).

Вероятность распознавания ложной ТМ:

PN = Р (Бгёяё3 ).

(5)

(6)

Степень важности показателей Рш и р определяется соотношением числа информативных и неинформативных изображений, поступающих на вход МОАИ СРТМ в режиме реальной работы. Чем меньше это соотношение, тем большее количество «ложных тревог» приходится на одну текстовую метку при прочих равных условиях. Основным

средством снижения Р и повышения Рш является совершенствование АР и АПР, в частности использование различного рода априорной информации о текстовых метках.

6. Вычисление характеристики быстродействия МОАИ

Как было указано выше, значимым требованием к МОАИ является его способность функционировать в требуемом режиме быстродействия. Показателем этой способности является задержка времени Т в выдаче результатов распознавания с момента появления изображения. Требования к величине задержки определяется техническими условиями эксплуатации СРТМ.

Пусть задержка времени алгоритма А на некотором входе составляет ТА. Используя тестовые входные данные 1пр, оценивается матожидание М (ТА). Далее под задержкой понимается матожидание задержки, если не сказано иное. Указанным образом рассчитываются задержки АЛ, АС, АР и АПР: М (ТЬ), М (Т), М (ТЯ), М (ТО) для информативных данных и М(Т'1), М(Т£), М(ТЯ), М(ТО) -

для неинформативных.

Если каждый алгоритм МОАИ функционирует вне зависимости от результатов вышележащих алгоритмов, то время обработки одного изображения можно рассчитать как сумму задержек всех алгоритмов:

Т = М (Т) + М Т) + М (тя ) + М (то ),

т' = мт) + мт) + м(тя) + м(то) .

Обычно такая логика функционирования алгоритмов применяется в реальных СРТМ только совместно с АПР высокого уровня, производящего принятие решений с использованием исторической информации и (или) нескольких источников изо-

(8)

бражений одного и того же объекта. АПР высокого уровня использует даже неполную информацию (недостаточно распознанных символов для формирования ТМ) при принятии решений. Рассмотрение таких конфигураций СРТМ выходит за рамки данной статьи.

В конфигурации СРТМ без АПР высокого уровня МОАИ прекращает обработку изображения при наступлении событий , ёЯ и выдает решение об отсутствии текстовой метки. В таких случаях нижележащие алгоритмы не вносят свой вклад в задержку Т. Использование ДВХ позволяет более точно оценить Т с учетом вероятностей указанных событий:

т = М (Т) + М Т) +

+М (тя )*(Р(ё,Ь) + Р(ё,Ь)) + (7)

+М (то ) * (Р(ёяБЬ) + Р(ёя SL) + Р(ёяё£ Ь)).

Для неинформативных изображений имеет место следующая зависимость:

т ' = М (Т) + М (Т')+

+М (тя)* Р(ё') + М (то)* р(ояо' ).

Также важной характеристикой любого алгоритма МОАИ является максимальная задержка. Для расчета максимальной задержки всего МОАИ следует вместо матожидания подставить в приведенные выше формулы (7-8) максимальные задержки АЛ, АС, АР и АПР.

Зависимости 7-8 позволяют оценивать задержки Т и Т' при конфигурировании МОАИ без проведения тестирования эффективности МОАИ, ограничиваясь вычислением характеристик того алгоритма, который подвергся изменениям.

Заключение

Процесс разработки и настройки алгоритмов МОАИ, как правило, длителен и трудоемок. Он определяется поиском компромисса между характеристиками производительности модуля и вероятностями ошибок распознавания первого и второго рода. Вследствие этого настройка МОАИ заключается в тестировании эффективности множества его конфигураций. Проводить такое тестирование при каждом изменении алгоритмов или их настроек неэффективно из-за больших затрат времени. Для решения этой проблемы предложено использовать установленную в статье функциональную зависимость эффективности МОАИ от эффективности составных частей модуля - алгоритмов локализации, сегментации, распознавания и принятия решений. Эффективность каждого алгоритма, как правило, известна, а если неизвестна, то ее расчет значительно менее ресурсоемок, чем тестирование эффективности всего МОАИ.

В контексте функционирования МОАИ СРТМ процесс обработки данных предлагается представить последовательностью событий вида X = «алгоритм

дал правильный (неправильный) ответ», а также некоторых специальных событий. Все возможные последовательности таких событий образуют двоичное дерево - дерево вероятностных характеристик.

Поскольку МОАИ СРТМ может работать как с информативными (содержащими образ ТМ), так и с неинформативными (не содержащими образ ТМ) изображениями, то предлагается использовать, соответственно, два ДВХ. ДВХ позволяют оценить эффективность МОАИ в целом, используя при этом вероятностные характеристики отдельных алгоритмов. В статье предложен метод, позволяющий, используя ДВХ, оценить вероятность правильного распознавания ТМ Риф1, вероятность ошибки первого

рода Рш и второго рода Регг, а также характеристики распознавания неинформативных изображений: вероятность правильного распознавания Рк и неправильного распознавания Рш .

Также предложен способ расчета характеристик производительности МОАИ с использованием ДВХ. Выведены зависимости, позволяющие оценивать задержки времени для информативных и неинформативных изображений на основе задержек отдельных алгоритмов и их вероятностных характеристик.

Важным для процесса разработки МОАИ является то, что ДВХ позволяют наглядно представить структуру процесса обработки изображения и визуально отобразить влияние эффективности алгоритмов модуля на промежуточные и конечные результаты.

Использование предложенного метода позволяет отказаться от непосредственного тестирования эффективности МОАИ при каждом изменении, что значительно сокращает длительность разработки и настройки модуля ОАИ и, как следствие, всей системы распознавания. Разработчику достаточно протестировать модернизированный им алгоритм и подставить полученные характеристики в приведенные формулы, чтобы оценить влияние изменений на эффективность МОАИ СРТМ.

Литература

1. Балыков, Е.А. Разработка и обеспечение качества программных средств обработки и анализа изображений / Е.А. Балыков, В.А. Царев - М.: Компания Спут-ник+, 2006. - 178 с.

2. Tsarev, Vladimir A. Basic principles of vehicles optoelectronic identification system development / Vladimir A. Tsarev // Pattern Recognition and Image Analysis, 2005. -Vol. 15, N 2. - P. 454-457. -ISSN 1054-6618.

3. Voskresensky, E.M. Text label recognition systems efficiency management using localization and segmentation algorithms output likelihood / Evgeny M. Voskresensky, Vladimir A. Tsarev. // 8th International Conference «Pattern Recognition and Image Analysis: New Information Technologies» (PRIA-8-2007): Conference Proceedings. 2007. - Vol. 8, N3. - P. 57-61. - ISSN 1054-6618.

4. Царев, В.А. Оптоэлектронные системы идентификации движущихся транспортных средств: назначение, состав, особенности проектирования и программной реализации / В.А. Царев, Е.А. Балыков, А.Е. Михайлов // Научно-технические ведомости СПбГПУ, 2005. - №3. - С. 40-48.

i Надоели баннеры? Вы всегда можете отключить рекламу.