Научная статья на тему 'Алгоритм выделения текстовых символов на изображении'

Алгоритм выделения текстовых символов на изображении Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
268
37
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чабан Л.С.

Рассматривается вопрос выделения текстовых символов на изображении для дальнейшего их распознавания. Приводится алгоритм нахождения индексов границ текстовых символов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM OF HIGHLIGHTING TEXT SYMBOLS IN PICTURES

I try to get answer on question of highlighting text symbols in pictures for further recognition. there is an algorithm of finding verge indexes of text symbols.

Текст научной работы на тему «Алгоритм выделения текстовых символов на изображении»

Решетневские чтения

УДК 004.932.2

Л. С. Чабан

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

АЛГОРИТМ ВЫДЕЛЕНИЯ ТЕКСТОВЫХ СИМВОЛОВ НА ИЗОБРАЖЕНИИ

Рассматривается вопрос выделения текстовых символов на изображении для дальнейшего их распознавания. Приводится алгоритм нахождения индексов границ текстовых символов.

Для распознавания текста необходимо выделять отдельные текстовые символы. Данная задача актуальна в различных областях: при анализе телевизионных трансляций, поиске информации в медиабазах, административном обслуживании в банках и страховых компаниях и т. д. Целью работы является изучение и модификация алгоритма выделения отдельных символов на изображении.

Для выделения отдельных символов изначально необходимо произвести сегментацию словосочетаний на слова. Существует большое разнообразие алгоритмов, решающих данную задачу, однако, в большинстве алгоритмов для улучшения качества работы выполняются преобразования входного изображения: порогового фильтра для снижения уровня шума, фильтра повышения контрастности и размазывающего фильтра.

Конечной целью работы данного этапа алгоритма является нахождение индексов столбцов-границ между символами. Входом для алгоритма сегментации символов служит изображение какого-либо слова. Для выделения текстовых символов необходимо определить среднюю яркость изображения слова. Общая схема алгоритма со-

стоит из двух частей: необходимо определить все индексы столбцов, соответствующие локальным минимумам средней яркости столбцов, выявить и удалить из этого списка индексов ложные границы символов.

Поиск локальных минимумов средней яркости столбцов происходит на смежных интервалах изменения индекса столбца. Размер интервала выбирается исходя из высоты строки. Далее проводится удаление ложных межсимвольных границ -его необходимо проводить в несколько этапов. В результате из списка индексов локальных минимумов удаляются индексы столбцов, средняя яркость которых не удовлетворяет условию, формируется второй список индексов-кандидатов в межсимвольные границы. Затем выявляются связи между столбцами пикселей. На этом шаге алгоритма сегментации анализируется связность изображений символов, и убираются из списка ложные границы, которые разрезают символ на части. В результате из списка индексов-кандидатов удаляются индексы столбцов, имеющие связь с соседями слева и справа, формируется конечный список индексов границ.

L. S. Chaban

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

ALGORITHM OF HIGHLIGHTING TEXT SYMBOLS IN PICTURES

The answer on the question of highlighting text symbols in pictures for further recognition is considered. There is an algorithm offinding verge indexes of text symbols in the article.

© Чабан Л. С., 2009

i Надоели баннеры? Вы всегда можете отключить рекламу.