Научная статья на тему 'Гистограммный подход для сегментации разнонаправленных рукописных строк текстовых документов'

Гистограммный подход для сегментации разнонаправленных рукописных строк текстовых документов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
102
38
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лазарев Д.С., Фаворская М.Н.

Рассматриваются проблемы, возникающие при сегментации рукописного текста на графическом изображении. Предлагаются рекомендации по решению этих проблем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Гистограммный подход для сегментации разнонаправленных рукописных строк текстовых документов»

Секция «Информационнее системы и технологии»

2. Обеспечить пользователю возможность просмотра результатов работы системы (как окончательных, так и промежуточных), а также возможность визуализации нейронной сети.

3. Разработать справочную систему и обеспечить модули справочной информацией.

4. Провести работу по всестороннему тестированию программы.

На текущем этапе исследований разработана библиотека классов и компонентов, а также пользовательское приложение, позволяющее обучать нейронные сети с послойной архитектурой и проводить тестирование созданной сети. Вид главного окна разработанной программной системы показан на рисунке.

Разработанный программный продукт был успешно протестирован путем решения задач аппроксимации ряда функций одной и нескольких переменных, а

также апробирован на практической задаче моделирования вибрационных характеристик турбины.

Полученные результаты позволяют сделать заключение о полной работоспособности данного продукта, что позволяет его рекомендовать к практическому использованию широким кругом прикладных специалистов с целью автоматизации сложного и плохо формализуемого процесса синтеза искусственных нейронных сетей.

Библиографическая ссылка

1. Истомина Ю. А. Анализ пакетов нейросетево-го моделирования // Решетневские чтения : материалы XVМеждунар. науч. конф. ; СибГАУ. Красноярск, 2011. Ч. 2. С. 615.

© Истомина Ю. А., 2012

УДК 004.9

Д. С. Лазарев Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ГИСТОГРАММНЫЙ ПОДХОД ДЛЯ СЕГМЕНТАЦИИ РАЗНОНАПРАВЛЕННЫХ РУКОПИСНЫХ СТРОК ТЕКСТОВЫХ ДОКУМЕНТОВ

Рассматриваются проблемы, возникающие при сегментации рукописного текста на графическом изображении. Предлагаются рекомендации по решению этих проблем.

Качественная сегментация изображений документов в системах распознавания рукописного текста является обязательным предварительным этапом.

В зависимости от качества отсканированного изображения и почерка человека текст на изображении может изменяться от строго горизонтального (что почти не встречается на практике) до разнонаправленного. В данном случае обработке и распознаванию подвергаются архивные документы. Все документы различаются по степени освещенности, четкости, зашумленности и т. д., что существенно затрудняет задачу сегментации. Обработка изображения текстового документа перед его непосредственным распознаванием делится на несколько этапов: бинаризация, морфологические методы расширения и сжатия и сегментацию изображения [1]. Экспериментальные исследования подтверждают тот факт, что предварительная обработка значительно повышает качество сегментации.

Существует множество подходов к сегментации изображения. Авторы Tsuruoka, S., Adachi, Y., Yoshi-kawa, T предлагают использовать алгоритм прореживания, основанный на построении областей произвольной формы, содержащих связный текст [2]. Алгоритм получает границу такой области шириной, не превышающей один пиксель. Другой подход предложен авторами Bin Zhang Sargur, N. Srihari и заключается в сегментации изображения с текстом на отдельные слова, выделяемые на основе многомерного вектора признаков [3]. Существует также гистограммный подход к сегментации изображения. В этом случае в зависимости от яркости пикселей строятся вертикальная и горизонтальная гистограммы (такой метод подходит для

черно-белых изображений). На пересечении пиков этих гистограмм выделяются области с текстом. При решении поставленной задачи будет использоваться последний подход к сегментации изображения.

Анализ архивного документа говорит о нетривиальном построении корректной гистограммы по яркости из-за разнонаправленности рукописного текста. В данной работе предлагается разбивать изображение на прямоугольные области определенных заранее размеров, после чего производить сегментацию для каждой из этих областей, предварительно подвергнув их выравниванию по горизонтали относительно содержания. Подобная обработка значительно понизит влияние помех, связанных с разнонаправленностью текста, и будет способствовать корректному выделению и выравниванию рукописных слов.

Библиографические ссылки

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера, 2005. 1072 с.

2. Tsuruoka, S., Adachi, Y., Yoshikawa, T. (poster-051 -tsuruoka.pdf) The segmentation of a text line for a handwritten unconstrained document using thining algorithm // Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition, 2000. P. 505-510.

3. Sargur Bin Zhang , Srihari N. Analysis of Handwriting Individuality Using Word Features // 7th International Conference on Document Analysis and Recognition, Edinburgh, 2003. Р. 1142-1146.

© Лазарев Д. С., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.