Научная статья на тему 'Предобработка изображений в сканцентре'

Предобработка изображений в сканцентре Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Предобработка изображений в сканцентре»

где f(x,k) - степень принадлежности объекта х е X к кластеру к е К по отношению ко всем другим кластерам. На основе аппарата нечеткой логики сформулированы условия минимизации целевой функции

b(f)= £ £f"(x,k).d2(x,k),

хеХ

где d(x,k) - евклидова функция расстояния от центра прямоугольника.

Компьютерное моделирование задачи показывает, что время распознавания объектов прямоугольной формы оказывается на один порядок меньше, нежели распознавание с помощью известных классических методов, которые ориентируются, в основном на гладкие графические объекты в виде круга, эллипса, параболы или гиперболы.

УДК 681.3.01

Ю. М. Вишняков, А. Цур, А. Н. Толкачев ПРЕДОБРАБОТКА ИЗОБРАЖЕНИЙ В СКАНЦЕНТРЕ

С самого начала зарождения области безбумажных технологий был поставлен вопрос перевода информации с бумажных носителей в электронный вид. И в настоящее время эта проблема не потеряла своей актуальности, а с развитием новых информационных технологий лишь расширила свои границы. Если раньше в качестве актуальной задачи стояла задача распознавания текста хотя бы при простейшем его написании, то сейчас задача ставится более глобально. Многие фирмы, специализирующиеся в области OCR-систем, большое внимание уделяют процессу предобработки изображений. Связано это в первую очередь с широким кругом предметных областей, где применяются OCR-системы. В качестве примера можно указать такие задачи, как обработка периодических изданий (газет, журналов), учебно-методической литературы, архивов документов, библиотек изданий, имеющих определенную историческую ценность. Проблемы, которые необходимо решать при этом, связаны, как правило, с потерей качества бумажных документов. Это различная зашумленность, блеклость текста, потеря необходимой цветовой гаммы. Все эти проблемы порой приходится решать при потоковой обработке в автоматическом или полуавтоматическом режиме.

В рамках созданного при виртуальной лаборатории ELDIC Южно-Российского центра сканерных технологий в настоящее время ведутся работы по созданию офисного программного обеспечения, специализированного на проблемах перевода бумажной информации в компьютерные форматы. Одним из пунктов в этой работе предусмотрена подсистема предобработки изображений. Программное обеспечение подсистемы реализуется в диалоговом режиме, когда пользователь, наблюдая за результатами ввода и улучшения качества текстов и выбирая необходимые методы их обработки, может получить приемлемые по качеству изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.