Научная статья на тему 'ЦИФРОВАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ СЛАБОКОНТРАСТНЫХ ДОКУМЕНТОВ'

ЦИФРОВАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ СЛАБОКОНТРАСТНЫХ ДОКУМЕНТОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
27
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ ФИЛЬТРАЦИЯ / УГАСАЮЩИЙ ДОКУМЕНТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Котов Владислав Викторович, Котова Наталья Александровна

Предложен метод обработки слабоконтрастных изображений текстовых документов, обеспечивающий фильтрацию аддитивных шумов без существенного искажения границ символов. Разработано программное обеспечение, реализующее предложенный метод.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Котов Владислав Викторович, Котова Наталья Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIGITAL IMAGE FILTERING OF LOW CONTRAST DOCUMENTS

A method for processing low-contrast images of dying text documents is proposed. It provides filtering of additive noise without significantly distorting the boundaries of characters. Software has been developed that implements the proposed method.

Текст научной работы на тему «ЦИФРОВАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ СЛАБОКОНТРАСТНЫХ ДОКУМЕНТОВ»

УДК 681.3

DOI: 10.24412/2071-6168-2021-9-269-271

ЦИФРОВАЯ ФИЛЬТРАЦИЯ ИЗОБРАЖЕНИЙ СЛАБОКОНТРАСТНЫХ

ДОКУМЕНТОВ

В.В. Котов, НА. Котова

Предложен метод обработки слабоконтрастных изображений текстовых документов, обеспечивающий фильтрацию аддитивных шумов без существенного искажения границ символов. Разработано программное обеспечение, реализующее предложенный метод.

Ключевые слова: цифровая фильтрация, угасающий документ.

Задача фильтрации слабоконтрастных изображений возникает в случаях цифровой обработки сканов угасающих документов, текст в которых из-за неудовлетворительных условий хранения оказывается слабочитаемым. Изначально подобные документы представляют собой рукописный или печатный текст на бумажном носителе, выполненный красителем определённого цвета. Однако с течением времени под влиянием неблагоприятных факторов внешней среды возникают дефекты, проявляющиеся в изменении окраски бумаги (пожелтении, появлении пятен и т.п.) и выцветании красителей текста. Количественно процессы угасания документа проявляются в снижении контраста между яркостями фона и текста, неравномерном по пространству листа [1].

Несмотря на то, что число точек, относящихся к тексту, существенно меньше числа фоновых точек, при малых размерах апертуры и наличии в ограниченной ею локальной области изображения одновременно фона и текста, гистограммы имеют бимодальный характер с парой экстремумов, соответствующих яркости фона и яркости текста в той же области.

Прямые процедуры повышения контраста (линейное контрастирование, препарирование, выравнивание гистограмм [2] и т.п.) оказываются неэффективными ввиду того, что с одной стороны, разность между яркостями фона и текста весьма невелика, и требует тщательного выбора параметров контрастирующей кривой, а с другой - абсолютные значения яркостей фона и текста могут существенно изменяться в пределах изображения документа вследствие неравномерности старения.

Более эффективной оказывается предварительная цветовая сегментация изображения на основе задаваемых человеком образцов фона и текста, с последующим контрастированием выделенных областей. Однако из-за частичного перекрытия гистограмм яркости фона и текста некоторые фрагменты изображения интерпретируются некорректно, что приводит к появлению в результирующем изображении ложных объектов или исчезновению настоящих.

Анализ структуры описываемых документов позволяет выделить некоторые основные их особенности. В частности, фрагменты текста имеют высокий уровень пространственной локализации, т.е. сконцентрированы в определенных пространственных областях. Это вытекает из структуры текста, который в большинстве случаев представляет собой совокупность графических примитивов (линия, окружность), достаточно малой, по сравнению с размерами всего документа величины. Поэтому при обнаружении точки, соответствующей текстовой области, вероятность того, что и окружающие ее точки также относятся к тексту, достаточно велика, и быстро падает достаточно при увеличении расстояния между точками. Для точек фона аналогичная вероятность уменьшается с увеличением расстояния существенно медленнее, поскольку фон имеет малую степень пространственной локализации.

Кроме того, между точками текста и фона, находящимися на малых расстояниях обычно имеется достаточный контраст, который и позволяет человеку отличать их друг от друга. На больших расстояниях, контраст может значительно падать в связи с общими изменениями цвета бумаги в пределах документа.

Рассмотренные обстоятельства позволили предложить процедуру предварительной фильтрации подобных изображений, осуществляющую локальное усреднение точек изображения с помощью скользящей апертуры. Особенностью метода является включение в апертуру лишь точек, близких не только пространственно, но и сходных по цветовому оттенку. Формально это можно представить следующим образом.

269

Известия ТулГУ. Технические науки. 2021. Вып. 9

Изображение I представляет собой матрицу пикселей \Рху! | \РХу ], каждый из которых представляет собой трёхкомпонентный вектор Р*,, Р^, элементы которого характеризуют красную, зелёную и синюю составляющие (х, у) -ой точки изображения соответствен-

но.

Точка Р результирующего изображения, обработанного предлагаемым фильтром, имеет следующий вид:

X РХу *,Ь • ^ (хс, ус, Х, у ) • жс (Рхсус , Рху ) рг,*,Ь _ х^у__

хсУс

Z Ws (, yc, x, y )-Wc (рХсУс , PXy)

x, y

где xcyc - координаты центра апертуры, по которой формируется текущий пиксель; Ws (.) -весовая функция, определяющая пространственную (space) близость пары точек; Wc (.) - весовая функция, определяющая близость цветовых оттенков (color) пары точек. Вид весовых функций может быть различным. Например, в этом качестве можно использовать гауссиан W(...) = exp(-aD(.,.)),где D(...) определяет расстояние:

D (xc, Ус , x, y) = ((x - xc )2 +(y - Ус )2 )/ ; D (Pxcyc , Pxy ) = ■ Л1/2

(PL -Pr

1 xy

*сус

\2 1 \2 ) +(Pxy -Pg

) \ xy xcy

r+( Py - )

а - масштабирующий коэффициент, определяющий, какие расстояния будут считаться достаточно близкими.

Физический смысл весовых функций таков: если текущая анализируемая точка оказывается близка к центру апертуры в пространстве и по яркости/цветовому оттенку, обе оконные функции оказываются близкими к единице, в результате соответствующая цветовая составляющая Р внесёт существенный вклад в формирование результата Рх у . Если текущая точка

ХУ хсУс

оказывается слишком удалённой от центра апертуры в пространстве, или она существенно отличается от неё по яркости, одна или обе весовые функции оказываются близкими к нулю, и, таким образом, данная точка не оказывает никакого влияния на формирование результата.

Подобный подход позволяет усреднить яркости фона и текста без размывания границ текста. С точки зрения цветовой сегментации рассмотренный фильтр уменьшает дисперсию яркостей фона и текста и, как следствие, повышает эффективность последующей цветовой сегментации документов рассматриваемого класса.

0,15 0,1 0,05

о

Текст -

f

Ф

Фон

Яркость

Яркость

150

170

190

210

150

170

190

210

Гистограммы яркости отфильтрованного изображения

На рисунке приведены гистограммы пары областей слабоконтрастного изображения до и после обработки по предложенной методике. Левая гистограмма соответствует области, включающей пиксели фона и текста. Правая гистограмма соответствует области, включающей пиксели только фона. Как видно из рисунка, ширина участков гистограмм, соответствующих фоновой области и области текста снизилась, улучшилось разделение текста и фона. Для области 2, содержащей лишь фоновые пиксели, среднеквадратическое отклонение яркости уменьшилась с 4,2 до 2,3 после фильтрации (при 256 градациях яркости каждой цветовой компоненты обрабатывавшегося изображения). К предварительно обработанному таким образом документу можно более эффективно применять обычные методы увеличения контраста, например, цветовую сегментацию.

Список литературы

1. Разработка методов восстановления угасающих хроматических (цветных) текстов архивных документов с использованием цифровых компьютерных технологий: методические рекомендации. М: Росархив, ВНИИДАД, 2014. 58 с.

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005.

1072 с.

Котов Владислав Викторович, д-р техн. наук, профессор, vkotov@list.ru, Россия, Тула, Тульский государственный университет,

Котова Наталья Александровна, канд. техн. наук, доцент, nkotova@inbox.ru, Россия, Тула, Тульский государственный университет

DIGITAL IMAGE FILTERING OF LOW CONTRAST DOCUMENTS V.V. Kotov, N.A. Kotova

A method for processing low-contrast images of dying text documents is proposed. It provides filtering of additive noise without significantly distorting the boundaries of characters. Software has been developed that implements the proposed method.

Key words: digital filtering, dying document.

Kotov Vladislav Viktorovich, doctor of technical science, professor, vkotov@list.ru, Russia, Tula, Tula State University,

Kotova Natalia Aleksandrovna, candidate of technical science, docent, nkotova@inbox.ru, Russia, Tula, Tula State University

УДК 004.94:69

АНАЛИТИЧЕСКИЙ МЕТОД ИССЛЕДОВАНИЯ АЭРОДИНАМИКИ ЗДАНИЯ С ПОМОЩЬЮ ПРОГРАММНЫХ СРЕДСТВ

А.Р. Газаров

Приводятся результаты компьютерного моделирования аэродинамики сооружения с использованием программного комплекса Ansys. Проведен анализ полученных данных и сделаны выводы о возможности применения математического моделирования для решения задач, связанных с аэродинамикой в строительной сфере.

Ключевые слова: математическое моделирование, конечные элементы, скорость, давление, аэродинамика, анализ.

Строительные технологии не стоят на месте и все новые решения, ранее считавшимися несостоятельными начинают применяться на практике. Одной из таких технологий являются фасады высотных зданий, отличающиеся наличием выступов (рис. 1). Такие фасады позволяют улучшить акустический комфорт в здании, а также улучшить аэродинамику сооружения за счет снижения числа вихрей, создаваемых ветром [1]. Однако стоит заметить, что в любом случае для высотного здания требуется значительный по глубине фундамент.

В данной работе будет проведена оценка аэродинамики подобного здания, а также выявлена возможность исследования подобных конструкций с помощью компьютерных программ. Для этого была проведена трехмерная симуляция движения воздуха, который движется на лицевую часть здания (на фасад) со скоростью 18,5 м/с. Данная скорость ветра относится к очень крепкому, а по шкале Бофорта численно определяется цифрой 8. Во многих областях, скорость ветра не поднимается выше отметки 9 по шкале Ботфорта, поэтому моделирование при скорости ветра, заявленной выше, является оптимальным.

271

i Надоели баннеры? Вы всегда можете отключить рекламу.