Научная статья на тему 'Специализированная система распознавания сканов документов'

Специализированная система распознавания сканов документов Текст научной статьи по специальности «Компьютерные и информационные науки»

219
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
распознавание / шум изображения / выравнивание изображения / нормализация изображений / выделение объектов на изображении / сверточная нейронная сеть / обучающая выборка.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — И.А. Малахов

В представленной работе рассматривается проблема автоматического распознавание текста на базе нейронных сетей в документах организации. В основе распознавания лежат символьные шаблоны, на которых осуществляется предварительное обучение нейронной сети. В работе приводятся и обсуждаются результаты экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — И.А. Малахов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Специализированная система распознавания сканов документов»

1. P. Chen, X. Bai and W. Liu, Vehicle Color Recognition on an Urban Road by Feature Context, IEEE Transactions on Intelligent Transportation Systems (TITS), 2014, Issue: 99, pp: 1-7.

2. X. Wu and V. Kumar. The Top Ten Algorithms in Data Mining. Chapman & Hall/CRC, 2009.

3. Домасев М. В., Гнатюк С. П. Цвет. Управление цветом, цветовые расчеты и измерения. - СПб.: Питер-Пресс, 209. - 219 с.

СПЕЦИАЛИЗИРОВАННАЯ СИСТЕМА РАСПОЗНАВАНИЯ

СКАНОВ ДОКУМЕНТОВ

И.А. Малахов

Научный руководитель: Ю.М. Вишняков Кубанский государственный университет ул. Ставропольская 149, 350040, Краснодар, Россия

Ключевые слова: распознавание, шум изображения, выравнивание изображения, нормализация изображений, выделение объектов на изображении, сверточная нейронная сеть, обучающая выборка.

Аннотация

В представленной работе рассматривается проблема автоматического распознавание текста на базе нейронных сетей в документах организации. В основе распознавания лежат символьные шаблоны, на которых осуществляется предварительное обучение нейронной сети. В работе приводятся и обсуждаются результаты экспериментов.

Сегодня распознавание текстов на имиджах документов является важной частью работы практически любого специализированного учреждения. Существует много коммерческих программ по распознаванию документов, но качество распознавания зачастую у них не высокое, вследствие чего в результатах присутствуют ошибки. Однако организации очень важно, чтобы системы обеспечивали качественное распознавание документов и показывали хорошие результаты при потоковой обработке.

Рассмотрим некоторые особенности в распознавании

текстов на имиджах. Поступающее на вход системы изображение должно быть свободным от различных помех и должно иметь хорошее качество. Разрабатывать универсальную программу для всего многообразия документов не имеет смысла, поскольку все возникающие нюансы, возникающие при обработке конкретного вида документов, учесть практически невозможно и тогда лучше разработать систему, направленную на конкретные виды документов. Универсальные системы распознавания функционируют по собственным алгоритмам, которые приходится настраивать под определенный тип документа, и это занимает много времени. Поэтому был предложен и разработана собственная специализированная система распознавания.

В обсуждаемой системе изображение символа подвергается полной обработке с целью его сравнивания с предложенными шаблонами. При этом осуществляется подбор характеристик, параметров и их систематизация в согласовании с имеющимися в системе критериями. Для достижения лучших результатов по качеству распознавания текстов в системе предусматривается повышение качества изображения с возможностью обучения, существо которых рассматривается подробно в предлагаемой статье.

При распознавании возможна ситуация, когда изображение повернуто под определенным углом. Из-за этого качество распознанного текста, возможно, будет плохим. В работе [1] предлагается решать данную проблему при помощи алгоритма поиска угла поворота и коррекции угла наклона изображения.

Существует также ряд других факторов, препятствующих качественному распознаванию, они достаточно полно освещаются в работе [2]. Например, это фотографии с низким качеством виду плохих условий съемки, засвеченные сканером участки на документах, блики от ламинированных документов и другие факторы, вызывающие дефекты и деформации в изображении документа. Это приводит к неверному или неполному распознавания текста. Данные факторы устраняются путем использования различных фильтров на этапе предварительной обработки изображения, такой обработкой не стоит пренебрегать.

Настоящая работа направлена на разработку

специализированной программной системы, направленной на качественное распознавание текстов имиджей документов. Данная цель достигается за счет дополнительной обработки имиджа и повышения его качества, использования сверточной нейронной сети и ее предварительным обучением на шаблонах, в основу чего положены результаты работы [3]. Предлагаемые решения ориентированы на конкретную задачу, а именно, на распознавание паспортов и другие документы конкретной организации.

Процесс обработки состоит в следующем. Вначале осуществляется удаление лишнего фона на фотографии и коррекции наклона, в системе это выполняется предварительным модулем обработки изображения. Конечный результат представляет собой набор аппроксимаций и выполняется путем вычисления дескрипторов Фурье для распознаваемой области.

После данных видов обработки имидж документа разбивается на сегменты и выбирается область распознавания, над которой с целью улучшения качества изображения выполняется фильтрация различными фильтрами.

В системе распознавания каждый модуль ищет необходимые поля для заполнения декларации, такие как: серия, номер, кем выдан паспорт, дата выдачи, код подразделения, Ф.И.О., дата рождения, место рождения. Подстраховкой достоверности полученного результата является проверка машиночитаемым кодом, включающая в себя сопоставление с ним результатов работы всех модулей.

Область с машиночитаемым кодом разбивается на два блока. Первый блок содержит Ф.И.О., а второй блок - серию, номер, год рождения, пол, дату выдачи и код подразделения паспорта. Если области с распознанным ранее текстом имеют неудовлетворительные результаты или не содержат информацию в каждом из блоков, то происходит замена результата на информацию из распознанного машиночитаемого кода. Для дальнейшего применения важно полученный результат раскодировать, при этом необходимо иметь в виду, что дата рождения и дата выдачи написана в обратном порядке (год, месяц, число). Поэтому происходит изменение данных на правильный порядок (число, месяц, год).

Распознавание происходит в два этапа. Сначала делается попытка распознать каждое слово по очереди, каждое из них передается классификатору в качестве обучающих данных. Благодаря чему адаптивный классификатор может более точно распознавать текст, который находится на странице. Чтобы сделать распознавание более точным, вторая итерация следует за первой. В этой ситуации слова, которые не были хорошо распознаны, повторно обрабатываются. Последний этап удаляет случайные попавшие пробелы и находит текст, написанный маленькими буквами.

Ниже на рисунках 1 и 2 представлен пример обработки конкретного паспорта на всех этапах распознавания.

Рисунок 1. Первый этап распознавания

Как это видно из рисунка 1, поступившее изображение (1) проходит фильтрацию и выравнивание по углу наклона, для него выполняется обрезка лишней области (2) и выполняется разбивка на два изображения (3). Далее результат обработки (3) является входом для следующего этапа, что показано на рисунке 2.

Рисунок 2. Второй этап распознавания

Из рисунка 2 видно, что проводится разбивка изображений по категориям данных, которые далее будут отправлены на параллельную обработку по своим функциональным модулям.

Укрупненный алгоритм работы системы распознавания в виде блок-схемы приведен на рисунке 3.

Рисунок 3. Блок-схема работы программы

Особого пояснения работа алгоритма не требует, поскольку каждый блок поименован своим функционалом.

Распознанный текст системой распознавания вставляется в шаблон (формуляр) и является завершающим этапом ее работы. Пример данного формуляра показан на рисунке 4.

Кем^ вадан^ ^ОТДЕД^УФМС РОССИИ ПО КРАСНОДАРСКОМУ КРАЮ

Рисунок 4. Формуляр распознанного документа

Для отладки была создана обучающая выборка, проведены обучение и точная настройка системы. В настоящее время система распознавания используется в организации и на ней обработано порядка 1000 имиджей реальных документов.

Система распознавания полностью работоспособна и показывает хорошие результаты.

Библиографический список

1. Charles C. Tappert, Ching Y. Suen, and Toru Wakahara, \The State of the Art in On-Line Handwriting Recognition," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 12, No. 8, Aug. 1990, pp. 787-808.

2. T.L. Dimond, \Devices for Reading Handwritten Characters," Proc. of Eastern Joint Computer Conference, December 1957, pp. 232-237.

3. Малахов И.А., Богданов М.О, "Прикладная математика XXI века: современные проблемы математики, информатики и моделирования", "Распознавание символов на изображениях", 2019. - С. 3-4.

ГИБРИДНЫЙ АЛГОРИТМ РЕШЕНИЯ КВАДРАТИЧНОЙ

ЗАДАЧИ О НАЗНАЧЕНИЯХ

Е.А. Нигодин

Кубанский государственный университет ул. Ставропольская 149, 350040, г. Краснодар, Россия

Ключевые слова: квадратичная задача о назначениях, гибридный алгоритм, генетический алгоритм, эвристический подход, эволюционный алгоритм, алгоритм оптимизации сорной травой.

Аннотация

Данная работа посвящена решению квадратичной задачи о назначениях с помощью гибридного алгоритма, использующего как принципы генетического, так и эволюционного алгоритма, проведению сравнительного анализа эффективности работы полученного алгоритма.

Генетические и эволюционные относится к классу эвристических алгоритмов и является весьма актуальным и известным направлением в области оптимизации и моделирования [1].

Цель работы состоит в создании эвристического гибридного алгоритма решения квадратичной задачи о назначениях, использующего принципы генетического алгоритма, и элементы эволюционного алгоритма, проведение экспериментальных исследований.

Есть множество п предприятий, которые могут быть

i Надоели баннеры? Вы всегда можете отключить рекламу.