Научная статья на тему 'Методика распознавания рукописного текста в оффлайн-режиме'

Методика распознавания рукописного текста в оффлайн-режиме Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
656
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ ОБРАБОТКА ДАННЫХ / СИСТЕМЫ РАСПОЗНАВАНИЯ / РАСПОЗНАВАНИЕ ОБРАЗОВ / РАСПОЗНАВАНИЕ РУКОПИСНОГО ТЕКСТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Святская Лада Олеговна

В статье рассматривается методика распознавания рукописного текста в оффлайн-режиме. Поскольку множество программных решений, широко представленных на рынке, не решают поставленной задачи в полной мере, разработка системы, позволяющей распознавать рукописные символы, остается актуальной задачей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика распознавания рукописного текста в оффлайн-режиме»

Литература

1. Микроканальные воздушные конденсаторы. [Электронный ресурс]. Режим доступа: http://aqua-therm.ru/news/news_1374.html/ (дата обращения: 08.12.2016).

2. Крупененков Н. Ф., Филатов А. С. Повышение энергоэффективности холодильных установок с помощью применения конденсаторов с каналами малых размеров // Мат-лы VII Международной научно-технической конференции «Низкотемпературные и пищевые технологии в XXI веке». Санкт-Петербург, 17-20 ноября 2015 г. Часть 1. С. 157-158.

3. Danfoss microchannel heat exchangers. Product brochure. [Electronic resource]. Режим доступа: www.danfoss.com/ (date of access: 08.12.2016).

4. Aluminium microchannel heat exchangers. Product brochure. Climetal S. A. [Electronic resource]. Режим доступа: www.climetal.com/ (date of access: 08.12.2016).

5. Микроканальные теплообменники Danfoss // Журнал Холодильная техника, 2011. № 8. С. 37-38.

6. Курылев Е. С., Оносовский В. В., Румянцев Ю. Д. Холодильные установки. 2-е изд., стереотип. СПб.: Политехника, 2002. С. 576.

Методика распознавания рукописного текста в оффлайн-режиме

Святская Л. О.

Святская Лада Олеговна / Svyatskaya Lada Olegovna — соискатель степени магистра, кафедра информатики и программного обеспечения вычислительных систем, факультет микроприборов и технической кибернетики, Московский институт электронной техники, г. Москва

Аннотация: в статье рассматривается методика распознавания рукописного текста в оффлайн-режиме. Поскольку множество программных решений, широко представленных на рынке, не решают поставленной задачи в полной мере, разработка системы, позволяющей распознавать рукописные символы, остается актуальной задачей.

Ключевые слова: цифровая обработка данных, системы распознавания, распознавание образов, распознавание рукописного текста.

Цифровая обработка изображений приобретает в настоящее время большое значение во многих областях деятельности человека. Теория распознавания изображений применяется в вычислительных машинах, в многоэтапной сортировке и анализе, в поисковых системах и системах распознавания гендерных и возрастных признаков [2].

В настоящее время сканирование и сохранение в памяти компьютера текста с твердого носителя является решенной задачей. Это существенно облегчает задачу хранения рукописных и печатных текстов и предоставления доступа к ним различных пользователей. Однако полученный в результате сканирования текст хранится в памяти компьютера в виде изображения, что делает работу с ним весьма сложной: затруднено ориентирование, практически невозможны редактирование, форматирование и поиск по тексту. Для решения этих задач необходимо провести процесс распознавания текста на изображении с созданием файла в том или ином текстовом формате.

Иногда перед владельцем персонального компьютера возникает довольно сложная по своим особенностям задача - перевести рукописный текст в цифровой формат в оффлайн-режиме. Конечно, можно выполнить эту работу и вручную. Однако такой метод актуален только при условии, что объем информации незначительный. В противном случае, поставленная задача является трудноосуществимой.

Таким образом, разработка методики распознавания рукописного текста, позволяющей значительно упростить работу по вводу информации, является актуальной задачей для множества пользователей.

В общем виде систему распознавания рукописных данных можно представить в виде трех подсистем: подсистемы извлечения признаков, подсистемы распознавания и подсистемы принятия решения, к какому классу относится данный объект.

Извлечение признаков - это преобразование входных объектов к единообразному, компактному и удобному виду с потерей подавляющей части содержащейся в объекте информации, слабо влияющей на классификацию. Способ извлечения признаков зависит от природы и исходной кодировки объектов и подбирается вручную.

Подсистема распознавания представляет собой алгоритм, разбивающий пространство признаков на части, соответствующие заданным классам.

Разработка системы ввода текста, ее тестирование и отладка невозможна без создания базы данных символов. База символов - одна из основных частей системы распознавания рукописных текстов. Представление символов в такой базе зависит от способа распознавания рукописного образа. Интерпретацией вычисленных вероятностей занимается отдельная от распознавания процедура принятия решений.

Операция обработки рукописного текста производится в две стадии. На первом этапе производится приведение исходного изображения к универсальному векторному виду. Для этого необходимо выполнить следующие преобразования, приводящие к инвариантному представлению данных:

- приведение изображения к серой шкале;

- приведение изображения к черно-белому виду;

- анализ и удаление шумов на изображении;

- скелетизация черно-белого изображения;

- векторизация изображения.

На этом же этапе решается задача сегментации вводимого рукописного текста на основе структурного подхода [3], который предполагает описание сложных объектов с помощью более простых подобъектов.

В качестве подзадачи выступает разработка методики обработки изображения, а именно -определение интересующей (рабочей) области. В качестве рабочей области выступают строки, которые затем необходимо разбить на слова. В силу высокой корреляции форм почерка множества людей, трудоемкой задачей является разбиение слов на буквы.

Целью второго этапа является классификация изображения. Задача классификации состоит в указании принадлежности входного образа одному из предварительно определенных классов, то есть, сравнение векторного представления (описания) введенного рукописного символа с векторным представлением (описанием) символа-эталона в базе данных.

В настоящее время наибольших успехов удалось добиться в распознавании зрительных образов, таких как печатные символы. Не вызывает сомнений полезность известных программ распознавания текстовой информации - FineReader и CuneiForm [4]. Распознавание символов по их графическому представлению - одна из самых старых и традиционных задач искусственного интеллекта.

Разработка системы, позволяющей распознавать рукописные символы, остается актуальной задачей. Множество программных решений, широко представленных на рынке, не решают поставленной задачи в полной мере. Если рукописный текст и удается распознать, то распознаванию сопутствует множество ошибок и неточностей. Более того, большая часть существующих программ являются платными, что затрудняет их использование.

Системы распознавания текста могут быть применены в областях, где требуется обработка большого количества рукописных документов (заполненные бланки, анкеты), - например, в государственных учреждениях.

Литература

1. Boser B. E., Guyon I. M., Vapnik V. N. A training algorithm for optimal margin classifiers, in Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory. P. 144-152. ACM Press, 1992.

2. Борисова И. А. Методы решения задач распознавания образов комбинированного типа: дис. на соискание ученой степени канд. тех. наук. Новосибирск, 2008. 121 с.

3. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // Машиностроение - 2008: Сборник трудов научно-технической конференции. М.: МГТУ им. Н. Э. Баумана, 2008. С. 152-154.

4. [Электронный ресурс]: Режим доступа: https://www.abbyy.com/ru-ru/finereader/ (дата обращения: 10.10.2016).

i Надоели баннеры? Вы всегда можете отключить рекламу.