Научная статья на тему 'Структура программного продукта для сегментации рукописного текста в архивных документах'

Структура программного продукта для сегментации рукописного текста в архивных документах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
9
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лазарев Д.С.

Предлагаются рекомендации к проектированию программного обеспечения, предназначенного для сегментации рукописного текста в архивных документах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE SOFTWARE STRUCTURE FOR HANDWRITTEN TEXT SEGMENTATION IN ARCHIVE DOCUMENTS

There are recommendations to engineering software for handwritten text segmentation in archive documents.

Текст научной работы на тему «Структура программного продукта для сегментации рукописного текста в архивных документах»

Информационные системы и технологии

3. Красильников Н. Н., Красильникова О. И. Исследование погрешностей определения координаты глубины при 3Б-сканировании методом, основанном на диффузном отражении света // Обраб. информ. и упр. 2012. № 3. С. 2-8.

4. Красильников Н. Н., Красильникова О. И. Определение координаты глубины по 2D-изображению // Опт. журн. 2011. Т. 78. № 12. С. 30-33.

V. A. Kuznetcov

Saint-Petersburg state University of Aerospace Instrumentation, Russia, Saint Petersburg 3D SCANNING BASED ON DIFFUSE REFLECTION

The results of investigation of errors caused by the quantization of images, fluctuation noise and features of scanned surface are represented. A method and proposed optimal parameters of scanning algorithm are described.

© Кузнецов В. А., 2012

УДК 004.352.243

Д. С. Лазарев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

СТРУКТУРА ПРОГРАММНОГО ПРОДУКТА ДЛЯ СЕГМЕНТАЦИИ РУКОПИСНОГО ТЕКСТА В АРХИВНЫХ ДОКУМЕНТАХ

Предлагаются рекомендации к проектированию программного обеспечения, предназначенного для сегментации рукописного текста в архивных документах.

Качественное распознавание рукописного текста в архивных документах часто может быть затруднено тем, что строки имеют отклонение от горизонтального положения. Такое отклонение препятствует точному выделению строки из массива текста. Автором было разработано программное обеспечение, предназначенное для сегментации рукописного текста в архивных документах.

В первую очередь изображение с текстом должно быть подвергнуто предварительной обработке, позволяющей впоследствии наиболее точно произвести выделение строк.

К этапам предварительной обработки изображений с текстом относятся бинаризация, построение скелета изображения, выделение границ, а также морфологическое расширение и сжатие [1-3]. Каждому действию соответствует отдельный модуль, выполняющий специфические функции.

Для каждого модуля предусматриваются возможности детальной настройки обработки (порога бинаризации, ширины маски и пр.).

Включение модулей в обработку должно происходить в следующем порядке: бинаризация, очистка от шумов, построение скелета, морфологические преобразования.

5. Красильников Н. Н., Красильникова О. И. Получение трехмерного изображения объекта путем измерения интенсивности диффузного отражения света различными точками его поверхности // Опт. журн. 2010. Т. 77. № 6. С. 19-24.

6. Яне Б. Цифровая обработка изображений. М. : Техносфера, 2007.

После поэтапной обработки всеми необходимыми модулями изображение готово к сегментации на строки. На этом этапе предлагается задействовать модуль, отвечающий за горизонтальное выравнивание строк. Для решения этой задачи прямоугольные фрагменты изображения, содержащие текст, подвергаются конечному числу поворотов на малый угол. После каждого поворота строится гистограмма яркости, и по ее рисунку принимается решение, является ли текущее положение наиболее близким к горизонтальному. Преобразованное таким образом изображение будет подготовлено к выделению отдельных слов и их дальнейшему распознаванию.

Библиографические ссылки

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М. : Техносфера, 2005.

2. Горошкин А. Н. Обработка изображений в системах распознавания рукописного текста // Цифровая обработка сигналов и ее применение : материалы 10-й Междунар. конф. М., 2008. С. 489-491.

3. Котович Н. В., Славин О. А. Распознавание скелетных образов [Электронный ресурс]. URL: http://ocrai.narod.ru/skeletrecognize.html (дата обращения: 20.09.2012).

Решетневскце чтения

D. S. Lasarev

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

THE SOFTWARE STRUCTURE FOR HANDWRITTEN TEXT SEGMENTATION

IN ARCHIVE DOCUMENTS

There are recommendations to engineering software for handwritten text segmentation in archive documents.

© Лазарев Д. С., 2012

УДК 004.65

М. А. Лаптева, К. М. Болдырев

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ХРАНИЛИЩА ДАННЫХ: ОСНОВНЫЕ АРХИТЕКТУРЫ И ПРИНЦИПЫ ПОСТРОЕНИЯ

Рассмотрены основные архитектуры хранилищ данных и некоторые общие принципы их построения. Выделены преимущества и недостатки виртуальных хранилищ данных и двухуровневой архитектуры данных.

В начале 80-х гг. прошлого века возникло понимание ограниченности применения регистрирующих систем для анализа данных и построения на их основе систем поддержки и принятия решений. Регистрирующие системы создавались для автоматизации рутинных операций по ведению бизнеса: выписки счетов, оформления договоров, проверки состояния склада и т. д. Основными требованиями к таким системам были обеспечение транзакционности вносимых изменений и максимизация скорости их выполнения. Именно эти требования и определили выбор реляционных систем управления базами данных (СУБД) и модели представления данных «сущность-связь» в качестве основных технических решений при построении регистрирующих систем.

Информация в регистрирующей системе актуальна только на момент обращения к базе данных, однако в следующий момент по тому же запросу можно получить уже совершенно иной результат. Интерфейс регистрирующих систем рассчитан на проведение жестко определенных операций, а получение результатов на нерегламентированный запрос сильно ограничено. Возможность обработки больших массивов данных также мала из-за настройки СУБД на выполнение коротких транзакций и неизбежного замедления работы остальных пользователей.

Ответом на возникшую потребность стало появление новой технологии организации баз данных - технологии хранилищ данных, в основе которой лежат две основные идеи: интеграция разъединенных детализированных данных (детализированных в том смысле, что они описывают некоторые конкретные факты, свойства, события и т. д.) в едином хранилище и разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа.

Хранилище данных - это предметно-ориентированная, интегрированная, содержащая исторические данные, не разрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений. Виртуальное хранилище данных -это система, представляющая интерфейсы и методы доступа к регистрирующей системе, которые эмулируют работу с данными в этой системе как с хранилищем данных. Виртуальное хранилище данных можно организовать, создав ряд представлений (view) в базе данных (БД) или применив специальные средства доступа, например продукты класса Desktop OLAP [1].

Главными достоинствами такого подхода являются простота и малая стоимость реализации, единая платформа с источником информации, отсутствие сетевых соединений между источником информации и хранилища данных.

Однако у этого подхода существуют и определенные недостатки: при проектировании виртуального хранилища данных создается не хранилище как таковое, а иллюзия его существования; структура хранения данных и само хранение данных не претерпевают изменений и остаются проблемы производительности, трансформации данных, интеграции данных с другими источниками, отсутствия истории, чистоты данных, зависимости от структуры и доступности основной БД.

Двухуровневая архитектура хранилища данных подразумевает построение витрин данных (data mart) без создания центрального хранилища, при этом информация поступает из небольшого количества регистрирующих систем и ограничена конкретной предметной областью [2]. При построении витрин данных используются основные принципы построения хранилищ данных, поэтому их можно считать хранилищами

i Надоели баннеры? Вы всегда можете отключить рекламу.