Научная статья на тему 'Программный комплекс для распознавания монтажной технической документации'

Программный комплекс для распознавания монтажной технической документации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
81
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНИЧЕСКАЯ ДОКУМЕНТАЦИЯ / РАСПОЗНАВАНИЕ / ЭЛЕКТРОННЫЙ ДОКУМЕНТООБОРОТ / АЛГОРИТМ / ЛСА / TECHNICAL DOCUMENTATION / RECOGNITION / ELECTRONIC DOCUMENT MANAGEMENT SYSTEM / LSA ALGORITHM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Матушев А.А.

Рассмотрена проблема использования и хранения старой бумажной документации. Проанализированы средства распознавания документов. Предложено улучшение программы для распознавания монтажных карточек. Описаны модули программного комплекса, в том числе модуль распознавания структур монтажных документов. Представлен алгоритм для распознавания структур монтажной документации табличного типа с помощью логических схем алгоритмов (ЛСА). Приведена структурная схема разрабатываемого программного комплекса.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOFTWARE PACKAGE FOR RECOGNITION OF ASSEMBLING TECHNICAL DOCUMENTATION

The article covers the problem of using and storage of old paper documentation. It analyzes the measures for documents recognition. It also suggests an improvement of the program for recognizing assembling cards. The article describes the software modules, including module for recognition of assembling structures documents. An algorithm for pattern recognition of assembling documentation of tabular type using logic diagram algorithms (LSA) is presented. There is also the block diagram of the software package under development.

Текст научной работы на тему «Программный комплекс для распознавания монтажной технической документации»

Общетехнические задачи и пути их решения

105

УДК 004.896 А. А. Матушев

Петербургский государственный университет путей сообщения Императора Александра I

ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ РАСПОЗНАВАНИЯ МОНТАЖНОЙ ТЕХНИЧЕСКОЙ ДОКУМЕНТАЦИИ

Рассмотрена проблема использования и хранения старой бумажной документации. Проанализированы средства распознавания документов. Предложено улучшение программы для распознавания монтажных карточек. Описаны модули программного комплекса, в том числе модуль распознавания структур монтажных документов. Представлен алгоритм для распознавания структур монтажной документации табличного типа с помощью логических схем алгоритмов (ЛСА). Приведена структурная схема разрабатываемого программного комплекса.

техническая документация, распознавание, электронный документооборот, алгоритм, ЛСА.

Введение

На железнодорожных дистанциях сигнализации, централизации и блокировки внедрены автоматизированные рабочие места АРМ-ВТД. С помощью данных программных комплексов организован электронный документооборот. Согласно распоряжению № 1299р от 10 июня 2013 г. вся новая документация должна поступать в электронном виде, однако в архивах имеются большие объемы старой бумажной технической документации, большей частью - монтажные схемы.

При модернизации систем автоматики и телемеханики, а также для решения задач эксплуатации приходится пользоваться старыми схемами, часто плохого качества. В настоящее время старая документация вручную переводится в электронный вид. Такой перевод занимает много времени (одна монтажная схема - около 30 мин.), при этом допускается много ошибок.

Для сокращения времени перевода и снижения трудозатрат предлагается автоматизировать процесс перевода документации с помощью специальных программ. Сегодня на рынке действуют две наиболее эффективные программы для распознавания документов:

Fine Reader (разработка фирмы ABBYY) и Cuneiform (Cognitive Technologies). Эксперименты с данными программами показали, что они не справляются с распознаванием сложной железнодорожной технической документации. Программа Fine Reader распознает в среднем 5 %, а Cuneiform - 2 % монтажной схемы. Для распознавания железнодорожной монтажной технической документации предлагается разработать более специализированный программный комплекс.

1 Постановка задачи распознавания

монтажной документации

Одним из решений задачи распознавания текста является применение искусственных нейронных сетей. В диссертации «Синтез объектной нейросетевой модели распознавания образов и ее применение в задачах железнодорожной автоматики» Д. В. Зуева [1] предложено использовать сверточную нейронную сеть для распознавания монтажной технической документации. Данная сеть показала высокую эффективность работы с монтажными карточками, однако монтажная техническая документация весьма разнообразна.

ISSN 1815-588Х. Известия ПГУПС

2015/1

106

Общетехнические задачи и пути их решения

Помимо монтажных карточек имеются другие виды документации: схемы лицевых панелей стативов и релейных шкафов, нижних и верхних клеммных панелей, нештепсельных полок и пр. Всю монтажную документацию можно условно разделить на два типа: к первому относятся документы, в которых данные представлены преимущественно в табличной форме (рис. 1); ко второму - остальные монтажные схемы (рис. 2).

В работе Д. В. Зуева рассмотрено распознавание монтажных карточек ЖАТ, т. е. документов первого типа. Вопрос распознавания клеммных и лицевых панелей, монтажа нештепселных полок и других документов второго типа остается открытым. Автор данной статьи предлагает методы распознавания монтажных документов схематического типа, а также методы повышения качества распознавания монтажной документации табличного типа.

а

б

& 7 е

rtrl 1АЧД гЫ X0WT 16ЧД rid ко нт

f 7- 1 1 й-1 G-H 1 т-вг

7 4i г 51 г ч-чг

i и 5 k 1 к

k Ъ к ъ h ъ

\г 11 17

и М И 7-1

и 11 11 17S-S1

n п п

г! г\ /77-гз Z4

гз гъ (Ч Ч-Ч 71

Рис. 1. Примеры монтажных схем табличного типа: а) лицевая панель статива; б) монтажная карточка

а

Рис. 2. Примеры монтажных схем схематического типа: а) клеммные панели; б) панели предохранителей

2015/1

Proceedings of Petersburg Transport University

Общетехнические задачи и пути их решения

107

2 Описание программного комплекса для распознавания монтажной технической документации

Автор предлагает адаптировать работу нейронной сети для решения задач распознавания всех типов монтажной документации. Для этого следует использовать программный модуль распознавания структуры монтажной схемы. Распознавание структуры позволит выделять базовые элементы различных монтажных схем. Примером базового элемента

для табличных монтажных схем служит ячейка таблицы. На рис. 3 представлен базовый алгоритм поиска ячеек таблицы. На языке логических схем алгоритмов [2, с. 60] данный алгоритм будет выглядеть так:

AP1 ^ Pi Р3 ^3 Р4 t4 Р5 ^5 B ^5

С W ^ ^ p6 t6 Г Dq1 t7 q2 t8Г Г V4 V5 q3 t9 O V q4 t10 q5 t11 Г E^t12 ;8 q6 t13 q7 t14V3 E2«t15,

Начало

Рис. 3. Алгоритм распознавания документов табличного типа

ISSN 1815-588Х. Известия ПГУПС

2015/1

108

Общетехнические задачи и пути их решения

где A - оператор поиска черных пикселей на изображении; B - оператор, создающий новый тип ячеек; C - оператор записи ячейки в общий массив и массив однотипных ячеек; D - оператор выбора ячейки из общего массива ячеек; Ех, Е2 - операторы, создающие ячейку с высотой вышестоящей (Е3) или нижестоящей (Е2) ячейки и с длиной текущей ячейки; O - оператор остановки и выдачи результатов; p - условие, проверяющее, является ли найденный пиксель черным; p , p3, p4 - условия, проверяющее возможность образования углов; p5 - условие, проверяющее, относится ли ячейка к известным типам; p6 - условие, проверяющее, закончен ли поиск пикселей; q - условие, проверяющее наличие ячейки выше текущей; q2 - условие, проверяющее наличие ячейки ниже текущей; q3 - условие, проверяющее, является ли текущая ячейка последней; q4, q5 - условия, проверяющие наличие ячеек сверху слева (q4) и справа (q5) от текущей; q6, q7 - условия, проверяющие наличие ячеек снизу слева (q6) и справа (q7) от текущей.

Данный алгоритм показал высокую эффективность распознавания структур таблиц. На данный момент ведется разработка алгоритма для распознавания схематических документов.

После завершения распознавания документа полученные данные необходимо представить в отраслевом формате. Модуль распознавания структур зафиксирует местонахождение всех найденных базовых элементов. Базовые элементы в свою очередь распознает нейронная сеть. Нейронная сеть, дополненная модулем распознавания структур, дает более точные результаты благодаря тому, что нейронная сеть работает непосредственно с текстом ячеек, зная конкретный адрес и тип ячейки, а не со всей монтажной карточкой сразу. Введение модуля распознавания структуры монтажной схемы позволит распознавать документы схе-магического типа и повысит качество распознавания документов табличного типа.

Для исключения ошибок, связанных с неверным распознаванием структур монтаж-

ных документов, предлагается ввести модуль предобработки изображения. Под предобработкой понимается выравнивание таблиц, удаление «шумов» и дорисовка недостающих элементов, если таковые имеются. Предобработка позволит повысить качество распознавания структур документов.

В ходе экспериментов по распознаванию монтажных схем на старых, грязных или рваных документах автор выяснил, что на таких документах имеются перечеркнутые, исправленные и поврежденные символы, из-за которых программа выдает ложные результаты. Такие символы зачастую даже человек разбирает с трудом. Для повышения количества распознанных символов предлагается использовать модуль логического анализа. Логический анализ разработан на основе принципов построения монтажной документации, базы марок различных используемых приборов и альбомов для проектирования различных систем. Получив на выходе распознанный документ, программа проанализирует и в случае несоответствия заданным требованиям исправит его.

Предлагаемый программный комплекс включает набор модулей:

1) предобработки изображения;

2) определения структуры документа и выделения базовых элементов;

3) распознавания полученных данных;

4) логического анализа;

5) просмотра, редактирования и сохранения документа.

Структурная схема программного комплекса представлена на рис. 4.

Заключение

Применение полученного программного комплекса позволит существенно сократить время перевода документов в электронный вид и ускорит переход дистанций сигнализации, централизации и блокировки на электронную безбумажную технологию ведения технической документации.

2015/1

Proceedings of Petersburg Transport University

Общетехнические задачи и пути их решения

109

Рис. 4. Структура программного комплекса

Библиографический список

1. Синтез объектной нейросетевой модели распознавания образов и ее применение в задачах железнодорожной автоматики : дис. ... канд.

техн. наук : 05.13.18 / Д. В. Зуев. - СПб. : Санкт-Петербург. гос. ун-т путей сообщения, 2013.

2. Синтез управляющих автоматов / В. Г. Лазарев, Е. И. Пийль. - 3-е изд., перераб. и доп. - М. : Энергоатомиздат, 1989. - 328 с.

УДК 624.19:699.874:331.451 А. М.Сазонова

Петербургский государственный университет путей сообщения Императора Александра I

ОСОБЕННОСТИ ОХРАНЫ ТРУДА ПРИ РАБОТАХ НА ПОДЗЕМНЫХ ОБЪЕКТАХ

В современном мире из-за высокой степени урбанизации, быстрого роста количества транспортных средств, дефицита территории большинство крупных городов мира активно использует подземное пространство, однако подземным работам свойственны специфические вредные производственные факторы. В статье рассматриваются вредные факторы, действующие на работников подземных объектов. Описано действие на организм человека биологических агентов, мелкодисперсной пыли, гипогеомагнитного поля земли, аэроионного состава воздуха, избытка двуокиси углерода. Приведен анализ результатов исследования подземных объектов города Санкт-Петербурга, текущего состояния условий труда, даны рекомендации по их улучшению.

подземный объект, охрана труда, вредные производственные факторы, микромицеты, PM-частицы, гипогеомагнитное поле, аэроионы, углерода диоксид.

Введение

Подземные сооружения стали неотъемлемой частью крупного города. Все чаще они используются для различных нужд населения.

Комплексная застройка подземного пространства мегаполиса позволяет рационально использовать наземные территории, содействует упорядочению транспортного обслуживания жителей и повышению безопасности дорож-

ISSN 1815-588Х. Известия ПГУПС

2015/1

i Надоели баннеры? Вы всегда можете отключить рекламу.