Научная статья на тему 'ПОБУДОВА АЛГОРИТМУ АНАЛіЗУ РУКОПИСНОГО ТЕКСТУ'

ПОБУДОВА АЛГОРИТМУ АНАЛіЗУ РУКОПИСНОГО ТЕКСТУ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
190
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РУКОПИСНИЙ ТЕКСТ / ONLINE МЕТОД / OFFLINE МЕТОД / РОЗПіЗНАННЯ РУКОПИСНОГО ТЕКСТУ / РУКОПИСНЫЙ ТЕКСТ / РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА / IRC / HANDWRITING / ONLINE METHOD / OFFLINE METHOD / HANDWRITING RECOGNITION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зарубенко О. О.

Проведен общий анализ работы двух подходов распознавания рукописного текста и на базе анализа созданы два соответствующих алгоритма для получения верного результата на основе оффлайнового метода анализа текста. Приведена результативность распознавания данного типа текста на текущий момент. Представлено общее заключение по работе двух алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithm analysis development of handwriting

Two algorithms that allow to recognize handwriting are shown in the article. These approaches are considered the most relevant off-line recognition, which is based on the handwriting recognition from scan image of profiles, agreements, statements and other documents. Development is done to promote recognition not only in document flow, but also in the field of artificial intelligence that surrounds subsequently able to analyze a human-written text. It was found that both the description algorithm can give us positive feedback for recognition. With the result of more than 90 % of the work on pattern recognition, at least one of the approaches will be fully achieved its investigation aim and will only improve the knowledge base, which is then able to provide for artificial intelligence an opportunity to learn through books and letters improving the percentage of recognition.

Текст научной работы на тему «ПОБУДОВА АЛГОРИТМУ АНАЛіЗУ РУКОПИСНОГО ТЕКСТУ»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ УПРАВЛЕНИЯ

ISSN 222Б-3780

Козловский Валерий Валериевич, доктор технических наук, профессор, заведующий кафедрой систем защиты информации, Национальный авиационный университет, Киев, Украина. Мищенко Андрей Витальевич, кандидат технических наук, профессор кафедры систем защиты информации, Национальный авиационный университет, Киев, Украина. Снижко Вячеслав Владимирович, аспирант, кафедра систем защиты информации, Национальный авиационный университет, Киев, Украина.

Kozlovskyi Valerii, National Aviation University, Kyiv, Ukraine, e-mail: vvk@zeos.net.

Mishchenko Andrii, National Aviation University, Kyiv, Ukraine, e-mail: vvk@zeos.net.

Snizhko Viacheslav, National Aviation University, Kyiv, Ukraine, e-mail: bb c@ukr.net

УДК 519.86:519.612 DOI: 10.15587/2312-8372.2014.31877

Зарубенко о. о. ПОБУДОВА АЛГОРИТМУ АНАЛ1ЗУ

рукописного тексту

Проведено загальний аналгз роботи двох тдходгв розтзнавання рукописного тексту та на базг аналгзу створено два в1дпов1дних алгоритмы для отримання в1рного результату на основг оффлайнового методу аналгза тексту. Наведено результативтсть розтзнавання даного типу тексту на поточний момент. Представлено загальний висновок по роботг двох алгоритмгв.

Илпчов1 слова: рукописний текст, online метод, offline метод, розтзнання рукописного тексту, IRC.

1. Вступ

При оформленш анкет, докуменпв та шших дшових паперiв в рiзних компатях в основному використовуеться макет документу, в який заповнювач вносить потрiбнi дат вручну (рукописним/рукодрукованим текстом). Для ефек-тивного використання ще1 шформацп дат потрiбно занести до бази даних. Це можна зробити двома способами: або вручну користувачем, або автоматично програмою. Швид-юсть роботи користувача по занесенню даних залежить вщ його квалiфiкацii у робоп з базами даних, швидкосп набору, можливосп проаналiзувати (розтзнати) написане заповнювачем, що свщчить про залежшсть бшьше вщ атрибупв користувача, тж вщ можливостей програмного забезпечення. А при робот з системою автоматичного розпiзнання тексту i його аналiзу, користувачевi потрiбно лише сканувати потрiбний документ i звiряти вихiднi данi з даними на документу коригуючи 'iх при необхщност!

На поточний момент найбшьш актуальною можна вважати проблему розтзнавання рукописного тексту. Для таких текспв досягнута точшсть розпiзнавання суттево нижча, шж для рукодрукованого тексту. Бшьш високi показники можуть бути досягнут тiльки з ви-користанням контекстно'i та граматично'i iнформацi'i. Наприклад, в процес розпiзнання шукати цiлi слова в словнику легше, нiж намагатися проаналiзувати окремi символи з тексту. Знання граматики мови може також до-помогти визначити, чи е слово дiесловом або iменником. Форми окремих рукописних символiв iнодi можуть не мштити достатньо iнформацii, щоб точно (бiльше 98 %) розтзнати весь рукописний текст. Це вщбуваеться, тому що люди мають рiзний почерк, що навiть для людини вiн iнодi е складним для розшзнант (наприклад, почерк лiкарiв в рецептах та медичних книжках).

Точшсть роботи методiв може бути вимiряна кшькома способами i тому може сильно вартватися. Примiром,

якщо зустрiчаeться спецiалiзоване слово «бетономшал-ка», яке не використовуеться для вщповщного про-грамного забезпечення медичного закладу, при пошуку некнуючих слiв, помилка може збшьшитися.

2. Анал1з лгсературних даних i постановка проблеми

На даний час поточним станом технологш розтз-нання оптичного тексту е доволi точне розтзнавання символiв у друкованому тексп (майже 100 %), у руко-друкованому (80-90 %), у рукописному (60-70 %) при чiткому зображенш, отриманому, наприклад, за допо-могою сканування документiв. Точнiсть розпiзнавання зображення останнього дуже низька, оскшьки почерк шдивщуальний для кожно1 людини i технологiя начала дослiджуватися в XXI вщ [1-9]. Якiсть розпiзнавання такого зображення може бути пщвищенна тшьки шляхом подальшого редагування людиною або внесення строгих форм заповнення тексту. Тобто загальна точшсть розтзнання вщсканованого зображення буде вартватися вiд 70 до 80 %, що не е добре адже ми будемо мати з десяток помилок на сторщщ. Тобто така технолопя може бути корисна лише у дуже обмеженому чи^ додатюв.

Розпгзнавання символгв online iнодi плутають з оптичним розтзнаванням символiв. Але таке розтзнання часто залежить вщ зчитування руху курсора по екрану, де програма аналiзуе рух i виводить символ. Наприклад, у засобах online розтзнавання, розроблених для OS PenPoint та планшетного ПК (на даний час — для системи Android) для бшьш зручного вводу шформацп за допомогою сть луса, можна визначити, з якого боку пишеться рядок: справа налiво або злiва направо. Offline метод — працюе зi статично! формою подання тексту [10, 11].

Online системи для розтзнавання рукописного тексту остантм часом стали широко вiдомi в якосп комерцшних

28 ТЕХНОЛОГИЧЕСКИЙ АУДИТ И РЕЗЕРВЫ ПРОИЗВОДСТВА — № 6/4(20], 2014, © Зарубенко О. О.

ISSN 222Б-3780

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ УПРАВЛЕНИЯ

J

продуктiв. Алгоритми таких пристро'!в використовують той факт, що порядок, швидкiсть i напрямок окремих дшянок лiнiй введення вiдомi. ^iM того, користувач навчиться використовувати пльки конкретнi форми листа. Цi методи не можуть бути використаш у програм-ному забезпеченнi, яке використовуе сканованi паперов1 документи, оскiльки ми зштовхуемося з зображенням, яке е статичне i потребуе розпiзнання, а online методи направленш на розтзнання динамiчного вводу даних i розтзнання тексту вщбуваеться за рахунок зчитування руху стилуса/курсора на екраш.

3. Щль та задач1 дослщження

Метою роботи е виршення проблеми розтзнавання рукописного тексту та створення системи, яка б наглядно вiдображала роботу алгоритму розтзнавання бшьше нiж на 90 %.

Для досягнення поставлено! мети необхщно:

1. Ознайомитися з даною предметною областю.

2. Розбити задачу на етапи. Створити алгоритм.

3. Рухатись по алгоритму виршуюшичи задачу.

4. Анал1з рукописного тексту

Перед тим, як створювати методику розтзнання рукописного тексту, потрiбно проаналiзувати саму структуру його побудови. Оскшьки рукописний текст вiдрiзняеться вiд рукодрукованого тим, що лиери в одному словi не е роздiльно написаними, а мають письмовi прив'язки одна до одно'! (рис. 1), то в такому випадку нам по-трiбно аналiзувати слово повнiстю або знаходити лиери та прибирати з'еднання (шшими словами переводити текст до рукодрукованого вигляду).

масив контейнерiв для даних ств (знакiв). Контейнер несе в собi атрибути: номер рядка, зображення слова (знака), W — масив можливих ств, який на момент створення е NULL i змшну типу boolean, що показуе розтзнане слово або нi. Потiм знаходимо знаки припинання i одра-зу 1х розпiзнаемо i вставляемо в потрiбний контейнер з масиву K, значення в масив W. Таким же самим чином розтзнаемо друкований текст за допомогою ORC системи.

Рис. 1. Наглядний приклад вщмши рукописного тексту вщ рукодрукованого

Вiдштовхуючись вiд цього можна сформувати два алгоритми верхнього рiвня роботи методу, а саме «алгоритм розтзнання рукописного тексту без перетво-рення його до рукодрукованого вигляду» або «алгоритм розтзнання рукописного тексту з перетворення його до рукодрукованого вигляду».

5. Алгоритм розтзнання рукописного тексту без перетворення його до рукодрукованого вигляду

Якщо розглядати «алгоритм розтзнання рукописного тексту без перетворення його до рукодрукованого вигляду», то вш буде мати 3 основы етапи: етап вхщно-го зображення, етап розтзнавання рукописного тексту i збереження готового екземпляра (рис. 2).

На першому етат (рис. 2) ми маемо вхщне зображення, що вщскановано за допомогою сканера, на якому знахо-диться потрiбна для розтзнавання шформащя (тип дано! шформацп невщомий). Наступним кроком аналiзуемо зображення i знаходимо рядки з текстом в ньому. Дал1 аналiзуючи рядки, розбиваемо !х на слова i створюемо К —

Рис. 2. Блок-схема алгоритму розтзнавання рукописного тексту без його перетворення до рукодрукованого вигляду

На другому етат (рис. 2) розтзнавання рукописного тексту ми вже не працюемо з зображенням, а лише з ма-сивом К, починаючи з «першого слова» в ньому (маеться на увазi перший нерозтзнаний контейнер масиву К).

TECHNOLOGY AUDiT AND PRODUCTiON RESERVES — № 6/4(20], 2014

29-J

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ УПРАВЛЕНИЯ

ISSN 2226-3780

Спочатку n0Tpi6H0 проаналiзувати зображення в ¿-тому контейнер! тобто знайти там Bei лiтери, яю можливо розтзнати системою. Далi використовуючи послщовтсть цих лiтр знайти слова, що мають таку ж послiдовнiсть лир i занести ïx в масив W, якщо ж нiчого не знайдено, то просто в текст виведеться зображення з контейнера. Шсля кроку з розтзнанням слiв маемо вже деяке представлення про вихдт данi. Вид даних на крощ 2.4 (рис. 2) пред-ставляеться користувачевi у виглядi рядкiв з можливими варiантами, якi виносяться з масивiв Wi сформованих на перших двух етапах розтзнавання зображення.

Збереження зображення (рис. 2) повинно бути мож-ливим в форматах, як потрiбнi користувачев! а саме PDF, doc та подiбниx.

6. Алгоритм розтзнання рукописного тексту з перетворення його до рукодрукованого вигляду

«Алгоритм розтзнання рукописного тексту з перетворення його до рукодрукованого вигляду» буде мати чоти-ри етапи (рис. 3): дещо змшений перший з попереднього алгоритму, етап переведення тексту до рукодруковано-го вигляду, етап розтзнавання рукодрукованого тексту i незмшений останнш етап з попереднього алгоритму

Рис. 3. Блок-схема алгоритму резтзнавання рукеписнега тексту з йега перетверення де рукедрукеванега вигляду

Використовуючи другий алгоритм ми будемо вико-ристовувати по суп двi системи: одну — для конвер-тацп рукописного тексту до рукодрукованого вигляду i другу — ICR систему для подальшого перетворення рукодрукованого тексту в цифровий вигляд.

Перший етап даного алгоритму (рис. 3) не потре-буе створення спещальних масивiв даних для слiв, як в попередньому алгоритм! а лише масив рядюв R для роботи просто! обробки даних в ньому i мштитиме в соб1 зображення рядка.

На другому етат (рис. 3) розтзнавання рукописного тексту зводиться до трансформацп тексту в руко-друкований вигляд (пункт 7).

7. Алгоритм трансформацп тексту

Розглянемо ж концепщю «алгоритму трансформацп тексту». Вщмиимо, що вхщним зображенням е рядки рукописного тексту, а вихщним — рукодруковаш лиери.

Для початку потрiбно розглянути, чим же рукописний текст вщр!зняеться вiд рукодрукованого (рис. 1). Оскшьки розробка методики буде зосереджена на оффлайновому рукописному текст! то i пiдхiд до алгоритму трансформацп буде безпосередньо Грунтуватися на вже написано-му вiдсканованому текст! Маючи текст у рукописному вигляд^ слщ зазначити, в першу чергу, поеднання лггер в словах мiж собою. Це поеднання означае, що об'еднаш лiтери входять до одного слова, i !х можна розглядати, як один цтсний запис. Щоб виконати процес трансформацп, потрiбно буде вставити промiжки мiж лиерами в словах (рис. 1, рис. 4), i таким чином перевести слово у наб!р лiтер. Наступним кроком буде змша деяких лиер, як! при рукописному письм! мають шший вигляд, шж у друкованому вигляд!. Такими лиерами е лиери: б, Д, д, Ж, ж, з, И, Й, Р, р, Т. Рукописний вигляд цих лиер дещо вщр!зняються вщ !х «друкованих аналопв», тому вони потребують окремого анал!зу. Пройшовши щ два кроки ми матимемо необхщний нам результат, а саме рукодрукований текст, рядки якого будуть представлен! в масив! R.

Рис. 4. Рездшення сл1в на лиери

На третьому етат даного алгоритму ми вже маемо масив R, що мктить рукодрукований текст. Тепер нам потрiбно цей текст перевести в цифровий вигляд i зберегти. Для цього використовуемо метод розтзнавання друкованого тексту (ORC) та метод розтзнання рукодрукованого тексту (IRC). Зкомпоновуемо отри-маний результат i вщдаемо на звiряння користувачу. Шсля чого, на останньому етат, користувач збернае дат в потрiбнiй для нього форм!

Отже, загальна картина «алгоритм розтзнання рукописного тексту з перетворення його до рукодрукованого виду» буде мати шший вигляд, шж алгоритм без перетворення, де на першому етат ми слвдуемо «алгоритму трансформацп тексту», а на другому но-ве отримане зображення вже обробляемо в ORC та

ТЕХНОЛОГИЧЕСКИЙ АУДИТ И РЕЗЕРВЫ ПРОИЗВОДСТВА — № 6/4(20], 2014

ISSN 222Б-3780

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ УПРАВЛЕНИЯ

IRC системах. Модуль конвертацп тексту до рукодру-кованого вигляду можна представити, як в виглядi ок-ремо! програми, так i у виглядi автоматично! функцп у системi розпiзнавання рукодрукованого тексту, що надасть програмi бiльший дiапазон розтзнання вщсканованого зображення i додасть !й повноти в роботi з оцифровування рукописних текспв.

8. Висновки

1. Розглянуто загальну ситуацп та процент розтз-навання поточними системами рукописного тексту.

2. Предоставлено розгляду два алгоритми аналiзу рукописного тексту.

3. Описано загальну роботу алгоритму розтзнавання рукописного тексту без його переведення до рукодру-кованого вигляду та наведено проблемш ситуацп при робот розтзнавання.

4. Описано загальну роботу алгоритму розтзнавання рукописного тексту з його переведення до рукодру-кованого вигляду та наведено проблемш ситуацп при робот розтзнавання. Наведено приклад трансформацп тексту та його проблемш зони.

Литература

1. Bangyal, W. H. Recognition of Off-line Isolated Handwritten Character Using Counter Propagation Network [Text] / W. H. Bangyal, J. Ahmad, Q. Abbas // International Journal of Engineering and Technology. — 2013. — Vol. 5(2). — P. 227-230. doi:10.7763/ijet.2013.v5.548

2. ABBYY FlexiCapture 10. Руководство системного администратора [Электронный ресурс]. — Abbyy, 2011. — Режим доступа: \www/URL: ftp://ftp.abbyy.com/TechSupport/FC10_Guides/ FlexiCapture%2010%20Admin%20Guide_RU.pdf. — 16.11.2014.

3. ABBYY FlexiCapture. Система потокового ввода данных. Создание машиночитаемых форм [Электронный ресурс]. — Abbyy, 2011. — Режим доступа: \www/URL: ftp://ftp.abbyy.com/ TechSupport/FC10_Guides/FlexiCapture%2010%20Form%20 Creation%20Guide_RU.pdf. — 16.11.2014.

4. Optical Character Recognition [Electronic resourse]. — Available at: \www/URL: http://www.unicode.org/charts/PDF/ U2440.pdf. — 16.11.2014.

5. History of Pen and Gesture Computing: Annotated Bibliography in On-line Character Recognition, Pen Computing, Gesture User Interfaces and Tablet and Touch Computers [Electronic resourse]. — Available at: \www/URL: http://rwservices.no-ip. info:81/pens/biblio85.html#CIC85. — 16.11.2014.

6. Распознавание рукописного текста [Электронный ресурс]. — Abbyy, 2014. — Режим доступа: \www/URL: http://kb.abbyy.ru/ article/1099. — 09.09.2014.

7. Type in many languages with Input Tools [Electronic resourse]. — Available at: \www/URL: https://support.google.com/mail/ answer/139576?hl=en. — 16.11.2014.

8. Annotated Bibliography in On-line Character Recognition, Pen Computing, Gesture User Interfaces and Tablet and Touch Computers [Electronic resourse]. — Available at: \www/URL: http://users.erols.com/rwservices/biblio.html. — 16.11.2014.

9. Методи розтзнавання тексту [Електронний ресурс] / Bira-педiя. — Режим доступу: \www/URL: https://uk.wikipedia. org/wiki/Методи_розпiзнавання_тексту. — 16.11.2014.

10. Handwriting recognition [Electronic resourse] / Wikipedia. — Available at: \www/URL: https://en.wikipedia.org/wiki/ Handwriting_recognition#Off-line_recognition. — 16.11.2014.

11. ABBYY FineReader 12. Языки распознавания [Электронный ресурс] — Abbyy, 2011. — Режим доступа: \www/URL: http://www.abbyy.ru/support/finereader/12/rl/. — 16.11.2014.

построение алгоритма анализа рукописного ТЕКСТА

Проведен общий анализ работы двух подходов распознавания рукописного текста и на базе анализа созданы два соответствующих алгоритма для получения верного результата на основе оффлайнового метода анализа текста. Приведена результативность распознавания данного типа текста на текущий момент. Представлено общее заключение по работе двух алгоритмов.

Ключевые слова: рукописный текст, online метод, offline метод, распознавания рукописного текста, IRC.

Зарубенко Олекст Олексшович, астрант, кафедра тформа-цшних технологш, Кигвська державна академгя водного транспорту ж. гетьмана Петра Конашевича-Сагайдачного, Украгна, e-mail: zarnagaul@gmail.com, alex.zarubenko@yandex.ru.

Зарубенко Алексей Алексеевич, аспирант, кафедра информационных технологий, Киевская государственная академия водного транспорта им. гетьмана Петра Конашевича-Сагайдачного, Украина.

Zarubenko Olexiy, Kyiv State Maritime Academy named after

hetman Petro Konashevych-Sahaydachniy, Ukraine,

e-mail: zarnagaul@gmail.com, alex.zarubenko@yandex.ru

УДК 681.513.52:622.691.4 DOI: 10.15587/2312-8372.2014.32103

фешанич л i експериментальна ощнка

статистичних характеристик

В1БРАЦН ПЕРЕДНЬо! опори НАГН1ТАЧА ГАЗоПЕРЕкАЧУВАЛЬНого АГРЕГАТУ

Представлено аналгз результатгв дослгджень статистичних характеристик вгброперемщення передньог опори нагнтача у системг автоматичного керування газоперекачувальним агрегатом дотискувальног компресорног станцп. Визначено такг характеристики сигналу як математичне спод1вання, дисперсгя, ггстограма, емшрична та теоретична щшьтстьрозподшу, законрозподшу, емшрична та теоретична функцп розподшу.

Ключовi слова: помпаж, вгброперемщення, статистичт характеристики, щшьтсть розподшу, закон розподшу, функцгя розподшу.

1. Вступ агрегатом (ГПА) дотискувально! компресорно! стан-

Задача покращення швидкодп та надшносп кнуючих цп (ДКС) тдземного сховища газу (ПСГ) е актуальною систем автоматичного керування газоперекачувальним тдзадачею загально! проблеми оптимального керування

TECHNOLOGY AUDiT AND PRODUCTiON RESERVES — № 6/4(20], 2014, © Фешанич Л. I. 31 -J

i Надоели баннеры? Вы всегда можете отключить рекламу.