Научная статья на тему 'Проблеме распознавания рукописного текста'

Проблеме распознавания рукописного текста Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1880
274
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РУКОПИСНЫЙ ТЕКСТ / БУКВА / НАПИСАНИЕ / ПОЧЕРК / РАЗБОРЧИВОСТЬ ПОЧЕРКА / РАСПОЗНАВАНИЕ НАПИСАННОГО / ЧТЕНИЕ / HANDWRITING / LETTER WRITING / LEGIBILITY OF HANDWRITING / RECOGNITION OF WRITTEN / READING

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Бреусова Елена Ивановна

В статье поднимается проблема распознавания написанного. Данная проблема находится в кругу актуальных, связанных с созданием общей теории развития систем письменной коммуникации. В работе автор определяет ряд дифференциальных признаков, благодаря которым осуществляется чтение неразборчивого почерка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

To the problem of handwriting recognition

Тhe problem of recognition of written text is raised. This problem is currently associated with the creation of a general theory of development of systems of written communication. A number of distinctive features is identified, through which reading of illegible handwriting is performed.

Текст научной работы на тему «Проблеме распознавания рукописного текста»

УДК 4 ББК 81.1

Е.И. Бреусова

К ПРОБЛЕМЕ РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА

В статье поднимается проблема распознавания написанного. Данная проблема находится в кругу актуальных, связанных с созданием общей теории развития систем письменной коммуникации. В работе автор определяет ряд дифференциальных признаков, благодаря которым осуществляется чтение неразборчивого почерка.

Ключевые слова: рукописный текст, буква, написание, почерк, разборчивость почерка, распознавание написанного, чтение.

E.I. Breusova

TO THE PROBLEM OF HANDwRITING RECOGNITION

^e problem of recognition of written text is raised. This problem is currently associated with the creation of a general theory of development of systems of written communication. A number of distinctive features is identified, through which reading of illegible handwriting is performed.

Key words: handwriting, letter writing, handwriting, legibility of handwriting, recognition of written, reading.

Б.И. Осипов в своей статье «Актуальные проблемы теории и истории письма» обозначает те вопросы, которые еще ждут своего рассмотрения. В числе таковых ученый называет вопрос о создании общей теории развития систем письменной коммуникации, в частности графической составляющей. «Если ставить вопрос уже и говорить только о графике, то необходимо исследование таких вопросов, как вопрос о разборчивости почерков, о пределах варьирования письменных знаков, а также о невербальных средствах письменной коммуникации» [6, с. 19].

Обозначенные проблемы, безусловно, требуют своего решения. Несмотря на то, что печатный текст, конкурируя с рукописным, пытается вытеснить последний, такое все же вряд ли произойдет полностью (во всяком случае, в ближайшие десятилетия). Ни ведение школьных тетрадей, ни письменная фиксация лекционного материала, пусть даже фрагментарно, ни ведение личных дневников, школьных журналов, медицинских карт

и пр. (даже при наличии их электронных версий) не могут полностью изжить себя в рукописной форме. В этой связи, конечно же, остро стоит вопрос о разборчивости почерка, а следовательно, о распознавании написанного1. Исследования в данной области позволят решить широкий круг задач распознавания рукописного текста. Практическое применение результатов этих исследований видится достаточно широким: от распознавания читающим написанного до автоматического чтения рукописных документов и до создания системы автоматического чтения рукописных текстов.

Такая постановка вопроса возникла неслучайно. Это связано, в первую очередь, с тем, что написанное от руки в силу индивидуальных особенностей почерка не всегда легко прочитывается адресатом. Тем более, что в пределах одного и того же почерка (под почерком понимается «определенная манера, способ письма, иначе определенная манера и способ изображения букв и оформления всего текста, определяемые рядом при-

1 При проверке письменных работ обучающихся в отдельных случаях не всегда удается сразу прочитать написанное. Беглость, небрежность, несформированность культуры письма затрудняют процесс понимания рукописного текста.

чин социального характера, часто находящиеся в неопределенной зависимости от орудий труда, культурных традиций и веяний эпохи» [1, с. 49]) начертание буквы, как характерная ее особенность, может варьироваться.

К тому же, если учитывать условное разграничение рукописных текстов - печатных (написанных от руки печатными буквами) и письменных (а письменные характеризуются разной степенью связности), то слитное письмо (письмо с высокой степенью связности) вызывает наибольшие трудности у носителя языка, достаточно часто становясь по-мехообразующим фактором при чтении, поскольку в таком письме вероятна высокая вариативность начертания букв, размытость границ отдельных графических знаков, вплоть до проявления начертательной омонимии. И чем меньше пишущий контролирует каллиграфичность своего почерка, тем больше вероятность написания им неразборчивых букв.

Решая проблему восприятия написанного, требуется определить, за счет чего происходит распознавание рукописного текста.

Как уже было сказано выше, рукописные тексты, как известно, отличаются от печатных проявлениями индивидуальных свойств почерка: от каллиграфически выведенных букв каждого слова в тексте до неразборчиво написанного текста в целом, несмотря на то, что существует эталон написания той или иной буквы, притом этому эталонному написанию обучался в начальной школе каждый пишущий. Но в процессе практики письма у каждого пишущего вырабатываются индивидуальные особенности почерка, которые начинают проявляться уже в 3-4 классах в результате приобретения начертательных умений и навыков, а к 5-6 классам они уже очевидны. У взрослого же письмо представляет собой целый сложный комплекс движений. Такой пишущий осуществляет запись уже не по буквам, а целыми словами. Таким образом, почерк можно характеризовать как совокупность сложных двигательных навыков, обусловленных деятельностью цен-

тральной нервной системы, доведенных до автоматизма.

В этой связи надо отметить, что различают технические навыки (сюда относим посадку человека при письме, расположение бумаги, держание пишущего средства); графические навыки (это воспроизведение письменных знаков и их сочетаний); навыки письменной речи (словарный состав и построение текста, предложений). Совокупность же технических и графических навыков, отображающихся в рукописи, и характеризуют почерк человека.

В целом же, почерку присущи как общие, так и частные признаки. Каждый пишущий под влиянием различных факторов вырабатывает навыки начертаний графических знаков. Это, в свою очередь, проявляется в манере письма - манере исполнения графического знака, которая в своей совокупности особенностей начертания становится неповторимой.

Для сформированного почерка, как показывает практика, свойственны индивидуальность и относительная устойчивость, за счет которой начертательные навыки пишущего характеризуются как стабильные, постоянно проявляющиеся на письме. Такой ряд устойчивых признаков в определенной степени помогает читающему распознать написанное. Именно устойчивость почерка позволяет адресату сформировать зрительный образ букв, что впоследствии дает возможность идентифицировать их в рукописи. Так, устойчивость в определенном смысле является защитой, способствующей узнаванию единиц письма в пределах одного почерка.

А такое свойство, как индивидуальность начертания графических знаков, создает помехи в процессе чтения скорописи. Это свойство, основанное на отличии начертания буквы от эталонного письма, иногда препятствует мгновенному распознаванию читаемого, а также способно создавать графическую омонимию.

Исследования разных областей наук демонстрируют, что «печатный или рукописный текст содержит информацию различных уровней иерархии. Принято связывать эти уровни со структурными

го

I-

о ф

I-

о

X

о ^

с

о

X

го ш го

X

со

о с

о го

Ф

£

О ^

с

го ш о

о >.

ф ^

ш

ш

элементами текста: буквами, словами, предложениями, абзацами и т.п. В процессе восприятия и понимания текста информация с каждого предыдущего уровня поступает на последующий, где она используется для принятия решения и в то же время влияет на работу нижележащих уровней» [3, с. 11]. Этот факт должен свидетельствовать о том, что искажение информации (как следствие неразборчиво написанного знака) на том или ином уровне должно приводить к ошибкам на более высоком уровне иерархии текста. Однако язык, изначально запрограммированный на успех, обладает таким свойством, как избыточность, благодаря которой создаются условия восприятия речи, в том числе и письменной. «Эксперименты физиологов и психологов показывают, что человек может вполне адекватно распознавать текст и понимать его смысл при искажении или отсутствии значительной части информации на одном или нескольких уровнях» [3, с. 11].

На буквенном уровне в этой иерархии можем наблюдать следующее. В словах (как линейной последовательности букв) с разной степенью вероятности могут появляться те или иные графические знаки. Предугадать появление той или иной буквы возможно (этому могут способствовать разные признаки: сочетаемость букв, место расположения и пр.). Так, теорией информации определена частота появления той или иной единицы письма в тексте [5, с. 42], которая несет определенную информацию, притом разные буквы несут разное количество информации: чем реже встречается графический знак в тексте, тем он более информационно насыщен, чем часто встречающиеся буквы. В связи с этим распознавание таких букв происходит быстрее в письменном тексте. Однажды отметив особенности начертания такого графического знака, глаз быстрее узнает его в написанном тексте.

Образ начертания буквы запоминается и за счет увеличения количества регрессий, которое каждый адресат делает при чтении, рецептивном виде речевой деятельности, связанном со

зрительным восприятием речевого сообщения, закодированного с помощью графических символов, т.е. букв (в среднем же оно составляет 10-15 на каждые 100 слов) [2, с. 46].

Начертательная омонимия же при чтении неразборчивого почерка может быть преодолена за счет избыточности языка. Определено, что эта избыточность колеблется в пределах 70-80%. «Это значит, что из 100 букв текста в любом «естественном» языке мира мы можем угадать 70-80 букв, если мы знаем этот язык (хотя и не знаем содержания текста)» [5, с. 39].

Однако человек, владеющий навыками беглого чтения, читает иначе, чем начинающий. Это уже чтение не по буквам и слогам, а чтение скачкообразное: читающий быстро «водит» глазом по строке, притом глаз не движется, а прыгает по строке [4, с. 32]. При таком чтении только часть единиц письма из каждого слова мы воспринимаем отчетливо, изображение другой же части видим приблизительно, а третью часть уже воспринимаем в виде темного пятна [4, с. 32]. В поле зрения человека обычно попадает 10-15 букв за одну фиксацию взгляда [2, с. 42]. В рукописных же текстах процесс чтения затрудняют как раз индивидуальные особенности почерка, в том числе и вариативность написания букв. Лишь незнакомые или неразборчиво написанные слова (или несколько слов подряд) носитель языка будет читать побуквен-но, вновь и вновь делая возвратные движения по строке, возвращаясь к неопознанным словам, с тем чтобы распознать их для удержания смысла прочитанного.

Кроме того, при беглом чтении адресат опирается уже не так на образы букв, как на образы слов. Фиксируются преимущественно начала и/или концы слов, какие-то слова могут вообще пропускаться при условии, что смысл текста читающему понятен.

В написанном слове, как утверждают ученые, наибольшую информационную нагрузку несут первые буквы (это подтверждает и тот факт, что в рукописном тексте начальные строчные буквы слов в большинстве почерков больше по разме-

ру последующих). Таким образом, читающий по первым буквам (реже по концу слова) догадывается о смысле написанного. Значит, важным для носителя языка при чтении становится распознать начальные единицы письма, а затем уже контекст поможет «вывести» смысл написанного.

Неразборчиво написанные флексии в ряде случаев (это обычно сочетание имени прилагательного/причастия с существительным, окончание глаголов и др.) также восполняются контекстом (окончания таких слов «прочитываем» по согласованию со стержневым).

Немаловажным является и тот фактор, что «разборчивость речи увеличивается при сокращении объема словаря, причем это относится как к уровню слов, так и в уровню фраз. «Словарем» в последнем случае является число возможных интерпретаций фразы. Например, чем меньше объем словаря, тем надежнее и быстрее распознаются слова при неполной информации фонемного уровня» [3, с. 12].

Справиться с помехообразующими факторами при чтении рукописных текстов помогает и возникающая у адресата гипотеза относительно содержания текста. «Когда мы начинаем читать, у нас возникает гипотеза относительно содержания текста, однако эта гипотеза имеет предварительный характер, и мы готовы отказаться от нее, чтобы уточнить свое понимание в процессе чтения» [7, с. 105]. По мере углубления в текст легче прочитываются буквы и слова в целом, в том числе и те, начертания которых казались крайне неразборчивыми.

Восприятию и распознаванию рукописи способствует и наличие пробелов в тексте. Они помогают не читать текст последовательно от начала до конца (особенно написанный неразборчивым почерком), «но более или менее произвольно выхватывать из него какие-то фрагменты и самостоятельно связывать

их между собой, угадывая таким образом смысл фразы» [7, с. 105-106].

Помимо пробелов, существенным для восприятия и распознавания написанного являются заглавные буквы, а также строчные, выходящие из ровного ряда строки. Строчные буквы, которые пишущий иногда изображает большими по величине, чем остальные, а также знаки с элементами, выходящими из строки, служат ориентиром для общего охвата и чтения текста, выделения не столько предложений, сколько целых слов. Такие индивидуальные особенности начертаний графических знаков также оказывают помощь читающему неразборчивое письмо.

Вышесказанное позволяет сделать следующие выводы. Свойства почерка, приобретенные в практике письма, проявляют себя в противоположном: индивидуальная манера начертания букв способна создавать помехи в письменном взаимодействии, а такое свойство почерка, как устойчивость, способно в определенной степени снимать этот коммуникативный барьер, помогая читающему распознавать написанное.

Для восприятия и распознавания написанного, как показывает читательский опыт, также значимы дифференциальные признаки, обнаруживающие себя в рукописных текстах и выделенные на основе следующих оппозиций: прописная - строчная; строчная, выходящая из строки - собственно прописная; контекст - его отсутствие; большая/меньшая информационная насыщенность букв; частота появления букв; избыточность языка - ее отсутствие; экспоненты букв и буквосочетаний, снимающие омонимию написаний, пробел; структурные элементы письменного текста и др. Безусловно, приведенный перечень признаков, характерных для любого рукописного текста и позволяющих распознавать написанное, не является исчерпывающим и не претендует на полноту изложения.

го

I-

о ф

I-

о

X

о ^

с

о

X

го ш го

X

со

о с

о го

Библиографический список

1. Амирова, Т. А. К истории и теории графемики [Текст] / Т. А. Амирова. - М.: Наука, 1977.

190 с.

ф

£

о ^

с

2. Гойхман, О.Я. Речевая коммуникация [Текст]: учебник / О.Я. Гойхман, Т.М. Надеина. - М.: ИНФРА-М, 2007. - 272 с.

3. Горский, Н. Распознавание рукописного текста: от теории к практике [Текст] / Н. Горский, В. Анисимов, Л. Горская. - СПб.: Политехника, 1997. - 126 с.

4. Каменецкий, Л.М. Техника корректора [Текст]: пособие для корректоров / Л.М. Каменец-кий. - М.: Искусство, 1954. - 168 с.

5. Кондратов, А.М. Звуки и знаки [Текст] / А.М. Кондратов. - М.: Знание, 1966. - 207 с.

6. Осипов, Б.И. Актуальные проблемы теории и истории письма [Текст] / Б.И. Осипов // Письменная культура народов России: материалы Всероссийской научной конференции 19-21 ноября 2008 г. / под ред. Б.И. Осипова. - Омск: Омск. гос. ун-т, 2008. - С. 18-20.

7. Успенский, Б.А. Ego Loquens: Язык и коммуникативное пространство [Текст] / Б.А. Успенский. - М.: РГГУ,, 2007. - 320 с.

References

1. Amirova T. A. The GraphemicHistory and Theory. M.: Nauka, 1977. P. 190. [in Russian].

2. Goikhman A. J. Nadeina T. M. Speech communication: Textbook. M.: INFRA-M, 2007. P. 272. [in Russian].

3. Gorsky N., Anisimov V., Gorsky L. Handwriting Recognition: from Theory to Practice. SPb.: Politekhnika, 1997. P. 126. [in Russian].

4. Kamenetsky L. M. Corrector Technique. The Guide for Proofreaders. M.: Iskusstvo, 1954. P. 168. [in Russian].

5. Kondratov A. M. Sounds and Symbols. M.: Znanie, 1966. P. 207. [in Russian].

6. Osipov B. I. Topical problems of theory and history of writing. Written Culture of the Peoples of Russia: Materials of all-Russian Scientific Conference 19-21 November 2008. Ed. B. I. Osipova. Omsk: Omsk. Gos. Un-t, 2008. P. 18-20. [in Russian].

7. Uspensky B. A. Ego Loquens: Language and Communicative Space. M.: RGGU, 2007. P. 320. [in Russian].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сведения об авторе: Бреусова Елена Ивановна,

кандидат филологических наук, доцент, доцент кафедры филологического образования и журналистики, Сургутский государственный педагогический университет,

г. Сургут, Российская Федерация. Ктай: elenabreusova@yandex.ru

Information about the author: Breusova Elena Ivanovna,

Candidate of Sciences (Philology), Academic Title of Associate Professor, Associate Professor,

Department of Philological Education and Journalism,

Surgut State Pedagogical University, Surgut, Russia.

E-mail: elenabreusova@yandex.ru.

ro m о

о >.

ф œ

LU

i Надоели баннеры? Вы всегда можете отключить рекламу.