Программные редктва и информационные технологии
УДК 004.032.26
ИСПОЛЬЗОВАНИЕ СЛОВАРЕЙ В СИСТЕМАХ РАСПОЗНАВАНИЯ РУКОПИСНОГО ТЕКСТА
Д. С. Лазарев, А. А. Ненашева
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: [email protected]
Рассматривается применение словарей для наиболее точного распознавания рукописного текста в архивных документах.
Ключевые слова: распознавание рукописного текста, архивные документы, пример использования словарей в распознавании рукописного текста.
USING DICTIONARIES IN HANDWRITTEN RECOGNIZING SYSTEMS
D. S. Lasarev, A. A. Nenasheva
Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]
Using dictionaries for more accurate handwriting recognition in archival documents is described.
Keywords: recognizing a handwritten text, archival documents, an example of using dictionaries in handwritten recognizing systems.
Несмотря на бурное развитие современных технологий, задача распознавания рукописного текста по сей день вызывает сложности даже для самых совершенных систем распознавания. Многообразие почерков, неаккуратность написанного текста зачастую делает определение тех или иных слов практически невозможным. В некоторых случаях программа может распознать только отдельные символы, в то время как полное распознавание слов не будет представляться возможным. В подобных условиях становится актуальным использование дополнительных словарей, помогающих производить наиболее правильную идентификацию слов [1].
Преимущества использования словарей заключаются в следующем:
- появляется возможность идентификации частично распознанного слова;
- увеличивается точность распознавания благодаря подбору слов, наиболее соответствующих данному контексту;
- ускоряется процесс распознавания текста.
В рамках данной статьи предлагается использование дополнительных словарей для распознавания рукописного текста, сканированного из архивных документов.
Заявленный способ улучшения качества распознавания заключается в том, что после выполнения операций разбиения изображения, предположительно содержащего текст, на фрагменты, предположительно содержащие символы, выполняют распознавание символов. В результате распознавания получают один или более вариантов символов для каждой графемы. После этого объединяют символы в группы, предположительно составляющие слова. Рассматривают все
возможные слова, полученные как комбинации всех возможных вариантов разбиения изображения на символы и вариантов распознавания составляющих фрагментов. Группы символов анализируют, в том числе вместе с одним или несколькими соседними группами с одной или с двух сторон. К словам применяют дополнительную информацию нескольких типов, последовательно из нескольких источников, в объеме, необходимом для точного распознавания слова, соизмеряя достигаемый уровень надежности распознавания и объем используемых вычислительных ресурсов [2].
Последовательность анализа следующая:
Предварительно задают перечень и очередность привлечения дополнительной информации. Перечень дополнительной информации и последовательность обращения следующая:
1. Информация о точках деления строки на символы.
2. Качество распознавания графического элемента.
3. Словарь.
4. Словарь возможных частей слов, например, триграмм.
5. Правила, обусловленные используемыми типовыми шаблонами данных.
6. Правила, обусловленные местонахождением слова в пределах стоки и/или абзаца.
7. Правила, обусловленные особенностями языка документа.
8. Правила, обусловленные типом документа.
9. Дополнительные правила для обработки редко встречающихся случаев.
Возможно использование не всех, а только части перечисленных видов дополнительной информации.
Также предварительно назначают оценку качества для каждого вида дополнительной информации.
Решетневскуе чтения. 2013
Определяют все возможные варианты разбиения фрагментов изображения, предположительно являющихся строками текста, на фрагменты, предположительно относящиеся к изображениям отдельных слов, по надежно распознанным пробелам.
После проведения указанных выше операций, найденные рукописные слова можно распознать с наибольшей точностью.
Библиографические ссылки
1. Лазарев Д. С. Сегментация рукописных строк в системах обработки текстовых документов // Молодежь и современные информационные технологии : сб. материалов Всерос. науч. конф. студентов, аспирантов и молодых ученых. Томск, 2012. С. 714.
2. Способ распознавания текстовой информации из графического файла с использованием словарей и
дополнительных данных [Электронный ресурс]. URL: http://www.findpatent.ru/patent/229/2295154.html (дата обращения: 09.09.2013).
References
1. Lazarev D. S. Segmentacija rukopisnyh strok v sistemah obrabotki tekstovyh dokumentov [Tekst] / D.S. Lazarev // Molodezh' i sovremennye informacionnye tehnologii : sb. materialov vserossijskoj nauchnoj konferencii studentov, aspirantov i molodyh uchenyh Tomsk, 2012, str. 714.
2. Sposob raspoznavanija tekstovoj informacii iz graficheskogo fajla s ispol'zovaniem slovarej i dopolnitel'nyh dannyh [Jelektronnyj resurs]. URL: http://www.findpatent.ru/patent/229/2295154.html. Zagl. s jekrana. (data obrashhenija: 09.09.2013).
© Лазарев Д. С., Ненашева А. А. 2013
УДК 004.93
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ПОЛА
И ВОЗРАСТА ЧЕЛОВЕКА
М. А. Лаптева, К. М. Болдырев
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: [email protected]
Рассмотрена разработка системы, различающей людей на изображениях по гендерному признаку (разбиение на два класса: «мужчины» и «женщины»), которая основана на специализированном аппаратном и программном обеспечении. Использование данной системы в сфере рекламы позволит адаптировать коммерческие предложения для человека.
Ключевые слова: реклама, гендерный признак, метод опорных векторов.
IMAGE PREPROCESSING FOR RECOGNIZING A PERSON GENDER AND AGE
M. A. Lapteva, K. M. Boldyrev
Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]
The research is devoted to the development of the system for people discriminating on the pictures by gender feature (splits into two classes: "men" and "women"), which is based on a dedicated hardware and software. The usage of this system in the field of advertising will allow to adapt the commercial offers for the individual.
Keywords: advertising, gender feature, support vector machine.
Успех любого бизнеса во многом зависит от рекламы. Реклама - двигатель торговли. Применение систем распознавания пола и возраста человека по изображению позволяет увеличить эффективность рекламы, транслируя информацию, направленную на определенный круг лиц [1]. Подобные системы находят широкое применение в различных областях: робототехнике, интерфейсах взаимодействия «человек-компьютер», системах сбора и оценки демографиче-
ских показателей, видеонаблюдении, системах интеллектуального представления информации с цифровых носителей и многих других.
Задача распознавания пола на сегодняшний день менее изучена. Существуют подходы, основанные на нейронных сетях, на комбинации вейвлетов Га-бора и метода главных компонент, на анализе независимых компонент и линейном дискриминантном анализе.