Научная статья на тему 'Использование метрик Хэмминга в алгоритмах распознавания текстов'

Использование метрик Хэмминга в алгоритмах распознавания текстов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
694
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ТЕКСТА / OCR / МЕТРИКИ ХЭММИНГА / HAMMING METRIC / НЕЙРОННАЯ СЕТЬ / NEURAL NETWORKS / ОЦИФРОВКА ИЗОБРАЖЕНИЙ / DIGITIZATION OF IMAGES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Купцова Ирина Владимировна

В статье анализируется основной принцип распознавания текста сопоставление готовых классов образов с входными данными и формулировка выводов на основе их схожести. Метод распознавания образов, что описан в данной статье, отличается от принципов нейронных сетей, где выводы делаются на основе проведения множества экспериментов. Решение данной проблемы описано на основе логических выводов, которые обосновываются математическим языком.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Купцова Ирина Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование метрик Хэмминга в алгоритмах распознавания текстов»

The use of Hamming metrics in text recognition algorithms Kuptsova I. (Ukraine) Использование метрик Хэмминга в алгоритмах распознавания текстов

Купцова И. В. (Украина)

Купцова Ирина Владимировна /Kuptsova Irina — бакалавр, факультет информатики и вычислительной техники,

Национальный технический университет Украины Киевский политехнический институт, г. Киев, Украина

Аннотация: в статье анализируется основной принцип распознавания текста - сопоставление готовых классов образов с входными данными и формулировка выводов на основе их схожести. Метод распознавания образов, что описан в данной статье, отличается от принципов нейронных сетей, где выводы делаются на основе проведения множества экспериментов. Решение данной проблемы описано на основе логических выводов, которые обосновываются математическим языком. Abstract: the article analyzes the basic principle of OCR - comparison images of the finished grade to the input data and the formulation of conclusions based on their similarity. Pattern recognition method which is described in this article is different from the principles of neural networks, where conclusions are drawn on the basis of many experiments. The solution to this problem is described on the basis of inferences that are justified in mathematical language.

Ключевые слова: распознавание текста, метрики Хэмминга, нейронная сеть, оцифровка изображений.

Keywords: OCR, Hamming metric, neural networks, digitization of images.

Распознавание текста - один из подразделов распознавания образов. Теория распознавания образов - раздел информатики, развивающий основы и методы классификации, идентификации предметов, явлений, процессов объектов, который характеризуются конечным набором некоторых свойств и признаков [1].

В процессе распознавания текста можно выделить основные этапы:

1) фильтрация изображения. Изображение, которое будет распознаваться, должно быть максимально четким для избегания погрешностей, а также черно-белым для упрощения процесса распознавания. Поэтому существует необходимость в минимизации шума исходного изображения, а также применении монохромного фильтра;

2) сегментация изображения. Предполагается, что предложения в тексте написаны четко горизонтально, буквы не перекрывают друг друга и расположены на одинаковом расстоянии, отличном от расстояния между словами;

3) выделение характеристик символов и их классификация. На этом этапе происходит распознавание символов с использованием метрик Хэмминга;

4) составление текста - слияние отдельно распознанных символов в текст.

Метрика Хэмминга - значение некой функции, которая обозначает непохожесть объектов между собой [2].

В случае векторного пространства, расстоянием Хэмминга d(a,b) между двумя векторами a и b, длиной n - число позиций, в которых они различны.

В общем виде расстояние Хэмминга dH для объектов Xi и Xj размерности P задается функцией:

dH(Xi,XJ)='Z ps= ign\ x^-xjs) \ .

Расстояние Хэмминга обладает следующими свойствами метрики:

1) dH(Xi,Xj)>0;

2) dH(Xi,Xj)=0;

3) dH (Xi.Xj) = dH (Xj.Xt);

4) .

Но вычисление метрики может привести к неожиданным результатам распознавания ввиду схожести и симметричности некоторых символов. Так, например, буквы "i", "j" будут распознаны ошибочно. Методом проб было определено, что такие буквы английского алфавита, как "H", "I", "i", "O", "o", "X", "x" имеют полную симметрию. По этой причине их необходимо выделить в отдельный класс, который упрощает процесс перебора метрик.

Таким образом, буква "j" становится уникальной в своем классе и распознается однозначно. В последующем, метрика определяется для каждого класса отдельно и дает более точные результаты, чем при прямом использовании [3].

Также нужно помнить, что обучение метрик зависит от используемого шрифта. При смене шрифта, точность распознавания быстро падает. По этой причине необходимо модифицировать метрику для каждого нового шрифта.

Литература

1. Теория распознавания образов. [Электронный ресурс]: Wikipedia. URL: https://ru.wikipedia.org/wiki/Теория_распознавания_образов/ (дата обращения: 18.07.2016).

2. Михайлов С. А. Искусственный интеллект и когнитивная графика. [Электронный ресурс]: Поиск лекций. URL: http://poisk-ru.ru/s17640t1.html/ (дата обращения: 18.07.2016).

3. Поветкин Алексей. Распознавание образов методом потенциальных функций. [Электронный ресурс]: CitForum. URL: http://citforum.ru/programming/delphi/recognition_2/ (дата обращения: 18.07.2016).

Design and development of the repository of educational materials for the learning support system for the course "Discrete mathematics and computational complexity" Sedova O.1, Takhteeva P.2 (Russian Federation) Проектирование и разработка хранилища учебно-методических материалов в составе системы поддержки учебного процесса по курсу «Дискретная математика и сложность вычислений» Седова О. М.1, Тахтеева П. М.2 (Российская Федерация)

'Седова Оксана Михайловна / Sedova Oksana — студент; 2Тахтеева Полина Михайловна / Takhteeva Polina — студент, кафедра кибернетики, Национальный исследовательский ядерный университет Московский инженерно-физический институт, г. Москва

Аннотация: в статье проводится анализ различных ресурсов хранения учебно-методических материалов, а также приводится описание проектирования и разработки модуля электронной библиотеки. Данный модуль является составной частью электронного учебника по курсу «Дискретная математика: теория алгоритмов и сложность вычислений», читаемому студентам второго курса факультета кибернетики и информационной безопасности НИЯУ «МИФИ». Abstract: there is an analysis of the various storage resources of educational materials, and it has a description of the design and development of an electronic library's module in the article. This module is part of the electronic textbook for the course "Discrete mathematics: the theory of algorithms and computational complexity", which his read for students of the Faculty of Cybernetics and Information Security NRNU "MEPHI".

Ключевые слова: электронная библиотека, обучающий ресурс, дискретная математика, теория алгоритмов.

Keywords: digital library, teaching resource, discrete mathematics, the theory of algorithms.

Современный этап развития образования широко связан с использованием информационных, а также различных возможностей, предоставляемых глобальной сетью Интернет. В связи с этим решающее значение приобретает удаленный доступ к ресурсам, опубликованным в Сети.

Электронная форма позволяет хранить информацию наиболее надежно и компактно, распространять ее намного оперативнее и шире и, кроме того, предоставляет возможности манипулирования с ней, которых не могло быть при иных формах. В связи с этим за последние годы во всем мире интенсивно увеличивается количество электронных публикаций. Подготовка традиционных печатных изданий всё чаще осуществляется в электронной форме. Так, в информационных системах ряда организаций формируются электронные массивы, например, по полным текстам российских газет, по справочно-энциклопедической информации, по музейным энциклопедиям и др. [1, 2].

i Надоели баннеры? Вы всегда можете отключить рекламу.