Научная статья на тему 'Распознавание рукописных символов с помощью нейронных сетей методом с обратным распространением ошибки'

Распознавание рукописных символов с помощью нейронных сетей методом с обратным распространением ошибки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
558
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ СИМВОЛОВ / МЕТОДОМ С ОБРАТНЫМ РАСПРОСТРАНЕНИЕМ ОШИБКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пшеничкин Е. В., Цуканов М. В., Рыженков Д. В.

Задача распознавания рукописных символов является одной из актуальных задач в настоящее время и востребовано в различных сферах деятельности. Задача распознавания символов можно применять для оцифровки старых рукописных записей, книг, статей и документов больших объемов, методом с обратным распространением ошибки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пшеничкин Е. В., Цуканов М. В., Рыженков Д. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Распознавание рукописных символов с помощью нейронных сетей методом с обратным распространением ошибки»

МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070

УДК 004

Е.В. Пшеничкин

студент 2 курса магистратуры ОГУ имени И.С. Тургенева,

г. Орел, РФ E-mail: [email protected] М.В. Цуканов

студент 2 курса магистратуры ОГУ имени И.С. Тургенева,

г. Орел, РФ E-mail: [email protected] Д.В. Рыженков

канд. тех. наук, доцент ОГУ имени И.С. Тургенева,

г. Орел, РФ E-mail: [email protected]

РАСПОЗНАВАНИЕ РУКОПИСНЫХ СИМВОЛОВ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ МЕТОДОМ С ОБРАТНЫМ РАСПРОСТРАНЕНИЕМ ОШИБКИ

Аннотация

Задача распознавания рукописных символов является одной из актуальных задач в настоящее время и востребовано в различных сферах деятельности.

Задача распознавания символов можно применять для оцифровки старых рукописных записей, книг, статей и документов больших объемов, методом с обратным распространением ошибки.

Ключевые слова

Распознавание символов, методом с обратным распространением ошибки.

Предлагается метод распознавания рукописных символов с графического файла, основанный на определении точек (пикселей), которые обладают наибольшей информацией об определении символа и дальнейшей обработкой положения, масштаба и толщине. Данный алгоритм может использоваться для распознавания отдельных символов, слов или целого документа.

Распознавание рукописного символа является сложной задачей с большим количеством особенностей. Решение сопровождается интересом создания оптимального алгоритма распознавания символов, что поможет сократить время для записи информации с изображения, графического файла или документа на компьютер без участия человека. Существует много успешных программ, которые могут считывать, обрабатывать и распознавать простой и не искаженный текст. Но при наличии спроса на такие программы, которые могут распознавать искаженный текст (рукописный текст) с возможностью преобразования в документ хорошего качества, недостаточно.

Графический файл (растровое изображение) представляет собой матрицу чисел, где каждый элемент будет являться координатой точки в двумерном пространстве. Значение каждого элемента определяет цвет точки, а положение ее - координаты в матрице. Цветное изображение использует три матрицы красного (R), зеленого (G) и синего (B), помогающие отобразить всю гамму оттенков.

Входные данные (цветную картинку или черно-белую) лучше всего хранить в форматах JPG, BMP или PNG. После этого на файл применяют фильтр, позволяющий преобразовать изображение в черно-белое, убрать лишний шум (зернистость) и настроить яркость, контрастность. Затем графический файл преобразовывают в матрицу, в которой содержатся только нулевые и единичные элементы. Единичным элементом является точка белого фона, а нулевыми - точки черного фона. При этом изображения, в котором текст или отдельные символы написаны ординарным почерком и не присутствует лишний "шум", могут быть распознаны абсолютно точно. Если заметны геометрические отличия в написании символа от шаблонного, то они могут быть распознаны неправильно.

Основная проблема при распознавании - это определение объекта (символа) к конкретному классу,

МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070

получение из структуры символа информации, которая позволяет максимально точно его определить. Выделить из символа данные так, чтобы при его написании не учитывались искажения формы образа, толщины, размера и положения. Очень важно, чтобы система была настроена на выявление мельчайших деталей объекта для разбиения по классам, поскольку все символы, написанные человеком, индивидуальны и повторить очень сложно. Далее полученную информацию требуется анализировать и делать вывод о его принадлежности к конкретному классу. Для этой цели создают систему анализа, которая будет сверять полученные данные с имеющимися эталонами символов. Перед использованием нейронной сети сначала требуется обучить ее, т.е. записать в базу данных эталонные образы каждого символа и сохранить.

Алгоритм системы обработки данных включает в себя следующие пункты:

1. Сканирование входной матрицы на наличие нулевых элементов. Поиск реализуется с помощью двойного цикла, который проходит построчно и находит все элементы в матрице. Найденные элементы и будут являются компонентами для комплексного массива

2. Комплексные числа, которые содержит массив описывают образ символа. Далее из этого массива отбираются только те точки, которые максимально приближены к эталонным точкам символа.

3. Получившиеся массивы преобразовывают в дискретное преобразование Фурье:

п=0

Фурье-образ определяет структуру исследуемого символа и преобразует в другую систему параметров, в которой можно легко выполнить масштабирование с помощью введения коэффициента нормализации векторов.

Выходными данными получаем два массива с одинаковым коэффициентом масштабирования, т.к. они определяют две линии, не связанные друг с другом, что приведет к искажению результата обработки. Из теории преобразования Фурье можно сделать вывод, что наиболее важными считаются пары векторов Fм-l], ^2; Fм-2] и т.д. Для классификации только цифр достаточно использовать только четыре пары векторов.

4. Сформированные два массива подаются с выхода системы обработки на вход нейронной сети для дальнейшего анализа. Но если использовать глубокий анализ, потребуется дополнить данные дополнительными параметрами, использующих простейшие законы теории.

Алгоритм нейронной сети включает в себя следующие стадии:

• Инициализация нейронной сети с обратным распространением ошибки. Этот метод содержит два слоя и девять нейронов. Входной вектор имеет тридцать три строки и десять столбцов (каждый столбец соответствует одному эталонному шаблону символа).

• Обучение сети осуществляется на эталонных данных, которые соответствуют идеально написанным символам.

• В дальнейшем обучение нейронной сети осуществляется на других данных, соответствующих различно написанных символов (букв, цифр и специальных символов). Очень важно, чтобы символы не были похожи друг на друга, иначе нейронная сеть будет настроена на распознавание только с похожим написанием, что приведет к ошибочным результатам.

• Финальное обучение проводится снова на эталонных образах, поскольку после обучения не на идеальных образцах, нейронная сеть "разучивается" определять хорошо написанные символы.

Получив готовую к использованию систему обработки и анализа данных с помощью нейронной сети, создаем конечную программу для работы с простым графическим файлом, на котором изображены рукописные буквы, цифры и специальные символы. Работа системы сводится к выполнению

Z(ri) = x(ri) + jy(n);

м-1

KS = J\F1\2 + \FM-1\

2

МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070

алгоритмического процесса:

• Обработка входного файла для дальнейшего преобразования в бинарную матрицу, в которой содержатся только нули и единицы

• Построчный поиск объектов

• При нахождении объекта, похожего на символ, происходит загрузка в функцию обработки и после в нейронную сеть. Полученный результат запоминается в массиве.

• Удаление объекта из функции обработки и продолжение поиска других объектов. При отсутствии таких объектов происходит сохранение результата и завершение распознавания символа.

Заключение

По результатам проделанной работы можно сделать выводы:

^ Особенность метода заключается в нахождении максимально обобщающей информации об исследуемом символе, направленность на работу с экспериментальными, реальными данными об объекте, а также с возможностью модернизации через глубокий анализ или в целях последующего практического применения.

^ Классификация любых рукописных символов должна производится с исключением всевозможного ряда искажений, так же и в структуре геометрии образца. При этом решение не должно быть найдено с помощью увеличения числа шаблонов в базе данных нейронной сети, так как это в большинстве случаев приводит к ненадежности работы по распознаванию с различными почерками и увеличению объема информации, хранящейся в БД, а также к уменьшению быстродействия. Основной целью при реализации программного продукта должно быть выделение самых ключевых данных об образце.

> Применение компьютеров для классификации символов с графического файла не трудоемкая задача, решение которой состоит только в улучшении эвристических методов создания алгоритма программ и обязательной проверки каждого шага и возможной ситуации на практике Список использованной литературы:

1. Дьяков В.П., Абраменкова И.В. Обработка сигналов и изображений: Специальный справочник / СПб.: Питер, 200. 608с.

2. Колби Р. Энциклопедия технических индикаторов рынка. Перевод. с англ. 2-е изд. М.: «Альпина Бизнес Букс», 2004. 837 с.

3. Леонов Е.А. Принятие решений на основе нечеткозначных моделей и алгоритмов обработки графических данных в технологии машинного обучения. 2008. 26 с.

4. Оссовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002. 345с.

5. Поршнев С.В. Основы работы и программирования: учебник. М.: Бином-Пресс. 2006. 320с.

6. Рутковская Д., Пилиньский М.. Рутковский Л. «Нейронные сети, генетические алгоритмы и нечеткие системы». Пер. с польск., И.Д. Рудинского. 2006. 452 с.

© Пшеничкин Е.В., Цуканов М.В., Рыженков Д.В., 2018

УДК 631.6

Реус И.С.

студент магистратуры ФГБОУ ВО КубГАУ г. Краснодар, Россия

ИНОВАЦИОННЫЕ ТЕХНОЛОГИИ ПРОИЗВОДСТВА РИСА НА ЭКОЛОГО-ЛАНДШАФТНОЙ ОСНОВЕ

Рисоводство — это подразделение растениеводства, которое в свою очередь относится к одной из

i Надоели баннеры? Вы всегда можете отключить рекламу.