МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070
УДК 004
Е.В. Пшеничкин
студент 2 курса магистратуры ОГУ имени И.С. Тургенева,
г. Орел, РФ E-mail: [email protected] М.В. Цуканов
студент 2 курса магистратуры ОГУ имени И.С. Тургенева,
г. Орел, РФ E-mail: [email protected] Д.В. Рыженков
канд. тех. наук, доцент ОГУ имени И.С. Тургенева,
г. Орел, РФ E-mail: [email protected]
РАСПОЗНАВАНИЕ РУКОПИСНЫХ СИМВОЛОВ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ МЕТОДОМ С ОБРАТНЫМ РАСПРОСТРАНЕНИЕМ ОШИБКИ
Аннотация
Задача распознавания рукописных символов является одной из актуальных задач в настоящее время и востребовано в различных сферах деятельности.
Задача распознавания символов можно применять для оцифровки старых рукописных записей, книг, статей и документов больших объемов, методом с обратным распространением ошибки.
Ключевые слова
Распознавание символов, методом с обратным распространением ошибки.
Предлагается метод распознавания рукописных символов с графического файла, основанный на определении точек (пикселей), которые обладают наибольшей информацией об определении символа и дальнейшей обработкой положения, масштаба и толщине. Данный алгоритм может использоваться для распознавания отдельных символов, слов или целого документа.
Распознавание рукописного символа является сложной задачей с большим количеством особенностей. Решение сопровождается интересом создания оптимального алгоритма распознавания символов, что поможет сократить время для записи информации с изображения, графического файла или документа на компьютер без участия человека. Существует много успешных программ, которые могут считывать, обрабатывать и распознавать простой и не искаженный текст. Но при наличии спроса на такие программы, которые могут распознавать искаженный текст (рукописный текст) с возможностью преобразования в документ хорошего качества, недостаточно.
Графический файл (растровое изображение) представляет собой матрицу чисел, где каждый элемент будет являться координатой точки в двумерном пространстве. Значение каждого элемента определяет цвет точки, а положение ее - координаты в матрице. Цветное изображение использует три матрицы красного (R), зеленого (G) и синего (B), помогающие отобразить всю гамму оттенков.
Входные данные (цветную картинку или черно-белую) лучше всего хранить в форматах JPG, BMP или PNG. После этого на файл применяют фильтр, позволяющий преобразовать изображение в черно-белое, убрать лишний шум (зернистость) и настроить яркость, контрастность. Затем графический файл преобразовывают в матрицу, в которой содержатся только нулевые и единичные элементы. Единичным элементом является точка белого фона, а нулевыми - точки черного фона. При этом изображения, в котором текст или отдельные символы написаны ординарным почерком и не присутствует лишний "шум", могут быть распознаны абсолютно точно. Если заметны геометрические отличия в написании символа от шаблонного, то они могут быть распознаны неправильно.
Основная проблема при распознавании - это определение объекта (символа) к конкретному классу,
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070
получение из структуры символа информации, которая позволяет максимально точно его определить. Выделить из символа данные так, чтобы при его написании не учитывались искажения формы образа, толщины, размера и положения. Очень важно, чтобы система была настроена на выявление мельчайших деталей объекта для разбиения по классам, поскольку все символы, написанные человеком, индивидуальны и повторить очень сложно. Далее полученную информацию требуется анализировать и делать вывод о его принадлежности к конкретному классу. Для этой цели создают систему анализа, которая будет сверять полученные данные с имеющимися эталонами символов. Перед использованием нейронной сети сначала требуется обучить ее, т.е. записать в базу данных эталонные образы каждого символа и сохранить.
Алгоритм системы обработки данных включает в себя следующие пункты:
1. Сканирование входной матрицы на наличие нулевых элементов. Поиск реализуется с помощью двойного цикла, который проходит построчно и находит все элементы в матрице. Найденные элементы и будут являются компонентами для комплексного массива
2. Комплексные числа, которые содержит массив описывают образ символа. Далее из этого массива отбираются только те точки, которые максимально приближены к эталонным точкам символа.
3. Получившиеся массивы преобразовывают в дискретное преобразование Фурье:
п=0
Фурье-образ определяет структуру исследуемого символа и преобразует в другую систему параметров, в которой можно легко выполнить масштабирование с помощью введения коэффициента нормализации векторов.
Выходными данными получаем два массива с одинаковым коэффициентом масштабирования, т.к. они определяют две линии, не связанные друг с другом, что приведет к искажению результата обработки. Из теории преобразования Фурье можно сделать вывод, что наиболее важными считаются пары векторов Fм-l], ^2; Fм-2] и т.д. Для классификации только цифр достаточно использовать только четыре пары векторов.
4. Сформированные два массива подаются с выхода системы обработки на вход нейронной сети для дальнейшего анализа. Но если использовать глубокий анализ, потребуется дополнить данные дополнительными параметрами, использующих простейшие законы теории.
Алгоритм нейронной сети включает в себя следующие стадии:
• Инициализация нейронной сети с обратным распространением ошибки. Этот метод содержит два слоя и девять нейронов. Входной вектор имеет тридцать три строки и десять столбцов (каждый столбец соответствует одному эталонному шаблону символа).
• Обучение сети осуществляется на эталонных данных, которые соответствуют идеально написанным символам.
• В дальнейшем обучение нейронной сети осуществляется на других данных, соответствующих различно написанных символов (букв, цифр и специальных символов). Очень важно, чтобы символы не были похожи друг на друга, иначе нейронная сеть будет настроена на распознавание только с похожим написанием, что приведет к ошибочным результатам.
• Финальное обучение проводится снова на эталонных образах, поскольку после обучения не на идеальных образцах, нейронная сеть "разучивается" определять хорошо написанные символы.
Получив готовую к использованию систему обработки и анализа данных с помощью нейронной сети, создаем конечную программу для работы с простым графическим файлом, на котором изображены рукописные буквы, цифры и специальные символы. Работа системы сводится к выполнению
Z(ri) = x(ri) + jy(n);
м-1
KS = J\F1\2 + \FM-1\
2
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02/2018 ISSN 2410-6070
алгоритмического процесса:
• Обработка входного файла для дальнейшего преобразования в бинарную матрицу, в которой содержатся только нули и единицы
• Построчный поиск объектов
• При нахождении объекта, похожего на символ, происходит загрузка в функцию обработки и после в нейронную сеть. Полученный результат запоминается в массиве.
• Удаление объекта из функции обработки и продолжение поиска других объектов. При отсутствии таких объектов происходит сохранение результата и завершение распознавания символа.
Заключение
По результатам проделанной работы можно сделать выводы:
^ Особенность метода заключается в нахождении максимально обобщающей информации об исследуемом символе, направленность на работу с экспериментальными, реальными данными об объекте, а также с возможностью модернизации через глубокий анализ или в целях последующего практического применения.
^ Классификация любых рукописных символов должна производится с исключением всевозможного ряда искажений, так же и в структуре геометрии образца. При этом решение не должно быть найдено с помощью увеличения числа шаблонов в базе данных нейронной сети, так как это в большинстве случаев приводит к ненадежности работы по распознаванию с различными почерками и увеличению объема информации, хранящейся в БД, а также к уменьшению быстродействия. Основной целью при реализации программного продукта должно быть выделение самых ключевых данных об образце.
> Применение компьютеров для классификации символов с графического файла не трудоемкая задача, решение которой состоит только в улучшении эвристических методов создания алгоритма программ и обязательной проверки каждого шага и возможной ситуации на практике Список использованной литературы:
1. Дьяков В.П., Абраменкова И.В. Обработка сигналов и изображений: Специальный справочник / СПб.: Питер, 200. 608с.
2. Колби Р. Энциклопедия технических индикаторов рынка. Перевод. с англ. 2-е изд. М.: «Альпина Бизнес Букс», 2004. 837 с.
3. Леонов Е.А. Принятие решений на основе нечеткозначных моделей и алгоритмов обработки графических данных в технологии машинного обучения. 2008. 26 с.
4. Оссовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2002. 345с.
5. Поршнев С.В. Основы работы и программирования: учебник. М.: Бином-Пресс. 2006. 320с.
6. Рутковская Д., Пилиньский М.. Рутковский Л. «Нейронные сети, генетические алгоритмы и нечеткие системы». Пер. с польск., И.Д. Рудинского. 2006. 452 с.
© Пшеничкин Е.В., Цуканов М.В., Рыженков Д.В., 2018
УДК 631.6
Реус И.С.
студент магистратуры ФГБОУ ВО КубГАУ г. Краснодар, Россия
ИНОВАЦИОННЫЕ ТЕХНОЛОГИИ ПРОИЗВОДСТВА РИСА НА ЭКОЛОГО-ЛАНДШАФТНОЙ ОСНОВЕ
Рисоводство — это подразделение растениеводства, которое в свою очередь относится к одной из