Научная статья на тему 'ПРИЛОЖЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ РУССКОЯЗЫЧНОГО ТЕКСТА С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ'

ПРИЛОЖЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ РУССКОЯЗЫЧНОГО ТЕКСТА С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
80
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / ОЦИФРОВКА РУКОПИСНОГО ТЕКСТА / МЕЖНЕЙРОННЫЕ СВЯЗИ / НЕЙРОСЕТЬ / КОЛИЧЕСТВО ЭПОХ / СТОХАСТИЧЕСКИЙ ГРАДИЕНТНЫЙ СПУСК

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соловьева Е.В., Тушев А.Н.

Работа посвящена разработке приложения для распознавания русскоязычного рукописного текста сверточными нейронными сетями. Реализуемый алгоритм со свёрточной нейросетью обеспечит эффективное и оптимальное решение сложных задач компьютерного зрения за короткий интервал времени, а также высокий уровень точности транскрипции. Разработанное приложение позволяет преобразовать изображение русскоязычного рукописного текста в разборчивый и редактируемый текст на компьютере.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Соловьева Е.В., Тушев А.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION FOR RECOGNIZING RUSSIAN-LANGUAGE TEXT USING CONVOLUTIONAL NEURAL NETWORKS

The paper is devoted to the development of an application for the recognition of Russian-language handwritten text by convolutional neural networks. The implemented algorithm with a convolutional neural network will provide an effective and optimal solution to complex computer vision problems in a short time interval, as well as a high level of transcription accuracy. The developed application allows you to convert an image of a Russian-language handwritten text into legible and editable text on a computer

Текст научной работы на тему «ПРИЛОЖЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ РУССКОЯЗЫЧНОГО ТЕКСТА С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ»

УДК 004.855.5, 004.93'14

Соловьева Е.В.

Алтайский государственный технический университет им. И.И. Ползунова (г. Барнаул, Россия)

Тушев А.Н.

канд. тех. наук, доцент кафедры информатики, вычислительной техники и информационной безопасности Алтайский государственный технический университет им. И.И. Ползунова (г. Барнаул, Россия)

ПРИЛОЖЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ РУССКОЯЗЫЧНОГО ТЕКСТА С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ

Аннотация: работа посвящена разработке приложения для распознавания русскоязычного рукописного текста сверточными нейронными сетями. Реализуемый алгоритм со свёрточной нейросетью обеспечит эффективное и оптимальное решение сложных задач компьютерного зрения за короткий интервал времени, а также высокий уровень точности транскрипции. Разработанное приложение позволяет преобразовать изображение русскоязычного рукописного текста в разборчивый и редактируемый текст на компьютере.

Ключевые слова: сверточные нейронные сети, оцифровка рукописного текста, межнейронные связи, нейросеть, количество эпох, стохастический градиентный спуск.

Современное общение, обмен информацией происходит преимущественно в электронном формате - сообщения, электронные письма, мессенджеры. Большинство данных существует только в электронном виде.

Но также остаются и рукописные работы - конспекты, записи, заметки. Часто встаёт такая задача как перенести информацию с бумажного носителя.

Одним из возможных решений подобной задачи является нейронная сеть. Особенностью нейронной сети является то, что возможна параллельная обработка информации всеми звеньями. При большом количестве межнейронных связей это даёт возможность существенно ускорить процесс обработки информации. В случае, описанном выше - оцифровки рукописного текста [1].

Целью данной работы является создание программного обеспечения по распознаванию русскоязычного рукописного текста сверточными нейронными сетями.

Работа выполнялась в среде Visual Studio с использованием языка С++.

Алгоритм работы программного обеспечения.

Перед использованием программного обеспечения загружаются данные для обучения нейросети. Соответствующий пункт в меню интерфейса продемонстрирован на рисунке 1.

^ Нейронные сети — □ X

File View Train

Open data

Load net

Save net

Exit

Рис. 1. Пункт меню для загрузки файла

Модель СоММБТ содержит в себе русскоязычный набор символов для обучения. После чтения файла необходимо обучить нейросеть. Соответствующий пункт в меню интерфейса продемонстрирован на рисунке 2 [2].

Рис. 2. Пункт меня для обучения нейросети

После выбора данного пункта откроется отдельная вкладка, в которой можно изменять параметры обучения. Содержимое вкладки и выбранные параметры показаны на рисунке 3.

Рис. 3. Вкладка для обучения с введенными параметрами

После запуска в режиме реального времени будет выводиться график изменения ошибки во время обучения. Также выводится информация о длительности обучения в секундах и количество эпох. На рисунке 4 продемонстрирован график спустя 365 секунд обучения.

Рис. 4. График изменения ошибки

После остановки проверяется правильность обучения. Выбирается соответствующая вкладка. Пример проверки правильности обучения продемонстрирован на рисунке 5.

Рис. 5. Проверка правильности обучения

В данном исследовании точность распознавания составила 87 процентов. Для модификации алгоритма и повышения точности в программе будет использоваться более двух сверточных слоёв, нейроны смещения, стохастический градиентный спуск, метод опорных векторов, а для ускорения процесса обучения

вычисления будут производиться на графической карте. На рисунке 6 показано, как точность данных с корректировкой повышается до 94% [3, 4].

Рис. 6. Проверка правильности обучения

Результаты работы: в ходе работы достигнута поставленная цель, а именно, разработано приложение для распознавания русскоязычного текста сверточными нейронными сетями.

СПИСОК ЛИТЕРАТУРЫ:

1. Интеллектуальные системы : учебное пособие / А. М. Семенов, Н. А. ^ловьев, Е. Н. Чернопрудова, А. С. Цыганков. — Оренбург : Оренбургский государственный университет, ЭБС АСВ, 2013. — 236 c. — ISBN 2227-8397. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/30055.html. — Режим доступа: для авторизир. Пользователей.

2. Простейшая нейронная сеть для распознавания рукописных цифр [Электронный ресурс]. URL: https://russianblogs.com/article/89501343006/ (Дата обращения 26.05.2023).

3. Asif A. Learning Neural Activations [Электронный ресурс] / A. Asif. URL: https://arxiv.org/abs/1912.12187 (Дата обращения 26.05.2023).

4. ML | Stochastic Gradient Descent (SGD) [Электронный ресурс]. URL: https://www.geeksforgeeks.org/ml-stochastic-gradient-descent-sgd/ (Дата обращения 15.04.2023).

Soloveva E.V.

Altai State Technical University named after I.I. Polzunov

(Barnaul, Russia)

Tushev A.N.

Candidate of Technical Sciences, Associate Professor of the Department of Computer Science, Computer Engineering and Information Security Altai State Technical University named after I.I. Polzunov

(Barnaul, Russia)

APPLICATION FOR RECOGNIZING RUSSIAN-LANGUAGE TEXT USING CONVOLUTIONAL NEURAL NETWORKS

Abstract: the paper is devoted to the development of an application for the recognition of Russian-language handwritten text by convolutional neural networks. The implemented algorithm with a convolutional neural network will provide an effective and optimal solution to complex computer vision problems in a short time interval, as well as a high level of transcription accuracy. The developed application allows you to convert an image of a Russian-language handwritten text into legible and editable text on a computer.

Keywords: convolutional neural networks, digitization of handwritten text, interneuronal connections, neural network, number of epochs, stochastic gradient descent.

i Надоели баннеры? Вы всегда можете отключить рекламу.