Научная статья на тему 'Определение автомобильных номеров с применением компьютерного зрения и нейронных сетей'

Определение автомобильных номеров с применением компьютерного зрения и нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компьютерное зрение / искусственный интеллект / нейронные сети / классификация текста / YOLOv8 / EasyOCR / OpenCV / computer vision / artificial intelligence / neural networks / text classification / YOLOv8 / EasyOCR / OpenCV

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алексей Романович Приходько, Денис Александрович Коваленко, Григорий Михайлович Жиляков

Проанализировано применение новейшей нейронной сети YOLOv8 для обнаружения объектов в режиме реаль-ного времени. Рассмотрены методы обработки текста со сложной структурой и на произвольном фоне, в том числе, с помощью предварительной бинаризации изображения. Модель обнаружения объектов разработана на основе алгоритма машинного обучения при помощи заранее составленного набора данных. Модель достигла точности на уровне 70,7 %, что подтверждает успешное применение искусственного интеллекта в решении данной задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Алексей Романович Приходько, Денис Александрович Коваленко, Григорий Михайлович Жиляков

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Identification of License Plates Using Computer Vision and Neural Networks

The paper analyzes the application of the state-of-the-art YOLOv8 neural network for real-time object detection. Methods for processing text with complex structure and on arbitrary background, including the use of preliminary image binarization, are considered. An object detection model was developed based on a machine learning algorithm using a pre-computed dataset. The model achieved an accuracy of 70.7%, which confirms the successful application of artificial intelligence in solving this problem.

Текст научной работы на тему «Определение автомобильных номеров с применением компьютерного зрения и нейронных сетей»

Молодой исследователь Дона. 2024;9(4):42-45. elSSN 2500-1779

ТЕХНИЧЕСКИЕ НАУКИ

© ®

УДК 004.8

Определение автомобильных номеров с применением компьютерного зрения и нейронных сетей

А.Р. Приходько, Д.А. Коваленко, Г.М. Жиляков

Донской государственный технический университет, г. Ростов-на-Дону, Российская Федерация Аннотация

Проанализировано применение новейшей нейронной сети YOLOv8 для обнаружения объектов в режиме реального времени. Рассмотрены методы обработки текста со сложной структурой и на произвольном фоне, в том числе, с помощью предварительной бинаризации изображения. Модель обнаружения объектов разработана на основе алгоритма машинного обучения при помощи заранее составленного набора данных. Модель достигла точности на уровне 70,7 %, что подтверждает успешное применение искусственного интеллекта в решении данной задачи.

Ключевые слова: компьютерное зрение, искусственный интеллект, нейронные сети, классификация текста, YOLOv8, EasyOCR, OpenCV

Для цитирования. Приходько А.Р., Коваленко Д.А., Жиляков Г.М. Определение автомобильных номеров с применением компьютерного зрения и нейронных сетей. Молодой исследователь Дона. 2024;9(4):42-45.

Identification of License Plates Using Computer Vision and Neural Networks

Aleksei R. Prikhodko, Denis A. Kovalenko, Grigorii M. Zhilyakov

Don State Technical University, Rostov-on-Don, Russian Federation

Abstract

The paper analyzes the application of the state-of-the-art YOLOv8 neural network for real-time object detection. Methods for processing text with complex structure and on arbitrary background, including the use of preliminary image binarization, are considered. An object detection model was developed based on a machine learning algorithm using a pre-computed dataset. The model achieved an accuracy of 70.7%, which confirms the successful application of artificial intelligence in solving this problem.

Keywords: computer vision, artificial intelligence, neural networks, text classification, YOLOv8, EasyOCR, OpenCV

For citation. Prikhodko AR, Kovalenko DA, Zhilyakov GM. Identification of License Plates Using Computer Vision and Neural Networks. Young Researcher of Don. 2024;9(4):42-45.

Введение. С развитием технологий и увеличением количества автотранспорта на дорогах вопрос безопасности становится все более актуальным. Распознавание номерных знаков позволяет автоматизировать процессы контроля и безопасности на парковках, дорогах, в аэропортах и других общественных местах. Однако существует необходимость в разработке эффективных методов определения автомобильных номеров для улучшения качества работы автоматизированных систем, таких как системы контроля скорости, розыска угнанных транс-Ё портных средств и другие. Поэтому целью работы явилось изучение потенциала применения технологий компьютерного зрения на основе алгоритмов машинного обучения для распознавания автомобильных

тЗ

g регистрационных номерных знаков. Использование методов компьютерного зрения на основе алгоритмов

^ машинного обучения должно позволить создать высокоэффективную систему автоматического распознавания

ё1 автомобильных номеров, которая сможет обрабатывать кадры даже в различных неблагоприятных условиях. Л

Основная часть. Компьютерное зрение — это тип искусственного интеллекта, возможности которого позволяют производить распознавание, сегментацию и классификацию различных объектов на изображениях и видео [1]. Оно играет ключевую роль в развитии технологий, повышении эффективности и создании новых

© Приходько А.Р.. Коваленко ДА.. Жиляков Г.М.. 2024

возможностей в различных отраслях. Компьютерное зрение используется для автоматизации решения задач, имитирующих человеческие способности — зрения и восприятия человека.

Компьютерное зрение осуществляется благодаря сочетанию нижеописанных методов и технологий, которые позволяют компьютерам анализировать и понимать изображения.

- методы, основанные на машинном обучении, которые используют обучение моделей распознавания объектов на основе большого количества размеченных данных;

- методы, основанные на сегментации, осуществляющие процессы определения границ объектов на изображениях с последующим анализом получившихся сегментов;

- методы, основанные на признаках. Они используют наборы признаков об объектах для их обнаружения и классификации. Алгоритмы извлекают их из изображений и сравнивают с шаблонами объектов для получения заключения об обнаружении или классификации объекта;

- методы на основе дескрипторов. Эти методы используют описания (дескрипторы) ключевых точек на изображении для определения объектов. Дескрипторы могут быть использованы для сопоставления объектов на разных изображениях или для поиска объектов в базе данных;

- методы на основе глубокого обучения. Техники, основанные на глубоком обучении, задействуют сложные нейронные сети для извлечения характеристик из изображений и для обучения моделей, способных распознавать объекты. Глубокое обучение позволяет автоматически выявлять сложные иерархические структуры в данных.

Для обнаружения автомобильных номерных знаков и распознавания текста на них использовали метод на основе машинного обучения, так как он устойчив к вариациям, а именно к изменениям освещения, ракурса и других трансформаций объектов, а также метод на основе признаков для обнаружения и классификации объектов.

Для анализа эффективности данных методов был собран и подготовлен набор данных, содержащий изображения автомобильных номеров с различными условиями освещения, углами съемки, размытием и другими возможными искажениями. Ключевые характеристики, которые были учтены при создании набора данных:

1. Разнообразные условия освещения. Набор данных содержит изображения с ярким дневным светом, тенями, сумерками и ночным освещением. Это поможет нейронной сети научиться распознавать номера в различных условиях.

2. Различные углы съемки. Изображения включают номера автомобилей, снятые под разными углами и с разных расстояний. Это поможет модели быть устойчивой к изменениям перспективы.

3. Размытие и искажения. На некоторые изображения были добавлены эффекты размытия и шума, что поможет модели обучиться находить номера в реалистичных условиях.

4. Разнообразие автомобильных номеров. Набор данных содержит различные типы автомобильных номеров, включая номера разных стран, форматов и стилей написания.

5. Разнообразие фонов. Изображения автомобильных номеров содержат различные фоны, чтобы модель могла выделять номера в разных окружениях.

6. Объем данных. Набор данных содержит достаточно большое число изображений для эффективного обучения нейронной сети.

Создание такого разнообразного набора данных должно было позволить обучить нейронную сеть YOLOv8 находить автомобильные номера в различных условиях и с высокой точностью. Пример изображений с различными характеристиками приведён на рис. 1.

Молодой исследователь Дона. 2024;9(4):42-45. eISSN 2500-1779

Этот набор данных был использован для обучения и тестирования модели нейронной сети, а также для оценки качества её работы [2]. Для распознавания текста на полученных изображениях была выбрана технология EasyOCR. EasyOCR — это Python-модуль для извлечения текста из изображений, представляющий собой универсальный оптический распознаватель символов, который может распознавать как текст в естественных сценах, так и плотный текст в документах.

Для создания и обучения модели распознавания автомобильных номеров была выбрана технология YOLOv8, которая обеспечивает высокую эффективность распознавания объектов. Это новая версия модели обнаружения объектов YOLO (You Only Look Once), разработанная компанией Ultralytics [3]. Основные преимущества данной модели:

1. Новая система обнаружения без якоря.

2. Улучшенные свёрточные блоки, обеспечивающие более быструю и точную работу модели.

3. Данная модель включает реализации всех задач искусственного интеллекта в области зрения, основными задачами которой являются идентификация, сегментация и классификация [4].

После завершения процесса обучения модель проверяется на точность и ошибки. Точность показывает, как часто модель правильно предсказывает категории, а ошибка отражает разницу между прогнозируемыми и реальными значениями. Чем ниже ошибка, тем лучше работает модель. Однако максимизация точности не всегда приводит к минимизации ошибок, выбор метрики зависит от задачи. Результаты оценки модели на тестовых данных, а также другие метрики обучения представлены на графиках (рис. 2), составленных автоматически в результате обучения модели YOLOv8.

1,3

1,2

1,1

1,0

0,9

train/box loss

1,5

1,0

0,5

50 0

train/cls loss

1,20 1,15 1,10 1,05 1,00 0,95

train/dfl_loss metrics/precision(B) metrics/recall(B)

0,96

0,98 0,97 0,96 0,95 0,94

50 0

50 0

50 0

1,4

1,3

1,2

1,1

val/box loss

1,0

0,8

0,6

0,4 50 0

val/cls loss

val/dfl loss

metrics/mAP 50(B) metrics/mAP 50-95(B)

Results ---Smooth

S

13

¡3

о

&

Рис. 2. Автоматически созданные графики метрик обучения полученной модели YOLOv8

В результате проведенной работы была разработана нейросетевая модель для распознавания автомобильных номерных знаков. Оценка эффективности данной модели показала, что ее точность достигает 0,707 или 70,7 %. Этот показатель можно считать достаточно высоким, свидетельствующим об эффективности разработанного решения.

Заключение. Реализована модель распознавания с использованием методов компьютерного зрения и машинного обучения. Данная модель показала высокий уровень точности, что при создании системы видеонаблюдения с распознаванием автомобильных номеров играет ключевую роль в повышении безопасности на парковках и дорогах, обеспечивая эффективное и надежное функционирование системы контроля и мониторинга за счёт минимизации ошибок.

0

0

Список литературы

1. Huyen C. Designing Machine Learning Systems. USA: O'Reilly; 2022. 389 p.

2. Sarkis A. Training Data for Machine Learning: Human Supervision from Annotation to Data Science .USA: O'Reilly; 2023. 332 p.

3. Обзор YOLOv8. URL: https://docs.ultralytics.eom/ru/models/yolov8/#overview (дата обращения: 22.04.2024).

4. YOLOv8: A New State-of-the-Art Computer Vision Model. URL: https://yolov8.com/ (дата обращения: 24.04.2024).

Об авторах:

Алексей Романович Приходько, студент кафедры кибербезопасность информационных систем Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), iavert.hugo@vandex.ru

Денис Александрович Коваленко, студент кафедры кибербезопасность информационных систем Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), denkov1004@gmail.com

Григорий Михайлович Жиляков, студент кафедры кибербезопасность информационных систем Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), kuznechik1892@mail.ru

Конфликт интересов: авторы заявляют об отсутствии конфликта интересов.

Все авторы прочитали и одобрили окончательный вариант рукописи.

About the Authors:

Aleksei R. Prikhodko, Student of the Cybersecurity of Information Systems Department, Don State Technical University (1, Gagarin Sq., Rostov-on-Don, 344003, RF), iavert.hugo@yandex.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Denis A. Kovalenko, Student of the Cybersecurity of Information Systems Department, Don State Technical University (1, Gagarin Sq., Rostov-on-Don, 344003, RF), denkov 1004@gmail. com

Grigorii M. Zhilyakov, Student of the Cybersecurity of Information Systems Department, Don State Technical University (1, Gagarin Sq., Rostov-on-Don, 344003, RF), kuznechik1892@mail.ru

Conflict of Interest Statement: the authors do not have any conflict of interest.

All authors have read and approved the final manuscript.

ru.

.la

u o

&

i Надоели баннеры? Вы всегда можете отключить рекламу.