Научная статья на тему 'ДЕТЕКТИРОВАНИЕ ДОРОЖНЫХ ЗНАКОВ НА ОСНОВЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ YOLO'

ДЕТЕКТИРОВАНИЕ ДОРОЖНЫХ ЗНАКОВ НА ОСНОВЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ YOLO Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
352
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННОЕ ОБУЧЕНИЕ / ДОРОЖНЫЕ ЗНАКИ / СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / РАСПОЗНАВАНИЕ ОБРАЗОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Никитин Д.В., Тараненко И.С., Катаев А.В.

Данная статья представляет исследование, посвященное применению нейросетевой модели YOLOv8 для обнаружения дорожных знаков. В ходе исследования была разработана и обучена модель на основе YOLOv8, которая успешно детектируют дорожные знаки в реальном времени. Статья также представляет результаты экспериментов, в которых модель YOLOv8 сравнивается с другими широко используемыми методами обнаружения знаков. Полученные результаты имеют практическую значимость в области безопасности дорожного движения, предлагая инновационный подход к автоматическому обнаружению дорожных знаков, что способствует улучшению контроля скорости и снижению аварийности на дорогах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никитин Д.В., Тараненко И.С., Катаев А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ROAD SIGN DETECTION BASED ON THE YOLO NEURAL NETWORK MODEL

This article presents a research study dedicated to the application of the YOLOv8 neural network model for road sign detection. During the study, a model based on YOLOv8 was developed and trained, which successfully detects road signs in real-time. The article also presents the results of experiments in which the YOLOv8 model is compared to other widely used methods for sign detection. The obtained results have practical significance in the field of road traffic safety, offering an innovative approach to automatic road sign detection, which contributes to improving speed control, attentiveness, and reducing accidents on the roads.

Текст научной работы на тему «ДЕТЕКТИРОВАНИЕ ДОРОЖНЫХ ЗНАКОВ НА ОСНОВЕ НЕЙРОСЕТЕВОЙ МОДЕЛИ YOLO»

Детектирование дорожных знаков на основе нейросетевой модели YOLO

Д.В. Никитин, И.С. Тараненко, А.В Катаев.

Волгоградский государственный университет

Аннотация: Данная статья представляет исследование, посвященное применению нейросетевой модели YOLOv8 для обнаружения дорожных знаков. В ходе исследования была разработана и обучена модель на основе YOLOv8, которая успешно детектируют дорожные знаки в реальном времени.

Статья также представляет результаты экспериментов, в которых модель YOLOv8 сравнивается с другими широко используемыми методами обнаружения знаков. Полученные результаты имеют практическую значимость в области безопасности дорожного движения, предлагая инновационный подход к автоматическому обнаружению дорожных знаков, что способствует улучшению контроля скорости и снижению аварийности на дорогах.

Ключевые слова: машинное обучение, дорожные знаки, сверточные нейронные сети.

Введение

Традиционные методы контроля скорости, основанные на визуальном обнаружении дорожных знаков, часто требуют значительных усилий и затрат времени. Однако с развитием глубокого обучения и нейросетевых моделей появились новые перспективы в области автоматического обнаружения знаков.

Существует большое количество моделей сверточных нейронных сетей, упоминаемых в научных работах под номерами [1-3].

Преимуществами нейросетевых методов распознавания объектов на изображениях являются их доступная стоимость, быстрота и надежность в распознавании, способность обрабатывать искаженные и зашумленные изображения, а также возможность работы на маломощных вычислительных устройствах [4, 5].

К недостаткам можно отнести необходимость наличия достаточного объема исходных данных для анализа, а также сложность выбора подходящей архитектуры нейронной сети и продолжительность процесса обучения [4, 6].

В данной статье мы представляем исследование, направленное на разработку и применение нейросетевой модели YOLOv8 для детектирования дорожных знаков. YOLOv8 - это последняя версия популярной модели, которая отличается высокой точностью и эффективностью в задачах обнаружения объектов.

Примеры использования сверточных нейронных сетей для обработки изображений представлены в [7, 8].

Описание набора данных

Для обучения модели CNN был использован набор данных Traffic Signs Dataset in YOLO format - это набор данных, который используется для решения задач по детектированию и классификации дорожных знаков.

Набор данных состоит из 741 фотографии участков дорог с дорожными знаками в формате JPG, с высоким разрешением 1360х800 пикселей. Фотографии были сделаны в разное время суток, года и погоду, что делает этот набор данных более разнообразным и репрезентативным.

Каждому изображению в наборе данных соответствует файл аннотации в формате txt, содержащий информацию о координатах и классе каждого обнаруженного на изображении дорожного знака.

Аннотация в данном наборе данных использует четыре категории дорожных знаков:

1. Запрещающие знаки;

2. Предупреждающие знаки;

3. Предписывающие знаки;

4. Все остальные дорожные знаки.

На рисунке 1 продемонстрировано распределение классов в нашем наборе данных.

■ Запрещающие ■ Предупреждающие

■ Предписывающие ■ Остальные

Рис. 1. - Распределение классов в обучающем наборе

Создание модели CNN

YOLO (You Only Look Once) - это одноступенчатый алгоритм обнаружения объектов с открытом исходным кодом, являющийся одним из самых популярных архитектур для распознавания объектов в реальном времени [9]. YOLO основан на глубоких сверточных нейронных сетях (CNN), и использует алгоритмы обработки изображений, и машинного обучения для обнаружения объектов на изображениях.

YOLO отличается от альтернативных методов обнаружения объектов своими преимуществами. В отличие от подходов, использующих ограничивающие рамки и области (например, R-CNN), YOLO оперирует с полным кадром как в процессе обучения, так и в процессе тестирования. Это позволяет ему получать более полную контекстную информацию о распознанных классах объектов [10].

Принцип работы YOLO в распознавании дорожных знаков заключается в следующих шагах:

1. Подготовка данных. Входное изображение разбивается на сетку ячеек фиксированного размера. Каждая ячейка ответственна за обнаружение объектов, центр которых попадает в данную ячейку;

2. Препроцессинг изображения. Изображение дорожного знака подвергается нескольким этапам препроцессинга. Сначала изображение масштабируется до заданного размера, затем происходит нормализация пикселей, чтобы значения находились в диапазоне от 0 до 1;

3. Обнаружение объектов. Сверточные слои применяются для извлечения признаков изображения, которые затем подаются на полносвязный слой для классификации и определения ограничивающих рамок, которые содержат определенный объект с определенной вероятностью;

4. Пост-обработка. Используя результаты классификации и ограничивающих рамок, происходит фильтрация и устранение ложных срабатываний;

5. Отображение результатов. Получение рамки и класса объекта.

Для обучения модели, были использованы уже предобученные веса yolov8x, которые имеют 68,2 миллиона параметров, при этом обучение проходило на 25 эпохах с размером изображения 640x640px. Результаты

прохождения обучения предоставлены на рисунке 2.

Class Images Instances BoxfP R mAP50 mAP59-95)

all 88 132 0.988 0.915 0.982 0.828

trafficlight 88 19 0.989 0.789 0.958 0.671

stop 88 10 0.978 0.9 0.978 0.915

speedlimit 88 31 0.987 1 0.995 0.921

crosswalk 88 22 1 0.972 0.995 0.807

:02<00:00, 1.05s/it]

Speed: 1.7ms preprocess, 10.2ms inference, 0.0ms loss, 1.6ms postprocess per image

Рис. 2. - Результаты прохождения обучения В процессе обучения модели YOLOv8 было установлено, что по сравнению с другими методами детектирования обученных она обладает высокой точностью обнаружения объектов на нашем наборе данных. В

частности, YOLOv8 достигает точности обнаружения на уровне 98,2% по метрике тАР50.

Таблица 1 представляет сравнительный анализ моделей детектирования.

Таблица 1 - Сравнение моделей для детектирования_

Метод Точность (mAP50)

YOLOv5 0,944

YOLOv7 0,945

YOLOv8 0,982

RetinaNet 0,953

Тестирование модели

По результатам обучения точность представленной модели равна 98,2%.

На рисунке 3 предоставлены результаты обучения модели. 1,0

0,9

0,3

0,7

- тАР50

0,6

- ППАР50-95

- precision

0,5 — recall

5 10 15 20 25

Эпохи

Рис. 3. - Результаты обучения Для оценки эффективности обученной модели было проведено тестирование с использованием камеры смартфона Huawei Nova 10 разрешением 50 Мп. В рамках тестирования была осуществлена видеофиксация знаков дорожного движения. Для обеспечения надлежащей

чистоты эксперимента, движение транспортного средства при проведении тестирования производилось с соблюдением правил дорожного движения.

Тестирование проводилось в два этапа:

1. 12 мая 2023 года в ночное время суток;

2. 12 мая 2023 года в условиях облачной погоды.

На каждом этапе съемка продолжалась в течение 2 часов.

На рисунке 4 представлен пример детектирования дорожных знаков. Слева показаны фотографии с места обнаружения знаков, а справа -соответствующие искомые знаки, которые нужно было распознать. Эти примеры помогут наглядно оценить процесс распознавания дорожных знаков.

£

вртШгпИ 0.91

№9

I

ЭрёесШтЛ 0.81

Рис. 4. - Пример детектирования дорожного знака Входе проведения тестирования было обнаружено, что модель YOLOv8 эффективно детектировал все дорожные знаки, по мере их приближения.

Заключение

В данной статье было проведено исследование, в котором использовалась нейросетевая модель YOLOv8 для обнаружения знаков, дорожных знаков на дорогах. Разработанная и обученная модель на основе YOLOv8 успешно детектируют знаки дорожного движения.

Результаты обучения подтверждают превосходство модели YOLOv8 по сравнению с другими методами детектирования дорожных знаков.

Полученные результаты имеют практическую значимость в области безопасности дорожного движения. Использование инновационного подхода автоматического обнаружения дорожных знаков, предлагаемого моделью YOLOv8, может способствовать улучшению контроля скорости, внимательности и снижению аварийности на дорогах.

Литература

1. Деменкова Т.А., Шпиева Е.В. Построение моделей сверточной нейронной сети для решения задач распознавания образов // Научно-технический вестник Поволжья. 2020. №5. С. 76-79.

2. Матвеев Д.А., Петруничева А.С. Разработка модели сверточной нейронной сети для классификации российских дорожных знаков // Политехнический молодежный журнал. 2020. №9(50). С. 2-9.

3. Симанков В.С., Теплоухов С.В. Аналитическое исследование методов и алгоритмов искусственного интеллекта // Вестник адыгейского государственного университета. Серия 4: естественно-математические и технические науки. 2020. № 3(266). С. 16-25.

4. Сабиров А.И., Катасёв А.С., Дагаева М.В. Нейросетевая модель распознавания знаков дорожного движения в интеллектуальных транспортных системах // Компьютерные исследования и моделирование. 2021. №2. С. 429-435.

5. Катасёв А.С., Фаттахов Н.И. Нейросетевые модели обнаружения и классификации знаков дорожного движения // Вестник технологического университета. 2023. №3. С. 79-84.

6. Альдарф А., Шакер А. Сравнение скорости и точности обучения сверточных нейронных сетей реализованных на TensorFlow и Visual Studio Cuda на GPU // Инновационный потенциал развития науки в современном мире. 2022. С. 6-12.

7. Евсин В.А., Широбокова С.Н., Жжонов В.А., Евсина В.А. Моделирование и реализация процесса распознавания знаков дорожного движения при определении ситуации на дороге с помощью искусственных нейронных сетей // Инженерный вестник Дона. 2022. №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.

8. Евсин В.А., Широбокова С.Н., Жжонов В.А., Евсина В.А. Моделирование и реализация процесса определения дорожных объектов с применением аппарата сверточных сетей RetinaNet // Инженерный вестник Дона. 2022. №7. URL: ivdon.ru/ru/magazine/archive/n7y2022/7786.

9. Дьяченко А.А., Гущина О.М. Анализ этапов развития одноступенчатых детекторов объектов на основе YOLO // Информационные технологии в моделировании и управлении: подходы, методы, решения. 2022. С. 427-435.

10. Аксютина М.С., Гончарук С.Е. Распознавание объектов в видеопотоке при помощи алгоритма YOLO и технологии openface // Научно-техническое творчество аспирантов и студентов. 2018. С. 208-211.

References

1. Demenkova T.A., Shpieva E.V. Nauchno-texnicheskij vestnik Povolzhya. 2020. №5. pp. 76-79.

2. Matveev D.A., Petrunicheva A.S. Politexnicheskij molodezhny'j zhurnal. 2020. №9(50). pp. 2-9.

М Инженерный вестник Дона, №7 (2023) ivdon.ru/ru/magazine/arcliive/n7y2023/8531

3. Simankov V.S., Teplouxov S.V. Vestnik ady'gejskogo gosudarstvennogo universiteta. Seriya 4: estestvenno-matematicheskie i texnicheskie nauki. 2020. № 3(266). pp. 16-25.

4. Sabirov A.I., Katasyov A.S., Dagaeva M.V. Komp'yuterny'e issledovaniya i modelirovanie. 2021. №2. pp. 429-435.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Katasyov A.S., Fattaxov N.I. Vestnik texnologicheskogo universiteta. 2023. №3. pp. 79-84.

6. AlMarf A., Shaker A. Innovacionny'j potencial razvitiya nauki v sovremennom mire. 2022. pp. 6-12.

7. Evsin V.A., Shirobokova S.N., Zhzhonov V.A., Evsina V.A. Inzhenernyj vestnik Dona. 2022. №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.

8. Evsin V.A., Shirobokova S.N., Zhzhonov V.A., Evsina V.A. Inzhenernyj vestnik Dona. 2022. №7. URL: ivdon.ru/ru/magazine/archive/n7y2022/7786.

9. Dyachenko A.A., Gushhina O.M. Informacionny'e texnologii v modelirovanii i upravlenii: podxody\ metody\ resheniya. 2022. pp. 427-435.

10. Aksyutina M.S., Goncharuk S.E. Nauchno-texnicheskoe tvorchestvo aspirantov i studentov. 2018. pp. 208-211.

i Надоели баннеры? Вы всегда можете отключить рекламу.