ПОДГОТОВКА ДАТАСЕТА И ОБУЧЕНИЕ НЕЙРОСЕТИ ДЛЯ АВТОМАТИЗАЦИИ СТРОИТЕЛЬНЫХ ПРОЦЕССОВ

Созоник А.Г.

УДК 004.896

Созоник А.Г.

Московский политехнический университет (г. Москва, Россия)

ПОДГОТОВКА ДАТАСЕТА И ОБУЧЕНИЕ НЕЙРОСЕТИ ДЛЯ АВТОМАТИЗАЦИИ СТРОИТЕЛЬНЫХ ПРОЦЕССОВ

Аннотация: в работе исследуются современные используемые методы и алгоритмы, позволяющие автоматизировать процесс строительства.

Ключевые слова: автоматизация, строительство, датасет.

Автоматизация строительных процессов является ключевым фактором для повышения эффективности и качества строительства. Современные технологии позволяют создать системы, которые могут автоматизировать различные аспекты строительного производства, включая проектирование, управление, мониторинг и выполнение строительных работ.

Автоматизированные системы и машины способны выполнять задачи быстрее, чем ручной труд, что сокращает сроки строительства. Автоматизация позволяет оптимизировать процессы, уменьшая время простоя и повышая слаженность работы на строительной площадке. Точные и предсказуемые действия автоматизированных систем снижают вероятность ошибок, что уменьшает необходимость в доработках и исправлениях.

Автоматизация строительных процессов способствует снижению затрат на строительство. Автоматизация сокращает необходимость в ручном труде, что уменьшает затраты на заработную плату и рабочую силу. Точные расчеты и автоматизированное выполнение задач уменьшают количество отходов и перерасхода материалов. Сокращение сроков выполнения проектов позволяет

снизить общие затраты на строительство, включая аренду оборудования и временные сооружения.

Безопасность является одним из ключевых преимуществ автоматизации строительных процессов. Автоматизированные системы могут выполнять опасные задачи, такие как работа на высоте или с тяжелыми материалами, что снижает риск травмирования рабочих. Системы автоматического мониторинга могут отслеживать условия на строительной площадке и предупреждать о потенциальных опасностях. Возможность удаленного управления и контроля строительных процессов позволяет снизить необходимость присутствия людей в опасных зонах.

Подготовка датасета для обучения модели

Для использования нейронной сети нужно прежде всего обучить её, для этого используется dataset - набор данных.

Подготовка датасета включает в себя съемку изображений, аннотирование, предварительную обработку данных и формирование структуры папок. В результате данной работы был создан качественный датасет, пригодный для использования в задачах компьютерного зрения.

Основным источником данных для датасета послужили фотографии, сделанные собственноручно (рис. 2.1.1). Для получения изображений использовалась камера смартфона Google Pixel 7. Съемка производилась при разных условиях освещения и с различных углов, чтобы обеспечить разнообразие данных. Были приняты меры для того, чтобы избежать искажения изображения и добиться максимальной четкости снимков.

Для повышения качества данных был проведен отбор снимков с явными дефектами (размытость, пересветы, сильные тени). Это позволило исключить негативное влияние таких изображений на обучение модели. Для создания датасета было использовано 10 бетонных блоков разного размера и формы. Каждый блок был сфотографирован несколько раз с разных ракурсов, чтобы обеспечить больше примеров для обучения (рис. 2.1.2).

Для аннотирования изображений использовалась программа LabelImg, которая позволяет создавать разметку в формате XML, совместимом с форматом Pascal VOC. Этот формат поддерживается многими фреймворками для обучения моделей глубокого обучения, включая YOLOv4. LabelImg был выбран за его интуитивно понятный интерфейс и широкие возможности по настройке.

Каждое изображение было тщательно аннотировано, чтобы модель могла точно распознавать бетонные блоки на различных снимках. Аннотирование проводилось вручную для обеспечения точности и качества разметки. Было уделено внимание точности выделения границ объектов, что играет ключевую роль в обучении детектора объектов.

Для проверки качества аннотаций была проведена ручная проверка случайным образом выбранных изображений. Все выявленные ошибки были исправлены, что позволило улучшить общее качество разметки и, соответственно, повысить эффективность обучения модели.

Для обучения модели YOLOv4 требуются аннотации в формате TXT, где каждая строка содержит информацию о позиции и размере объекта в нормализованных координатах. Для конвертации из формата XML в формат TXT была написана специальная скрипт на Python.

Для обеспечения корректного обучения и оценки модели датасет был разделен на три подмножества:

- Train: 70% данных, использующихся для обучения модели. Это подмножество включает в себя разнообразные изображения, чтобы модель могла научиться распознавать объекты в различных условиях,

- Val: 20% данных, использующихся для валидации во время обучения. Это подмножество помогает контролировать процесс обучения и предотвращать переобучение,

- Test: 10% данных, использующихся для финальной оценки качества модели. Эти данные не использовались в процессе обучения и позволили объективно оценить производительность модели на новых данных.

Установка и настройка программного пакета для обучения модели.

Для установки и настройки программного обеспечения, необходимого для обучения модели YOLOv4, важно наличие операционной системе Windows. Нужно установить библиотеки Darknet, CUDA, а также различные зависимости и инструменты для работы с данными и тренировкой модели.

С официального сайта NVIDIA developer.nvidia.com/cuda-downloads была скачена последняя версия CUDA, совместимая с имеющейся видеокартой и системой. Следуя инструкциям мастера установки, обязательно нужно выбрать установку драйверов и инструментов для разработчиков. После установки CUDA необходимо добавить пути к библиотекам CUDA в переменные среды.

С официального сайта NVIDIA developer.nvidia.com/cudnn была скачена версия cuDNN, которая совместима с установленной версией CUDA. Скачанный архив необходимо разархивировать, а затем создать копии файлов в соответствующие директории CUDA.

Следующим шагом нужно установить пакет Desktop development with C++ для Visual Studio. После чего необходимо клонировать репозиторий Darknet с GitHub.

После скачивания нужно запустить проект при помощи файла darknet.sln в Visual Studio. В свойствах проекта нужно найти и отредактировать параметр "Additional Include Directories", добавив пути к установленным библиотекам.

В меню "Build" необходимо выбрать "Build Solution". После чего нужно дождаться окончания компиляции.

Далее необходимо скачать предобученные веса из официального репозитория и перенести их в папку проекта.

Итоговая модель.

После многократного итерационного процесса настройки и внесения изменений в конфигурационный файл модели YOLOv4, были достигнуты значительные улучшения в производительности модели. Начав с базовой

конфигурации и постепенно добавляя новые слои, изменяя их параметры и порядок, модель смогла адаптироваться под конкретный набор данных.

В ходе экспериментов были внесены следующие ключевые изменения в конфигурационный файл yolov4.cfg:

- увеличено количество сверточных слоев для улучшения способности модели извлекать признаки,

- добавлены слои сокращения (shortcut) для улучшения передачи информации через несколько слоев,

- использованы слои маршрутизации (route) для объединения выходов нескольких слоев.

Модель была обучена на 10000 изображениях, содержащих бетонные блоки. В процессе обучения были использованы оптимальные гиперпараметры, такие как скорость обучения, количество итераций и размеры пакетов. Обучение проводилось на рабочей станции с использованием GPU RTX4070ti, что позволило эффективно справиться с большими объемами данных и сложностью модели.

По результатам обучения были получены несколько графиков, по которым возможно оценить качество обучения.

После завершения обучения модель была протестирована на валидационном наборе данных. Из полученных графиков следует, что внесенные изменения значительно улучшили точность и производительность модели.

Ключевой метрикой, используемой для оценки детекторов объектов, является Mean Average Precision (mAP), равный 95,5.

Вывод.

Был разработан собственный набор данных с изображениями для обучения при помощи дополнительных ресурсов и программ.

Были созданы все необходимые файлы для непосредственного обучения нейронной сети.

Была проведена модификация модели с помощью изменения различных параметров для непосредственного улучшения показателей точности.

В конце была проведена контрольная проверка результативности обученной нейронной сети.

СПИСОК ЛИТЕРАТУРЫ:

1. Solem Jan Erik / Programming Computer Vision with Python / 2012;

2. Gevorgyan, M., Mamikonyan, A., & Escriva, D. M. (2019). OpenCV 4 with Python Blueprints. Packt Publishing;

3. A Comprehensive Review of YOLO Architectures in Computer Vision: From YOLOvl to YOLOv8 and YOLO-NAS [Электронный ресурс] / https://www.mdpi.eom/2504-4990/5/4/83 (дата обращения 10.05.2024);

4. YOLO-v1 to YOLO-v8: The Rise of YOLO and Its Complementary Nature toward Digital Manufacturing and Industrial Defect Detection [Электронный ресурс] / https://www.mdpi.eom/2075-1702/11/7/677 (дата обращения 5.05.2024);

5. Распознавание образов с помощью искусственного интеллекта [Электронный ресурс] / https://habr.com/ru/articles/709432/ (дата обращения 8.05.2024)

Sozonik A.G.

Moscow Polytechnic University (Moscow, Russia)

DATASET PREPARATION AND TRAINING NEURAL NETWORKS FOR AUTOMATION OF CONSTRUCTION PROCESSES

Abstract: the paper examines the modern methods and algorithms used to automate the construction process.

Keywords: automation, construction, dataset.

ПОДГОТОВКА ДАТАСЕТА И ОБУЧЕНИЕ НЕЙРОСЕТИ ДЛЯ АВТОМАТИЗАЦИИ СТРОИТЕЛЬНЫХ ПРОЦЕССОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Созоник А.Г.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Созоник А.Г.

DATASET PREPARATION AND TRAINING NEURAL NETWORKS FOR AUTOMATION OF CONSTRUCTION PROCESSES

Текст научной работы на тему «ПОДГОТОВКА ДАТАСЕТА И ОБУЧЕНИЕ НЕЙРОСЕТИ ДЛЯ АВТОМАТИЗАЦИИ СТРОИТЕЛЬНЫХ ПРОЦЕССОВ»