ИССЛЕДОВАНИЕ ЭФФЕКТИВНЫХ АРХИТЕКТУР СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ

Федотов И.С.

CC BY

117

19

i Надоели баннеры? Вы всегда можете отключить рекламу.

Журнал

Вестник науки

2023

Область наук

Компьютерные и информационные науки

Ключевые слова

СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / АРХИТЕКТУРЫ / ГЛУБОКОЕ ОБУЧЕНИЕ / ЭФФЕКТИВНОСТЬ / ИССЛЕДОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Федотов И.С.

Данная статья исследует современные архитектуры сверточных нейронных сетей (CNN) для задачи классификации изображений. Анализируется значимость архитектурных особенностей в достижении высокой точности классификации, рассматривая исторически значимую модель, такую как LeNet-5, а также более новые разработки, включая VGG и ResNet. Обсуждается эволюция архитектур сверточных нейронных сетей, выявляя вызовы, связанные с глубиной сетей, и представляет методы решения этих проблем. Заключение подчеркивает важность выбора оптимальной архитектуры, учитывая специфику задачи, доступные ресурсы и объем данных, и предполагает дальнейшее развитие области классификации изображений с использованием более мощных нейронных сетей

i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH ON EFFECTIVE CONVOLUTIONAL NEURAL NETWORK ARCHITECTURES FOR IMAGE CLASSIFICATION

This article explores contemporary architectures of convolutional neural networks (CNNs) for image classification tasks. The significance of architectural features in achieving high classification accuracy is analyzed, considering historically significant model such as LeNet-5, as well as more recent developments including VGG and ResNet. The evolution of convolutional neural network architectures is discussed, highlighting challenges associated with network depth and presenting methods to address these issues. The conclusion underscores the importance of selecting an optimal architecture, taking into account the task's specifics, available resources, and data volume, and implies the further advancement of the field of image classification through the utilization of more powerful neural networks.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ЭФФЕКТИВНЫХ АРХИТЕКТУР СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ»

УДК 004

Федотов И.С.

студент 4 курса САФУ Северный (Арктический) федеральный университет (г. Архангельск, Россия)

ИССЛЕДОВАНИЕ ЭФФЕКТИВНЫХ АРХИТЕКТУР СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ

Аннотация: данная статья исследует современные архитектуры сверточных нейронных сетей (CNN) для задачи классификации изображений. Анализируется значимость архитектурных особенностей в достижении высокой точности классификации, рассматривая исторически значимую модель, такую как LeNet-5, а также более новые разработки, включая VGG и ResNet. Обсуждается эволюция архитектур сверточных нейронных сетей, выявляя вызовы, связанные с глубиной сетей, и представляет методы решения этих проблем. Заключение подчеркивает важность выбора оптимальной архитектуры, учитывая специфику задачи, доступные ресурсы и объем данных, и предполагает дальнейшее развитие области классификации изображений с использованием более мощных нейронных сетей.

Ключевые слова: сверточные нейронные сети, классификация изображений, архитектуры, глубокое обучение, эффективность, исследование.

В последние десятилетия искусственный интеллект и глубокое обучение стали неотъемлемой частью многих сфер человеческой деятельности, включая компьютерное зрение и обработку изображений. Среди множества приложений, использующих технологии машинного обучения, классификация изображений выделяется особой важностью. Современные методы классификации изображений часто основаны на сверточных нейронных сетях (Convolutional

Neural Networks, CNN)[1], которые демонстрируют выдающуюся эффективность в распознавании и анализе визуальных данных.

Архитектура сверточных нейронных сетей представляет собой комплексную структуру слоев, спроектированных для обнаружения иерархических признаков в изображениях. Эффективная архитектура нейронной сети является ключевым фактором в достижении высокой точности классификации. С целью улучшения результатов, исследователи постоянно работают над созданием новых и оптимизацией существующих архитектур. Популярные архитектуры сверточных нейронных сетей[2]:

• LeNet-5: Разработанная Янь Лекуном в 1998 году, LeNet-5 была одной из первых успешных архитектур для распознавания рукописных

цифр. Она содержит сверточные слои, слои подвыборки и полносвязанные слои;

• VGG: VGG-архитектуры, предложенные группой ученых из Университета Оксфорда, славятся своей глубокой структурой с

повторяющимися сверточными слоями;

• ResNet: Архитектура ResNet предложена Каримом Хе и его коллегами в 2015 году. Основной идеей является использование skip-

connections, позволяющих обучать глубокие сети без проблем с затуханием градиента.

В силу постоянного развития компьютерных технологий и доступности больших объемов данных, исследователи сталкиваются с возможностью создания все более сложных и глубоких архитектур. Однако с ростом глубины сети возникают проблемы, такие как переобучение и затухание градиента. Для их решения были предложены различные техники, включая batch normalization[3], dropout и архитектурные инновации вроде ResNet.

Исследование эффективных архитектур сверточных нейронных сетей для классификации изображений является активной и важной областью в области глубокого обучения. Каждая новая архитектура привносит свои инновации и способы решения сложных задач. Однако выбор оптимальной архитектуры

зависит от конкретной задачи, объема данных и вычислительных ресурсов. В будущем можно ожидать дальнейшего развития этой области и создание еще более мощных и умных нейронных сетей для анализа и классификации изображений.

СПИСОК ЛИТЕРАТУРЫ:

1. Сверточная нейронная сеть, часть 1[Электронный ресурс] - URL: https://habr.com/ru/articles/348000/

2. Архитектуры нейросетей [Электронный ресурс] - URL: https://habr.com/ru/ companies/nix/articles/430524/

3. Batch normalization [Электронный ресурс] - URL: https://en.wikipedia.org/w iki/Batch_normalization

Fedotov I.S.

Northern (Arctic) Federal University (Archangelsk, Russia)

RESEARCH ON EFFECTIVE CONVOLUTIONAL NEURAL NETWORK ARCHITECTURES FOR IMAGE CLASSIFICATION

Abstract: this article explores contemporary architectures of convolutional neural networks (CNNs) for image classification tasks. The significance of architectural features in achieving high classification accuracy is analyzed, considering historically significant model such as LeNet-5, as well as more recent developments including VGG and ResNet. The evolution of convolutional neural network architectures is discussed, highlighting challenges associated with network depth and presenting methods to address these issues. The conclusion underscores the importance of selecting an optimal architecture, taking into account the task's specifics, available resources, and data volume, and implies the further advancement of the field of image classification through the utilization of more powerful neural networks.

Keywords: convolutional Neural Networks, image classification, architectures, deep learning, efficiency, research.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Федотов И.С.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федотов И.С.

RESEARCH ON EFFECTIVE CONVOLUTIONAL NEURAL NETWORK ARCHITECTURES FOR IMAGE CLASSIFICATION

Текст научной работы на тему «ИССЛЕДОВАНИЕ ЭФФЕКТИВНЫХ АРХИТЕКТУР СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ»