ОБОСНОВАНИЕ ВЫБОРА АРХИТЕКТУРЫ НЕЙРОННОЙ СЕТИ ДЛЯ ПЕРСПЕКТИВНОГО ПРОГРАММНО-АППАРАТНОГО КОМПЛЕКСА АНАЛИЗА ДВИГАТЕЛЬНОЙ АКТИВНОСТИ МЕЛКИХ ЛАБОРАТОРНЫХ ЖИВОТНЫХ
© 2023 К. С. Макаров1, А. В. Улинов2, П. А. Чаплыгин3, Е. А. Бородина4
1 научный руководитель, кандидат технических наук, доцент кафедры программного обеспечения и администрирования информационных систем
e-mail: [email protected]
2 3 студент 2 курса бакалавриата направления подготовки «Информатика и вычислительная техника» e-mail: [email protected] e-mail: [email protected]
Курский государственный университет
4 студент 4 курса специалитета направления подготовки ««Лечебное дело» e-mail: katyusha.borodina.01 @mail.ru
Курский государственный медицинский университет
В работе проведен анализ нейросетевых архитектур для разработки программного обеспечения программно-аппаратного комплекса определения физиологических параметров и анализа двигательной активности мелких лабораторных животных. Представлены основные этапы формирования набора данных для обучения нейросетевых моделей.
На полученном датасете проведено сравнение наиболее эффективных при детектировании объектов на изображениях архитектур нейронных сетей YOLOv8 и SSD MobileNetV2. Приведены результаты обучения и показано, что обученные нейронные сети могут быть использованы в составе гибридной интеллектуальной системы при разработке программного обеспечения программно-аппаратного комплекса анализа двигательной активности мелких лабораторных животных.
Ключевые слова: нейросетевая архитектура, программно-аппаратный комплекс, физиологические параметры, двигательная активность.
JUSTIFICATION OF NEURAL NETWORK ARCHITECTURE SELECTION FOR A PERSPECTIVE SOFTWARE-HARDWARE COMPLEX OF MOTOR ACTIVITY ANALYSIS OF SMALL LABORATORY ANIMALS
© 2023 K. S. Makarov1, A.V. Ulinov2, P. A. Chaplygin3, E. A. Borodina4
1 Sciencific supervisor, Candidate of Technical Sciences, Associate Professor of the Department of Software and Information Systems Administration e-mail: [email protected]
2,3 2nd year student in “Informatics and Computer Engineering ” e-mail: [email protected] e-mail: [email protected]
Kursk State University
4 4th year specialist student in “Medicine ” e-mail: katyusha.borodina.01 @mail.ru
Kursk State Medical University
The article presents an analysis of neural network architectures for the development of software-hardware complexes for determining physiological parameters and analyzing motor activity of small laboratory animals. The main stages of data preparation for neural network models training are described. A comparison of the most effective neural network architectures YOLOv8 and SSD MobileNetV2 for object detection on images is carried out on the obtained dataset. The results of the training are presented, and it is shown that the trained neural networks can be used as part of a hybrid intelligent system in the development of software-hardware complexes for analyzing motor activity of small laboratory animals.
Keywords: neural network architecture; hardware and software complex; physiological parameters; motor activity.
В настоящее время в медицине существует значительный интерес к развитию новых методов исследования двигательной активности мелких лабораторных животных, так как это позволит усовершенствовать диагностику повреждений центрального и периферического отделов нервной системы. Сбор необходимых данных для проводимых исследований производятся вручную студентами, научными работниками, врачами [1]. Данный подход не только требует значительных затрат времени и усилий, но также является субъективным, что влияет на точность и надежность результатов. Создание программно-аппаратного комплекса, который сможет автоматизировать процесс исследования двигательной активности, может существенно упростить работу научных и медицинских работников и повысить качество получаемых результатов.
Одним из ключевых моментов при разработке программного обеспечения такого комплекса является обоснование выбора нейросетевых моделей и архитектур, от которых напрямую будут зависеть результаты работы комплекса.
В связи с этим целью данной работы является обоснование выбора моделей нейронных сетей для разработки программного обеспечения программно-аппаратного комплекса определения физиологических параметров и анализа двигательной активности мелких лабораторных животных с использованием методов машинного обучения.
В работе [2] было показано, что наиболее эффективными архитектурами нейронных сетей при решении задачи обнаружения объектов на изображении являются нейронные сети семейств YOLO и SSD.
На момент написания научно-исследовательской работы новейшей версией модели нейронной сети, основанной на архитектуре YOLO, является YOLOv8, эффективность которой по сравнению с предыдущими версиями была продемонстрирована разработчиками [3], поэтому, как более новая версия сравниваемой модели, она была выбрана в качестве используемой в дальнейшем.
YOLOv8 (You Only Look Once) - это быстрая и эффективная архитектура нейронной сети, которая обнаруживает объекты на изображениях, используя только один прогон изображения через нейронную сеть. Архитектура нейронной сети представлена на изображении (рис. 1).
Рис. 1. Архитектура YOLOv8
SSD (Single Shot MultiBox Detector) - это архитектура нейронной сети для детектирования объектов на изображениях [4]. Она также использует один прогон изображения через нейронную сеть и множество различных размеров bounding Ьох'ов для обнаружения объектов. SSD MobileNet V2 - это архитектура нейронной сети, оптимизированная для мобильных устройств, которая позволяет быстро и эффективно детектировать объекты на изображениях (рис. 2) [4].
Рис. 2. Архитектура SSD MobileNetV2
Для обучения нейронных сетей, используемых для определения объектов на изображениях, важным этапом является формирования датасета. Для этого необходимо собрать и обработать фотографии, наиболее приближенные к тем, которые будут в дальнейшем использоваться для обнаружения на них определенных классов.
Для формирования датасета на базе экспериментально-биологической клиники лаборатории физиологии двигательной активности научно-исследовательского института физиологии Курского государственного медицинского университета были записаны видеоролики в различном освещении с участием лабораторных животных в
том же ракурсе, в котором студенты и преподаватели делают их в ручном режиме для проведения исследования (рис. 3).
Рис. 3. Пример изображения лабораторного животного
Видеоролики были приведены к виду серии отдельных изображений с помощью Python скрипта, это было необходимо для дальнейшей разметки изображений и использования их как обучающего набора данных.
Одним из ключевых этапов работы с графическими данными является разметка изображений, которая включает в себя выделение и аннотацию на изображении объектов, которые нейронная сеть будет обучаться распознавать. Разметка в ходе проведения исследования проводилась с помощью инструмента разметки с открытым исходным кодом CVAT (Computer Vision Annotation Tool) (рис. 4) [5].
Рис. 4. Главное окно CVAT
После разметки данных датасет должен быть разделен на обучающую, валидационную и тестовую выборки. Обучающая выборка используется для обучения нейронной сети, валидационная выборка - для корректировки настраиваемых параметров сети в процессе обучения, а тестовая выборка - для оценки ее производительности и точности. Данная задача была решена с помощью онлайн-инструмента Roboflow [6].
Важно также учитывать, что для эффективного обучения нейронной сети необходимо иметь достаточно большой и разнообразный набор данных, включающий изображения объектов в разных условиях освещения, разных ракурсах, с различными фонами и т.д. Только так можно достичь высокой точности и производительности модели в реальных условиях использования.
В связи с этим в Roboflow также была проведена аугментация данных - поворот уже размеченных изображений на 90, 180 градусов, отражение их по вертикали и горизонтали для того, чтобы повысить разнообразие набора данных.
По итогу проделанной работы был получен набор данных, состоящий из 455 изображений, готовых к обучению нейронных сетей (рис. 5).
455 images View All Images »
TRAIN! TEST SPLIT
Training Set Validation Set Testing Set 4%
395 images 40 images 20 images
PREPROCESSING Auto-Orient: Applied Resize: Stretch to 640x640
AUGMENTATIONS Outputs per training example: 3 Flip: Horizontal, Vertical 90° Rotate: Ciockwise, Counter-Clockwise, Upside Down
DETAILS Version Name: 2023-03-28 3.56pm
Version ID: 1
Generated: Мзг 28, 2023 Annotation Group: rat-paws
Рис. 5. Набор данных с применёнными методами предобработки
Для обучения выбранных нейронных сетей был использован Google Colab -инструмент, предоставляющий доступ к облачным серверам с аппаратным обеспечением, достаточным для использования в целях глубокого обучения. Обучение модели YOLOv8 проводилось в количестве 50-ти эпох с фиксированным размером входных изображений 640x480 пикселей. Результаты обучения представлены на рисунке 6.
Рис. 6. Графики обучения модели YOLOv8
По итогу обучения модели она была протестирована на нескольких примерах изображений, которые модель не встречала в обучении. Оценка показателей точности нейронной сети на тестовых данных сопоставима со значениями, полученными в процессе обучения на валидационных примерах. Пример работы алгоритма на тестовых данных можно увидеть на рисунке 7.
Рис. 7. Результат работы обученной модели YOLOv8
YOLOv8 для задачи распознавания объектов на изображении использует графический процессор и больше всего подходит для распознавания в реальном времени. Модель показала достаточно высокий результат, обеспечивая точность на уровне 89-92%.
Следующим шагом было обучение нейронной сети SSD MobileNetV2. Данная модель обучалась в течение 4000 эпох и использовала батч размером 16 изображений (рис. 8).
Такая разница в количестве эпох обучения обусловлена тем, что в архитектуре YOLO используется большее количество параметров и совмещенная функция потерь, оптимизированная для задачи детекции объектов. Это позволяет повысить качество обучения и достичь высокой точности с меньшим количеством эпох. В то же время MobileNetV2, разработанная для мобильных устройств и ограниченных вычислительных ресурсов, может быстро сойтись, но не достигнуть требуемого результата по точности, в отличие от более глубокой модели, из-за чего потребовалось большее количество эпох обучения.
Рис. 8. Графики обучения модели SSD MobileNetV2
Столь высокая точность в условиях небольшого объема обучающего набора данных, а также ограничения вычислительных мощностей доказывает эффективность используемой архитектуры в решении задач компьютерного зрения при использовании решений на мобильных и встраиваемых устройствах.
Таким образом, в результате были собраны и предобработаны типовые данные, обучены и протестированы две нейронные сети для задачи распознавания объектов на изображениях: YOLOv8 и SSD MobileNetV2. Обучение проводилось с использованием Google Colab, обеспечивающего доступ к вычислительным ресурсам, необходимым для глубокого обучения. YOLOv8 обучалась в течение 50 эпох, достигая точности 89-92%, и была протестирована на изображениях, не встречавшихся в обучении. SSD MobileNetV2 обучалась в течение 4000 эпох и была опробована на мобильных устройствах, показывая высокую точность в условиях ограниченных вычислительных ресурсов (рис. 9).
Рис. 9. Результат работы обученной модели MobileNetV2
Обученные нейросетевые модели обеспечили как высокую точность (в среднем выше 90%), так и быстродействие (не более 300 мс на распознавание одного изображения). Это подтверждает эффективность выбранных архитектур нейронных сетей для решения задачи обнаружения лап мелких лабораторных животных в условиях медицинского эксперимента. В дальнейшем обученные нейронные сети могут быть использованы в составе гибридной интеллектуальной системы при разработке программного обеспечения программно-аппаратного комплекса анализа двигательной активности мелких лабораторных животных.
Библиографический список
1. Нотова, С. В. Современные методы и оборудование для оценки поведения лабораторных животных (обзор) / С.В. Нотова, Т.В. Казакова, О.В. Маршинская // Животноводство и кормопроизводство. 2018. № 1 [Электоронный ресурс]. - URL: https://cyberleninka.ra/article/n/sovremennye-metody-i-oborudovanie-dlya-otsenki-povedeniya-laboratomyh-zhivotnyh-obzor (дата обращения: 15.04.2023).
2. Balafas, V.K. Computational Comparison of Deep Learning Algorithms for Object
Detection. 2021 / V.K. Balafas, N. Ploskas [Электоронный ресурс]. - URL:
https://www.researchgate.net/publication/358891731_Computational_Comparison_of_Deep_ Leaming_Algorithms_for_Object_Detection (дата обращения: 16.04.2023).
3. What is YOLOv8? The Ultimate Guide [Электронный ресурс]. - URL: https://blog.roboflow.com/whats-new-in-yolov8/ (дата обращения: 16.04.2023).
4. What is MobileNet SSD v2? [Электронный ресурс]. - URL:
https://roboflow.com/model/mobilenet-ssd-v2 (дата обращения: 16.04.2023).
5. Computer Vision Annotation Tool [Электронный ресурс]. - URL: https://www.cvat.ai/ (дата обращения: 16.04.2023)
6. Roboflow: Give your software the power to see objects in images and video. [Электронный ресурс]. - URL: https://roboflow.com/ (дата обращения: 16.04.2023)