СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЕ И ОБЩЕСТВЕННЫЕ НАУКИ
УДК 004
Повышение эффективности использования компьютерного зрения К.К. Казарян
Донской государственный технический университет (г. Ростов-на-Дону, Российская Федерация)
Аннотация. Проанализированы понятия «компьютерное зрение» и «машинное зрение», отмечены их отличия, определена цель создания машинного зрения, названы его основные задачи и методы реализации. Рассмотрены история появления и развития этой технологии, этапы распознавания информации, а также особенности применения машинного зрения на производстве, в транспортной и других отраслях хозяйствования. Представлены решения проблем повышения эффективности и точности функционирования систем безопасности при мониторинге и управлении транспортными потоками. Целью данной работы является создание алгоритма, позволяющего улучшить дорожную инфраструктуру с помощью компьютерного зрения.
Ключевые слова: компьютерное зрение, машинное зрение. Improving the Efficiency of Computer Vision
Katorina K Kazaryan
Don State Technical University (Rostov-on-Don, Russian Federation)
Abstract. The paper analyzes the concepts of computer and machine vision, their differences, the purpose of creating machine vision, its main tasks, and methods for implementing computer vision. The history of the emergence and development of this technology, the stages of information recognition, as well as the features of the application of machine vision in various fields are considered. A solution to the problem of increasing the efficiency and accuracy of information security systems in monitoring and managing traffic flows is presented, and the advantages of the method are described.
Keywords: computer vision, machine vision.
Введение. Машинное зрение — это область искусственного интеллекта, которая включает в себя разработку алгоритмов и методов, позволяющих правильно интерпретировать цифровые изображения с помощью компьютера. Конечная цель визуального восприятия компьютера — имитировать человеческое зрение, распознавать объекты, отслеживать движение и устанавливать их пространственные взаимосвязи.
Автоматизированный анализ изображений имеет большое значение во многих областях человеческой деятельности, включая здравоохранение, различные системы безопасности, автомобилестроение, сфера развлечений и др.
История машинного зрения берет начало в 1950-х годах, когда нейрофизиологи начали проводить эксперименты с кошками, чтобы понять, как их мозг реагирует на визуальные стимулы [1]. Было установлено, что мозг животного первоначально реагирует на грубые очертания фигур или линии, что указывает на то, что интеллектуальная обработка изображений начинается с наиболее простых форм. Это открытие привело к разработке первой технологии машинного визуального анализа, с помощью которой оцифровывались картинки.
В 1960-х годах искусственный интеллект стал академическим предметом и ученые начали разрабатывать алгоритмы для имитации человеческого зрения. В 1974 году была представлена технология оптической интерпретации символов (OCR), которая позволяла узнавать любой шрифт и воспринимать текст. Аналогичным образом система интеллектуального распознавания букв и других символов (ICR) может прочитать рукописный текст с помощью нейросетей. OCR и ICR были внедрены в некоторых программы, которые производят обработку счетов-фактур и прочих документов, считывают номера автотранспорта, осуществляют мобильные платежи и машинный перевод.
Основная часть. Машинное зрение — быстро развивающаяся область искусственного интеллекта, которая обладает огромным потенциалом. Имитируя человеческое зрение и восприятие, машины распознают и
интерпретируют цифровые картинки и видеоряды, что, в свою очередь, позволяет находить им широкое применение.
Компьютерное зрение часто сравнивают с человеческим, которое представляет собой сложный процесс, состоящий из нескольких этапов обработки изображений [2]. Человеческий глаз фиксирует изображение, которое затем отправляется в мозг для интерпретации. Мозг анализирует его, запуская различные когнитивные процессы, а потом идентифицирует и классифицирует объект на изображении.
Машинное зрение предполагает использование камер, алгоритмов, компьютеров для интерпретации цифровых изображений и видео. Первым шагом в реализации технологии машинного зрения является захват изображения с помощью камеры или датчика. Как только изображение получено, оно обрабатывается компьютером. Алгоритмы анализируют изображение, чтобы идентифицировать узоры, формы и другие особенности, которые имеют отношение к поставленной задаче.
Машинное зрение в значительной степени зависит от уже имеющихся на данный момент данных. Большие наборы изображений и видео используются для обучения моделей, которые затем опять применяются для анализа новых изображений и видео. Модель машинного обучения может лучше выполнять свои задачи, если будет иметь доступ к большему количеству данных.
В компьютерном зрении используются метод глубокого обучения и сверхточные нейронные сети (CNN) [3]. Глубокое обучение использует нейросети для анализа и интерпретации данных. CNN — это такой вид алгоритма глубокого обучения, который наиболее эффективен для задач распознавания изображений.
Еще один метод, используемый в компьютерном зрении — это обнаружение объектов, он включает в себя идентификацию и локализацию предметов на изображении.
Автоматизированный анализ визуальной информации применяется для распознавания объектов и их отслеживания [4]. Он включает в себя использование алгоритмов машинного зрения для идентификации и отслеживания предметов на изображении или в видеопотоке. Распознавание может применяться в самых разных областях, например в розничной торговле, на производстве и в сфере безопасности.
Большое значение автоматизированный анализ изображений имеет и при распознавании лиц, и в биометрии. Благодаря алгоритмам компьютерного зрения специализированные программы способны идентифицировать людей на основе черт их лиц.
Биометрическая идентификация также часто используется на пограничном контроле, в банковском деле и здравоохранения. Анализируя уникальные особенности, такие как отпечатки пальцев, узоры радужной оболочки глаз и структура лица, программные алгоритмы идентифицируют людей с высокой степенью точности.
Автоматизированный анализ изображений нашел применение и в цифровой обработке визуальных медицинских данных: это рентгеновские снимки, изображения МРТ и компьютерной томографии. Анализируя эти снимки, специализированные программы выявляют отклонения в состоянии исследуемых органов человека, что помогает в диагностике и отслеживании динамики заболеваний.
Самоуправляемые автомобили — еще одна область применения автоматизированного анализа изображений. Алгоритмы компьютерного зрения используются для обработки информации с камер и датчиков, установленных на автомобиле, позволяя ему «видеть» окружающую среду и ориентироваться в ней. Этот процесс включает в себя идентификацию и отслеживание других транспортных средств, пешеходов и препятствий, а также принятие решений в режиме реального времени о том, как на них реагировать.
На сегодняшний день система мониторинга и управление транспортными потоками имеет ряд недостатков: светофоры настроены таким образом, что они выделяют время для движения только одного направления, даже если плотность транспортного потока низка, не учитывают изменчивость пешеходного потока, что приводит к задержке передвижения пешеходов.
Для устранения этих недостатков был разработан алгоритм управления светофорами с использованием компьютерного зрения. Данный алгоритм может быть реализован следующим образом:
1. Установка камер: система управления светофорами должна включать в себя установку видеокамер на перекрестке для мониторинга плотности транспортного потока и скорости движения.
2. Обработка данных: данные, полученные с камер, передаются на сервер для обработки. Система компьютерного зрения использует алгоритмы обработки изображений, чтобы определить количество автомобилей на дороге и скорость их движения.
3. Принятие решений: на основе данных, полученных с камер и обработанных на сервере, система принимает решение о необходимости изменения цвета светофора для каждого направления движения. Например, если на одной из дорог наблюдается высокая плотность транспортного потока и низкая скорость движения, система может продлить время зеленого света для этого направления, чтобы обеспечить более эффективное движение автомобилей.
4. Управление светофорами: после принятия системой какого-либо решения команды по управлению светофорами передаются на устройства, контролирующие светофоры на перекрестке. Например, если система решает продлить время зеленого света для одного из направлений, то зеленый сигнал будет продолжать гореть дольше, чем обычно.
Таким образом, система управления светофорами с использованием компьютерного зрения позволит более эффективно управлять транспортными потоками, учитывая плотность и скорость движения автомобилей и пешеходов.
Заключение (выводы). Разработан алгоритм по улучшению дорожной инфраструктуры с помощью компьютерного зрения. Он позволит автоматически определять неисправности светофоров, невидимые дорожные знаки, пересечение несанкционированных маршрутов, выявлять проблемные участки дороги и своевременно принимать меры к их устранению. Все это позволит повысить безопасность, комфортность и эффективность транспортного движения.
Библиографический список
1. Шалагинов А. История компьютерного зрения. Telecom & IT. URL: https://shalaginov.com/2020/05/16/computer-vision-history (дата обращения: 15.04.2023).
2. Зуйкова А. Что такое компьютерное зрение и где его применяют? РБК. Тренды. URL: https://trends.rbc.ru/trends/industry/5f1f007e9a794756fafbfa83 (дата обращения: 14.04.2023).
3. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. Москва: Вильямс; 2004. 928 с.
4. Зачем нужны системы машинного зрения. Vision machines. URL: https://visionmachines.ru/articles/s chego nachat/zachem nuzhny sistemy mashinnogo zreniya/ (дата обращения: 15.04.2023).
Об авторе:
Казарян Каторина Камоевна, студент кафедры «Вычислительные системы и информационная безопасность» Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), kazaryan katorina@mail.ru
About the Author:
Katorina K Kazaryan, student of the Computer Systems and Information Security Department, Don State Technical University (1, Gagarin Sq., Rostov-on-Don, 344003, RF), kazaryan_katorina@mail.ru