Научная статья на тему 'ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В МОБИЛЬНЫХ БРАУЗЕРАХ'

ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В МОБИЛЬНЫХ БРАУЗЕРАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
12
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компьютерное зрение / глубокое обучение / обнаружение объектов / распознавание объектов / технологии распознавания лиц / computer vision / deep learning / object detection / object recognition / facial recognition technologies

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Череповский М.В., Винокур А.И.

В работе рассматриваются основные концепции компьютерного зрения, такие как обработка изображений, распознавание образов, отслеживание движения и распознавание сцен. Систематизированы целевые подходы и применяемые методы компаниями при внедрении компьютерного зрения на современном этапе, что позволяет выявить их значимость и потенциал применения в различных областях применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPLORING THE POSSIBILITIES OF COMPUTER VISION IN MOBILE BROWSERS

Paper discusses the basic concepts of computer vision, such as image processing, pattern recognition, motion tracking and scene recognition. The targeted approaches and methods used by companies in the implementation of computer vision at the present stage are systematized, which makes it possible to identify their significance and potential for application in various fields of application.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В МОБИЛЬНЫХ БРАУЗЕРАХ»

УДК 004.01 Череповский М.В., Винокур А.И.

Череповский М.В.

магистрант кафедры Информатики и информационных технологий Московский политехнический университет (г. Москва, Россия)

Винокур А.И.

д-р тех. наук, проф.,

профессор кафедры Информатики и информационных технологий Московский политехнический университет (г. Москва, Россия)

ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ В МОБИЛЬНЫХ БРАУЗЕРАХ

Аннотация: в работе рассматриваются основные концепции компьютерного зрения, такие как обработка изображений, распознавание образов, отслеживание движения и распознавание сцен. Систематизированы целевые подходы и применяемые методы компаниями при внедрении компьютерного зрения на современном этапе, что позволяет выявить их значимость и потенциал применения в различных областях применения.

Ключевые слова: компьютерное зрение, глубокое обучение, обнаружение объектов, распознавание объектов, технологии распознавания лиц.

В последние годы машинное обучение пережило период стремительного развития, привнесшего с собой значительные инновации и трансформации в различные области науки, технологий и бизнеса. Новые методы и алгоритмы, а также более доступные вычислительные ресурсы, вместе с огромным объемом данных, стали ключевыми факторами, способствующими этому прогрессу.

Машинное обучение стало неотъемлемой частью многих сфер, включая медицину, финансы, производство, торговлю, а также повседневную жизнь, проникая в умные устройства, автономные автомобили и многое другое [1, с. 8]. Этот процесс привел к созданию новых методологий, улучшению существующих подходов и повышению эффективности решения различных задач.

Искусственный интеллект (ИИ) ускоряет построение моделей и интегрирует многочисленные дисциплинарные исследовательские процессы. В сфере производства междисциплинарных знаний определение проблем и приоритеты исследований больше не вытекают исключительно из одной дисциплинарной точки зрения, а все больше формируются социальными потребностями. В последние годы произошел всплеск производства междисциплинарных знаний из-за возросшей обеспокоенности общественности по поводу таких тем, как окружающая среда, здоровье, общение и конфиденциальность. Используя большие данные и передовые алгоритмы, ИИ превосходно создает точные модели, адаптированные для решения проблем. Кроме того, интеллектуальные компьютерные системы поддерживают принятие решений в режиме реального времени, часто превосходя возможности принятия решений человеком. Также при помощи машинного зрения компьютеры могут распознавать объекты, обнаруживать и классифицировать образы, анализировать поведение и взаимодействие с окружающей средой [2, с.3].

Рассмотрим постановку целей, которые ставят перед собой компании при разработке и внедрении систем компьютерного зрения.

1. Улучшение клиентского опыта: использование искусственного интеллекта для создания чат-ботов, виртуальных ассистентов и систем обработки естественного языка (NLP) помогает компаниям предоставлять более эффективный и персонализированный сервис своим клиентам. Это может включать ответы на вопросы, помощь в выборе товаров или услуг, обработку рекламных запросов.

2.Автоматизация процессов: модели с внедрением искусственного интеллекта при общении могут использоваться для автоматизации рутинных задач, таких как обработка запросов в службе поддержки, обработка заказов или бронирований, что позволяет компаниям сократить затраты на персонал и повысить эффективность операций.

3.Создание интеллектуальных продуктов и сервисов: разработка моделей с внедрением искусственного интеллекта для общения может стать основой для создания новых инновационных продуктов и сервисов. Например, это может быть встроенный в устройства голосовой помощник, который помогает пользователям совершать покупки, находить информацию или управлять умным домом.

4.Анализ данных и получение инсайтов: системы обработки естественного языка могут использоваться для анализа текстовых данных, таких как обзоры пользователей, отзывы, комментарии в социальных сетях и т. д., что позволяет компаниям получать ценные инсайты о своих продуктах и услугах, а также о потребностях и предпочтениях своих клиентов.

Одним из главных факторов, способствующих прорывам в компьтерном зрении, является развитие глубокого обучения и сверточных нейронных сетей. Глубокое обучение позволяет моделям обучаться на больших объемах данных и извлекать сложные признаки из изображений [3, с.2]. Эти сети могут автоматически изучать представления объектов и различных атрибутов, что делает их незаменимыми инструментами для компьютерного зрения [4, с.3].

Обнаружение и распознавание объектов являются важными задачами машинного зрения. Прорывы в этой области позволяют компьютерам точно и быстро идентифицировать объекты на изображениях или в реальном времени [5, с.7]. Продвижения в области обнаружения и распознавания объектов способствуют повышению безопасности и эффективности в различных сферах жизни.

Распознавание лиц и эмоций - это еще одна важная область применения компьютерного зрения. Технологии распознавания лиц активно используются в

системах аутентификации, видеонаблюдении и социальных медиа. С развитием машинного зрения компьютеры стали способными точно определять лица и идентифицировать их на изображениях и видео. Кроме того, системы распознавания эмоций могут анализировать выражения лиц и определять эмоциональное состояние человека [6, с. 9]. Это открывает новые возможности в области маркетинга, психологии и социальных исследований [7, с. 4].

Автономные транспортные средства - это одно из наиболее захватывающих применений машинного зрения в современном мире. Автомобильная промышленность активно исследует и разрабатывает технологии, которые позволяют автономным транспортным средствам распознавать объекты внешней окружающей среды.

Машинное зрение позволяет автономным транспортным средствам обнаруживать и распознавать различные объекты на дороге, такие как другие автомобили, пешеходы, велосипедисты и дорожные знаки. Системы компьютерного зрения способны анализировать все потоки с видеокамер и использовать алгоритмы распознавания образов для точного и быстрого определения объектов.

Машинное зрение помогает АТС автономным транспортным средствам анализировать дорожную ситуацию и принимать соответствующие решения. Это включает определение скорости и направления движения объектов, прогнозирование их траекторий и оценку препятствий. Благодаря машинному зрению автономные транспортные средства могут безопасно перемещаться по дороге и реагировать на изменения в окружающей среде [8, с 9].

На основании вышеизложенного следует отметить, что появление искусственного интеллекта и машинного обучения знаменует собой поворотный момент в истории человечества, беспрецедентно изменяя различные аспекты нашей жизни. Их значимость в современном мире невозможно переоценить, поскольку от здравоохранения до финансов, от образования до транспорта - они меняют стереотипы и открывают новые возможности для исследований и развития, обладают огромным потенциалом

для решения некоторых из наиболее острых проблем, включая изменение климата, профилактику заболеваний и управление ресурсами. Используя их мощь, мы сможем глубже понять сложные системы, разработать более эффективные решения и принимать обоснованные решения для создания устойчивого технологического развития России.

СПИСОК ЛИТЕРАТУРЫ:

1. Винокур А.И. Искусственный интеллект. Свойства зрительного восприятия и компьютерное зрение. В сборнике: Шаг в будущее: искусственный интеллект и цифровая экономика. Технологическое лидерство: взгляд за горизонт. материалы IV Международного научного форума. Министерство науки и высшего образования Российской Федерации, Государственный университет управления. Москва, 2021. С. 184-188;

2. Szeliski, R. (2018). Computer Vision: Algorithms and Applications. Springer;

3. Bishop, C. M. (2016). Pattern Recognition and Machine Learning. Springer;

4. Forsyth, D., & Ponce, J. (2021). Computer Vision: A Modern Approach. Prentice Hall;

5. Deep Learning Book: Goodfellow, I., Bengio, Y., & Courville, A. (2020). Deep Learning. MIT Press;

6. OpenCV: Bradski, G., & Kaehler, A. (2018). Learning OpenCV: Computer Vision with the OpenCV Library. O'Reilly Media;

7. Everingham, M., Van Gool, L., Williams, C. K., Winn, J., & Zisserman, A. (Eds.). (2018). The Pascal Visual Object Classes (VOC) Challenge. International Journal of Computer Vision, 88(2), 303-338;

8. LeCun, Y., Bengio, Y., & Hinton, G. (2019). Deep learning. Nature, 521(7553), 436-444

Cherepovsky M. V., Vinokur A.I.

Cherepovsky M.V.

Moscow Polytechnic University (Moscow, Russia)

Vinokur A.I.

Moscow Polytechnic University (Moscow, Russia)

EXPLORING THE POSSIBILITIES OF COMPUTER VISION IN MOBILE BROWSERS

Abstract: paper discusses the basic concepts of computer vision, such as image processing, pattern recognition, motion tracking and scene recognition. The targeted approaches and methods used by companies in the implementation of computer vision at the present stage are systematized, which makes it possible to identify their significance and potential for application in various fields of application.

Keywords: computer vision, deep learning, object detection, object recognition, facial recognition technologies.

i Надоели баннеры? Вы всегда можете отключить рекламу.