Научная статья на тему 'Компьютерное зрение: концепт, функционально-целевое назначение, структура, регуляторика'

Компьютерное зрение: концепт, функционально-целевое назначение, структура, регуляторика Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
25
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
компьютерное зрение / машинное зрение / дроны / цифровые онтологии / искусственный / computer vision / machine vision / drones / digital ontologies / artificial intelligence / technological advantage competition / regulatory technology (RegTech)

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — И В. Понкин, В П. Куприяновский, С Л. Морева, А И. Лаптева

Статья посвящена исследованию понятия и концепта компьютерного зрения как элемента современных технологий искусственного интеллекта. Авторы отмечают, что концепт и основанные на нём важнейшие и перспективные инновационные технологии компьютерного зрения – имеют все основания и предпосылки стать прорывными (подрывными) технологиями. Компьютерное зрение предполагает интерпретацию и понимание окружающего мира на основе статических изображений или видеоизображений. В статье показаны актуальность и востребованность таких технологических воплощения компьютерного зрения. Авторы показывают историю развития этого концепта, последовательное этапное формирование предпосылок и опорных звеньев технологической реализации компьютерного зрения. Отмечая, что функционал компьютерного зрения, сам по себе, сложен не только в релевантной реализации, но и в исчерпывающем объяснении, авторы статьи приводят обзор представленных в научной литературе объяснений понятия и технологий компьютерного зрения. В статье показаны технологические методы и решения, заложенные в основе компьютерного зрения. В статье сделан акцент на изложение методов компьютерного зрения в интегральном концепте Рафаля Шерера, показано многообразие ключевых концептуально-технологических подходов в основе компьютерного зрения. В статье представлены авторская дефиниция компьютерного зрения и авторская классификация функционалов компьютерного зрения. Авторы детализированно излагают классификацию приложений и применений компьютерного зрения. Авторы дают краткое обозрение регулирования технологий и применений компьютерного зрения. Показаны перспективы развития технологий и решений в сфере компьютерного зрения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — И В. Понкин, В П. Куприяновский, С Л. Морева, А И. Лаптева

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Computer vision: concept, functional-purpose, structure, related regulatory developments

The article is devoted to the study of the concept of computer vision as an element of modern artificial intelligence technologies. The authors note that the concept and the most important and promising innovative computer vision technologies based on it have all grounds and prerequisites to become breakthrough (subversive) technologies. Computer vision implies interpretation and understanding of the surrounding world on the basis of static images or video images. The article shows the relevance and demand for such technological embodiments of computer vision. The authors show the history of development of this concept, successive stage formation of prerequisites and supporting links of technological realization of computer vision. Noting that the functionality of computer vision, in itself, is difficult not only in relevant realization, but also in exhaustive explanation, the authors of the article give a review of the explanations of the concept and technologies of computer vision presented in the scientific literature. The article shows the technological methods and solutions underlying computer vision. The article emphasizes the presentation of computer vision methods in the integral concept of Rafal Scherer, shows the variety of key conceptual and technological approaches in the basis of computer vision. The author's definition of computer vision and author's classification of computer vision functionalities are presented in the article. The authors detail the classification of computer vision applications and uses. The authors give a brief review of regulation of technologies and applications of computer vision. Prospects of development of technologies and solutions in the field of computer vision are shown.

Текст научной работы на тему «Компьютерное зрение: концепт, функционально-целевое назначение, структура, регуляторика»

Компьютерное зрение: концепт, функционально-целевое назначение, структура, регуляторика

И.В. Понкин, В.П. Куприяновский, С.Л. Морева, А.И. Лаптева

Аннотация - Статья посвящена исследованию понятия и концепта компьютерного зрения как элемента современных технологий искусственного интеллекта. Авторы отмечают, что концепт и основанные на нём важнейшие и перспективные инновационные технологии компьютерного зрения - имеют все основания и предпосылки стать прорывными (подрывными) технологиями. Компьютерное зрение предполагает интерпретацию и понимание окружающего мира на основе статических изображений или видеоизображений. В статье показаны актуальность и востребованность таких технологических воплощения компьютерного зрения. Авторы показывают историю развития этого концепта, последовательное этапное формирование предпосылок и опорных звеньев технологической реализации компьютерного зрения. Отмечая, что функционал компьютерного зрения, сам по себе, сложен не только в релевантной реализации, но и в исчерпывающем объяснении, авторы статьи приводят обзор представленных в научной литературе объяснений понятия и технологий компьютерного зрения. В статье показаны технологические методы и решения, заложенные в основе компьютерного зрения. В статье сделан акцент на изложение методов компьютерного зрения в интегральном концепте Рафаля Шерера, показано многообразие ключевых концептуально-технологических подходов в основе компьютерного зрения. В статье представлены авторская дефиниция компьютерного зрения и авторская классификация функционалов компьютерного зрения. Авторы детализированно излагают классификацию приложений и применений компьютерного зрения. Авторы дают краткое обозрение регулирования технологий и применений компьютерного зрения. Показаны перспективы развития технологий и решений в сфере компьютерного зрения.

Ключевые слова — компьютерное зрение, машинное зрение, дроны, цифровые онтологии, искусственный

Статья получена 15 апреля 2024 г.

И.В. Понкин - Институт государственной службы и управления Российской академии народного хозяйства и гос. службы при Президенте РФ, кафедра государств. и муницип. управления, докт. юрид. наук, профессор (e-mail: ponkin-iv@ranepa.ru).

B.П. Куприяновский - Российский университет транспорта (МИИТ) (email: v.kupriyanovsky@rut.digital).

C.Л. Морева - Санкт-Петербургский гос. университет аэрокосмического приборостроения, кафедра управления в технических системах (Кафедра 31), канд. тех. наук (e-mail: sweetmoreva@yandex.ru).

А.И. Лаптева - Московский гос. юридический университет им. О.Е. Кутафина (МГЮА), кафедра спортивного права, канд. юрид. наук. (e-mail: juriste.ap@gmail.com).

интеллект, конкуренция технологических преимуществ, регуляторные технологии (РегТех).

I. ВВЕДЕНИЕ

Компьютерное (техническое, машинное) зрение (или точнее - компьютерное видение; англ. - «computer vision») - это концепт и основанные на нём важнейшие и перспективные инновационные технологии, имеющие все основания и предпосылки стать прорывными (подрывными) технологиями.

Чтобы обеспечить визуальную интерпретацию и контекстуальное понимание статических цифровых изображений и цифровых видео-изображений компьютерно-программными моделями («машинами»), компьютерное зрение и его приложения широко используются во всех областях, применимы для анализа изображений и видео и прогнозирования различных применений в реальной жизни, для решения проблем, связанных с обработкой изображений и с визуальным представлением (и/или интерпретацией), с использованием связанных с глубоким обучением когнитивных способностей машины [1, с. 2].

Современные интенсивные научные разработки технологий компьютерного зрения для беспилотных летательных аппаратов (БПЛА) и безэкипажных катеров (БЭК) военного применения, но ещё более разработки в области навигации мирного беспилотного транспорта (железнодорожного, авто-, авиа-, водного) и других роботизированных систем - всё это выступает «локомотивом» развития и продвижения таких технологий в целом в настоящее время. Уже вошло в обиход понятие «морское компьютерное зрение». Дополнительные существенные импульсы придают в этом технологические изыскания и разработки в сферах генеративного искусственного интеллекта (англ. -«generative artificial intelligence»), интернета вещей (англ. - «Internet of things» (IoT)), «умного» города (англ. - «smart-city»), киберметавселенных,

интеллектуализированного поиска изображений в электронных библиотеках, аналитической обработки медицинских изображений, реалистичной визуализации синтезированных сцен в компьютерной графике, в сфере образования (составление и обзоры библиометрических карт, обучение в сфере робототехники и проч.), в исследовании произведений искусства и в др. сферах. У компьютерного зрения вообще очень широкий спектр мирных применений - уже в настоящее время и, тем более, на перспективу.

Тема компьютерного зрения становится всё более

популярным предметом исследования в выходящих научных изданиях, но до сих пор не исчерпана, нуждаясь в обобщениях и объяснениях. Многое нуждается в прояснениях, в лучших объяснениях.

Кроме того, как пишут Дэвид Форсайт и Жан Понс, «компьютерное зрение как область - это определённый интеллектуальный рубеж. Как и любой другой рубеж, она захватывающа, но неорганизованна, и часто нет надёжных авторитетов, к которым можно было бы апеллировать. Многие полезные прикладные идеи не имеют теоретического обоснования, а некоторые теории бесполезны на практике; развитые области широко разбросаны, и часто одна выглядит совершенно недоступной из другой» [2, с. xvii].

Заполнению некоторых пробельных каверн и посвящена настоящая статья.

II. ИСТОРИЯ КОНЦЕПТА КОМПЬЮТЕРНОГО ЗРЕНИЯ

Концепт компьютерного зрения имеет относительно давнюю историю, последовательно проистекал в своём развитии и обогащался из следующих концептов:

- концепт Ларри Робертса 1960-1963 гг., который рассмотрел и описал в Массачусетском технологическом институте возможности извлечения трёхмерной геометрической информации из двумерных перспективных изображений блоков (полиэдров -объединений многогранников равной или различной размерности) [3; 4];

- концепт Дэвида Марра 1982 года, определивший компьютерное зрение как переход от двухмерного видения к трёхмерному визуальному распознаванию, использующий низкоуровневые алгоритмы обработки изображений, применяемые к 2D-изображениям, для получения 2,5D-наброска сцены (как «первого черновика»), с тем чтобы далее получить репрезентацию 3D-моделей сцен с использованием высокоуровневых методов [5] (подход Марра был излишне сложен в реализации, кроме того, в большинстве приложений компьютерного зрения не требовалось импортировать 3D-модели [6, с. 9]);

- концепт Джона Ф. Кэнни 1986 года - метод распознавания краёв (выделения границ), один из ставших наиболее распространёнными методов обработки изображений для обнаружения краёв. Результат задействования метода детекции границ Кэнни определяется следующими параметрами: 1) ширина гауссова фильтра (англ. - «Width of the Gaussian filter»), используемого на первом этапе, напрямую влияет на результаты работы алгоритма Canny; 2) порог (шаг, англ. - «Threshold» («step»)) -используется при отслеживании краёв с помощью гистерезиса. Метод позволяет выявлять края, где изменяется интенсивность пикселей (градиент изображения), перед обнаружением краёв необходимо удалить неважные края, для этого применяется гауссово сглаживание (англ. - «Gaussian smoothing») [7, с. 16-17];

- концепт Майкла Брэди [8, с. 201-241], позиционирующий интеллектуализированное зрение как процесс, преобразующий сигналы в структурированные символические описания;

- концепт Янниса Алоимоноса 1990 года -

концепт целенаправленного качественного

компьютерного зрения, в рамках которого компьютерное зрение позиционируется не само по себе, а как часть (сообразно целям и задачам) более крупной системы, которая что-то делает, реализуя собой последовательность подзадач, обладающих

инвариантностью к окружающей среде, понимая под качественным подходом постановку вопросов таким образом, чтобы ответ был либо «да/нет», либо дискретной классификацией [9, с. 358].

III. ПРЕДСТАВЛЕННЫЕ В НАУЧНОЙ ЛИТЕРАТУРЕ ОБЪЯСНЕНИЯ ПОНЯТИЯ И ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Функционал компьютерного зрения, сам по себе, сложен не только в релевантной реализации, но и в исчерпывающем объяснении. И попыток такого объяснения весьма много в литературе.

Как пишут Эсма Дилек и Мюрат Денер, компьютерное зрение - это область искусственного интеллекта, которая позволяет машинам извлекать значимую информацию из цифровых изображений, видео и других визуальных входов, а также действовать на основе этой информации [10, с. 2].

Джеймс Добсон определяет компьютерное зрение как нечто большее, чем просто технологии видения, то есть алгоритмы и методы, используемые для автоматизации зрения. Оно предполагает подход к пониманию цифровых представлений реальности, который в первую очередь основан на анализе этих закодированных визуальных данных, но также опирается на другие формы познания окружающего универсума. Компьютерное зрение также является дискурсивным. Оно находится в кодированной онтологии, выстроенной вокруг определённых алгоритмов, в позиционировании как способа понимания окружающего универсума как части визуальной культуры. Понять компьютерное зрение - значит принять его восприятие мира как особой конструкции, особой мета-перспективы реальности [11, с. 51].

Компьютерное зрение опирается на особенности изображения, описываемые в категориях опорных (ключевых) точек, краёв, пространственных форм объектов, цветов и градиентов цветов, плотности (интенсивности) и градиентов такой плотности и др.

Как пишет Т. Хуанг, компьютерное зрение имеет двойную цель. С точки зрения биологической науки, компьютерное зрение направлено на создание вычислительных моделей зрительной системы человека. С инженерной точки зрения, компьютерное зрение направлено на создание автономных систем, которые могли бы выполнять некоторые из задач, выполняемых зрительной системой человека, и могут даже превосходить её в ряде случаев. Многие задачи компьютерного зрения связаны с извлечением трёхмерной и временной информации из изменяющихся

во времени двумерных данных, полученных с помощью одной или нескольких телевизионных камер, и в целом с пониманием таких динамических сцен. Разумеется, эти две цели тесно связаны. Свойства и характеристики зрительной системы человека часто служат источником вдохновения для инженеров, разрабатывающих системы компьютерного зрения. И наоборот, алгоритмы компьютерного зрения могут дать представление о том, как работает зрительная система человека [12, с. 21].

Афродита Софоклеус, Панайотис Христодулу и др. определяют компьютерное зрение как технологии, позволяющие компьютерам захватывать,

интерпретировать, обрабатывать визуально

воспринимаемые объекты, понимать захваченные цифровые изображения (понимать сцены в реальном мире), получать высокоуровневые знания из цифрового контента и соответствующим образом реагировать, позволяющие извлекать информацию из цифровых изображений, которая в конечном итоге может привести к решению или выполнению действия [13, с. 3].

При всём многообразии определений компьютерного зрения фиксируется их сходимость к точке зрения, что, в принципе, компьютерное зрение онтологически есть по сути своей феномен, относимый к искусственному интеллекту, тесно с ним сопряжённый, а то и реализующий собственно искусственный интеллект.

В этом семантическом поле и разграничиваются понятия машинного зрения и компьютерного зрения: термин «машинное зрение» относимо к техническим составляющим зрения, тогда как термин «компьютерное зрение» сфокусирован на решениях искусственного интеллекта.

IV. МЕТОДЫ В ОСНОВЕ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Компьютерное зрение предполагает интерпретацию и понимание окружающего мира на основе статических изображений или видеоизображений. Задачи компьютерного зрения могут быть иерархически организованы на низком, среднем и высоком уровнях. Если задачи низкого уровня компьютерного зрения направлены на обработку изображений для их улучшения и извлечения информации, то задачи среднего уровня компьютерного зрения связаны с оценкой свойств объектов на изображениях, включая геометрические свойства, движение и категории объектов. Задачи высокого уровня компьютерного зрения направлены на интерпретацию и понимание событий или действий на статических изображениях или видеоизображениях. Задачи компьютерного зрения варьируются от задач низкого уровня, таких как извлечение признаков и сегментация изображений, и задач среднего уровня, включая обнаружение, отслеживание и распознавание объектов, до задач высокого уровня, включая распознавание действий человека [14, с. 165].

В основе технологий компьютерного зрения в разное время задействовались: Основанные на канальных характеристиках или деформируемых деталях модели (англ. - «Based on integral channel features or Deformable Part Models»), агрегированные

канальные характеристики («aggregated channel features» (ACF)), гистограммы ориентированных градиентов («histograms of oriented gradients» (HOG)), локальные бинарные шаблоны («local binary patterns» (LBP)), масштабно-инвариантное преобразование признаков (scale-invariant feature transform (SIFT)), фильтры Габора («Gabor filters»), локальные тернарные паттерны («local ternary patterns» (LTP)), локальное фазовое квантование («local phase quantization» (LPQ)), ротационно-инвариантные локальные бинарные паттерны («rotationinvariant co-occurrence local binary patterns»), усложнённые локальные бинарные шаблоны («completed local binary patterns»), повёрнутые изображения локальных двоичных шаблонов («rotated local binary pattern images») и глобально вращательно-инвариантные многомасштабные совместные бинарные шаблоны «globally rotation-invariant multi-scale co-occurrence local binary patterns» в числе техник ручной работы, которые использовались для извлечения признаков из изображений; более новые подходы, такие как свёрточные нейронные сети («convolutional neural networks» (CNN)), не требующие ручных функций, поскольку сами способны исследовать особенности из данных изображения. Свёрточные нейронные сети пытаются имитировать принципы работы человеческого мозга и зрительной коры, используя несколько слоёв для распознавания объектов. Одной из выдающихся сильных сторон свёрточных нейронных сетей является их способность классифицировать объекты по тысячам классов. К другим преимуществам свёрточных нейронных сетей относятся их относительная устойчивость к шуму изображения, а также устойчивость к вращению и изменениям положения объектов на изображении. Их самыми большими недостатками являются длительное время обучения и необходимость большого набора данных для обучения. Применяются также генеративно-состязательные сети («Generative Adversarial Networks» (GAN)) - подход, основанный на генеративном моделировании, который использует методы глубокого обучения для получения высококачественных изображений, метод обучения без учителя, который включает в себя автоматическое обнаружение и изучение закономерностей или закономерностей во входных данных, которые модель может использовать для генерации или создания новых примеров, которые могут быть разумно взяты из исходного набора данных [10, с. 3-5; 15].

Но всё это лишь малая часть от общего объёма применявшихся и применяемых технологических подходов.

V. Методы компьютерного зрения в интегральном

КОНЦЕПТЕ РАФАЛЯ ШЕРЕРА

Методы компьютерного зрения в целевой привязке распознавания, классификации и поиска изображений наилучшим на сегодня систематическим образом (в сжатом изложении) описал в своём труде Рафаль Шерер, выделяющий и описывающий линейку подходов.

Компьютерное зрение опирается на характеристики изображений, описывающие точки, края, объекты или цвет. Выделяют «вручную формируемые» признаки

(англ. - «hand-made features») и «выученные» признаки (благодаря методам глубокого обучения, англ. - «learned features»), и выделяют глобальные и локальные методы определения характеристик изображений. Глобальные методы извлекают признаки из всего изображения без разделения на более и менее значимые области. К этой группе можно отнести алгоритмы на основе гистограмм, такие как гистограмма ориентированных градиентов (англ. - «histogram of oriented gradients» (HOG)) или вектор когерентности цвета (англ. - «colour coherence vector» (CCV)); в большинстве случаев они генерируют постоянное количество данных описания, которые легче сравнивать и хранить, с другой стороны, сравнение изображений с помощью алгоритмов на основе гистограмм даёт пользователю лишь смутное сходство. Методы, основанные на локальных признаках, сначала пытаются найти значимые характерные области изображения на основе алгоритмов - лапласиана Гаусса (англ. - «laplacian of Gaussian» (LoG)) или разности Гаусса (англ. - «difference of Gaussian» (DoG)); затем они генерируют описание их окрестностей. Эти методы более точны, но, с другой стороны, способны генерировать большое количество данных для описания, и это количество слишком варьируется для каждого изображения. Методы локальных признаков, основанные на ключевых точках, эффективны при обнаружении сходства между изображениями, но менее эффективны при распознавании контента [7, с. 7].

Рафаль Шерер выделяет следующие методы (считаем необходимым привести обширные цитатно-реферативные извлечения из его работы):

1. Метод масштабно-инвариантного преобразования признаков (англ. - «scale-invariant feature transform» (SIFT)) - алгоритм обнаружения и описания локальных особенностей изображения: для каждой ключевой точки, описывающей локальную особенность изображения, генерируется вектор признаков, который может быть использован для дальнейшей обработки; алгоритм невосприимчив к изменению масштаба, повороту и изменению освещённости. SIFT состоит из 4 основных этапов: 1) обнаружение экстремумов в масштабируемом пространстве (англ. - «scale-space») - извлечение потенциальных ключевых точек путём сканирования всего изображения (построение масштабируемого пространства, лапласианова аппроксимация гауссовым размытием (сглаживанием, англ. - «laplacian approximation by Gaussian blur»)); 2) локализация ключевых точек (выбор стабильных ключевых точек, устойчивых к изменению масштаба и повороту; удаление неважных ключевых точек (удаление «шума»);

3) назначение ориентации - поиск ориентации ключевых точек, устойчивой к трансформации изображения;

4) дескриптор ключевых точек (англ. - «keypoint descriptor») - генерация векторов, описывающих ключевые точки [7, с. 7-8].

2. Метод ускоренных робастных (надёжных, устойчивых) признаков (англ. - «speeded-up robust features» (SURF)) - улучшенная версия SIFT с точки зрения скорости (вместо разности Гаусса используются интегральные изображения, что позволяет ему работать гораздо быстрее, за счёт генерации меньших данных и

более короткой длины дескриптора), - метод обнаружения и описания локальных особенностей изображения. Алгоритм также имеет параллельную версию, что позволяет генерировать результаты гораздо быстрее. SURF генерирует ключевые точки изображения (точки интереса, англ. - «interesting points»), что позволяет извлекать и сопоставлять локальные особенности, например, в парах изображений. Для каждой ключевой точки, которая указывает на локальную особенность изображения, генерируется вектор признаков, описывающий окружение ключевой точки и позволяет определить её ориентацию; эти векторы часто используются для дальнейшей обработки во многих методах компьютерного зрения. SURF включает четыре этапа: 1) вычисление интегральных изображений; 2) быстрый детектор гессиана (англ. - «fast hessian detector»); 3) дескриптор точек интереса (англ. - «interest point descriptor»); 4) генерация векторов, описывающих ключевую точку [7, с. 9].

3. Метод распознавания краёв (выделения границ) (англ. - «edge detection») - метод обработки изображений, основанный на выявлении значительных локальных различий в изображении и позволяющий определить форму объекта, что имеет решающее значение на этапах классификации или поиска изображений. Обычно края обнаруживаются между двумя различными областями изображения (изменение градиента). Они возникают при изменении интенсивности изображения или её первой производной. Существует четыре типа краёв: 1) рамповый край (англ. - «ramp») - когда значения краёв постепенно увеличиваются; этот профиль краёв часто используется на фотографиях, его также можно обнаружить после процесса размытия изображения; 2) ступенчатый край (англ. - «step») - когда значение интенсивности изменяется резко, от одной стороны к другой; это наиболее желательный профиль краёв, они часто встречаются в компьютерных изображениях;

3) линейный край (англ. - «line») - этот профиль края состоит из двух близко расположенных краёв; они обнаруживаются фильтрами первой производной и невосприимчивы к большинству методов размытия;

4) крышеобразный край (англ. - «roof») - этот профиль часто наблюдается в виде линий на фотографических изображениях [7, с. 13-14].

Частным случаем является метод детекции границ Кэнни (англ. - «Canny Edge Detection») - один из числа методов распознавания краёв (выделения границ), один из наиболее распространённых методов обработки изображений для обнаружения краёв, предложенный Джоном Кэнни в 1986 году, в качестве исходного материала берущий изображение в градациях серого цвета, получая изображение, отображающее положение отслеживаемых разрывов интенсивности. Алгоритм состоит из 5 отдельных шагов: 1) шумоподавление (англ. - «noise reduction»): входное изображение сглаживается с помощью соответствующего гауссова фильтра; 2) нахождение градиента интенсивности изображения (англ. - «finding the intensity gradient of the image»): на этом этапе помечаются края, где градиенты изображения имеют

большую величину; 3) подавление не-максимумов (англ. - «non-maxima suppression»): если величина градиента в пикселе больше на определённую величину, чем в двух соседних по направлению градиента, осуществляется пометка пикселя как края, в противном случае осуществляется пометка пикселя как фона; 4) трекинг краёв с помощью гистерезиса (англ. - «edge tracking by hysteresis»): окончательные края определяются путём подавления всех краёв, не связанных с подлинными краями (англ. - «genuine edges») [7, с. 16-17].

4. Методы обнаружения больших двоичных объектов и извлечения больших двоичных объектов (англ. - «blob (англ. «binary linked object» - объект двоичной компоновки) detection and blob extraction») -методы обработки изображений, позволяющие обнаруживать и извлекать списки больших двоичных объектов на изображении (в большинстве случаев блоб (объект) отличаем от фона и других объектов). Фильтры, применяемые при обнаружении краёв, не могут быть использованы из-за большого размера объектов. Наиболее распространённым подходом, используемым в качестве препроцессинга при обнаружении блобов, является применение гауссова размытия, за счёт чего полученное изображение упрощается, а неважные детали удаляются. Получить однородные объекты из изображения в виде списка пикселей крайне сложно, когда имеем дело с неоднородным фоном, то есть с объектами, содержащими разноцветный фон. Существует множество методов извлечения объектов (блобов) из изображений. Выделение блобов можно описать следующими шагами (для четырёхугольника): 1) отыскание каждого отдельного объекта на входном изображении; 2) отыскание пикселей краёв объекта (методы: сверху/снизу, слева/справа); 3) определение четырёх углов четырёхугольника; 4) установление пределов искажения (это значение определяет, насколько сильно может отличаться объект; устанавливается, чтобы обнаружить идеальный четырёхугольник; 5) проверка, насколько хорошо анализируемая фигура вписывается в четырёхугольник с заданным параметром; 6) проверка среднего расстояния между пикселями данного края и краем предполагаемого четырёхугольника; 7) если среднее расстояние не превышает заданный предел искажения, то можно считать, что фигура является четырёхугольной [7, с. 18-19].

5. Алгоритмы кластеризации (англ. - «clustering algorithms») - методы организации наборов данных в однородные группы, основанные на заданных признаках схожести, иной аналогизации или соотносимости объектов. Кластеризация данных широко используется в области интеллектуального анализа данных и его приложений. Известно и применяется множество алгоритмов кластеризации: алгоритм кластеризации k-средних (англ. - «к-means clustering algorithm»), алгоритм кластеризации со сдвигом среднего значения (англ. - «mean shift clustering algorithm») [7, с. 19].

6. Методы сегментации (англ. - «segmentation») -методы разделения, фрагментации входного изображения на значимые структуры - на однородные объекты, обладающие схожими свойствами.

Сегментация - одна из самых сложных областей обработки изображений, так как получить однородные, гомогенные объекты из изображений, содержащих фон или перекрывающиеся области, довольно сложно. Известно и применяется множество методов сегментации изображений, которые можно разделить на следующие группы: сегментация на основе окрестностей (англ. - «neighborhood-based segmentation»); сегментация на основе пороговых значений (англ. -«threshold-based segmentation»); сегментация на основе краёв (англ. - «edge-based segmentation»); сегментация на основе регионов (англ. - «region-based segmentation»); сегментация на основе кластеризации (англ. - «clustering-based segmentation»); сегментация на основе сопоставления (англ. - «matching-based segmentation») [7, с. 22].

VI. Технологии сегментации изображений

Особое значение имеет вопрос о технологиях компьютерной сегментации оперируемых (исследуемых, препарируемых) цифровых или одновременно трансформируемых в цифровые изображений.

К сегментации изображений (их логической разбивке на обособленные оформленные смысловые объекты на основе некоторых рабочих признаков и последующей локализации и классификации), в принципе, составляющей в немалой степени основу компьютерного зрения, применяется ряд технологических подходов к сегментации и, как правило, применяемых в некоторых сочетаниях.

Выделяют следующие интегральные технологии сегментации изображений:

1. Семантическая сегментация (англ. - «semantic segmentation») - это технология сегментации рядом расположенных групп пикселей оперируемого изображения, реализуемая посредством поиска внутри исследуемого изображения или потока изображений (видеоизображения) разных обособленных (обособляемых) изображений (смысловых объектов) и их категорирования по линейке категорий или карте признаков категорий. В том числе это производится посредством метода перебора вариантов-шаблонов (с обращением к массированной базе данных аннотаций шаблонированных «простых» изображений) и их сопоставления с оцениваемым суб-изображением -элементом внутри исследуемого изображения. При этом обособляемому и различаемому суб-изображению атрибутируется метка семантического класса и, при необходимости, меток нижестоящих подклассов.

2. Экземплярная сегментация (англ. - «instance segmentation») - это технология сегментации рядом расположенных групп пикселей оперируемого изображения, реализуемая посредством поиска внутри исследуемого изображения или потока изображений (видеоизображения) схожих и относимых к однородным (по тому или иному основанию сопоставления) обособленных (обособляемых) изображений и их классифицирующего маркирования как экземпляров («штук», номеров) внутри одной (однородной) классификационной группы (таксона, класса).

3. Паноптическая сегментация (англ. - «panoptic segmentation») - это гибридизированная технология сегментации оперируемого изображения, синтетически сочетающая семантическую и экземплярную сегментацию, реализующая единую сеть управления вниманием (модулей внимания предложений и модулей внимания масок) и согласующая обработку вещей и обработку вещей в сцене, с разграничением оперируемого изображения на семантически значимые «регионы» (части, сегменты) и с детекцией различением отдельных экземпляров объектов внутри этих регионов. Под вещью понимается объект на оперируемом изображении, который имеет чётко определённую или, по крайней мере, необходимо и достаточно ясно определяемую геометрию (геометрическую форму). При этом каждому пикселю атрибутируется семантическая метка, тогда как пикселям с относимостью к классам «вещей» и с возможностью исчисления атрибутируются уникальные идентификаторы экземпляров.

Эти технологические подходы реализуются на инструментальном уровне теми или иными подходами, в том числе описанными Рафалем Шерером - в нашей репрезентирующей цитатной выборке выше (обнаружение краёв и др.).

Соответственно, в интегрирующем взгляде на эти технологии следует вести речь о сегментаторе (англ. -«segmenter») - сложным компьютерно-программном ресурсе, реализующем такие задачи, имеющем архитектуру кодировщика-декодера экстракции признаков и последующего создания точной карты сегментации, имеющем возможности варьирования и масштабирования дискретизации и детализации.

VII. АВТОРСКИЙ КОНЦЕПТ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Компьютерное зрение - осуществление (как способность, функционал и процесс) компьютерно-программными моделями оперирования цифровыми статическими или динамическими (видео) изображениями и/или их последовательностями посредством их автоматического выявления (обнаружения), распознавания и идентификации (рекогнитивной обработки посредством вероятностных методов или геометрической информации, в т.ч. сопоставления с искусственно

созданными / заложенными трёхмерными и

двухмерными объектами), отслеживания (трекинга), сопоставления (сравнения, аналогизации) и упорядочения, интеграции (соединения) или разграничения (вычленения, сегментации) таких изображений и / или их частей (деталей изображений), воспроизведения и достраивания (в том числе восстанавливающего или моделирующего) изображений - в целях извлечения из них структурированных символических данных (включая буквы, цифры, иные символы), образов или моделей, доступных, в свою очередь, для высокоуровневых когнитивных компьютерно-программных восприятия и обработки.

К функционалам компьютерного зрения следует отнести:

- распознавать и различать (увидеть и идентифицировать) визуальные объекты и образы, их

границы, формы или технические и физические облики, их сочетания (группирования) и сегментации, перепады углов;

- семантически, экземплярно или иным образом сегментировать группы объектов; классифицировать и ранжировать визуальные объекты и образы и их сочетания (определять людей или технику в кадре и др.);

- распознавать и различать цвет и градиент цвета, текстуры, меры яркости, контрастности, насыщенности, прозрачности, размеры и др. параметры визуальных объектов и образов, освещённость, размытие, частичное затенение, искажение цвета и ухудшение контрастности изображений;

- определять размерность шума (в т.ч. точечного) на видеоизображении, включая тени, пыль, разноцветные пятна, неравномерные уровни освещённости;

- локализовать и определять местоположение и ориентацию визуальных объектов и образов в системе координат и/или в среде, их точки позиции (точки в системе координат, обозначающие точные указания позиций конкретных объектов);

- соотносить (аналогизировать, устанавливать подобие, иным образом сравнивать, коррелировать) и разграничивать, выявлять схожесть или, напротив, различия визуальных объектов и образов;

- определять дефекты и прочие аномалии на визуальных объектах (трещины, искривления и др.);

- определять движение и производить трекинг (отслеживание) движения визуальных объектов и образов, определять параметры такого движения (плотность потока движения, интенсивность движения, скорости движения, векторы движения и др.);

- фиксировать изменения формы, цветности и состояния объектов и образов;

- захватывать и извлекать из визуальных объектов и образов знаки (буквы, цифры и др.), распознавать и идентифицировать их;

- когнитивно определять («понимать») компьютерно-программно генерируемые визуальные объекты и образы и меру их соответствия текстовым ргошр1-запросам;

- когнитивно определять («понимать») семантические и онтологические взаимосвязи между паттернами изображений.

VIII. СФЕРЫ ПРИМЕНЕНИЯ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Спектр применений компьютерного зрения весьма широк и заслуживает внимания. Обзорно такие направления могут быть классифицирующе обозначены следующим образом:

1) компьютерное зрение для распознавания лиц и иной биометрии людей в автоматизированных системах видеонаблюдения и контроля;

- для распознавания лиц людей в автоматизированных системах видеонаблюдения и контроля;

- для распознавания иной помимо лиц биометрии (отпечатков пальцев, радужки глаза);

- для обнаружение аномалий в поведении людей в потоке кадров фиксации видеоизображений камерами

видеонаблюдения;

2) компьютерное зрение для навигации (и контроля навигации) транспортных средств и других роботизированных систем (в т.ч. для оперативного определения расстояния до преграды и времени достижения её, для определения приоритетных и альтернативных «рукавов» (каналов) движения, для автоматического обнаружения и распознавания дорожных знаков и разметки дорожного движения, для автоматической парковки и др.) - мирных беспилотных транспортных средств (железнодорожных, авто-, авиа-, надводных и подводных, космических); беспилотных средств военного назначения;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3) компьютерное зрение в автономных роботизированных системах на производстве - в промышленности, сельском хозяйстве и др., в том числе:

- применение компьютерного зрения в полностью механизированных проходческих забоях угольных шахт - для навигации (см.: [16]), в рамках интеллектуализированного горнорудного предприятия;

- применение компьютерного зрения на автоматизированных роботизированных производственных линиях (для обеспечения применения естественных, интуитивно понятных и творческих методов общения операторов с роботами - для распознавания жестов человеческих рук в целях взаимодействия человека и робота (см.: [17]); для навигации роботов и др.);

4) компьютерное зрение для автоматического обнаружения и распознавания номерных (государственных регистрационных) знаков транспортных средств;

5) компьютерное зрение для распознавания и классифицирования объектов на спутниковых геоинформационных изображениях;

6) компьютерное зрение в автоматизированных системах генерирования синтетических изображений и / или оперирования изображениями:

- в моделях генеративного искусственного интеллекта (англ. - «generative artificial intelligence»), в генеративных предобученных диффузионно-трансформерной моделях - для генерации синтетических изображений по текстовым prompt (от англ. prompt - «побуждать») запросам (https://stablediffusion.fr; https ://stablediffusionweb .com);

- для исследования произведений искусства (соответствие предполагаемому автору и/ или художественной школе, установление подлинника / подделки, установление меры повреждённости / утраченности) (см.: [18]);

- для интеллектуализированного поиска изображений в электронных библиотеках, базах;

- для выявления поддельных видео-сцен (дипфейков) с конкретными людьми в видеозаписи;

- для реалистичной визуализации синтезированных сцен в компьютерной графике в сфере кинематографии, мультипликации, производства компьютерных игр и симуляторов;

- компьютерное зрение (как обратная связь) в функциональной и обеспечительной архитектуре цифровых моделей-двойников и киберметавселенных;

7) компьютерное зрение дефектоспического

назначения - мониторинга состояния и целостности конструкций:

- поиск трещин и иных повреждений (и их размеров) в бетонных и металлических конструкциях мостов (см.: [19]) и путепроводов, портовых сооружений, конструкциях плотин и иных зданиях, опорах линий электропередач, трубопроводах;

- поиск дефектов в корпусах судов, в подвижном составе железнодорожного транспорта и др.;

- поиск трещин и иных повреждений (и их размеров) в железнодорожном рельсовом полотне (см.: [20]), в автодорожном покрытии и покрытии взлётно-посадочных полос аэродромов (трещин, выбоин, перекосов и др.) и др.;

- поиск повреждений в линиях электропередач;

- поиск повреждений в хранилищах топлива, химических активных жидкостей

- гиперспектральное зондирование (например, зданий на предмет выявления дефектов теплоизоляции; массивов посадок на предмет выявления болезней растений, свойств и состояния почвенных покровов на предмет проблем);

8) компьютерное зрение в автоматизированных системах биомедицинской визуализации, распознавания и аналитической обработки медицинских изображений, оперирования медицинских изображениями;

9) компьютерное зрение в создании и обеспечении искусственных человеческих глаз, высокоточное производство сложносоставных трёхмерных биомиметических комбинированных глаз (бионических протезов) (см.: [21]);

10) компьютерное зрение для распознавания документов и оперирования ими (составление и обзоры библиометрических карт и др.);

11) компьютерное зрение в сфере образования (обучение в сфере робототехники (см.: [13]), фиксация поведения экзаменуемых и проч.);

12) превентивный визуальный контроль угроз схода селей, снежных и каменных лавин, поведения вулканов;

13) 3Б-картирование подводных и подземных полостей в скальных породах и ледниковых массивах.

Следует понимать, что детерминантами пределов развития технологий компьютерного зрения сегодня выступают технологически достигнутые уровни создания оптических средств, их стабилизации в пространстве и их функционирования в сложных погодных условиях.

Многие неблагоприятные погодные условия, такие как сильный снегопад, ливень, туман, покрывающий камеру, чрезмерная яркость, вызванная солнечным светом, и различия в углах обзора из-за сотрясения камеры, вызванного сильным ветром, могут вызвать трудности в получении и правильной обработке изображения. Если последовательные изображения не могут быть получены стабильно из потоков камер, трудно сделать значимые выводы с помощью методов компьютерного зрения. Кроме того, другие факторы, такие как сложный фон и низкая контрастность, также могут затруднить автоматическое извлечение признаков из изображений [10, с. 45].

IX. РЕГУЛИРОВАНИЕ КОМПЬЮТЕРНОГО ЗРЕНИЯ

Проведённое исследование законодательства Российской Федерации и других ведущих технологических держав показывает следующее: притом что целенаправленного регулирования компьютерного зрения не существует ныне в каком-либо государстве, вместе с тем, любом развитом крупном государстве действует множество нормативных правовых актов, регулирующих разработку, патентование, тестирование, применение тех или иных цифровых технологий, которые активно используют технологические решения и системы компьютерного зрения - системы видеонаблюдения и распознавания лиц, дроны различного назначения, медицинское применение для распознавания исследуемых медицинских изображений и мн. др.

Впрочем, производные вопросы подпадают под более широкое регулирование.

Например, внедрение в клиническую практику медицинских организаций устройств, использующих алгоритмы компьютерного зрения для оперирования медицинскими изображениями, поставило вопрос о юридической ответственности в случае ошибки [22]. Законодательная база медицинского права явно не поспевает за этим.

Распознавание биометрии, в принципе, достаточно исчерпывающе урегулировано. Компьютерное зрение, давно практически работающее в виде биометрических приложений распознавания отпечатков пальцев или лиц, распознавания номерных знаков и т.п., имеет достаточно большую правовую базу.

X. ЗАКЛЮЧЕНИЕ

Как писал ещё в 1987 году Майкла Брэди (вполне себе актуально и для дня сегодняшнего и завтрашнего), «интеллектуальное зрение открывает большие перспективы в будущем. Оно уже принесло богатые плоды во многих разнообразных приложениях. Ещё больше плодов быстро созревают и становятся пригодными для коммерческого использования. Более того, на дереве исследований уже есть здоровые почки, которые, похоже, принесут свои плоды в ближайшие несколько лет» [8, с. 236-237].

Компьютерное зрение (и его оптическое и иное инженерно-техническое обеспечение), уже сегодня превосходя биологические образцы по многим параметрам, имеют огромное прорывное значение как прорывные (подрывные) технологии.

Библиография

[1] Computer Vision: Applications of Visual AI and Image Processing

[Компьютерное зрение: Приложения визуального

искусственного интеллекта и обработки изображений] / Ed. by

Pancham Shukla, Rajanikanth Aluvalu, Shilpa Gite and Uma

Maheswari. Vol. 15. - Berlin: Walter de Gruyter, 2023. - 370 p.

[2] Forsyth D.A., Ponce J. Computer Vision: A Modern Approach

[Компьютерное зрение: Современный подход]. Second edition. -

Boston: Pearson Education, 2012. - xxix; 761 p.

[3] Roberts L.G Machine perception of 3D solids // Optical and Electro-

Optical Information Processing [Оптическая и электрооптическая

обработка информации] / Ed. by James T. Tippett and Lewis C. Clapp (Editor). - Cambridge (MA, USA): MIT Press, 1965. - 780 p.

- P. 159-197.

[4] Roberts L.G Machine Perception of Three-Dimensional Solids:

Submitted in partial fulfillment of the requirements for the degree of Doctor of philosophy [Машинное восприятие трёхмерных твёрдых тел: Представлено в частичном выполнении требований для получения степени доктора философии] / Massachusetts institute of technology, June, 1963. - New York: Garland Publishing, 1963.

<https://achievements.ai/timeline/machine-perception-of-3d-solids-lawrence/>.

[5] Marr D. Vision: A Computational Investigation into the Human

Representation and Processing of Visual Information [Видение: Вычислительное исследование человеческой репрезентации и обработки визуальной информации]. - San Francisco: Freeman, 1982.

[6] Nalbant K.G, Uyanik Computer Vision in the Metaverse

[Компьютерное зрение в метавселенной] // Journal of Metaverse.

- 2021. - Vol. 1. - № 1. - P. 9-12.

[7] Scherer R. Computer Vision Methods for Fast Image Classification and

Retrieval [Методы компьютерного зрения для быстрой классификации и поиска изображений]. - Cham (Switzerland): Springer Nature Switzerland, 2020. - ix; 137 p.

[8] BradyM. Intelligent Vision [Интеллектуализированное зрение] // AI

in the 1980s and Beyond: An MIT Survey / Edited by W. Eric L. Grimson, Ramesh S. Patil. - Cambridge (MA, USA): MIT Press, 1987. - x; 375 p. - P. 201-241.

[9] Aloimonos J. Purposive and qualitative active vision [Целенаправленное и качественное активное видение] // Pattern Recognition: Proceedings., 10th International Conference on. -1990. - Vol. 1. - P. 346-360.

[10] Dilek E., Dener M. Computer Vision Applications in Intelligent

Transportation Systems: A Survey [Применение компьютерного зрения в интеллектуальных транспортных системах: Обзор] // Sensors. - 2023. - Vol. 23. - № 6. - Article 2938. - 65 p.

[11] Dobson J.E. Birth of Computer Vision [Рождение компьютерного

зрения]. - Minneapolis: University of Minnesota Press, 2023. - 215 p.

[12] Huang T.S. Computer Vision: Evolution and Promise [Компьютерное

зрение: Эволюция и перспективы] // 1996 CERN School of Computing (Egmond aan Zee, The Netherlands, 8 September-21 September 1996): Proceedings / Editor: C.E. Vandoni. - Geneva: CERN, 1996 - xi; 246 p. - P. 21-24.

[13] Sophokleous A., Christodoulou P., Doitsidis L., Chatzichristofis S.A.

Computer Vision Meets Educational Robotics [Компьютерное зрение в образовательной робототехнике] // Electronics. - 2021. -Vol. 10. - № 6. - Article 730. - 24 p.

[14] Ji Q. Probabilistic Graphical Models for Computer Vision [Вероятностные графические модели для компьютерного зрения]. - London: Elsevier, 2020. - xv; 278 p.

[15] Nanni L., Ghidoni S., Brahnam S. Handcrafted vs. Non-Handcrafted

Features for Computer Vision Classification [Ручные vs. неручные признаки для классификации в компьютерном зрении] // Pattern Recognition. - 2017. - Vol. 71, November. - P. 158-172.

[16] Du Y., ZhangH., LiangL. et al. Applications of Machine Vision in

Coal Mine Fully Mechanized Tunneling Faces: A Review [Применение машинного зрения в полностью механизированных проходческих забоях угольных шахт: Обзор] // IEEE Access. - 2023. - Vol.. 11. - P. 102871-102898.

[17] Qi J., Ma L., Cui Z., Yu Y. et al. Computer vision-based hand gesture

recognition for human-robot interaction: a review [Распознавание жестов рук на основе компьютерного зрения для взаимодействия человека и робота: Обзор] // Complex & Intelligent Systems. - 2024. - Vol. 10. - P. 1581-1606.

[18] The Next Rembrandt [Проект «Следующий Рембрандт»] //

<https://www.nextrembrandt.com>.

[19] Luo K., Kong X., Zhang J. et al. Computer Vision-Based Bridge

Inspection and Monitoring: A Review [Инспекция и мониторинг мостов на основе компьютерного зрения: Обзор] // Sensors. -2023. - Vol. 23. - № 18. - Article 7863.

[20] Rahman M., Liu H., Masri M. et al. A railway track reconstruction

method using robotic vision on a mobile manipulator: A proposed strategy [Метод реконструкции железнодорожного пути с использованием роботизированного зрения на мобильном манипуляторе: Предлагаемая стратегия] // Computers in Industry.

- 2023. - Vol. 148. - Article 103900.

[21] Zhang F., Xu H., Yang Q. et al. Femtosecond Laser Microfabrication

of Artificial Compound Eyes [Микрофабрикация искусственных глаз с помощью фемтосекундного лазера] // Photonics. - 2024. -Vol. 11. - № 3. - Article 264. - 25 p.

[22] HarnedZ., LungrenM.P., RajpurkarP. Machine Vision, Medical AI, and Malpractice [Машинное зрение, медицинский искусственный интеллект и дефект медицинской помощи] // Harvard Journal of Law & Technology. - 2019. - № 3. - P. 2-10.

Computer vision: concept, functional-purpose, structure, related regulatory

developments

Igor Ponkin, Vasily Kupriyanovsky, Svetlana Moreva, Alena Lapteva

Abstract - The article is devoted to the study of the concept of computer vision as an element of modern artificial intelligence technologies. The authors note that the concept and the most important and promising innovative computer vision technologies based on it have all grounds and prerequisites to become breakthrough (subversive) technologies. Computer vision implies interpretation and understanding of the surrounding world on the basis of static images or video images. The article shows the relevance and demand for such technological embodiments of computer vision. The authors show the history of development of this concept, successive stage formation of prerequisites and supporting links of technological realization of computer vision. Noting that the functionality of computer vision, in itself, is difficult not only in relevant realization, but also in exhaustive explanation, the authors of the article give a review of the explanations of the concept and technologies of computer vision presented in the scientific literature. The article shows the technological methods and solutions underlying computer vision. The article emphasizes the presentation of computer vision methods in the integral concept of Rafal Scherer, shows the variety of key conceptual and technological approaches in the basis of computer vision. The author's definition of computer vision and author's classification of computer vision functionalities are presented in the article. The authors detail the classification of computer vision applications and uses. The authors give a brief review of regulation of technologies and applications of computer vision. Prospects of development of technologies and solutions in the field of computer vision are shown.

Keywords — computer vision, machine vision, drones, digital ontologies, artificial intelligence, technological advantage competition, regulatory technology (RegTech).

Ponkin Igor V., Doctor of science (Law), professor of the Institute of Public Administration and Civil Service of the Russian Presidential Academy of National Economy and Public Administration (Moscow, Russia) (IPACS, RANEPA), State professor. (e-mail: ponkin-iv@ranepa.ru). ORCID: 0000-00034438-6649

Kupriyanovsky Vassiliy P., Russian University of Transport (email: v.kupriyanovsky@rut.digital).

Moreva Svetlana L., PhD, Saint-Petersburg State University of Aerospace Instrumentation. (e-mail: sweetmoreva@yandex.ru). ORCID: 0009-0000-3670-9538.

Lapteva Alena I., PhD (Law), assistant professor of Sports Law Department of the Kutafin Moscow State Law University (MSAL). (e-mail: juriste.ap@gmail.com). ORCID: 0000-0002-4865-9694.

References

[1] Computer Vision: Applications of Visual AI and Image Processing /

Ed. by Pancham Shukla, Rajanikanth Aluvalu, Shilpa Gite and Uma

Maheswari. Vol. 15. - Berlin: Walter de Gruyter, 2023. - 370 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[2] Forsyth D.A., Ponce J. Computer Vision: A Modern Approach. Second

edition. - Boston: Pearson Education, 2012. - xxix; 761 p.

[3] RobertsL.G. Machine perception of 3D solids // Optical and Electro-

Optical Information Processing / Ed. by James T. Tippett and Lewis C. Clapp (Editor). - Cambridge (MA, USA): MIT Press, 1965. -780 p. - P. 159-197.

[4] Roberts L.G: Machine Perception of Three-Dimensional Solids:

Submitted in partial fulfillment of the requirements for the degree of Doctor of philosophy / Massachusetts institute of technology, June, 1963. - New York: Garland Publishing, 1963. <https://achievements.ai/timeline/machine-perception-of-3d-solids-lawrence/>.

[5] Marr D. Vision: A Computational Investigation into the Human

Representation and Processing of Visual Information. - San Francisco: Freeman, 1982.

[6] NalbantK.G., UyanikComputer Vision in the Metaverse // Journal of

Metaverse. - 2021. - Vol. 1. - № 1. - P. 9-12.

[7] Scherer R. Computer Vision Methods for Fast Image Classification and

Retrieval. - Cham (Switzerland): Springer Nature Switzerland, 2020. - ix; 137 p.

[8] Brady M. Intelligent Vision // AI in the 1980s and Beyond: An MIT

Survey / Edited by W. Eric L. Grimson, Ramesh S. Patil. -Cambridge (MA, USA): MIT Press, 1987. - x; 375 p. - P. 201-241.

[9] Aloimonos J. Purposive and qualitative active vision // Pattern

Recognition: Proceedings., 10th International Conference on. -1990. - Vol. 1. - P. 346-360.

[10] DilekE., DenerM.Computer Vision Applications in Intelligent

Transportation Systems: A Survey // Sensors. - 2023. - Vol. 23. -№ 6. - Article 2938. - 65 p.

[11] Dobson J.E. Birth of Computer Vision. - Minneapolis: University of

Minnesota Press, 2023. - 215 p.

[12] Huang T.S. Computer Vision: Evolution and Promise // 1996 CERN

School of Computing (Egmond aan Zee, The Netherlands, 8 September-21 September 1996): Proceedings / Editor: C.E. Vandoni.

- Geneva: CERN, 1996 - xi; 246 p. - P. 21-24.

[13] Sophokleous A., Christodoulou P., Doitsidis L., Chatzichristofis S.A.

Computer Vision Meets Educational Robotics // Electronics. - 2021.

- Vol. 10. - № 6. - Article 730. - 24 p.

[14] Ji Q. Probabilistic Graphical Models for Computer Vision [Вероятностные графические модели для компьютерного зрения]. - London: Elsevier, 2020. - xv; 278 p.

[15] Nanni L., Ghidoni S., Brahnam S. Handcrafted vs. Non-Handcrafted

Features for Computer Vision Classification // Pattern Recognition.

- 2017. - Vol. 71, November. - P. 158-172.

[16] Du Y., ZhangH., LiangL. et al. Applications of Machine Vision in

Coal Mine Fully Mechanized Tunneling Faces: A Review // IEEE Access. - 2023. - Vol.. 11. - P. 102871-102898.

[17] Qi J., MaL., Cui Z., Yu Y. et al. Computer vision-based hand gesture

recognition for human-robot interaction: a review // Complex & Intelligent Systems. - 2024. - Vol. 10. - P. 1581-1606.

[18] The Next Rembrandt // <https://www.nextrembrandt.com>.

[19] Luo K., Kong X., Zhang J. et al. Computer Vision-Based Bridge

Inspection and Monitoring: A Review // Sensors. - 2023. - Vol. 23.

- № 18. - Article 7863.

[20] Rahman M., Liu H., Masri M. et al. A railway track reconstruction

method using robotic vision on a mobile manipulator: A proposed strategy // Computers in Industry. - 2023. - Vol. 148. -Article 103900.

[21] Zhang F., Xu H., Yang Q. et al. Femtosecond Laser Microfabrication

of Artificial Compound Eyes // Photonics. - 2024. - Vol. 11. - № 3.

- Article 264. - 25 p.

[22] Harned Z., Lungren M.P., Rajpurkar P. Machine Vision, Medical AI,

and Malpractice // Harvard Journal of Law & Technology. - 2019. -№ 3. - P. 2-10.

i Надоели баннеры? Вы всегда можете отключить рекламу.