Научная статья на тему 'Содержательные основы математической модели цифрового полутонового изображения'

Содержательные основы математической модели цифрового полутонового изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
цифровое изображение / математическая модель / обработка изображений / представление визуальной информации / моделирование. / digital image / mathematical model / image processing / visual information representation / modeling.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Покинтелица Артем Евгеньевич

В данной работе проанализированы содержательные основы математической модели цифрового полутонового изображения и рассмотрен процесс ее построения. Отмечено, что представление визуальной информации с помощью множества значений дискретизированной функции яркости, упорядоченного в соответствии с некоторым правилом, делает возможным применение математических методов обработки изображений. Делается вывод о том, что упорядочивающая функция устанавливает связь между отдельными элементами цифрового изображения (пикселями) и является ключевым фактором в процессе извлечения полезной информации из обрабатываемого набора данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Покинтелица Артем Евгеньевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Substantial Foundations of the Mathematical Model of a Digital Halftone Image

This paper analyzes the substantial foundations of the mathematical model of a digital halftone image. The process of the model construction is considered. It is indicated that the representation of visual information using a specially ordered set of values of a discretized image function which determines the brightness of the image makes it possible to use mathematical methods of image processing. The ordering function establishes the relationship between the individual elements of a digital image (pixels). It is concluded that the ordering function is the key to extracting useful information from a set of visual data that is being processed.

Текст научной работы на тему «Содержательные основы математической модели цифрового полутонового изображения»

УДК 51-74:004.932 DOI 10.24412/2413-7383-2024-3-36-43

А. Е. Покинтелица

Федеральное государственное бюджетное научное учреждение «Институт проблем искусственного интеллекта», г. Донецк, 283048, г. Донецк, ул. Артема, 118 б

СОДЕРЖАТЕЛЬНЫЕ ОСНОВЫ

МАТЕМАТИЧЕСКОЙ МОДЕЛИ

ЦИФРОВОГО ПОЛУТОНОВОГО ИЗОБРАЖЕНИЯ*

A. E. Pokintelitsa

Federal State Budgetary Scientific Institution «Institute of Artificial Intelligence Problems» 283048, Donetsk, Artema str., 118-b

SUBSTANTIAL FOUNDATIONS OF THE MATHEMATICAL MODEL OF A DIGITAL HALFTONE IMAGE

В данной работе проанализированы содержательные основы математической модели цифрового полутонового изображения и рассмотрен процесс ее построения. Отмечено, что представление визуальной информации с помощью множества значений дискретизированной функции яркости, упорядоченного в соответствии с некоторым правилом, делает возможным применение математических методов обработки изображений. Делается вывод о том, что упорядочивающая функция устанавливает связь между отдельными элементами цифрового изображения (пикселями) и является ключевым фактором в процессе извлечения полезной информации из обрабатываемого набора данных.

Ключевые слова: цифровое изображение, математическая модель, обработка изображений, представление визуальной информации, моделирование.

This paper analyzes the substantial foundations of the mathematical model of a digital halftone image. The process of the model construction is considered. It is indicated that the representation of visual information using a specially ordered set of values of a discretized image function which determines the brightness of the image makes it possible to use mathematical methods of image processing. The ordering function establishes the relationship between the individual elements of a digital image (pixels). It is concluded that the ordering function is the key to extracting useful information from a set of visual data that is being processed.

Key words: digital image, mathematical model, image processing, visual information representation, modeling.

* Работа выполнена по Госзаказу. FREN-2023-0004 «Теоретические основы обнаружения и оценки объектов на местности интеллектуальными робототехническими системами в условиях быстроменяющейся обстановки»

Введение

С позиции кибернетических представлений, модель - это инструмент научного познания. Она являет собой условный образ изучаемого объекта, сконструированный так, чтобы отразить существенные для цели исследования характеристики объекта.

Представление визуальной информации в виде данных, пригодных для дальнейшей компьютерной обработки, включает внушительный ряд процессов, для анализа которых необходимо комбинировать знания из весьма различных областей науки и техники. В задачах исследования окружающей среды с применением систем технического зрения [1] особую роль играет обнаружение протяженных объектов -значимых объектов, или объектов интереса.

Актуальность данной работы обусловлена вопросами, возникающими при решении задач обнаружения объектов интереса робототехническими устройствами для отслеживания их взаимодействия на местности в условиях быстроменяющейся обстановки [2].

Целью представленной работы является рассмотрение процесса построения математической модели цифрового полутонового изображения с точки зрения ее содержательной составляющей. Кроме того, целеполагающей основой данного исследования является формирование системы базовых понятий для описания процессов обработки цифровых изображений.

Объектом исследования выступает двумерное цифровое изображение некоторой области окружающего пространства.

Предметом исследования является способ представления полутонового цифрового изображения.

Обнаружение объектов на изображении

Цифровое изображение представляет собой организованные особым образом данные, содержащие в себе визуальную информацию о состоянии окружающей среды. Как было отмечено выше, процедура обнаружения протяженных объектов на изображении является одной из основных в задачах исследования окружающей среды с применением систем технического зрения.

Обнаружение (англ. ё^веИоп) - один из основных сенсорных процессов как для человека, так и для устройств, имитирующих работу его сенсорной системы. В техническом аспекте, сенсорное восприятие - это способность системы обнаруживать и регистрировать стимулы в окружающей среде с помощью различных сенсорных устройств. В этом смысле ощущение можно сопоставить с получением информации о состоянии окружающей среды, а раздражитель - с источником сигнала.

Резюмируя изложенное выше, определим обнаружение как выделение сигнала, поступающего от значимого объекта, из его смеси с шумом и мешающими сигналами от других объектов.

Для управления и контроля в технических системах широко применяются оптические сенсоры. Обусловлено это в первую очередь тем, что визуальное представление информации удобно для человека (оператора) и легко поддается интерпретации. Однако, обработка визуальных данных является весьма ресурсозат-ратной задачей и может представлять определенную сложность [3], [4]. В этом контексте термин «обнаружение» следует понимать как выделение значимого объекта из фона, а также раздельное восприятие нескольких объектов, удаленных друг от друга на расстояние, соизмеримое с их собственными размерами.

П

Математическая модель цифрового изображения

Для решения задач получения, хранения и обработки изображений с применением компьютера необходимо прежде всего построить математическую модель [5] того, что мы называем цифровым изображением [6], [7]. В зависимости от назначения модель может учитывать пространственно-временные, энергетические (спектральные), информационные (вероятностные) или какие-либо иные характеристики сигналов.

В поле нашего исследования находится модель двумерного полутонового цифрового изображения.

Рассмотрим протяженный объект, освещенный светом от некоторого источника (рис. 1). Попадая на поверхность объекта, свет отражается и, в общем случае, такое отражение является диффузным [8].

Рисунок 1 - Формирование изображения объекта в плоскости регистрирующего устройства

Расположим на некотором удалении от объекта плоское прямоугольное регистрирующее устройство - оптический сенсор, обеспечивающий перевод визуальной информации об объекте в числовую форму.

Мы будем рассматривать его лишь как систему получения изображений, отвлекаясь от принципа его действия. Геометрические параметры устройства характеризуются размерами прямоугольной области а и Ь.

В плоскости регистрирующего устройства распределение энергии светового излучения по пространственным координатам и по длинам волн описывается неотрицательной функцией Д(х, у, X), где х и у - пространственные координаты (0 < х< а, 0 < у< Ь), а X - длина волны.

Введем весовую функцию £(Х), которая будет характеризовать спектральную чувствительность оптического сенсора. Тогда результат усреднения функции Д(х, у, X) по диапазону длин волн с учетом £(Х) будет иметь вид

/ъшах

/ (х, у )= | ^ (х, у, (/) сТк

где Хтах и Хшт - соответственно верхняя и нижняя границы диапазона спектральной чувствительности регистрирующего устройства.

/

Полученную таким образом функцию I(х, у), называемую также функцией яркости, будем ассоциировать с понятием изображения в том смысле, в котором это понятие трактуется в вопросах числового представления изображений.

Для формирования дискретного изображения, или, как его еще называют, цифрового изображения, на первом этапе необходимо произвести операцию дискретизации - преобразования функции / (х, у) двух непрерывных переменных в функцию дискретных аргументов. Пусть величины Ах и Ду определяют соответственно шаг дискретизации по пространственным переменным х и у для указанной операции.

Модельным образом оптического сенсора будет служить прямоугольная решетка Р (рис. 2), в узлах которой располагаются светочувствительные элементы Рт, п (т = 1, 2, ..., М; п = 1, 2, ..., И). Здесь М и N - число узлов решетки вдоль осей Ох и Оу соответственно. Линейные размеры этой решетки совпадают с размерами прямоугольной области а и Ь регистрирующего устройства, описанного выше.

Рисунок 2 - Модельный образ оптического сенсора, представленный в виде прямоугольной решетки

Дискретизация функции яркости/(х, у) по пространственным переменным х и у связана с заменой промежутков изменения аргументов следующими множествами точек:

{О, тгАх, т2Дх,..., тм^Дх} и пхАу, п2Ау,..., пм_хАу }. Результатом данной операции будет множество отдельных значений функции

I (х, у):

F = {/((т-1)Ах, (п-1)Ау )},

где т = 1, 2, ..., М; п = 1, 2, ..., N.

Формально операция дискретизации может быть представлена с помощью дельта-функции Дирака 5(х), которая является сингулярной обобщенной функцией и отличается от обычных функций, которые могут быть заданы указанием всех своих значений [5]. Данная функция часто используется при описании сосредоточенных в точке величин. Так, дискретизированную по пространственным переменным функцию яркости I (х, у) можно представить следующим образом:

(х, у) =

/а (х, У) = Л /(и, у)5(х - и, у - V)ёиёу,

в

где область О совпадает с областью, которой ограничено описанное выше регистрирующее устройство, а двумерная дельта-функция б(х - и, у — V) равна ю при х = и, у = V, и принимает нулевое значение во всех остальных случаях.

На следующем этапе происходит дискретизация непрерывной величины -значений функции /(х, у) - по уровню. Выполняется так называемая операция квантования [9] с каждым полученным при дискретизации по пространственным переменным значением функции и число Q задает количество уровней квантования.

Таким образом, полутоновое цифровое изображение описывается множеством Дд значений квантованной функции / ((т — 1)ДХ, (п — 1)Д ), с заданным набором уровней

квантования (/, /,..., / ) и независимыми дискретными переменными т и п (д = 1, 2, ...,

Q; т = 1, 2, ...,М; п = 1, 2, ...,К).

Заключение

В задачах обнаружения протяженного объекта на цифровом изображении местности понятия «значимый объект» и «фон» не поддаются формализации и поэтому требуют разъяснения в каждом конкретном случае. Термин «местность» здесь следует понимать как некоторую часть поверхности или же пространства, характеризующуюся общностью каких-либо признаков.

Цифровое изображение объекта и местности, полученное с помощью регистрирующего устройства, несет в себе визуальную информацию о состоянии окружающей среды, или, проще говоря, окружении. В таком контексте совокупные данные о состоянии окружающей среды будут характеризовать обстановку на этой местности.

На содержательном уровне, совокупность «отпечатков» образов наблюдаемой картины для каждой длины волны из интервала длин волн светового излучения, проходящего через плоскость регистрирующего устройства, можно описать с помощью функции распределения энергетической освещенности. Формирующая система (оптический сенсор) преобразует информацию об освещенности в данные, которые характеризуют яркость изображения. Введение на начальном этапе моделирования длины волны в качестве независимой переменной позволяет при необходимости переходить к так называемым цветовым координатам.

Кроме того, заслуживает отдельного внимания и то обстоятельство, что сама по себе операция дискретизации функции яркости / (х, у) по пространственным переменным х и у не предполагает упорядочения полученного множества значений функции. Введение упорядочивающего правила позволяет устранить эту проблему и открывает возможности для представления цифровых изображений в виде последовательностей или матриц. Одним из вариантов реализации упорядочивающего правила является методика кодировки изображения с помощью пар множеств точек изображения и соответствующих им координат в заранее заданной координатной системе [10].

Основываясь на вышеизложенных соображениях, можно ввести понятие пикселя как базового элемента для дискретного представления двумерных цифровых изображений. Кроме того, выглядит вполне естественной идея ассоциировать пиксель как со светочувствительным элементом рт, п решетки Р оптического сенсора, так и со светоизлучающим элементом устройств, на которых формируется изображение. Установление соответствия посредством пикселей между геометрическими, яркост-ными и цветовыми свойствами изображения является ключевым моментом в его математическом описании.

Выводы

Рассмотрен процесс построения математической модели цифрового полутонового изображения с точки зрения ее содержательной составляющей.

Представление изображения с помощью множества Fq, упорядоченного в соответствии с некоторым правилом, создает основу для применения математического аппарата линейной алгебры и теории матриц.

Описанный подход позволяет естественным образом ввести понятие пикселя как базового элемента двумерного цифрового изображения. Совокупность пикселей характеризует геометрические свойства изображения и отражает его связь с изображаемым пространством.

Список литературы

1. Форсайт, Д. Компьютерное зрение : соврем. подход [Текст] I Д. Форсайт, Ж. Понс ; Дэвид Форсайт, Жан Понс. M. [и др.] ; Вильямс, 2004. 926 с. ISBN 5-8459-0542-7. EDN QMNJMH.

2. HERm^ra, А. А. Обнаружение объектов на местности интеллектуальными роботами в быстроменяющейся обстановке [Текст] / А. А. HH^rara, С. И. Уланов. Проблемы искусственного интеллекта. 2023. № 3(30). С. 36-43. DOI 10.34757/2413-7383.2023.30.3.003. EDN ALLVUM. ISSN 24l3-7383.

3. Пикалев, Я. С. О нейронных архитектурах извлечения признаков для задачи распознавания объектов на устройствах с ограниченной вычислительной мощностью [Текст] I Я. С. Пикалев, Т. В. Ермоленко. Проблемы искусственного интеллекта. 2023. № 3(30). С. 44-54. DOI 10.34757/24137383.2023.30.3.004. EDN BBGWBM. ISSN 2413-7383.

4. Ляхов, П. А. Разработка алгоритмов цифровой обработки изображений на основе метода Винограда в общем виде и анализ их вычислительной сложности [Текст] I П. А. Ляхов, H. H. ^горнов, H. Ф. Семенова, А. Ш. Абдулсалямова. Компьютерная оптика. 2023. Т. 47, № 1. С. 68-78. DOI 10.18287/2412-6179-CO-1146. EDN IPBFMC.

5. Mышкис, А. Д. Элементы теории математических моделей : написание уравнений, упрощение уравнений, выбор решений [Текст] I А. Д. Mышкис ; А. Д. Mышкис ; 4-е изд. Mосква i URSS, 2009. 191 с. ISBN 978-5-397-00576-0. EDN QJUWIT.

6. Методы компьютерной обработки изображений [Текст] : учеб. пособие для студентов вузов, обучающихся по направлению подготовки дипломированных специалистов «Прикладная математика» I M. В. Гашников, H. И. Глумов, H. Ю. Ильясова [и др.] ; под ред. В. А. Сойфера ; 2 издание, исправленное. Mосква i ООО Издательская фирма «Физико-математическая литература», 2003. 784 с. ISBN 5-9221-0270-2. EDN QMMTJV.

7. Прэтт, У. Цифровая обработка изображений [Текст] I У. Прэтт ; пер. с англ. Mосква i M^, 1982. Кн.1 312 с.

8. Wolff, L. B. Improved Diffuse Reflection Models for Computer Vision / L. B. Wolff, S. K. Nayar, M. Oren. [International journal of computer vision]. 1998. Vol. 30, № 1. P. 55-71. DOI 10.1023/A:1008017513536.

9. Баженов, А. В. Цифровая обработка сигналов [Текст] : учеб. пособие для аспирантов научной специальности 2.3.1 «Системный анализ, управление и обработка информации» I А. В. Баженов, Г. И. Линец. Ставрополь i Общество с ограниченной ответственностью «Издательско-информационный центр "Фабула"», 2022. 178 с. ISBN 978-5-91903-278-6. - EDN ACKAKL.

10. Козлов, В. H. Введение в математическую теорию зрительного восприятия [Текст] I В. H. Козлов. Mосква i Mехмат MT^ 2001. 128 с.

References

1. Forsyth D., Ponce J. Komp'iuternoe zrenie: sovremennyi podkhod [Computer vision: a modern approach]. Moscow et al., Williams, 2004, 926 p.

2. Nikitina A. A., Ulanov S. I. Detection of objects on the ground by intelligent robots in a rapidly changing environment. Problems of Artificial Intelligence, 2023, no. 3 (30). pp. 36-43. DOI: 10.34757/24137383.2023.30.3.003

3. Pikalyov Ya. S., Yermolenko T. V. About neural architectures of feature extraction for the problem of object recognition on devices with limited computing power. Problems of Artificial Intelligence, 2023, no. 3 (30). pp. 44-54. DOI: 10.34757/2413-7383.2023.30.3.004

4. Lyakhov P. A., Nagornov N. N., Semyonova N. F., Abdulsalyamova A. S. Development of digital image processing algorithms based on the Winograd method in general form and analysis of their computational complexity. Computer Optics, 2023, no. 47 (1). pp. 68-78. DOI: 10.18287/2412-6179-C0-1146

5. Myshkis A. D. Elementy teorii matematicheskikh modelei: napisanie uravnenii, uproshchenie uravnenii, vybor reshenii [Elements of the theory of mathematical models: writing equations, simplifying equations, choosing solutions]. Moscow, URSS, 2009, 191 p.

6. Gashnikov N. I., Glumov N. Y., Ilyasova M. V. et al. Metody komp'iuternoi obrabotki izobrazhenii [Methods of computer image processing]. 2nd ed., rev. Ed. V. A. Soyfer. Moscow, FIZMATLIT, 2003, 784 p.

7. Pratt W. Tsifrovaia obrabotka izobrazhenii. Kniga 1. [Digital image processing. Book 1]. Moscow, Mir Publishers, 1982, 312 p.

8. Wolff L. B., Nayar S. K., Oren M. Improved Diffuse Reflection Models for Computer Vision. International Journal of Computer Vision, 1998, no. 1 (30). pp. 55-71. DOI: 10.1023/A:1008017513536

9. Bazhenov A. V., Linets G. I. Tsifrovaia obrabotka signalov [Digital signal processing]. Stavropol, Izdatel'sko-informatsionnyi tsentr "Fabula", 2022, 178 p.

10. Kozlov V. N. Vvedenie v matematicheskuiu teoriiu zritel'nogo vospriiatiia [Introduction to the mathematical theory of visual perception]. Moscow, Mekhmat MGU, 2001, 128 p.

RESUME

A. E. Pokintelitsa

Substantial Foundations of the Mathematical Model of a Digital Halftone Image

A digital image is a specially organized data containing visual information about the state of the environment. The detection of extended objects in an image is one of the main procedures in the tasks of environmental exploration using computer vision systems.

Monitoring the interaction of objects in some terrain by robotic devices is quite a difficult task. The issues that arise when solving such problems make this work relevant.

The purpose of the presented work is to analyze the substantial foundations of the mathematical model of a digital halftone image. The process of building a model is also considered.

It is noted that the representation of visual information using a specially ordered set of values of a discretized image function which determines the brightness of the image makes it possible to use mathematical methods of image processing. The ordering function establishes the relationship between the individual elements of a digital image (pixels). It is concluded that the ordering function is a key element of the approach to extracting useful information from a set of visual data that is being processed.

The presented considerations allow us to naturally introduce the concept of a pixel as a basic element of a two-dimensional digital image. The set of pixels characterizes the geometric properties of the image and reflects its connection with the depicted space.

РЕЗЮМЕ

А. Е. Покинтелица

Содержательные основы математической модели цифрового полутонового изображения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Цифровое изображение представляет собой организованные особым образом данные, содержащие в себе визуальную информацию о состоянии окружающей среды. Процедура обнаружения протяженных объектов на изображении является одной из

основных в задачах исследования окружающей среды с применением систем технического зрения.

Актуальность данной работы обусловлена вопросами, возникающими при решении задач обнаружения объектов интереса робототехническими устройствами для отслеживания их взаимодействия на местности.

Целью представленной работы является рассмотрение процесса построения математической модели цифрового полутонового изображения с точки зрения ее содержательной составляющей.

Отмечено, что представление визуальной информации с помощью упорядоченного особым образом множества значений дискретизированной функции яркости делает возможным применение математических методов обработки изображений. Делается вывод о том, что упорядочивающая функция устанавливает связь между отдельными элементами цифрового изображения (пикселями) и является ключевым фактором в процессе извлечения полезной информации из обрабатываемого набора данных.

Изложенные соображения позволяют естественным образом ввести понятие пикселя как базового элемента двумерного цифрового изображения. Совокупность пикселей характеризует геометрические свойства изображения и отражает его связь с изображаемым пространством.

Покинтелица Артем Евгеньевич - младший научный сотрудник отдела теоретических исследований в области искусственного интеллекта, Федеральное государственное бюджетное научное учреждение «Институт проблем искусственного интеллекта», г. Донецк. Область научных интересов: искусственный интеллект, анализ данных, представление информации; эл. почта: pae.ipai@mail.ru, адрес: 283048, г. Донецк, ул. Артема, д. 118 б, телефон: +7 (856) 311-34-24.

Статья поступила в редакцию 22.04.2024.

i Надоели баннеры? Вы всегда можете отключить рекламу.