Научная статья на тему 'УЛУЧШЕНИЕ ИЗОБРАЖЕНИЙ АСФАЛЬТОБЕТОННЫХ ПОКРЫТИЙ НА ОСНОВЕ МЕТОДОВ СЕГМЕНТАЦИИ'

УЛУЧШЕНИЕ ИЗОБРАЖЕНИЙ АСФАЛЬТОБЕТОННЫХ ПОКРЫТИЙ НА ОСНОВЕ МЕТОДОВ СЕГМЕНТАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
31
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СРАВНЕНИЕ / МЕТОД / СЕГМЕНТАЦИЯ / ИЗОБРАЖЕНИЕ / ФОТОГРАФИЯ / ДОРОГА / ПОКРЫТИЕ / СОСТОЯНИЕ / ТОЧНОСТЬ / КЛАССИФИКАЦИЯ / ВРЕМЯ / СЛОЖНОСТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Журавлев А.А.

Для оценки качества дорожного покрытия существует множество систем, работающих на основе конкретных алгоритмов, среди которых методы сегментации изображения. Временная сложность и точность классификации - два ключевых показателя при оценке эффективности конкретного алгоритма. В данной статье в качестве анализируемых методов сегментации изображений используются: Кластеризация k-средних, Линейная кластеризация, Адаптивные пороговые значения, Глобальные пороговые значения. На основе способов, описанных в разделе «Методология экспериментов», наилучшие показатели точности классификации и временной сложности имеет метод «Глобальные пороговые значения» (38,2% - точность классификации; временная сложность - линейная (такой же тип сложности имеют и другие методы, однако, у данного алгоритма гораздо меньшие абсолютные временные показатели).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Журавлев А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPROVING IMAGES OF ASPHALT CONCRETE PAVEMENTS BASED ON SEGMENTATION METHODS

To assess the quality of the road surface, there are many systems that work on the basis of specific algorithms, including image segmentation methods. Time complexity and classification accuracy are two key indicators when evaluating the effectiveness of a particular algorithm. In this article, the following image segmentation methods are used as the analyzed methods: k-means clustering, Linear clustering, Adaptive thresholding, Global thresholding. Based on the methods described in the section "Methodology of experiments", the "Global thresholds" method has the best indicators of classification accuracy and time complexity (38.2% - classification accuracy; time complexity is linear (other methods have the same type of complexity, however, GT has much less absolute time indicators).

Текст научной работы на тему «УЛУЧШЕНИЕ ИЗОБРАЖЕНИЙ АСФАЛЬТОБЕТОННЫХ ПОКРЫТИЙ НА ОСНОВЕ МЕТОДОВ СЕГМЕНТАЦИИ»

и

Улучшение изображений асфальтобетонных покрытий на основе

методов сегментации

А.А. Журавлев Уральский федеральный университет

Аннотация: Для оценки качества дорожного покрытия существует множество систем, работающих на основе конкретных алгоритмов, среди которых методы сегментации изображения. Временная сложность и точность классификации - два ключевых показателя при оценке эффективности конкретного алгоритма. В данной статье в качестве анализируемых методов сегментации изображений используются: Кластеризация k-средних, Линейная кластеризация, Адаптивные пороговые значения, Глобальные пороговые значения. На основе способов, описанных в разделе «Методология экспериментов», наилучшие показатели точности классификации и временной сложности имеет метод «Глобальные пороговые значения» (38,2% - точность классификации; временная сложность - линейная (такой же тип сложности имеют и другие методы, однако, у данного алгоритма гораздо меньшие абсолютные временные показатели). Ключевые слова: сравнение, метод, сегментация, изображение, фотография, дорога, покрытие, состояние, точность, классификация, время, сложность.

Введение

Роль дорог в жизни почти каждого человека достаточно велика. В связи с этим, оценка качества дорожного покрытия является одной из самых популярных задач во всем мире. Для этого существует множество систем, которые работают на основе определенных алгоритмов, в том числе, и с помощью методов сегментации изображения. Сегментация представляет собой процесс разделения изображения на несколько сегментов (частей). Одними из ключевых показателей при оценке эффективности конкретного метода являются точность классификации [1, 2] (отнесение изображения к конкретной группе) и временная сложность [3, 4].

В данной статье в качестве анализируемых методов сегментации изображений используются: Кластеризация k-средних, Линейная (простая линейная итеративная) кластеризация, Адаптивные (локальные) пороговые значения, Глобальные пороговые значения.

и

Научная новизна заключается в способе определения временной сложности алгоритмов.

Цель работы - определить точность классификации и временную сложность выбранных методов сегментации. Задачи исследования:

1. Кратко описать выбранные методы сегментации изображений.

2. С помощью способов, представленных в разделе «Методология экспериментов», получить точность классификации и временную сложность выбранных методов сегментации изображений.

3. Сравнить полученные результаты с другими методами, которые проходили через схожую процедуру оценки параметров.

Описание анализируемых методов

Кластеризация к-средних

Алгоритм «кластеризации ^средних» (КС) является неконтролируемым алгоритмом и используется для отделения интересующей области от фона. Он объединяет или разбивает данные на ^кластеры или части на основе ^центроидов. Алгоритм используется в том случае, когда имеются немаркированные данные (данные без определенных категорий или групп). Цель состоит в том, чтобы найти определенные группы на основе некоторого сходства данных с количеством групп [5]. Линейная кластеризация

Простая линейная итеративная кластеризация, или линейная кластеризация (ЛК) - метод сегментации пикселей для сокращения нерелевантных данных изображения. Кроме того, идея, которая лежит в его основе, заключается в замене стандартной пиксельной сетки сеткой регионов. Таким образом, создается изображение с менее примитивными элементами, сохраняющее при этом меньшее количество деталей [6].

и

Адаптивные пороговые значения

Метод «Адаптивные пороговые значения» (АПЗ) обычно принимает изображение в оттенках серого или же цветное в качестве входных данных и, в простейшей реализации, выводит двоичное изображение, представляющее сегментацию. Для каждого пикселя на изображении необходимо вычислить пороговое значение. Если значение пикселя ниже порогового показателя, оно устанавливается в фоновое значение, иначе принимает показатель переднего плана [7].

Глобальные пороговые значения

Алгоритм «Глобальные пороговые значения» (ГПЗ) самый простой из всех методов порогового значения, заключающийся в разделении гистограммы изображения с использованием единого глобального порога ^ Затем выполняется сегментация путем сканирования изображения пиксель за пикселем и маркировки каждого пикселя, как объекта или фона, в зависимости от того, больше или меньше уровень серого для этого пикселя, чем значение ^ Успешное выполнение данного метода полностью зависит от того, насколько хорошо гистограмма может быть разделена [8].

Методология экспериментов

Вычисление точности классификации

Эксперимент для определения точности выбранных методов сегментации проводится по тому же принципу, что и в работе [1]. Его основные этапы:

1) Отбор 140 изображений дорожного покрытия 4 видов (без повреждений, с трещинами, с ямами, с колеями) с выделением на каждый по 35 фотографий, из которых 10 изображений являются шаблонными и подлежат только сегментации) и тестовые (используются для сегментации и сопоставления с шаблонными изображениями).

и

2) Выбирается шаблонное изображение, наиболее схожее с текущей тестовой фотографией.

3) Если категории шаблонного и тестового изображений совпадают, то такой ответ считается верным.

Пример фотографий каждого вида (без повреждений, с трещинами, с ямами, с колеями) показан на рис. 1.

1 - без повреждений 2-е трещинами

3-е ямами 4-е колеями

Рис. 1 - Фотографии каждого вида дорожного состояния: 1 - без повреждений, 2 - с трещинами, 3 - с ямами, 4 - с колеями Определение сложности алгоритмов

Также, как и точность классификации, ключевым показателем качества алгоритма является его временная сложность. В данной статье для оценки временной сложности каждого из вышеперечисленных методов проведена серия экспериментов для изображений разного размера. Изображения имеют следующие размеры (в пикселях): 60000, 80000, 120000, 240000, 480000, 960000.

и

Для обработки изображений выбранными методами сегментации используется 5 фотографий с трещинами. В качестве формата выбран PNG, поскольку изображения данного типа сжимаются без потерь. Фотографии представлены на рис. 2.

4 5

Рис. 2 - Исходные изображения для сегментации Исходный размер каждой фотографии - 240000 пикселей. Для определения временной сложности этих методов каждое из 5 изображений увеличивается и уменьшается в 2, 3 и 4 раза. Для определения более точного значения времени обработки для конкретного алгоритма каждое фото обрабатывается 10 раз. Таким образом, для каждого алгоритма проведено 50 серий экспериментов, поскольку имеется 5 различных изображений. Формула имеет следующий вид:

где - среднее время сегментации изображения определенным

алгоритмом, M - количество обработок (сегментаций) одного изображения, N - количество изображений, ^ - время одного преобразования.

и

В данной статье M = 10, N = 5.

Пример фотографии после сегментации выбранными методами показан на рис. 3.

Исходное изображение Кластеризация k-средних Линейная кластеризация

Адаптивыне пороговые значения Глобальные пороговые значения

Рис. 3 - Пример сегментации изображения каждым из выбранных методов

Результаты экспериментов

Для реализации обоих экспериментов выбраны среда Visual Studio 2022 и язык программирования C#. Для вычисления точности классификации дополнительно используется библиотека Emgu.CV [9]. Компьютер, на котором проводятся эксперименты, обладает следующими характеристиками:

• процессор - Intel Core i5;

• оперативная память - 8 гигабайт;

• тип системы - x64;

• операционная система - Windows 10 Pro. Вычисление точности классификации

Результаты эксперимента для определения точности классификации выбранных методов сегментации изображения представлены в таблице 1.

и

Таблица № 1

Точность классификации (в процентах) выбранных методов сегментации

Название метода Кластеризация k-средних Линейная кластеризация Адаптивные пороговые значения Глобальные пороговые значения

Номер эксперимента

1 32 35 30 34

2 36 34 33 37

3 42 42 38 44

4 35 33 39 36

5 42 41 38 40

Среднее значение 37,4 37,0 35,6 38,2

Определение сложности алгоритмов

Результаты эксперимента для определения времени работы алгоритмов сегментации в зависимости от размера изображения показаны в таблице 2.

Таблица № 2

Таблица 2 - Время работы (в миллисекундах) методов сегментации в зависимости от размера изображения

Название метода Кластеризация k-средних Линейная кластеризация Адаптивные пороговые значения Глобальные пороговые значения

Количество пикселей

60000 597 334 690 6

80000 650 462 910 7

120000 1094 790 1375 11

240000 1917 2119 2761 22

480000 3954 5892 5491 38

720000 5920 10947 8178 58

960000 7748 16645 11020 75

и

График зависимости времени работы методов сегментации от размера изображения представлен на рисунке 4.

Зависимость среднего времени выполнения методов сегментации изображений от количества пикселей

18000

16000

и

г

14000

5 X

® 12000

X

§

С 10000 л п

к 8000

Ф

Ю 6000 Ш 0)

5- 4000

г

о.

и 2000 О

О 200000 400000 600000 800000 1000000 1200000

Количество пикселей

Рисунок 4 - График зависимости времени работы методов сегментации от

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

размера изображения Если сравнить полученный график с тем, который представлен в [10], то можно сделать вывод, что КС, АПЗ и ГПЗ имеют линейную временную

л

сложность O(n), ЛК - O(n). Однако ГПЗ обладает гораздо меньшими абсолютными временными показателями по сравнению с другими алгоритмами.

Обсуждение результатов

Исходя из результатов, представленных в таблице 1 можно утверждать, что наилучший показатель точности классификации имеет алгоритм ГПЗ, этот показатель составляет 38,2%, что немногим больше, чем у остальных методов. Однако, данное значение не превосходит показатель метода «Оператор Кирша» из [1], который равен 46,2%. Но тем не менее, в связи с тем, что абсолютные временные показатели (представлены в таблице 2) ГПЗ достаточно невысокие, можно предположить, что данный метод является хорошей опорой для дальнейшей разработки собственного метода оценки качества дорожного покрытия. Чтобы с уверенностью это утверждать,

и

необходимо провести анализ временной сложности для методов, перечисленных в работе [1].

Выводы

В данной статье на основе способа, описанного в разделе «Методология эксперимента», вычислены точность классификации и временная сложность для следующих методов сегментации изображения: Кластеризация k-средних, Линейная кластеризация, Адаптивные пороговые значения, Глобальные пороговые значения. Метод «Глобальные пороговые значения» имеет наилучшие показатели точности классификации (38,2%) (меньше, чем соответствующая характеристика для метода «Оператор Кирша» (46,2%), рассмотренного в [1]) и временной сложности (линейная; такой же временной сложностью обладают и другие методы, однако у ГПЗ гораздо меньшие абсолютные временные показатели), поэтому, с большой долей вероятности, он может служить хорошей опорой для разработки собственного алгоритма оценки качества дорожного покрытия.

Литература

1. Журавлев А.А. Сравнение эффективности классификации методов выделения контуров на примере изображений дорожного покрытия // XXI век: итоги прошлого и проблемы настоящего плюс. 2023. Т. 12, № 1, С. 23-28.

2. Гонсалес, Р. Цифровая обработка изображений. - М.: Техносфера, 2012. - 1101 с.

3. Кравченко, В.Ф. Цифровая обработка сигналов и изображений в радиофизических приложениях. - М.: Физматлит, 2007. - 544 с.

4. Ерош, И.Л., Сергеев М.Б., Соловьев Н.В. Обработка и распознавание изображений в системах превентивной безопасности: Учебное пособие. -СПб.: ГОУ ВПО СПбГУАП, 2012. - 154 с.

и

5. Introduction to Image Segmentation with K-Means clustering, URL: kdnuggets.com/2019/08/introduction-image-segmentation-k-means-clustering.html.

6. SLIC Superpixels. URL: epfl.ch/labs/ivrl/research/slic-superpixels/

7. Adaptive Thresholding. URL: homepages.inf.ed.ac.uk/rbf/HIPR2/ adpthrsh.htm

8. What is thresholding? Explain about global thresholding. URL: benchpartner.com/q/what-is-thresholding-explain-about-global-thresholding

9. EMGU CV Tutorial. URL: bias.csr.unibo.it/vr/Esercitazioni/Tracce/ Emgu%20CV%20Tutorial%20 Skander.pdf

10. О большое (Big O). Случаи логарифмической и факториальной сложности. URL: proproprogs.ru/structure_data/std-o-bolshoe-big-o-sluchai-logarifmicheskoy-i-faktorialnoy-slozhnosti

References

1. Zhuravlev A.A. XXI vek: itogi proshlogo i problemy' nastoyashhego plyus. 2023. Vol. 12, № 1, pp. 23-28.

2. Gonsales, R. Cifrovaya obrabotka izobrazhenij [Digital Image Processing]. M.: Texnosfera, 2012. 1101 p.

3. Kravchenko, V.F. Cifrovaya obrabotka signalov i izobrazhenij v radiofizicheskix prilozheniyax [Digital Signal and Image Processing in Radiophysical Applications]. M.: Fizmatlit, 2007. 544 p.

4. Erosh, I.L., Sergeev M.B., Solov'ev N.V. Obrabotka i raspoznavanie izobrazhenij v sistemax preventivnoj bezopasnosti [Image Processing and Recognition in Preventive Security Systems]. Uchebnoe posobie SPb. GOU VPO SPbGUAP, 2012. 154 p.

5. Introduction to Image Segmentation with K-Means clustering, URL: kdnuggets.com/2019/08/introduction-image-segmentation-k-means-clustering.html.

и

6. SLIC Superpixels. URL: epfl.ch/labs/ivrl/research/slic-superpixels/

7. Adaptive Thresholding. URL: homepages.inf.ed.ac.uk/rbf/HIPR2/ adpthrsh.htm

8. What is thresholding? Explain about global thresholding. URL: benchpartner.com/q/what-is-thresholding-explain-about-global-thresholding

9. EMGU CV Tutorial. URL: bias.csr.unibo.it/vr/Esercitazioni/Tracce/ Emgu%20CV%20Tutorial%20 Skander.pdf

10. O boFshoe (Big O). Sluchai logarifmicheskoj i faktoriaFnoj slozhnosti. [Big O. Cases of logarithmic and factorial complexity]. URL: proproprogs.ru/structure_data/std-o-bolshoe-big-o-sluchai-logarifmicheskoy-i-faktorialnoy-slozhnosti

i Надоели баннеры? Вы всегда можете отключить рекламу.