Алгоритм детектирования несанкционированных свалок мусора на основе анализа данных дистанционного зондирования Земли

Акинина Наталья Викторовна; Никифоров Михаил Борисович

УДК 004.852; 004.855.5

АЛГОРИТМ ДЕТЕКТИРОВАНИЯ НЕСАНКЦИОНИРОВАННЫХ СВАЛОК МУСОРА НА ОСНОВЕ АНАЛИЗА ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ

Н.В. Акинина, М.Б. Никифоров

Рассматривается проблема своевременного мониторинга несанкционированных свалок мусора. Рассмотрена математическая модель обработки спутниковых снимков с целью обнаружения несанкционированных свалок мусора. Приведено описание алгоритма детектирования несанкционированных свалок мусора. Приведено описание каждого этапа данного алгоритма. Приведены результаты реализации описанного алгоритма.

Ключевые слова: мониторинг, классификация, текстура, текстурные признаки Харалика, энергетические характеристика Лавса, анализ главных компонент, авто-энкодер, машина опорных векторов, бинарная кадровая маска.

Введение

Несанкционированные свалки являются одним из значимых факторов загрязнения, оказывающих негативное воздействие на природные компоненты: атмосферу, водные источники, почву, растительный и животный мир. Размещаясь непосредственно на почвенном покрове, свалки выводят из сельскохозяйственного оборота и биосферы значительную часть земель, привнося в них загрязняющие вещества. При анализе местоположения свалок была обнаружена их приуроченность к следующим природным объектам к лесным массивам - 94%, к лугам - 1%, к пустырям - 1.5%, к берегам водоемов - 3%, к оврагам - менее 1%. Установлено, что чаще свалки встречаются у транзитных транспортных путей (шоссе, железная дорога и т.п.), гаражей, в местах проживания людей (частный сектор городов, садоводческие товарищества, отдаленные населенные пункты и т.п.) [1].

Проблема

Единственным источником информации, дающим полную, актуальную, оперативную картину проблемы и при этом минимизирующим финансовые, временные, трудовые затраты для решения данной проблемы, являются современные данные дистанционного зондирования Земли (ДЗЗ) из космоса. Безусловно, наиболее эффективная методика мониторинга мест складирования отходов должна опираться на современные компьютерные технологии, в частности, на средства обработки данных ДЗЗ и геоинформационные системы (ГИС). Космические снимки в сочетании с выборочным наземным контролем, а также другими источниками информации (имеющимися электронными картами, цифровыми моделями рельефа), становятся основой для оперативного выявления, картографирования и мониторинга свалок.

Эффективная методика выявления, картографирования и мониторинга несанкционированных мест складирования отходов должна включать следующие обязательные шаги: подбор космических снимков с необ-

321

ходимыми временными и техническими характеристиками, выполнение их фотограмметрической обработки, дешифрирование снимков с целью выделения свалок и загрузка полученных результатов в ГИС.

Для упрощения и ускорения работы по поиску свалок, а также для повышения точности их выявления по снимку на этапе дешифрирования, используются знания о возможном расположении свалок по отношению к антропогенным и природным объектам. С использованием космических снимков сверхвысокого пространственного разрешения можно визуально определять и картографировать свалки размером от 10 кв. м с очень большой степенью вероятности (до 90-95%) [1].

Для установления фактов сокращения или увеличения площади ранее выявленных свалок, а также для контроля выполнения мероприятий по их рекультивации, очень эффективно применение разновременных композитов — изображений, сформированных из двух разновременных космических снимков на одну и ту же территорию. На таких результирующих изображениях очень контрастно выделяются именно изменившиеся в площадном отношении объекты, в том числе и свалки, что гарантирует тотальный, безошибочный и малозатратный мониторинг.

Следует отметить, что кроме измерения площадных характеристик свалок по одиночным космическим снимкам, современные системы ДЗЗ позволяют измерять высоту тела свалки (точность до 1 м), а также рассчитывать объем складированного мусора за счет выполнения съемки в стереоскопическом режиме (по паре космических снимков) [2].

Кроме установления самого факта складирования отходов и измерения количественных характеристик свалки, по космическим снимкам можно определить и ряд ее качественных параметров, практически выходя на составление экологического паспорта свалки, одной из составляющих которого становится определенный ранее морфологический состав (тип мусора), а другой — определение по снимку воздействия свалки на компоненты вмещающего ландшафта. Это может быть повреждение травяного покрова, кустарников, деревьев по периферии свалки; наличие стоков с территории свалки; захламленность береговой линии, водной акватории объектов, прилегающих к свалке; горение, тление свалки; испарения от свалки (фиксируются только очень мощные потоки).

Математическая модель. Данные ДЗЗ (спутниковые снимки), получаемые от сенсоров можно представить в виде изображения (спутникового снимка) В:

I = 1,1; у = 1,3; к = 1, К; 1,3, К е К, 322

где Ьу - пиксель спутникового снимка В, находящийся в г-ой строке пикселей, в у-м столбце; Ь^ - спектральная яркость пикселя Ьу в &-ом спектральном канале; I - количество строк пикселей в спутниковом снимке В; J - количество столбцов пикселей в спутниковом снимке В; К - количество спектральных каналов в спутниковом снимке В [3].

Спектральные яркости Ьуи должны быть масштабированы в диапазон [-1; 1] для удобства дальнейшей работы с ними. Для масштабирования спектральных яркостей из первоначального диапазона уровней квантования может быть использовано линейное преобразование, которое для Q-и уровней имеет вид:

где Ьуи - первоначальное (квантованное) значение спектральной яркости

На вход системы искусственного интеллекта поступает численное представление спутникового снимка В. Далее функционируют последовательно следующие модули:

1. Модуль выделения на спутниковом снимке характерных образов (функция сегментации) — выделяет на спутниковом снимке интересующие объекты и формирует из них отдельное множество;

2. Модуль выделения характерных признаков на образе (Функция расчета текстурных признаков) — описывает образы посредством описания их текстурных признаков (текстурные признаки Харалика, энергетические характеристики Лавса) и на выходе дает совокупность векторов, состоящих из численного представления описанных текстурных признаков;

3. Модуль выделения основных признаков образов (функция сокращения размерности векторного пространства) — производит выделение наиболее ценной информации с целью экономии затрачиваемых на обработку ресурсов и сокращения времени обработки;

4. Модуль классификации характерных образов (функция распознавания образов) — распознает по имеющимся векторам текстурных признаков интересующие области (в данном случае — несанкционированные свалки) и делит входную информацию на классы в зависимости от наличия областей с отходами;

5. Модуль выделения на образе интересующей области (функция формирования маски) — выделяет для большей наглядности на изображениях области, заполненные мусором.

Алгоритм

Схема алгоритма детектирования несанкционированных свалок мусора представлена на рис. 1.

Ьук е [°;Й у е ^

[4].

Начало О

1

/ Получение / / спутникового / / снимка / Классификация

1

Выделение характерных образов Выделение интересующей области

1 *

Выделение характерных признаков / Возврат / / спутникового / / снимка /

1 1

Выделение основных признаков Конец

Рис. 1. Алгоритм детектирования несанкционированных свалок мусора

Алгоритм состоит из следующих этапов:

1. Выделение на спутниковом снимке характерных образов.

Существует несколько подходов к выделению образов на спутниковом снимке. Наиболее эффективным, с точки зрения времени выполнения и требуемых вычислительных ресурсов и позволяющим получить при этом результат качества, достаточного для дальнейшего совмещения, является подход, основанный на использовании многомерной нейронной карты Ко-хонена [5].

Принцип работы многомерной нейронной карты Кохонена проиллюстрирован рис. 2. На рис. 2 трехмерная карта описывает двухмерное векторное пространство в соответствии с его статистическими характеристиками. Несоответствие размерности (карта большей размерности описывает пространство меньшей размерности) позволяет достичь нелинейности описания, что положительно влияет на качество выполняемой классификации и, соответственно, на качество сегментации пространства.

Рис. 2. Сегментация двухмерного векторного пространства с помощью трехмерной нейронной карты Кохонена

2. Описание выделенных образов.

Наиболее простым является выбор в качестве признаков пикселя его яркостей во всех каналах изображения. Таковой подход не может быть использован на практике, поскольку он не учитывает спектральные яркости соседних пикселей и, следовательно, ведет к неправильной классификации пикселей на зашумленных изображениях.

Существенный интерес в контексте решения задачи составления электронных карт по данным аэрофотосъемки представляет описание пикселей изображения посредством описания покрывающих их текстур (тек-

324

стурные признаки), поскольку таковые признаки учитывают не только спектральные яркости пикселя в каждом из каналов, но также спектральные яркости пикселей в окрестностях рассматриваемого пикселя и взаимосвязь между данными спектральными яркостями.

Существуют следующие способы описания текстур:

- описание текстур с помощью признаков, рассчитываемых по гистограмме изображения;

- спектральные текстурные характеристики;

- энергетические характеристики Лавса;

- текстурные признаки Харалика;

- прочие способы.

Харалик предложил описывать текстуру, покрывающую изображение, характеристиками специальных матриц вхождений E, рассчитываемых по изображению. Каждая матрица вхождений описывает структуру текстуры в соответствующем направлении от одного края обрабатываемого изображения к другому. По результатам расчета характеристик матриц E составляется вектор текстурных признаков изображения, которые могут рассматриваться как характеристики текстуры, покрывающей каждый пиксель изображения. В случае изображения I данный снимок необходимо обойти с помощью окна размером 0ц на 0ц пикселей, рассчитывая для каждого окна набор текстурных признаков Харалика. Значение 0ц должно

быть выбрано в соответствии с решаемой задачей.

Расчет текстурных признаков Харалика может быть эффективно распараллелен средствами современных вычислительных систем. Недостатком текстурных признаков Харалика является их меньшая компактность (большая размерность вектора dmn), по сравнению с соответствующим вектором энергетических характеристик Лавса, что объясняется необходимостью расчета одних и тех же характеристик для нескольких матриц вхождений. На практике же последний недостаток не играет существенной роли в случае, если текстурные признаки Харалика лучшим образом, с точки зрения качества работы классификатора, описывают классифицируемые текстуры.

3. Понижение размерности пространства признаков с использованием PCA-сети и автоэнкодера.

Анализ главных компонент (principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв минимальный объем информации. Иногда PCA называют преобразованием Карунена — Лоева или преобразованием Хотеллинга. PCA состоит в линейном ортогональном преобразовании входного вектора X размерности n в выходной вектор Y размерности p, где p < n - при этом компоненты вектора Y являются некоррелированными и общая дисперсия после преобразования остается неизменной.

Автоэнкодер (автоассоциатор) — специальная архитектура нейронных сетей, позволяющая применять обучение без учителя при использовании метода обратного распространения ошибки. Простейшая архитектура

325

автоэнкодера — сеть прямого распространения, без обратных связей, наиболее схожая с перцептроном и содержащая входной слой, промежуточный слой и выходной слой.

Главная цель обучения автоэнкодера — добиться того, чтобы входной вектор признаков вызывал отклик сети, равный входному вектору. То есть задача функционирования автоэнкодера сводится к нахождению аппроксимации такой функции, чтобы отклик нейронной сети равнялся значению входных признаков с точностью до заданного значения ошибки. Чтобы решение поставленной задачи было нетривиальным, топология нейронной сети должна удовлетворять одному из следующих условий:

- количество нейронов скрытого слоя должно быть меньше, чем размерность входных данных. Такое ограничение позволяет получить сжатие данных при передаче входного сигнала на выход сети. В таком виде функционирование автоэнкодера напоминает метод анализа главных компонент (PCA);

- активация нейронов скрытого слоя должна быть разреженной. Данное требование позволяет получить нетривиальные результаты, даже когда количество нейронов скрытого слоя превышает размерность входных данных.

4. Классификация характерных образов.

Машина опорных векторов ((англ.) support vector machine, SVM) выполняет линейное разделение пространства образов на два класса [6].

Пусть дано пространство V, состоящее из векторов v:

V = {v}; _

V = {V1,..., Vq,..., VQ } q = 1, Q;

vq e R.

В контексте решаемой задачи пространство V образуется из векторов признаков классифицируемых образов.

Ключевая особенность машины опорных векторов состоит в ее способности выполнять нелинейное разбиение классифицируемого векторного пространства V путем отображения V в векторное пространство V' такое, что |V| £ V '| и линейное разделение которого возможно или производится с

меньшей ошибкой, чем линейное разделение исходного пространства.

Векторное пространство V формируется следующим образом:

V' ={v}; _

v' ={v\,..., v'q'} q = 1Q;

Vq e R

j® V';

y =j( У).

326

Разделяющая поверхность Ь рассматривается в пространстве V. Разделение, таким образом, является линейным в отношении V. Требуемая нелинейность разделения пространства V обеспечивается отображением ф. Размерности пространств V и V' не обязательно совпадают и, в общем случае, имеет место быть следующее соотношение: Q £ Q'.

Принцип работы машины опорных векторов проиллюстрирован

рис. 3.

Рис. 3. Принцип работы машины опорных векторов

Машина опорных векторов в процессе своей работы не использует отображение f- SVM оперирует ядрами скалярных произведений векторов пространства V. Уравнение разделяющей поверхности L, описываемой

машиной опорных векторов, имеет вид:

QS

L(S, v) = ^ Wj ■ kernel(Sj, v) + T; i=1

kernel (s, v) = j( s )j( y);

S = {Sj};i = q,QS;S с V;

W = Wj; Wj e R;

T e R,

где: L - разделяющая поверхность; S - множество опорных векторов; kernel — ядро скалярного произведения — скалярное произведение образов векторов s и v в пространстве V; Т — пороговое значение.

В качестве ядра скалярного произведения могут быть использованы функции, удовлетворяющие теореме Мерсера.

Бинарная кластеризация, выполняемая машиной опорных векторов, состоит в том, чтобы рассчитать значение L(S,v) для некоторого входного вектора v. Если L(S,v) > 0, то вектор v относится к классу, условно маркируемому +1, в противном случае L(S,v) < 0 - вектор v относится к классу, условно маркируемому -1. Ситуация L(S,v) = 0 рассматривается как некорректная, вектор v маркируется как «неклассифицированный», а образ, соответствующий вектору, в дальнейшем не рассматривается.

Таким образом, цель обучения машины векторов состоит в определении следующих ее параметров:

- множества S опорных векторов;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- вектора W весов при опорных векторах;

- порогового значения T.

5. Выделение интересующих областей на изображении.

Бинарная кадровая маска движения показывает наличие или отсутствие движения в каждом отдельно взятом пикселе текущего кадра. Неподвижные пикселы обозначаются логическими нулями, а подвижные - логическими единицами. Для вычисления маски движения используется текущий кадр и один или несколько дополнительных кадров, называемых ссылочными. По маске движения проводится сортировка макроблоков, в результате которой часть блоков признаётся подвижной, а часть неподвижной.

Формирование бинарной кадровой маски движения на основе принципов контекстно-зависимого арифметического кодирования. Проводится предварительное построение маски по паре последовательных кадров с её последующей коррекцией на основе статистического анализа полученной маски.

При проведении коррекции маски вычисляются вероятности движения пикселов в контексте движения их пространственных соседей. Конечное заключение относительно движения пиксела делается по попаданиям рассчитанных вероятностей в один из двух вероятностных поддиапазонов. Таким образом, каждый пиксел может поменять свой статус на противоположный [7].

Результат выполнения описанного алгоритма приведен на рис. 4.

Необработанный спутниковый снимок Обработанный спутниковый снимок

Рис. 4. Пример спутникового снимка (до и после обработки)

Заключение

Описанный алгоритм детектирования несанкционированных свалок позволил эффективно выделять места скопления отходов с точностью 92 -95 % при времени обработки 2,8.. .3,5 секунды на один кадр.

Список литературы

1. Раменский региональный экоцентр [Электронный ресурс] URL: http://www.rrec.ru (дата обращения: 04.08.20l9).

2. Издание о высоких технологиях [Электронный ресурс] URL: http: //www. cnews .ru (дата обращения: 08.08.2019).

3. Колесенков А.Н., Таганов А.И., Акинина Н.В., Псоянц В.Г. Модели и методы принятия управленческих решений по мониторингу экологических рисковых ситуаций // Динамика сложных систем - XXI век № 2 (2017). М.: Радиотехника, 2017. С. 3 - 8.

328

4. Akinina N.V., Gusev S.I., Kolesenkov A.N., Taganov A.I. Construction of basic graphic elements library for geoinformation ecological monitoring system // 27th International Conference Radioelektronika (RADIOELEKTRONIKA). Czech Republic, Brno, 2017. P. 1 - 5.

5. Акинин М.В. Модели и алгоритмы моделирования интеллектуальной системы автоматического совмещения данных дистанционного зондирования Земли и цифровых карт местности (диссертация). Рязань, 2014. 166 с.

6. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. 1072 с.

7. Хайкин С. Нейронные сети: полный курс, 2-е изд., испр.: пер. с англ. М.: ООО .И.Д. Вильямс., 2006. 1104 с.

Акинина Наталья Викторовна, канд. техн. наук, старший преподаватель, natalya.akininaagmail.com, Россия, Рязань, Рязанский государственный радиотехнический университет,

Никифоров Михаил Борисович, канд. техн. наук, доцент, nikiforov.m. h a evm.rsreu.ru, Россия, Рязань, Рязанский государственный радиотехнический университет

ALGORITHM FOR DETECTING UNAUTHORIZED DUMPS BASED ON THE ANALYSIS

OF REMOTE SENSING DA TA

N. V. Akinina, M. V. Akinin, M.B. Nikiforov

The problem of timely monitoring of unauthorized garbage dumps is considered. The mathematical model of satellite images processing for the purpose of detection of unauthorized garbage dumps is considered. The description of algorithm of detection of unauthorized dumps of garbage is resulted. The description of each stage of this algorithm is given. The results of the implementation of the described algorithm are presented.

Key words: monitoring, classification, texture, Haralik's textural features, energy characteristics of LaWs, principal component analysis, autoencoder, support vector machine, binary frame mask.

Akinina Natalia Viktorovna, candidate of technical sciences, senior lecturer, natalya. akininaagmail. com, Russia, Ryazan, Ryazan State Radio Engineering University,

Nikiforov Michael Borisovich, candidate of technical sciences, docent, nikiforov. m. b@evm. rsreu. ru, Russia, Ryazan, Ryazan State Radio Engineering University

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Акинина Наталья Викторовна, Никифоров Михаил Борисович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Акинина Наталья Викторовна, Никифоров Михаил Борисович

ALGORITHM FOR DETECTING UNAUTHORIZED DUMPS BASED ON THE ANALYSIS OF REMOTE SENSING DATA

Текст научной работы на тему «Алгоритм детектирования несанкционированных свалок мусора на основе анализа данных дистанционного зондирования Земли»