Научная статья на тему 'Методы классификации гиперспектральных изображений при экологическом мониторинге'

Методы классификации гиперспектральных изображений при экологическом мониторинге Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
235
30
Поделиться
Ключевые слова
ГИПЕРСПЕКТРАЛЬНОЕ ИЗОБРАЖЕНИЕ / МЕТОДЫ КЛАССИФИКАЦИИ / ДЕШИФРИРОВАНИЕ / ЭКОЛОГИЧЕСКИЙ МОНИТОРИНГ / HYPERSPECTRAL IMAGE CLASSIFICATION TECHNIQUES / AERIAL PHOTOGRAPH INTERPRETATION / ENVIRONMENTAL MONITORING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Раменская Екатерина Вячеславовна, Ермаков Василий Васильевич, Кузнецов Михаил Павлович

В статье рассмотрены методы классификации гиперспектральных изображений с целью идентификации участков, загрязненных нефтью/нефтепродуктами. Выявлена необходимость создания узкоспециализированного алгоритма классификации изображений, который позволит учесть недостатки других методов. Разработан алгоритм, позволяющий получить классификацию высокого качества.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Раменская Екатерина Вячеславовна, Ермаков Василий Васильевич, Кузнецов Михаил Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

METHODS OF CLASSIFICATION OF HYPERSPECTRAL IMAGES WHEN ENVIRONMENTAL MONITORING

The article deals with the classification of hyperspectral imaging techniques to identify sites contaminated by oil/oil products. The need for the creation of highly specialized image classification algorithm detected. It will take into account the disadvantages of other methods. The algorithm was developed. It allows to obtain a classification of high-quality.

Текст научной работы на тему «Методы классификации гиперспектральных изображений при экологическом мониторинге»

УДК 528.8, 502/504

МЕТОДЫ КЛАССИФИКАЦИИ ГИПЕРСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ ПРИ ЭКОЛОГИЧЕСКОМ МОНИТОРИНГЕ

© 2016 Е.В. Раменская1, В.В. Ермаков1, М.П. Кузнецов2

1 Самарский государственный технический университет 2 Московский физико-технический институт

Статья поступила в редакцию 10.12.2015

В статье рассмотрены методы классификации гиперспектральных изображений с целью идентификации участков, загрязненных нефтью/нефтепродуктами. Выявлена необходимость создания узкоспециализированного алгоритма классификации изображений, который позволит учесть недостатки других методов. Разработан алгоритм, позволяющий получить классификацию высокого качества. Ключевые слова: гиперспектральное изображение, методы классификации, дешифрирование, экологический мониторинг.

Сегодня средства дистанционного зондирования Земли (ДЗЗ) находят все большее применение в целях обеспечения экологической безопасности территорий. Данные дистанционного зондирования применяются при лесопатологическом мониторинге, инвентаризации лесов, мониторинге состояния и продуктивности морских и пресных водоемов, в задачах обнаружения и распознавания несанкционированных свалок и контроля состояния полигонов, при мониторинге динамики границ снежного покрова, для комплексной оценки состояния растительного покрова, при поиске нефтезагрязнений. Широкое использование данных ДЗЗ обусловлено явными достоинствами: проведение регулярных наблюдений за состоянием территорий, включая мониторинг техногенных объектов, получение информации, обобщающей процессы на различных уровнях, наблюдение за труднодоступными объектами на отдаленных территориях.

Для получения необходимой информации специалисты проводят обработку спутниковых изображений (предварительную и тематическую). Процесс предварительной обработки изображения предполагает удаление из данных ДЗЗ систематических радиометрических и геометрических ошибок и обычно включает изменение яркости и контрастности, а также пространственную фильтрацию и преобразование Фурье. Решение задач тематической обработки является этапом анализа предварительно обработанного изображения с целью реализации процесса обнаружения и распознавания обнаруженных объектов, называемого дешифрированием изображения. В результате дешифрирования получают тематическую карту

Раменская Екатерина Вячеславовна, аспирант. E-mail: iljushinakatja@rambler.ru

Ермаков Василий Васильевич, кандидат технических наук, старший преподаватель. E-mail: wassiliy@rambler.ru Кузнецов Михаил Павлович, аспирант. E-mail: mikhail.kuznecov@phystech.edu

территории с нанесенными на ней дешифрированными распознанными объектами [1].

Дешифрирование может производиться визуальными и автоматизированными методами. Визуальные методы предполагают ручной анализ снимков, при этом основным инструментом проведения визуального дешифрирования являются знания и интуиция дешифровщика. Визуальные методы дешифрирования подразумевают наличие большого опыта у специалиста, проводящего дешифрирование.

Появление цифровых снимков стало основанием для развития методов автоматизированного дешифрирования. В настоящее время существует целый ряд программных средств, применяемых для обработки данных ДЗЗ. Выбор программы предопределяет конкретная решаемая задача, объем обрабатываемых данных и степень квалификации исполнителя. Среди многочисленных программных пакетов наибольшее распространение получили ENVI, ERDAS Imagine, PCI Geomatica. Перечисленные программные пакеты обеспечивают полный комплекс обработки, являются лицензионными и дорогостоящими. Между тем существуют бесплатные программы, такие как MultiSpec и ILWIS, с помощью которых можно выполнить основные операции, необходимые для картографирования и мониторинга природный изменений.

В основе большинства методов машинной классификации объектов лежат формализованные дешифровочные признаки. При обработке многозональных снимков используются признаки спектральной яркости, и решается задача определения количественных связей между спектральной яркостью и характеристикой объекта. Задача классификации заключается в разбиении некоторой группы объектов на классы на основе определенных требований [2]. К одному классу при этом относятся объекты, обладающие одинаковой спектральной яркостью. Для решения

Общая биология

этой задачи используются различные алгоритмы теории распознавания образов, математической статистики, кластерный анализ.

Одной из актуальных задач стадии тематической обработки изображений, которая часто возникает на практике, становится выбор метода их классификации. Различают два вида классификации: с обучением (контролируемая классификация) и без обучения (неконтролируемая). Выбор того или иного вида классификации обусловлен поставленными задачами в исследовании. Наибольший интерес представляют методы контролируемой классификации, которые учитывают априорную информацию о типах объектов и вероятности их представления данными изображения, эталонных значениях спектральных характеристик этих объектов.

Алгоритмы контролируемой классификации основываются на методах, среди которых основными являются [3]:

- метод параллелепипедов;

- метод классификации по минимальному расстоянию;

- метод дистанции Махаланобиса;

- метод классификации по правилу максимального правдоподобия.

Метод параллелепипедов реализует наиболее простой алгоритм, основанный на статистическом подходе. В методе используются сведения о классах, полученные в процессе обучения в виде векторов средних значений яркости и векторов дисперсии. Этот метод применяется, когда значения спектральной яркости разных объектов практически не перекрываются, а классов объектов немного.

Метод минимального расстояния (называемый также методом спектрального расстояния) подсчитывает спектральное расстояние между вектором значений пикселя-кандидата и вектором средних значений каждой обучающей выборки. Метод используется, когда спектральные признаки разных классов похожи, и диапазоны значений их яркости перекрываются.

Метод расстояний Махаланобиса сходен с методом минимального расстояния и отличается лишь тем, что в процессе классификации измеряется не эвклидово, а расстояние Маха-ланобиса. Это позволяет учесть распределение (дисперсию) значений яркости пикселей в эталонных участках.

В методе максимального правдоподобия пиксель приписывается к тому классу, который максимизирует функцию правдоподобия классификации. Количество и параметры классов задаются пользователем путем указания обучающих выборок. Данный метод имеет высокую точность, учитывает дисперсию значений признаков классов (как в методе расстояния Махаланобиса) и не оставляет неклассифицированных пикселей (как в методе минимального расстояния).

Для решения задачи классификации гиперспектральных изображений с целью идентификации участков почвы, загрязненных нефтью/ нефтепродуктами, были применены все перечисленные методы. В работе объектом исследования выступил гиперспектральный снимок, полученный в ходе лётных испытаний самолета-лаборатории, с пространственным разрешением 2 м. На снимке отображена территория предприятия, на которой располагаются восемь нефтешламона-копителей, образованных в ходе эксплуатации установки комплексной подготовки нефти и при ликвидации аварийных разливов нефти. Группа накопителей включает накопители действующие и закрытые на рекультивацию.

В ходе обработки изображения было замечено, что в видимой части спектра электромагнитного излучения трудно отличить тёмные участки почвы, загрязненные нефтью и нефтепродуктами, от теней, отбрасываемых зданиями и растительностью, а также других слабоотражаю-щих объектов. В ближней инфракрасной области наблюдается разделение спектральных кривых отражения теней и нефти/нефтепродуктов, что позволяет применять алгоритмы классификаций для идентификации нефтезагрязненных участков земли по данным дистанционного зондирования.

Рассматриваемые методы позволили идентифицировать некоторые нефтешламонакопители, однако полученные результаты классификаций изображения нельзя считать удовлетворительными по причине низкого процента правильно идентифицированных объектов (менее 70% верно идентифицированных пикселей снимка) [4]. В этой связи возник вопрос создания узкоспециализированного алгоритма классификации.

Предлагаемая методология анализа гиперспектральных изображений включают в себя следующие шаги. Сначала определяется необходимый набор изображений поверхности Земли (гиперспектральных снимков). Затем экспертом производится маркировка изображений, при этом на каждом снимке выделяются земельные участки, которые загрязнены нефтью/нефтепродуктами с высокой степенью уверенности (например, в результате полевых исследований). Кроме того, выделяются участки, которые не загрязнены, но которые трудно отличить от нефтяного загрязнения. В такие области, как правило, входят тени инфраструктурных зданий, малых водоемов, тени облаков, и другие.

Для отмеченной сформированной выборки решается проблема двухклассной классификации спектров, при этом спектры, соответствующие нефтяному загрязнению, являются объектами класса интереса, а все остальные спектры, которые присутствуют в изображении, являются объектами других классов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Алгоритм классификации включает в себя два этапа. На первом этапе выполняется процедура

кластеризации размеченных областей интереса. Для этого выполняется процедура оценки смеси распределений, а также подсчитываются расстояния Махаланобиса между всеми центрами кластеров [5]. На втором этапе выполняется процедура классификации объектов, признаковым описанием которых является набор расстояний Махаланобиса до вычисленных центров кластеров. В качестве процедуры классификации в данной работе рассматривается алгоритм построения решающего дерева [6]. Выбор этого простого и универсального метода классификации основан на предположении, что объекты разных классов являются хорошо разделимыми в построенном признаковом пространстве расстояний.

Метод является интерпретируемым в контексте моделируемого явления: областями интереса считаются те точки изображения, форма спектров которых схожа с формой спектров центров кластеров. Кроме того, вычислительная сложность процедуры обучения является линейной по количеству объектов, что является необходимым требованием при обработке изображения большого размера, количество точек которого достигает 107.

Алгоритм позволил получить высокое качество классификации гиперспектрального изображения (92% верно идентифицированных пикселей). Такой процент идентификации может быть связан с неявным загрязнением почвы, которую можно считать условно чистой. На снимках, сделанных в разное время и при разных условиях (состав атмосферы, угол солнца), были определены нефтезагрязнения, различающиеся по своему химическому составу и агрегатному состоянию (водонефтяные эмульсии, застарелые

нефтешламы, битумы) [7]. Алгоритм позволил отделить нефтезагрязненные участки почвы от других слабоотражающих объектов. Подтверждением работы алгоритма служит также идентифицируемый нефтезагрязненный участок, о существовании которого изначально не было никакой информации. При сопоставлении классифицированного снимка с картой было установлено, что это участок нефтеналивной станции, где вероятность загрязнения почвы достаточно высока.

СПИСОК ЛИТЕРАТУРЫ

1. Кашкин В.Б., Сухнин А.И. Дистанционное зондирование Земли из космоса. Цифровая обработка изображений: Учебное пособие. М.: Логос, 2001. 264 с.

2. Чандра А.М., Гош С.К. Дистанционное зондирование и географические информационные системы. М.: Техносфера, 2008. 312 с.

3. Шовенгердт Р.А. Дистанционное зондирование. Модели и методы обработки изображений. М.: Техносфера, 2010. 560 с.

4. Токарева О. С. Обработка и интерпретация данных дистанционного зондирования Земли: учебное пособие. Томск: Изд-во Томского политехнического университета, 2010. 148 с.

5. Mahalanobis P. On the generalized distance in statistics // Proceedings of the National Institute of Science 12 (1936): 49-55.

6. Ross Ouinlan J. Induction of decision trees // Machine learning, 1(1):81-106, 1986.

7. Получение опорных спектральных сигнатур при гиперспектральной съемке/ А.О.Гурьянова, Е.В. Раменская, А.Г. Мандра, В.В. Ермаков // Экология и промышленность России. 2014. №10. С.44-48.

METHODS OF CLASSIFICATION OF HYPERSPECTRAL IMAGES WHEN ENVIRONMENTAL MONITORING

© 2016 E.V. Ramenskaya1, V.V. Ermakov1, M.P. Kuznetsov2

1 Samara State Technical University 2 Moscow Institute of Physics and Technology

The article deals with the classification of hyperspectral imaging techniques to identify sites contaminated by oil/oil products. The need for the creation of highly specialized image classification algorithm detected. It will take into account the disadvantages of other methods. The algorithm was developed. It allows to obtain a classification of high-quality.

Keywords: hyperspectral image classification techniques, aerial photograph interpretation, environmental monitoring.

Ekaterina Ramenskaya, Post-Graduate Student. E-mail: iljushinakatja@rambler.ru

Vasiliy Ermakov, Candidate of Technical Sciences, Senior Lecturer. E-mail: wassiliy@rambler.ru Mikhail Kuznetsov, Post-Graduate Student. E-mail: mikhail.kuznecov@phystech.edu