УДК 528.8
КЛАССИФИКАТОР НЕФТЯНОГО ЗАГРЯЗНЕНИЯ НА ВОДНОЙ
ПОВЕРХНОСТИ
Е.А. Чернецова1, А.Д. Шишкин2
Российский Государственный Гидрометеорологический Университет, 192007, Россия, Санкт-Петербург, Воронежская улица, дом 79
Рассматривается автоматизированный классификатор нефтяного пятна и ветрового слика на водной поверхности. Обосновывается выбор входных параметров классификатора. Приводится методика определения структуры нейронной сети- классификатора объектов в автоматизированной системе дистанционного мониторинга.
Ключевые слова: нефтяное загрязнение, тмный объект, алгоритм вычисления, протяженность, стандартное отклонение.
А CLASSIFIER OF OIL POLLUTION ON WATER SURFACE
Chernetsova E. A., Shishkin A. D.
Russian State Hydrometeorological University, 192007, Russia, St. Petersburg, Voronezh street, house 79
An automated classifier of the oil spill and wind slick on the water surface is considered. The choice of input parameters of the classifier is justified. A method for determining the structure of a neural network - a classifier of objects in an automated remote monitoring system is given.
Keywords: oil pollution, TM object, calculation algorithm, extent, standard deviation.
Контраст между нефтяным загрязнением и окружающим фоном зависит от высоты волн, количества пролитой нефти, скорости ветра и других факторов.
Обнаружение нефтяных загрязнений на изображении, полученном с помощью дистанционного зондирования водной поверхности, включает в себя решение трех задач:
- Обнаружения темного объекта
- Выделения основных характеристик темного объекта
- Классификации темного объекта как нефтяного загрязнения или природного слика.
После выделения области темного объекта на изображении, рассчитывается ряд его геометрических и физических характеристик. В таблице 1 приведен ряд различных характеристик темного объекта, предлагаемых в работах различных авторов.
Если пятно является следствием недавнего разлива нефти движущимся судном (например, танкер очищает свой танк), важным параметром загрязнения является растяжение, которое можно выразить как отношение длина/ширина. В работе [1] было показано, что параметры темного объекта, относящиеся к градиенту контраста интенсивности по направлению от фона к объекту обеспечивают наибольшую
достоверность информации, если используется классификация с помощью нейронных сетей. Стандартное отклонение фона учитывает эффект скорости ветра. Если интенсивность пикселей сравнивается с отраженным сигналом, информацию о пространственной корреляции соседних пикселей обеспечивает такой параметр, как текстура изображения. При этом в работах различных авторов особо выделяются параметры темного объекта, обладающие наибольшей эффективности в смысле различения классов ( см. таблицу 2).
Исходя из анализа указанных литературных источников для автоматизированной оценки были выбраны следующие параметры темного объекта изображения:
1. Размер области, на которой наблюдается объект (в км2) А
2. Периметр Р - длина (в км.) границ объекта
3. Сложность, определяемая как
с = ' . (1)
2 V ж А
Этот параметр обычно принимает малые численные значения для районов с простой геометрией и большие значения для сложных геометрических районов.
1 Чернецова Елена Анатольевна - кандидат технических наук, доцент, телефон +7-921-315-18-79, e-mail: chernetsova@list. ru;
2Шишкин Анатоли Дмитриевич - кандидат технических наук, доцент, телефон +7-921-405-16-86, e-mail: an. dm. shishkin@mail. ru
4. Протяженность 5". Этот параметр получен с помощью метода главных компонент [2] векторов, составляющими которых являются координаты пикселей, принадлежащих объекту. Если х и х 2 являются двумя собственными числами, связанными с вычисляемой матрицей Сложность
ковариации и х > х , значение протяженности
100Х„
£ =
(2)
Х 1 + Х 2
Поясним алгоритм вычисления протяженности 8 темного объекта. Для этого рассмотрим изображение пятна на поверхности в терминах координат пикселей (рисунок 1).
координата х
ко- 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9
ор- 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
ДИ- 3,1 3,2 3,4 3,5 3,6 3,7 3,8 3,9
на- 4.1 4,2 в 4,5 4,6 4,7 4,8 4,9
та 5.1 5,2 5,3 ш 5,5 5,6 5,7 5,8 5,9
6,1 6,2 6,3 6,4 В 6,6 6,7 6,8 6,9
V 7,1 7,2 7,3 7,4 7,5 ш 7,7 7,8 7,9
8.1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9
9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9
Рисунок 1 - Протяженное и тонкое пятно на поверхности в терминах координат пикселей
Таблица 1 - Характеристики темного объекта, предлагаемые для автоматизации процедуры обнаружения нефтяного загрязнения на морской поверхности в работах различных авторов (указан номер ссылки на статью)
Характеристика
3
4 5 6
Размер области, которую темный объект занимает на изображении
и т
тас
л б о е и
В
ьл о
РЧ
Периметр темного объекта
Отношение область/периметр
Ширина темного объекта
р
о
-е
е
К
7
Отношение длина/ширина темного объекта
Распространение
Стандартное отклонение для объекта
Стандартное отклонение для фона_
Контраст Градиент Стандартное отклонение градиента
Радиолокационный контраст темного объекта
■ I I
Радиолокационный контраст фона_
Интенсивность пикселей
Стандартное отклонение интенсивности пикселей
Интенсивность пикселей темного объекта (ИПТО)_
Стандартное отклонение интенсивности пикселей (СОИП)
Отношение ИПТО/СОИП
Среднее отклонение от окружения
Отношение мощность/средняя мощность_
Близость к обширным областям
Близость к суше
Близость к фрактальным объектам
Значение текстуры слоя, основанной на подгруппе объектов
Значение текстуры формы, основанная на подгруппе объектов Расстояние до точечного источника
Количество обнаруженных точечных объектов на изображении
Количество окружающих точеных объектов на изображении
Однородность
Энтропия
Энергия
Корреляция
Текстура
Номер Параметр
ссылки
9 Радиолокационный контраст фона
10 Отношение интенсивности пикселей объект/фон
11 Отношение ИПТО/СОИП
12 Энтропия контраста
13 Корреляция контраста
14 Радиолокационный контраст темного объекта
15 Средний контраст
16 Стандартное отклонение фона
17 Контраст
18 Разность контрастов фона и объекта
19 Отношение стандартных отклонений объект/фон
Координаты пикселей, принадлежащих пятну, представляют собой двумерный вектор а1:
а1 = [2 2; 2 3; 2 4;2 5; 3 2;3 3; 3 4;3 5;4 2;4 3;
4 4; 4 5; 4 6;4 7; 4 8;5 2; 5 3; 5 4;5 5;5 6;5 7;
5 8; 6 4; 6 5; 6 6;6 7; 6 8; 7 6; 7 7;7 8] Вычисляем ковариационную матрицу двумерного вектора а1: Ы = соу(а1^)
Вычисляем собственные числа ковариационной матрицы Ь1:
с1 = 1,3269 - это величина собственного числа х
4,8950 - это величина собственного числа х .
Таблица 2 - Лучшиепараметры для обеспечения надежности процесса
классификации темного объекта как нефтяного пятна или природного слика в работах различных авторов (указан номер ссылки на статью)
КОО] эдината х
ко- 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9
ор- 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
ди- ЗД 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9
на- 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9
та 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9
6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9
V 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9
8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9
9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9
Координаты пикселей, принадлежащих пятну представляют собой двумерный вектор а: а = [2 2; 3 3;4 3; 4 4;5 4; 5 5;6 5; 6 6; 7 6;7 7] Рассчитываем матрицу ковариации Ь вектора а: Ь = со^(а)
Рассчитываем вектор с собственных чисел матрицы ковариации Ь: с = ег^(Ь). Получаем следующие значения собственных чисел:
с = 0,1298 - это величина собственного числа
Х 2 .
5,1369 - это величина собственного числа х .
Рассчитываем протяженность по формуле (2): £=100*0.1298/(0.1298+5.1369)= 2.4645
На рисунке 2 изображен темный объект, который по форме больше стремится к окружности.
Рисунок 2 - Темный объект, по форме стремящийся к окружности в терминах пикселей
Рассчитываем протяженность второго темного объекта на плоскости:
51 = 100 * 1,3269/(1,3269 + 4,895) = 21,3263 Сравнивая 5 = 2,4645 и 51 = 21,3263 видим, что численное значение £ мало для протяженных и тонких объектов и велико для объектов, чья форма близка к окружности.
5. Стандартное отклонение для объекта - стандартное отклонение (в дБ) значений
интенсивности пикселей, принадлежащих темному объекту.
6. Стандартное отклонение для фона (В8ф - стандартное отклонение (в дБ) значений интенсивности пикселей, принадлежащих району, окружающему темный объект.
7. Максимальная контрастность (СопМах) отличие (в дБ) между средним значением интенсивности пикселей фона и самым малым значением интенсивности пикселей вне темного объекта.
8. Средняя контрастность (СопМе) - отличие (в дБ) между средним значением интенсивности пикселей фона и средним значением интенсивности пикселей темного объекта.
9. Максимальный градиент (ОМах). - максимальный граничный градиент (в дБ) «фон-объект».
10. Средний градиент (ОМе) - средний граничный градиент (в дБ) «фон-объект».
11. Стандартное отклонение градиента - стандартное отклонение в дБ значений
граничного градиента.
Полученные значения параметров объекта используются в качестве исходного вектора для автоматизированного классификатора объектов изображения [20].
После завершения сегментации изображения и вычисления физических и геометрических характеристик изображенных объектов должна быть решена задача классификации объектов. Алгоритмы классификации базируются в основном на байесовских или статистических решениях. Недостатком этих методов является сложность выработки классификационных правил из-за вовлеченности в этот процесс многих нелинейных и плохо изученных факторов. Эти сложности можно преодолеть при использовании алгоритмов нейронных сетей (НС). Нейронные сети, в отличие от статистических классификаторов, не требуют точно определенного отношения между входным и выходным векторами, т.к. формируют свои собственные отношения вход-выход из набора данных, используя построение границ решений [21].
Основным элементом для построения НС служит искусственный нейрон [22]. Он традиционно представляется линейной суммой с N входами (каждому из входов ставится в соответствие некоторый весовой коэффициент м>. ) и
одним выходом, соединенным с нелинейным элементом, реализующим активационную функцию нейрона Е(х) .
При выборе структуры нейронной сети для решения задачи классификации необходимо учитывать следующие аспекты:
1. Способность сети к обучению, т.е. возможность научить систему распознавать требуемое количество объектов. Чем больше в сети слоев и нейронов, тем выше ее способности и одновременно с этим потребности в аппаратных ресурсах.
2. Быстродействие, которое достигается уменьшением сложности сети, т.к. чем меньше нужно аппаратных ресурсов, тем быстрее осуществляется работа НС.
Удовлетворение этих взаимопротиворечивых требований требует решения задачи оптимизации структуры НС Для решения этой проблемы можно воспользоваться теоремой Хегт-Нильсена [23], которая доказывает представимость функции многих переменных общего вида с помощью двухслойной НС прямого распространения с ограниченными функциями активации сигмоидного вида:
Е (х) = 1/(1 + ехр( - х)) (3)
Сигмоидальные функции являются монотонно возрастающими и имеют отличные от нуля производные на всей области определения. Эти характеристики обеспечивают правильное функционирование и обучение сети. Двухслойная НС прямого распространения, имеющая N входов и К выходов, содержит скрытый слой, состоящий из М нейронов, и выходной, состоящий из К нейронов. Результатом работы НС является нелинейное преобразование ^мерного входного вектора Х в К-мерный выходной вектор У: У = Е ((Е (X * Ш )) * V ) (4) где Ш - матрица весовых коэффициентов внутреннего слоя НС размером [ ХхМ ] ; V -матрица весовых коэффициентов выходного слоя НС размером [ МхК ]; Е - активационная функция.
Выражение (4) представляет собой матричную форму записи системы из К нелинейных уравнений. Путем подбора значений переменных Ш и V можно добиться примерного равенства значения У одному из предварительно заданных значений У , поставленных в соответствие одному или нескольким входным векторам X . Этот процесс называется обучением сети. Итерации обучения НС повторяются до тех пор, пока для всех эталонных образов не будут достигнуты требуемые значения сигналов на выходах НС с ошибкой, меньшей некоторой заданной ошибки обучения 5 . Таким образом, вероятность правильной классификации зависит от заданного значения 5 и от числа нейронов в каждом слое НС.
Для уменьшения сложности сети в качестве входного массива данных предлагается вводить не значения интенсивности пикселей, как в [23], а предварительно полученные значения вычисленных на предыдущем этапе характеристик сегментов изображения.
Таким образом, в создаваемой нейронной сети имеется 11 входных параметров и нужно определить количество нейронов в скрытом слое. Для задачи извлечения информации из входов с целью обобщения или снижения размерности массива данных, необходимо использовать сужающуюся сеть [22]. Количество тренировочных примеров должно быть приблизительно равным количеству весов сети, умноженному на обратную величину ошибки. Например, для предельной ошибки е =0.1 необходимо использовать обучающий набор данных в 10 раз больший, чем количество весов. Эта зависимость описывается формулой:
п> ш/е, (5)
где п - объем обучающего набора данных; ю - количество весов в сети
Причиной того, что величина ошибки играет значительную роль, связана с соотношением между обобщающей способностью и точностью. Малая ошибка переобученной сети не может считаться успехом тренировки. Если нужно использовать большее количество весов чем то, которое может заполнить набор данных, то необходимо остановиться при большей ошибке обучения для того, чтобы сохранить обобщающую способность. Это вынуждает жертвовать точностью в пользу обобщающей способности сети.
Так как количество входных и выходных элементов в большинстве случаев определяется задачей, то можно определить выражение, описывающее количество весов в терминах количества скрытых единиц в полносвязной однонаправленной сети с одним скрытым слоем:
h = ш/io, (6)
где i - количество входных переменных сети; o - количество выходных переменных сети; h - количество нейронов в скрытом слое.
Таким образом, получаем, что в нейронной сети с одним скрытым слоем, одиннадцатью входными переменными и одним выходом, при условии, что количество нейронов в скрытом слое h < 10 количество весов должно быть не менее 110.
Литература
1. Богданович В.А. Применение принципа инвариантности в задачах обнаружения с априорной неопределенностью.- Изв. вузов СССР. Радиоэлетро-ника.-1973, т. 16, № 1.- С. 43-47
2. Шишкин А.Д. Инвариантное правило обнаружения целей для РЛС с высоким разрешением. - Радиотехника и электроника-1974,т. 19, № 7. - С. 1524-1526
3. Clark, M.M. Transport modeling for environmental engineers and scientists. J.Wiley & Sons, NY, USA, 1996, p. 559.
4. Leonard, B.P. "Third-order Upwinding as a Rational Basis for Computational Fluid Dynamics", in Proc. ofthe International Computational Techniques and Applica-tionsConference (CTAC-83), The University of Sydney, Australia, 1984, Elsevier Science Pub. Co., pp. 106-120.
5. Tkalich, P. and Chan, E.S. "The Third-order Polynomial Method for Two-dimensional Convection and Diffusion", Int. J. for Numerical Methods in Fluids,2003, V.41 (9), pp. 997-1019
6. Fingas M.F., Brown C.E. Review of Oil Spill Remote Sensing.- in Proceedings of the Fifth Int. Conf on Remote Sensing for Marine and Coastal Environments, Environmental Research Institute of Michigan, Ann Arbor, Michigan, 2000, pp.I-211-218
7. Lehr W.J. Oil Spill Monitoring using a field Microcomputer-GPS Receiver Combination.- in Proceedings of the Second Thematic Conference on Remote Sensing for Marine and Coastal Environments: Needs, Solutions
and Applications, ERIM Conferences, Ann Arbor, Michigan, 1994, pp.I-435-439
8. O'Neil R.A., Neville R.A., Thompson V. The Arctic Marine Oilspill Program (AMOP) Remote Sensing Study, Environment Canada Report EPS 4-EC-83-3, Ottawa, Ontario, 1983, 257 p.
9. A. H. S. Solberg, G. Storvik, R Solberg and E. Volden, Automatic Detection of Oil Spills in ERS SAR Images, IEEE Trans. Geosci. and Remote Sensing, vol. 37, pp. 1916-1924, 1999.
10. B. Fiscella, A. Giancaspro, F. Nirchio, P. Pavese, and P. Trivero, Oil spill detection using marine SAR images, Int. J.Remote Sensing, vol. 21, no. 18, pp.3561-3566, 2000.
11. K. Topouzelis, V. Karathanassi, P. Pavlakis and D. Rokos, Oil Spill Detection: SAR Multiscale Segmentation and Object Features Evalutation, Remote Sensing of the Ocean and Sea Ice, pp. 77-78, 2002.
12. M. Marghany, RADARSAT Automatic Algorithms for Detecting Coastal Oil Spill Pollution, JAG, vol. 3, pp. 191-196, 2001.
13. H. Espedal and T. Wahl, Satellite SAR Oil Spill Detection Using Wind History Information, International Journal ofRemote Sensing, 20, pp. 49-65, 1999.
14. M. Migliaccio M. Tranfaglia, Oil Spill Observation by SAR: A Review, Proc. US-Baltic International Sym-posium,Klaipeda (Latva), June 2004.
15. C. Brekke and A. H. S. Solberg, Oil Spill Detection by Satellite Remote Sensing, Remote Sens. Environ., no.95, pp.1-13, 2005.
16. C. Elachi, Introduction to the Physics and Techniques of Remote Sensing, New York (NY) USA, John Wiley & Sons,1987.
17. A. H. S. Solberg, S. T. Dokken and R. Solberg, Automatic Detection of Oil Spills in ENVISAT, RADARSAT and ERS SAR Images, Proc. IEEE Symp. Geosci. Remote Sensing (IGARSS'03), July 2003.
18. H. Assilzadeh, S. B. Mansor, Early Warning System for Oil Spill Using SAR Images, Proc. ACRS 2001 -22ndAsian Conference on Remote Sensing, Singapore, vol 1, pp. 460-465, 2001.
19. F. Del Frate, A. Petrocchi, J. Lichtenegger, and G. Calabresi, Neural Networks for Oil Spill Detection Using ERSSAR Data, IEEE Trans. Geosci. and Remote Sensing, vol. 38, pp. 2282-2287, 2000.
20. Е.А. Чернецова, А.Д.Шишкин Автоматизация процесса расчета параметров нефтяных пятен на радиолокационном изображении морской поверхности.- IX международная научно-практической конференции "Фундаментальные и прикладные проблемы приборостроения, информатики и экономики», 2-5 октября 2006 г.Сочи, Россия, - С.130-135
21. U.Anders, O.Korn Model selection in neural networks.- Neural Networks, vol.12, pp.309-323, 1999
22. Swingler К. Applying neural networks: A practical guide, Academic Press, London., 1996,- 300 р.
23. Hecht-Nielsen R. Theory of the Back Propagation Neural Network, Int. Joint Conf. on Neural Networks, Sheraton Washington Hotel, Washington D.C., June18-22, 1989, vol.1,pp.593-606