Научная статья на тему 'Детектирование пиков наномасштабных изображений в шумах'

Детектирование пиков наномасштабных изображений в шумах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
66
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАНОМАСШТАБНЫЕ ИЗОБРАЖЕНИЯ / NANOSCALE IMAGES / ОБРАБОТКА ИЗОБРАЖЕНИЙ / IMAGE PROCESSING / ДЕТЕКТИРОВАНИЕ ПИКОВ / DETECTION OF PEAKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Новиков Лев Васильевич

Предлагается новый помехоустойчивый алгоритм оценки положения и интенсивности пиков нанообъектов. Метод основан на обработке изображения по столбцам и строкам с использованием алгоритма поиска экстремумов по трем точкам в скользящем окне данных. Метод позволяет оценить положение и интенсивность пиков при отношении сигнал/шум до трех с вероятностью обнаружения до единицы, нулевой вероятностью пропуска пика и ложной тревоги.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DETECTION OF PEAKS NANOSCALE IMAGES IN NOISES

A new noise-immune algorithm for estimating the position and intensity of the peaks of nanoobjects is proposed. The method is based on image processing by columns and rows using the algorithm of three-point extremes search in a sliding data window. The method allows to estimate the position and intensity of peaks with a signal-to-noise ratio up to three with probability of detection up to unity, zero probability of peak miss and false alarm.

Текст научной работы на тему «Детектирование пиков наномасштабных изображений в шумах»

ISSN 0868-5886

НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2018, том 28, № 3, c. 124-129

=МАТЕМАТИЧЕСКИЕ МЕТОДЫ - -:

И МОДЕЛИРОВАНИЕ В ПРИБОРОСТРОЕНИИ

УДК 519.688; 543.087.9 © Л. В. Новиков

ДЕТЕКТИРОВАНИЕ ПИКОВ НАНОМАСШТАБНЫХ ИЗОБРАЖЕНИЙ В ШУМАХ

Предлагается новый помехоустойчивый алгоритм оценки положения и интенсивности пиков нанообъектов. Метод основан на обработке изображения по столбцам и строкам с использованием алгоритма поиска экстремумов по трем точкам в скользящем окне данных. Метод позволяет оценить положение и интенсивность пиков при отношении сигнал/шум до трех с вероятностью обнаружения до единицы, нулевой вероятностью пропуска пика и ложной тревоги.

Кл. сл.: наномасштабные изображения, обработка изображений, детектирование пиков

ВВЕДЕНИЕ

В последнее время значительно расширился круг задач, решаемых с помощью анализа изображений самых различных объектов в области криминалистики, биологии, медицины, микроэлектроники, фармацевтики, аналитической химии и в других приложениях. В работе [1] предложены новые подходы анализа химического состава поверхности гетерогенных образцов, названные "химическая визуализация" (chemical imaging). В основе лежит анализ корреляции между, как минимум, двумя изображениями, полученными различными методами, например время-пролетной вторичной ионной масс-спектрометрией (ToF-SIMS) и сканирующей электронной микроскопией (SEM), рентгеновской фотоэлектронной спектроскопией и атомной силовой микроскопией (AFM) и т. п. с последующей обработкой многомерных данных [2-4].

Концепция многосенсорного гиперспектрального образа анализируемого объекта объединяет неразрушающие методы анализа на основе рама-новской (RMS), энергодисперсионной рентгеновской (EDX) и электронно-колебательной спектроскопии, а также SEM и ToF-SIMS. Полученные изображения обрабатываются методами многомерной статистики для получения обобщенных спектральных признаков с использованием методов главных компонент (PCA) и кластерного анализа. Эта концепция находит применение в области науки о жизни, материаловедения и геофизики, классификации клеток и аэрозолей в пробах окружающей среды [1].

Одной из задач, решаемых в теории обработки изображений, является получение данных о морфологии поверхности, например морфологии на-

ноструктур, используемых в различных приложениях от распознавания отпечатков пальцев и диагностики печатных плат [5] до оценки шероховатости поверхности [6-8], определения размеров на-ночастиц [9] и качества биосимуляров в фармацевтической промышленности [10].

Достоверность принимаемых решений по оценке морфологических параметров, в частности наноструктур, зависит от точности оценок этих параметров в условиях сильных шумов и других помех. Настоящая работа посвящена оценке интенсивности и положения пиков изображений, характерных для комплексных исследований с использованием атомной силовой, туннельной или растровой электронной микроскопии.

Традиционный подход в анализе структуры поверхности при наличии шумов основан на предварительной фильтрации шума с использованием тех или иных хорошо известных алгоритмов. Однако эта операция неизбежно ведет к искажению характера поверхности — нарушению формы пиков, уменьшению их интенсивности и иногда положения максимумов. В предлагаемом алгоритме не требуется предварительная фильтрация. Он основан на методе поиска начала, максимума и конца пиков по производной в трех точках скользящего окна данных, предложенного в работе [11]. Поиск максимумов изображения нанообъектов выполняется в два этапа. На первом — путем обнаружения экстремумов по строкам и столбцам матрицы данных формируются кластеры точек в зоне вершины пика. Затем, используя иерархический кластерный анализ, локализуются эти кластеры и определяются их центры, величина и расположение которых принимаются за параметры пиков в изображении.

ДЕТЕКТИРОВАНИЕ ПИКОВ...

125

ОПИСАНИЕ АЛГОРИТМА

Изображение, содержащее множество пиков, может быть представлено в виде матрицы Ъ, элементы которой ¿(1,3) определяются формулой

L

z(^ 3) = X 4/ ((г - Ь ), (3 - 3)) + р(и 3),

1=1

где Л1 — интенсивность; / — функция формы; г, ]1 — положение 1-го пика; Ь — число пиков; р(Ь,3) — аддитивный шум; г' = 1...1, 3 = 1... J.

В простейшем случае в качестве модели функции / может быть выбран двумерный гаусс

/ (.) = Л, ехр {-4 },

где г,2 = (г' - г'1 )2 + (3 - 31 )2, ^ — среднеквадрати-ческая ширина пика.

В настоящей работе для проверки алгоритма используется более сложная модель пика, представляющая собой гауссов пик с эллипсоидальной формой сечения горизонтальной плоскостью. Тогда

Г2 =(( г - г, )2 +( 3 - 3 )2)/Л -

2

-ртг ((г - г )С08^ - (3 - 3 )81па/) VЛ.

р 1

Здесь 2^ — фокальное расстояние и 2р — большая полуось эллипса, Р > , С^ — угол наклона оси эллипса в плоскости (г, 3),

л, =7 рр - .

Каждый 3-й столбец матрицы Ъ образует 1-мерный вектор-столбец Z ■ = [(г)| с элементами (г).

Каждая г-я строка матрицы Ъ образует /мерный вектор-строку Z¡ = [ ( 3)] с элементами

¿г (3) . г г

Алгоритм обнаружения положения (г,, 3) и амплитуды Л1 пиков изображения производится последовательной обработкой по столбцам и строкам матрицы Ъ с последующим анализом полученных данных с целью уточнения искомых параметров.

При обработке по столбцам Zj производится поиск перегибов (хребтов) в каждом столбце 3 матрицы Ъ. Для этой цели используется подход, подробно изложенный в работе [11] для одномерного случая. Суть предлагаемого алгоритма состоит в следующем.

Сформируем текущую выборку у из К +1 отсчетов с центром в точке г вектора Z3

[У (к)] = ((г - К2) (г)(г + К2)) :

У =

где к = 1. К и К выбирается всегда четным числом из условия 0.5-0.7 от ширины пика на половине высоты в отсчетах. При этом во избежание скачков на границах Z. полагаем, что если

(г - К/2)< 0, то у (г - К/2) = Z3 (1) и,

(г + к/2) > 1, то у (г + к/2) = z (1).

если

о

0

1

со ^

0

1 ф

н

I

1.2 1

0.8 0.6 0.4 0.2 0

-0.2 415

¡0

¡1 / *

* *

Ь ________

" 'тах

*

" "Ш1П * - —----- * -------------

*

420 425

Номер отсчета, i

430

435

Рис. 1. Фрагмент столбца матрицы изображений с окном данных из девяти отсчетов (К = 8) и аппроксимирующая парабола (сплошная линия) с точками ¡1, ¡0, ¡2; ¡Ьт1п, ¡Ьтах — минимальный и максимальный пороги обнаружения

126

Л. В. НОВИКОВ

Аппроксимируем отсчеты в окне у полиномом второй степени (параболой) у на сетке k = (- К/ 2,...,0,..., К/ 2):

У ( k ) = РЛ2 + Р2k + Рэ> где р1, р2, рэ — коэффициенты полинома.

К К"

Выберем в интервале

2 2

три точки t1, t0, t2

" K' , t> = 0, t2 = " K' " K'

ч = - — — , где —

4 4 4

целое число, большее или равное К.

На рис. 1 показан фрагмент столбца с окном данных из девяти отсчетов (К = 8) и аппроксимирующая парабола с точками t2.

Величина первой производной параболы в точке ^ будет равна

и в точке t2:

d1 = 2 Plt1 + Р2

d2 = 2 p1t2 + p2.

(1)

(2)

Величина второй производной параболы равна 2 Р1 .

Величина параболы в точке k = 0 равна средневзвешенному значению в скользящей выборке исходных данных в точке 1:

Zj (/■ ) = .У (0) = Рз.

(3)

Используя формулы (1)—(Э) рассмотрим алгоритм обнаружения хребтов в каждом столбце матрицы 2. В начале обработки исходных данных устанавливаются признаки обнаружения начала и вершины хребта:

[0, начало хребта необнаружено; PS = ! (4)

[1, началообнаружено.

[0, вершина хребта необнаружена; PSS —! (5)

[1, вершина обнаружена.

Условие начала хребта имеет вид:

Р8 = 0; йх > 0; ^ > ^ ръ > йтт, (6)

где — порог нижнего уровня, выбираемого по стандартному отклонению шума и: =(1 -2)и .

После обнаружения начала хребта устанавливаются признаки PS = 1 и PSS = 0 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Обозначим номера строк, в которых обнаружены начала хребтов, как Iminmax .

Условие вершины хребта имеет вид:

PS = 1; di > 0; d2 < 0; p < 0; max (у) > ^, (7)

где thmax — порог максимального уровня, выбираемый из условия thmax = (4 ^ б)ст . После обнаружения вершины хребта устанавливаются признаки PS = 0 и PSS = 1. Обозначим номера строк, в которых обнаружены максимумы хребтов, как 1max .

Сформируем новую матрицу Zm данных, состоящую из столбцов матрицы Z и строк с номерами 1max , т. е. Zm = 1 : J).

Выполним анализ матрицы Zm по строкам Imax с использованием алгоритмов (4)-(7) с целью обнаружения номеров столбцов Jmax, в которых обнаружены максимумы.

В результате приведенного анализа матрицы данных Z получаем координаты пиков в виде

таблицы [ 1max Jmax ] .

Амплитуда A (1max, Jmax ) обнаруженных пиков оценивается по точке максимума параболы при условии PSS = 1. Если форма пиков несимметричная, то в окрестности их вершины даже при отсутствии шума обнаруживается несколько максимумов, образующих кластер. За оценку положения такого пика принимается среднее взвешенное значение по каждой координате, а за интенсивность — максимальное значение интенсивности пиков, входящих в кластер. Признаком принадлежности кластеру принимается расстояние между точками, которое должно быть меньше минимального расстояния между пиками анализируемой поверхности, задаваемого по априорным данным. За оценку положения кластера принимается среднее взвешенное значение по каждой координате, а за интенсивность — максимальное значение интенсивности пиков, входящих в кластер.

МОДЕЛИРОВАНИЕ

Проверка эффективности алгоритма производилась по модельному спектру, состоящему из 81 пика гауссовой формы с эллипсоидальной формой сечения и добавлением белого шума (рис. 2, а). На рис. 2, б, показаны кластеры пиков изображения и их вершины, полученные на основе предлагаемого

ДЕТЕКТИРОВАНИЕ ПИКОВ.

127

У 500 400 300 200 100

100 200 300 400 500

X

У

400 300 200 100

/ > 5 \ 3

.....•». ■А- ........-

* * ч ¥ * ч

4 * / ч % г 1 ч

........А." ■г ■■■*■■ ч / / ч Г %..........

/ / / ч ч ч \

......V- / / / ■/ $ ..........

ч * / ч # *!

......./ ■■"Ч •••• Л Л ■V * "V..........

/ ч Л; ч/ ч ч

0

100

200

300

400

500

X

Рис. 2. Изображение из 81 модельных пиков.

а — в шумах при отношении сигнал/шум, равном трем; б — кластеры пиков изображения с отметкой обнаруженных вершин пиков (О)

Абсолютные (для положения пиков по осям X и У) и относительные среднеквадратические ошибки (СКО) оценки параметров пиков при различных отношениях сигнал / шум (с/ш) для метода поиска экстремумов, изложенного в [12, 13], — 1 и предлагаемого метода — 2.

Параметр Отношение с/ш

3.0 10 20 100

Метод поиска экстремумов

1 2 1 2 1 2 1 2

Положение пика (в отсчетах): X У 0 1 0 1 0 1 0 0 0 0.8 0 0 0 0 0 0

Положение пика (СКО): X У 1.65 1.51 0.85 1.13 1.44 1.38 0.97 0.87 1.40 1.33 0.9 0.68 1.40 1.30 0.90 0.60

Амплитуда 0.15 0.075 0.12 0.029 0.120 0.021 0.120 0.020

Вероятность правильного обнаружения 0.907 0.931 0.976 0.999 0.970 1 0.986 1

Вероятность ложного обнаружения 0.727 0.034 0.028 0.002 0.020 0 0.013 0

128

Л. В. НОВИКОВ

алгоритма. Результаты сравнивались с программой определения экстремумов в изображении — extrema2.m, используемой в разложении по эмпирическим модам (BEMD) [12, 13], с предварительной фильтрацией шума на основе мультивейвле-тов [14]. Относительная погрешность оценки координат и амплитуды пиков производилась по десяти реализациям шума. Погрешность положения пика определялась по его отклонению от истинного значения. Максимальные значения погрешностей для обоих методов обработки сведены в таблицу.

Кроме того, вычислялась вероятность правильного обнаружения как отношение числа обнаруженных пиков по всем десяти реализациям, положение которых отличается от заданных в модели не более, чем на четыре отсчета, к общему числу модельных пиков. Вероятность ложного обнаружения вычислялась как отношение числа обнаруженных пиков по всем десяти реализациям, не заданных в модели, к общему числу модельных пиков. Сравнение данных в столбцах методов 1 и 2 таблицы показывает явное преимущество предлагаемого алгоритма как по уровню погрешности оценки параметров пиков, так и по величине вероятности ложного обнаружения.

ЗАКЛЮЧЕНИЕ

Алгоритм детектирования предложенным методом позволяет повысить достоверность обнаружения пиков благодаря низкому уровню ошибки оценок и вероятности ложного обнаружения при малых отношениях сигнал/шум. Это позволяет значительно понизить порог чувствительности приборов и расширить диапазон оцениваемых параметров.

Работа поддержана государственным заданием № 007-00229-18-00.

СПИСОК ЛИТЕРАТУРЫ

1. Ofner J., Brenner F., Wieland K. et al. Image-based chemical structure determination // Scientific reports. 2017. Doi: 10.1038/s41598-017-07041 -x.

2. Ofner J., Kamilli K.A., Eitenberger E. et al. Chemometric analysis of multisensor hyperspectral images of precipitated atmospheric particulate matter // Anal. Chem. 2015. Vol. 87, no. 18. P. 9413-9420.

Doi: 10.1021/acs.analchem.5b02272.

3. Gowen A.A., Dorrepaal R.M.. Multivariate chemical image fusion of vibrational spectroscopic imaging modalities // Molecules. 2016. Vol. 21, no. 7.

Doi: 10.3390/molecules21070870.

4. Sobol O., Holzlechner G., Holzweber M. et al. First use of data fusion and multivariate analysis of ToF-SIMS and SEM image data for studying deuterium-assisted degradation processes in duplex steels // Surf. Interface Anal.

2016. Wiley Online Library. Doi: 10.1002/sia.6015.

5. Kaur B., Kaur S.P. Applications of mathematical morphology in image processing: a review // International Journal of Electronics & Communication Technology. 2013. Vol.4, no. 3. P. 15-17.

6. Толстихина А.Л. Атомно-силовая микроскопия кристаллов и пленок со сложной морфологией поверхности. Дис. ... д-ра физ.-мат. наук. М.: ФГБУН Институт кристаллографии им. А.В. Шубникова РАН, 2013. 332 с.

7. Орлов А.А., Антонов Л.В. Алгоритмы обработки снимков промышленных изделий // Современные проблемы науки и образования. 2012. № 6. URL: http://science-education.ru/ru/article/view?id=7844.

8. Сойфер В.А., Куприянов А.В. Анализ и распознавание наномасштабных изображений: традиционные подходы и новые постановки задач // Компьютерная оптика. 2011. Т. 35, № 2. С. 136-144.

9. Чукланов А.П., Бородин П.А., Зиганшина С.А., Бухара-ев А.А. Алгоритм для анализа АСМ-изображений поверхностей со сложной морфологией // Ученые записки Казанского государственного университета. 2008. Т. 150, № 2. С. 220-227.

10. Reichelt W.N., Kaineder A., Brillmann M. et al. High throughput inclusion body sizing: Nano particle tracking analysis // Biotechnol. J. 2017. Vol. 12, № 6. Doi: 10.1002/biot.201600471.

11. Новиков Л.В., Куркина В.В. Метод оценки параметров спектральных пиков // Научное приборостроение.

2017. Т. 27, № 3. С. 99-106.

URL: http://213.170.69.26/mag/2017/abst3.php#abst12.

12. Dong W., Li X., Lin X. and Li Z. A bidimensional empirical mode decomposition method for fusion of multispec-tral and panchromatic remote sensing images // Remote Sens. 2014. Vol. 6, no. 9. P. 8446-8467. Doi: 10.3390/rs6098446.

13. MathWorks. URL: http://www.mathworks.com/matlabcentral/fileexchange.

14. Rahman M.A., Khan A.S. A spatial spectral filtration (SSF) based correlated coefficients thresholding approach for image denoising // International Journal of Computer Science and Information Technologies. 2016. Vol. 7, № 3. P. 1097-1101.

Институт аналитического приборостроения РАН, г. Санкт-Петербург

Контакты: Новиков Лев Васильевич, [email protected]

Материал поступил в редакцию 7.05.2018

ISSN 0868-5886

NAUCHNOE PRIBOROSTROENIE, 2018, Vol. 28, No. 3, pp. 124-129

DETECTION OF PEAKS NANOSCALE IMAGES IN NOISES

L. V. Novikov

Institute for Analytical Instrumentation of RAS, Saint-Petersburg, Russia

A new noise-immune algorithm for estimating the position and intensity of the peaks of nanoobjects is proposed. The method is based on image processing by columns and rows using the algorithm of three-point extremes search in a sliding data window. The method allows to estimate the position and intensity of peaks with a signal-to-noise ratio up to three with probability of detection up to unity, zero probability of peak miss and false alarm.

Keywords: nanoscale images, image processing, detection of peaks

REFERENСES

1. Ofner J., Brenner F., Wieland K. et al. Image-based chemical structure determination. Scientific reports, 2017. Doi: 10.1038/s41598-017-07041-x.

2. Ofner J., Kamilli K.A., Eitenberger E. et al. Chemometric analysis of multisensor hyperspectral images of precipitated atmospheric particulate matter. Anal. Chem., 2015, vol. 87, no. 18, pp. 9413-9420.

Doi: 10.1021/acs.analchem.5b02272.

3. Gowen A.A., Dorrepaal R.M. Multivariate chemical image fusion of vibrational spectroscopic imaging modalities. Molecules, 2016, vol. 21, no. 7.

Doi: 10.3390/molecules21070870.

4. Sobol O., Holzlechner G., Holzweber M. et al. First use of data fusion and multivariate analysis of ToF-SIMS and SEM image data for studying deuterium-assisted degradation processes in duplex steels. Surf. Interface Anal., 2016, Wiley Online Library. Doi: 10.1002/sia.6015.

5. Kaur B., Kaur S.P. Applications of mathematical morphology in image processing: a review. International Journal of Electronics & Communication Technology, 2013, vol.4, no. 3, pp. 15-17.

6. Tolstihina A.L. Atomno-silovaya mikroskopiya kristallov i plenok so slozhnoj morfologiejpoverhnosti. Diss. ... d-ra fiz.-mat. nauk [Atomic and power microscopy of crystals and films with difficult morphology of a surface. Drs. phys.-mat. sci. diss.]. Moscow, FGBUN Institute of a crystallography A.V. Shubnikova of RAS, 2013. 332 p. (In Russ.).

7. Orlov A.A., Antonov L.V. [Image processing algorithms of the industrial products]. Sovremennye problemy nauki i obrazovaniya [Modern problems of science and education], 2012, no. 6. (In Russ.). URL: http://science-education.ru/ru/article/view?id=7844.

Contacts: Novikov Lev Vasil'evich, [email protected]

8. Soifer V.A., Kupriyanov A.V. [Analysis and recognition of the nanoscale images: conventional approach and novel problem statement]. Komp'yuternaya optika [Computer Optics], 2011, vol. 35, no. 2, pp. 136-144. URL: http://www.computeroptics.smr.ru/KO/PDF/KO35-2/01.pdf. (In Russ.).

9. Chuklanov A.P., Borodin P.A., Ziganshina S.A., Buha-raev A.A. [Algorithm for the analysis of ASM-images of surfaces with difficult morphology]. Uchenye Zapiski Kazanskogo Universiteta [Scientific notes of the Kazan state university], 2008, vol. 150, no. 2, pp. 220-227. (In Russ.).

10. Reichelt W.N., Kaineder A., Brillmann M. et al. High throughput inclusion body sizing: Nano particle tracking analysis. Biotechnol. J., 2017, vol. 12, № 6. Doi: 10.1002/biot.201600471.

11. Novikov L.V., Kurkina V.V. [The method for estimation of spectral peak parameters]. Nauchnoe Priborostroenie [Scientific Instrumentation], 2017, vol. 27, no. 3, pp. 99-106. Doi: 10.18358/np-27-3-i99106. (In Russ.).

12. Dong W., Li X., Lin X. and Li Z. A bidimensional empirical mode decomposition method for fusion of multispec-tral and panchromatic remote sensing images. Remote Sens, 2014. vol. 6, no. 9, pp. 8446-8467. Doi: 10.3390/rs6098446.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

13. MathWorks. URL: http://www.mathworks.com/matlabcentral/fileexchange.

14. Rahman M.A., Khan A.S. A spatial spectral filtration (SSF) based correlated coefficients thresholding approach for image denoising. International Journal of Computer Science and Information Technologies, 2016. vol. 7, no. 3, pp. 1097-1101.

Article received in edition 7.05.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.