Научная статья на тему 'Цифровая обработка экспериментальных данных в рентгеноструктурном анализе наноструктур. Часть 1. Методы'

Цифровая обработка экспериментальных данных в рентгеноструктурном анализе наноструктур. Часть 1. Методы Текст научной статьи по специальности «Математика»

CC BY
347
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕНТГЕНОСТРУКТУРНЫЙ АНАЛИЗ / ЦИФРОВАЯ ФИЛЬТРАЦИЯ / РОБАСТНЫЕ МЕТОДЫ / ВЕЙВЛЕТ-АНАЛИЗ / X-RAY ANALYSIS / DIGITAL FILTERING / ROBUST METHODS / WAVELET ANALYSIS

Аннотация научной статьи по математике, автор научной работы — Алалыкин Александр Сергеевич, Алалыкин Сергей Сергеевич, Крылов Петр Николаевич

Проведен краткий обзор наиболее часто встречающихся методов обработки экспериментальных данных. Рассмотрены методы цифровой фильтрации, условия применимости построения аппроксимирующих функций, их совместное применение для анализа развернутых рентгенодифракционных спектров.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алалыкин Александр Сергеевич, Алалыкин Сергей Сергеевич, Крылов Петр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIGITAL PROCESSING OF EXPERIMENTAL DATA IN THE X-RAY ANALYSIS OF NANOSTRUCTURES. PART 1. METHODS

A brief overview of the most common methods of processing experimental data. The methods of digital filtering, the conditions of applicability of the construction of approximating functions, their joint application for the analysis of time-back X-ray diffraction spectra.

Текст научной работы на тему «Цифровая обработка экспериментальных данных в рентгеноструктурном анализе наноструктур. Часть 1. Методы»

УДК 539.26(075.8)

ЦИФРОВАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В РЕНТГЕНОСТРУКТУРНОМ АНАЛИЗЕ НАНОСТРУКТУР. Часть 1. Методы

АЛАЛЫКИН А.С., АЛАЛЫКИН С.С., КРЫЛОВ П.Н.

Удмуртский государственный университет, 426034, г. Ижевск, ул. Университетская, 1

АННОТАЦИЯ. Проведен краткий обзор наиболее часто встречающихся методов обработки экспериментальных данных. Рассмотрены методы цифровой фильтрации, условия применимости построения аппроксимирующих функций, их совместное применение для анализа развернутых рентгенодифракционных спектров.

КЛЮЧЕВЫЕ СЛОВА: рештеноструктурный анализ, цифровая фильтрация, робастные методы, вейвлет-анализ.

ВВЕДЕНИЕ

В настоящее время интенсивно развиваются исследования различных наноструктурированных систем (ультрадисперсных порошков, нанокомпозитных материалов, многослойных гетероструктур и т.д.). Интерес к ним обусловлен возможностью значительной модификации и даже принципиального изменения свойств известных материалов при переходе в нанокристаллическое состояние, новыми возможностями, которые открывают нанотехнолотии в создании материалов и изделий из структурных элементов нанометрового размера [1, 2].

Исследование таких систем накладывает высокие требования, как к разрешающей способности измерительного оборудования, так и к последующей обработке экспериментальных данных: максимальной скорости вычислений при предельно достижимой их точности и высокой эффективности методов оценки физических параметров, интересующих экспериментаторов. При этом появление высокого уровня и коррелированности шумовых отсчетов значительно ухудшает анализ экспериментальных данных [3].

Традиционно математическая обработка экспериментальных данных в рентгеноструктурном анализе включает статистическую обработку по многократно полученным отсчетам и цифровую обработку, в которой наиболее часто применяется цифровая фильтрация методом скользящего среднего [4] и построение тренда кривой методом наименьших квадратов (МНК) [5, 6]. Проведем критический анализ наиболее часто встречающихся методов обработки экспериментальных данных.

ЦИФРОВАЯ ФИЛЬТРАЦИЯ

Цифровая фильтрация является простейшим способом удаления шума из экспериментальных данных. В качестве примера можно привести метод частотной декомпозиции, при котором выбирается, например, только ряд из точек с «нечетными» номерами, а остальные отбрасываются. Такой способ «прореживания» позволяет «отбросить» высокочастотную составляющую спектра, которая, как правило, содержит только информацию о шуме. Еще одним наиболее распространенным методом цифровой фильтрации является метод «скользящего среднего» [7]. Удаление шумов в этом методе осуществляется путем проведения кривой, наиболее близко расположенной ко всем полученным в эксперименте точкам. В данном случае рассчитывается точка из некоторого окна от -N+1 до ¡+Ы точек по формуле, например,

1 N

4 = ^ £. (1)

k=-N

Полученное в результате такой процедуры сглаженное значение для средней точки ряда является наилучшим для выбранной группы точек и выбранной аппроксимирующей функции. Сместив окно на одну точку, можно найти сглаженное значение для следующей точки и т.д. В простейшем случае используется линейное приближение. Тогда средняя точка ряда вычисляется как среднее арифметическое ординат всех точек, входящих в группу (см. формулу (1)). При этом сглаживание, проводимое с помощью такого линейного цифрового фильтра, позволяет снизить уровень шумов на величину, приблизительно равную корню квадратному из числа используемых точек, то есть рост соотношения сигнал/шум в

этом случае составляет +1. Число точек следует выбирать таким, чтобы в любой

интервал свертки включалась не более чем одна точка перегиба.

Другой модифицированный метод скользящего среднего (метод «плавающей» средней) заключается в построении среднего для последующей точки от предыдущего среднего с весовыми коэффициентами. В данном случае выбирается ряд точек с меньшим значением индекса, сглаженных в некотором окне N от i-ой точки:

S1 = S1_1 (2)

где S1 - значение скользящего среднего при добавлении следующей точки спектра;

S1-1 - значение скользящего среднего на предыдущем этапе; y1 - ордината добавляемой

точки. Данный подход широко применяется в прецизионных системах сбора данных, таких как микросхемы семейства MSC12xx фирмы Texas Instruments.

Описываемые методы цифровой фильтрации способны существенно уменьшить уровень высокочастотных шумов, выделить медленно меняющиеся сигналы, однако обладают существенными недостатками: приводят к редукции полезного сигнала как по частоте, так и по амплитуде. Например, увеличение ширины окна дает существенное снижение высоты дифракционных линий рентгенодифракционного спектра и рост их полуширины.

Можно встретить и другие методы цифровой фильтрации. Например, в работе [4] успешно применяется метод медианного фильтра. Важным преимуществом медианной фильтрации является способность к удалению импульсных помех практически без искажения плавно изменяющихся последовательностей значений сигнала, длительность которых превышает длину апертуры медианного фильтра. Здесь одномерный медианный фильтр представляет собой «скользящее окно» протяженностью N отсчетов, в котором центральный элемент заменяется медианой.

МЕТОДЫ ВЫДЕЛЕНИЯ ТРЕНДОВОЙ ЗАВИСИМОСТИ (АППРОКСИМАЦИЯ)

Наиболее важным этапом обработки экспериментальных данных является аппроксимация: построение кривой-тренда, имеющей минимум функционала определенного вида с экспериментальными данными.

Экспериментальные данные, как правило, задаются числовыми рядами значений двух величин: зависимой (yk) и независимой (xk), каждая из которых в общем случае, кроме

определенной регулярной (детерминированной) составляющей, может содержать и случайные составляющие самой различной природы. Случайные составляющие обусловлены как статистической природой изучаемых процессов, так и внешними факторами процессов измерений и преобразования данных (шумы, помехи, дестабилизирующие факторы и ошибки измерений и т.д.). Независимая переменная xk обычно полагается детерминированной, а, следовательно, ее случайная составляющая «переносится» на зависимую переменную yk . Полагается также, что значения случайной составляющей зависимой переменной (как собственные, так и «суммарные») распределены по некоторому вероятностному закону.

При выполнении аппроксимации данных априорно предполагается существование определенной детерминированной связи у(х) между регулярными составляющими этих двух числовых рядов на статистически значимом уровне, достаточном для ее выявления на уровне случайных составляющих. Задача выявления такой закономерности относится к числу неопределенных и неоднозначных, результат которой существенно зависит от трех основных и весьма субъективных факторов:

1) выбора меры приближения (близости) зависимой переменной к искомой функции и метода построения приближения (параметров математической модели);

2) выбора подходящего класса функции аппроксимации (степенной, тригонометрической и пр.), отвечающего физической природе моделируемого процесса;

3) метода оптимизации порядка модельной функции или числа членов ряда аппроксимирующего выражения.

Отсюда следует, что оптимальная аппроксимация может быть обеспечена только достаточно гибкими интерактивными алгоритмами на основе многоэтапных итерационных процессов с возможностью коррекции на каждом этапе.

Мера приближения. Наиболее распространен критерий наилучшего приближения в виде минимума степенной разности между значениями переменной ук и

аппроксимирующей функции (p{xk ):

Ф = Ек - ((хк )Г ^ тп, (3)

k

где S > 0 - положительное число.

Квадратичная мера реализуется при £ = 2 и определяет метод наименьших квадратов, что обеспечивает максимальное правдоподобие функции приближения при нормальном распределении случайной составляющей зависимой переменной ук . Несмещенной оценкой меры приближения в МНК является дисперсия остатков:

Е\Ук -Фк)]£

(к - т) • (4)

где т - количество параметров в функции приближения; (к - т) - число степеней свободы.

Однако экспериментальные данные могут содержать выбросы и грубые ошибки, которые вызывают смещения вычисляемых параметров. Их влияние обычно исключается цензурированием данных: вычислением гистограммы разностей ук -((хк) после

определения первого приближения функции аппроксимации и исключением «хвостовых» элементов гистограммы (до 2,5 % от количества данных или резко выделяющихся элементов данных на основании оценок вероятностей с использованием соответствующих распределений).

Для построения аппроксимирующего тренда необходимо минимизировать функционал вида (3), которому будут удовлетворять коэффициенты аппроксимирующей функции а1 а2 ...,ат , найденные из решения системы уравнений

дФ дФ дФ

— = 0, — = 0 ... — = 0. (5)

да1 да2 дат

Однако частой ошибкой является использование для полиномиальной аппроксимации

следующего набора базисных функций: ((хк) = Е а^'к . Этот базис является наиболее

естественным и, пожалуй, первым приходящим в голову вариантом. Но, хотя с этим базисом удобно работать, он очень плохо обусловлен. Причем проблемы появляются даже при умеренном числе базисных функций (порядка десяти). Эта проблема может быть решена путем выбора базиса из полиномов Чебышева вместо базиса из степеней х. Полиномы Чебышева линейно выражаются через степени х и наоборот, так что эти базисы эквивалентны. Однако, обусловленность базиса из полиномов Чебышева значительно лучше,

чем у базиса из степеней х. Это позволяет без проблем осуществлять аппроксимацию полиномами практически любой степени.

Мера наименьших модулей (метод Лагранжа) реализуется при £ = 1 и применяется при распределениях случайных составляющих зависимой переменной по законам, близким к закону Лапласа (двустороннее экспоненциальное распределение). Такая мера соответствует площади между графиками экспериментальных данных и функцией аппроксимации. По сравнению с квадратичной, эта мера является более устойчивой, в том числе при наличии случайных составляющих с большими амплитудами (длинные «хвосты» разностных гистограмм). Свойства квадратичной меры и меры наименьших модулей в определенной степени сочетаются при £ = 3/2.

Минимаксная мера (мера Чебышева - минимизация максимального расхождения функции аппроксимации с данными) обеспечивает наилучшее приближение при равномерном распределении значений случайной составляющей, но не является устойчивой при наличии больших расхождений данных с функцией аппроксимации.

Аппроксимирующая функция в принципе может быть математической функцией любого типа, линейной комбинацией различных функций или функциональным рядом из степенных, тригонометрических и любых других функций. В основу ее построения желательно закладывать априорные (теоретические) предположения о сущности изучаемого явления, хотя бы по таким свойствам, как область определения переменных и производных, асимптот, минимумов и максимумов.

При полном отсутствии априорной информации о распределении случайной составляющей данных на начальном этапе обычно используется квадратичная мера приближения, при этом существенное значение имеет количество задаваемых параметров функции аппроксимации, особенно при малом количестве данных. При прочих равных условиях целесообразно использовать функции с минимальным количеством задаваемых параметров, что обеспечивает большее число степеней свободы и, соответственно, меньшие значения дисперсии остатков.

Наибольшее распространение в практике аппроксимации при отсутствии теоретических аспектов изучаемых явлений получили функциональные ряды, для которых определяющее значение имеет порядок аппроксимирующей функции (модели). Порядок модели ограничивает число членов функционального ряда аппроксимирующей функции определенным оптимальным количеством членов ряда, которое обеспечивает обоснованное расхождение с фактическими данными и минимизирующее отклонение от искомой регулярной составляющей данных.

Очевидно, что для функциональных рядов порядок модели (степень ряда для степенных рядов) определяет значение меры приближения. При повышении порядка модели (в пределе до бесконечности) минимум функции (3) стремится к нулю. Однако это означает, что при повышении порядка модели в функцию аппроксимации входит не только регулярная составляющая данных, но и все большая и большая доля случайных составляющих, в пределе до полного соответствия функции срк исходным данным ук . Повышение степени приближения к исходным данным при наличии в них случайных составляющих с какого-то определенного момента (порядка модели) не только не будет приближать функцию аппроксимации к регулярным составляющим данных, а наоборот - увеличивать расхождение. С этой точки зрения термин «мера приближения» (3) было бы целесообразнее заменить термином «мера аппроксимации» данных, а под мерой приближения понимать значение меры аппроксимации, при которой обеспечивается максимальная степень приближения функции аппроксимации к регулярной составляющей данных (минимум дисперсии разности функций аппроксимации и регулярной составляющей).

При разделении данных на значения регулярных составляющих sk и случайных ок для квадратичной меры можно записать

Л Ьк -р(хк )]2 = ЛЬ +°к -р(хк )]2 = •••

к 2 к 2 (6)

••• = Л к- Фк )Г+2 Л к- Фк )Г °к+Л1

При нулевом значении математического ожидания случайных величин ок значение второй суммы стремится к нулю, и для оптимальной аппроксимирующей функции имеем

Л к к -р(хк)]2 ^ тт , (7)

к

ЛЬ к- ч>{хк)]2 >> Л - (хк)2 • (8)

кк

В пределе, при идеальной аппроксимации, выражение (7) стремится к нулю, а выражение (8) эквивалентно соотношению дисперсий

ЛЬ к -у(хк)]2 Л - (хк)2

к

л->> л-. (9)

k - m k

Отсюда следует, что при прочих равных условиях наилучшим является приближение, у которого мера приближения близка к дисперсии шума.

При отсутствии информации о дисперсии шумов оптимальный порядок модели может определяться методом последовательных уточнений с последовательным нарастанием порядка модели и сравнением по критерию Фишера значимости различия дисперсии остатков каждого нового порядка с предыдущим порядком. При увеличении порядка модели (начиная с 1-го) значимость различия дисперсий сначала является довольно высокой, постепенно уменьшается и в области оптимальных порядков становится малозначимой. Это объясняется тем, что в этой области при небольших изменениях в меньшую сторону значения числителя выражения (4) одновременно, за счет увеличения порядка, сокращается число степеней свободы. После прохождения оптимальной зоны значения дисперсий остатков снова начинают увеличиваться с увеличением значимости различий. Оптимальный порядок модели при нормальном распределении шума может устанавливаться и непосредственно по минимуму дисперсии остатков.

Наиболее распространенным методом оценки параметров трендовой зависимости по данным измерений в рентгеноструктурном анализе получил метод МНК. Популярность МНК объясняется тем, что получаемые МНК-оценки оказываются состоятельными и асимптотически эффективными, т.е. наилучшими среди всех других методов оценивания в предположении нормальности распределения ошибок1. К сожалению, это предположение в реальной жизни нарушается очень часто благодаря засорению фоновыми измерениями с высоким уровнем и коррелированностью шумовых отсчетов.

В работе [8] в таких случаях предполагают применять более общий подход метода оценивания, называемый методом максимального правдоподобия (ММП), который действует при произвольных законах распределения оцениваемых параметров. В этом случае каждому измерению придается специальный вес, значение которого убывает с ростом невязки, то есть расстояния до подгоняемой кривой. Этот подход, называемый «робастным» (robust - устойчивый), был введен П. Хьюбертом, предложившим отличный от [8] метод его реализации. Так, оценки по модулю в методе Лагранжа уже относятся к робастным.

Вместе с тем и самими авторами указывается, что применение робастного оценивания параметров имеет смысл только в случаях засоренности выборки. Если, напротив, есть уверенность, что выборка сигнала свободна от фоновых измерений, то никакой необходимости в использовании процедуры с весовыми коэффициентами нет, так как для таких случаев доказана максимальная эффективность обычного МНК.

Выделение шумовой зависимости и построение аппроксимирующей функции может быть получено с помощью спектрального анализа методами Фурье и вейвлет-анализом.

1 имеющих нормальное распределение Пуассона.

ЦИФРОВАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ _В РЕНТГЕНОСТРУКТУРНОМ АНАЛИЗЕ НАНОСТРУКТУР. Часть 1. Методы_

Представим, что полученные экспериментальные данные представляют собой некоторый «реальный» сигнал. При этом аппроксимирующая функция описывается в виде некоторого «полезного» сигнала. Таким образом, смысл выделения шума состоит в том, что реальный сигнал раскладывается в виде суммы полезного сигнала и шумовой добавки, имеющей некоторое статистическое распределение. При разложении такого сигнала вычисляются коэффициенты Фурье или вейвлет-разложения. При последующем обратном преобразовании (синтезе) сигнала коэффициенты, отвечающие «шуму», не учитываются.

При разложении сигнала также имеется возможность перейти к дискретно-непрерывному преобразованию, при котором в обратном преобразовании не учитываются составляющие, имеющие «шумовую» природу по предположению. В этом случае обратное преобразование становится дискретным по конечному набору коэффициентов, без выделения непосредственной математической зависимости шумовой добавки. Свойства регулярности используемых вейвлетов при этом становятся особенно существенными на этапе восстановления сигнала. При восстановлении можно не воспроизводить информацию, отвечающую шуму. Именно на этом этапе преимущество вейвлетов проявляется особенно ярко.

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

Очень многие задачи исследования структуры сигналов связаны со спектральными характеристиками и методами их эффективного вычисления. В отличие от вероятностных методов, описывающих свойства случайных процессов во временной области, спектральный анализ позволяет охарактеризовать частотный состав сигнала. Математической основой данного анализа является преобразование Фурье (ПФ) [9], которое играет важную роль не только при расчете спектров, но и как необходимый промежуточный этап при проведении цифровой фильтрации экспериментальных данных, сглаживании сигналов, при определении передаточных и ковариационных функций и т.д.

Суть спектрального анализа исследуемого сигнала 5(г) состоит в определении коэффициентов Сп при разложении сигнала на многочлены ряда

ад

5 (г) = С о( (г)+... + С(п (г)+... = £ С(п (г), (10)

п=0

коэффициенты которого определяются из соотношения

г.

1

Сп=—2{5 (г )<рп (г К (11)

И г1

где

г 2

1Н12 = {И (г Уг (12)

г1

- квадрат нормы, или энергия базисной функции (п (г). При этом предполагается, что никакая из базисных функций не равна тождественно нулю, и на интервале ортогональности [г1 г2 ] выполняется условие

(г ((г>й = {И 2>к = п. (13)

{ { о, к * п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выбор рациональной системы ортогональных функций зависит от конкретной поставленной задачи. Наибольшее распространение получила система гармонических функций. Во-первых, гармонические колебания, в отличие от других, сохраняют свою форму при прохождении через линейные системы, изменяются лишь амплитуда и начальная фаза.

Во-вторых, широко используется хорошо разработанный символический метод. Например, очень важной является задача приближенного разложения сложных сигналов, при которой требуемая точность обеспечивается на минимуме членов ряда и позволяет отсечь высокочастотные гармонические колебания, относящиеся к шуму.

Классическое ПФ (непрерывное и дискретное) является весьма полезным математическим аппаратом для анализа и синтеза сигналов, однако иногда оказывается недостаточно эффективным при обработке сложных сигналов. К недостаткам можно отнести:

1) неприменимость к анализу нестационарных сигналов. Преобразование Фурье не отличает сигналы двух синусоид с разными частотами, один из которых представляет собой сумму синусоид, второй — последовательно следующие друг за другом синусоиды. В обоих случаях их спектр будет выглядеть как два пика на двух фиксированных частотах. В этом случае теряется информация о временных характеристиках сигнала, локализованных на некотором временном интервале;

2) базисную функцию, при разложении в ряд по которой появляется гармоническое колебание, математически определенное на всей временной оси и постоянно во времени;

3) отдельные особенности сигнала вызывают незначительные изменения частотного образа сигнала во всем интервале частот, которые «размазываются» по всей частотной оси, что делает их обнаружение по спектру практически невозможным.

Проблемы спектрального анализа и синтеза сигналов, ограниченных во времени, частично решаются переходом к кратковременному или оконному ПФ. Идея этого преобразования заключается в следующем: временной интервал существования сигнала разбивается на ряд промежутков - временных окон. В каждом промежутке вычисляется свое ПФ. Если в каком-то окне существовали частотные составляющие некоторого сигнала, то они будут присутствовать в спектре. Таким образом, можно перейти к частотно-временному представлению сигнала:

ад

£ (<, Ь) = \ £ (г № — Ь У0101Л, (14)

—ад

в котором применяется предварительная операция умножения сигнала на «окно» ^(г — Ь). Здесь окном является локальная во времени функция (например, ^(г) = 1 при 0 < г < т и ^(г) = 0 при г < 0 и г > т ), перемещаемая вдоль оси времени г для вычисления ПФ в разных позициях Ь. В результате получается текущий спектр, то есть частотно-временное описание сигнала.

Если окно, показанное на рис. 1, перемещать скачками (через т ) вдоль всего времени существования сигнала £ (г), то за некоторое число таких перемещений возможен «просмотр» всего сигнала. Такой спектральный анализ равносилен анализу с помощью набора фильтров с постоянной шириной полосы пропускания, равной Аа « 2п / т.

Ъ Ь+т

Рис. 1. Оконное преобразование Фурье

Очевидно, что каждое окно выделяет свой небольшой участок во времени, а значит точность представления и разрешающая способность (по времени) могут быть повышены. Однако, согласно известному принципу неопределенности Гейзенберга, Аа т = const, то есть невозможно получить одновременно высокое разрешение и по частоте, и по времени. Окну с узкой шириной (т) по времени будет соответствовать плохое разрешение по частоте

(большая величина Аа ).

Недостаток оконного ПФ состоит также в том, что используется фиксированное окно и, следовательно, фиксированное разрешение по времени и частоте для всех точек плоскости преобразования, которое не может быть адаптировано к локальным свойствам сигнала.

ВЕЙВЛЕТ-АНАЛИЗ

Вейвлеты являются одним из эффективных инструментов пространственно-временного анализа. Они стали необходимым математическим инструментом во многих исследованиях [10, 11]. Их используют в тех случаях, когда результат анализа некоторого сигнала должен содержать не только простое перечисление его характерных частот (масштабов), но и сведения об определенных локальных координатах, при которых эти частоты проявляют себя. Таким образом, анализ и обработка нестационарных (во времени) или неоднородных (в пространстве) сигналов разных типов представляют собой основное поле применения вейвлет-анализа. Общий принцип построения базиса вейвлет-преобразования состоит в использовании масштабного преобразования и смещений. Любой из наиболее часто применяемых вейвлетов порождает полную ортонормированную систему функций с конечным носителем, построенных с использованием масштабного преобразования и сдвигов. Именно за счет изменения масштабов вейвлеты способны выявить различие в характеристиках на разных шкалах, а путем сдвига проанализировать свойства сигнала на разных точках на всем изучаемом интервале. В силу свойства полноты этой системы возможно сделать обратное преобразование.

При анализе нестационарных сигналов за счет свойства локальности вейвлеты получают существенное преимущество перед преобразованием Фурье, которое дает нам только глобальные сведения о частотах (масштабах) исследуемого сигнала, поскольку используемый сигнал определен на бесконечном интервале.

Вейвлет-преобразование одномерного сигнала состоит в его разложении по базису, сконструированному из обладающей определенными свойствами солитоноподобной функции (вейвлета) посредством масштабных изменений и переносов [12]. Каждая из функций этого базиса характеризует как определенную пространственную (временную) частоту, так и ее локализацию в физическом пространстве (времени).

Таким образом, вейвлет-преобразование обеспечивает двумерную развертку исследуемого одномерного сигнала, при котором частота и координата рассматриваются как независимые переменные. В результате появляется возможность анализировать свойства сигнала одновременно в физическом (время, координата) и в частотном пространствах. Сказанное легко обобщается на неодномерные сигналы или функции. Вейвлет-преобразование не так хорошо и широко известно, поскольку математический аппарат находится еще на стадии активной разработки. Поэтому для наглядности укажем необходимые понятия вейвлет-анализа, проводя аналоги и сравнения с анализом Фурье, значимость и привлекательность которого для широкого круга исследователей неоспоримы и проверены временем [13].

Определения, свойства и их следствия приводятся для одномерных функций, рядов данных. При необходимости все сказанное может быть обобщено на многомерные случаи. Для определенности мы говорим о функциях, зависящих от времени, о временных рядах и, следовательно, о частотах. Однако без нарушения общности независимая координата может быть пространственной (с соответствующими волновыми числами) и любой другой.

Рассмотрим пространство Ь2 (Я) функций / (г), определенных на всей действительной оси Я(— да, да) и обладающих конечной нормой (энергией)

ад

Е/ = \\/(г)\2йг< да . (15)

-ад

Функциональные пространства Ь2 (0,2п) (в ПФ) и Ь (Я) существенно различны. В частности, локальное среднее значение каждой функции из Ь2 (Я) должно стремиться к нулю на ± да. Синусоидальная волна не принадлежит Ь (Я), и, следовательно, семейство синусоидальных волн не может быть базисом функционального пространства Ь (Я). «Волны», образующие пространство Ь2 (я), должны быть ортогональны [14], стремиться к нулю на ± да и для практических целей чем быстрее, тем лучше.

Простейшим примером такого ортогонального вейвлета является НААR-вейвлет, названный по имени предложившего его Хаара и определяемый соотношением [15]:

Г1, о < г< 1/2,

-1, 1/2 < г< 1, (16)

о, г< о, г > 1.

Сконструируем базис функционального пространства Ь (Я) с помощью непрерывных масштабных преобразований и переносов вейвлета у(г) с произвольными значениями базисных параметров - масштабного коэффициента а и параметра сдвига Ь :

Уь (г) = \а\—1/2 , а,Ь е Я, у е Ь2 (я) . (17)

На его основе запишем интегральное вейвлет-преобразование:

да / да

Ж (а,Ь) = \а\-1/21 £ (г)у* I — Ш = | £ (г )у'аЬ №, (18)

—да V а У —да

* ^ ^

где у - комплексно сопряженный вейвлет.

Итак, каждая функция из Ь2 (Я) может быть получена суперпозицией масштабных преобразований и сдвигов базисного вейвлета, то есть является композицией «вейвлетных волн» (с коэффициентами, зависящими от номера волны (частоты, масштаба) и от параметра сдвига (времени)).

При базисных параметрах (а,Ь), а,Ь е Я обратное вейвлет-преобразование записывается с помощью того же базиса (17), что и прямое:

£(г) = С-1 \\ж{а,Ь)ул ^, (19)

где Су - нормализующий коэффициент (аналогичный коэффициенту (2п)12, нормализующему преобразование Фурье):

Ун (г)

Сщ = {||(®)2\\ 1Ш® < да (20)

-да

(крышечкой сверху обозначается фурье-образ).

Условие конечности константы Су ограничивает класс функций у (г) е Ь2 (Я), которые

могут быть использованы в качестве базисных вейвлетов. В частности, очевидно, что образ Фурье у должен быть равен нулю в начале координат а = 0 и, следовательно, должен быть равен нулю, по крайней мере, нулевой момент:

да

| у(г)Л = 0. (21)

да

Чаще всего в приложениях достаточно рассмотрения только положительных частот, то есть а > 0, а значит вейвлет должен удовлетворять условию

Cw= 2j||(a)2 a lda = 2j||(-0)2 a lda<w.

. .. . (22)

0 0

Поскольку вейвлет-преобразование есть скалярное произведение анализирующего вейвлета на заданном масштабе и анализируемого сигнала, коэффициенты Ж(а,Ь) содержат комбинированную информацию об анализирующем вейвлете и анализируемом сигнале (как и коэффициенты ПФ, которые содержат информацию о сигнале и о синусоидальной волне).

Выбор анализирующего вейвлета определяется тем, какую информацию необходимо извлечь из экспериментальных данных. Каждый вейвлет имеет свои характерные особенности во временном и в частотном пространстве, поэтому иногда с помощью разных вейвлетов можно полнее выявить и подчеркнуть те или иные свойства анализируемой функции. Если провести аналогию с математическим «микроскопом», то параметр сдвига Ь фиксирует точку фокусировки микроскопа, масштабный коэффициент а - увеличение и, наконец, выбором базисного вейвлета у определяются оптические качества микроскопа.

Вещественные базисы на основе вейвлета часто конструируются из производных функции Гаусса [13]:

^ (t )=(- i)m dm

exp

f-12 ^

v 2 у

(23)

здесь д

д m [...]

dt"

, m > 1. Более высокие производные имеют больше нулевых моментов и

позволяют извлечь информацию об особенностях более высокого порядка, содержащихся в сигнале. Например, при т=1 получается WAVE-вейвлет, а при т = 2 - МНАТ-вейвлет или «Мексиканская шляпа». Названы такие вейвлеты по форме получающихся функций (рис. 2).

а) WAVE-вейвлет; б) MHAT-вейвлет Рис. 2. Примеры базисных функций

30

30

MHAT-вейвлет, имеющий узкий энергетический спектр и два равных нулю момента (нулевой и первый), хорошо приспособлен для анализа сложных сигналов. Обобщенный на двумерный случай MHAT-вейвлет часто используется для анализа изотропных полей. Если же производная берется лишь в одном направлении, получается неизотропный базис с хорошей угловой избирательностью. Для построения такого базиса к масштабным преобразованиям и сдвигам базисного вейвлета необходимо добавить его вращение. При этом математический микроскоп (вейвлет-преобразование) приобретает еще и качества поляризатора с углом поляризации, пропорциональным углу поворота вейвлета.

На основе функции Гаусса строится также хорошо известный DOG-вейвлет (Difference of Gaussians):

V (г ) =

Ч121 _г-и

ехр

2

( 1.12 Л

- 0,5ехр

8

(24)

В заключение отметим, что выбор конкретного вейвлета, будь то дискретный или непрерывный, зависит от данного анализируемого сигнала. Разные виды сигнала удается анализировать тем или иным способом, и критерием успеха обычно является простота получаемого разложения. Интуиция и практический опыт исследователя оказываются при этом решающим фактором. Ясно, что обратное преобразование (синтез) остается достаточно устойчивым и воспроизводит наиболее важные характеристики начального исследуемого сигнала, если используются правильные методы.

Рассмотренные выше методы показывают, что при восстановлении профилей экспериментальных кривых представляется логичным использовать следующий порядок восстановления: цифровая фильтрация ^ построение кривой-тренда ^ анализ профиля. При этом предварительная обработка экспериментальных данных с применением цифровых фильтров оказывается не менее важной, чем построение аппроксимационной кривой. Даже с учетом нормального распределения ошибок построение кривой-тренда может иметь затруднения ввиду: а) существенного ухудшения обусловленности матриц при построении полиномиального тренда при высоком уровне шума; б) появления высокочастотной составляющей на низкочастотном участке кривой при проведении операции сверток в ПФ или Вейвлет-анализе.

Конечно же, указанные методы не единственны. Например, все большую популярность в обработке рентгенодифракционных кривых приобретает применение робастных методов при построении аппроксимирующих функций [8] и применение нейронных сетей [8, 16]. Тем не менее, данные методы могут быть с успехом применены в области рентгеноструктурного анализа для выделения и анализа дифракционных линий, отвечающих нановключениям, расположенных в матрице другого структурного материала [4, 17].

ЗАКЛЮЧЕНИЕ

Таким образом, применение современных методов обработки рентгенодифракционных спектров позволяет существенно увеличить разрешение и улучшить восстановление дифракционных линий, отвечающих элементам нанометрового диапазона в условиях высокого уровня шума. Наиболее перспективным представляется применение робастных методов оценивания и вейвлет-анализа. Но, даже в этом случае, целесообразно применение комплексного подхода: цифровая фильтрация ^ построение кривой-тренда ^ анализ профиля.

СПИСОК ЛИТЕРАТУРЫ

1. Крылов П.Н., Федотова И.В. Технологии наноматериалов. Ижевск : Изд-во Удм. гос. ун-та, 2009. 139 с.

2. Крылов П.Н., Федотова И.В. Пленочная технология полупроводниковых материалов // Химическая физика и мезоскопия. 2009. Т. 11, № 3. С. 361-373.

3. Нигматуллин Р.Р. Наношумы: новые инвазивные методы количественного "прочтения" случайных последовательностей // Ученые записки Казан. гос. ун-та. 2007. Т. 149, № 3. С. 71-82.

4. Решетняк М.В., Соболь О.В. Расширение возможностей анализа структуры и субструктурных характеристик нанокристаллических конденсированных и массивных материалов квазибинарной системы W2B2-TiB2 при использовании программы обработки рентгенодифракционных данных "New_pшШe" // ФИП. 2008. Т. 6, № 3-4. С. 180-188.

5. Лоусон Ч., Хенсон Р. Численное решение задач методом наименьших квадратов. М. : Наука, 1986. 232 с.

6. Калиткин Н.Н. Численные методы. М. : Наука, 1978. 512 с.

7. Оппенгейм А., Шафер Р. Цифровая обработка сигналов. М.: Техносфера, 2006. 856 с.

8. Ососков Г.А., Полянский А., Пузынин И.В. Современные методы обработки экспериментальных данных в физике высоких энергий // Физика элементарных частиц и атомного ядра. 2002. Т. 33, вып. 3. С. 676-745.

9. Лайонс Р. Цифровая обработка сигналов. М. : Бином-Пресс, 2006. 656 с.

10. Сергеев С.В., Червяков Н.И. Метод порогового подавления шума в сигнале на основе вейвлет-преобразования // Инфокоммуникационные технологии. 2008. Т. 6, № 2. С. 29-32.

11. Молчанов С.В., Рубан О.В., Мершиев И.Г. и др. Применение адаптивной вейвлет-фильтрации для детектирования зашумленных сигналов ядерного квадрупольного резонанса // Вестн. Рос. гос. ун-та им. И. Канта. 2009. Вып. 4. С. 71 - 80.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Яковлев А.Н. Введение в вейвлет-преобразования. Новосибирск : Изд-во НГТУ, 2003. 104 с.

13. Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения // Успехи физических наук. 1996. Т. 166, № 11. С. 1146-1170.

14. Coifman R. Wavelets and Their Applications // Boston : Jones and Barlett Publ. 1992. С. 453-470.

15. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование // Успехи физических наук. 2001. Т. 171, № 5. С. 465-501.

16. Севастьянов А.А. Решение обратных некорректных задач в прикладной спектроскопии с помощью вейвлет-анализа и нейронных сетей : Автореф. дис. ... канд. физ.-мат. наук. Казань, 2004. 16 с.

17. Алалыкин А.С., Алалыкин С.С., Крылов П.Н. и др. Рентгенодифракционные исследования нанокомпозитных тонких пленок. Программные методы. Ижевск : Изд-во Удм. гос. ун-та, 2009. 70 с.

DIGITAL PROCESSING OF EXPERIMENTAL DATA IN THE X-RAY ANALYSIS OF NANOSTRUCTURES. PART 1. METHODS

Alalykin A.S., Alalykin S.S., Krylov P.N.

Udmurt State University, Izhevsk, Russia

SUMMARY. A brief overview of the most common methods of processing experimental data. The methods of digital filtering, the conditions of applicability of the construction of approximating functions, their joint application for the analysis of time-back X-ray diffraction spectra.

KEYWORDS: X-ray analysis, digital filtering, robust methods, wavelet analysis.

Алалыкин Александр Сергеевич, кандидат физико-математических наук, доцент, доцент кафедры физики твердого тела УдГУ

Алалыкин Сергей Сергеевич, заведующий лабораторией автоматизации физических исследований учебно-научного института экспериментального естествознания УдГУ

Крылов Петр Николаевич, кандидат физико-математических наук, доцент, заведующий кафедрой физики твердого тела УдГУ, тел. (3412) 916133, e-mail: ftt@udsu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.