Научная статья на тему 'Анализ методов разделения наложенных компонент в экспериментальных зависимостях'

Анализ методов разделения наложенных компонент в экспериментальных зависимостях Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
52
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Батищев В. И., Косарев Д. Н.

Рассмотрены вопросы системного анализа методов разделения наложенных компонент в сложных экспериментальных зависимостях. Исследованы аппроксимационные подходы к решению задачи разделения наложенных компонент, методы локализации и обострения пиковых зависимостей, основанные на преобразованиях исходного сигнала, которые приводят к искажению профиля пиков, но инвариантны относительно искомых параметров.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Батищев В. И., Косарев Д. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ методов разделения наложенных компонент в экспериментальных зависимостях»

Информационные технологии

УДК 681.518.3

В.И. Батищев, Д.Н. Косарев

АНАЛИЗ МЕТОДОВ РАЗДЕЛЕНИЯ НАЛОЖЕННЫХ КОМПОНЕНТ В ЭКСПЕРИМЕНТАЛЬНЫХ ЗАВИСИМОСТЯХ

Рассмотрены вопросы системного анализа методов разделения наложенных компонент в сложных экспериментальных зависимостях. Исследованы аппроксимационные подходы к решению задачи разделения наложенных компонент, методы локализации и обострения пиковых зависимостей, основанные на преобразованиях исходного сигнала, которые приводят к искажению профиля пиков, но инвариантны относительно искомых параметров.

Получаемые в результате эксперимента зависимости являются многокомпонентными сигналами, содержащими полезную, физически обусловленную составляющую, искаженную совместным влиянием многих сопутствующих факторов (фоновое излучение, помехи, аппаратные искажения). В связи с этим важной задачей обработки экспериментальных данных является предварительная обработка, включающая в себя нормировку, разделение различных физических эффектов и фильтрацию с целью исключения аномальных результатов, устранения трендов и фоновых составляющих, сглаживания шумов. В этом ряду задач наиболее сложной и наименее проработанной оказывается задача разделения наложенных информативных компонент. В статье [1] нами была предложена методика разделения эффектов, обусловленных совместным влиянием разнохарактерных аппаратурных искажений на результаты эксперимента и устранения этих искажений. Однако в целом задача разделения значительно шире и требует системного осмысления как самой постановки, так и существующих методов её решения.

Наложение отдельных компонент (профилей) в экспериментальных зависимостях вызывается принципиальными физическими причинами и может усугубляться несовершенством средств измерений и методики проведения эксперимента. Задача разделения наложенных профилей может иметь двоякую постановку: определение профилей совмещенных компонент или определение ряда функционалов от совмещенных компонент (амплитуды, положения максимума, интегральной интенсивности) [2, 3].

Указанное обстоятельство привело к формированию двух традиционных подходов к решению задачи разделения наложенных линий: параметрического и непараметрического. Оба подхода основаны на использовании аддитивной модели многокомпонентных зависимостей

т

у(х) = х !](х) + ф (х) (1)

]=1

т

где ^^ (х) - аддитивная смесь информативных компонент;

г=1

Ф(х) - низкочастотная составляющая искажающего воздействия (фон, тренд);

Х( х) - высокочастотная составляющая искажающего воздействия (шум).

Суть параметрического подхода заключается в оценке параметров моделей профилей в (1). По сути своей это аппроксимационная задача, решение которой может производиться классическим методом наименьших квадратов (МНК) или другими статистическими методами.

При использовании МНК для разделения наложенных линий по измеренным значениям сигнала формируется функционал невязки

® п т

3(а) = £№)(х,,^)]2, (2)

•=1 ]=1

минимизация которого приводит к получению оптимальных оценок параметров а у = {т у, Ау, ст у }, где у = 1,2,...ш - число наложенных компонент мультиплета, / = 1,2,...п - число

точек измерений.

Очевидно, что задача поиска глобального минимума функции многих переменных является типичной некорректной задачей, решение которой неоднозначно и в существенной степени определяется качеством исходных данных и выбором начальных приближений параметров моделей. Корректное решение задачи возможно только путем ее доопределения априорной информацией и, как правило, на основе аппроксимационного подхода, предполагающего обоснованный для конкретной предметной области выбор математических моделей исследуемых процессов и явлений.

Аппроксимационные методы требуют структурированной априорной информации, что делает возможным их применение лишь в конкретных прикладных задачах с изученной и формализованной спецификой. Однако в таких ситуациях методы аппроксимации позволяют получать устойчивые, адекватные исходным данным и работоспособные решения.

Применение метода наименьших квадратов существенно ограничивается громоздкостью вычислительных процедур. Кроме того, при использовании МНК необходимо заранее определять число компонент мультиплета. В связи с этим для анализа структуры мультиплетов, определения числа компонент и начальных приближений параметров моделей широко используются методы дифференцирования спектров и производной спектрометрии. В работах [1, 4, 5] исследована эффективность метода производной при разделении мультиплетов. Показано, что при дифференцировании спектров за счет улучшения разрешения получается информационный выигрыш. Метод дифференцирования спектров имеет также самостоятельное значение при анализе структуры мультиплетов, если не требуется восстановления профилей компонент и высокой точности определения параметров моделей.

Байесовские оценки параметров а получают путем построения апостериорной функции плотности распределения оценок параметров на основании априорной функции плотности распределения оценок параметров и условной плотности распределения значений экспериментальной зависимости. Последняя предполагается известной, так как определяется статистическими характеристиками случайной помехи. Выбор априорной функции плотности распределения оценок параметров всегда содержит элемент произвола.

Частным случаем байесовских оценок параметров являются оценки максимального правдоподобия, для вычисления которых необходимо решить задачу максимизации функции апостериорной плотности распределения оценок параметров. При нормальном законе распределения метод максимального правдоподобия эквивалентен МНК.

Одним из упрощенных вариантов параметрического подхода к разделению совмещенных пиков является метод моментов. Сущность метода моментов заключается в расчете статистических моментов п -порядка

¥

Мп = | хпу( х)ёх (3)

— ¥

или центральных моментов (п > 2)

¥—

тп =|(х — Х)пу(х)^ . (4)

—¥

Центральные моменты тп (п = 2,3,4) можно применять для определения ряда характеристик формы пиков: 5 = тз2 , Е = . Известно, что значения 5” и Е для одиночного пика лю-

т-2 т-2

бой формы отличаются от соответствующих значений в случае совмещения пиков. Этим свойством можно воспользоваться для идентификации группы совмещенных пиков.

Для случая разделения двух совмещенных (дуплетных) гауссовых пиков оценки параметров получаются путем решения системы пяти линейных уравнений, которая путем преобразования может

быть сведена к алгебраическому уравнению 9-й степени с одним неизвестным.

Вычислительная процедура метода моментов может быть существенно упрощена. Так, например, при одинаковых значениях параметров ширины гауссовых пиков Ст1 = ст 2 в (1) для оп-

ределения параметров моделей необходимо решить алгебраическое уравнение 3-й степени. При известных значениях т и ^2 метод моментов для двух совмещенных пиков сводится к решению уравнения второй степени [6].

В работах [1, 7] исследованы сглаживающие свойства метода моментов и проведена оценка погрешности численного интегрирования, предложено комплексное использование метода моментов и метода дифференцирования. Однако применение метода моментов существенно ограничивается вследствие возникновения погрешности из-за конечности интервалов интегрирования в (3), (4). Кроме того, метод моментов очень чувствителен к низкочастотным шумам, в частности к смещению фоновой составляющей, т.е. имеет свойства, обратные свойствам метода спектроскопии производной.

Одним из вариантов параметрического подхода к разделению является метод, основанный на разложении сложного контура по некоторой системе симметричных функций, монотонно убывающих по обе стороны от максимума [8]. Предварительно система функций ортогонализи-руется на заданном множестве точек измерения методом Г рамма-Шмидта. Задача определения числа, положения максимумов и формы компонент сводится к решению линейной системы уравнений.

Несмотря на кажущуюся простоту, данный метод обладает недостатками, аналогичными недостаткам МНК. В процессе ортогонализации системы может оказаться, что некоторые векторы почти параллельны, что приводит к резкому ухудшению точности дальнейшей ортогона-лизации. Определение числа линейно независимых векторов затруднительно вследствие наличия случайного шума; таким образом, определение числа компонент неоднозначно.

Под непараметрическими методами разделения наложенных линий понимаются различные методы преобразования сигналов, усиливающие разрешение, т.е. приводящие к сужению пиков. В наиболее общем виде проблема увеличения разрешения ставится как редукция к идеальному прибору и сводится к решению интегрального уравнения Фредгольма 1-го рода с разностным ядром:

Известно, что задача (5) некорректна и общим методом ее решения является метод регуляризации. В ряде работ произведено сравнение методов регуляризации и нелинейного МНК и показано, что при сравнимых вычислительных затратах метод регуляризации обладает более высокой устойчивостью и воспроизводимостью результатов.

Ряд непараметрических методов разделения наложенных компонент сигнала можно объединить под общим названием спектрального подхода [9, 10]. Данный метод не требует априорных сведений о составе сигнала и отличается высоким быстродействием. Однако он чувствителен к случайным шумам, поскольку связан с процессом обращения свертки и нелинейной заменой переменных.

Один из вариантов спектрального непараметрического метода основан на известном из теории преобразования Фурье соотношении, связывающем изменение масштаба функции во временной области с изменением частотной характеристики преобразованной функции. Уменьшение масштаба во временной области приводит к сужению профиля пика и, следовательно, к увеличению доли составляющих высоких частот в его Фурье-преобразовании. Таким образом, если произвести преобразование Фурье сигнала, пропустить полученный сигнал через фильтр, усиливающий высшие частоты, и осуществить обратное Фурье-преобразование, то в результате ширина пиков будет уменьшена по отношению к исходным ее значениям.

Иной вариант спектрального подхода основан на методе выявления скрытых периодичностей. Исходный сложный контур представляется в виде комбинации гауссовых или лоренцевых компонент одинаковой ширины, но различной амплитуды [11, 12]. Выполнив преобразование Фурье от гауссовых функций, получим:

и (х) = | К (х — х) у (х)ё х,

(5)

т

т

где К(х) - аппаратная функция прибора, у(х) = Е 1у(х).

г=1

22

т

у=1

В Фурье-пространстве задача разложения сложного контура на составляющие сводится к нахождению амплитуд и частот отдельных гармоник методом Лагранжа-Дейля. Метод не нашёл практического применения из-за весьма серьезных допущений о форме и структуре муль-типлета, лежащих в его основе. Практически данный метод является параметрическим и рассматривается здесь для общности изложения.

Для широкого круга задач информация о профилях компонент избыточна. Необходимой является информация о положении пиков, их амплитуде или интегральной интенсивности. Поэтому существует большая группа методов, основанных на преобразованиях исходного сигнала, которые приводят к искажению профиля пиков, но инвариантны относительно искомых параметров.

Один из методов рассматриваемой группы основан на том, что дельта-функция Дирака может быть представлена линейной комбинацией четных производных от нормального распределения:

1 ¥ „(2К)

5(* - *о) = ^1 (-1)* Окт-у12К>(х), К=0 2К К!

(7)

где

у( х) = ехр

(* - *0) 2а 2

(8)

Выражение (7) является теоретической основой преобразования, обеспечивающего усиление разрешения за счет суммирования четных производных распределения монолинии (8). В результате преобразования одиночные пики трансформируются в дельта-функции.

Практическое использование выражения (7) затруднительно в связи с появлением шумов при расчете производных высоких порядков. Поэтому вместо (7) используется преобразование

К = 4

У( х) = Е (-1) Ка2кУ(2К)(х)

(9)

К = 0

где а2к - неизвестные коэффициенты.

Для уменьшения осцилляций после осуществления преобразования (9) производится цифровая фильтрация. Практически целесообразно применение фильтров Савицкого-Г олея с окном в 5, 7 или 9 точек. При более широких окнах существенно искажается высота пика. Обычно производится трехкратное сглаживание, при этом смещение максимумов пиков в преобразованных спектрах не превышает 1,4% от исходного положения пика. Пределы разрешения - расстояния между компонентами порядка 0,6 полуширины.

Ряд методов разрешения основан на свертке исходного спектра с функциями различного вида, т.е. на синтезе цифровых фильтров в частной области. Действительно, если рассматривать измеренный сигнал в виде

у(х) = |Н(х)у(х - х)ёх,

а в качестве Н(х) взять гауссову функцию, то Фурье-образ преобразованного сигнала будет определяться отношением У (ю) = У(ю) , где У (а) - Фурье-образ исходного сигнала. А сам пре-

Н (ю)

м

образованный сигнал определяется выражением у(х) =Е

(х-т])

2( а 2-а 2)

е ' , что соответствует су-

жению каждой составляющей. Очевидно, что наилучший эффект обострения получается, если функция обострения соответствует истинной форме пиков.

При известных параметрах спектрометрического тракта форму полезного сигнала можно считать известной. В этом случае оптимальным фильтром полезного сигнала будет корреляционный фильтр. Корреляционная обработка пиков в многоканальных спектрах основана на использовании взаимнокорреляционной функции измеренной зависимости у(х) и вычисленной как

1 N

g(k) = ^+7 I y(xk- xj )

J=—N

M

M —

I (xj )-I (xj )

i=1

i=1

(10)

M 1 N

где 11i (x.) =--------------- I

J 2 N +1 .=-N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i=1 J=—N

N

I ‘i (xj )

i=1

Преобразование (10) одновременно подавляет фоновую составляющую и усиливает разрешение. Степень усиления разрешения существенно зависит от выбора величины окна.

В работах [1, 6] исследованы информационные аспекты повышения разрешения спектров путем дифференцирующих фильтров. Полное количество информации, которое способен пере-

где (М+1) - число регистра-

Z Z

дать прибор, определяется выражением P = (M +1) log(M +1)

ционных уровней сигнала, которое зависит от отношения сигнал/шум; Z =

(x1 - xN )

А

- число

интервалов независимого аргумента с рабочим диапазоном х1 - хи и разрешением А. Дифференцирование приводит к увеличению 2 за счет уменьшения разрешения и одновременно к уменьшению М за счет ухудшения отношения сигнал/шум. Поэтому информационный выигрыш в разрешении может быть достигнут при наличии избыточной информации, в частности, при количестве отсчетов, превышающем то их количество, которое требуется для передачи деталей кривой формы. Показано, что при последовательном вычислении производных шаг дифференцирования изменяется колебательно (обратно пропорционально частоте среза соответствующих производных). Увеличение разрешения при использовании второй производной составляет 1,25 и 1,42; 4-й производной - 1,67 и 2,52 для функции Гаусса и Лоренца соответственно.

Проведённый анализ показал, что корректное решение задач разделения многокомпонентных экспериментальных зависимостей возможно только путем ее доопределения априорной информацией и, как правило, на основе аппроксимационного подхода, предполагающего обоснованный для конкретной предметной области выбор математических моделей исследуемых процессов и явлений. Для широкого круга задач необходимой является информация о положении пиков, их амплитуде или интегральной интенсивности. В этой связи исследованы методы локализации и обострения пиковых зависимостей, основанные на преобразованиях исходного сигнала, приводящих к искажению профиля пиков, но инвариантных относительно искомых параметров.

БИБЛИОГРAФИЧЕСKИИ СПИСОК

1. Батищев В.И., Золин А.Г., Косарев Д.Н, Романеев А.Е. Аппроксимационный подход к решению обратных задач анализа и интерпретации экспериментальных данных // Вестник СамГТУ, сер. Технические науки. 2006. №40. С. 57-65.

2. СизиковВ.С. Математические методы обработки результатов измерений. СПб.: Политехника, 2001. 240 с.

3. Василенко Г.И. Теория восстановления сигналов: о редукции к идеальному прибору в физике и технике. М.: Сов. радио, 1979. 272 с.

4. Осипова В.М., Борисова Н.Ф. Параметрическое восстановление спектра в спектроскопии производной // ЖПС, 1985. Т. 42. №4. С. 603-606.

5. Дубровкин И.М. Об изменении количества информации, содержащейся в спектре, при его дифференцировании // ЖПС. 1981. Т. 35. №4. С. 699-704.

6. Батищев В.И. Аппроксимационный подход к обработке и интерпретации результатов рентгено-

дифрактометрических экспериментов // Проблемы управления и моделирования в сложных системах: Труды VII Междунар. конф. / Под ред.: акад. Е.А. Федосова, акад. Н.А. Кузнецова, проф. В.А. Виттиха. Самара:

Самар. науч. центр РАН, 2005. С. 197-202.

7. Сураев В.Ф., Кочубей С.М. О точности цифрового дифференцирования экспериментально измеренных спектральных контуров // ЖПС. 1985. Т. 42. №4. С. 627-631.

8. Михайленко В.И., Михальчук В.В. Разложение спектра на элементарные симметричные полосы с помощью метода ортогонализации Грамма-Шмидта // ЖПС. 1986. Т. 45. №3. С. 483-488.

9. Phillips G. W.,Marlow K. W. Peak search and analysis of gamma-ray spectra with very low statisties. IEEE Trans., Nucl. Sci., 1977. V.24. N1. P.154-163.

10. HillmanM. Computer analysis of gamma- and x-ray spectra. Nucl. Justr and Meth., 1976. V. 135. N2. P.363-368.

11. Романенко С.В., Стромберг А.Г. Классификация математических моделей аналитических сигналов в форме пиков // Журнал аналитической химии, 2000. Т. 55. №11. С. 1144-1148.

12. Стромберг А.Г., Романенко С.В., СтасюкН.В., СеливановаЕ.В. Аппроксимационные математические модели аналитических сигналов. Универсальная математическая модель трех элементарных пиков в аналитической химии // Изв. вузов. Химия и хим. технология. 2002. Т.45. №3. С. 97-102.

i Надоели баннеры? Вы всегда можете отключить рекламу.