Научная статья на тему 'Влияние искажения спектра на правильность количественного анализа по методу многомерной калибровки'

Влияние искажения спектра на правильность количественного анализа по методу многомерной калибровки Текст научной статьи по специальности «Математика»

CC BY
130
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
СибСкрипт
ВАК
Область наук
Ключевые слова
КОЛИЧЕСТВЕННЫЙ АНАЛИЗ / МНОГОМЕРНАЯ КАЛИБРОВКА / ИСКАЖЕНИЕ ПОЛОС ПОГЛОЩЕНИЯ / ПРАВИЛЬНОСТЬ / QUANTITATIVE ANALYSIS / MULTIVARIATE CALIBRATION / PURE-COMPONENT SPECTRA DISTORTIONS / TRUENESS

Аннотация научной статьи по математике, автор научной работы — Дубровкин Иосиф Михайлович, Ананьев Владимир Алексеевич

Путем компьютерного моделирования оценена правильность спектрометрического анализа многокомпонентных смесей по методу многомерной калибровки при использовании искаженных спектров. Указаны границы допустимых искажений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Дубровкин Иосиф Михайлович, Ананьев Владимир Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE IMPACT OF THE SPECTRA DISTORTIONS ON THE TRUENESS OF THE QUANTITATIVE ANALYSIS IN MULTIVARIATE CALIBRATION

Computer-based evaluation of the trueness of the quantitative analysis of the multicomponent mixtures using multivariate calibration has been performed in the case of the disturbed spectra of the training set. The permissible limits of these distortions have been established.

Текст научной работы на тему «Влияние искажения спектра на правильность количественного анализа по методу многомерной калибровки»

УДК 543.153

ВЛИЯНИЕ ИСКАЖЕНИЯ СПЕКТРА НА ПРАВИЛЬНОСТЬ КОЛИЧЕСТВЕННОГО АНАЛИЗА ПО МЕТОДУ МНОГОМЕРНОЙ КАЛИБРОВКИ

И. М. Дубровкин, В. А. Ананьев

THE IMPACT OF THE SPECTRA DISTORTIONS ON THE TRUENESS OF THE QUANTITATIVE ANALYSIS IN MULTIVARIATE CALIBRATION

I. M. Dubrovkin, V. A. Ananiev

Путем компьютерного моделирования оценена правильность спектрометрического анализа многокомпонентных смесей по методу многомерной калибровки при использовании искаженных спектров. Указаны границы допустимых искажений.

Computer-based evaluation of the trueness of the quantitative analysis of the multicomponent mixtures using multivariate calibration has been performed in the case of the disturbed spectra of the training set. The permissible limits of these distortions have been established.

Ключевые словa: количественный анализ, многомерная калибровка, искажение полос поглощения, правильность.

Keywords: quantitative analysis, multivariate calibration, pure-component spectra distortions, trueness.

В аналитической химии для количественного анализа многокомпонентных смесей применяется многомерная калибровка, которая позволяет установить связь между спектрами эталонных образцов (тренировочное множество) и концентрациями определяемых компонентов [1, с. 302 - 321]. При этом знание параметров спектров значительно улучшает эффективность математических процедур [2, с. 30 -136]. Параметры могут быть определены или с помощью экспертных систем, основанных на использовании баз спектральных данных, в том числе с привлечением теоретического расчета спектров молекул [3, с. 1053 - 1066; 4], или путем разложения сложных спектров на полосы, обусловленные поглощением индивидуальных компонентов [5, с. 108 - 115]. Очевидно, что параметры индивидуальных полос, полученные математически или экспериментально с использованием первого или второго подхода, и их аналоги в изучаемой смеси будут отличаться из-за неточности теории, погрешности эксперимента и вычислений. Это должно приводить к погрешности в определении концентрации компонентов в смеси. Однако оценить в аналитическом виде возможную погрешность количественного анализа, обусловленную искажением полос индивидуальных компонентов, используя метод многомерной калибровки, не представляется возможным.

Целью настоящей работы являлась численная оценка относительного отклонения вектора расчетных концентраций от истинного значения в смеси (правильность анализа) при использовании, как МНК (Метод наименьших квадратов), так и метода PLS (The Partial Least Squares или Проекция на латентные структуры (ПЛС) [1]). При расчетах предполагалось, что спектры тренировочного множества состоят из полос гауссовой или лоренцевой формы, положения максимумов которых и ширина на полувысоте (полуширина) были возмущены случайными погрешностями. Анализ проводился относительно спектра смеси, который состоял из суммы неискаженных полос.

Теория. В тексте используются общепринятые термины линейной алгебры. Заглавные и строчные буквы, выделенные жирным шрифтом, обозначают матрицы и векторы-столбцы, соответственно, скаляры выделены курсивом. Надстрочные индексы Т и -1 используются для обозначения транспонированной и обратной матриц соответственно.

Рассмотрим линейную модель спектра многокомпонентной смеси у при соблюдении закона Бугера- Ламберта-Бера:

у = Кс + 8, (1)

где K = mxn - матрица полос поглощения индивидуальных компонентов; п - число компонентов; m -число точек на оси абсцисс спектра; c = пх 1 - вектор концентраций компонентов, 8 = mx1 - вектор нормального шума с нулевым средним и дисперсией 2

аУ .

В общем случае p смесей выражение (1) может быть переписано в классической форме:

Y = СКТ + Ну, (2)

где Y = pxm - матрица спектров смесей тренировоч-

ного множества; строки pxm матрицы C составлены

т Н т 2 т из векторов c ; Ну = 1х а у ; I - единичная матрица;

2

а У - дисперсия шума.

Предположим, что матрица K известна, тогда, согласно классическому методу прямой калибровки [1], оценка матрицы C из выражения (2) по МНК [6] может быть получена из выражения:

С = Y B0, (3)

где Bкл = К(КТК)-1 - оценка регрессионной матрицы.

Для обратного метода калибровки (метод P-матрицы) [1]:

C = YBобр - Не, (4)

где Вобр - регрессионная матрица рассчитываемая по 2 2

ПЛС; Не = I аС ; аС - дисперсия шумов матрицы

концентраций тренировочного множества.

Вектор концентрации индивидуальных компонентов в смеси оценивается по ее спектру (1):

сТ = ут В . (5)

Пусть столбцы неискаженной матрицы К составлены из полос гауссовой (Лв) или лоренцевой (Ль) формы:

Лап(х) = ЛопЄхр[-4/п2(х - хоп)

(6)

Уиск = (С + Ес)К

+ м

иск >Ш*У -

(8)

К^ск = (СхС)-1СтУиск. (9)

Оценка вектора концентрации смеси, обладающей спектром (1), производится с помощью выражения подобного (5):

„Т т Яиск

с = у В .

иск *

В качестве меры влияния погрешности матрицы Киск на вектор определяемых концентраций будем использовать относительную погрешность оценки этого вектора:

ЛЬп(х) = Аоп/[1 + 4(х - Хоп)2], (7)

где А0п - оптическая плотность в максимуме полосы п; х = /'/^п; I - целочисленная координата по оси абсцисс спектра; ^п - (полуширина); х0п = 10п^п - положение максимума полосы.

Предположим, что максимум полосы п смещен на величину Д/0п, а ее форма искажена за счет изменения полуширины Д^п. Относительные смещения будут равны 8, = Дх0п = Д/'/^п и 5„п = ДwJwn. Кро-

/0п

ме этого, примем, что каждая полоса искажена случайным шумом. Задавая матрицу концентраций тренировочного множества е, из выражения (2) получим матрицу спектров смесей для многомерной калибровки:

5С = ||Єиск с

(10)

~гт' Т -ж-у- ОлсУт .

где К иск = К иск + Нк - матрица, составленная из полос, искаженных систематическими погрешно-2 2

стями; Нк= I ак ; ак - дисперсия шумов. Из уравнений (4) и (8) находим регрессионную матрицу В и(^р

для обратного метода калибровки, используя ПЛС.

Для классической калибровки регрессионная матрица (3) может быть представлена в виде:

виск = к (кТ к )-1

пкл 1Чиск V Г^иск 1чиск,/ •

Матрица К^к может быть определена из спектров тренировочного множества (8) по МНК (метод К-матрицы) [1]:

где || || - символ Евклидовой нормы вектора; черта означает усреднение по независимым экспериментам; Сздн - заданный вектор концентрации смеси.

Поскольку вектор с искажен только случайными погрешностями, а сиск - как случайными, так и систематическими, то относительная погрешность (10) служит характеристикой относительного отклонения вектора расчетных концентраций от истинного значения (правильность анализа).

Описание численного эксперимента для модельных спектров

Для численного эксперимента использовали три теоретических спектра трехкомпонентных смесей, представленных на рис.1а-в (Д = А/Атах - относительная оптическая плотность; Атах - максимальная оптическая плотность спектра смеси). Полоса поглощения каждого компонента (столбец матрицы К) имеет гауссову форму. Параметры полос представлены в таблице. Как видно, спектры а, б состоят из полос одинаковой полуширины, различным образом перекрывающихся между собой, а спектр в - из полос разной полуширины. Все три полосы имеют одинаковую оптическую плотность в максимуме. Мерой чувствительности расчетной концентрации к возмущениям матрицы К может служить ее число обусловленности - соМ(К) [6] (таблица). При расчетах использовали т = 100.

Таблица

Параметры полос и значение соп^К)

Спектр Параметры полос cond( )

і01 і02 і03 w1 W2 Wз Гаусс Лоренц

1 120 160 180 50 50 50 4 5

2 150 160 165 100 100 100 453 228

3 150 160 170 100 75 35 19 28

А

1,0

0,8

0,6

0,4

0,2

/—\ а 1,0 6 1,0 х ч в

\ 0,8 N. 0,8 / \

/| 2 з\ 0,6 / 0,6 У \

г \ /* А. NN 0,4 12 3 0,4 ■ 12 3 \

■ ***** .***• \ • 0,2 0,2

0 0 . ***** ....

0 104

203 104

203 104

203

Рис. 1. Спектры смесей а-в (—), состоящих из полос 1 - 3 (...)

Кроме этого, были использованы спектры, аналогичные описанным выше, но состоящие из полос лоренцевой формы с параметрами, совпадающими с теми, которые представлены в таблице.

Относительная погрешность 8с рассчитывалась как среднее из результатов 105 независимых численных экспериментов. Стандартное отклонение для этой величины оценивалось при Р = 95 %. В каждом эксперименте относительное смещение максимума полосы 80 и относительное смещение её полуширины 8 являлись нормально распределенными случайными величинами с нулевым средним и с фиксированным стандартным отклонением а8и а8

соответственно.

Матрица концентраций тренировочного множества включала 50 образцов. Каждая её строка была составлена из трёх случайных чисел, равномерно распределенных в области 0-1. В каждой серии численных расчетов генерировались шумы, обладающие следующими стандартными отклонениями: ау = ау = ак = 10-3; аС = 5х 10-3.

Для вычислений и построения графиков был написана программа на языке ЫАТЬАБ. При калибровке по методу ПЛС использовалось два компонента.

Результаты и их обсуждение

Результаты численных расчетов верхней границы погрешности 8^ для спектров 1 а-в от ошибок

8п0 и 8 (Р = 95 %) представлены на рис. 2, 3 (буквы соответствуют таковым для рисунка 1). Выбор верхней границы обусловлен тем, что в некоторых случаях стандартное отклонение величины 8с превышало её среднее значение.

Анализ полученных данных позволяет сделать следующие выводы.

1. Использование МНК для сильно перекрывающихся полос неприемлемо, так как уже при смещении максимума полос 80, имеющем стандартное отклонение а8 = 10 %, ошибка определения вектора концентрации может превысить 20 %

(рис. 2 бь б2). Кроме этого, значительный разброс рассчитанных величин свидетельствует о большой неустойчивости полученных оценок.

2. Согласно [8], верхняя граница погрешности, определяемая из уравнения (10):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8“р < или и соМ(К)||ДК||/||К||, (11)

где ||ДК|| норма возмущения матрицы К. Из наших оценок следует, что 8т << 8скир и что соМ(К) не является доминирующим фактором, определяющим величину 8С . Так, например, значения соМ(К) для спектров а, б отличаются в десятки раз (таблица), а погрешности 8С близки между собой (рис.2 аа,б1). В

этой связи представляется необоснованной рекомендация по использованию расширенной формы выражения (11) со знаком равенства в качестве универсальной оценки погрешности анализа [9].

3. Как видно из данных, представленных на рис. 2 и 3, переход от МНК к методу ПЛС приводит к существенному уменьшению погрешности. Даже для спектра б, характеризующегося высокой коллинеарностью индивидуальных полос поглощения,

максимальное значение 8С не превышает 12 %

(рис. 3 б1).

4. Смещение максимумов полос поглощения оказывает значительно больший возмущающий эффект, чем изменение их полуширины. Этим, по всей видимости, объясняется относительно слабое влияние формы полос (гауссовая или лоренцевая) на погрешность 8С (при или а8 < 10 %) при неизменности положения их максимумов. Тем не менее наблюдается зависимость 8С от ширины индивидуальных полос при калибровке по МНК. Например, для спектра в, обусловленного полосами разной ширины, погрешность гораздо меньше при больших

значениях а8 ,чем для спектров а, б, полосы которых имеют равную полуширину. Необходимо отметить, что для ПЛС этот эффект не наблюдается (рис. 3).

Вестник КемГУ

№ 2 (50) 2012

%

стл ,%

°и-

Од , %

и и-

Рис. 2. Максимальные погрешности определения вектора концентраций по МНК для спектров 1 а-в без реконструкции полос поглощения индивидуальных компонентов (—) и с реконструкцией (...) для гауссовых (о, □ ) и лоренцевых (Д, ◊) полос соответственно

а6. .% •о

Об, .% ‘о

О я ,% ‘о

О к ,%

и\ы

Рис. 3. Максимальные погрешности определения вектора концентраций по ПЛС для спектров 1 а-в без реконструкции полос поглощения индивидуальных компонентов (—) и с реконструкцией (...) для гауссовых (о, □ ) и лоренцевых (А, ◊) полос соответственно

Учет смещений максимумов полос поглоще- деления вектора концентраций при анализе препа-

ния, обусловленных индивидуальными компонен- рата Экседрин. Спектры Экседрина и его ингреди-

тами, при анализе таблеток Экседрин

В качестве практического приложения предложенной методики нами оценены погрешности опре-

ентов представлены на рис. 4а [7].

Рис. 4а. Спектры препарата Экседрин (—) и его ингредиентов (...) (парацетамол (1), кофеин (2), аспирин(З)), взятых в соотношении 0.4425:0.1150:0.4425 соответственно. Суммарная концентрация -20 г/ л в смеси вода - метанол - ледяная уксусная кислота (69-28-3). Воспроизводится с разрешения http://www.dissolutiontech.com.

Рис. 4б. Средние погрешности определения вектора концентраций при анализе препарата Экседрин по МНК (о ,□) и ПЛС (А, ◊) без реконструкции (—) и с реконструкцией (...) спектров индивидуальных компонентов

Методом полиномиальной аппроксимации (с помощью многочлена 5-й степени) в области 241340 нм (шаг 1 нм, т = 100) были получены функциональные выражения для дискретных спектров, позволившие осуществить их контролируемое смещение по оси абсцисс без потери крайних точек. При расчетах принималось, что форма спектров индивидуальных компонентов Экседрина остается постоянной. Спектр, обусловленный индивидуальным компонентом, смещался независимо от других спектров по оси абсцисс на величину 8, имеющей нормальное распределение с нулевым средним и стандартным отклонением с8 . Все остальные

параметры численных расчетов были тождественны параметрам, используемым в предыдущем разделе. Зависимости средних погрешностей 8С от стандартного отклонения смещений по оси абсцисс с 8 для

препарата Экседрин представлены на рис. 4б.

Выбор средних величин обусловлен относительно слабым разбросом значений 8С при различных численных экспериментах. В отличие от случая модельных спектров, реконструкция индивидуальных спектров, обусловленных различными компонентами, из спектров смесей дала некоторые преимущества по сравнению с непосредственным использованием искаженных спектров. Неожиданным, однако, оказалось, что ПЛС-калибровка не имеет преимуществ по сравнению с МНК. Данный факт указывает на необходимость анализа погрешностей в каждой конкретной ситуации.

Как известно, погрешность спектральной калибровки современных спектрофотометров составляет ±0.2 нм. Исходя из данных, представленных на рис. 4б, можно утверждать, что ошибка определения вектора концентраций при анализе Экседрина не превышает 1.5 - 2 %. Указанная величина согласу-

ется с опубликованными погрешностями спектрометрического анализа таблеток Экседрин [10].

Заключение

Генерирование спектров смесей тренировочного множества, основанное на использовании нескольких полос поглощения, параметры которых отягощены погрешностями, позволяет проводить компьютерное моделирование погрешности, обусловленное использованием многомерной калибровки. При относительных величинах погрешностей до 10 % относительная погрешность определения концентраций не превышала 10 % даже в случае сильно перекрывающихся полос поглощения. Предлагаемая методика позволяет в каждом конкретном случае оценить погрешность определения концентраций при варьировании параметров полос спектров.

Литература

1. Родионова, О. Е. Хемометрика: достижения и перспективы / О. Е. Родионова, А. Л. Померанцев // Успехи химии. - 2006. - T. 75. - № 4.

2. Boulet, J.-C. Improvement of direct calibration in spectroscopy / J.- C. Boulet, J.- M. Roger // Anal. Chim. Acta. - 2010. - V. 668.

3. Elyashberg, M. E. Fuzzy structure generation: a new efficient tool for computer-aided structure elucidation (CASE) / M. E. Elyashberg, K. A. Blinov, S. G. Molodtsov, A. J. Williams, G. E. Martin // J. Chem. Inf. Model. - 2007. - V. 47.

4. Грибов, Л. А. Безэталонный молекулярный спектральный анализ. Теоретические основы / Л. А. Грибов, В. И. Баранов, М. Е. Эляшберг. - M.: URSS. - 2002. - 320 c.

5. Monakhova, Y. B. Independent components in spectroscopic analysis of complex mixtures / Y. B. Monakhova, S. A. Astakhov, A. Kraskov,

S. P. Mushtakova // Chem. Intell. Lab. Syst. - 2010. -V. 103.

6. Себер, Дж. Линейный регрессионный анализ / Дж. Себер. - М.: Мир, 1980. - 456 с.

7. Simonian, M. H. Full spectrum quantitation: an advance UV/Visible spectroscopic method for multicomponent dissolution testing / M. H. Simonian // http://www.dissolutiontech.com/DTresour/1995 Articles /DT199505_A02.pdf.

8. Воеводин, В. В. Матрицы и вычисления / В. В. Воеводин, Ю. А. Кузнецов. - M: Наука, 1984. -320 c.

9. Danzer, K. Analytical chemistry. Theoretical and metrological fundamentals / K. Danzer. - Springer, 2005. - 315 p.

10. Ozdemir, A. Utilization of multivariate calibration techniques for the spectrophotometric simultaneous determination of paracetamol, aspirin and caffeine in pharmaceutical formulation / A. Ozdemir , E. Dinc, F. Onur // Turk. J. Pharm. Sci. - 2004. - V. 1.

i Надоели баннеры? Вы всегда можете отключить рекламу.