Научная статья на тему 'Оценка погрешности количественного спектрохимического анализа многокомпонентной смеси в присутствии случайно изменяющейся базовой линии спектра'

Оценка погрешности количественного спектрохимического анализа многокомпонентной смеси в присутствии случайно изменяющейся базовой линии спектра Текст научной статьи по специальности «Математика»

CC BY
173
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
СибСкрипт
ВАК
Область наук
Ключевые слова
КОЛИЧЕСТВЕННЫЙ СПЕКТРОХИМИЧЕСКИЙ АНАЛИЗ / ПРЯМАЯ КАЛИБРОВКА / ПОГРЕШНОСТИ / СЛУЧАЙНО ИЗМЕНЯЮЩАЯСЯ БАЗОВАЯ ЛИНИЯ / QUANTITATIVE SPECTROCHEMICAL ANALYSIS / DIRECT CALIBRATION / ERRORS / RANDOMLY VARYING BASE LINE

Аннотация научной статьи по математике, автор научной работы — Дубровкин Иосиф Михайлович, Ананьев Владимир Алексеевич

Погрешности количественного анализа многокомпонентных смесей, измеренных по спектрам поглощения, возмущенных случайно изменяющейся базовой линией, могут быть значительно уменьшены путем введения ковариационной матрицы шумов при расчетах по методу наименьших квадратов. Эффективность предложенного метода продемонстрирована на примере анализа препарата Экседрин.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Дубровкин Иосиф Михайлович, Ананьев Владимир Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ERROR ESTIMATION IN THE QUANTITATIVE SPECTROCHEMICAL ANALYSIS OF MULTICOMPONENT MIXTURE WITH RANDOMLY VARYING SPECTRAL BASELINE

The errors of quantitative analysis of multicomponent mixtures using absorption spectra perturbed by randomly varying baseline could be significantly reduced by the introduction of the noise covariance matrix in least squares estimation. The effectiveness of the proposed method is demonstrated on the example of Excedrin drug analysis.

Текст научной работы на тему «Оценка погрешности количественного спектрохимического анализа многокомпонентной смеси в присутствии случайно изменяющейся базовой линии спектра»

УДК 543.153

ОЦЕНКА ПОГРЕШНОСТИ КОЛИЧЕСТВЕННОГО СПЕКТРОХИМИЧЕСКОГО АНАЛИЗА МНОГОКОМПОНЕНТНОЙ СМЕСИ В ПРИСУТСТВИИ СЛУЧАЙНО ИЗМЕНЯЮЩЕЙСЯ

БАЗОВОЙ ЛИНИИ СПЕКТРА

И. М. Дубровкин, В. А. Ананьев

ERROR ESTIMATION IN THE QUANTITATIVE SPECTROCHEMICAL ANALYSIS OF MULTICOMPONENT MIXTURE WITH RANDOMLY VARYING SPECTRAL BASELINE

I. M. Dubrovkin, V. A. Ananiev

Работа выполнена в рамках НИР, финансируемой из средств Министерства образования и науки РФ в рамках государственного задания КемГУ.

Погрешности количественного анализа многокомпонентных смесей, измеренных по спектрам поглощения, возмущенных случайно изменяющейся базовой линией, могут быть значительно уменьшены путем введения ковариационной матрицы шумов при расчетах по методу наименьших квадратов. Эффективность предложенного метода продемонстрирована на примере анализа препарата Экседрин.

The errors of quantitative analysis of multicomponent mixtures using absorption spectra perturbed by randomly varying baseline could be significantly reduced by the introduction of the noise covariance matrix in least squares estimation. The effectiveness of the proposed method is demonstrated on the example of Excedrin drug analysis.

Ключевые словa: количественный спектрохимический анализ, прямая калибровка, погрешности, случайно изменяющаяся базовая линия.

Keywords: quantitative spectrochemical analysis, direct calibration, errors, randomly varying base line.

Количественный спектрохимический анализ многокомпонентной смеси известного качественного состава является одним из самых распространенных методов аналитической химии [1]. Например, количественный анализ лекарственных препаратов можно проводить по спектрам оптического поглощения растворов, полученных после их растворения. Так как спектр поглощения каждого компонента смеси в растворе заранее известен, то для анализа обычно используют метод прямой калибровки (метод К-матрицы) [1]. Столбцы матрицы К представляют собой значения коэффициентов молярного поглощения индивидуальных компонентов смеси для заданных длин волн. Предполагается, что эти столбцы линейно независимы. При сильном перекрытии спектров индивидуальных компонентов используются методы хемометрики [2].

Классический метод прямой калибровки основан на использовании идеальной модели спектра многокомпонентной смеси, предполагающей присутствие только гомоскедатичного (обладающего постоянной дисперсией) и некоррелированного шума. Это допущение не всегда оправдано из-за нестабильности условий регистрации спектра и специфики его цифровой обработки [3]. Кроме этого, отклонение от идеальной модели может быть обусловлено наличием неконтролируемых примесей в растворе. Визуально указанные эффекты могут проявляться в спектре поглощения в форме базовой линии (фона), для устранения которой используется предварительная обработка спектров: алгебраическая коррекция фона [1], производная спектрометрия [4], вейвлет-преобразова-ние [5]. Как правило, полная компенсация базовой линии практически невозможна, поэтому в спектре смеси всегда будут оставаться ее "следы" со случайно изменяющимися параметрами.

Целью настоящей работы является оценка влияния случайно изменяющейся базовой линии на точностные характеристики количественного анализа по методу прямой калибровки.

Теория

В статье используются общепринятые термины линейной алгебры. Заглавные и строчные буквы, выделенные жирным шрифтом, обозначают матрицы и векторы-столбцы, соответственно, скаляры выделены курсивом. Надстрочные индексы Т и -1 используются для обозначения транспонированной и обратной матриц, соответственно.

В соответствии с законом Бугера-Ламберта-Бера спектр оптического поглощения смеси, состоящей из у компонентов, можно записать в виде

у = ЯЫ + 8 (1)

где K - шхп матрица, столбцы которой составлены из коэффициентов молярного поглощения чистых компонентов смеси для заданных длин волн; ш - число заданных длин волн; c - пх1 вектор концентраций компонентов; ё - толщина поглощающего слоя (кюветы), которая для простоты изложения принята равной 1 см; 8 - шх1 вектор нормального шума с нулевым средним и ковариационной матрицей &2 V. Для идеальной модели V является единичной матрицей, а с2у равно дисперсии шумов. При наличии случайно

изменяющейся базовой линии матрица V отлична от единичной (см. Приложение).

Оценка вектора c по обобщенному методу наименьших квадратов [4] равна:

с = (KTV-1K)-1KTV-1y, (2)

с дисперсионной матрицей

Ds = (KTV-1K)-1. (3)

Дисперсия вектора с:

а? }-п

= 1г(Бг) + 2 2 ВуБ^ (4)

] >>1

где й - след матрицы; Бы - элемент матрицы Б. Наличие второго члена в выражении (4) показывает, что концентрации отдельных компонентов смеси корре-лированы.

Численной оценкой дисперсии вектора концентраций является его среднеквадратическая погрешность

MSE (а) = mean(]T(C k-cjj

mix\

)

j in

(5)

/ mix^ / mixч

+2 Z (c i - Ci )(C j - С j ),

j >i>1

где mean обозначает усреднение повторных численных оценок; Cj,ic - точная концентрация k-го компонента в смеси.

Для подобных по форме и сильно перекрывающихся спектров чистых компонентов расчет обратной матрицы в выражении (2) будет очень чувствителен к погрешностям измерения спектров. Для стабилизации обращения матриц используется метод регуляризации по Тихонову [5], согласно которому

с = (KTV-1K+ aI)-1KTV-1y, (6)

где a - параметр регуляризации; I - единичная матрица. Мы будем подбирать значение параметра регуляризации таким образом, чтобы минимизировать относительную среднеквадратическую погрешность оценки с в уравнении (6):

n . 2

RMSE(a)m1n = mina MSE(a)/ Z(CmiX) • (7)

Оценка погрешностей анализа таблеток Эк-седрин

Спектры Экседрина и его ингредиентов (рис. 1) в цифровой форме были получены путем компьютерного сканирования опубликованных спектров [6].

Было взято 100 равноотстоящих отсчетов в области 260 - 300 нм. К спектру раствора таблеток Эксед-рин (рис. 1) добавлялся полиномиальный фон (см. уравнение (А1) Приложения) со случайными параметрами. Численные оценки корня относительной среднеквадратической погрешности (ЕКМБЕ) производились путем усреднения 10000 статистически независимых расчетов. Для вычислений и построения графиков была написана программа на языке МАТЬАБ.

Результаты численного эксперимента представлены на рис. 2.

Анализ полученных данных позволяет сделать следующие выводы:

1. Использование матрицы V, рассчитанной в строгом соответствии с дисперсиями коэффициентов полиномиального фона (см. Приложение) свидетельствуют о хорошем совпадении теоретических и численных оценок (рис. 2а).

2. Пренебрежение случайным фоном при больших стандартных отклонениях его наклона (а ) значительно увеличивает погрешность определения вектора концентраций (рис. 2б).

3. Зависимость относительной среднеквадратиче-ской погрешности оценки вектора концентрации от стандартного отклонения постоянного члена полинома (аа0) мала по сравнению с её зависимостью от

стандартных отклонений коэффициентов первой (ста1) и второй степени (аа?). Таким образом, погрешность анализа весьма чувствительна к случайным изменениям наклона некомпенсированной базовой линии.

4. Нами обнаружено что, при оптимальном выборе матрицы V регуляризация решения уравнения (1) малоэффективна. Однако при больших стандартных отклонениях наклона базовой линии в случае V = I , благодаря регуляризации погрешность анализа значительно снижается (рис. 2в).

2

Рис. 1. Спектры препарата Экседрин (—) и его ингредиентов (...) (парацетамол (1), кофеин (2) и аспирин (3), в соотношении 0.4464:0.1071:0.4464, соответственно). Суммарная концентрация равна 20 мг/л в смеси вода-метанол-ледяная уксусная кислота (соотношение указанных компонентов 69:28:3). Спектр салициловой кислоты (4) с концентрацией 4 мг/л в той же смеси. Воспроизводится с разрешения "http://www.dissolutiontech.com"

Литература

1. Бернштейн, И. Я. Спектрофотометрический анализ в органической химии/ И. Я. Бернштейн, Ю. А. Каминский. - Л.: Химия. - 1986. - 200 с.

2. Родионова, О. Е. Хемометрика: достижения и перспективы / О. Е. Родионова, А. Л. Померанцев // Успехи химии. - 2006. - T. 75. - № 4. - C. 302 - 321.

3. Fernandez-Ahumada, E. A new formulation to estimate the variance of model prediction. Application to near infrared spectroscopy calibration / E. Fernandez-Ahumada, J. M. Roger, B. Palagos // Anal. Chim. Acta. - 2012. -V. 721. - P. 28 - 34.

4. Дубровкин, И. М. Химический анализ с использованием математического дифференцирования / И. М. Дубровкин // ЖАХ. - 1988. - T. XLIV. - № 6. - C. 985 - 979.

5. Depczynski, U. Quantitative analysis of near infrared spectra by wavelet coefficient regression using a genetic algorithm / U. Depczynski, K. Jetter, K. Molt [et al.] // Chemom. Intell. Lab. Syst. - 1999. - V. 47. - P. 179 - 187.

6. Себер, Дж. Линейный регрессионный анализ / Дж. Себер. - М.: Мир. - 1980. - 456 с.

7. Тихонов, А. Н. Методы решения некорректных задач / А. Н. Тихонов, В. Я. Арсенин. - M.: Наука. -1986. - 288 c.

8. Simonian, M. H. Full spectrum quantitation: an advance UV. Visible spectroscopic method for multi-component dissolution testing / M. H. Simonian. - Режим доступа: http://www.dissolutiontech.com.

Информация об авторах:

Дубровкин Иосиф Михайлович - доктор физико-математических наук, заведующий отделом точных наук. Академический колледж Западная Галилея, Израиль, 972-4-6292910, dubrovkin@013.net.il.

Iosif M. Dubrovkin - Doctor of Physics and Mathematics, Head of Exact Sciences Department, Western Galilee College, Israel.

Ананьев Владимир Алексеевич - доктор химических наук, профессор кафедры аналитической химии КемГУ, eprlab@kemsu.ru.

Vladimir A. Ananiev - Doctor of Chemitry, Professor at the Department of Analytical Chemistry, Kemerovo State University.

i Надоели баннеры? Вы всегда можете отключить рекламу.