УДК 543.42
Вестник СПбГУ. Сер. 4. 2012. Вып. 4
Н. А. Герасимов, А. М. Киселёв, И. О. Конюшенко, С. А. Кукушкин, В. М. Немец
О ВОЗМОЖНОСТЯХ АБСОРБЦИОННО-СПЕКТРАЛЬНОГО ОПРЕДЕЛЕНИЯ КОНДЕНСИРОВАННЫХ АРОМАТИЧЕСКИХ СОЕДИНЕНИЙ В БЕНЗИНАХ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ В ОБРАБОТКЕ РЕЗУЛЬТАТОВ СПЕКТРОСКОПИЧЕСКИХ ИЗМЕРЕНИЙ
Введение. Метод главных компонент (МГК) относится к группе методов многомерной (многофакторной) математической статистики (ММС), которые в последние десятилетия находят всё большее применение в аналитических исследованиях различных сложных по составу объектов. Как правило, их применение осуществляется в целях идентификации (классификации) такого рода объектов. В этих случаях характеристический спектр исследуемых объектов выступает в качестве многомерного спектроскопического образа. Вместе с тем применение ММС принципиально позволяет решать и задачи повышения информативности спектроскопических методик количественного анализа (снижение погрешности, расширение интервала определяемых концентраций) сложных по составу объектов. Такая возможность обусловлена принципиальной многомерностью спектральных измерений в широком диапазоне длин волн в сочетании с оптимизированной процедурой сокращения размерности многомерного пространства, отражающего результаты измерений. Имеющиеся работы этой направленности применительно к оптическим методам исследования объектов довольно малочисленны и, на наш взгляд, не полностью отражают возможности метода в решении задач количественного анализа. При том что упоминания о широких возможностях методов многомерной градуировки приводятся в большом числе работ, как ставших уже классическими [1], так и новых [2], практическое использование таких методов всё ещё остаётся достаточно редким явлением. В представляемой работе проведены исследования особенностей применения МГК для обработки многомерного аналитического сигнала при молекулярно-абсорбционном спектральном определении примесей в бензине. Исследуемыми объектами являются смеси бензина с конденсированными диароматическими соединениями на уровне 10~3 мас. %.
Приниципиальные основы. В классической молекулярно-абсорбционной количественной спектрометрии объектов сложного состава ответственным моментом является выбор длины волны зондирующего излучения, на которой измеряемые оптические характеристики (например, пропускание) максимальным образом реагируют на присутствие и изменение концентрации определяемого компонента в исследуемом объекте. Решение задачи поиска такой точки спектра может оказаться весьма трудоёмким. Нужно учитывать и то обстоятельство, что для разных диапазонов концентраций определяемого компонента могут быть предпочтительны различные участки спектра. Наконец, представляется очевидным, что рассмотрение только одного участка спектра, каким бы информативным он ни был, никогда не обеспечит максимально возможной информативности аналитического сигнала. Поэтому представляется целесообразным использование приёмов, позволяющих достаточно просто и быстро извлекать из спектра смеси максимальное количество информации, а также исключающих из рассмотрения не информативные, а лишь «шумящие» участки. С решением такой задачи, очевидно,
© Н.А.Герасимов, А.М.Киселёв, И. О. Конюшенко, С. А. Кукушкин, В. М. Немец, 2012
напрямую связаны вопросы увеличения чувствительности аналитических измерений и повышение устойчивости их результатов.
Решение задачи повышения информативности оптических спектров в количественном анализе сложных объектов может состоять в использовании многомерного подхода, т. е. в измерении аналитического сигнала на многих длинах волн в широком спектральном диапазоне. При этом набор сколь угодно большого массива точек в спектре, в которых можно измерить аналитический сигнал, сегодня проблемы не представляет. Однако здесь существует реальная опасность ввода в рассмотрение избыточного и одновременно практически бесполезного числа данных. Действительно, если в некотором диапазоне длин волн определяемый компонент не имеет, например, полос поглощения, то измерения в этом диапазоне ничего кроме увеличения шумовой составляющей не дадут. Таким образом, задача обработки спектральной информации при таком подходе состоит в извлечении максимального количества полезной информации с отбросом шумовой составляющей и представлении этой информации в виде зависимости обобщённого аналитического сигнала от той или иной характеристики исследуемого объекта, в том числе и от концентрации определяемых компонентов.
Основная идея метода главных компонент состоит в том, что если представлять спектр как многомерный вектор, в качестве координат которого выступают значения интенсивностей на определённых длинах волн, то возможно провести исследование взаимного расположения спектров образцов в многомерном пространстве и выделить направления, описывающие некоррелированные различия между спектрами. Совокупность таких направлений образует ортогональный базис, именуемый системой главных компонент. Многомерный аналитический сигнал представляется в таком случае как некоторая линейная комбинация всех измеренных в спектре значений интенсивности:
где Уи — сформированное значение обобщённого аналитического сигнала для к-го стандартного образца (СО); к — номер СО, используемого в построении градуировочной характеристики, принимает значения от 1 до М, где М — полное число СО; X— измеренное значение аналитического сигнала для к-го образца на длине волны ~кг; аг — вес члена разложения, учитывающий вес значения Хиг в обобщённом аналитическом сигнале. Суммирование проводится по всем длинам волн, на которых измеряются значения Хиг. Таким образом, для каждого стандартного образца формируется значение У, используемое для построения градуировочной зависимости. Основной критерий выбора значений весов аг совпадает с критерием для первой главной компоненты в МГК — достижение максимальных различий между значениями Уи. Степень различия внутри совокупности Уи может быть оценена на основе формального представления Уи как реализаций некоторой случайной величины. Тогда критерий достижения максимальных различий между Уи равен максимальному значению оценки дисперсии:
Максимальное значение этой оценки и обеспечивает в данном случае максимальную крутизну градуировочной характеристики.
Пользуясь терминологией многомерной математической статистики, можно сказать, что в целом определение оптимальной совокупности аг основано на поиске собственных
(1)
(2)
к=1
векторов и собственных значений ковариационной матрицы многомерной случайной величины X, для которой значения Хи являются выборкой [3].
Вышеизложенное определяет следующий порядок действий при построении градуи-ровочной характеристики. Составляется набор СО в необходимом диапазоне концентраций определяемого компонента. Измеряются интенсивности спектров СО в выбранном спектральном интервале. Результаты измерений обрабатываются в соответствии с методикой МГК. Итогом обработки является построение градуировочной характеристики «обобщённый аналитический сигнал — концентрация определяемого компонента», где в качестве значений обобщённого аналитического сигнала выступают значения по первой главной компоненте. Далее в тех же условиях и точках спектра, что и в случае измерений СО, измеряются интенсивности для образца с неизвестной концентрацией определяемого компонента. Результаты этих измерений обрабатываются по (1) с весами ai, определёнными при построении градуировочной характеристики. Полученное значение обобщённого аналитического сигнала позволит по градуировочной характеристике определить концентрацию изучаемого компонента.
Эксперимент. В качестве исследуемого объекта выбран бензин БР-2 («Галоша» нефрас-С2-80/120), как один из наиболее чистых относительно содержания полициклических ароматических соединений. Роль контролируемых примесей выполняли диароматические соединения. Оценка их содержания в исследуемом бензине не превышала 10~3 мас. %. Для унификации процедуры приготовления СО и снижения её трудоёмкости был использован следующий способ. В бензин вводился парафин (фракция С14—С17), содержащий известные количества диароматики (нафталина) — 0,50 ± 0,01 мас. %. Парафин выбран из-за того, что он не имеет поглощения в видимой области. Концентрация нафталина в парафине оценивалась хроматографи-чески. Для исследования были приготовлены 10 СО бензина, в которых содержание контролируемых примесей изменялось в диапазоне от 0,010 до 0,500 мас. % (с точностью 2 отн. %). Использовался также чистый бензин. Измерения проводились на спектрофотометре СФ-56 в диапазоне спектра 250-1000 нм с шагом 1 нм и при спектральной ширине щели 1 нм. Спектры пропускания измерялись многократно в течение пяти дней и не проявили заметного временного изменения. По многократно измеренным спектрам строились усреднённые зависимости пропускания для каждого образца. Общий вид усреднённых спектров пропускания представлен на рис. 1. Как видно, сильное поглощение у всех СО начинается в области 400 нм. Поглощение чистого бензина начинается при меньших длинах волн. Поглощение СО вызвано наличием в них примеси
100-,
80-
^ 40-
о
а
—1
20-
0,00 % 0,03 % 0,30 % 0,50 %
Рис. 1. Спектры пропускания смесей с различными концентрациями ароматики
200 400 600 800 1000 1200
Длина волны, нм
полиароматических соединений. В диапазоне 300-400 нм поглощение в чистом бензине выражено слабо. В более коротковолновой области интенсивное поглощение проявляет и чистый бензин. Обусловлено оно уже другими углеводородными компонентами (например, моноароматическими соединениями — бензолом, толуолом и прочими). Результаты более детальных измерений представлены на рис. 2.
Построенные с использованием классического подхода градуировочные графики для значений оптической плотности П в области спектра от 300 нм и далее через 5 нм приведены на рис. 3, 4. Градуировочные зависимости для коротковолновой области спектра рассчитывались с использованием точек с малыми концентрациями, так как для более высоких концентраций парафина на соответствующих длинах волн значения оптической плотности были велики и, следовательно, определялись с большой погрешностью. На графиках указано среднее квадратичное отклонение (в) аналитического сигнала от аппроксимирующей прямой. Наличие погрешности связано с погрешностью составления смесей (около 2 отн. %) и с конечным динамическим диапазоном спектрофотометра.
Полученные результаты могут быть описаны следующим образом. На участке 300-315 нм (см. рис. 3) традиционный подход даёт удовлетворительные результаты для малых концентраций примеси. Оптическая плотность смесей с большими концентрациями примеси в этой области спектра значительна, отношение «сигнал—шум» низко, поэтому значения оптической плотности больше 3,0 не могут быть использованы для построения градуировочных графиков. Относительное СКО лежит в пределах 3 % от полного диапазона изменения аналитического сигнала. Однако по мере роста длины волны оно имеет тенденцию к увеличению (для определённого диапазона концентраций), что заметно при сравнении графиков для 315 нм (рис. 3, г) и 320 нм (рис. 4, а). При дальнейшем увеличении длины волны СКО продолжает расти и, что хорошо заметно в области малых концентраций, разброс становится настолько большим, что гра-дуировочная зависимость становится хаотичной. Это вынуждает на длине волны 330 нм (рис. 4, в) рассматривать только диапазон концентраций 0,03-0,21 % (что и продемонстрировано на рис. 4, г), а на 335 нм — 0,09-0,40 % (рис. 4, д). Приведённые результаты объясняются особенностью спектров, состоящей в сдвиге края полосы поглощения в длинноволновую область при увеличении концентрации примеси. В результате: не существует длины волны, на которой бы оптические плотности для всех концентраций имели бы незашумлённые значения, позволяющие построить градуировочную характеристику по всему диапазону концентраций.
Рис. 2. Спектры пропускания смесей
с различными концентрациями ароматики в диапазоне длин волн от 300 до 400 нм
0-
280
320
360
Длина волны, нм
2,01,51,00,50,0-
В
0,01
0,02
0,05
0,00 0,00 0,01 0,01 0,01 0,01 0,02
с, %
3,5-, 3,02,5 2,0 1,51,00,5 0,0
В
0,00 ' 0,01 ' 0,02 ' 0,03 ' 0,04 ' 0,05
с, %
В
3,0- 0,09 у 3,0-
2,5 2,5
2,0 2,0
1,5- Лб,05 1,5-
1,0- /"0,03 я = 0,08 1,0-
0,5 0,0 0,02 0,01 ^0,00 0,5 0,0
0,00 0,02 0,04 0,06 0,08 0,10
с,
В
0,01
0,00
0,00 0,03
0,05 0,08
с, %
Рис. 3. Градуировочные графики, построенные по значениям оптической плотности на различных длинах волн: а — 300; б — 305; в — 310; г — 315 нм
0,10 0,13
Для построения градуировочной характеристики «обобщённый аналитический сигнал — концентрация» те же спектры оптической плотности были обработаны по МГК. При этом набор весов а^ рассчитывался с использованием спектров для всего диапазона концентраций. Полученная зависимость аппроксимировалась полиномом четвёртой степени. Среднее квадратичное отклонение результата эксперимента от аппроксимирующей кривой, отнесенное к величине Д = Утах _ Утт, составляет 2,2 % при изменении концентраций примеси в пределах от 0 (чистый бензин) до 0,30 мас. %. На рис. 5 приведена зависимость обобщённого аналитического сигнала У от концентрации примеси. График обрывается на концентрации 0,30 %, так как разница в значениях обобщённого аналитического сигнала между точками, соответствующими концентрациям 0,30 и 0,40 %, меньше, чем указанное относительное остаточное СКО (2,2 %). Таким образом, возможны уверенные измерения концентрации примеси в диапазоне от 0 до 0,30 мас. %. При концентрациях ~ 0,40 % и более аппроксимирующая кривая по-прежнему сохраняет монотонность, однако снижается её наклон, т. е. происходит ухудшение точностных характеристик результатов измерений. Уменьшение наклона градуировочной кривой по мере роста концентрации примеси обусловлено тем, что спектры образцов 0,30, 0,40 и 0,50 % имеют значительно меньшие различия по сравнению с другими образца-
2,5 —| 2,0 1,51,00,5 0,0
В
0,12
0,01
2,0 1,51,00,5 0,0
0,00 В
0,03 0,05 0,08
С, %
0,10 0,13
0,21
0,12
0,35
0,05 ■ 0,09
'0,03
3,5 3,02,5 2,0 1,5 -1,00,5 0,0 -0,5-
2,0 1,51,00,5 0,0
В
0,0^/^0,05
"0,02 0,00
0,00 В
0,05
0,10 0,15
С, %
0,20 0,25
0,03
0,05
0,00 0,05
0,10 0,15
С, %
0,8 0,70,6 0,5 0,40,3 0,2 0,10,0
0,20 0,25
0,00 0,03 0,05 0,08 0,10 0,13 0,15 0,18 0,20 0,23
С, %
В
0,12
0,09
0,05 0,10 0,15 0,20 0,25 0,30 0,36 0,41
С, %
Рис. 4. Градуировочные графики, построенные по значениям оптической плотности на различных длинах волн: а — 320; б — 325; в — 330; г — 330 (оставлены точки, соответствующие образцам с большими концентрациями примеси); д — 335 нм
ми с малыми концентрациями. Спектры же образцов с концентрациями примеси 0,40 и 0,50 % вообще пересекаются (см. рис. 2), нарушая общую тенденцию к сдвигу полосы поглощения в красную область по мере увеличения концентрации диароматики.
д
0,1-1 а 0,0 -0,1 -0,2 -0,3 -0,4 -0,5 -0,6 -0,7
300
400 500 600 Длина волны, нм
700
Так как критерий (2) «нацелен» на поиск максимальных различий между образцами, совокупность весов а^, вычисленная по спектрам всех образцов, значительно лучше отражает взаимные различия между спектрами образцов с малыми концентрациями парафина, чем образцов с его большими концентрациями. Этот вывод хорошо иллюстрирует график зависимости весов а^ от длин волн, приведённый на рис. 6. Подобные графики широко применяются при использовании МГК, так как позволяют исследовать информативность различных признаков [1]. Проблема может быть решена введением второй ступени метода. Если наклон графика (см. рис. 5) для группы образцов с высокими концентрациями примеси недостаточен для надёжного измерения, можно выделить эту группу из общего набора СО и провести с ней процедуру, описываемую в (1) и (2). «Изолированные» в данном случае образцы с малыми концентрациями примеси и значительными различиями в спектрах пропускания перестанут оказывать влияние на работу критерия (2), позволяя ему «сконцентрироваться» на образцах интересующей группы. Таким образом можно рассчитать дополнительный набор весов в и применять его дополнительно к тем образцам неизвестной концентрации, которые попадают в зону больших концентраций. В качестве примера на рис. 7 приведена градуировочная кривая У = /(С), построен-
Рис. 6. Зависимость весов а от длины волны В
2,0
1,5-
1,0-
0,5
0,0 0,5 1,0
1,5
С, %
2,0 2,5 3,0
Рис. 7. Градуировочный график для области концентраций 0,3-0,5 %
ная для образцов с концентрацией диароматики от 0,30 мас. %, позволяющая находить концентрации с приемлемой точностью.
Поскольку расчёт набора весов проводился в данном случае только по спектрам образцов с высокими концентрациями, а МГК, лежащий в основе этого расчёта, нацелен на поиск наибольших различий между спектрами, наклон градуи-ровочной характеристики во второй ступени метода позволяет надёжно определять концентрации и свыше 0,30 %. То, что набор весов ßj наиболее хорошо отражает различия между образцами из требуемого интервала, можно проиллюстрировать графиком (рис. 8): веса имеют большие значения именно там, где различия между образцами с большими концентрациями велики.
Выводы.
1. Проведены исследования некоторых особенностей и возможностей применения метода главных компонент для повышения информативности количественного спектрального абсорбционного анализа объектов сложного молекулярного состава (на примере исследования бензина БР-2 с примесью конденсированных ароматических соединений).
2. Показано, что применение МГК в этом случае освобождает от сложного и трудоёмкого исследования спектра поглощения с целью поиска оптимальной аналитической области. Кроме того, использование МГК позволяет расширить диапазон определяемых концентраций и снизить случайную погрешность результата измерений до минимума, определяемого неточностью изготовления стандартных образцов.
3. Предложен двухэтапный способ использования МГК.
Литература
1. Esbensen K. H. Multivariate Data Analysis — In Practice. Oslo, Norway: CAMO Process AS, 2002. 161 p.
2. Родионова О. Е., Померанцев А. Л. Хемометрика в аналитической химии. URL: http://www.chemometrics.ru (дата обращения: 01.03.2012).
3. Дронов С. В. Многомерный статистический анализ. Барнаул: Изд-во Алтайского гос. унта, 2003. 246 c.
Статья поступила в редакцию 28 мая 2012 г.
-0,2--1-1-1-1-1-1-1-1-1
300 400 500 600 700 Длина волны, нм
Рис. 8. Зависимость весов в от длины волны