ХИМИЯ
Вестн. Ом. ун-та. 2010. № 2. С. 99-105.
УДК 543.422.3-76+519.237.5
И.В. Власова, А.С. Шелпакова, А.А. Нагаев
Омский государственный университет им. Ф. М. Достоевского
ФОРМИРОВАНИЕ ГРАДУИРОВОЧНЫХ НАБОРОВ ДЛЯ СПЕКТРОФОТОМЕТРИЧЕСКОГО АНАЛИЗА МНОГОКОМПОНЕНТНЫХ СМЕСЕЙ С ПРИМЕНЕНИЕМ МЕТОДА МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Предложен новый алгоритм непрямой градуировки для спектрофотометрического анализа смесей с применением метода множественной линейной регрессии (МЛР). На основе этого алгоритма разработано программное обеспечение для формирования наборов стандартных смесей, по которым производится градуировка. Новый алгоритм позволяет повысить точность анализа неразделенных смесей по сравнению с другими вариантами градуировки.
Ключевые слова: спектрофотометрический анализ, хемометрические алгоритмы,
Современные аналитические приборы позволяют получать и обрабатывать большие массивы данных. Так, спектр поглощения индивидуального вещества в УФ-области может быть представлен в виде массива, содержащего 1 000 и более чисел, а при спектрофотометрическом анализе многокомпонентных смесей объем исходных данных возрастает во много раз. Для анализа смесей в настоящее время часто используют хемометрические алгоритмы, в частности, метод множественной линейной регрессии (МЛР) [1-4]. В этом случае содержания компонентов в смеси вычисляют, решая сильно переопределенную систему линейных уравнений вида:
Ах = К* Сх , (1)
где Ах - вектор оптических плотностей анализируемой смеси при п длинах волн, К* - матрица коэффициентов светопоглощения размера п х р р-число определяемых компонентов, п >> р), Сх - вектор концентраций компонентов анализируемой смеси. В основе вычислений лежит метод наименьших квадратов (МНК). Решение системы (1) в рамках МНК находят как:
Сх = (К*Т К*)-1 Ах. (2)
Расчеты ведут с применением набора коэффициентов поглощения К*, предварительно вычисленных по спектрам индивидуальных соединений (компонентов смеси). Такой вариант МЛР называют прямой градуировкой [5]. Однако при реализации данного способа расчета концентраций возникает ряд трудностей. Во-первых, алгоритм МЛР
Работа выполнена в рамках Госконтракта П 1103.
© И.В. Власова,А. С. Шелпакова, А.А. Нагаев, 2010
101 А. С. Ласунов
предполагает скои плот ности, и если в спектрах смесей есть участки с достоверны-соблюдение ус-ми отклонениями от аддитивности, их необходимо заранее исключать. ловия аддитив-Во-вторых, для снижения погрешностей определения требуется опти-ности оптиче-
мизация спектральных диапазонов, вплоть до выбора различных участков спектра для расчета концентраций разных компонентов [3, 4]. Это увеличивает время на разработку методики анализа, однако не всегда приводит к желаемой точности результатов анализа [4].
Если же возможны процессы взаимодействия компонентов между собой, что зачастую приводит к отклонениям от аддитивности, то вычислять элементы матрицы коэффициентов необходимо по спектрам т стандартных смесей того же качественного состава, что и анализируемые, но с точно известным содержанием каждого компонента:
К = (СТС)-1А, (3)
где С - матрица концентраций т х р (т -число стандартных смесей), А - вектор оптических плотностей смесей при заданной длине волны. Расчеты по системе (3) повторяют п раз, т. е. столько, сколько длин волн предполагают в дальнейшем использовать для решения системы (1). Этот вариант МЛР называют непрямой градуировкой. При отклонениях оптических плотностей исследуемых смесей от закона аддитивности, а также при наличии в смесях дополнительных неизвестных компонентов непрямая градуировка должна приводить к более точным результатам анализа [5]. Основная проблема при вычислении матрицы коэффициентов в этом случае - формирование хорошо обусловленной матрицы концентраций для стандартных смесей (С), используемых в качестве градуировочных. Плохая обусловленность является следствием неудачного выбора концентраций компонентов в стандартных смесях, что может значительно ухудшить результаты анализа.
Цель настоящей работы - повышение точности спектрофотометрического анализа многокомпонентных смесей с применением МЛР в варианте непрямой градуировки. Для достижения основной цели необходимо было теоретически решить вспомогательную задачу - разработать оптимальный способ формирования градуировочных наборов, содержащих заданное число стандартных смесей. Способ должен обеспечить вычисления такой
матрицы коэффициентов (К), которая приведет к минимальным погрешностям определения концентраций компонентов при спектрофотометрическом анализе смесей того же типа.
Теоретическая часть. Пусть приготовление стандартных смесей (растворов) и измерение их светопоглощения сопряжено с возникновением случайных погрешностей. Тогда система уравнений, связывающая состав и светопоглощение растворов, имеет следующий вид:
А = КС + е, (4)
где е - вектор обобщенных погрешностей, включающих в себя случайные погрешности приготовления растворов индивидуальных соединений и их стандартных смесей, погрешности измерения аналитических сигналов и т. п. Будем считать, что распределение обобщенных погрешностей является нормальным, эти погрешности не зависят от концентраций С и не коррелируют с числом приготавливаемых градуировочных смесей т. Тогда ковариационная матрица остатков
Е^е) может быть записана как:
(5)
где 82 - неизвестная дисперсия компонент векторам, а 1т - единичная матрица т -го порядка.
МНК основан на минимизации функционала:
0(к ) = еТе = (А- КС )Т (А- КС). (6)
л
Точность оценки К матрицы К определяется ковариационной матрицей:
Z. =Е
(К- К)Т (К - К ) = е|[стс )т1ст^]г [(стс Ус = (стс У сеСт4:т (стс ).
Заменим ковариационную регрессионных остатков Е^е)
(5) и в конечном итоге получим:
(7)
матрицу с учетом
© И.В. Власова, А.С. Шелпакова, А.А. Нагаев, 2010
=
(8)
Диагональ этой матрицы есть вектор
Л
дисперсий оценок K. При заданной размерности единичной матрицы (m) и постоянной величине S2, основным условием максимальной точности оценивания К будет оптимальность матрицы концентраций С. В качестве оценки оптимальности возьмем минимум суммы дисперсий
Л
оценок K, или, что эквивалентно, след (trace) матрицы (СС/3. Тогда сформированный оптимальный план эксперимента обеспечит минимальное суммарное среднеквадратичное отклонение оценок в классе всех планов заданной размерности m:
trace (CTC ) ^ mm ,
(9)
■ min ’
lb < C < ub
соответственно
и
матрицы
верхнего
где lb, ub
нижнего (lower bound)
(upper bound) ограничений.
Реализацию вышеизложенного алгоритма вели с помощью оригинальной программы, написанной в пакете MATLAB. Входными данными программы являются:
- число компонентов р;
- минимальные и максимальные концентрации каждого компонента в градуировочных смесях (ожидаемые содержания компонентов в анализируемых смесях должны находиться в пределах заданных концентрационных уровней);
- число градуировочных смесей, от т = р до заданного пользователем верхнего предела.
Поиск минимума (9) осуществляли внутренним средством пакета МАТЬАБ (функция /тгпеоп). Результатом работы программы являются оптимальные (в указанном выше смысле) концентрации компонентов для каждой стандартной смеси градуировочного набора. Одновременны выдаются данные по наборам, содержащим разное число смесей. Оптимальный набор, из числа предложенных программой, пользователь выбирает сам.
Методика эксперимента. Объектами анализа были двухкомпонентные смеси папаверина гидрохлорида (ПГ) и дибазола (Дб), а также трехкомпонентные смеси ацетилсалициловой кислоты (АСК), кофеина (Кф) и парацетамола (Пр). Смеси готовили из реактивов х.ч., растворяя точные навески в дистиллированной воде и смешивая необходимые объемы полученных рабочих растворов с добавлением аммиачного буферного раствора или раствора ЫаОН. Щелочная среда растворов была выбрана согласно ранее полученным экспериментальным данным [6, 7]. Всего было приготовлено и проанализировано несколько десятков модельных смесей разного состава (табл. 1). Кроме того, анализировали реальные лекарственные препараты, в состав которых входят те же вещества.
Т а б л и ц а 1
Состав модельных смесей
Число компонентов, p Компоненты Массовое соотношение С, мкг/мл Среда
2 ПГ от 3 : 1 до 1 : 20 от 1,2 до 7,2 0,01 М NaOH, рН = 12
Дб от 2,4 до 24,0
3 АСК от 3 : 1 : 3 до 8,5 : 1 : 8,5 от 7,5 до 12,5 Аммиачный буфер, рН = 10
Кф от 1,5 до 2,5
Пр от 7,5 до 12,5
Часть смесей использовали в качестве стандартных, для создания градуировочных наборов и вычисления по ним коэффициентов. Остальные модельные смеси использовали для проверки результатов анализа. Тестовые наборы включали не менее 10 смесей каждого типа. Концентрации компонентов в смесях тестового набора были выбраны так, чтобы:
- максимальные оптические плотности смесей не превышали 1,0;
- вклады отдельных компонентов в поглощение смеси при любой длине волны внутри выбранного спектрального интервала превышали утроенное стандартное отклонение оптической плотности смеси, рассчитанное для выборки, включающей 3 повторно приготовленные смеси одина-
кового качественного и количественного состава;
- среди смесей тестового набора обязательно присутствовали такие, в которых соотношение компонентов отвечало их соотношению в реальных лекарственных препаратах, например, в препаратах «Папазол-УБФ» и «Аскофен».
Концентрации компонентов в градуировочных смесях выбирали с учетом тех же рекомендаций, но дополнительно учитывали результаты работы программы. Например, следовало подобрать оптимальный градуировочный набор для трехкомпонентной системы АСК : Кф : Пр
с тем, чтобы затем использовать вычисленные коэффициенты для анализа препарата «Аскофен». С учетом соотношения АСК : Кф : Пр в данном препарате концентрации компонентов в растворе номинального состава составляли 10,0 мкг/мл для АСК и Пр и 2,0 мкг/мл для Кф. В программу были введены минимальные и максимальные концентрации компонентов, отличающиеся от номинальных на ± 25 % а также заданы разные объемы градуировочных наборов - от 3 до 10 смесей. В качестве примера работы программы приведем данные по составам двух наборов (табл. 2).
Т а б л и ц а 2
Примеры градуировочных наборов для трехкомпонентной смеси АСК : Кф : Пр
Гоадуировочный набор № смеси Концентрации компонентов, мкг/мл
АСК Кф Пр
1 1.1 12,5 1,5 12,5
1.2 7,5 2,5 10,5
1.3 10,5 2,5 7,5
2 2.1 7,5 2,5 7,5
2.2 12,5 1,5 7,5
2.3 7,5 2,5 7,5
2.4 9,9 1,5 12,5
2.5 7,5 2,5 7,5
Все растворы готовили не менее трех раз, спектры регистрировали на спектрофотометре СФ-2000 в кварцевых кюветах (1,0 см), в спектральном диапазоне от 220 до 300 нм с шагом 0,2 нм. Относительные стандартные отклонения Sr значений оптических плотностей во всех случаях составляли, как правило 0,03-0,05 единиц.
Обработку полученных спектральных данных методом МЛР (вычисление коэффициентов и расчет концентраций) выполняли при помощи программного пакета Microsoft Excel, используя меню Сервис ^ Анализ данных ^ Регрессия (или Поиск решения), как изложено в работе [8].
По результату определения i-го компонента j-ой тестовой смеси вычисляли относительную погрешность его определения (далее Stj), а взятые по модулю погрешности определения каждого компонента усредняли по q смесям:
= q J j • (10)
j=1
Кроме того, для сопоставления точности анализа одних и тех же смесей при использовании разных градуировочных
наборов рассчитывали обобщенную по p компонентам смесей характеристику погрешности анализа (£):
# = (& )2. (И)
Результаты исследования. Рассмотрим результаты, полученные при исследовании бинарных систем. Первоначально анализ смесей методом МЛР вели с использованием коэффициентов, вычисленных по спектрам индивидуальных соединений (прямая градуировка, или 1-ый вариант МЛР). Расчет концентраций ПГ и Дб с применением всего спектрального диапазона не дал хороших результатов -погрешности определения Дб во всех модельных смесях превышали 10-15 % отн. Исключение неаддитивного участка спектра 235-250 нм, приходящегося на область максимального поглощения ПГ, позволило снизить погрешности определения дибазола, но при этом возросли погрешности определения ПГ. Можно сказать, что анализ смесей ПГ и Дб методом МЛР в варианте прямой градуировки по-
зволяет определять оба компонента с погрешностями менее 5 % отн. только в тех смесях, где соотношение ПГ : Дб варьирует от 1:1 до 1:5. Увеличение избытка как ПГ, так и Дб, приводит к возрастанию погрешностей.
Затем к анализу тех же смесей применили 2-ой вариант МЛР - непрямой градуировки. Набор для вычисления коэффициентов был составлен в соответствии с результатами работы программы, и включал только две смеси, с максимальными соотношениями ПГ и Дб, а именно 3 : 1 и 1 : 20. Приведем результаты анализа шести тестовых смесей, полученные по двум вариантам метода МЛР (табл. 3).
Т а б л и ц а 3
Относительные погрешности определения папаверина и дибазола в смесях с применением двух вариантов градуировки метода МЛР
Повторный анализ смесей ПГ и Дб с применением новых коэффициентов привел к следующим положительным результатам: во-первых, снизились погрешности определения компонентов; во-вторых, одновременное определение компонентов с погрешностью не более 5 % отн. стало возможным при любых соотношениях ПГ и Дб, от 3 : 1 до 1 : 20; в-третьих, не потребовалась дополнительная оптимизация спектрального диапазона путем исключения неаддитивного участка спектра.
Т а б л и ц а 4
Зависимость погрешностей определения компонентов в бинарных смесях от числа смесей в градуировочном наборе
Число смесей в градуировочном наборе, m Обобщенная погрешность определения Пг и Дб, t %
Смесь № 4.2 Смесь № 6.2
2 2,3 1,2
3 4,1 4,3
4 4,3 4,3
5 3,3 2,9
6 2,7 2,2
Проверка коэс зфициентов, вычислен-
ных по разным градуировочным наборам, показала, что увеличение m нецелесообразно, так как не приводит к повышению точности результатов. В качестве примера в табл. 4 показано, как меняется обобщенная погрешность определения ПГ и Дб в тестовых смесях № 4.2 и № 6.2 при использовании коэффициентов, вычисленных по разным градуировочным наборам.
Таким образом, можно сказать, что для расчета концентраций ПГ и Дб по спектрам поглощения смесей методом МЛР лучшим оказался 2-й вариант, в котором градуировочный набор состоял всего из двух модельных смесей, выбранных с помощью программы.
Анализ трехкомпонентных смесей АСК : Кф : Пр выполняли только по 2-му варианту МЛР. Градуировочные наборы составляли по данным работы программы. Проверка коэффициентов, вычисленных по наборам, состоящим из 3, 4...10 смесей показала, что в отличие от бинарных систем оптимальные градуировочные наборы в данном случае состояли из пяти и шести смесей. В качестве примера в табл. 5 представлены результаты анализа трех тестовых смесей АСК : Кф : Пр. Как видно, вычисленные по предложенному набору (т = 6) коэффициенты позволили определять все три компонента в тестовых смесях с погрешностями менее 3 % отн. и относительными стандартными отклонениями не более 0,02. Дополнительная оптимизация спектрального диапазона не требовалась.
Анализ лекарственных препаратов. Вычисленные коэффициенты были применены для расчета содержаний активных компонентов лекарственных препаратов «Папазол-УБФ» и «Аскофен» по их спектрам поглощения. В состав «Папазола -УБФ» входят ПГ и Дб, в состав «Аскофе-
№ тесто- вой смеси С, мкг/мл Относительные погрешности 15 1 % отн.
Прямая градуировка Нег град рямая уировка
Дб ПГ 5Дб 5пг 5Дб 5пг
1.2 3,6 3,6 0,2 1,9 2,2 0,6
2.2 3,6 4,8 1,8 2,1 1,8 0,9
3.2 7,2 2,4 6,3 3,4 0,6 0,8
4.2 7,2 4,8 7,4 0,4 1,1 2,0
5.2 14,4 3,6 8,0 1,7 0,7 1,0
6.2 19,2 1,2 6,1 6,7 1,9 2,2
S %,среднее по 6 смесям 5,0 2,7 1,2 1,4
£ % 5,7 1,9
на» - АСК, Кф и Пр. Данные препараты не содержат других компонентов, помимо указанных, которые поглощали бы свет в той же области спектра.
Пробоподготовку и снятие спектров вели в соответствии с разработанными нами ранее методиками [6, 9, 10]. Наряду со 2-ым вариантом метода МЛР, расчеты вели методом Фирордта (МФ) [6, 9], а также методом многомерной градуировки (или проекции на латентные структуры, РЬБ) [10]. Коэффициенты поглощения, применяемые в МФ, были вычислены по спек-
трам индивидуальных соединений. Многомерные градуировки для метода РЬБ были построены с применением программы ипБегашЫег. Для этого использовали обучающие наборы, состоящие из 5 и 7 модельных смесей, соответственно для «Папа-зола- УБФ» и «Аскофена». Результаты определения компонентов в лекарственных препаратах по одним и тем же спектрам поглощения, но с использованием трех вариантов расчета приведены в табл. 6.
Т а б л и ц а 5
Результаты определения АСК, Кф и Пр в тестовых смесях с разным соотношением компонентов
Соотношение АСК:Кф : Пр Компонент С, мкг/ мл Отн. погрешность, 5, % 5,
введено найдено
8,3 : 1 : 8,3 АСК 12,5 12,31 -1,5 0,01
Кф 1,5 1,48 -1,1 0,007
Пр 12,5 12,74 1,9 0,002
3 : 1 : 4 АСК 7,5 7,71 2,8 0,005
Кф 2,5 2,54 1,7 0,006
Пр 10,0 10,28 2,8 0,003
5 : 1 : 5 АСК 11,2 11,26 0,5 0,002
Кф 2,2 2,16 -1,6 0,01
Пр 10,0 10,25 2,5 0,02
Т а б л и ц а 6
Результаты спектрофотометрического определения компонентов лекарственных препаратов (п=3, Р=0,95)
Препарат Компонент Указано на упаковке, мг Найдено, мг
МЛР РЬЯ МФ
«Папазол-УБФ» ПГ 0,030 0,028 ± 0,002 0,029 ± 0,001 0,029 ± 0,007
Дб 0,030 0,031 ± 0,003 0,028 ± 0,001 0,029 ± 0,008
«Аскофен» АСК 0,200 0,207 ± 0,005 0,201 ± 0,005 0,205 ± 0,002
Кф 0,040 0,038 ± 0,002 0,041 ± 0,004 0,037 ± 0,001
Пр 0,200 0,205 ± 0,004 0,201 ± 0,010 0,227 ± 0,002
Как видно, все результаты, полученные методами МЛР и РЬБ, совпадают, сравнение средних по критерию Стью-дента не выявило значимых различий, нет достоверных различий и в сходимости результатов. Несколько хуже оказались результаты, полученные МФ. Содержание Пр в «Аскофене» достоверно завышено по сравнению с указанным на упаковке, а данные по ПГ и Дб характеризуются меньшей сходимостью по сравнению с РЬБ и МЛР.
В заключение следует сказать, что проведенные в данной работе исследова-
ния являются предварительными. Прежде чем рекомендовать вариант непрямой градуировки метода МЛР к широкому использованию в практике спектрофотометрического анализа, исследования необходимо продолжить, в частности, важно установить на смесях разного качественного состава и содержащих разное число компонентов, есть ли корреляция между числом аналитов в смеси и оптимальным числом стандартных смесей в градуировочном наборе. Не менее важной представляется и оптимизация по используемому в расчетах числу длин волн (п).
Наконец, необходимо оценить возможность определения аналитов методом МЛР в присутствии других светопоглощающих компонентов смесей.
Однако даже первые полученные результаты говорят о перспективности применения в анализе сложных смесей варианта непрямой градуировки МЛР; для этого не требуется специальное программное обеспечение - все расчеты можно выполнять в пакете Excel, а оптимизация градуировочных наборов позволяет не только сократить трудозатраты на этапе подготовки градуировки, но и обеспечивает высокую точность анализа.
Авторы благодарят к.ф-м.н. Добровольского С.М. за участие в обсуждении результатов и ценные советы.
ЛИТЕРАТУРА
[1] Erdal D. Linear regression analysis and its applica-
tion to the multivariate spectral calibrations for the multiresolution of a ternary mixture of caffeine, paracetamol and metamizol in tabletsc // J. of Pharmaceutical and Biomedical Analysis. 2003. V. 33. Р. 605-615.
[2] Сутормина Е. Ф. Спектрофотометрическое определение аммиака и оксидов азота в продуктах реакции окисления аммиака // Журн. аналит. химии. 2004. Т. 9. № 4. С. 373-376.
[3] Шелпакова А. С., Масякова Е. Н. Применение
метода множественной линейной регрессии в спектрофотометрическом анализе смесей витаминов / Вестн. Ом. ун-та. 2009. № 2. С. 168172.
[4] Власова И. В., Шелпакова А. С., Масякова Е. Н.
Спектрофотометрический анализ смесей витаминов с применением метода множественной линейной регрессии // Аналитика и контроль. 2009. Т. 13, № 2. С. 86-90.
[5] Отто М. Современные методы аналитической
химии (в 2-х томах). Т. 2. М. : Техносфера. 2004. 281 с.
[6] Власова И. В., Кулакова С. А., Поморцева А. В
Спектрофотометрическое определение кофеина, парацетамола и ацетилсалициловой кислоты при совместном присутствии // За-водск. лабор. 2005. Т. 71. № 9. С.18-20.
[7] Шилова А. В. Выбор условий спектрофотомет-
рического анализа смесей (лекарственных препаратов) с применением математического моделирования: дис. ... канд. хим. наук. Омск. 2008. 131 с.
[8] Власова И. В., Шелпакова А. С., Добровольский
С. М., Фисенко А. В. Новые подходы к применению метода множественной линейной регрессии в спектрофотометрическом анализе многокомпонентных смесей // Аналитика и контроль. 2009. Т. 13. № 3. С. 153-157.
[9] Власова И. В., Шилова А. В. Повышение точно-
сти определения компонентов в двухкомпонентных смесях по методу Фирордта // Вестн. Ом. ун-та. 2006. № 2. С. 53-55.
[10] Шелпакова А. С, Власова И. В., Корягина А. Ю. Спектрофотометрический анализ лекарственных препаратов с применением метода проекции на латентные структуры // 1 Всероссийская конференция «Современные методы химико-аналитического контроля фармацевтической продукции» : тез. докл. М., 2009. С. 169.