Научная статья на тему 'Хемометрические алгоритмы в спектрофотометрическом анализе неразделенных смесей органических веществ'

Хемометрические алгоритмы в спектрофотометрическом анализе неразделенных смесей органических веществ Текст научной статьи по специальности «Химические технологии»

CC BY
1179
557
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ХЕМОМЕТРИЧЕСКИЕ АЛГОРИТМЫ / АНАЛИЗ МНОГОКОМПОНЕНТНЫХ СМЕСЕЙ / СПЕКТРОФОТОМЕТРИЧЕСКИЙ АНАЛИЗ / ОТКЛОНЕНИЯ ОТ АДДИТИВНОСТИ / CHEMOMETRICAL ALGORITHMS / ANALYSIS OF MULTICOMPONENT MIXTURES / SPECTROPHOTOMETRIC ANALYSIS / DEPARTURE FROM ADDITIVITY

Аннотация научной статьи по химическим технологиям, автор научной работы — Власова И. В., Вершинин В. И., Шелпакова А. С.

Рассмотрены возможности и ограничения спектрофотометрического анализа многокомпонентных смесей органических веществ без их разделения. Как показывает обзор публикаций за последние 10 лет, новые достижения в этой области связаны с применением хемометрических алгоритмов, особенно метода множественной линейной регрессии (МЛР) и метода проекции на латентные структуры (PLS), а также метода Фирордта (МФ). Наиболее сложными проблемами являются использование хемометрических алгоритмов при неаддитивности светопоглощения смесей (МФ, МЛР) и оптимизация формирования обучающих выборок (PLS). Исследования, проведенные на кафедре аналитической химии ОмГУ в последние годы, вносят существенный вклад в решение этих проблем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по химическим технологиям , автор научной работы — Власова И. В., Вершинин В. И., Шелпакова А. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Chemometrical algorithms in spectrophotometric analysis of organic matters nonseparated mixtures

The article examines possibilities and limitations of spectrophotometric analysis of organic matters multicomponent mixtures without their separation. As the publications' survey for the last 10 years has shown, new achievements in this field are connected with the application of chemometrical algorithms especially multiple linear regression technique (MLR) and latent structure protection technique (PLS) as well as the Firordt method (FM). The most difficult problems are the application of chemometrical algorithms by non-additivity of mixtures' light absorption (MF, MLR) and the optimization of leaning sample formation (PLS). Research conducted by the department of OmSU analytical chemistry in recent years considerably contributes to the solution of these problems.

Текст научной работы на тему «Хемометрические алгоритмы в спектрофотометрическом анализе неразделенных смесей органических веществ»

Вестн. Ом. ун-та. 2010. № 2. С. 14-24.

УДК 543.428.1

И.В. Власова, В.И. Вершинин, А.С. Шелпакова

Омский государственный университет им. Ф. М. Достоевского

ХЕМОМЕТРИЧЕСКИЕ АЛГОРИТМЫ В СПЕКТРОФОТОМЕТРИЧЕСКОМ АНАЛИЗЕ НЕРАЗДЕЛЕННЫХ СМЕСЕЙ ОРГАНИЧЕСКИХ ВЕЩЕСТВ*

Рассмотрены возможности и ограничения спектрофотометрического анализа многокомпонентных смесей органических веществ без их разделения. Как показывает обзор публикаций за последние 10 лет, новые достижения в этой области связаны с применением хемометрических алгоритмов, особенно метода множественной линейной регрессии (МЛР) и метода проекции на латентные структуры (РЬ8), а также метода Фирордта (МФ). Наиболее сложными проблемами являются использование хемометрических алгоритмов при неаддитивности светопоглощения смесей (МФ, МЛР) и оптимизация формирования обучающих выборок (РЬ8). Исследования, проведенные на кафедре аналитической химии ОмГУ в последние годы, вносят существенный вклад в решение этих проблем.

Ключевые слова: хемометрические алгоритмы, анализ многокомпонентных смесей, спектрофотометрический анализ, отклонения от аддитивности.

Многокомпонентные смеси органических веществ (нефтепродукты, лекарственные препараты, пищевые продукты и др.) можно анализировать как с разделением компонентов (ВЭЖХ, ГЖХ, капиллярный электрофорез), так и без него (спектрофотометрия в УФ, видимой или ИК-области, спектрофлуориметрия). Однако относительная значимость этих подходов зависит от типа решаемой задачи [1]. Спек-трофотометрию преимущественно используют для определения единичного вещества (аналита) или группы родственных аналитов. Хроматографические методы применяют и в этих случаях, но их преимущества реализуются в полном объеме при решении задач другого типа

- при одновременном и раздельном определении ряда аналитов, а также при проведении структурно-группового анализа. Так, распространенные способы раздельного определения витаминов в поливитаминных препаратах основаны на применении высокоэффективной жидкостной хроматографии (ВЭЖХ) [2]. Основным способом структурногруппового анализа бензинов стала газо-жидкостная хроматография (ГЖХ) [3]. Хроматографическое разделение компонентов перед их детектированием снимает наиболее сложную проблему молекулярноспектроскопических методов - проблему наложения сигналов разных компонентов. Спектральные наложения особенно опасны при использовании широкополосных и малоинформативных спектров поглоще-

* Обзорная статья написана по материалам докладов на XV конференции «Евроанализ-2009» (Инсбрук, Австрия) и

III Всероссийской конференции «Аналитика России» (Краснодар, 2009).

© И.В. Власова, В.И. Вершинин, А.С. Шелпакова, 2010

ния молекул в УФ, видимой и ближней ИК-области. Решить проблему спектральных наложений в рамках традиционных подходов (поиск селективных фотометрических реагентов, маскирование мешающих веществ) не удалось. Поэтому быстрое развитие хроматографии в 1960-е -1980-е гг. привело к снижению интереса к спектрофотометрии смесей, как и к другим классическим методам их анализа, например, неводному титрованию [4].

К сожалению, хроматографическое разделение некоторых смесей органических соединений может приводить к сдвигу таутомерного равновесия между разными формами аналитов, деструкции аналитов и другим нежелательным эффектам [5], а само разделение иногда идет слишком долго. Поэтому на практике анализ смесей часто ведут без разделения компонентов, используя спектрофотомет-рию. Возможности этого метода в 1990-е гг. существенно выросли благодаря появлению компьютеризированных спектрофотометров и развитию хемометрики [6, 7]. Современные спектрофотометры позволяют быстро и точно измерять свето-поглощение смесей на многих длинах волн, а затем автоматически рассчитывать содержания аналитов по заранее рассчитанным многомерным градуировкам. Математическая обработка больших массивов спектральной информации позволяет достаточно точно рассчитывать содержания аналитов (порознь или суммарно), даже при полном наложении их спектров поглощения [8]. Поэтому многоволновая спектрофотометрия, которая долго была теоретически интересным, но редко используемым на практике методом, в 1990-е гг. стала распространенным способом анализа смесей органических веществ, а теперь начинает успешно конкурировать с хроматографией [9]. Соответственно растет и число публикаций по теоретическим основам и аналитическим возможностям многоволновой спектрофотометрии.

Наиболее простые по составу смеси (2-3 компонента при соотношении их концентраций, близком к 1) можно анализировать по методу Фирордта (МФ), решая соответствующую систему линейных уравнений [8,10]. Для более сложных смесей успешно применяют методы МЛР и РЬБ. В частности, метод РЬБ используют и

для раздельного определения индивидуальных соединений в сложных смесях [11,12], и для оценки общего содержания структурно-родственных соединений (например, полифенолов в зеленом чае [13]), и для структурно-группового анализа нефтепродуктов [9]. Зато очень популярные в 1970-е - 1980-е гг. и теоретически хорошо разработанные алгоритмы разложения сложных спектров на индивидуальные составляющие (см. обзор [10]), для анализа реальных смесей сейчас используют относительно редко. Однако и в этой области появляются интересные методики. Примером могут быть публикации саратовских исследователей [14].

Количественный анализ смесей с использованием многоволновой спектрометрии существенно упрощается при выполнении следующих условий:

а) качественный состав смеси и спектры поглощения компонентов заранее известны;

б) зависимость оптической плотности смеси от концентрации каждого аналита линейна;

в) на любой длине волны наблюдается аддитивность светопоглощения, т. е. оптическая плотность смеси (А^) равна арифметической сумме оптических плотностей исходных компонентов (ХА), измеренных в тех же условиях по отдельности.

Для применения хемометрических алгоритмов условия (а) и (б) не обязательны, хотя их выполнение повышает точность анализа [8, 10]. С другой стороны, не ясно, насколько точные результаты можно получить при невыполнении условия (в).

Неаддитивность светопоглощения реальных смесей была выявлена многими аналитиками, например, при определении суммарного содержания антиоксидантов [15]. Она может быть связана с химическим взаимодействием компонентов (протолиз, окислительно-восстановительные процессы, кинетические эффекты, образование ассоциатов и другие супрамолекулярные явления) [1]. Отме-

тим, что супрамолекулярное взаимодействие органических соединений распространено весьма широко [16], причем его вероятность тем выше, чем больше компонентов входит в состав исследуемой смеси. Возможны и принципиально иные причины неаддитивности, связанные не с химическими процессами, а с системати-

ческими погрешностями оптических измерений. Систематические исследования по неаддитивности светопоглощения разных смесей не проводились, а давние публикации в данной области (А.Ф. Васильев, С.Н. Сагайдачный и др.) имеют в основном теоретико-математический характер [17, 18].

Разработка методов анализа неразделенных смесей органических соединений ведется на кафедре аналитической химии ОмГУ довольно давно [19], а с 2003 г. эти исследования были нацелены на применение хемометрических алгоритмов. Планировалось оценить точность спектрометрического анализа смесей (в том числе неаддитивных) с применением алгоритмов МФ, МЛР и PLS. Следовало выяснить, насколько сложные смеси могут быть проанализированы с применением того или иного алгоритма, как связаны систематические погрешности анализа с отклонениями от аддитивности, какие приемы можно использовать для повышения точности и экспрессности анализа реальных объектов. Результаты работы омских аналитиков применительно к спектрофотометрическому анализу смесей с применением МФ и МЛР изложены в работах, представленных в списке литературы [20-30], в настоящей статье будет дан лишь краткий обзор полученных результатов. Для метода PLS данные будут приведены впервые.

Объектами наших исследований были водные растворы, содержащие смеси лекарственных веществ (ароматических соединений) или витаминов. Смеси содержали от 2 до 6 определяемых компонентов на концентрационном уровне 10-5 -10-7 моль/л. Спектры поглощения растворов в УФ-области регистрировали на спектрометре СФ-2000. Полученные при многократном сканировании спектров данные обрабатывали с помощью программ Microsoft Excel и The Unscrambler Client 9.8, а также с помощью авторской программы Optic-Tablet [20]. Условия (а) и

(б) выполнялись для всех, а условие (в) -лишь для части модельных смесей. При его невыполнении отклонения от аддитивности были невелики (по модулю не более 20 % от оптической плотности смеси), но статистически значимы.

Метод Фирордта. Этот метод, предложенный еще в 1873 г. [4], основан на

решении системы линейных уравнений вида

т

Л = Ё дР • 1 • ’ (1)

і=1

где Аі - оптическая плотность анализируемого раствора при і-ой аналитической длине волны (АДВ), аі] - молярный коэффициент светопоглощения ]-го компонента при і-ой АДВ, с] - молярная концентрация ]-го компонента. Число АДВ (А:) обычно берут равным числу определяемых компонентов смеси (т). Для повышения точности используют переопределенные системы (А > т) [31], вычисляют содержание разных компонентов смеси на разных наборах АДВ [8] и/или применяют производную спектрофотометрию [32]. Как правило, случайные погрешности результатов анализа, проведенного с использованием МФ, не ниже 3 % отн. (по модулю) и быстро растут при увеличении т. Систематические погрешности могут вызываться, в частности, отклонениями от аддитивности светопоглощения:

АЛ = Ае - £А . (2)

В статье И. В. Власовой [21] приведен алгебраический вывод формул, связывающих систематические погрешности (Дсх и Дсу) определения каждого из компонентов бинарной смеси с отклонениями от аддитивности АЛі и АЛ2, выявленными при аналитических длинах волн Аі и А2 . А именно:

Асх = (Ьі АЛ2 - Ь2 АЛі) Г1 , (3а)

АсТ = (а2 АЛі - а1 АЛ2 ) С1 , (3б)

где аі, а2, Ьі, Ь2 - молярные коэффициенты поглощения X и У для 1-й и 2-й АДВ, I

- толщина слоя раствора в кювете, ї = I (а2 Ьі - аі Ь2). Расчеты показывают, что в неблагоприятном случае, когда АЛі и АЛ2 имеют разные знаки, систематические погрешности могут в несколько раз превышать (по модулю) уровень отклонений от аддитивности, если те и другие выражены в % отн. Выведенные формулы подтверждены в ходе компьютерного эксперимента и согласуются с результатами анализа модельных смесей.

Методами аналитической геометрии показано, что относительные погрешности определения компонентов смеси не превысят заданный предел бстах, если отклонения от аддитивности будут меньше некоторого критического уровня ААкрит

[22]. Таким образом, аддитивность све-топоглощения не является обязательным условием применения МФ. Этот метод можно использовать и для анализа неаддитивных смесей, важно лишь, чтобы отклонения от аддитивности были относительно небольшими. Величина ААкрит зависит от ряда факторов - коэффициентов поглощения компонентов и соотношения их концентраций. Как показано в статье В.И. Вершинина и соавторов, помещенной в этом же номере «Вестника ОмГУ», отклонения от аддитивности све-топоглощения при заданном соотношении компонентов можно статистически прогнозировать методами планирования эксперимента [23].

Влияние отклонений от аддитивности может быть уменьшено путем целенаправленного выбора АДВ [20, 21]. Соответствующие рекомендации были использованы для разработки экспрессных методик анализа лекарственных препаратов, содержащих два активных компонента. Примером может быть препарат «Папазол», содержащий папаверина гидрохлорид (ПГ) и дибазол (Дб) [24]. В водном растворе этого препарата возможно образование ассоциата (за счет водородных связей). Оба аналита определяли на одном наборе АДВ - 240 и 280 нм. Такой выбор уменьшает влияние отклонений от аддитивности, хотя и не устраняет его полностью (табл. 1).

Т а б л и ц а 1

Систематические погрешности анализа модельных смесей папаверина и дибазола по методу Фирордта при разном соотношении компонентов

Концентрации, мкг/мл Соотношение концентраций Отклонение от аддитивности, % Отн. погрешности, %

ПГ Дб 240 нм 280 нм ПГ Дб

3,6 3,6 1 : 1 2,5 1,2 0,6 2,8

3,6 7,2 1 : 2 2,6 0,3 2,0 0,6

1,2 4,8 1 : 4 2,9 0,5 5,4 1,0

2,4 24 1 : 10 3,4 2,2 5,5 5,6

1,2 24 1 : 20 5,5 3,2 12,0 3,5

Примечание: здесь и далее относительные погрешности вычислены по средним результатам анализа трех параллельных проб и показаны без учета знака.

Очевидно, изложенный подход к оценке и минимизации систематических погрешностей может быть применен и в более сложных случаях, при одновременном и раздельном определении многих компонентов [25, 26]. Однако на практике необходимый уровень точности (6с < 5 %) достигался лишь для наиболее простых смесей (т = 2-3) и только в узком концентрационном интервале. Дело в том, что величина отклонений от аддитивности зависит от соотношения концентраций компонентов в растворе пробы. Так, при ПГ : Дб = 1:1 (по массе) ДА < ААкрит, и погрешности анализа меньше 5 % отн. Напротив, 20-кратный избыток дибазола приводит к росту ДА и, соответственно, к увеличению систематической погрешности анализа до 10-15 % (табл. 1). Методика экспрессного анализа смесей ПГ и ДБ оказалась достаточно точной лишь для узкого интервала соотношений компонентов - от

2:1 до 1:2. Такие методики не универсальны, но могут быть использованы для контроля производства лекарственных препаратов и других объектов, имеющих заданный номинальный состав.

Метод множественной линейной регрессии, как и метод Фирордта, основан на применении коэффициентов поглощения, заранее вычисленных для множества АДВ. Сильно переопределенную систему линейных уравнений вида (1) решают методом наименьших квадратов [8, 33]. Ввиду меньшего влияния случайных погрешностей МЛР позволяет анализировать более сложные смеси, чем МФ [27]. В тривиальном случае, когда АА = 0, методом МЛР мы могли одновременно определять 4-5 компонентов с погрешностями до 5 % отн. Несоблюдение условия аддитивности приводило к появлению систематической погрешности. Точность результатов анализа падает по мере роста АА, как и в случае

МФ. Для повышения точности можно исключать данные, относящиеся к участкам спектра с достоверно выраженными отклонениями от аддитивности. Можно рассчитывать концентрации компонентов, заранее подбирая для каждого из них такой спектральный интервал, использование которого приводит к более точным результатам анализа. В случае необходимости можно также рассчитывать концентрации некоторых компонентов по разностным спектрам. Совокупность этих приемов мы применяли при определении методом МЛР индивидуальных витаминов в поливитаминных препаратах (премиксах) по спектрам поглощения их растворов в УФ-области [28]. Одновременно удается определить до 5 витаминов. Разработанная методика по своим метрологическим характеристикам примерно соответствует известным методикам хроматографического анализа тех же объектов

[34]. К сожалению, предварительная оптимизация спектральных диапазонов усложняет разработку методик, но не всегда приводит к желаемому результату.

Оптимизация спектральных диапазонов - не единственный способ снижения погрешностей спектрофотометрического анализа, вызванных взаимодействием компонентов исследуемой смеси. Возможен и другой, более перспективный способ, так называемый метод непрямой градуировки. Он был использован нами в работе [29]. А именно, коэффициенты поглощения компонентов (коэффициенты регрессии) можно вычислять не по спектрам растворов индивидуальных соединений (далее - способ 1, прямая градуировка), а по спектрам смесей с точно известным качественным и количественным составом, близким к ожидаемому составу анализируемых проб (способ 2, непрямая градуировка) (табл. 2).

Т а б л и ц а 2

Относительные погрешности определения витаминов в их модельной смеси по методу МЛР с использованием двух способов расчета коэффициентов регрессии

Витамин С, мкг/ мл Относительные погрешности (5, % отн.)

1 способ 2 способ

В1 1,4 9,0 1,4

В2 1,6 8,2 2,7

В5 7,1 5,0 0,5

В6 1,0 10,7 2,5

Реализуя способ 2, при разработке методики анализа нужно создать небольшую обучающую выборку (как в методе РЬБ [35]), зарегистрировать спектры модельных смесей, а затем решить систему линейных уравнений типа (1) относительно коэффициентов регрессии, пользуясь алгоритмом МЛР. Найденные коэффициенты в дальнейшем используются в ходе анализа проб с неизвестным составом. Число модельных смесей в обучающей выборке должно быть не меньше числа аналитов. Поскольку в спектрах смесей из обучающей выборки проявятся такие же отклонения от аддитивности, как и в спектрах анализируемых смесей, применение коэффициентов поглощения, найденных по способу 2, должно уменьшить влияние отклонений от аддитивности. Естественно, непрямая градуировка пригодна и для анализа аддитивных смесей. Примером могут быть данные по 4компонентной смеси витаминов, приве-

денные в табл. 2. Отметим, что при использовании второго способа расчета коэффициентов оптимизация спектральных диапазонов не потребовалась. Способы формирования обучающих выборок в случае непрямой градуировки обсуждаются в статье И.В. Власовой и соавторов в этом же номере «Вестника ОмГУ» [30]. Для оптимизации состава градуировочных смесей, используемых в качестве обучающей выборки, можно применять аппарат матричного анализа.

Рассчитанные вторым способом коэффициенты поглощения применимы и в методе Фирордта (табл. 3). Сравнивая табл. 1 и 3, можно увидеть, что использование второго способа расчета коэффициентов заметно повышает точность анализа неаддитивной смеси папаверина и дибазола. Одновременное определение обоих компонентов с погрешностями до 5 % отн. с помощью МФ возможно даже в присутствии большого избытка дибазола.

Т а б л и ц а 3

Результаты определения папаверина и дибазола в смесях разного состава с применением второго способа расчета коэффициентов

Соотношение концентраций ПГ: Дб Относительные погрешности, б %

МФ МЛР

ПГ Дб ПГ Дб

1 ; 1 0,2 2,5 0,б 0,8

1 і 2 1,9 3,0 1,5 0,5

1 і 4 1,9 3,3 1,2 1,б

1 і 10 1,5 1,б 2,4 1,1

1 і 20 2,9 0,4 1,8 2,2

Метод проекции на латентные структуры (PLS) - один из самых распространенных хемометрических алгоритмов. Его неоднократно использовали и в спектрофотометрическом анализе смесей [11-13, 3б, 37], в том числе в особо сложном случае - при определении показателей структурно-группового состава, когда рассчитывают суммарные содержания родственных соединений c близкими, но не идентичными спектрами. Примером может быть определение суммарных содержаний аренов, нафтенов и парафинов в бензинах [9]. При этом спектры поглощения проб регистрировали в ближней ИК-области на приборе PIONIR 1G24, а математическую модель получали с помощью стандартной программы Quant+, реализующей алгоритм PLS1. Лдекватной оказалась модель, содержащая всего 3 фактора. Среднеквадратичная ошибка калибровки (SEC) для всех показателей состава прямогонных бензинов не превышала G,3 % абс., а результаты анализа проб, не использовавшихся для построения модели, практически совпадали с результатами хроматографического анализа тех же проб по стандартной газохроматографической методике [3].

Как правило, расхождения между результатами анализа по предложенной и стандартной методикам составляют всего 1-2 % отн., что меньше допустимых расхождений между результатами повторных анализов по стандартной методике. Преимуществом новой методики [9] является уменьшение продолжительности анализа

с 4 часов до 10-20 мин, что позволяет применять ее для корректировки технологических процессов. Разумеется, спектрометрическая методика определения показателей структурно-группового состава не может полностью заменить стандартную хроматографическую методику (источник данных для построения калибровочной модели), но может быть полезным дополнением к ней, экспрессным вариантом анализа бензинов известного типа. Использование таких методик представляется перспективным и экономически целесообразным при стабильной технологии производства, четко определенной схеме аналитического контроля и большом числе анализируемых проб одинакового типа. Недостатком методик типа [9] является необходимость заново формировать обучающую выборку и заново рассчитывать математическую модель при переходе к анализу проб другого типа.

Нахождение ковариационной связи между оптическими плотностями смесей на разных длинах волн и концентрациями компонентов теоретически возможно и в том случае, когда светопоглощение смеси неаддитивно. Наши эксперименты показали, что при использовании алгоритма РЬБ 2 точность анализа модельных смесей лекарственных веществ или смесей витаминов по УФ-спектрам слабо зависит от наличия участков неаддитивного светопоглощения, а также от числа одновременно определяемых компонентов

[38]. Мы не выявили статистически дос-

товерного влияния этих факторов. При достаточно большом объеме обучающей выборки погрешности определения компонентов в любых смесях по модулю не превышали 3 % отн. (табл. 4). Оговорим-

ся, что смеси с числом компонентов более 6, с соотношением концентраций более 20:1 и отклонениями от аддитивности, превышающими 20 % отн., пока что не исследовались.

Т а б л и ц а 4

Результаты анализа некоторых смесей по УФ-спектрам с применением метода РЬв

Компоненты Введено, мкг/мл Найдено, мкг/мл 5, % М, %

Смесь лекарственных веществ

Кофеин 2,0 2,0 0,9 1,0

Парацетамол 4,0 4,0 0,9 1,4

Ацетилсалициловая кислота 12,0 12,1 0,8 0,9

Смесь витаминов

В2 3,00 3,06 2,2 0,8

В5 12,00 12,03 0,2 1,1

В6 2,00 2,04 1,8 1,8

Кэ 0,80 0,81 1,8 3,2

В1 1,00 1,01 1,0 3,0

Таким образом, при использовании метода РЬБ обеспечение необходимой точности результатов анализа не является проблемой даже в случае неаддитивных смесей. Более сложной и недостаточно исследованной проблемой метода РЬБ является способ формирования обучающей выборки, обеспечивающий необходимую и достаточную точность модели. В работах, посвященных применению метода РЬБ к спектрофотометрическому анализу смесей, обучающие выборки конструировались различными способами, без детального обоснования этих способов. Считают, что обучающая выборка должна включать как можно больше проб [35], хотя данных, подтверждающих достоверное повышение точности анализа с увеличением объема обучающей выборки, в известной нам литературе нет. Очевидно, способ формирования обучающей выборки должен определяться тем, какие именно смеси предполагается анализировать. Возможны два основных случая:

а) анализ техногенных смесей с известным номинальным составом. Примером могут быть лекарственные препараты, витаминные добавки, косметическая

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

продукция и т. п. Содержание основных компонентов в реальных пробах будет меняться в весьма узких интервалах вокруг номинальных значений;

б) анализ природных и других объектов, не имеющих номинального состава. Содержание любого аналита в соответствующих пробах прогнозировать трудно. Возможно, при переходе от одной пробы к другой оно будет меняться в несколько раз или даже на несколько порядков.

Мы полагаем, что принципы формирования обучающих выборок и требования к их объему в вышеуказанных ситуациях не могут быть одинаковыми. По-видимому, рекомендация «чем больше объем выборки - тем лучше!» справедлива лишь для объектов второго типа. Более простой задачей представляется формирование обучающей выборки для анализа смесей с заданным номинальным составом. Вероятно, в подобных случаях объем обучающей выборки может быть гораздо меньше, а это облегчит и ускорит разработку методик анализа.

Построение многомерных градуировок для анализа смесей номинального состава мы вели с использованием компью-

терной программы The Unscrambler Client 9.8. Проверку построенных градуировок осуществляли путем анализа n тестовых смесей. На основе результатов, полученных для i-го компонента j-ой тестовой смеси, вычисляли относительную погрешность его определения (далее <5у), а полученные данные усредняли по n смесям:

J =П

^1

J =1

(4)

Кроме того, рассчитывали обобщенную по т компонентам смеси оценку погрешностей анализа (§):

§ =

V (8 )2

(5)

г=1

Разумеется, величина § не является погрешностью в строгом метрологическом смысле этого слова, однако использование этой условной характеристики удобно для сопоставления точности анализа одних и тех же смесей в разных условиях, а также при разном объеме обучающей выборки.

Нами установлено, что в случае анализа лекарственных препаратов или поливитаминных композиций (премиксов) по УФ-спектрам погрешности определения аналитов зависят от объема обучающей выборки (А), причем эта зависимость не является монотонной. Увеличение объема выборки вначале резко снижает погрешности анализа, а затем эти погрешности остаются примерно постоянными (рис. 1). Аналогичные зависимости получены для многих других смесей лекарственных веществ и для смесей витаминов. Излом графической зависимости лучше виден, если по ординате откладывать обобщенную характеристику погрешности § (рис. 2). Положение излома зависит от числа одновременно определяемых аналитов. Так, при одновременном определении 2 компонентов смеси в обучающую выборку достаточно включить 5 модельных смесей. Дальнейшее увеличение объема выборки не приведет к заметному повышению точности анализа смеси, а следовательно, нецелесообразно. В случае одновременного определения 6 компонентов необходимо и достаточно включить в обучающую выборку 13 смесей, и т. д. Обобщая полученные данные, можно сделать вывод, что объем обучающей выборки (Л*), необходимый и достаточный для минимизации погрешности анализа смеси

по методу РЬБ, связан с числом определяемых компонентов (т) по формуле:

Л* = 2m+1. (6)

Данная закономерность ранее в литературе не описана, по-видимому, она установлена впервые.

Рис. 1. Зависимость систематических погрешностей определения ацетилсалициловой кислоты (I), кофеина (II) и парацетамола (III) в модельной смеси от объема обучающей выборки

Определяя состав каждой из А* модельных смесей, следует учитывать следующие факторы: 1) номинальный состав исследуемых смесей; 2) ожидаемые отклонения состава реальных проб от номинальных показателей; 3) объем обучающей выборки (Л*). Так, при разработке методик анализа лекарственных препаратов мы предполагали, что содержания компонентов в реальных пробах будут отличаться от номинальных значений не более, чем на 50 %. Смеси из обучающей выборки также должны отвечать этому условию. Желательно, чтобы число модельных смесей с положительными и отрицательными отклонениями содержания каждого компонента от его номинального значения было одинаковым. Если в состав анализируемых проб будут входить некоторые неопределяемые компоненты, поглощающие в той же области спектра, что и аналиты, их необходимо вводить и в модельные смеси.

Составленные по данной схеме обучающие выборки были применены для построения многомерных РЬБ-градуи-ровок

[37]. Анализировались как аддитивные, так и неаддитивные смеси, содержащие 2, 4 или 6 аналитов. Для проверки полученных моделей (градуировок) использовали тестовые смеси, в которых, как и в обучающих смесях, содержания отдельных компонентов отличались от номинальных менее чем на 50 %. Несмотря на то, что число смесей в обучающих выборках было сравнительно

небольшим, для всех компонентов погрешности анализа методом РЬБ по модулю не превышали 3 %.

Рис. 2. Зависимость обобщенной погрешности анализа смесей с разным числом (т) определяемых компонентов от объема обучающей выборки. Значения т указаны на кривых

Интересно было сопоставить результаты анализа одних и тех же смесей с применением модифицированных алгоритмов МЛР и РЬБ (табл. 5). В методе МЛР использовали второй способ расчета коэффициентов, в методе РЬБ - обучаюшде выборки ограниченного объема, причем в обоих случаях использовали один и тот же набор из ЛТ*-модельных смесей. Оказалось, что в случае определения 2-4 анали-тов модифицированный метод МЛР не уступает по точности методу РЬБ, но при увеличении числа одновременно определяемых компонентов до 5-6 более точные результаты получаются с использованием метода РЬБ.

Сопоставление точности анализа модельных смесей с применением МЛР и РЬв

Т а б л и ц а 5

Число аналитов Число тестовых смесей Обобщенная погрешность, £ , %

МЛР РІБ

2 49 1,1 2,7

4 56 1,8 2,8

6 29 11,4 5,7

Полученные данные были использованы при разработке хемометрических методик анализа лекарственных препаратов, содержащих 2-3 аналита, а также 5-и 6-компонентных поливитаминных смесей (премиксов) по их светопоглощению в УФ-области [37-39]. Как и в случае модельных смесей, алгоритм РЬБ позволяет достаточно точно и быстро определять активные компоненты лекарственных и поливитаминных препаратов без их разделения и в присутствии других компонентов. С использованием минимально необходимого числа смесей градуировка может быть построена всего за один рабочий день. Дальнейшие измерения и расчеты занимают не более 30 мин. Внедрение такого рода методик в практику работы контролирующих лабораторий представляется достаточно перспективным делом.

На основании проведенных исследований можно придти к следующим выводам:

1. Многоволновая спектрофотометрия неразделенных смесей в сочетании с хе-мометрическими алгоритмами обработки данных позволяет получать весьма точ-

ные результаты анализа даже при полном наложении спектров поглошения компонентов смеси. Этот экспрессный, хотя и не универсальный, способ анализа в ряде случаев может успешно конкурировать с хроматографией.

2. Взаимодействие компонентов смеси приводит к отклонениям от аддитивности светопоглощения и, соответственно, к систематическим погрешностям анализа, что ограничивает возможности многоволновой спектрофотометрии в анализе смесей.

3. Одновременное спектрофотометрическое определения компонентов смеси с применением хемометрических алгоритмов возможно даже при неаддитивности светопоглощения. Наиболее пригоден в таких ситуациях метод РЬБ, наименее пригоден метод Фирордта, требующий, чтобы отклонения от аддитивности не превышали некоторых критических значений.

4. Систематические погрешности анализа смесей с применением алгоритмов МФ и МЛР возрастают по мере увеличения отклонений от аддитивности. Возможности этих методов в отношении ана-

лиза неаддитивных смесей существенно увеличиваются, если рассчитывать коэффициенты поглощения по спектрам модельных смесей того же качественного состава, что и анализируемые пробы. Оптимальный состав этих смесей может быть рассчитан заранее, с применением матричного анализа. Приемлемым, но менее перспективным способом повышения точности анализа смесей является предварительная оптимизация аналитических длин волн (МФ) или выбор особых спектральных интервалов для определения каждого компонента (МЛР).

5. Основным препятствием для более широкого практического применения метода PLS в анализе неразделенных смесей является длительная и трудоемкая процедура формирования больших обучающих выборок для построения на их основе математических моделей (многомерных градуировок). В случае анализа смесей с известным номинальным составом можно ограничиться обучающими выборками небольшого объема. Для определения m компонентов смеси методом PLS необходимо и достаточно использовать выборку, содержащую (2m + 1) модельных смесей. При формировании обучающих выборок следует учитывать номинальный состав проб и пределы варьирования каждого показателя состава.

ПРИМЕЧАНИЯ

Эта программа предоставлена компанией CAMO Process AS.

ЛИТЕРАТУРА

[1] Власова И. В. Методология спектрофотометри-

ческого анализа смесей органических соединений. Проблема аддитивности светопоглощения / И. В. Власов, В. И. Вершинин, Т. Г. Цюпко // Журн. аналит. химии. 2011. Т. 66. № 1 (в печати).

[2] Арбатский А. П. Определение витаминов в кор-

мовых и пищевых продуктах методом высокоэффективной жидкостной хроматографии / А. П. Арбатский, Г. Н. Афоньшин, В. М. Востоков // Журн. аналит. химии. 2004. Т. 59. № 12. С. 1304-1307.

[3] ASTM D.5134-98. Standard Test Method for De-

tailed Analysis of Petroleum Naphthas through n-Nonane by Capillary Gas Chromatography. Annual book of ASTM Standards. USA. 1998; ТУ 38.301-19-108-97. Фракция бензиновая - сырье для пиролиза. 1997-12-01.

[4] Золотов Ю. А. История и методология анали-

тической химии / Ю. А Золотов, В. И. Вершинин. М. : Академия. 2007. 464 с.

[5] Гиошон Ж. Количественная газовая хроматография для лабораторных анализов и промышленного контроля / Ж. Гиошон, К. Гийе-мен. М. : Мир. 1991. Ч. 2. 836 с.

[6] Родионова О. Е. Хемометрика в аналитической

химии / О. Е. Родионова, А. Л. Померанцев. URL: http://www.chemometrics.ru/materials/artic-les/chemometrics_review.pdf

[7] Эсбенсен К. Анализ многомерных данных / К.

Эсбенсен. Черноголовка : Изд-во ИПХФ РАН, 2005. 160 с.

[8] Берштейн И. Я. Спектрофотометрический ана-

лиз в органической химии / И. Я. Берштейн, Ю. А. Каминский. Л. : Химия, 1986. 200 с.

[9] Вершинин В. И. Определение суммарных содержаний парафинов, нафтенов и аренов по светопоглощению бензинов в ближней ИК-области / В. И. Вершинин, Е. В Коптева, В. В. Троицкий // Заводская лаборатория. Диагностика материалов. 2005. Т. 71. № 11. С. 10-15.

[10] Хоц М. С. Математические методы и ЭВМ в анализе многокомпонентных смесей спектроскопическими методами / М. С. Хоц // Математические методы и ЭВМ в аналитической химии. М. : Наука, 1989. С. 87-99.

[11] Dunmez U. Spectrophotometric multicomponent analysis of a mixture of triprolidine hydrochloride and pseudoephedrine hydrochloride in pharmaceutical formulations by partial least-squares multivariate calibration / U. Dunmez, A. Bozdoрan, G. Kunt, Y. Div // Chem. anal. 2007. V. 52. № 1. Р. 135-140.

[12] Lomillo A. Resolution of binary mixtures of rifa-mucin SV and rifampicin by UV/VIS spectroscopy and partial least-squares method (PLS) / A. Lo-millo, M. Asuncion, O. Dominguez Renedo, J. Ar-cos Martinez // Chem. and Biodivers. 2004. V. 1. № 9. Р. 1336-1343.

[13] Quansheng C. Determination of total polyphenols content in green tea using FT-NIR spectroscopy and different PLS algorithms / Quansheng, Chen, Jiewen Zhao, Muhua Liu, Jianrong Cai, Jianhua Liu // J. of Pharm. Biomed. Analysis. 2008. V. 46. № 3. P. 568-573.

[14] Монахова Ю. Б. Безэталонный спектральный анализ независимых компонент смесей: экспериментальная практика / Ю. Б. Монахова, С. А. Астахов, С. П. Муштакова // Журн. аналит. химии. 2009. Т. 64. № 5. С. 495-505.

[15] Темердашев З. А. / З. А. Темердашев., Т. Г. Цюпко // Аналитика России 2009 : материалы III Всероссийской конференции. Краснодар : КубГУ. 2009. С. 428.

[16] Лен Ж. М. Супрамолекулярная химия. Концепции и перспективы / Ж. М. Лен. Новосибирск : Наука, 1998. 334 с.

[17] Васильев А. Ф. Применение ЭВМ в химических и биохимических исследованиях / А. Ф. Васильев. М. : Химия,1976. С. 246.

[18] Сагайдачный С. Н. Проверка аддитивности многокомпонентных смесей методом корреляционного анализа / С. Н. Сагайдачный, В. Н. Солдатов // Журнал аналит. химии. 1986. Т. 36. № 2. С. 224-232.

[19] Вершинин В. И. Компьютерная идентификация органических соединений / В. И. Вершинин, Б. Г. Дерендяев, К. С. Лебедев. М. : Академкнига, 2002. 197 с.

[20] Власова И. В. Новые подходы к спектрофотометрическому анализу многокомпонентных смесей / И. В. Власова, А. В. Шилова // Вюник Харювського нацюнального ушверситету. Хiмiя. 2007. Вип. 15 (38). № 770. С. 14-22.

[21] Власова И. В. Возможность определения компонентов бинарных смесей методом Фирордта с погрешностями, не превышающими заданный предел / И. В. Власова, В. И. Вершинин // Журн. аналит. химии. 2009. Т. 64. № 6. С. 571577.

[22] Власова И. В. Предельно допустимые отклонения от аддитивности при фотометрическом анализе смесей по методу Фирордта / И. В. Власова, Н. А. Исаченко, А. В. Шилова // Журн. аналит. химии. 2010. Т. 65. № 5. С. 481-487.

[23] Вершинин В. И. Планирование эксперимента как способ изучения отклонений от аддитивности светопоглощения / В. И. Вершинин, М. А. Харькова, И. В. Власова // Вестник ОмГУ. 2010. № 2.

[24] Власова И. В. Спектрофотометрическое определение папаверина гидрохлорида и дибазола в лекарственном препарате «Папазол», таблетки / И. В. Власова, А. В. Шилова, С. В. Рыжова, Е. Н. Одинец // Разработка, исследование и маркетинг новой фармацевтической продукции : сборник научных трудов (Пятигорская государственная фармацевтическая академия). Пятигорск. 2005. Вып. 60. С. 193-194.

[25] Vlasova I. V. Binary mixtures spectrophotometric analysis modeling according Firordt's method / I. V. Vlasova, A. V. Shilova // International Congress on Analytical Sciences ICAS-2006/ Moscow. 25-30 June 2006. P. 534.

[26] Власова И. В. Спектрофотометрическое определение кофеина, парацетамола и ацетилсалициловой кислоты при совместном присутствии / И. В. Власова, С. А. Кулакова, А. В. По-морцева // Заводская лаборатория. 2005. Т. 71. № 9. С. 18-20.

[27] Власова И. В. Спектрофотометрический анализ смесей витаминов с применением метода множественной линейной регрессии / И. В. Власова, А. С. Шелпакова, Е. В. Масякова // Аналитика и контроль. 2009. Т. 13. № 2. С. 86-90.

[28] Масякова Е. Н. Определение водорастворимых витаминов группы В в неразделенных смесях / Е. Н. Масякова, А. С. Шелпакова, А. В. Феллер, И. В. Власова // Разработка, исследование и маркетинг новой фармацевтической продукции : сборник научных трудов (Пятигорская государственная фармацевтическая академия). Пятигорск. 2008. Вып. 63. С. 303-304.

[29] Власова И. В. Новые подходы к применению метода множественной линейной регрессии в спектрофотометрическом анализе многокомпонентных смесей / И. В. Власова, А. С. Шел-пакова, С. М. Добровольский, А. В. Фисенко // Аналитика и контроль. 2009. Т. 13. № 3. С. 153-157.

[30] Власова И. В. Формирование градуировочных наборов для спектрофотометрического анализа многокомпонентных смесей с применением метода множественной линейной регрессии / И. В. Власова, А. С. Шелпакова, А. Н. Нагаев. // Вестник ОмГУ. 2010. № 2.

[31] Гоизодуб А. И. Влияние повторных измерений и расширения набора длин волн на точность многоволновой спектрофотометрии по методу наименьших квадратов / А. И. Гризодуб, Н. Н. Ас-молова, В. П. Георгиевский, Н. В. Белоброва // Журн. аналит. химии. 1989. Т. 44. № 10. С. 1824-1834.

[32] Беликов В. Г. Количественное определение лекарственных веществ в смесях методом производной спектрофотометрии / В. Г. Беликов, Е. Н. Вергейчик, А. С. Саушкина, С. В. Клочков // Современные методы анализа фармацевтических препаратов. Научные труды. Москва. 1988. T. XXVI. С. 7-9.

[34] Huang Xi-ru. Analysis of Naoning pian by multiple leaner regression method / Huang Xi-ru, Zhang Jong-shun, Fu Chao-mei, Lui Wei-na, Zhang Zhen-hua [and ors.] // Spectrosc. and Spectral. Anal. 2001. V. 21. № 6. P. 840-842.

[34] Власова И. В. Определение водорастворимых витаминов в премиксах методом высокоэффективной жидкостной хроматографии / И. В. Власова, Е. Н. Масякова, Л. А. Богданова, Н. Ю. Пермякова // Заводская лаборатория. 2007. Т. 73. № 9. С. 25-27.

[35] Шараф М. А. Хемометрика / М. А. Шараф, Д. Л. Иллмэн, Б. Р. Ковальски. Л. : Химия, 1989. 272 с.

[36] Erdal D. Multivariate analysis of paracetamol, propiphenazone, caffeine and thiamine in quaternary mixtures by PCR, PLS and ANN calibrations applied on wavelet transform data / D. Erdal, D. Baleanu, G. Ioele, M. De Luca, G. Ragno // Journal of Pharmaceutical and Biomedical Analysis. 2008. V. 48. Р. 1471-1475.

[37] Dinz E. Multivariate spectral calibration technique based on regression analysis for the quantitative multiresolution of a ternary mixture containing paracetamol, ascorbic acid and acetylsalicylic acid in effervescent tablets / E. Dinz, A. Uzdemir // Pharmazie. 2004. V. 59. № 9. Р. 700-705.

[38] Власова И. В. Спектрофотометрический анализ смесей органических веществ с применением метода проекции на латентные структуры / И. В. Власов, А. С. Шелпакова, В. И. Вершинин // Зав. лаборатория. Диагностика материалов. 2010 (в печати).

[39] Шелпакова А. С. Спектрофотометрический анализ лекарственных препаратов с применением метода проекции на латентные структуры / А. С. Шелпакова, И. В. Власова, А. Ю. Ко-рягина // I Всероссийская конференция «Современные методы химико-аналитического контроля фармацевтической продукции» : тез. докл. М., 2009. С. 169.

i Надоели баннеры? Вы всегда можете отключить рекламу.