Особенности разработки многоэлементных стандартных образцов состава природных сред. Алгоритм обработки выборок данных межлабораторного эксперимента
Е. А. Анчутина, Л. Л. Петров
ЧАСТЬ 2
Рассмотрены примеры и предложен алгоритм обработки выборок данных асимметричного вида распределения. Такая обработка до вычисления аттестуемых значений обеспечивает корректность установления аттестованных характеристик при аттестации стандартных образцов состава природных сред.
В таблицах 1—8 и на рисунках 1—7, иллюстрирующих примеры обработки различных видов распределения данных, представлены:
1) выборка результатов определения содержания элемента/компонента в СО (массовая доля, % или млн1) и примененные методы (таблица сокращений методов приведена в Приложении 1);
2) параметры исходной и конечной (после исключения результатов, недостоверных с нашей точки зрения) выборок: медиана М, среднее арифметическое, мера скошенности Аю [1],
сср - М
определяемая как--100%;
М
3) аттестованное значение и характеристика его погрешности, вычисленные согласно ГОСТ 8.532—2002 [2] для исходной и с исключением одного или нескольких результатов из выборок;
4) медианы результатов, полученные с помощью одного метода;
5) диаграммы распределения результатов для исходных, промежуточных и конечных выборок.
Построение гистограммы — первый шаг профессиональной экспертизы. Гистограмма — частотное попадание результатов в определенные концентрационные интервалы («карманы») — дает возможность оценить симметричность распределения данных и одно- или мно-
гомодальность выборки. Одной из разновидностей графических интерпретаций данных может также служить построение так называемых boxplott («ящика с усами» по [3]). Применение такого представления данных для геоаналитических исследований недавно было описано в [4]. Такой способ дает возможность получения графического описания распределения данных, учитывающего только исходные данные без каких-либо предположений о характере распределения. Построения начинают от медианы выборки данных (М — отмечена незакрашенным прямоугольником), по одну и другую сторону от которой откладываются отрезки, равные значениям медиан упорядоченных рядов данных, от минимального результата до М — М25 — и от М до максимального результата в выборке — М75. Расстояние от М25 до М75 составляет «длину ящика». Длина «уса» составляет 1,5 длины ящика. Все результаты, попадающие в диапазон от конца «уса» до двух длин ящика, считаются «выбросами» (outliers — отмечены сферическими закрашенными точками), вне этого диапазона — экстремальными, крайними (extreme — отмечены ромбовидными закрашенными точками). Медианы выборки результатов, полученных каждым из применяемых методов, оцениваются для того, чтобы выяснить, не дает ли какой-нибудь метод анализа систематическое завышение или занижение результата определения содержания элемента.
В последние годы изменились требования к величинам погрешности аттестации СО. Например, согласно МИ 2335-2003 (п. 5.5.) [5], при реализации внутреннего контроля качества результатов анализа погрешность аттестации применяемого для этих целей СО не должна превышать одной трети от характеристики погрешности результатов анализа. Такое же соотношение рекомендуют и зарубежные разработчики стандартов [6]. Таким образом, если принять во внимание, что максимально допустимая погрешность при количественном химическом анализе на содержание микроэлементов — 30% отн., то погрешность аттестации СО должна быть не более 10% отн.
Поэтому достижение оптимально узкого назначенного значения погрешности становится важным аспектом при разработке СО. Следует отметить, что аттестованное значение некорректно рассматривать отдельно от приписанной характеристики погрешности. То, что в сертификате/паспорте на ГСО представлено двумя числами — аттестованным значением С и погрешностью аттестации ДС — должно восприниматься как концентрационный интервал (С - Дс) + (С + Дс), в пределах которого с вероятностью Р = 95% находится истинное содержание элемента/компонента в образце.
Пример 1. Результаты определения содержания К20 в ГСО состава черного сланца СЧС-1 (табл. 1, 2, рис. 1, а—г).
На гистограмме распределения результатов определения К20 в ГСО СЧС-1 исходной выборки данных (рис. 1, а) можно видеть две моды и два результата, находящихся вне основной массы данных — минимальный и максимальный (табл. 1). Вохр1ой рисунка 1, а дает один экстремальный результат (1,81%) и два «выброса» (по 2,50% каждый). После исключения их из выборки вновь построенный график (рис. 1, б) уже показывает на наличие группы «выбросов», состоящих из четырех минимальных результатов усеченной выборки и одного максимального. Распределение данных для выборки результатов от 3,28% до 4,06% (рис. 1, в) вновь сформировало две группы вне основной массы данных. Конечная выборка (рис. 1, г) — симметричная (Аю = 0) (табл. 2). Аттестованное значение, вычисленное для конечной выборки данных, по значению ближе к пометодной медиане для РФА методик (табл. 2), что может быть аргументом в пользу правильности оценки реального содержания определяемого компонента, так как данный концентрационный диапазон (2—4%) является оптимальным для РФА методик при определении К20 в образцах горных пород. Методики пламенной фотометрии, с помощью которых получено большинство результатов выборки, включают в себя процедуру предварительного разложения
пробы. В данном случае могло иметь место неполное разложение пробы состава черного сланца из-за труднорастворимых органических составляющих. Среди исключенных результа-
тов были два (по 2,50% каждый), полученные АЭС методикой в приближенно-количественном (ПК АЭС) варианте, остальные представлены и в конечной выборке данных (табл. 1, 2).
Таблица 1
Выборка данных МЛЭ для ^ в ГСО СЧС-1
Шифр метода Результат, % Шифр метода Результат, % Шифр метода Результат, %
ИНАА 1,81 ПФ 3,59 ИСП-АЭС 3,77
АЭС 2,50 ПФ 3,65 РФА 3,80
АЭС 2,50 ПФ 3,67 ПФ 3,81
ПФ 2,69 ПФ 3,67 ПФ 3,83
ПФ 2,70 ПФ 3,71 ПФ 3,87
ПФ 2,73 ПФ 3,72 ААС 3,89
ПФ 2,84 РФА 3,72 ПФ 3,89
ИСП-АЭС 3,28 ПФ 3,72 РФА 3,90
ПФ 3,35 РФА 3,73 ПФ 4,02
ААС 3,36 РФА 3,74 ИНАА 4,02
ПФ 3,54 РФА 3,75 ААС 4,06
ПФ 3,54 РФА 3,75 РФА 4,36
ПФ 3,54
Параметры выборки, % Шифр метода (число рез-тов) Пометодная медиана, %
M Сср Аю 3,720 3,514 -0,055 3,730 3,730 0,000 исходная выборка конечная выборка АЭС (2) ИНАА (2) ИСП-АЭС (2) ПФ (20) 2,50 2,92 3,53 3,66
Статистическая обработка по ГОСТ 8.532-2002 РФА (8) 3,75
Аттестованное Характеристика значение, % погрешности, % ААС (3) 3,89
3,733 0,085 3,736 0,053 исходная выборка без 1,81; 2,50; 2,50; 2,69; 2,70; 2,73; 2,84; 4,36
3,730 0,045 без 1,81; 2,50; 2,50; 2,69; 2,70; 2,73; 2,84; 3,28; 3,35; 3,36; 4,02;
Таблица 2
Статистическая обработка выборки данных МЛЭ для ^ в ГСО СЧС-1
1,6 2,0 2,4 2,8 3,2 3,6 4,0 4,4
1,81 2,06 2,32 2,58 2,83 3,09 3,34 3,60 3,85 4,11 4,36
С, %
3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1
3,28 3,40 3,52 3,64 3,76 3,88 4,00
С, %
3,50 3,55 3,60 3,65 3,70 3,75 3,80 3,85 3,90 3,95
Рис. 1. Диаграммы распределения результатов определения содержания К20 (С, %) в ГСО СЧС-1 для выборок данных: а — исходная; б, в — промежуточные; г — конечная
Как можно видеть на представленных Ьох-р1оИ (рис. 1, а—г), данный вид диаграмм дает представление только о части асимметричных результатов и при исключении экстремальных данных и «выбросов» вновь представляет картину с наличием возможных «выпадающих» результатов. В сущности, этот вид графического представления данных есть разновидность статистики и, как любой статистический подход, ограничен налагающимися на него условиями. Но в конечном итоге приводит к тем же выводам, что и при визуальной интерпретации с помощью построения гистограмм и экспертизы исключенных результатов. «Весовая» статистика, используемая в ГОСТ 8.532—2002 [2] при вычислении аттестованных значений, ограничена условием, что в вычислении не участвуют результаты, чьи нормированные отклонения (Ц) больше или равны единице [2, 7]. При исключении таких результатов медиана и, как следствие, нормированные отклонения результатов усеченной выборки могут измениться, и вновь часть результатов может быть исключена из вычисления аттестованного значения. В данном случае для полной выборки шести минимальным результатам были приписаны нулевые веса. При исключении их и повторном вычислении еще одно минимальное значение было признано исключенным. При третьем варианте уже один максимальный результат имел и1 > 1, после исключения которого все оставшиеся результаты дают вклад в величину аттестованного значения. Так что, даже при повторении процедуры «весовой» статистической обработки в конечном итоге могли быть признанными «выпадающими» только результаты, которые на гистограмме рисунка 2, а входили в число двух минимальных мод и максимального результата, стоящих вне основной массы данных.
В процессе «урезания» выборки необходимо сохранять тенденцию к неизменности медианы (см. «Параметры выборки» таблицы 2), так как медиана более стабильная характеристика и при одномодальном распределении всегда более близка к реальному содержанию.
Как можно видеть на представленных Ьохр1ой (рис. 1, а—г), при исключении экстремальных данных и «выбросов» данный вид диаграмм вновь представляет картину с наличием возможных «выпадающих» результатов. В сущности, этот вид графического представления данных есть разновидность статистики и, как любой статичтический подход, ограничен налагающимися на него условиями. Но в конечном итоге может привести к тем же выводам, что и при визуальной интерпретации с помощью построения гистограмм и экспертизы исключенных результатов. «Весовая» статистика, используемая в ГОСТ 8.532—2002 [2] при вычислении аттестованных значений, ограничена условием, что в вычислении не участвуют результаты, чьи нормированные отклонения (Ц) больше единицы или равны ей [2, 7]. При асимметричных и многомодальных видах необходимо определиться с реальным уровнем содержания элемента/компонента, и после исключения недостоверных результатов и приведения выборки к симметричному виду также можно применить такое отсечение для снижения значения погрешности и при выполнении вышеперечисленных условий. Применяя такую систему мер по обработке полученных выборок данных, можно быть уверенным, что, стараясь привести выборку к симметричному виду и тем самым снизить погрешность аттестации, аттестуемая оценка не будет отклоняться от реального значения содержания элемента в образце.
Пример 2. Результаты определения содержания Sr в ГСО состава черного сланца СЧС-1 (табл. 3, 4, рис. 2, а—д).
Максимальный результат 2650 млн1, полученный ПФ методикой (табл. 3), был исключен из выборки как явный промах, не показан на диаграммах и не учитывался при статистической обработке. Гистограмма распределения результатов определения Sr в ГСО СЧС-1 (рис. 2, а) — левоасимметрична (Аю= +0,08). Диаграмма Ьохр1оИ указывает на три экстремальных результата и четыре «выброса». Конечная выборка, полученная последовательным
Таблица 3
Выборка данных МЛЭ для Sr в ГСО СЧС-1
Шифр метода Результат, млн-1 Шифр метода Результат, млн-1 Шифр метода Результат, млн-1
АЭС 100 ИСП-МС 147 РФА 160
АЭС 100 РФА 148 ИСП-МС 164
ААС 123 ИСП-АЭС 150 ИНАА 165
ААС 124 РФА 150 ААС 170
ИСП-МС 124 ИНАА 150 АЭС 180
ИСП-МС 126 ИСП-МС 150 АЭС 182
ААС 130 РФА 150 РФА 186
ИСП-МС 137 РФА 150 АЭС 200
АЭС 140 РФА 152 АЭС 200
ИСП-МС 143 ИСП-АЭС 152 АЭС 226
РФА 144 РФА 154 ИСП-МС 244
РФА 144 РФА 156 ИСП-АЭС 280
РФА 144 РФА 160 РФА 339
РФА 144 РФА 160 ПФ 2650
РФА 146
Таблица 4
Статистическая обработка выборки данных МЛЭ для Sr в ГСО СЧС-1
Параметры выборки, млн-1 Шифр метода (число рез-тов) Пометодная медиана, млн-1
М 150 150 Сср Аю 220 +0,08 исходная выборка 150 0,00 конечная выборка ААС (4) ИСП-МС (8) РФА (17) 127 145 150
Статистическая обработка по ГОСТ 8.532-2002 ИСП-АЭС (3) 152
Аттестованное значение, млн-1 1 50,0 Характеристика погрешности, млн-1 5,0 исходная выборка ИНАА (2) АЭС (8) ПФ (1) 157 181 2650
149,0 3,4 без 100; 100; 200; 200; 226; 244; 280; 339; 2650
150,0 3,5 без 100; 100; 123; 124; 124; 126; 180; 182; 186; 220; 220; 226; 244; 280; 339; 2650
80 100 120 140 160 180 200 220 240 260 280 300 320 340 360
100,0 128,7 157,4 186,0 214,7 243,4 272,1 300,8 329,4
C, млн -1
б -►
120 130 140 150 160 170 180 190
I □
I
120 130 140 150 160 170 180 190
V
\ 10
£ 8
° R
§
v 2 0
120 125 130 135 140 145 150 155 160 165 170 175
a I □ I
• I I
123,0 135,6 148,2 160,8 173,4 186,0
C, млн -1
мО
н о о
н
tr
125
130
135
140
145
150
155
160
165
170
175
130,0 138,0 146,0 154,0 162,0 170,0
С, млн -1
Рис. 2. Диаграммы распределения результатов определения содержания Sr (С, млн-1) в ГСО СЧС-1 для выборок данных: а — исходная; б, в, г — промежуточные; 3 — конечная
усечением согласно рис. 2, а—д, составлена из результатов от 130 млн1 до 170 млн1 и представляет собой симметрично распределенные результаты (рис. 2, д, Аю = 0). Большинство результатов, полученных с помощью АЭС, попали в число исключенных (как минимальных, так и высоких).
Три из них (два из которых минимальные) выполнены ПК АЭС методикой (т.е. с погрешностью измерений до 50% отн.). Применение количественной методики АЭС определения Sr в горных породах включает возможное измерение сигнала по двум линиям, одна из которых используется при ожидаемом уровне содержания Sr до 150 млн1, другая от 150 млн1 и выше. Таким образом, возникает подозрение,
что данное значение (150 млн1) не попадет в оптимальную аналитическую область при регистрации как той, так и другой линии, что вызвало смещение результата.
Более сложные виды распределения результатов — находящиеся возле предела обнаружения и верхнего предела МВИ.
Пример 3. Выборка у верхнего предела МВИ (табл. 5, 6, рис. 3, а—в; 4, а—в).
Определение содержания SiO2 в разрабатываемом СО состава кварца Кв-1 осложнено ошибками, связанными с разбавлением пробы для достижения оптимального для анализа уровня концентрации и насыщением линий при прямых измерениях. Гистограмма (рис. 3, а)
97,82 98,11 98,40 98,68 98,97 99,26 99,55 99,84
С, %
98,41 98,69 98,98 99,26
С, %
99,55 99,84
99,04 99,16 99,27 99,39 99,50 99,62 99,73
С, %
Рис. 3. Диаграммы распределения результатов определения содержания 8Ю2 (С, %) в разрабатываемом СО Кв-1 для выборок данных: а — исходная; б — промежуточные; в — конечная
Таблица 5
Выборка данных МЛЭ для SiO2 в образце Кв-1
Шифр метода Результат, % Шифр метода Результат, % Шифр метода Результат, %
РФА 97,82 СПФ 98,90 СПФ 99,39
РФА 98,00 СПФ 98,94 СПФ 99,40
СПФ 98,02 Г 99,04 Г 99,44
СПФ 98,41 РФА 99,18 РФА 99,44
СПФ 98,59 СПФ 99,18 СПФ 99,50
Г 98,65 СПФ 99,21 СПФ 99,56
Г 98,68 СПФ 99,22 РФА 99,59
СПФ 98,70 Г 99,31 Г 99,61
Г 98,71 РФА 99,31 Г 99,62
СПФ 98,77 ААС 99,32 РФА 99,71
СПФ 98,80 СПФ 99,32 СПФ 99,73
Г 98,83 СПФ 99,33 РФА 99,97
СПФ 98,85 РФА 99,33 СПФ 99,98
СПФ 98,88 РФА 99,36
СПФ 98,90 СПФ 99,38
Таблица 6
Статистическая обработка выборки данных МЛЭ для SiO2 в образце Кв-1
Параметры выборки, %
М Сср Аи
99,22 99,11 -0,0011 исходная выборка
99,35 99,37 +0,0002 конечная выборка
Статистическая обработка по ГОСТ 8.532-2002
Аттестованное Характеристика
значение, % погрешности, %
99,18 0,14 исходная выборка
99,35 0,05 с 99,04% по 99,62%
Шифр метода Пометодная Мм, с wcp, м> А "ю, м
(число рез-тов) медиана, млн-1 % %
Г (9) 99,04 99,0 99,1 +0,0006
СПФ (23) 99,18 99,2 99,1 -0,0010
ААС (1) 99,32 99,4 99,2 -0,0018
РФА (10) 99,35
со со о_ см_ ^ со оо_ сэ сч со_ оо_
К оо оо" оо со" со" о" аз а> от сп о о
0)0)0>0>0)0)0>0)0>0>0)0)т— т—
97,82 98,15 98,48 98,81 99,14 99,47 99,80
С, %
98,02 98,41 98,80 99,19 99,59 99,98
С, %
98,65 98,84 99,04 99,23 99,43 99,62
С, %
Рис. 4. Диаграммы распределения результатов определения содержания SiO2 (С, %) в разрабатываемом СО Кв-1, полученных с помощью: а — РФА; б — СПФ; в — Г
указывает на наличие нескольких мод, причем среднее арифметическое результатов находится в «яме» между двумя модами, и аттестованное значение, вычисленное как среднее взвешенное, близко к Сср.
Для выяснения причин многомодально-сти были построены диаграммы для результатов, полученных с помощью отдельных методов (рис. 4, а—в). Видно, что для результатов РФА (рис. 4, а) существует «левый хвост», сформированный двумя результатами (97,82% и 98,00%); для гравиметрического метода (рис. 4, в) — две моды (по 4 и 5 значений соответственно). Именно за счет результатов СПФ методик (рис. 4, б), давших основной вклад в общую выборку данных (23 результата), были образованы две моды в распределении для полной выборки данных (рис. 3, а). Значение Сср и М для СПФ приходится на «провал» между пиками мод, также как и Сср для результатов исходной выборки, что приводит к явно неверному установлению аттестованного значения, если принять выборку в том виде, в котором она существует изначально. В данном случае, во-первых, была отсечена мода минимальных значений (три результата), а также отброшены четыре самых высоких результата из-за того, что в образце
Кв-1 содержание Ре203 было предварительно установлено не менее 0,4%. Во-вторых, из оставшихся двух мод была выбрана мода высоких значений из-за известного факта занижения результатов возле верхнего предела МВИ [8] вследствие причин, о которых упоминается в начале абзаца. Таким образом, конечная выборка состоит из результатов от 99,04% до 99,62% упорядоченного ряда, и распределение результатов в ней симметричное (даже с легкой левой асимметрией — Аю = +0,0002).
Пример 4. Выборка результатов определения содержания возле предела обнаружения. Результаты определения содержания К20 в образце Кв-1 (табл. 7, 8, рис. 5, 6, 7).
Это пример попытки оценки содержания, находящегося на уровне пределов большинства примененных аналитических методик. Разброс в выборке из 27 результатов составляет три порядка (табл. 7). Гистограмма распределения результатов дает множество небольших по количеству входящих в них результатов мод (рис. 5). Построение Ьохр1ой (рис. 6, а, б), также как и анализ выборки с помощью «весовой» статистики, применяемой в ГОСТ 8.532—2002, не привели к однозначному выводу относительно возможных недо-
Таблица 7
Выборка данных МЛЭ для ^ в образце Кв-1
Шифр метода Результат, млн-1 Шифр метода Результат, млн-1 Шифр метода Результат, млн-1
ПФ 12 РФА 90 ПФ 200
ПФ 14 РФА 100 РФА 220
ИСП-МС 14 РФА 100 ПФ 250
ПФ 24 ПФ 107 РФА 390
ПФ 29 ПФ 120 ПФ 400
ПФ 36 ЯФМ 140 ПФ 600
ПФ 47 РФА 140 РФА 700
ИСП-АЭС 54 ПФ 200 ПФ 790
РФА 85 РФА 200 АЭА 3600
12 62 112 163 213 263 313 363 414 464 514 564 614 665 715 765
C, %
Рис. 5. Гистограмма распределения результатов определения содержания K2O (С, млн-1) в образце Кв-1
-100 0 100 200 300 400 500 600 700 800 900 C, млн-
—i-1-1-1-1-1-1-г-
•...............♦
-50 0 50 100 150 200 250 300 350 400 450 C, млн-1
т-1-1-1-1-1-1-г
□
J_I_I_I_I_I_I_I_L
Рис. 6. Диаграммы Ьохр1ой результатов определения содержания К20 (С, млн-1) в образце Кв-1 для выборок: а — исходная; б — после исключения экстремальных результатов и «выбросов»
стоверных результатов. Оба статистических подхода приводят к одинаковым выводам относительно сомнительных результатов выборки (одного экстремального и двух «выбросов»), после исключения которых наличие таковых не выявляется. Медианы результатов отдельных методов приведены в таблице 8. Гистограммы распределения результатов, полученных РФА и ПФ методиками (рис. 7, а, б), также как и распределения результатов исходной выборки (табл. 8, рис. 5), резко асимметричны.
Таким образом, действия, направленные на достижение симметричности в выборке, анализ диаграмм и параметров выборки данных,
не привели к установлению корректного со всех точек зрения аттестованного значения. В данном случае аналитические методики, разработанные для анализа горных пород, «проваливаются» из-за непривычно низкого содержания большинства определяемых в СО Кв-1 элементов. Поэтому для оценки реального уровня содержания в образце результаты, составляющие выборку, рассматривались на предмет их достоверности. По крайней мере, два результата можно считать надежными по следующим соображениям. Один результат (14 млн-1) получен в аналитической лаборатории Норвежской геологической службы масс-спектрометрическим методом с индуктивно
Рис. 7. Диаграммы распределения результатов определения содержания К20 (С, млн-1) в разрабатываемом СО Кв-1, полученных с помощью: а — ПФ; б — РФА
Таблица 8
Статистическая обработка выборки данных МЛЭ для ^ в образце Кв-1
Параметры выборки, млн-1 Шифр метода (число рез-тов) Пометодная медиана, млн-1
М Сср Аю 120 321 +1,7 исходная выборка 27 29 +0,1 конечная выборка ИСП-МС (1) ИСП-АЭС (1) ПФ (14) 14 54 114
Статистическая обработка по ГОСТ 8.532-2002 ЯФМ (1) 140
Аттестованное Характеристика значение, млн-1 погрешности, млн-1 РФА (9) АЭС (1) 140 3600
115 54 исходная выборка
29 18 только 12; 14; 14; 24; 29; 36; 47; 54
связанной плазмой с лазерной абляцией, т. е. методом без предварительного разложения проб и обладающим достаточно низким пределом обнаружения (<10 млн1). Другой (24 млн1) получен химической лабораторией ИГХ СО РАН методом пламенной фотометрии с предварительным переведением образца в раствор. Предел обнаружения для данной методики составлял 7 млн1. Таким образом, опираясь на эти результаты, за достоверную была принята мода наименьших значений (а это всего 8 результатов). Медиана урезанной выборки равна 26,5 млн1. Вывод о достоверности достигнутого уровня содержания К20 не окончателен и требует дополнительного МЛЭ для установления корректных аттестованных характеристик.
При таких видах распределения медиана уже не отражает близость к истинной оценке содержания. Ситуация, связанная с анализом, близким к верхнему пределу применяемых методик, упрощена естественным знанием, что содержание элемента/компонента не может превышать 100% отн. В данном же случае необходимо определиться с уровнем содержания элемента в образце, так как теоретически может оказаться, что реальное содержание находится за пределом концентраций, установленных в МЛЭ для рассматриваемого элемента, а результаты выборки есть следствие неучтенных систематических смещений, измерение фона или аналитических линий, не принадлежащей анализируемому элементу.
Поэтому для правильного осмысления реального уровня содержания конкретного элемента необходим особый подход, например, коррекция выборок данных, отсекаемых пределом обнаружения большинства примененных методик, как предложено, например, в [9]. Такая коррекция возможна только в случае, когда существует хотя бы остаточное (небольшое количество данных) распределение за пределом обнаружения большинства методик. Когда же распределение отсекается пределом обнаружения, то в этом случае необходимо
и можно лишь обратиться непосредственно к методикам измерения, с помощью которых были получены данные МЛЭ, и провести коррекцию результатов не аттестованной величины и ее погрешности, а каждого результата, давшего вклад в выборку отдельно, как предложено, например, в [10, 11]. Но установление аттестованного значения и его погрешности в таких случаях, скорее всего, невозможно.
Последовательность обработки результатов МЛЭ
1. Рассмотрение протоколов анализа СО на соответствие требованиям организаторов МЛЭ, формирование выборки данных и упорядочивание результатов в порядке возрастания от минимального до максимального (согласно п.п. 4.9—5.2 [2]).
2. Построение и анализ гистограмм/(гисто-грамм и Ъохр1оИ) распределения результатов. Исключение явных «промахов» и экстремальных результатов (отличающихся от уровня содержания основной массы данных на порядок и выше).
3. Оценка параметров выборки — медианы М, среднего арифметического Сср, меры скошенности Аю (или другой характеристики меры асимметрии распределения данных, например, третьего центрального момента случайной величины [12]).
4. В случае симметричного распределения (Аю~ 0) — вычисление аттестованных характеристик согласно [2].
В случае асимметричного распределения:
5. Вычисление медиан результатов, полученных с помощью отдельных методов.
6. Последовательное исключение результатов, находящихся вне основной массы данных до получения симметричного распределения (Аю^ 0). При этом необходимо соблюдать правило: методами, с помощью которых получены результаты, признанные
сомнительными/«выбросами», должны быть представлены и результаты в «усеченной» вы-борке.
Если в процессе симметризации исключаются все результаты, выполненные конкретным методом, то должно существовать обоснованное объяснение возможности систематической погрешности результатов при определении содержания рассматриваемого элемента в образце данного состава, используя конкретную методику.
После каждого цикла исключений сомнительных результатов — повторное построение гистограммы/boxplott и рассмотрение по п. 6.
7. В случае двух- и более модальных распределений необходимо определить реальный уровень содержания элемента/компонента. Критерием выбора могут служить:
1) «экспертный» результат, т. е. результат, полученный методикой с установленными показателями качества при определении содержания рассматриваемого элемента в изучаемых видах проб и пределами обнаружения, достаточными для данного концентрационного уровня (такой пример можно видеть в [13] при установлении аттестованных значений содержания Ag и Au в ГСО СЧС-1 и СЛг-1);
2) в случае отсутствия такой методики — определение содержания с помощью двух методик с принципиально разными физическими основами (как предложено, например, в [14]), например, AAA и ИНАА или ИСП-МС с предварительным переведением пробы в раствор и РФА;
3) результаты, представленные в МЛЭ как «меньше предела обнаружения», также должны быть приняты во внимание при принятии решения о реальном уровне содержания элемента в аттестуемом образце.
Выводы
В каждом случае предварительной экспертизы данных МЛЭ могут возникать свои вопросы, решение которых ведет к окончательным выводам о надежности или невозможности установления аттестованного интервала. Необходимо знание особенностей методик при определении конкретного элемента для данных типов проб. Любые подозрения о систематических погрешностях вследствие несовершенства аналитических процедур (неполноты вскрытия на стадии пробоподготовки, наложений или смещений аналитических линий при измерении сигнала и т. п.) или незнание специфичности состава аттестуемого материала должны быть приняты во внимание, так же как и факты, подтверждающие правильность рассуждений в процессе обработки выборок данных. Тем не менее не вызывает сомнения целесообразность предварительного рассмотрения полученных в МЛЭ результатов для каждого аттестуемого элемента, что может быть сделано по предложенному алгоритму.
Приложение 1
Список сокращенных названий методов
Г — гравиметрия
т — титриметрия
ПФ — пламенная фотометрия
СПФ — спектрофотометрия
АЭС — атомно-эмиссионная спектрометрия
ААС — атомно-абсорбционная спектрометрия
РФА — рентгенофлуоресцентный анализ
ИНАА — инструментальный нейтронно-актива-
ционный анализ
ИСП-МС — масс-спектрометрия с индуктивно свя-
занной плазмой
ИСП-АЭС — атомно-эмиссионная спектрометрия
с индуктивно связанной плазмой
ЯФМ — ядерно-физические методы
Литература
1. Юфа Б. Я. Требования геохимии к метрологическим параметрам аналитических методов и возможности этих методов для геохимических исследований радиоактивных элементов / Юфа Б. Я., Голубев Н. В., Кузнецов А. Г., Губанов Г. Ф. // Радиоактивные элементы в горных породах. Изд-во Наука, Сибирское отделение (Новосибирск), 1975. С. 237—243.
2. ГОСТ 8.532—2002. Стандартные образцы состава веществ и материалов. Межлабораторная метрологическая аттестация. Содержание и порядок проведения работ. Минск, ИПК Изд-во стандартов, 2002. 9 с.
3. Тъюки Дж. Анализ результатов наблюдений. М.: Мир, 1981. 693 с.
4. Зарубина О. В. Представительность геохимического опробования почв глобальной геохимической сети (на примере Приангарья). Диссертация на соискание ученой степени кандидата г-м наук. Иркутск, 2005.
5. МИ 2335-2003. ГСИ. Внутренний контроль качества результатов количественного химического анализа. ФГУП УНИИМ, Екатеринбург, 2003. 80 с.
6. Guide to Quality in Analytical Chemistry. CITAC / Eurachem, 2002. 57 с.
7. Анчутина Е. А. Сравнение алгоритмов статистической обработки данных межлабораторных экспериментов, изложенных в государственных стандартах ГОСТ 8.532—85 и ГОСТ 8.532—2002 /
Анчутина Е. А., Петров Л. Л. // Аналитика и контроль. 2006. Т. 10, № 1. С. 98—105.
8. Кабанова Е. Химический состав стандартных образцов гранита G-1 и диабаза W-1 и методы их определения / Геохимия. Минералогия. Петрография. Итоги науки, М.: ВИНИТИ, 1965. С. 91—144.
9. Петров Л. Л. Закономерности распределения результатов в аналитических интервалах методик выполнения измерений при количественных методах элементного анализа // Заводская лаборатория.
2001. Т. 67, № 12. С. 49—58.
10. Шаевич Р. Б. Экспериментальная проверка способа определения действительных значений малых содержаний компонентов / Шаевич Р. Б., Громов И. Ю., Крейнгольд С. У., Клячко Ю. А. // Заводская лаборатория. 2001. Т. 67, № 10. С. 61—67.
11. Kubala-Kukus A. Influence of detection limit on the measured concentration distribution of trace elements / Kubala-Kukus A., 'Barns D., Braziewicz J., Majewska U., Mrowczynski S. and Pajek M. // X-Ray Spectrometry, 2001. V. 30. P. 348—352.
12. Вентцель Е. С. Теория вероятностей. М.: Академия, 2003. С. 468—476.
13. Petrov L. L. Multielement Standard Samples of Black Shale / Petrov L. L., Kornakov Yu. N., Korotaeva I. Ya., Anchutina E. A., Persikova L. A., Susloparova V. E., Fedorova I. N., Shibanov V. A. // J. Geostandards and Geoanalytical Research. 2004. V. 28, № 1. C. 89— 103.
14. Kane J. S. Traceability in Chemical Analysis / Kane J. S. and Ph. J. Potts // Geostandards Newsletter,
2002. V. 26. С. 171—177.
Авторы
Анчутина Е. А.
Младший научный сотрудник Института геохимии СО РАН.
Направления деятельности: аттестация стандартных образцов состава; установление и гарантия правильности аттестованных характеристик; оптимизация межлабораторных исследований. 26 печатных работ.
Адрес:
664033 г. Иркутск, ул. Фаворского, 1а e-mail:
Петров Л. Л.
Заведующий аналитическим отделом Института геохимии СО РАН, доктор химических наук, академик Метрологической академии. Направления деятельности: аттестация стандартных образцов состава; сопоставление метрологических характеристик аналитических методов и их метрологическое обеспечение; геохимические аспекты аналитики. Более 180 работ.
Адрес:
664033 г. Иркутск, ул. Фаворского, 1а