Научная статья на тему 'Инвариантная статистика в масс-спектрометрии'

Инвариантная статистика в масс-спектрометрии Текст научной статьи по специальности «Математика»

CC BY
73
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Научное приборостроение
ВАК
RSCI
Область наук

Аннотация научной статьи по математике, автор научной работы — Леонов И. Е., Трифанов В. Н., Шубин В. М., Нестеров М. М.

В работе рассматриваются времяпролетные и квадрупольные масс-спектрографы. В первом случае измеряется интенсивность излучения, воспринимаемая детектором, как функция времени пролета частиц. Во втором случае измеряется интенсивность как функция напряженности магнитного поля. Обработку этих функций предлагается осуществлять методом инвариантной статистики. Этот метод позволяет получать статистический резонансный спектр интенсивностей как функций параметров порядка и вероятности возбуждения этих резонансов. Линии статистического спектра должны фиксировать частицы определенной массы. Вероятности возбуждения этих линий определяют относительные количества частиц наблюдаемых масс.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Invariant statistics in mass-spectroscopy

The paper considers flight time and quadrupole mass-spectrometers. In the first case, the radiation intensity is measured versus the particle flight time; in the second case, the intensity is measured versus the magnetic field strength. Both functions are supposed to be processed by the invariant statistics technique that enables one to get a statistical resonance spectrum of intensities as a function of the order parameters and the probability of those resonances excitation. The statistical spectrum lines correspond to particles with certain masses. Probabilities of those lines excitation determine relative amounts of particles with the masses measured.

Текст научной работы на тему «Инвариантная статистика в масс-спектрометрии»

ISSN 0868-5886

НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2008, том 18, № 1, c. 60-64

= ИССЛЕДОВАНИЯ, ПРИБОРЫ, МОДЕЛИ -

И МЕТОДЫ АНАЛИЗА

УДК 519.814: 621.384.668.8

© И. Е. Леонов, В. Н. Трифанов, В. М. Шубин, М. М. Нестеров

ИНВАРИАНТНАЯ СТАТИСТИКА В МАСС-СПЕКТРОМЕТРИИ

В работе рассматриваются времяпролетные и квадрупольные масс-спектрографы. В первом случае измеряется интенсивность излучения, воспринимаемая детектором, как функция времени пролета частиц. Во втором случае измеряется интенсивность как функция напряженности магнитного поля. Обработку этих функций предлагается осуществлять методом инвариантной статистики. Этот метод позволяет получать статистический резонансный спектр интенсивностей как функций параметров порядка и вероятности возбуждения этих резонансов. Линии статистического спектра должны фиксировать частицы определенной массы. Вероятности возбуждения этих линий определяют относительные количества частиц наблюдаемых масс.

ВВЕДЕНИЕ

Будем рассматривать времяпролетные и квадрупольные масс-спектрографы. Интенсивность регистрируемого детектором излучения есть функция времени пролета частиц — в первом случае. Во втором случае измеряется интенсивность как функция напряженности магнитного поля.

К обработке этих функций предлагается применить метод инвариантной статистики В.Н. Три-фанова. Этот метод позволяет получать статистический резонансный спектр интенсивностей как функций параметров порядка (времени пролета, напряженности магнитного поля) и вероятности возбуждения этих резонансов. Линии статистического спектра должны фиксировать частицы определенной массы. Вероятности возбуждения этих линий определяют относительные количества частиц наблюдаемых масс.

В основе такой статистики лежат инварианты. Они не зависят от числа независимых событий в наблюдаемой совокупности. Такие инварианты позволяют найти резонансы параметров порядка и вероятности их возбуждения. Более того, возможна стратификация наблюдаемого резонансного спектра. Эта процедура открыта, она является синтезом эвристики и технологии. Конкретные образцы масс-спектрометрических данных дают возможность применять разные эвристические варианты их обработки по технологиям инвариантной статистики. Это должно позволить обнаруживать слабо проявленные зубцы и давать им соответствующую интерпретацию. Далее для каждой страты первого уровня можно построить стратификацию второго уровня. Такая процедура повторяется до тех пор, пока не исчезает асимметрия в резонансных спектрах, т. е. пока спектры не станут дискретно равномерными с максимальной энтропией и нулевой информацией. Такое иерархическое раскрытие резонансного спектра назовем

ультраметрическим [1]. В отличие от фрактальной иерархии, в которой соблюдается принцип подобия распределений на всех уровнях, в ультраметрической иерархии этот принцип подобия нарушается. Каждый уровень обладает своим неповторимым резонансным спектром.

ТЕХНОЛОГИЯ ИНВАРИАНТНОЙ СТАТИСТИКИ

Прежде чем изложить технологию инвариантной статистики [2], договоримся, что состояние процесса характеризуется параметром порядка, а вероятность его реализации характеризуется интенсивностью процесса в этом состоянии. При этом допущении изложим технологию инвариантной статистики.

Состояния системы, наблюдаемые в процессе опыта, группируются вокруг отдельных точек с состояниями xk, k = 1, 2, ..., N. Это означает, что практически вся информация о состояниях системы находится в области этих узловых точек. Континуальная система замещается алгебраической с дискретным множеством состояний xk с их вероятностями pk.

Статистические моменты состояний вплоть до момента требуемого порядка в системе замещенных точек образуют замкнутую систему, что позволяет получить однозначный закон распределения резонансных состояний. Число и значение замещающих точек, а также вероятности их возбуждения, подлежат определению по наблюдаемой выборке масс-спектрограммы.

Рассмотрим эту технологию подробнее. Пусть x — неделимое состояние-событие, а совокупность п таких событий обозначим

п

x = V x .

П ^^

1

Если неделимые события однородны, то такая сумма будет равна

X = пх,

а ее среднее значение

1 = —Ш--3О

°2~ ^ п '

1з=о- ~101Л,

Отклонения от средних равны

14 = О-(151 +1012)Оп - 15О2;

В силу центрирования событий средние значения отклонений равны нулю:

х =< х - Х>= 0, х =< х - X >= 0.

п п п '

Однако дисперсии и более высокие центральные моменты, как правило, не равные нулю, характеризуются нестабильностью и зависят от числа неделимых событий в совокупности. Поэтому для статистического анализа они мало информативны, поскольку информация об организации наблюдаемых событий (их внутренней связности) скрывается этой нестабильностью. В противоположность им статистические инварианты стабильны и информативны. Именно они проявляют внутреннюю организацию наблюдаемых событий.

Первый (диссипативный) инвариант (О), отражающий по существу основную идею инвариантной статистики, определяет масштаб флуктуаций неделимого события и равен отношению дисперсии к среднему значению наблюдаемого события:

О = х2 / х = х2 / х .

п п

Этот инвариант одинаков как для совокупности событий, так и для их неделимой части. Он стабилен и несет информацию о флуктуациях наблюдаемых событий. Для каждой выборки инвариант свой.

Кроме этого инварианта существует счетное множество инвариантов более высоких порядков. Все они также стабильны и информативны. Чем точнее требуется отображать организованность событий, тем больше таких инвариантов требуется привлекать к анализу наблюдаемых процессов. Такие инварианты можно получить, используя разложение моментов высоких порядков по степеням дисперсии наблюдаемых событий.

Формульная запись инвариантов применительно к моментам до шестого порядка включительно имеет вид:

а) по наблюдаемой совокупности событий: О = Оп / хп , Оп = хП (центрировано),

1= ^ 11 = '

б) для неделимых событий:

О = О / х, О = х2 (центрировано),

1 = — 11 = О'

12 =--3О,

13 =--101.О,

3 О

14 = О— (1512 +1012)О - 15О2,

где хп, х — совокупность событий и их неделимая часть; Оп, О — их дисперсии.

Построенные инварианты позволяют определить искомые резонансные спектры неделимых и наблюдаемых событий. Можно получить диадные и триадные спектры неделимых событий. Диадные спектры имеют два резонанса хь х2 (х < х2). Триадные спектры имеют три резонанса хь х3, х2 (х < < х3 < х2). Эти спектры имеют наименьшую информационную избыточность.

По теореме Колмогорова система с нулевой избыточностью имеет размерность 2 < е = 2.718 < 3. Коль скоро триада ближе к то рассмотрим три-адную технологию более подробно.

Исследуем два альтернативных случая:

- в первом среднее значение х3 наблюдаемо, т. е. (х3 = х ), и отклонение от него

х3 - < х3 х > - 0 ;

- во втором — среднее значение не наблюдаемо, когда х3 Ф х , и отклонение от него не равно нулю

х3 =< х3 - х >Ф 0 .

При этом для обоих случаев размах резонансов равен

^^ — ^С 2 .

Случай первый

Функциональное уравнение таково:

4

х = пх .

п

6

хтх(х2 - « х + «г) = 0, х е (х1,0, х2),

для которого

« = х3/х2 = х3/Б = 31, «2 = 32 -+ 3Б .

При т = 2 функциональное уравнение приобретает вид

х5 - « х4 + « х3 = 0, решая которое получаем резонансы

х1 = (31 -у112Б + 432 -3312 )/2 ,

х2 = (31 + 12Б + 432 -3312)/2.

При этом размах резонансов (« = х2 - х^ удовлетворяет условию

«2 = 12Б + 432 - 3312.

Дисперсия неделимого события для х5 равна

Б = 0; Б = (23132 - 33 - 313) /(431).

Число неделимых событий в наблюдаемой совокупности равно п=Бп /Б, где Бп — дисперсия наблюдаемой совокупности событий. Однако если размах наблюдаемой совокупности неизвестен, то число неделимых событий в этой совокупности определяется так

п =

/ (бБп).

вид

х6 - « х5 + « х4 = 0.

Решая его, получаем:

Б = -332 + 42 ,

4

Любое (п) разбиваем на триаду (п = щ + п3 + п2), число таких триад равно

N =

(п + 1)(п + 2) 2

для каждой триады наблюдается резонансная смесь

х = + п3х3 + п2х2 = пх + п2х2, х3 = 0. Вероятность возбуждения такой смеси равна п!

Р = "

ГР^ Р3п3 Р2п2 .

п1 !п3!п2!

Случай второй

В принятых обозначениях получаем необходимое количество функциональных уравнений:

х «1 х + «2 х «3 = 0 , х х + «2 х «3 х = 0 , х х + «2 х х = 0 ,

х «1 х + «2 х «3 х = 0 .

Из первых двух уравнений находим

«3 = х х , «2 = х / х «1 х / х . Включая два последних уравнения, получаем:

Б3 - Л1Б2 + 4Б - А3 = 0,

При т = 3 функциональное уравнение имеет

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А = 2( 32 - 32),

А2 =

А3 =

2(34 -322) + 9(322 -314) -1231 (3132 -./3)

12

\2 /г г2ч

(33 -3132^ - (34 -32)(32 -31) 12 :

+ (332 + 312)2 - (34 - 3133 + 32 (32 - 312))

V 16 6 .

В обоих случаях выбирается то Б, которое лучшим образом удовлетворяет условию

0 < Б < Бп.

После определения Б находим число событий в наблюдаемой совокупности п = Бп / Б.

Вероятность возбуждения резонансов неделимого события выражается так:

(х = х0, Р1 = -Б/(х1«),

(х = 0), р = Р3 = (Б + х:х2)/(х1х2),

(х = х2), р2 = Б/(х25), « = х2 - х1.

х «1 х + «2 х «3 — 0,

« = 33 - 3132 + 6 31Б

1 = 32 - 312 + 2Б '

= 32 - 31«1 + 3Б,

«3 = (31 - «1) Б.

Сначала решаем кубическое уравнение для Б. Из трех корней выбирается тот, который удовлетворяет условию 0 < Б < Бп. Затем находим полиномиальные инварианты («1, «2, «3). После чего решаем кубическое уравнение для резонансов независимого события:

х = (хь х3, х2), х1 < х3 < х2.

При этом размах резонансов будет равен « = х2 - хь Может оказаться, что Б не вписывается в указанные границы. Тогда возможны два случая:

а) О < 0, в этом случае задается п и определяется О = Оп / п;

б) О > Оп, в этом случае принимается О = Оп, п = 1.

Вероятности резонансов неделимого события:

(х = хО, Р1 = (О + х2х3) / ((х1 - х2)(х1 - х3)), (х = х3), Р3 = (О + х^) / ((х3 - х:)(х3 - х2)), (х = х2), Р2 = (О + х^) / ((х2 - х0(х2 - х3)).

Число оболочек резонансов наблюдаемых событий равно п = Оп / О. Это число разбивается на триаду (п = п + п3 + п2), число таких триад равно

н = (п + 1)(п + 2) 2 .

Весь спектр наблюдаемых событий определяется числом таких разбиений в виде смесей

х = пх + п3х3 + п2х2 = пх + п2х2, х3=0.

Вероятности возбуждения каждой такой смеси равны

Таким образом, задача определения резонансного спектра и вероятности возбуждения решена.

Отметим, что резонансные спектры масс-спектрометрии выделяют наиболее вероятные точки сгущения частиц соответствующих масс. Однако наблюдаемые масс-спектрограммы континуальны и, как правило, многомодальны. В этом случае необходимо искать область притяжения каждой резонансной точки сгущения. Это проблема стратификации масс-спектрограмм. Решим ее.

СТРАТИФИКАЦИИ МАСС-СПЕКТРОГРАММ

Рассмотрим два ближайших резонанса наблюдаемой смеси (хк, х^). Каждый из этих резонансов является резонансным центром (точкой сгущения) своей страты («к, «Я+О, в пределах каждой из которых случайно флуктуируют резонансы простых событий х = (хь х3, х2) с вероятностями р = (рь р3, р2). Эти флуктуации создают конусы рассеяния резонансов в пределах своих страт. Это рассеяние в одну сторону характеризуется резонансом х1, а в другую сторону резонансом х2. Граница между стратами определяется точкой пересечения конусов рассеяния соседних страт (обозначим ее «). В результате встречной диссипации резонансов соседних страт получаем «Я = хк + пх2 = хк+\ - пх\. Из этого выражения находим параметр п и, подставляя его значение в исходное уравнение, находим

«к = (х2хк+1 - хх) / « = х2 - х1.

Следует отметить фундаментальную особенность этого выражения. В нем внутренние граничные условия (х1, х2) согласованно сочетаются с внешними граничными условиями, проявленными в наблюдаемых резонансов смесей (хк, х^). Еще отметим, что равномерное распределение получится при условии (х2 = -х]), тогда «к = (хк+\ + хк)/2. Как правило, такая ситуация возникает в статистически равномерных системах с максимальной энтропией. Но в реальных системах, обычно статистически неравномерных, такие случаи практически не встречаются в силу их неинформативности.

Задача поиска резонансных точек сгущения в масс-спектрограммах для частиц с соответствующими массами требует информации. Такая информация присутствует в несимметричных неравновесных системах. Если нет информации, то и нет частиц с наблюдаемыми массами. Поэтому неравномерность распределения является хорошим критерием иерархического поиска частиц в ультраметрических структурах.

Но рассмотренная ситуация для стратификации масс-спектрограмм не единственная. В общем случае между любыми двумя состояниями можно найти равновесную границу по изложенной выше схеме. При таком подходе возникает возможность классификации потока частиц на отдельные классы с установленными границами между этими классами.

СПИСОК ЛИТЕРАТУРЫ

1. Нестеров М.М., Данилов В.Н., Леонов И.Е. Применение ультраметрической адаптивной статистики для анализа структуры масс-спек-трометрического сигнала // Труды Санкт-Петербургского института информатики и автоматизации. 2005. Т. 2, вып. 2. С. 379-385.

2. Трифанов В.Н. Инвариантный статистический анализ и управление в транспортных системах. СПб.: Элмор, 2003. 192 с.

Санкт-Петербургский институт информатики и автоматизации РАН (Леонов И.Е., НестеровМ.М.)

Институт проблем транспорта РАН, Санкт-Петербург (Трифанов В.Н.)

СКБ АП ФГУП "ПО Маяк", г. Озерск Челябинской обл. (Шубин В.М.)

Материал поступил в редакцию 12.11.2007.

INVARIANT STATISTICS IN MASS-SPECTROSCOPY

I. E. Leonov1, V. N. Trifanov2, V. M. Shubin3, M. M. Nesterov1

1 Institute for Computer Science and Automation RAS, Saint Petersburg 2Institute of Transport Problems RAS, Saint Petersburg 3FSUC SKB AP "PO Mayak", Chelyabinsk oblast, Ozersk town

The paper considers flight time and quadrupole mass-spectrometers. In the first case, the radiation intensity is measured versus the particle flight time; in the second case, the intensity is measured versus the magnetic field strength. Both functions are supposed to be processed by the invariant statistics technique that enables one to get a statistical resonance spectrum of intensities as a function of the order parameters and the probability of those resonances excitation. The statistical spectrum lines correspond to particles with certain masses. Probabilities of those lines excitation determine relative amounts of particles with the masses measured.

i Надоели баннеры? Вы всегда можете отключить рекламу.