Научная статья на тему 'Параметрический анализ данных проточной цитометрии'

Параметрический анализ данных проточной цитометрии Текст научной статьи по специальности «Математика»

CC BY
163
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Игла Р. Е.

В работе рассматривается параметрический подход к анализу данных проточной цитометрии. В рамках данного подхода предлагаются две модели и проводится их сравнение с помощью критерия, основанного на анализе "хвостов" функций распределения. Также доказываются некоторые свойства оценок, связанных с этим критерием, в частности показывается, что мощность критерия стремится к единице при росте числа наблюдений в выборке.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Параметрический анализ данных проточной цитометрии»

Численные эксперименты проводились для матричных многочленов степени п — 1 с коэффициентами из Zdxd, где d = 2, 3, а п = 1024, 2048. Для перемножения этих многочленов, с одной стороны, использовалась составленная нами процедура FastMultMatrWithFNTT, а с другой — библиотечная функция перемножения матриц Expand\pl.p2]. Из табл. 2 видно, что, как и в случае скалярных многочленов, использование методов, основанных на применении теоретико-числовых преобразований, позволяет значительно сократить время вычислений при больших п.

Таблица 2

Матричные многочлены

п Порядок d Процедура FastMultMatrWithFNTT Expand \pl.p2]

1024 2 93,547 111,703

1024 3 306,437 353,766

2048 2 540,391 791,125

СПИСОК ЛИТЕРАТУРЫ

1. Буеленко А. С., Икрамов X. Д. Об умножении числовых и матричных степенных рядов // ЖВМиМФ. 2005. 45. № 1. С. 3-7.

2. Krishnamurthy Е. V. Error-free polynomial matrix computations. N. Y.: Springer-Verlag, 1985.

3. Nussbaumer H.J. Fast Fourier transform and convolution algorithm. N.Y.: Springer-Verlag, 1980.

4. Pan V. Y. Structured matrices and polynomials. Boston: Birkhauser, 2001.

5. Каханер Д., Моулер К., Нэш С. Численные методы и программное обеспечение. .4.: Мир, 1998.

Поступила в редакцию 10.04.07

УДК 519.233.32, 519.257 Р.Е. Игла

ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ ДАННЫХ ПРОТОЧНОЙ ЦИТОМЕТРИИ

(кафедра математической статистики факультета ВМиК, e-mail: igla.roman@gmail.com)

В работе рассматривается параметрический подход к анализу данных проточной цитометрии. В рамках данного подхода предлагаются две модели и проводится их сравнение с помощью критерия, основанного на анализе "хвостов" функций распределения. Также доказываются некоторые свойства оценок, связанных с этим критерием, в частности показывается, что мощность критерия стремится к единице при росте числа наблюдений в выборке.

1. Введение. Проточная цитометрия представляет собой технику для быстрого оптического анализа отдельно взятых клеток.

Принципы проточной цитометрии весьма просты. Клетки или ядра поодиночке пересекают сфокусированный световой пучок. Свет определенной длины возбуждает молекулы флуоресцирующих красителей, связанных с различными клеточными компонентами. Свет, испускаемый красителями, собирают с помощью системы линз и зеркал и разлагают на компоненты. Световые сигналы детектируют, преобразуют в электрические импульсы и далее в форму, удобную для компьютерной обработки и хранения информации. В результате процедуры, описанной выше, для каждой частицы получается несколько параметров. Анализируя эти параметры, можно получить некоторую общую информацию о совокупности изучаемых частиц [1].

Одной из важнейших задач проточной цитометрии является определение доли клеток, обладающих определенными свойствами, например содержащих некоторые интересующие нас гены. В данной статье будет рассмотрена одна из таких задач: найти процент CD3-положительных (CD3+), CD8-отрицательных (CD8-) лейкоцитов, содержащих INF7 (интерферон-гамма) или IL-4 (интерлейкин-4) среди всех ( 'l).'l' -. СВ8~-лейкоцитов.

2. Различные подходы к анализу данных проточной цитометрии. Большинство программного обеспечения для анализа данных проточной цитометрии основано на непараметрическом визуальном анализе данных. При анализе используются различные графики, на этих графиках выделяется некоторая область, такая, что значения, соответствующие интересующим нас клеткам, попадают в данную область. Таким образом, искомый процент определяется как отношение значений, попавших в данную область, к общему числу всех клеток. Основной недостаток данного подхода — это требование, чтобы наблюдаемые распределения были многомодальными. В случаях, когда распределение одномодально, нет практически никакой возможности выделить необходимую нам область.

В данной статье мы рассмотрим параметрический подход к анализу данных проточной цитометрии. В параметрическом подходе мы предполагаем, что наблюдаемые данные получены из смеси двух распределений с некоторыми функциями распределения Р(х) и £?(ж). Получаем функцию распределения наблюдаемых данных Н(х) = <хР(ж) + (1 — а)£?(ж). Если предположить, что функции Р(х) и 0{х) принадлежат некоторым семействам, например являются функциями нормального распределения, то можно построить оценки для параметра а, это и будет искомый процент клеток.

Параметрический подход можно применять к более широкому классу распределений — как к многомодальным, так и к одномодальными. Основная проблема параметрического подхода в том, что нам неизвестны функции распределений Р(х) и £?(ж). Если их подобрать, то можно будет оценить параметр смеси а. Далее будут рассмотрены две модели для Р(х) и 0{х) и проведено их сравнение.

3. Математические модели. Рассмотрим следующую модель: от каждой клетки мы наблюдаем некоторый сигнал, этот сигнал представляет собой сумму полезного сигнала и некоторого шума. Шум присущ всем клеткам, полезный сигнал излучают только клетки, обладающие интересующим нас свойством. Будем считать, что шумовой сигнал имеет нормальное распределение с плотностью

1 ((х- а)2

ф(х) = — ехр 1

а для полезного сигнала рассмотрим две модели.

1. Экспоненциальная модель. Полезный сигнал имеет экспоненциальное распределение

/о (ж) = Аехр(^Аж).

Здесь рассматривается плотность только для клеток, содержащих интересующий нас ген.

2. Нормальная модель. Полезный сигнал имеет нормальное распределение

1 ((х- а!)2

/нж) = дг- , ехР

2а'2

Далее, получаем, что плотность полезного сигнала для всех клеток равна д^х) = «/¿(ж) + + (1 — а)6(х), г = 0,1, где 6(х) — дельта-функция. Плотность наблюдаемого сигнала есть свертка плотности шума и полезного сигнала: к(х) = (д$ * ф)(х), г = 0,1. Легко заметить, что для нормальной модели распределение наблюдаемого сигнала есть смесь двух нормальных распределений:

1 ({х-а1)2\ 1 ({х ~ аг)2'

П1{х) = (1 — а)—у=— ехр 1 1 1 ~ — 1

Я!(ж) = (1 -а)Ф ( —

01 / \ £72

где Н\(х) и к\{х) — соответственно функция распределения и плотность для нормальной модели. Здесь а,\ = а, а,2 = а + а', а\ = а, стг = о + с'.

Если вычислить плотность и функцию распределения для экспоненциальной модели, то получим следующие результаты:

Мя) = (1 - а)ехР ((а\Г9а)21 + аАе^-^-^Ф (-\fbxa \ 2 а2 ) \

а

X (X \ А^ _\ 1_л1* ( X (X

Но(х) = Ф - А^ - ае ! "А(г"°'ф ^ - А а) . (1)

Оценивая параметры распределений Р(ж) и С?(ж), получим искомое значение а.

4. Оценка параметров моделей и сравнение модельных распределений. Сравнение моделей будет проводиться на десяти выборках реальных данных, описанных выше. Среди данных присутствуют как многомодальные, так и одномодальные распределения. Параметры моделей будем оценивать двумя способами — методом наименьших квадратов и методом максимального правдоподобия.

Построим следующий критерий для проверки гипотезы о виде распределения. Рассмотрим функции распределения для экспоненциальной и нормальной моделей: На(х) и Н\(х). Если рассмотреть 1п(1 — Но(х)) и 1п(1 — Н\(х)), то при больших значениях х они близки соответственно к линейной и квадратичной функциям. Построим следующий критерий. Возьмем эмпирическую функцию рас-

N

пределения Р*(х) = ^ X) < ж), рассмотрим значения величины Г(х) = 1п(1 — Е*(х)) в скач-

г=1

ках функции ¿^(ж), выберем некоторое пороговое значение жо и оставим только значения Г(х) при х > жо, методом наименьших квадратов подбираем функцию вида 1*(х) = 0о + х0\ + х202 и с помощью Т-критерия |' Т = 02/\!проверяем гипотезу о равенстве коэффициента 02 нулю. Получим,

что гипотеза 02 = 0 будет соответствовать гипотезе Н(ж) = 1?о(ж), а гипотеза 02 ф 0 — гипотезе Н(х) = Н\(х).

Оценивая параметры моделей и применяя к ним описаный выше критерий, получим результаты, показанные в таблице.

лг Т-значение Р- значение

1 0,9437 0,1726

2 1,2451 0,1065

3 1,2050 0,1141

4 0,6289 0,2647

5 0,9242 0,1776

6 0,0840 0,4665

7 0,6699 0,2515

8 1,1251 0,1302

9 1,0811 0,1398

10 0,3138 0,3768

Все Р-значения в таблице получаются больше 0,1, т.е. при любом разумном размере критерия следует принять нулевую гипотезу: наблюдаемые данные лучше описываются экспоненциальной моделью.

Далее в работе будут доказаны асимптотическая несмещенность и состоятельность оценок параметров полиномиальной регрессии 0. Из состоятельности следует, что критическая область описанного выше критерия с ростом объема выборки будет стремиться ко всей числовой прямой. Отсюда несложно получить, что мощность критерия будет стремиться к единице при N ^ оо.

5. Асимптотическая несмещенность и состоятельность оценок параметров регрессии.

Формализуем регрессию Г(ж*) = 0о + х^0\ + Итак, имеем

Г (жг) = 00 + Х^0\ + х\02 + £i, i = 0,...,n, Еег = Е(1*(Хг)) - (00 + Хг0г + х102) = еи соч(еи£э) = соу(1* (жг), I* (Xj ) ). Найдем распределение ошибок е% в условиях верной нулевой гипотезы. Так как

. N

i=l

то, используя дельта-метод [2], получим, что вектор Г = (Г(жо), 1*(х\),..., Г(х„)} имеет приближенно нормальное распределение с математическим ожиданием т = {то, Ш1,..., тп}, где т^ = = 1п(1 — Но(хг)), и матрицей ковариаций £ = {сг^}, где

~ (1-Но(Хг))(1-Но(х^) '

Так как Х\,..., Хп независимы, то

1 (1 - Но(х^)) - (1 - Но(Хг))(1 - Н0 (xj))

= N

(1-Я0(я»))(1-Яо(я,-))

Не ограничивая общности, будем считать, что хо,хг,... ,хп упорядочены по возрастанию. Тогда для г ^ у имеем

Щ{Хг)

а при г > ] оц вычисляется по формуле оц = а^. Таким образом, мы нашли ковариационную матрицу для е.

Получаем следующую задачу линейной регрессии:

Г{Хг) = ва+Хгв1+Х2в2 + £^

где вектор е = {во, £\,..., еп} имеет нормальное распределение с математическим ожиданием е = = {во, 61,..., еп} и матрицей ковариаций

Е =

/ст0 Сто Сто • • ст0\

ст0 СТ1 £71 • ' СТ1

ст0 СТ1 СТ2 ' ' СТ2

\£70 £71 £72

Где £7г =

ЛГ(1-Я0(я»))'

СТ„/

В данной задаче, в отличие от классической задачи линейной регрессии, математическое ожидание ошибок отлично от нуля (Ее^ ф 0), но при Жг —> оо Ее^ —> 0. Покажем это.

Утверждение 1. Если гипотеза На верна, то начиная с некоторого номера г выполняется неравенство

где Ф(и) и ф(и) — функция и плотность нормального распределения соответственно, а ^ = (ж* — а)/а, в = Ха. _

Утверждение доказывается с использованием равенства (1) и неравенства Ф(и) ^ (р(и)/и. Легко видеть, что ^ ^ 0 при х^ ^ оо.

Вернемся к нашей задаче линейной регрессии. Запишем ее в векторном виде. Получим

г = Хв + £,

где

X =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(\ Жо Жд\ 1 Х\ X-

\1

£ =

/ео\

£2

\еп/

Если применить теперь обобщенный метод наименьших квадратов [3], то получим следующую оценку для вектора в:

в = (Х'Е^Х)'1 Х'Т,= в + (Х"£А">: 'г.

где Е — ковариационная матрица для е.

Так как Ее ф 0, то оценки в будут смещенными. Покажем, что жо можно выбрать таким образом, что эти оценки будут асимптотически несмещенными.

Зафиксируем какое-нибудь произвольное значение жо- Получим для любого е$

Ее. <с Аг ( ] <с А

£7 / \ £7

Рассмотрим более общую задачу линейной регрессии

г = Хв + £,

Жо — в

1 I - I = 7о-

где

Y =

/1*(х0)\

1*ы

X =

/ II(xq) /2 (XQ ) fl(xi) ¡2(xi) fl(x2) /2 (X2 )

\fi(xn) h{xn)

fk(xo)\

fk(xi)

fk(x2)

fk(xn)J

e =

/ел

02

\()tj

£ =

Vo )

Выше показано, что \E£i\ < 70, а матрица ковариаций S имеет следующий вид:

S =

/ст0 Сто Сто • • ст0\

ст0 CTl CTl • • CTl

ст0 CTl Ст2 • • СТ2

\0О fl

где Oi = a(xi), аст(ж)ТТ-

СТ„/

нено неравенство

Докажем, что при некоторых ограничениях на функции fi(x), /2(ж),..., Д(ж) и а(х) будет выпол-

EQi-Qi

Теорема. Пусть для задачи линейной регрессии (2) выполняются следующие условия.

1. Функция fi(x) либо является константой, либо строго возрастает.

2.

d (da(x)\ . d (da(x)

lim — ( ,,, ' ) = А > 0 или lim — —I = +оо.

3.

4. Матрица

G =

>00 dx \ dfi(x)

d f а(х) ж-foo dx \fi(x)

( Ii(xq) fl(xi) ~ fl(xQ) Il(x2) - fl(xi)

>00 dx \dfi(x)

Л d / a(x) ,

= А > 0 или lim — —V4 = +00.

>00 dx \fi(x)

(3)

/2 (ж о) /г(ж!) - /2(ж0) /г(ж2) - /г(ж!)

\fi(xn) ~ fi(xn-i) /2(хп) - l2(xn-i)

fk(xq) \

fk(xi) ~ fk(xq) fk(x2) ~ fk(xi)

fk(xn) ~ fk(Xn-l)/

удовлетворяет условию: любая подматрица размерности кхк обратима и для элементов обратной матрицы выполнено неравенство

9зт =

det ^Мз.-.г^!

det Gi1i2___ik_1ik

<

С

1з(хо)'

Тогда найдется такое жо, что будет справедливо неравенство

k2C2da

(4)

Евг - 6i

< 7о

fj(xo)dc

(5)

где di = (cj — Cj-i) \ da = aQ , dc = min dj.

OSCiSCfc —1

Замечание. Если одна из функций /¿(ж) равна константе, то соответствующая ей строчка матрицы G будет состоять из одних нулей, не считая первого элемента. В этом случае в условии 4 рассматриваются только подматрицы, для которых i\ = 0.

Доказательство. Ев - в = E{{X'T1-lX)-lX'T1~lY) - в = {X'T1-lX)-lX'T1~lE£.

Посчитаем обратную матрицу S . Получим

(do + di —di 0 0 0 \

-di di + d2 d>2 0 0

0 -d2 d2 + d3 0 0

0 0 0 dn-1 + dn ~d„

\ 0 0 0 ~d„ dn J

Разобьем доказательство на два этапа. Сначала найдем oi

Х'Т, 1Ее, затем умножим вектор е\ на матрицу П 1 = (x's-

di =

da =

Oi - Oi-i

ст0

эти оценки.

Итак, для компонент вектора е\ получим следующие неравенства:

\еи\ < 7о(|/г(жо)4 - (/¿(жi) - fi{xo))di\ + \Ui{xi) - fi(xo))di - (fi(x2) - fi(xi))d2\ + ...

• • • + \(fi(xn-i) ~ fi(xn-2))dn-1 - (fi(xn) - fi{xn-i))dn\).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Раскроем модули в этом выражении. Покажем, что жо можно выбрать таким, чтобы выражение (хз) - fi(xj-i))dj - (fi(xj+i) - fi(xj))dj+1 было неотрицательно для любого г. Рассмотрим два случая.

1. Пусть /¿(ж) = const. Тогда для любого j верно (fi(x:j) - fi(xj-i))dj - (fi(xj+1) - fi(x:j))dj+1 = 0.

2. Функция fi(x) строго возрастает. Так как xq,xi, ■ ■ ■ ,хп упорядочены по возрастанию и Hq(x) — функция распределения, то o:j < (Jj+i (будем предполагать, что Hq(x) строго возрастает). Имеем

(fi(xj) - fi(xj-i))dj - (fi(xj+1) - fi(xj))dj+1 > 0

aj+1 ~ ai

аз ~ a3-i

/г (^'+1) - /г {Х] ) /г (¡Г,- ) - /< (ж^ _ 1)

Последнее неравенство равносильно тому, что найдется такое число < х' < ж^-, что

d скг(х)

> 0.

dx dfi(x)

> 0.

Аналогично, используя (3), можно доказать, что |/г(жо)^о — (/¿(^1) — /г(жо))^1| ^ 0. Таким образом, получаем, что для компонент вектора е\ будут верны следующие оценки:

\еи\ < 7о/г(жо)4-

Первый этап закончен.

к

Перейдем теперь к вектору е2 = (Х'^~1Х)~1Х'^~1Ее, ^ ^ 1^1 ' \еи\-> ГДе — элементы

1=1

матрицы П-1 = {Х'Т,~1 Х)~1. Вычислим элементы матрицы П = {Х'Т,~1 X):

п

Ыц = о)Л'(жо) + - /г(®р-1))(Л'(®р) ~ /¿(®р-1))-

р= 1

Обозначим дуР = /¿(жр) — /¿(жр_1), дм = /¿(жо). Тогда шц можно записать следующим образом:

п

= ^ ^ dpgipgjp.

Далее,

р=1

|det О

41

1 1 \йеЬЩ '

где матрица Пу получается из матрицы П вычеркиванием г-ш строки и ^'-го столбца. Можно показать, что

с^ О = ^ ^ dj¡1 dj/2 ... dik (det ) ,

det ttij =

£

di1 di2 ... dik_1 det Gili2___ik_i det G:iiii2___ik_i,

где С?^...^ — подматрица матрицы С со столбцами %\%2 .. Ль, а — подматрица матрицы

С со столбцами и вычеркнутой ;/'-й строкой. Это доказывается по индукции по числу

функций к.

Для элементов обратной матрицы имеем

\шгз\ =

|detfi

41

£

OSjil <¿2 <•••<« J;_l Sjn

di^di2 ■ ■ ■ dik_1

det ,/....,

det (l.; .; .;

|detfi|

£ dildi2...dii(detGili2...ii)2

£

^¿2 ■ ■ ■ d%k_1

det i? • • •

£

diidi2 ... dik_1drn(det Gi1i2_^k_im)2

Индекс т в последнем выражении — минимальное целое неотрицательное число, отличное от

¿1, ¿2; • • •, ik-1; 9:,т — эт0 значение элемента матрицы Giii2 ik_lTn с индексом j, т. Применяя неравенство (4), получаем (обозначим dc = min dm)

0<т,<к — 1

ij\ £ к

£

di1 di2 ... dik_1

det G%

£ di1 di2 ... dik_1 drn(det Gi1i2_^k_im)2

OO-il <¿2 <•••<« J;_l Ц.П

kC2

dcfi(xo)fj(xo)'

Итак, справедливо

k in I , ^ kC2fi(xQ)do k2C2d0

\ец\ < 7o 777ГТ77ГТ = 7o"

i= 1

de!г (®0 ) fj (®0 ) fj (®0 ) de '

Теорема доказана.

Вычислим теперь все коэффициенты в формуле (5) для нашей задачи. Итак, здесь

fi(x) = 1, /2 (ж) = ж, /з(ж) = ж2,

5н = О,

5ю = 1,

92г=Хг-Хг-1, д 20 = Ж0, 53г=®?-®?-1, 530 = Жц.

(6)

Значения Ж0,Ж1,... ,хп образуют геометрическую прогрессию с частным А = 10« или А = 10®. Найдем такую константу С, чтобы выполнялось неравенство (4). Итак,

1 О О

G = ж0 Xi — Xi-i хj — Xj-i , где 0 < г < j. „2

•> о

Ж- /у" _ /у" гр^ _ гр^

О % %_1 j j_1 /

Несложно показать, что

И <

А

А(А - I)2'

92з\ <

1

<

ж0А(А — I)2'

И <

А

жо(А — I)2'

ЖдА(А — 1)2(А + 1)' 1 ^ ж2(А^1)2(А + 1)'

Таким образом, получим С = (дД)2 •

Для дальнейших рассуждений нам понадобится следующее утверждение. Утверждение 2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Na( ж) =

Я0(ж)

(1 — Hq(x)) а где |А(ж)| < для ж, большего некоторого xq.

1 в(х-а)

= —е 2 е — 1 + А(ж),

Утверждение доказывается с использованием равенства (1) и неравенства Ф(и) ^ (р(и)/и. Оценим отношение Iй.

Утверждение 3. Пусть 1 < А ^ |, тогда хо можно выбрать таким, что будет выполняться неравенство

4 (вхо(Л2 - 1)

< ехр

dc \ сг

Доказательство. Так как к = 3, то Ia- = max = тах <Tl~o<To, <72~0<Tl ^ • Рассмотрим выражение

в(х2-а) в(х1-а)

о2-о 1 С\е 5 - С\е 5 + А(х2) - А(хi) 1

-=-в^Г)-> гДе Сi = -е 2 •

ао - 1 + А(х0) а

Используя уверждение 2 и условие 1 < А ^ |, легко показать, что

Cíe ( I ] - Cíe ( * } + А(х2) - А(хi) С\е ( * } _ Íв(х2 - х0) в(Хп-а) ^ в(хп-а) — ехР I

Схе i ^1 + А(ж0) Сге * \ °

Теперь, учитывая, что {xi} — геометрическая прогрессия с частным А, получим

02-0i (вха(\2 - 1)

^ ехр 1

а о \ а

Аналогично можно получить, что

О"! - (Т0 (вх0(\ - 1)

- ^ ехр -

а о \ а

Таким образом, получаем

4 (вХ(){\2 - 1)

, < ехр

аг. \ о

Утверждение доказано.

Замечание. Условие 1 < А < | носит технический характер. Если его опустить, то оценки

будут более громоздкими и чуть больше по значению, но это не повлияет на дальнейшие рассуждения.

1 1

Кроме того, А = 10« и А = 10» и удовлетворяют данному неравенству. Подставляя полученные результаты в формулу (5), получаем

Ы < С\7о = С\ - '

где

дх°~аф ^о-а _ '

9А2 /вха(Х2-1У

Cl = xi~\-а-J' J = 1'2'3'

= C2—---C2 = const.

x3~l xp-a ф / xp-a q\ ' 0 <7 V <7 J

Таким образом, если в качестве xq выбрать xq = а + а (-\/21n(N) + Х2в), где N — количество

наблюдений в выборке, то Ев^ — в:1 0 при N оо, т. е. оценки параметров линейной регрессии будут асимптотически несмещенными. Покажем теперь, что эти оценки будут состоятельными. Так как оценки в асимптотически несмещенные, то для их состоятельности достаточно доказать, что дисперсия этих оценок стремится к нулю.

Утверждение 4. Пусть для задачи линейной регрессии (2) выполняются условия 1-4 теоремы тогда для оценок 0 верно неравенство

кС2

СО v(0i,0j)

si

Ndcfi(xQ)fj(xQ)'

(7)

Для доказательства утверждения достаточно заметить, что матрица ковариаций оценок 0 равна £$ = , и воспользоваться неравенством (6) из доказательства теоремы.

Из утверждения 3 получаем, что

1 /0(А жо - о)

— < ехр -

do \ а

Подставляя значения С, к, /¿(жо), а также выражение (8) в неравенство (7), получаем

DO; <

ЗА2

2г —2 еХР

/0(А2жо - а)

о

(8)

(9)

— 1)4Жд

Подставляя в (9) выражение жо = а + а Ы(М) + А20^, получим, что Бв^ —> 0 при N ^ оо. Таким образом, мы доказали, что оценки параметров линейной регрессии являются асимптотически несмещенными и состоятельными.

6. Заключение. Итак, в статье были рассмотрены два подхода для анализа данных проточной цитометрии. Было проведено сравнение непараметрического и параметрического анализа. Параметрический подход можно применять как для многомодальных, так и для одномодальных распределений. Результаты его применения более объективны, нежели для непараметрического подхода. В рамках параметрического подхода были рассмотрены две модели, приведена их иллюстрация и сравнение. Для описания содержания INF7 и IL-4 в клетках лучше подходит экспоненциальная модель. Есть предположение, что содержание CD3 и CD8 в клетках лучше характеризуется нормальной моделью. Это требует дополнительного исследования. В данной статье рассмотрен только одномерный параметрический анализ данных. Поскольку данные являются многомерными, приходилось сначала использовать непараметрический анализ для выделения ('1)3' -. С08~-лейкоцитов, а только затем применять параметрический анализ для INF7 или IL-4. Несмотря на то что в данном непараметрическом анализе не возникает описанных в пункте 2 недостатков (данные многомодальны, и эти моды ярко выражены), интересны многомерный параметрический анализ, возникающие в нем модели и их практическая реализация.

СПИСОК ЛИТЕРАТУРЫ

1. Shapiro Н.М. Practical flow cytometry. N. Y.: Wiley-Liss, 2001.

2. Bickel P. J., Doksum K. A. Mathematical statistics. San Francisco: Holden-Day, 1977.

3. Айвазян С. А., Енюков И. С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985.

Поступила в редакцию 20.03.07

i Надоели баннеры? Вы всегда можете отключить рекламу.