ISSN 0868-5886
НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2009, том 19, № 3, c. 12-20
ТЕОРЕТИЧЕСКИЕ ИССЛЕДОВАНИЯ
УДК 57.087+519.254+519.651
© А. Л. Буляница
МЕТОДЫ ОЦЕНИВАНИЯ ПАРАМЕТРОВ КРИВОЙ ЛОГИСТИЧЕСКОГО РОСТА. Ч. 2. ОЦЕНИВАНИЕ И КОМПЕНСАЦИЯ СИСТЕМАТИЧЕСКОЙ ПОГРЕШНОСТИ ИЗМЕРЕНИЯ. СОПОСТАВЛЕНИЕ ДВУХ РАЗЛИЧНЫХ ФОРМ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ЛОГИСТИЧЕСКОГО РОСТА
Логистический рост является одной из традиционных математических моделей, применяемых для описания многих популяционных процессов. Динамика количества ДНК при проведении полимеразной цепной реакции в реальном времени (ПЦР-РВ) адекватно описывается подобной моделью. В ч. 1 данной работы (см. этот выпуск НП) были описаны алгоритмы построения эффективных оценок параметров и приведено описание характеристик случайных погрешностей предложенных оценок. Задачами ч. 2 статьи является выявление и компенсация систематической составляющей кривой логистического роста и сопоставление двух различных форм (с использованием алгебраической (степенной) и показательной функций) математической модели процесса.
Кл. сл.: полимеразная цепная реакция, логистический рост, систематическая погрешность, приближение функций, итерация
ВВЕДЕНИЕ
Одной из принятых форм информативного сигнала в приборах, реализующих полимеразную цепную реакцию в реальном масштабе времени, является кривая логистического роста
X =-
X *
1 + (B - 1К
(1)
Здесь Хп — величина сигнала на п-м шаге измерения (п = 0, 1,..., N при N = 30-40).
Характеристика зависимости (1), интерпретация роли информативных параметров а0, Х и Хо, обоснование алгоритмов их оценивания, а также оптимизация выбора отсчетов сигнала для повышения эффективности оценок были даны в первой части статьи [1].
В ч. 2 данной работы описаны алгоритмы выявления и компенсации систематических составляющих сигнала. Кроме того, проанализировано другое достаточно распространенное описание процесса логистического роста (2), включающее степенную зависимость
X = — +--———2—
n ^ 1 + (n / п'У
(2)
и установлена связь между параметрами обеих моделей.
КОМПЕНСАЦИЯ НАЧАЛЬНОГО ДРЕЙФА СИГНАЛА ЛОГИСТИЧЕСКОГО РОСТА
Проведение измерений может осуществляться в условиях, когда имеется дрейф базовой линии, интерпретируемый как систематическая погрешность измерения. При этом малому информативному сигналу на начальных отсчетах п, когда количество ДНК еще мало, соответствует значительный фоновый сигнал. Очевидно, что он требует оценивания или/и компенсации.
Однако предварительный анализ кривой (1) позволяет осуществить две простые экспресс-оценки сигнала насыщения Х*.
а) В [1] были сформулированы критерии поиска порогового цикла (точки кривой с наименьшей кривизной). В этой точке информативная составляющая сигнала должна быть равна 0.5Х*.
б) Размах сигнала даже с учетом возможности недостижения уровня насыщения должен примерно соответствовать Х*.
Таким образом, приближенные экспресс-оценки Х могут быть выполнены на основе таких простых рассуждений.
Рассматриваются алгоритмы компенсации фонового сигнала, исходя из предположения, что этот сигнал адекватно аппроксимируется полиномом либо нулевого, либо первого порядка. В этом случае возможны два подхода: аппроксимация или/и компенсация соответствующего тренда ма-
п
лого порядка по Кендаллу—Стьюарту [2], либо оценивание параметров, например, по МНК с последующей экстраполяцией на все отсчеты и компенсацией.
Определение величины фонового сигнала 2п = = X = сош^п) базируется на гипотезе, что X аддитивно суммируется со всеми информативными сигналами, т. е. вместо X« измеряется X« + X . Экспресс-оценивание параметров Х и Х0 кривой (1), а также X возможно на основе следующих предположений.
а) По критерию смены знака второй разности можно определить примерное положение порогового цикла п . При указанном п = п X . = 0.5X* + X .
п
б) Полагая в первом приближении а0 = 1.90, можно оценить В = X* / X0 +1 = а«*.
в) На начальных отсчетах п, когда В / а« >> 1, соответствующий оцениваемый сигнал близок к X; на конечных отсчетах, близких к стадии насыщения, если она достигается, при В / аЩ << 1 величина сигнала должна быть близка к X * + X . Таким образом, можно приближенно оценить величину X и произвести ее компенсацию.
После компенсации X можно исследовать информативный сигнал в тех интервалах отсчетов, когда он достаточно слабо меняется по величине, т. е. при п << п (информативная составляющая мала по величине) или/и п >> п (информативная составляющая практически не меняется из-за достижения насыщения). По нескольким отсчетам строится линейная аппроксимация, оценивается величина параметра положения сигнала и значимость наличия тренда первого порядка (например, по критерию Фишера или аналогичному [3, 4]). Далее линейный тренд экстраполируется на весь диапазон отсчетов п и компенсируется (вычитается) эта составляющая систематической погрешности.
Вышеописанный алгоритм проиллюстрируем простым примером: генерируем кривую (1) с параметрами а0 = 1.950, Х = 2000, Х0 = 1, п = 0, 1,..., 30. Внесем аддитивную случайную центрированную помеху, сгенерированную по равномерному закону в диапазоне [-10; +10], и постоянную систематическую погрешность X = +200. Некоторые значимые отсчеты суммарного сигнала приведены в табл. 1.
Расчет сигнала второй разности по отсчетам 10, 11, 12 дает (-15.9); по отсчетам 11, 12, 13 — (+22.3). Можно убедиться, что по крайней мере в 2 последующих и предшествующих отсчетах знак второй разности сохраняется. Тогда на интервале 11-12 отсчетов наблюдается перегиб. Более точная его локализация с помощью линейной интерполяции по величине второй разности дает п = = 11.41 и, следовательно, Xn* = 1205.1.
Экспресс-оценка В = 1.901141 + 1 « 1516. Отсчетам п = 0.3 соответствуют t > 221 и, следовательно, сигналы, близкие по величине к X. Отсчетам п > 24 соответствуют t < 310-4 и сигнал, практически равный Х + X. С помощью МНК для п = = 0.3 и п = 24.30 строим линейные аппроксимации:
а) для первого участка Xn = 191.08 + 2.90 • п ;
б) для второго участка Xn = 2208.58 --1.24 • (п - 24) либо с соизмеримой точностью Xn = 2204.90 = со^ф) .
Средние значения сигнала на первом и втором участках рассматриваются как X и X * + X . (При этом 0.5Х + Ъ примерно равен 1205.1). Тогда X «191.08 + 2.90 • 1.5 = 195.4 и X* + X « 2204.9. Следовательно, « 2009.5 (значение сигнала при п = п должно быть примерно равно 0.5 • 2009.5 + +195.4 = 1200.2).
Табл. 1. Отсчеты сигнала на участках малого изменения информативной составляющей
п Xn п Xn п Xn
0 191.2 7 295.7 24 2208.6
1 192.0 8 393.4 25 2206.6
2 200.5 9 547.8 26 2208.4
3 198.1 10 764.6 27 2206.2
4 211.5 11 1072.4 28 2199.0
5 222.2 12 1396.1 29 2202.1
6 254.3 13 1697.5 30 2203.2
Оценочное
значение
Хп=X*/ В
« 2009.5 /1516 = 1.33. Тогда на начальных отсчетах логистический рост практически неограничен, носит экспоненциальный характер и осуществляется примерно по закону X0 • аЦ, т. е. при п = 0, 1, 2, 3 получим величины 1.33, 2.53, 4.80 и 9.12 (линейная аппроксимация соответствующего фрагмента сигнала позволяет получить оценку параметра положения, равную 2.56). Таким образом, наклон линейной аппроксимации практически полностью объясняется логистическим ростом, и, следовательно, аддитивной систематической погрешности типа линейного тренда первого порядка не имеется.
СРАВНЕНИЕ ДВУХ МОДЕЛЕЙ КРИВЫХ ЛОГИСТИЧЕСКОГО РОСТА
Кривая логистического роста описывается двумя зависимостями (1) и (2), отличающимися различным числом информативных параметров и типом используемых функций. В (1) входит показательная функция, в (2) — степенная. Существенным представляется вопрос о связи параметров моделей: (X*,Х0, а0) и (Д, Л2, п, р) . Первые два параметра в обеих моделях имеют один и тот же смысл: начальный сигнал Х0 = Л1 и сигнал насыщения X * = Л2. Два оставшихся параметра модели (2) можно связать с параметрами модели (1) на основе сопоставления временного положения и динамики информативного сигнала в области наиболее линейной фазы сигнала, т. е. на цикле п0 = 1п(X* / Х0 -1) / 1п(а0). Имеем п0 >> 1 при достаточно большом соотношении ХУХ0. Приравняв временное положение порогового цикла на основе моделей (1) и (2), а также dXn / &п — скорость роста информативного сигнала в указанной временной области, получим соотношения
(п/ п0) р = (р - 1)/( р + 1)
и X * 1п(а0) / 4 =
Т. к.
(X' -X0)(р2 -1) 4 рп
* р -1
п = пр-
(
| р +1
1 --
2
Л
■ п0. Т. е. харак-
р(р -1) '„
терный временной масштаб п из (2) практически совпадает с величиной порогового цикла п . Тем самым в первом приближении возможно связать параметры обеих моделей кривых логистического роста.
Однако, выбрав в качестве критерия минимизацию среднеквадратичного отклонения обеих моделей на интервале отсчетов п = [0; N], получим, что оптимальные оценки параметров Аь А2, п и р расходятся с названными выше. Это связано, в частности, с тем, что скорости роста степенной и показательной функций различны, и в областях стыковки участков кривой "начальный участок"— "экспоненциальный рост" и "экспоненциальный рост"—"участок насыщения" имеются существенные расхождения обеих кривых.
Имитационное моделирование свидетельству*
ет, что оптимальные значения п0 « п , а остальные оптимальные значения имеют некоторые расхождения с приближенными оценками:
(3)
Д = X0; Л2 = X*; р = п01п(а0).
Задачу оптимизации предлагается решить следующим образом. Указанные три значения параметров (3) рассматриваются как первое итерационное приближение. Необходимые поправки для второго итерационного приближения определим в соответствии с алгоритмом:
а) выпишем функционал качества
Ф( Л, Л2, р) =
=1
X *
1 + (X •/ X-1) • а-
^ +—Л—Л— 1 + (п / п)р
\\
(4)
//
б) вычисляются частные производные первого по-
дФ дФ дФ рядка-;-;- при значениях параметров (3);
сЛ1 6Л2 др
в) после необходимых итерационных приращений АД, АД,, Ар мы должны получить стационарную точку функционала Ф, в которой все частные производные первого порядка должны стать равными нулю (необходимое условие экстремума функции нескольких переменных);
г) приращения частных производных первого порядка в приближении второго дифференциала функции нескольких переменных равны:
а дФ д2Ф ^ д2Ф ^ д2Ф А
А-«-АЛ +-АЛ +-Ар;
дЛ дЛ2 1 дЛ1дЛ2 2 дДдр
X* / X0 >> 1 ^ п >> 1 ^ р >> 1 ^ р « п 1п(а0), А-
11 дФ д2Ф
дЛ2 дЛ1дД2
д2Ф д2Ф
АЛ +-АЛ2 +-Ар;
1 дД2 2 дЛ2др
(5)
дФ д2Ф д2Ф д2Ф
А-«-АЛ1 +-АЛ +-Ар.
др дДдр дрдД др2
При этом производные первого порядка выражаются, как
2
п
п=0
п
fp-2K- х.п) j+v;
ao
— = -2У( х1 - х2 )-
fA n n'i
+ 1 V.
+ V
дЛ,
^ = 2(Л -Л2)У(X' -X2)^1п(п/п<). др ^ 1 ^^ п п' (1+Vn)2
Здесь и далее введены обозначения XI и XI — отсчеты кривых логистического роста в соответствии с моделями (1) и (2), Vn = (п / п*)р .
Производные второго порядка определяются выражениями:
д2ф= 2У-1-• = 2У- ^
¿—^íл,^f\2, я/1 Я/1 ,
8A2
41+V)2' fAi84 +V)2'
f2°- = 2( 4 - Л)У VWni +
^ 1 ^ (1 + уя )3
Vn ln(n / и')
6A16p
+
21 (- X2)
(1 + Vn)
2 '
f °. = 2( A2 - A,)I V =ln(n / n')
8A28p
- 2^ (X1 - X2)
(1 + V, )3
Vn ln(n / n)
(1 + Vn)
2
f2°= 2( A2 - A,)=X V'ln2(n / n')
8p
(1 + V. )4
-2( а - 4)! (X; - XI) ^(1 ^ / п-).
Таким образом, на основе линейной системы уравнений (5) вычисляются необходимые приращения параметров АЛ1, АЛ2 и Ар и второе итерационное приближение решения задачи минимизации функционала качества (4).
ПРИМЕР РАСЧЕТА ОПТИМАЛЬНО СОГЛАСОВАННЫХ ПО ПАРАМЕТРАМ МОДЕЛЕЙ (1) И (2)
Рассмотрим кривую (1) с параметрами Х = = 2000, Х0 = 0.2, а0 = 1.94. Первое итерационное приближение параметров степенной модели (2): Л = 0.2; Л2 = 2000; п = 13.898; р = 9.210 (п* вычислен [1], как 1п(X*/ X0 - 1)/1п(а0) = = 1п(9999) / 1п(1.94)). Дисперсию расхождения моделей можно оценить, как Ф(Л1, Л2, р) / (N +1 - 3),
где Ф определен согласно (4), поскольку выборка содержит (N + 1) отсчет и 3 оцениваемых параметра. Вычисление частных производных и решение системы (5) для определения приращений параметров позволяет получить новое итерационное приближение: А = 0.2 + 17.001 = 17.201; А2 = 2000 + + 17.369 = 2017.369; р = 9.210 + 0.043 = 9.253. (Построение 10 итераций в соответствии с алгоритмом, встроенным в пакет ORIGIN 6.1, позволяет получить весьма близкие оценки: А1 = 17.198, А2 = = 2017.290, р = 9.256). Среднеквадратичное отклонение моделей при первой итерации значений параметров равно 25.06; при втором (уточненном) наборе параметров — 17.13. Взяв модель (1) с X = = 3000; X0 = 0.05; a0 = 1.95, т. е. условия более позднего достижения порогового цикла (n* = = 16.474) и более эффективной ПЦР, в качестве оптимальных параметров по описанной выше методике получим: Ai = 16.691; А2 = 3028.084; р = = 10.945. Реализация итерационной процедуры по алгоритму ORIGIN дает весьма близкие оценки А1 = 16.601; А2 = 3028.149; р = 10.941. Тем самым подтверждается высокая точность решений задачи оптимизации "пересчета" параметров модели на основе итерационного приближения первого дифференциала и матрицы Гессе (т. е. системы (5)).
ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ ВЫПОЛНЕНИЯ ЦИКЛА АЛГОРИТМОВ
ОБРАБОТКИ КРИВЫХ ЛОГИСТИЧЕСКОГО РОСТА
В качестве модельного сигнала генерируем последовательность отсчетов п = 0,., 34 при заданных параметрах: Х = 3200, Х0 = 0.2, а0 = 1.92. Далее аддитивно добавляем сгенерированную равномерно распределенную центрированную случайную величину в диапазоне [-16; +16] (оговоренное ранее условие Х / 8 > 120 выполнено). В качестве систематической погрешности задается линейный тренд первого порядка 250 + 2.0 • п . График сгенерированной зашумленной кривой и ее значимых фрагментов представлен далее.
На рис. 1 приведена форма кривой логистического роста с наложенными систематической и случайной погрешностями измерения. На графике схематически выделены участки: 1 — фаза начального роста, соответствующая малому количеству ДНК; 2 — наиболее линейный участок роста в области порогового цикла (точки перегиба); 3 — участок насыщения.
Далее проиллюстрированы основные стадии обработки указанного информативного сигнала. Заметим, что идеальной кривой логистического роста (1) соответствуют В = 3200 / 0.2 = 16000 и п = 1п(16000 - 1) / 1п(1.92) = 14.840.
Рис. 1. Схематическое представление информативного сигнала в соответствии с моделью логистического роста. Пояснения см. в тексте
Табл. 2. Величина сигнала на этапе насыщения логистической кривой
п Xn п Xn п Xn
23 3440.4 27 3456.1 31 3458.9
24 3438.3 28 3457.0 32 3451.8
25 344.1 29 3464.7 33 3471.4
26 3455.0 30 3447.5 34 3467.2
Табл. 3. Величина сигнала на начальном этапе кривой логистического роста
п Xn п Xn п Xn
0 195.6 3 197.7 6 214.8
1 193.3 4 217.2 — —
2 205.9 5 229.6 — —
Первый этап обработки предполагает выявление систематической погрешности, ее компенсацию и грубую оценку основных параметров кривой логистического роста.
Анализируем динамику второй разности исходного сигнала: при п = 12—14 эти разности положительны (при п = 14 равна +86.07), далее при п = 15—17 происходит смена знака (при п = 15 величина второй разности -17.08). Таким образом, на интервале 14-15 отсчетов находится точка перегиба (пороговый цикл). Методом линейной интерполяции определяется точка перехода второй разности через ноль: п = 14.83 и Хп* = 1834.4.
В предположении формы графика систематической погрешности, как линейной, тренд первого
порядка X,,* примерно соответствует 0.5Х* + а0 + + а^п*. Эффективность ПЦР априорно полагаем средней, т. е. а0 = 1.90 . Т. к. а^ = 1.98 « 170, то отклонение от порогового цикла на +8 тактов соответствует стадии насыщения сигнала (информативная составляющая практически совпадает с Х*); участок, предшествующий пороговому циклу на 8 тактов и более, — начальный участок экспоненциального роста (полезная составляющая сигнала близка к X0 • аЩ). На основе временного положения порогового цикла получаем примерное отношение Х / Хс = = 1+1.914'83 = 13610.
В табл. 2 и 3 представлены значения фрагментов сгенерированного информативного сигнала —
на этапе насыщения (отсчеты 23-34) и на начальном этапе (отсчеты 0-6).
На основе МНК данные таблицы аппроксимированы трендом первого порядка 3394 + 2.13«, что иллюстрируется на рис. 2. Таким образом, сумма X* + а0« 3394 при а! « 2.13.
Аппроксимация Xп = /(п) данных табл. 3 по МНК дает зависимость 192.6 + 5.04 • п . Можно сделать следующие выводы:
а) систематическая погрешность содержит постоянное смещение (а0 « 190);
б) параметр положения линейного тренда (а! « « 2.1);
в) большие значения параметра а! « 5.0 связаны с информативным слагаемым (экспоненциальным ростом);
г) разность между свободными членами на обоих участках (3394 - 190 = 3204) примерно соответствует величине сигнала насыщения л .
Для проверки проанализируем предполагаемую точку перегиба (измерение на пороговом цикле):
компенсировав из сигнала 1834.4 и систематиче-
*
скую составляющую, равную а0 + а1 • п « «190 + 2.1 • 14.83 « 221, должны получить около 1613, что примерно соответствует требуемому уровню 0.5Х = 1602. Таким образом, в первом приближении можно полагать сигнал насыщения 3204. Следовательно, оценка начального информативного сигнала Х0 составит 3204 / 13610 « « 0.235. Информативная составляющая сигнала на начальных отсчетах приближенно соответствует Х0 • а« « 0.235 •1.9п. При аппроксимации этой зависимости линейным трендом по МНК получим 1.57 +1.63 • п Разность вычисленных параметров положения 5.0 - 2.1 = 2.9 в значительной степени
объясняется "наложенным" информативным экспоненциальным ростом. Кроме того, истинное значение параметра а0 может превосходить априорно заданный средний уровень 1.90, а наличие случайной помехи большого (по сравнению с изменением сигнала на начальных отсчетах) диапазона также может исказить оцененную величину параметра положения систематической погрешности. В целом можно полагать, что в первом приближении систематическую погрешность можно аппроксимировать зависимостью 190 + 2.1п. Далее эта систематическая погрешность компенсируется.
После компенсации систематической составляющей сигнала осуществляется более точное оценивание информативных составляющих сигнала — а0, Л и Х0 по методикам, описанным выше. Также следует заметить, что проведенная компенсация линейного тренда первого порядка не повлияла на оценку положения порогового цикла (точки перегиба), т. к. последний определяется вторым разностным сигналом, а вторая разность от линейного тренда первого порядка есть ноль.
Ранее [1] были найдены условия оптимального оценивания параметра а0 (4-точечная схема, включающая измерения на отсчетах п, п + 1, п + 4 и п + 5, т. к. в большинстве случаев оптимальным является k = 4). Было определено, что оптимальный отсчет п должен соответствовать t = 4.5^5, т. е. примерно на 3 отсчета предшествовать пороговому циклу. Однако, поскольку предварительно осуществлялась компенсация систематической составляющей, целесообразно использовать отсчеты с большими величинами информативного сигнала, т. к. эффект неточной компенсации систематической составляющей информативного сигнала будет в этом случае менее значим.
3470
3460
5 3450
с;" га
1 3440 о
3430
24
кривая на участке насыщения |—линейная аппроксимация у = 3394 + 2.13 п
27
30
—I—
33
Рис. 2. Выделение систематической погрешности как линейного тренда первого порядка на стадии насыщения
Отсчеты
Табл. 4. Величины отсчетов сигнала после компенсации систематической составляющей
п Xn п Xn п Xn п Xn
27 3209 29 3214 31 3204 33 3212
28 3208 30 3195 32 3195 34 3206
Табл. 5. Выборка оценок параметра F
п
11 10 12 13 14 15
9.654 9.589 9.681 9.643 9.656 9.702
Для иллюстрации выберем четыре 4-точечные схемы, соответствующие п = 12—15. Расчет параметра а0 даст следующие оценки: 1.944; 1.948; 1.894 и 1.838. Выбрав медиану этих 4 измерений, получим (1.944 + 1.894) / 2 » 1.919.
Для сравнения, использование близких 4-точечных схем по отсчетам (13, 14, 16, 17), (13, 14, 18, 19) и (12, 13, 18, 19) дает достаточно близкие оценки: 1.895, 1.889 и 1.922 соответственно.
После оценивания а0 осуществляется расчет оценок Х*. Как говорилось ранее, более эффективные оценки будут при использовании наибольших по величине измерений (близких к стадии насыщения). Измерения на заключительных отсчетах кривой (от 27 до 34-го) после компенсации аппроксимированной систематической погрешности и округленные до целочисленных значений представлены в табл. 4.
Использовав пары значений сигнала на отсчетах 27-31, 28-32, 29-33, 30-34, применили формулу расчета Х из [1] при k = 4 и оцененное значение параметра а0 = 1.919. Тогда оценки Х практически совпадают с вышеуказанными измерениями, поскольку стадия насыщения практически достигнута: 3203.6; 3194.0; 3211.8 и 3206.9. В этих условиях дисперсия ошибки оценивания должна лишь незначительно превышать дисперсию исходной помехи (стандартное отклонение исходной равномерной помехи с полуразмахом 8 =16 есть 9.24). В соответствии с медианной оценкой получим, чтоХ* « (3206.9 + 3203.6) / 2 = 3205.3.
Заключительный оцениваемый параметр Е связан с отношением Х / Х0. В соответствии с методикой [1] наиболее эффективное оценивание этого параметра осуществляется при отсчетах, примерно соответствующих t = 12—15 (требуется решение трансцендентного уравнения). Т. к. t = 1 — точка перегиба (пороговый цикл), а0 близко к 2.0, то требуется выбрать отсчет, предшествующий пороговому циклу на Ап: Ап = 1п^) / 1п(а0) = 4 - 5 . Однако по соображениям, высказанным ранее, следу-
ет несколько сместить отсчеты в сторону больших измерений. В табл. 5 приведены оценки параметра Е на основе измерений п = 10—15. По медианному алгоритму получено Е = 9.655. Следовательно, В = = 15600 и Х0 = 0.205. Пороговый цикл вычисляется, как Е /1п(а0) = 14.816. Поскольку оценочные значения параметров получились весьма близкими к истинным, то и достаточно устойчивая оценка положения порогового цикла оказалась весьма близкой к истинному значению.
В заключительной стадии обработки информативного сигнала можно осуществить сопоставление найденных параметров модели (1) с параметрами альтернативной модели (2). Первая итерация параметров: п0 = п = 14.816, Л1 = X0 = 0.205 , Л2 = X* = 3205.3 и р = п0/1п(а0) = 9.655. Применив алгоритм уточнения параметров, основанный на решении системы (5), получим необходимые приращения параметров и новые итерационные значения: АЛ = 25.995^Л= 26.200, АЛ2 = 21.71^ Л2 = 3227.01 и Ар = 0.083 ^ Л1 = 9.738. Среднеквадратичное отклонение двух кривых составит: при первой итерации параметров 36.17 отсчетов, при второй итерации — 25.88. На рис. 3 иллюстрируется совпадение кривых, построенных на основе различных моделей логистического роста. Взяты значимые фрагменты, поскольку на начальной стадии и на стадии насыщения обе модели обеспечивают близкие значения (соответственно к величинам Х0 и Х*). Наиболее "расходящейся" стадией являются участки с наибольшей кривизной сигнала, т. е. на границах областей 1—2 и 2— 3 (см. рис. 2). Более детализированные укрупненные фрагменты представлены на рис. 4 (а и б).
Разумеется, проиллюстрирована лишь общая схема оценивания информативных параметров кривых логистического роста. В частности, возможно формирование как более представительной статистики оценок параметров (за счет варьирования выбора п и k вблизи оптимальных условий),
Рис. 3. Сравнение форм кривых логистического роста, сформированных на основе различных моделей
3200
-¿-модель 1 (показательная) модель 2 (степенная)
10
12 14
Отсчеты
3000
ф
о
2800
2300
18
модель 1 (показательная) модель 2 (степенная)
21 24
Отсчеты
Рис. 4. Различие кривых логистического роста, сформированных в соответствии с различными математическими моделями.
а — фрагмент в области перехода режимов 1—2; б — фрагмент в области перехода режимов 2—3
так и другие принципы отбора результирующей оценки из выборки. Например, в [1] для формирования результирующей оценки параметров рассмотрен алгоритм стохастической аппроксимации.
Другая предложенная оценка в форме медианы по четному числу измерений алгоритмически является усеченным средним, т. е. учитывает различие оценок, обладает необходимой робастностью (ус-
тойчивостью к выбросам) и мало отличается по своим характеристикам от оценки на основе алгоритма стохастической аппроксимации.
ЗАКЛЮЧЕНИЕ
Показаны возможности эффективной компенсации систематической составляющей сигнала, а также надежного оценивания параметров моделей логистического роста. Кроме того, детально описана процедура сопоставления двух наиболее распространенных форм (1) и (2) решения логистического уравнения, использующих показательные и степенные функции. Рассмотренные в ч. 1 и 2 алгоритмы позволяют осуществить обработку соответствующих кривых (информативных сигналов) и в конечном счете способствуют получению необходимой аналитической информации при реализации ПЦР-РВ.
Данная работа выполнялась при финансовой поддержке в рамках программ и проектов: Аналитической ведомственной целевой программы "Развитие научного потенциала высшей школы" — проект "Исследования и диагностика клеточных структур: новые методические подходы и инструментальные решения на основе сканирующей зон-довой микроскопии и микрочиповых технологий" (№ 4247); Программы фундаментальных исследований Президиума РАН № 20 "Создание и совер-
шенствование методов химического анализа и исследования структуры веществ и материалов" — проект "Микрочиповые аналитические системы для метода молекулярных колоний"; Программы фундаментальных исследований Президиума РАН на 2009 г. № 27 "Основы фундаментальных исследований нанотехнологий и наноматериалов".
СПИСОК ЛИТЕРАТУРЫ
1. Буляница А.Л. Методы оценивания параметров кривой логистического роста. Ч. 1. Оптимизация условий оценивания при наличии аддитивной случайной помехи // Здесь. С. 3-11.
2. Kendall M.G. & Stuart A. The Advanced Theory of Statistics. V. 3. Design and analysis, and time-series. 2nd edn. London: Charles Griffin & Company Limited, 1968.
3. Большее Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с.
4. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. М.: Наука, 1968. 288 с.
Институт аналитического приборостроения РАН, Санкт-Петербург
Материал поступил в редакцию 24.04.2009.
METHODS FOR LOGISTIC GROWTH CURVE PARAMETERS ESTIMATION.
PART. 2. ESTIMATION AND COMPENSATION OF THE SYSTEMATIC COMPONENT OF MEASUREMENT. COMPARISON OF TWO DIFFERENT FORMS OF THE MATHEMATICAL MODEL FOR LOGISTIC GROWTH
A. L. Bulyanitsa
Institute for Analytical Instrumentation RAS, Saint-Petersburg
Logistic growth is one of the traditional mathematical models, used for describing many population processes. The dynamics of DNA quantity in conducting polymerase chain reaction in real time (PCR-RT) is adequately described by a similar model, as it was noted earlier [1]. In part. 1 of this paper the algorithms for the development of the efficient parameters estimation were described, and the description of the characteristics of the random errors in the estimations proposed was given. The main aims of part. 2 of this paper are determination and compensation of the systematic component of logistic growth curve, and comparison of two different forms (using algebraic (power) and exponential functions) of the mathematical model of the process.
Keywords: polymerase chain reaction, logistic growth, systematic error compensation, approximation of functions, iterations