Научная статья на тему 'Численная оценка равномерности распределения молекулярных колоний при анализе изображений результата цПЦР в геле'

Численная оценка равномерности распределения молекулярных колоний при анализе изображений результата цПЦР в геле Текст научной статьи по специальности «Математика»

CC BY
68
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Научное приборостроение
ВАК
RSCI
Область наук
Ключевые слова
МЕТОД МОЛЕКУЛЯРНЫХ КОЛОНИЙ / MOLECULAR COLONIES / МИКРОЧИПОВОЕ УСТРОЙСТВО / MICROCHIP DEVICE / РЕАКЦИОННАЯ КАМЕРА / REACTION CHAMBER / КОЛИЧЕСТВЕННЫЙ АНАЛИЗ / QUANTITATIVE ANALYSIS / МЕРА РАВНОМЕРНОСТИ / MEASURE OF UNIFORMITY / ПОРЯДКОВЫЕ СТАТИСТИКИ / ORDER STATISTICS

Аннотация научной статьи по математике, автор научной работы — Буляница Антон Леонидович, Рудницкая Г.Е., Тупик А.Н., Лукашенко Т.А., Цымбалов А.И.

Одним из высокочувствительных методов генетического анализа является метод молекулярных колоний, реализуемый на планарном микрочиповом устройстве с системой реакционных камер. При этом погрешность результатов анализа связана с равномерностью расположения молекулярных колоний в реакционной камере. В работе рассматривается подход, основанный на порядковых статистиках. Это позволяет обосновать две оценки степени равномерности, являющиеся аналогами общих понятий статистики: точечной оценки максимального правдоподобия и интервальной оценки. Применимость подхода проиллюстрирована анализом изображений, полученных при обнаружении транскриптов цитокератина (CK-19) в пробе.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Буляница Антон Леонидович, Рудницкая Г.Е., Тупик А.Н., Лукашенко Т.А., Цымбалов А.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NUMERICAL ESTIMATION OF DISTRIBUTION UNIFORM OF MOLECULAR COLONIES FOR dPCR RESULTS IMAGE ANALYSIS

Molecular colony technique is one of the sensitive methods of genetic analysis. This technique was implemented on a planar microchip device with array of reaction chambers. The errors of analysis related to the distribution of molecular colonies in the reaction chamber are discussed. An approach based on order statistics is described in the paper. It provides two estimates of the measure of uniform distribution, that are analogues of basic concepts in statistics: point maximum likelihood estimates and interval estimates. Usefulness of this approach was illustrated by analysis of images, gets with cytokeratin’s transcripts (CK-19) determination in sample.

Текст научной работы на тему «Численная оценка равномерности распределения молекулярных колоний при анализе изображений результата цПЦР в геле»

ISSN 0868-5886 НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2014, том 24, № 4, c. 3-12

- МАТЕМАТИЧЕСКИЕ МЕТОДЫ

И МОДЕЛИРОВАНИЕ В ПРИБОРОСТРОЕНИИ

УДК 57.088+54.062+519.234.7

© А. Л. Буляница, Г. Е. Рудницкая, А. Н. Тупик, Т. А. Лукашенко, А. И. Цымбалов, А. А. Евстрапов

ЧИСЛЕННАЯ ОЦЕНКА РАВНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ МОЛЕКУЛЯРНЫХ КОЛОНИЙ ПРИ АНАЛИЗЕ ИЗОБРАЖЕНИЙ

РЕЗУЛЬТАТА цПЦР В ГЕЛЕ

Одним из высокочувствительных методов генетического анализа является метод молекулярных колоний, реализуемый на планарном микрочиповом устройстве с системой реакционных камер. При этом погрешность результатов анализа связана с равномерностью расположения молекулярных колоний в реакционной камере. В работе рассматривается подход, основанный на порядковых статистиках. Это позволяет обосновать две оценки степени равномерности, являющиеся аналогами общих понятий статистики: точечной оценки максимального правдоподобия и интервальной оценки. Применимость подхода проиллюстрирована анализом изображений, полученных при обнаружении транскриптов цитокератина (CK-19) в пробе.

Кл. сл.: метод молекулярных колоний, микрочиповое

анализ, мера равномерности, порядковые статистики

ВВЕДЕНИЕ

Наиболее распространенным методом амплификации нуклеиновых кислот является полиме-разная цепная реакция (ПЦР). Появление этого метода способствовало формированию нового диагностического направления в клинической медицине — молекулярной ДНК-диагностики [1]. Перспективным направлением развития ПЦР является цифровая полимеразная цепная реакция (цПЦР), позволяющая регистрировать исходное количество ДНК (или РНК) на уровне единичных молекул [2]. К преимуществам цПЦР следует отнести возможность непосредственного определения исходного количества ДНК без дополнительных процедур калибровки (построения градировочных зависимостей) и независимость получаемого результата от эффективности амплификации. Вариантом реализации цПЦР является проведение реакции амплификации в тонком слое геля [3]. Пористая структура геля затрудняет диффузию крупных макромолекул (ДНК), но не влияет на диффузию более мелких реакционных компонентов. Во время амплификации копии молекулы-мишени формируются вокруг исходной молекулы, образуя так называемые молекулярные колонии. Если исходная концентрация молекул-мишеней мала, то колонии в геле будут пространственно разделены. Количество молекулярных колоний совпадает с числом ДНК-мишеней, находящихся в исследуемом образце. Впервые этот метод, названный методом молекулярных колоний (ММК), был предложен А. Б. Четвериным с сотрудниками (ИБ

устройство, реакционная камера, количественный

РАН, г. Пущино) для регистрации колоний РНК в агарозном геле [4]. Авторы "выращивали" колонии РНК с помощью QP-репликазы для обнаружения единичных молекул нуклеиновых кислот. Для метода ПЦР из-за циклических нагревов потребовалась замена агарозы на термоустойчивый поли-акриламидный гель [5, 6]. Как отмечают авторы [7], размер одной колонии может варьироваться от одного до нескольких сотен микрометров, что зависит от эффективности ПЦР, количества циклов амплификации, размеров фрагментов ДНК и характеристик геля. В этой же работе показано, что ММК позволяет выявить 1 молекулу ДНК или 2 молекулы РНК. При этом число колоний всегда пропорционально числу посеянных мишеней, что позволяет определить исходный титр. Авторы считают, что полиакриламидный гель имеет высокую разрешающую способность: в терминах цифровой ПЦР, гель диаметром 14 мм эквивалентен по разрешающей способности ПЦР-планшету с миллиардом лунок. Для реализации метода молекулярных колоний используют предметные стекла с лунками глубиной 400 мкм, диаметром 14 мм, что соответствует объему 65 мкл. [7].

Этот метод является простым и недорогим и использует традиционные методики для подготовки реакционной смеси, а также коммерчески доступное оборудование для проведения ПЦР. Гель, заранее сформированный в реакционных камерах, может храниться при температуре +4 °С длительное время (до года). Метод молекулярных колоний позволяет создавать универсальные

аналитические системы, ориентированные на широкий спектр ДНК-мишеней и реагентов. Однако в настоящее время в полной мере возможности метода молекулярных колоний не реализованы из-за трудоемкости, связанной с подготовкой и герметизацией лунок на предметном стекле. Поэтому реализация метода цифровой ПЦР в геле на микрочиповых устройствах является актуальной задачей. Уменьшение объема реакционной камеры снижает расход реактивов и биологических образцов, а также позволяет разместить на одном устройстве несколько реакционных камер для одновременного проведения ПЦР с несколькими пробами. Создание аналитических систем на основе микрочипов позволяет реализовать новые подходы и методики анализа, которые сложно или невозможно выполнить на макроаналогах устройств для ПЦР. Интеграция реакционных камер для ПЦР в геле с другими аналитическими системами, например капиллярного электрофореза, делает возможным создание комплексной микроаналитической системы для исследования биологических проб.

Погрешность ММК при количественной оценке определяемых мишеней зависит от равномерности расположения в реакционной камере молекулярных колоний, их количества, а также их перекрывания. В данной статье на основании экспериментальных результатов оценивается распределение молекулярных колоний в реакционной камере, обсуждаются некоторые аналитические характеристики метода и перспективы их улучшения.

МИКРОЧИПОВЫЕ УСТРОЙСТВА

В ИАП РАН разработаны прототипы микрочиповых устройств для проведения ПЦР [8]. Для реализации ММК на микрочипах предложены варианты топологий миниатюрных устройств из стекла [9], а также из полимерных материалов [10]. Реакционные камеры в стеклянных устройствах получены методом фотолитографии и кислотного

травления. В полимерном (полиметилметакри-лат — ПММА) микрочиповом устройстве реакционные камеры сформированы методом лазерной микрообработки (лазерная абляция). В этих реакционных камерах отлит полиакриламидный гель, после чего камеры герметизировали покровными пластинами с применением полимерных композиций. Объем реакционной камеры сопоставим с объемом полимерных пробирок для ПЦР-РВ и составляет от 15 до 35 мкл в зависимости от варианта топологии.

В работе использовали микрочиповые устройства из стекла и полиметилметакрилата с реакционными камерами глубиной 200 мкм и диаметром 14 и 10 мм соответственно, каждая из которых имеет входные и выходные каналы шириной около 1 мм (рис. 1).

МЕТОДЫ, ОБРАЗЦЫ И РЕАГЕНТЫ

При экспериментальных исследованиях на микрочиповых устройствах определяли содержание транскриптов цитокератина (CK-19) — онкомар-кера, который считается специфичным для эпителиальных клеток, в образцах периферической крови. В крови больных в процессе пролиферации опухолевых клеток наблюдают увеличение количества кератинов. РНК из образцов периферической крови выделяли при помощи набора ZR Whole-Blood RNA MiniPrep (Zymo Research, США) по протоколу производителя. Для получения кДНК проводили обратную транскрипцию с помощью фермента M-MLV Reverse Transcriptase (Promega Corp., США).

При постановке ПЦР использовали флуоресцентные зонды и синтезированные специфичные праймеры (ООО ДНК-Синтез, г. Москва), позволяющие получать ампликоны длиной 103, 210 или 310 пар оснований. Нуклеотидные последовательности применяемых праймеров приведены в табл. 1. В состав ПЦР-смеси вносили меньшее

Табл. 1. Нуклеотидные последовательности праймеров (ООО ДНК-Синтез)

Олигонуклеотиды 5'-З' последовательность

Прямой праймер для синтеза фрагментов Обратный праймер для синтеза фрагмента длиной 103 п.о. Обратный праймер для синтеза фрагмента длиной 210 п.о. Обратный праймер для синтеза фрагмента длиной 310 п.о. CCTGCGGGACAAGATTCTTG CTCAAACTTGGTTCGGAAGTCAT CCTCGATCTGCATCTCCAGGTC GAATCCACCTCCACACTGACCT

Табл. 2. Нуклеотидные последовательности зондов (ООО ДНК-Синтез)

Зонд 5'-3' последовательность

Beacon (FAM) FRET-донор (FAM) FRET-акцептор (Cy5) FAM-AGCGTCATTGAGAACTCCAGGATTGTCGACGCT AGATCGACAATGCCCGTCTGGC-FAM Cy5-CAGATGACTTCCGAACCAAGTTTGAGAC

количество прямого праймера относительно обратного для проведения асимметричной ПЦР, что обеспечивало преимущественный синтез фрагмента мишени с флуоресцентными зондами.

Для регистрации молекулярных колоний использовали специфичные флуоресцентные зонды двух типов: зонд Beacon с флуорофором FAM или флуоресцентные зонды типа FRET, которые располагались на синтезируемой цепи кДНК в непосредственной близости друг от друга, что позволяло осуществить перенос энергии от флуорофора-донора FAM к флуорофору-акцептору Cy5. Нук-леотидные последовательности применяемых зондов приведены в табл. 2.

Перед экспериментом высушенные гели восстанавливали путем пропитывания смесью для ПЦР, которую вводили в каждую камеру дозатором через входной канал. Смесь включает: i) реакционную смесь, содержащую ПЦР-буфер, де-зоксинуклеозидтрифосфаты, MgCl2 и Taq ДНК-полимеразу с ингибирующими активность фермента антителами (Кат. № M-428, ЗАО СИНТОЛ);

2) 0.08 hM прямого праймера и 0.2 hM обратного праймера (для проведения асимметричной ПЦР);

3) 0.2 mM флуоресцентного зонда; 4) 2 мкг/мкл BSA (Bovine Serum Albumin, fraction V, Sigma). В смесь добавляли i мкл раствора, содержащего кДНК.

ПРИБОРЫ И ОБОРУДОВАНИЕ

ПЦР осуществляли на приборе Swift MaxPro (ESCO, Сингапур) с нагревательным блоком "in situ" с ровной поверхностью. Коэффициент теплопроводности стекол лежит в интервале (0.5i-

1.28) Втм-1К-1, что позволяет обеспечить высокоэффективный и быстрый процесс амплификации (см., например, [11]). Полимеры имеют более низкий, чем у стекла, коэффициент теплопроводности (0.1-0.3) Втм-1К-1 [12]. При выборе режимов тер-моциклирования для стеклянных или полимерных микрочиповых устройств учитывалось это различие. Для стеклянных чипов условия были следующими: предварительный нагрев до 95 °С в течение 5 мин, затем рабочий режим 45 циклов — 95 °C в течение 6 с, 60 °C в течение 60 с. Для микроустройств из ПММА: предварительный нагрев до 95 °С в течение 5 мин, затем рабочий режим 45 циклов — 95 °C в течение 25 с, 60 °C в течение 50 с, 72 °C в течение 60 с.

Детектирование молекулярных колоний проводили на приборе для регистрации результатов цПЦР — детекторе молекулярных колоний ДМК-1 (ИАП РАН). Пространственное разрешение прибора достигает 1 мкм, а минимальный размер анализируемых объектов составляет 3 мкм [13]. Измерения осуществлялись при длине волны возбуждения 473 нм в диапазоне регистрации флуоресценции в интервале 515-535 нм для красителя FAM (зонд Beacon) или 635-675 нм для красителя Cy5 (FRET-зонды).

На рис. 2, а, представлены изображения молекулярных колоний, полученные в результате проведения ПЦР в реакционных камерах с гелем на стеклянных микрочипах. Анализируемая проба содержала около десяти молекул кДНК СК-19. Для обнаружения молекулярных колоний использовался зонд Beacon (FAM). При этом в зависимости от длины амплифицируемого фрагмента регистрировался разный размер колоний, равный 2, 1.5 и 1 мм для фрагментов длиной 103, 210 и 310 пар оснований соответственно.

б

Рис. 2. Изображения молекулярных колоний.

Получены: а — в стеклянном микрочиповом устройстве с длиной фрагмента амплификации 103, 210 и 310 п.о.; б — в полимерном микрочиповом устройстве (210 п.о.)

а

Результаты, полученные на полимерном микрочиповом устройстве, представлены на рис. 2, б. Для обнаружения колоний применяли специфичные флуоресцентные зонды FRET и праймеры для фрагментов 210 пар оснований.

ОЦЕНИВАНИЕ ПОГРЕШНОСТИ СЧЕТА МОЛЕКУЛЯРНЫХ КОЛОНИЙ

Погрешность счета молекулярных колоний по существу является погрешностью результатов количественного анализа и относится к основным аналитическим характеристикам метода. Ранее в работе [14] была описана процедура оценивания указанной погрешности. Базовыми теоретическими положениями являлись: а) гипотеза классического эксперимента (равномерность размещения колоний в реакционной камере); б) комбинаторная схема без возвращения, на основе которой оценивались вероятности отсутствия пересечения любых соседних колоний, вероятности наличия одной, двух пар (троек) и т. д. пересекающихся колоний. Так как группа пересекающихся колоний будет интерпретирована как одна колония, этот фактор приводит к занижению их числа.

Согласно рис. 2, при анализе фрагментов длиной 210 п.о. отношение радиусов реакционной камеры и колонии (R/r0) составляет 9.5 и 7.5 для стеклянного и полимерного чипов соответственно. Полагаем, что колонии достоверно идентифицируются, если расстояние между их центрами превышает 0.4 радиуса. Тогда параметр N, определяющий вероятности перекрывания колоний, равный (R / 0.4r0)2, будет 580 и 350 для стеклянного и полимерного чипов.

Рассчитаем максимальное число молекулярных колоний, соответствующее верхней границе дина-

мического диапазона, исходя из двух критериев:

1) вероятность того, что ошибка оценивания числа колоний превысит 1, не превосходит 10 %;

2) средняя ошибка счета колоний (математическое ожидание) не превосходит 1.

Во всех случаях ошибка счета (количественного анализа) связана с занижением их числа.

Тогда, в соответствии с первым критерием, максимальное число колоний 25 и 20 для стеклянного и полимерного чипов. Согласно второму критерию, максимальное число колоний составит 35 и 27. Уменьшение радиуса колонии вдвое в этих условиях приводит к двукратному увеличению соответствующих граничных значений. Эта закономерность будет выполняться, когда N превышает сотни.

Согласно первому критерию (более чем 90 %-я вероятность того, что колонии либо не пересекаются, либо имеется только одна пара пересекающихся колоний), можно использовать приближенную оценочную формулу для расчета максимального числа колоний т. При этом N превышает 100, т существенно превышает 1 и все множители от (т-2) до т заменяются на (т-1). Логарифмы вычисляются в приближении многочлена Маклорена первого или второго порядка.

Тогда получим оценку (т -1)4 < 8N21п (1/0.90)

При N = 580 получим т < 24.1 (вместо 25), при N = 380 — т <18.9 (вместо 20).

В случае неравномерного размещения колоний по реакционной камере вероятности их пересечения в области более плотного расположения возрастают, тем самым возрастает и вероятность ошибки количественного анализа. Таким образом, требуется введение количественной меры степени равномерности. Решению этой задачи и посвящен следующий раздел статьи.

АНАЛИЗ РАВНОМЕРНОСТИ РАСПОЛОЖЕНИЯ КОЛОНИЙ В РЕАКЦИОННОЙ КАМЕРЕ МИКРОЧИПОВОГО УСТРОЙСТВА

В случае небольшого числа достаточно крупных молекулярных колоний степень равномерности можно оценить, основываясь на субъективной визуальной оценке. Однако даже при этом разработка количественной меры равномерности остается актуальной. Если же речь идет о регистрации достаточно большого числа колоний, необходима формализация и объективизация такой оценки.

Предложенная количественная мера равномерности базируется на вероятностных характеристиках порядковых статистик. Каждая колония может идентифицироваться по положению ее центра (х, у). Опосредованной характеристикой ее позиционирования будет расстояние г центра колонии от геометрического центра реакционной камеры. Таким образом, для набора молекулярных колоний имеем 3 выборки (х- и у-координаты центра и г — расстояние от центра камеры). Необходимым условием является равномерность всех трех выборок, т. к. даже равномерности распределений х-и у-координат, независимых друг от друга, еще не гарантируют равномерности по удалению от центра (г). Одновременно с этим, только равномерность распределения расстояний от центра не гарантирует равномерности размещения колоний по площади реакционной камеры. Например, "выстраивание" колоний по диаметру, даже при теоретически обоснованном распределении г, противоречит равномерности распределений по х- и у-координатам.

При заданном законе распределения случайной величины с плотностью распределения вероятностей (ПРВ) /х) и функцией распределения (ФР) F(x) плотность распределения вероятностей к-й порядковой статистики из выборки объема п задается известной формулой

/п: (х) = пСП_-; Fk-1 (х) (1 - F (х))п -k / (х), к = 1,2,..., п.

Если исходить из равномерного распределения колоний в пределах реакционной камеры — круга радиуса 1 (после нормировки на радиус камеры Я), плотности распределения вероятностей х и у и расстояния центра колонии от центра реакционной камеры г имеют вид, подробно обоснованный в [15]. Из них легко получается и форма закона распределения расстояния г центра колонии от центра реакционной камеры:

/(г) = 2г, F(г) = г2 при г е [0; 1].

Исходя из этих законов распределения, можно

Рис. 3 Изображение 9 молекулярных колоний (103 пар оснований) после 42-го цикла. Стеклянное микрочиповое устройство

получить теоретическое распределение упорядоченных координат центров колоний — х (слева направо), у (снизу вверх), расстояний r от центра и сопоставить их с фактическим распределением. То есть критерий равномерности распределения колоний в реакционной камере можно отнести к критериям согласия.

На основе плотности распределения порядковых статистик определяем две характерные точки: медиана распределения k-й порядковой статистики и мода (наиболее вероятное положение). Соответственно реальное расположение k-й по счету колонии будем сопоставлять с указанными расчетными характеристиками.

Для примера рассмотрим распределение 9 выявленных молекулярных колоний (фрагмент: 103 пар оснований, стеклянный чип, Beacon). Увеличенное их изображение представлено на рис. 3. Визуальная оценка свидетельствует о том, что их расположение не сильно противоречит гипотезе равномерности.

Параметры порядковых статистик экспериментальные (согласно рис. 3) и расчетные (теоретические) представлены ниже в табл. 3. В этой таблице принята следующая нумерация: под номером 1 среди координат х представлена координата центра самой левой колонии; соответственно под номером 9 идет х-координата самой правой из изображенных на рис. 3 колоний. Координаты по y упорядочены снизу вверх: т. е. 1-я координата y в таблице — это координата самой нижней, а 9-я — координата центра самой верхней из колоний. Упорядочивание по расстоянию r от центра определяет следующую нумерацию: под номером 1 — расстояние от центра реакционной камеры до самой наименее удаленной колонии, под номером 9 — расстояние

Табл. 3. Параметры порядковых статистик

Параметр 1 2 3 4 5 6 7 8 9

Координата центра х -0.688 -0.613 -0.548 -0.441 0.048 0.441 0.489 0.753 0.774

ФР х 0.621 0.349 0.187 0.127 0.578 0.873 0.736 0.872 0.561

Координата центра y -0.473 -0.247 -0.194 -0.161 0.032 0.140 0.237 0.473 0.602

ФР у 0.880 0.873 0.723 0.511 0.553 0.458 0.337 0.407 0.254

Расстояние r 0.172 0.441 0.516 0.656 0.731 0.763 0.785 0.806 0.839

ФР r 0.239 0.547 0.448 0.595 0.584 0.438 0.264 0.113 0.042

до самой удаленной (близкой к краю реакционной камеры) колонии.

Практически ФР характеризует, с какой вероятностью истинное расположение соответствующей упорядоченной колонии отклоняется от медианного (ФР = 0.5) теоретически обоснованного ее положения. Например, по r: колонии 2-6 по степени удаления от центра расположены в непосредственной близости от расчетной медианы их теоретического распределения. Тем самым примерно равновероятным явится их расположение как ближе к центру камеры, так и далее от него. В то же время ФР = 0.042 для 9-й, самой удаленной от центра, колонии свидетельствует, что, согласно теории, примерно в 96 % случаев она должна быть еще более удалена от центра камеры, если исходить из гипотезы равномерности.

Для количественной оценки общей (интегральной) степени равномерности по всей совокупности колоний предложены два подхода.

Подход 1. Полагая, что ФР порядковой статистики равна Р — вероятности, что соответствующая статистика может принимать меньшее значение, по каждой из приведенных порядковых статистик рассчитывается произведение Р(1-Р).

Особенности этой величины: 1) P(1 - P) = max при Р = 0.5, т. е. при "попадании" соответствующей статистики в точку медианы; 2) эта величина инвариантна относительно замены Р на (1-Р), что позволяет считать равнозначными отклонения статистики от своей медианы как в большую, так и в меньшую стороны; 3) при небольших отклонениях от медианы (Р = 0.4 или 0.6) это произведение равно 0.24 вместо максимально возможного 0.25, вместе с тем Р = 0.1 и менее (0.9 и более) уже дает 0.09 и менее и характеризуется весьма значительным отклонением произведения от 0.25.

На основе оценок Рк по каждой из статистик вычисляется геометрическое среднее

p*(i - р)=n п р^ (i - р^)=

а .

которому соответствует Р =1 ±\10.25 - а .

Для распределений порядковых статистик по координатам х и у, а также по г для колоний, изображенных на рис. 3, соответствующие оценки Р будут близкими: 0.779, 0.739 и 0.778. Если сопоставить найденные квантили 74-78 % с квантилями нормального распределения, получим точки, отклоняющиеся от математического ожидания т на (0.65^0.77)ст. То есть при равномерном распределении колоний по реакционной камере размещение колоний, наблюдаемое в эксперименте, встречается не реже, чем нормально распределенная случайная величина, превосходящая т + (0.65^0.77)ст. Это явление совсем не редкое, и степень равномерности можно считать высокой.

Подход 2 основывается на методе максимального правдоподобия. По каждой порядковой статистике рассчитывается ее значение ПРВ /х(к)) по сравнению с ПРВ, соответствующей вероят-нейшему расположению колонии /так, а именно

= /(х(к)) / /тах . Тем самым оценивается, во сколько раз размещение каждой колонии на месте, наблюдаемом в эксперименте, менее вероятно по сравнению с наивероятнейшей конфигурацией колоний, определенной теоретически.

Далее берется геометрическое среднее по всем

Гп

статистикам / = Ы^ wk . Эта величина для удоб-

\ к=1

ства интерпретации может быть пересчитана в отклонение нормальной случайной величины с единичной дисперсией от математического ожидания по схеме А = ±^/-21п(/) . Расположение каждой колонии на своем месте будет в 1// менее

вероятно по сравнению с наиболее вероятным размещением.

Для примера рассмотрим распределение колоний по г, соответствующее рис. 3.

Положение моды (вероятнейшего значения) к-й порядковой статистики из п определяется, как

г2 = (2к-1)/(2п-1), к = 1,2,..., п.

Далее в табл. 4 представлены данные для формирования оценки равномерности распределения молекулярных колоний по г в рамках подхода 2. Как и ранее, номеру 1 соответствует ближайшая к центру реакционной камеры колония, а номеру 9 — самая удаленная.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Видно, что расположение первых 6 колоний практически совпадает с наивероятнейшим. В то же время 9-я колония расположена в месте, примерно в 20 раз менее вероятном, чем ее вероят-нейшее положение. Тогда интегральный параметр / = 0.5853, чему соответствует А = ±1.038. В принципе, отклонение нормальной случайной величины от математического ожидания на А и более — явление совсем не редкое (соответствующая вероятность примерно 30 %). Другая интерпретация: вероятность расположения каждой из 9 колоний на указанных местах, т. е. на соответствующем удалении от центра реакционной камеры, составляет 58.5 % от вероятности наиболее вероятного расположения.

Рассмотрим рис. 2, б, — формирование молекулярных колоний на полимерном чипе. Сигнал флуоресценции в левой части рисунка можно интерпретировать, как интенсивность флуоресценции от нескольких пересекающихся колоний. По площади этого фрагмента в сравнении с площадью колонии можно полагать, что оно соответствует 3 колониям. Это восприятие достаточно субъективно. Сигналы от остальных 7 колоний идентифицируются однозначно. Таким образом, анализируем расположение 10 молекулярных колоний на рис. 2, б, с точки зрения равномерности их распределения. В этом случае упорядочивание 10 колоний по удалению от центра камеры приводит

к следующему набору порядковых статистик: 0.329, 0.471, 0.571, 0.600, 0.604, 0.624, 0.702, 0.706, 0.772 и 0.887. То есть наиболее близкая к центру колония удалена на расстояние примерно 1/3 радиуса, наиболее удаленная — 8/9 радиуса реакционной камеры. При первом подходе такому распределению 10 колоний соответствует среднее значение функции распределения Р = 0.844 (или 0.156). При втором подходе получим / = 0.4455, чему соответствует А = ±1.272. (То есть вероятность расположения каждой из колоний на указанном месте в среднем составляет 0.445 от максимальной). При этом оценки равномерности по 3 характеристикам (х и у координаты и расстояние от центра) сопоставимы.

В некоторых случаях оценки равномерности распределения колоний по координатам х и у, а также по расстояниям г, проведенные на стадии отработки анализа, позволяют выявить особенности способов загрузки реагентов в реакционную камеру.

В частности, наличие существенной неравномерности может свидетельствовать о значимом факторе асимметрии при вводе вещества, например, по механизму избыточной вязкости (гидравлического сопротивления) части реакционной камеры и практической невозможности проникновения туда крупных макромолекул.

Существенная неравномерность по г при менее выраженной неравномерности по координатам, особенно вызванная экстремальными порядковыми статистиками (наиболее удаленными от центра реакционной камеры), может свидетельствовать о влиянии краевых эффектов на рост молекулярных колоний.

В целом равномерность размещения колоний по реакционной камере может быть объективно количественно оценена в рамках двух предложенных подходов. Она является одним из показателей качества пробоподготовки (загрузки пробы). При решении различных задач многопараметрической оптимизации равномерность — один из возможных параметров.

Табл. 4. Параметры порядковых статистик по г

Характеристика 1 2 3 4 5 6 7 8 9

Положение 0.172 0.441 0.516 0.656 0.731 0.763 0.785 0.806 0.839

Мода (вероят-нейшее положение) 0.243 0.420 0.542 0.642 0.728 0.804 0.874 0.939 1.000

Wk 0.9052 0.9918 0.9836 0.9940 0.9995 0.9278 0.6540 0.2997 0.0506

ЗАКЛЮЧЕНИЕ

В работе на базе вероятностных характеристик порядковых статистик предложены и применены подходы для оценивания степени равномерности распределения однотипных объектов (молекулярных колоний) в реакционной камере. Две количественные оценки (меры) равномерности являются частными случаями традиционно применяемых в статистике методов точечного и интервального оценивания. При этом в рамках первого подхода расположение колонии, усредненное по всему набору выявленных колоний, сопоставлялось с наиболее вероятным ее размещением, соответствующим гипотезе равномерности. Второй подход сопоставлял размещение каждой из молекулярных колоний со средним (медианным) ее расположением. Тем самым степень равномерности молекулярных колоний, достигнутая при анализе, оценивалась по вероятности отклонения каждой колонии от ее теоретически обоснованного медианного расположения.

Применение данного подхода к экспериментальным данным, представленным на рис. 2, б, и 3, позволило дать объективную количественную оценку достигнутой степени равномерности: расположение каждой колонии на наблюдаемых местах при упорядочивании по степени удаления от центра реакционной камеры свидетельствует о том, что их расположение примерно в 2.2 и 1.7 раза менее вероятно, чем наиболее вероятное их размещение. Это подтверждает достаточно высокую степень равномерности и является основанием считать распределение колоний не противоречащим гипотезе равномерности. Отметим, что в рассматриваемых случаях, т. к. число наблюдаемых колоний невелико — 10 и 9 соответственно, — расчетная количественная оценка подтверждается и субъективным восприятием.

Расчеты свидетельствуют, что в данном случае с вероятностью, превышающей 90 %, средняя ошибка количественного анализа (счета колоний) не превысит 1, поскольку наблюдаемое на рис. 2, а и б, число колоний не достигает 27 и 35 соответственно.

На базе предложенных подходов к оцениванию равномерности распределения колоний по реакционной камере может быть решена еще одна задача, а именно исследована зависимость этой характеристики от длины амплифицирован-ного фрагмента ДНК (103, 210 и 310 пар оснований). Подобное исследование может позволить сравнить и оптимизировать стадии анализа. При этом оценивание равномерности распределения колоний по реакционной камере проводится в соответствии с предложенными процедурами.

Равномерность расположения колоний в реакционной камере является значимым показателем, поскольку с ним связаны вероятности перекрывания соседних колоний и, как следствие, ошибки количественного определения. При неравномерности размещения колоний вероятность их перекрывания может существенно увеличиться по сравнению с равномерным вариантом.

Работа выполнена при частичной поддержке Федеральной целевой программы "Национальная система химической и биологической безопасности Российской Федерации" (2009-2014 годы), НИР "Анализ-13", тема "Разработка методик регистрации результатов цифровой полимеразной цепной реакции и технологий создания микрочиповых устройств для ее постановки".

СПИСОК ЛИТЕРАТУРЫ

1. Nygren M. Molecular diagnostics of infectious diseases. Department of Biotechnology, Royal Institute of Technology, Stockholm, Sweden, KTH, 2000. ISBN 91-7170-504-X.

2. Vogelstein B., Kinzler K.W. Digital PCR // Proc. Nat. Acad. Sci. USA. 1999. Vol. 96. P. 9 236-9 241.

3. Mitra R.D., Church G.M. In situ localized amplification and contact replication of many individual DNA molecules // Nucleic Acids Res. 1999. Vol. 27, N 24. P. e34.

4. Chetverin A.B., Chetverina H.V., Munishkin A.V. On the nature of spontaneous RNA synthesis by Q replicase // J. Mol. Biol. 1991. Vol. 222. P. 3-9.

5. Chetverin A.B., Chetverina H.V. Method for amplification of nucleic acids in solid media and its application for nucleic acid cloning and diagnostics. 1999. U.S. Patent 5,958,698.

6. Chetverin A.B., Chetverina H.V. Solid medium for amplification and expression of nucleic acids as colonies. 1999. U.S. Patent 6,001,568.

7. Четверина Е.В., Четверин А.Б. Наноколонии: обнаружение, клонирование и анализ индивидуальных молекул // Успехи биол. химии. 2008. Т. 48. С. 3-64.

8. Евстрапов А.А., Буляница А.Л., Рудницкая Г.Е. и др. Оценка результатов полимеразной цепной реакции в реальном времени кДНК онкомаркеров СК-19 методом электрофореза на микрофлюидном чипе // Научное приборостроение. 2012. Т. 22, № 4. С. 77-85.

9. Курочкин В.Е., Евстрапов А.А., Буляница А.Л. и др. Разработка микрочиповых устройств для проведения ПЦР в геле // Научное приборостроение. 2010. Т. 20, № 4. С. 127-131.

10. Tupik A.N., Evstrapov A.A., Rudnitskaya G.E., Lukashenko T.A. Design reaction chamber for digital PCR in gel // CD of extended abstracts of 2nd International conference "Implementation of Microreactor Technology in Biotechnology", 5-8.05.2013, Cavtat, Croatia. P. 79.

11. Easley C.J., Legendre L.A., Landers J.P., Ferrance J.P. Rapid DNA amplification in glass microdevices // Methods Mol. Biol. 2006. Vol. 339. P. 217-732.

12. Cook L.M., Stokowski S.E. Filter materials // Handbook of laser Science and Technology. CRC press, Boca Raton, 1995. Vol. IV: Optical Materials, Part 2. P. 151.

13. Руководство по эксплуатации ДСКФ-1 ДШИ 2.840.018 РЭ. ИАП РАН, 2010. 39 с.

14. Буляница А.Л., Тупик А.Н., Рудницкая Г.Е., Евстра-пов А.А. Применение классических комбинаторных схем при количественном генетическом анализе методом молекулярных колоний // Обозрение прикладной и промышленной математики. 2014. Т. 21, вып. 4 (принято в печать). Опубл. URL: (http://tvp.ru/conferen/vsppm15/kibso067.pdf).

15. Свешников А.А. Сборник задач по теории вероятностей, математической статистике и теории случайных функций. М.: Наука, 1965. 143 c.

Институт аналитического приборостроения РАН, г. Санкт-Петербург (Буляница А.Л., Рудницкая Г.Е., ТупикА.Н., Лукашенко Т.А., Цымбалов А.И., Евстрапов А.А.)

Санкт-Петербургский государственный политехнический университет (Буляница А.Л.)

Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (ИТМО)

(Евстрапов А.А.)

Санкт-Петербургский академический университет — научно-образовательный центр нанотехнологий РАН (Евстрапов А.А.)

Контакты: Буляница Антон Леонидович, antbulyan@yandex.ru

Материал поступил в редакцию: 12.09.2014

NUMERICAL ESTIMATION OF DISTRIBUTION UNIFORM OF MOLECULAR COLONIES FOR dPCR RESULTS IMAGE ANALYSIS

A. L. Bulyanitsa1'2, G. E. Rudnitskaya1, A. N. Tupik1, T. A. Lukashenko1, A. I. Tsimbalov1, A. A. Evstrapov1'3'4

1 Institute for Analytical Instrumentation of RAS, Saint-Petersburg 2National Research University Saint-Petersburg State Polytechnical University 3ITMO University, Saint-Petersburg

4Saint-Petersburg Academic University — Nanotechnology Research and Education Center RAS

Molecular colony technique is one of the sensitive methods of genetic analysis. This technique was implemented on a planar microchip device with array of reaction chambers. The errors of analysis related to the distribution of molecular colonies in the reaction chamber are discussed. An approach based on order statistics is described in the paper. It provides two estimates of the measure of uniform distribution, that are analogues of basic concepts in statistics: point maximum likelihood estimates and interval estimates. Usefulness of this approach was illustrated by analysis of images, gets with cytokeratin's transcripts (CK-19) determination in sample.

Keywords: molecular colonies, microchip device, reaction chamber, quantitative analysis, measure of uniformity, order statistics

REFERENСES

1. M. Nygren (2000): Molecular Diagnostics of Infectious Diseases. Department of Biotechnology, Royal Institute of Technology, KTH, Stockholm, Sweden. ISBN 91-7170-504-X.

2. Vogelstein B., Kinzler K.W. Digital PCR. Proc. Nat. Acad. Sci. USA, 1999, vol. 96, pp. 9 236-9 241.

3. Mitra R.D., Church G.M. In situ localized amplification and contact replication of many individual DNA molecules. Nucleic Acids Res., 1999, vol. 27, no. 24,

p. e34.

4. Chetverin A.B., Chetverina H.V., Munishkin A.V. On the nature of spontaneous RNA synthesis by Q replicase. J. Mol. Biol., 1991, vol. 222, pp. 3-9.

5. Chetverin A.B., Chetverina H.V. Method for amplification of nucleic acids in solid media and its application for nucleic acid cloning and diagnostics. 1999. U.S. Patent 5,958,698.

6. Chetverin A.B., Chetverina H.V. Solid medium for amplification and expression of nucleic acids as colonies. 1999. U.S. Patent 6,001,568.

7. Tupik A.N., Evstrapov A.A., Rudnitskaya G.E., Lukashenko T.A. Design reaction chamber for digital PCR in gel. CD of extended abstracts of 2nd International conference "Implementation of Microreactor Technology in Biotechnology", 5-8.05.2013, Cavtat, Croatia. p. 79.

8. Easley C.J., Legendre L.A., Landers J.P., Ferrance J.P. Rapid DNA amplification in glass microdevices. Me-

Contacts: Bulyanitsa Anton Leonidovich, antbulyan@yandex.ru

HAYHHOE ÜPHEOPOCTPOEHHE, 2014, tom 24, № 4

thodsMol. Biol, 2006, vol. 339, pp. 217-732. 9. Cook L.M., Stokowski S.E. Filter materials. Handbook of laser Science and Technology. CRC press, Boca Raton, 1995. vol. IV: Optical Materials, part 2, p. 151.

Article arrived in edition: 12.09.2014

i Надоели баннеры? Вы всегда можете отключить рекламу.