Научная статья на тему 'Первичная обработка исходных данных микробиологических исследований'

Первичная обработка исходных данных микробиологических исследований Текст научной статьи по специальности «Математика»

CC BY
695
104
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕМЕНТАРНАЯ СТАТИСТИКА / МИКРОБИОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ / ELEMENTARY STATISTICS / MICROBIOLOGICAL INVESTIGATIONS

Аннотация научной статьи по математике, автор научной работы — Андрюков Борис Георгиевич, Тимченко Нелли Федоровна

Статистический анализ в микробиологии, как и в других медико-биологических исследованиях, является не самоцелью, а необходимым инструментом для описания и интерпретации полученных данных, обоснования и аргументирования полученных выводов и принятых решений, поддержки критического мышления. В статье рассмотрены понятия элементарной статистики и методы первичной обработки исходных данных применительно к микробиологическим исследованиям.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Андрюков Борис Георгиевич, Тимченко Нелли Федоровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Statistical analysis in microbiology, as well as in other biomedical research, not an end in itself but a necessary tool for the description and interpretation of data, rationale and reasoning of findings and decision-making, support for critical thinking. The article presents modern statistical methods, principles, application of statistical concepts and methods in typical cases, the analysis of experimental data of microbiological research. In the first part of the tensorexamined the concept of elementary statistics and methods of primary data in relation to microbiological research.

Текст научной работы на тему «Первичная обработка исходных данных микробиологических исследований»

ния факторов патогенности У. pseudotubercuilosis, а также сети, кодирующие нормальный механизм поддержания гомеостаза макроорганизма в норме, процессы множества многоуровневых механизмов формирования рецидивирующего, затяжного и хронического течения и системной патологии, генетические и эпигенетические факторы, влияющие на характер иммунного ответа.

Анализ семантических цепей развития ПТ позволил выявить ограниченность связующих отношений между объектом (У. pseudotubercuilosis) и этапом его внутриклеточного взаимодействия с организмом в плане участия факторов вирулентности в механизмах развития апоптоза, а также степени и маркерах участия митохондрий в развитии системного воспалительного ответа.

Andryukov B.G.

PSEuDoTuBERcuLoSIS AS SYSTEM ANALYSIS oBJEcT

FGBU - Scientific Research institute of Epidemiology and Microbiology, Siberian Branch of the Russian Academy of Medical Sciences, Vladivostok

Keywords: pseudotuberculosis, systems analysis, polymorphism, mechanisms of pathogenesis.

Сведения об авторе:

Андрюков Борис Георгиевич, заслуженный врач РФ, доктор медицинских наук, ведущий научный сотрудник лаборатории молекулярных основ патогенности бактерий Федерального государственного бюджетного «НИИ ЭМ» СО РАМН; 690005, Владивосток, ул. Ивановская, 4. Тел.: (423)253-94-43; e-mail: [email protected]

© Б.Г Андрюков, Н.Ф. Тимченко, 2013 r УДК 519.6

*Андрюков Б.Г, Тимченко Н.Ф.

ПЕРВИЧНАЯ ОБРАБОТКА ИСХОДНыХ ДАННыХ МИКРОБИОЛОгИЧЕСКИХ ИССЛЕДОВАНИЙ

*ФГБУ «1477 Владивостокский военно-морской клинический госпиталь» МО РФ;

ФГБУ «Научно-исследовательский институт эпидемиологии и микробиологии» СО РАМН, директор -Л.М. Сомова, г. Владивосток

Статистический анализ в микробиологии, как и в других медико-биологических исследованиях, является не самоцелью, а необходимым инструментом для описания и интерпретации полученных данных, обоснования и аргументирования полученных выводов и принятых решений, поддержки критического мышления. В статье рассмотрены понятия элементарной статистики и методы первичной обработки исходных данных применительно к микробиологическим исследованиям.

Ключевые слова: элементарная статистика, микробиологические исследования.

* автор-корреспондент: Андрюков Борис Георгиевич, e-mail: [email protected].

600005, Владивосток, ул. Ивановская, 4. Тел.(423) 246-78-14.

Введение

Без статистического анализа сегодня трудно представить себе ни одно экспериментальное или эмпирическое микробиологическое исследование. Объектом статистического анализа являются данные, полученные в ходе экспериментов или наблюдений. Не случайно появление микробиологии, как науки и статистики как метода произошло в мире практически одновременно, в 50-х годах XIX столетия, в результате новых идей и медицинских технологий. В этот период стала очевидной необходимость учета и лечения таких заболеваний, как холера и туберкулез, а также изучение инфекций хирургических ран, а статистика тогда употреблялось в значении обобщения любого количества данных. Впервые эти две науки сошлись вместе в 1854 г. во время эпидемии холеры

в Лондоне, когда английские врач Д. Сноу и итальянский микробиолог Ф. Пачини, эффективно использовав микробиологические знания и статистический методы, доказали водный путь возникновения и распространения вспышки, доказав несостоятельность миазматической теории болезни [1, 3, 6, 9].

Однако при формировании доказательной базы результатов исследований именно статистическая методология до сих пор вызывает у специалистов медико-биологического профиля, по выражению D.M. 1Мгир, «страх и трепет, а иногда отвращение и редко нежность» [13]. Отсутствие базовых математических знаний часто является преградой в освоении методов статистики. Возможно, для многих все дело в том, что статистика, как и химия, микробиология или медицина является такой же наукой и

заслуживает того, чтобы разобраться и понять ее основные принципы и внутреннюю логику [2, 8, 9, 11].

В контексте микробиологии, статистический анализ чрезвычайно полезен и важен в интерпретации и выводах, касающихся собранных в ходе эксперимента данных. Традиционно считается, что микробиология относится к естественнонаучным дисциплинам, в которых часто трудно получить действительно удовлетворительное количественное определение. Однако достаточно рассмотреть лишь роль и значение статистики при планировании микробиологических экспериментов, теории случайных процессов

- при изучении роста микроорганизмов или теории информации - при обсуждении некоторых вопросов изменении резистентности бактерий к антибиотикам, чтобы понять, что и в микробиологии существует много важных проблем, где математические методы обеспечивают такой результат, который невозможно достигнуть чисто описательным путем [4, 7, 12]. Кроме того, как и в других медико-биологических исследованиях, в микробиологии статистический анализ является не самоцелью, а необходимым инструментом для интерпретации и анализа полученных данных, обоснования и аргументирования полученных выводов и принятых решений, поддержки критического мышления [5, 10, 13].

Цель сообщения: попытка доступного изложения некоторых понятий элементарной статистики и методы первичной обработки исходных данных применительно к микробиологическим исследованиям.

Формирование статистической гипотезы

Начало любого исследования - это постановка научной проблемы, что влечет за собой формулирование гипотезы. Гипотезы могут быть научными (формулируются как предполагаемое решение проблемы) и статистическими (утверждение в отношении неизвестного параметра сформулированное языком статистики). Любая статистическая гипотеза требует соответствующего подтверждения, в противном случае она отвергается.

Статистическая обработка данных является инструментом для обоснования выводов, касающихся интересующей нас популяции (группы лиц, объединенных каким-либо признаком), на основе анализа репрезентативной (представительной) выборки из нее. Любой статистический анализ допускает, что обнаруженные (или необнаруженные) закономерности до известной степени могут оказаться случайными.

Переходя от общей постановки проблемы и дизайна исследования к расчетам, необходимо, прежде всего, сформулировать статистическую гипотезу. Она служит своеобразным связующим звеном между данными и возможностью применения статистических методов анализа, формулируя вероятностный закон разброса данных.

Выдвинутая статистическая гипотеза дает описание ожидаемых результатов исследования, с которыми сравниваются наблюдаемые. Если гипотеза верна, наблюдаемое отличается от ожидаемого лишь случайным образом, а именно - в соответствии с вероятностным законом этой гипотезы.

Статистические гипотезы подразделяются на нулевые и альтернативные. Нулевая гипотеза (Н0) предполагает отсутствие различий (корреляции, связи) между сравниваемыми выборками. В качестве контрольной выборки чаще всего выступает общепринятый стандарт (метод, подход). Нулевая гипотеза -это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий. Если же нулевая гипотеза отвергается, то принимается альтернативная гипотеза (На) - гипотеза о значимости различий. Эту гипотезу еще называют экспериментальной (т.к. это то, что мы хотим доказать).

Отличие наблюдаемого от ожидаемого измеряется вероятностной мерой. Если отличия между наблюдаемым и ожидаемым настолько велики, что вероятность того, что они являются случайными мала, - можно отвергнуть выдвинутую гипотезу как неверную. Обычно она отвергается, если вероятностная мера оказалась меньше или равна заранее установленному уровню значимости.

Во многих случаях исследователь-микробиолог интуитивно ставит перед собой задачу доказать, что «новый метод лучше старого», т.е. подтвердить альтернативную гипотезу. Это достаточно распространенное заблуждение относительно порядка применения статистических методов.

В микробиологии практически всегда единственным способом подтверждение научной гипотезы требует экспериментального подтверждения. Например, можно ли априори утверждать, что предлагаемая питательная среда более эффективна для культивирования микроорганизмов, по сравнению с ранее известной? Вряд ли - пока она не будет апробирована и результаты ее применения будут сопоставлены с результатами применения традиционных сред.

Проверка гипотез проводится на основе анализа многочисленных наблюдений и измерений, в результате которых мы получаем определенный массив (выборку) данных той или иной степени репрезентативности (представительности). Полученная выборка данных, должна обладать достаточной статистической мощностью для интерполяции полученных выводов об их закономерности.

Природа переменных, типы данных, их ввод и распределение.

Целью большинства микробиологических исследований является сбор или измерение данных для получения информации о микроорганизмах, закономерностях их жизни и развития, а также признаков, характеризующих их взаимодействия с организма-

ми людей, животных, растений и объектами окружающей среды. В статистической терминологии эти признаки называются переменными, т.к. индивидуальная величина их (характеристика), полученная в результате измерения, варьирует от субъекта к субъекту и может принимать различные значения. В микробиологии, например, такими объектами являются микроорганизмы и их признаки - морфологические и культуральные свойства, чувствительность к антибиотикам, факторы патогенности, титры антител, образующихся в организме при инфицировании, уровень заболеваемости и т. д. Переменным признакам можно противопоставить постоянные величины, то есть неотъемлемую индивидуальную характеристику отдельного объекта. Например, все бактериальные организмы имеют клеточное строение, что является величиной постоянной, в то время как строение клетки отдельного представителя микроорганизмов - величина переменная.

Для извлечения нужной информации имеющиеся данные необходимо сгруппировать, проанализировать и обобщить, для чего и используются статистические методы (тесты). Для правильного и корректного выбора статистического теста необходимо учитывать характер данных, включаемых в анализ: типы переменных, возможные зависимости между ними и формы их распределения. Различают зависимые (значения, которых можно только измерять) и независимые (значения которых в процессе эксперимента можно изменять) переменные.

Эта классификация легла в основу многих современных вариантов и модификаций систематизации типов переменных, которые продолжают совершенствоваться до настоящего времени. Большинство из предлагаемых статистических компьютерных программ построены на определенных схемах классификации типов переменных, и имеет принципиальное значение для корректного выбора статистических тестов (рис.1).

Переменные

Качественные

(категориальные)

Количественные

(числовые)

Вторичные

(производные)

Номинальные

(альтернативные)

Дискретные

(цельночисленные)

Проценты

Порядковые

(ординальные)

Непрерывные

Пропорции

(отношения)

Интенсивность

Рис. 1. Классификация типов переменных

Все переменные и результаты измерений (наблюдений) можно разделить на два типа: качественные (категориальные) и количественные (числовые). Качественные переменные могут принадлежать к различным типам (категориям).

Наиболее распространенным и простым типом количественных переменных являются непрерывные, которые могут принимать любые числовые значения и не имеют никаких ограничений. Примером непрерывных данных может быть число выросших колоний, рост, количество штаммов, количество обследованных проб, данные лабораторных исследований, вес, молекулярная масса, пульс и т.д.

Второй тип количественных данных - дискретные переменные. Они способны принимать только определенные числовые значения, могут обозначить целочисленные данные или ранжировать данные по степени проявления на ранговой шкале (титр антител, микробное число и т.д.).

Если каждый тип категориальных переменных нельзя отранжировать по отношению к другим, то такая переменная обозначается как номинальная (альтернативная). Эта шкала достаточно часто используется для анализа переменных в микробиологии. Они являются неупорядоченными и используются для качественной классификации. Примером номинальных переменных могут быть определенные категории микроорганизмов: чувствительные, умеренно-резистентные и резистентные (по отношению к определенным антибиотикам), диссоциативные формы штаммов, факторы патогенности (бактерий), патогенные-непатогенные (микроорганизмы), высоковирулентные-низковирулентные (штаммы). Переменные этого типа, в частности, могут быть бинарными (дихотомическими) и иметь категорические значения: например, да/нет, грамположитель-ные/грамотрицательные (микроорганизмы).

Порядковыми (ординальными) переменными в микробиологии являются те данные, в которых предусматривается наличие определенных градаций и категорий (например, стадии и формы инфекционного заболевания, чувствительность диагностических тестов и методов и т.д.).

Другие типы переменных достаточно часто используются в микробиологических исследованиях. Они включают в себя производные (вторичные) данные (проценты, пропорции, интенсивность, метки, оценки), а также цензурированные величины. Анализ результатов научных исследований, выполненных специалистами-бактериологами, показывает, что, к сожалению, значительное количество авторов ограничивается оценкой вторичных данных, на основании которой делают выводы.

После выполнения какого-либо исследования (наблюдения) полученные переменные необходимо собрать для дальнейшего анализа и систематизации. В недавнем прошлом для этих целей использовали специально разработанные формы и анкеты, выполненные на бумажных носителях. В современных условиях широкое распространение компьютерной техники позволяет использовать для

этих целей текстовые или табличные редакторы, позволяющие успешно решать задачи ввода и сохранения данных. Типичная электронная таблица состоит из строк (проб) и колонок (переменных), которые при необходимости легко группируются и расширяются. Форма таблицы и последовательность ввода данных разрабатываются при планировании дизайна исследования.

Опыт показывает, что наибольшие проблемы возникают при введении качественных (категориальных) переменных. Этому типу данных необходимо присво-

ить числовые коды (1, 2, 3, 4 и т.д.), а для бинарных данных удобно использовать коды 1 или 0. Например, при исследовании микроорганизмов из полости рта при различных заболеваниях были идентифицированы ряд представителей микрофлоры и грибов, которым для внесения в таблицы данных были присвоены коды: Staph. aureus (1), L. bucalis (2), E. gingivalis (3), Tr. tenax (4), Borrelia (5), Fusobacterium (6), C. albicans (7) и т.д. Эти коды вместе с числовыми (количественными) переменными последовательно вносятся в электронные таблицы (рис. 2).

1 = Stap h. au геи s

2 = L. bu са lis

I 3 = E.gingivalis..

1 = норма 2= пародонтит I 3 = стоматит

№ № Дата рождения ПОЛ Дата исследования Микроорганизм Окраска по Граму Патология

1 13/02/1 981 1 12/04/2011 1,3,5, 9, 11 1 2

2, 8, 12, 14, 16 0

2 1 1/03/1 984 2 1 1/04/2011 5, 7, 11,13 1 1

4, 8, 10, 12, 14 0

3 1 7/1 2/1 98 3 1 14/04/2011 1 , 5, 7, 9, 12 1 1

4, 8, 10, 12, 14 0

4 15/1 0/1 98 0 2 12/04/2011 1 , 7, 9, 12 1 2

2, 6, 12, 14,16 0

5 1 7/05/1 973 2 13/04/2011 3, 5, 7, 9, 1 1 1 1

6, 12, 14 0

6 0 7/02/1 98 0 1 11/04/2011 1 , 5, 7, 9, 1 1 1 2

2,14, 16 0

7 22/1 1/1 981 1 14/04/2011 3, 7, 9, 11 , 12 1 1

4, 8, 12, 14 0

8 14/02/1 97 9 1 10/04/2011 5, 9, 1 1, 13, 1 5 1 1

6, 12, 14, 18 0

9 2 7/1 2/1 982 2 12/04/2011 5, 9, 1 1, 13, 1 5 1 2

2, 6, 12, 14, 1 6 0

10 1 7/07/1 97 9 2 13/04/2011 7, 9, 1 1, 12, 15 1 2

2, 10, 14, 18 0

Рис. 2. Кодовая схема ввода качественных переменных электронной таблицы (исследование микроорганизмов из полости рта при различных заболеваниях)

Форма плотности распределения - для непрерыв- рической гистограммой, показывая, с какой часто-

ных переменных, или форма весовой функции - для той значения переменной попадают в определенные

дискретных переменных, может выражаться эмпи- интервалы или принимают определенные значения.

+1а +2а +3а

т-—г“—Г ' Ч——п—"“I----------------------1-------1------1-----г

0 0,4 0,8 1,2 1,6 2,0 2,4 2,8 3,2 3,6 4,0 4,4 4,8 5,2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Диаметр колоний, мм

Рис. 3. Нормальное (гауссово) распределение переменных (диаметры колоний Y. enterocoliticа на среде Серова)

В медицине и в микробиологии, к сожалению, очень мало переменных имеют математически точное нормальное (гауссово, т.е. соответствующее закону Гаусса-Лапласа) распределение. При таком распределении количественные значения непрерывных данных располагаются симметрично вокруг среднего или среднего значения, кривая их распределения имеет форму колокола, и математически описываются формулой, включающей два параметра - среднее значение и стандартное отклонение.

В качестве примера нормального распределения на рис. 3 приведен пример значений диаметров колоний У еПегосоШса на среде Серова (в мм). При рассмотрении этой диаграммы обращает на себя внимание симметричность кривой: это говорит о том, что в нормальном распределении большие и малые значения переменных (в данном случае, диаметров) встречаются с одинаковой частотой.

Например, при исследовании ростовых свойств питательной среды Серова для идентификации У еПегосоПйса после суточной инкубации выявлены матовые колонии с неровным краем со средним диаметром 2,62±0,41 мм. Варьирование количественных оценок диаметра колоний, значения которых находились выше или ниже среднего значения симметрично вокруг него, напоминало колоколообразную кривую. Характерной особенностью нормального распределения переменных является то, что чем больше отклоняется значение отдельной переменной от среднего значения, тем реже она встречается и наоборот. Иначе говоря, частота отклонений (от среднего значения) является функцией их величины.

Оценка соответствия нормального распределения («нормальности») выполняется с помощью специальных статистических программ, т.н. критериев согласия (например, критерии Пирсона, Колмогорова и другие). Однако применение критериев согласия требует обычно довольно значительного объёма данных. Так, критерий Пирсона обычно рекомендуется использовать при объёме выборки не менее 50-100. Поэтому при небольшом объёме выборки проверку гипотезы

о виде функции распределения проводят приближёнными методами - графически (с помощью построения гистограммы) или по значениям асимметрии (показатель, отражающий степень несимметричности кривой дифференциальной функции экспериментального распределения по сравнению с дифференциальной функцией нормального распределения) и эксцесса (показатель, отображающий вытянутость (возвышение) кривой дифференциальной функции экспериментального распределения по сравнению с дифференциальной функцией нормального распределения).

Требование определения нормальности является необходимым, но недостаточным для применения популярного среди микробиологов t-критерия Стью-дента. Должно выполняться и равенство генеральных дисперсий в сравниваемых группах, что диктует необходимость применение F-критерия Фишера, критерии Кохрана, Вальда и др.

В программе MS Excel есть встроенные стандартные статистические функции (ВСТАВКА-ДИАГРАММА и ВСТАВКА-ФУНКЦИИ) для построения диаграммы и расчета асимметрии (функция СКОС) и эксцесса (функция ЭКСЦЕСС). Использование этих функций позволит сэкономить массу времени и усилий исследователя.

В медико-биологических исследованиях, однако, гораздо чаще встречается, так называемый, перекос распределения переменных, в которых большинство результатов сосредоточены на одной конце распределения с длинным хвостом значений, распространяющимся в противоположном направлении. В качестве примера на рис. 4 приведено распределение значений диаметров колоний Micrococcus roseus на среде Мюллера (в мкм).

Причинами перекоса распределения переменных могут быть также нарушения правил выборки, когда в процессе отбора одним представителям совокупности отдают предпочтения перед другими. При такого рода распределения непрерывных переменных используют непараметрические статистические методы (например, U-критерий Манна-Уитни). Однако именно непараметрические критерии при статистическом анализе переменных в микробиологии применяют достаточно редко.

Рис. 4. Перекос распределения переменных (диаметры колоний Micrococcus roseus на среде Мюллера)

Таким образом, выбор метода статистического анализа зависит от типа распределения переменных. Примеры применения параметрических и непараметрических статистических методов в микробиологических исследованиях будут рассмотрены ниже.

Шкалы измерения

Тип переменных, их оценки, значения, а также статистические операции, которые можно с этими данными осуществлять оцениваются различными шкалами измерения. Шкала представляет собой числовую систему - совокупность возможных значений какой-либо переменной. Первое отличие заключается в качественном и количественном характере шкалы, а также допустимостью математических действий.

Различие шкал определяется их информативностью. По типам переменных существуют несколько типов шкал: дискретные, непрерывные, номинальные (номинативные), порядковые (ординальные), отношений, интервальные и другие. Рассмотрим некоторые из них.

Номинальная (синонимы: номинативная, наименований, категориальная, классификационная) шкала -это шкала, классифицирующая объекты по названию (например, микроорганизмы - по их принадлежности к семействам, родам, видам, типам, т.е. по признаку, с помощью которого один объект наблюдения - в данном случае, микроорганизм, можно отличить от другого). Соответственно, это шкала неколичественная, так как в ней можно посчитать только количество объектов в классах и относительную частоту встречаемости признака. Единица измерения этой шкалы - это одно измерение. Примером номинальной шкалы является таксономические классификации бактерий и вирусов. Простейший и достаточно распространенный в микробиологии вариант номинальной шкалы - дихотомическая шкала, состоящая всего из двух ячеек-признаков, например: «патогенный (микроорганизм) - непатогенный», «грамположительный - грамотрицательный», «функциональный - структурный» (признак), «отрицательная - положительная» (реакция) и т.п. Может оказаться, что в процессе повторения экспериментов различия между «классами» может стираться и, в конечном итоге, корректнее можно было бы говорить о вероятностной принадлежности к тому или иному классу (группе, профессии, контингенту, роду, виду и т.д.). Таким образом, нет оснований рассматривать номинальную шкалу в качестве простейшей, начальной в уровнях измерений в микробиологии. Однако необходимо знать, что переменные, относящиеся к этому типу шкал, допускают очень ограниченные возможности для проведения анализа. С точки зрения выполнения математических действий, номинальная шкала все же является самой «бедной». Исключение составляют дихотомические переменные. Для них можно, по крайней мере, определять ранговую корреляцию. Если, например, есть патогенные и непатогенные («да-нет») виды иерсиний и есть плазмидсодержащие и безплазмидные штаммы иерсиний. Обнаруживается зависимость наличия некоторых факторов патогенности, обуславливающих вирулентность иерсиний с на-

личием у нее плазмиды (40-45 мДа), что доказывается вычислением коэффициентов ранговой корреляции.

Проведя классификацию объектов по названию, мы получаем возможность перейти от качественных характеристик к количественным, т.е. от наименований - к числам.

Порядковая (ранговая) шкала - это шкала, классифицирующая объекты по принципу «больше - меньше», т.е., она позволяет упорядочить наблюдения по какому-либо признаку. Если для номинальной шкалы было безразлично, в каком порядке располагаются переменные (объекты), то в порядковой шкале они образуют последовательность от меньшего к большему (значению признака) или наоборот. Соответственно, этот тип шкалы предполагает измерение (ранжирование) по какому-либо признаку. Например, проранжируем некоторые патогенные микроорганизмы по величине инфицирующей дозе (ГО): Sh. dysenteriae - 1 (10 - 100 клеток бактерий);

S. 1урЫ - 2 (105 клеток); V. Ло1егае еЬог - 3 (106 клеток); Е. соН 0124 - 4 (108 клеток). При порядковых измерениях числа (1, 2, 3, 4...) обеспечивают некоторую экономию при передаче информации. При этом номера присваиваются так, что учитываются только признаки однозначности и порядка. Поэтому, например, вычисление средних значений в порядковой шкале не является корректным. При использовании бальных оценок (рангов) необходимо применить вычисление иной характеристики - расчет медианы. Другой известной порядковой шкалой является чувствительность микроорганизмов к какому-либо антибиотику: чувствительные (1), умеренно-резистентные (2) и резистентные (3).

Дискретная шкала - это шкала, в которой множество возможных значений оцениваемой величины конечно, например, в баллах (от 1 до 5), крестах (от 1 до 4), титрах. Примером такой шкалы применительно к микробиологическим исследованиям является измерение титров антител в сыворотке крови пациента (1:200; 1:400 ... 1:1600 и т.д.). Поэтому, например, вычисление средних значений в шкалах, использующих бальную оценку (дискретная, порядковая) не является корректным. При использовании бальных оценок необходимо применить вычисление иной характеристики - медиану.

Интервальная шкала достаточно часто применяется при бактериологических исследованиях при оценке, например, временных и температурных условий (культивирования микроорганизмов, инкубации, протекания реакций). Числовые значения в интервальной шкале условны, т.к. имеют произвольную точку отсчета и имеют значения отношения длин интервалов. Согласитесь, нельзя сказать, что температура 30оС в два раза больше, чем 15оС. То есть, в этой шкале есть «0», но он условен и принят только для удобства. Над переменными в данной шкале можно выполнять операцию определения расстояния, измерение разницы температур. Над полученными числовыми значениями можно выполнять любые арифметические операции.

Непрерывная шкала, в отличие от дискретной, это шкала в которой множество возможных значений оценивается в бесконечных величинах. Эта шкала исполь-

зуется для переменных, измеряемых действительными числами. Например, величина экстинкций, размеры, активность, концентрация веществ в растворах и т.п.

И, наконец, статистическая шкала - отношений, позволяющая оценивать во сколько раз оцениваемый признак какого-либо объекта больше (или меньше) другого. Эта шкала похожа на интервальную, отличаясь произвольным масштабом измерения (и, соответственно, наименованием единиц измерения), но в ней есть реальное нулевой значение. Примером такой шкалы в микробиологии может быть длина, ширина, диаметр микробной клетки, продолжительность инкубационного периода, активность токсина, время и скорость реакции, массы, объемы и концентрации веществ и т.д. Над числами, полученными в результате измерения в этой шкале, можно выполнять любые арифметические действия. Набор допустимых значений для данной переменной называется областью его значений.

Для чего исследователю-микробиологу знать о типах шкал и переменных?

В статистических исследованиях шкалы различаются по мощности (информативности): номинальная

- порядковая - интервалов - отношений. Каждая шкала имеет соответствующую ей оценку тенденции к схождению и разбросу переменных. Конечной целью любого научного анализа или научного исследования является выявление зависимостей между переменными. Философия науки учит, что не существует иного способа представления знаний, кроме как в оценке связей между количествами и качествами переменных, и в этом заключено развитие науки.

Выбор варианта оценки зависит от шкалы, используемой для измерения и от целей статистического анализа.

ЛИТЕРАТУРА

1. Бейли Н. Математика в биологии и медицине. М.: Мир, 1970. 327 с.

2. Гельман В.Я. Медицинская информатика (практикум). СПб.: Питер, 2002. 480 с.

3. Гланц С. Медико-биологическая статистика: Пер с англ. М. 1999. 368 c.

4. Дюк В. Обработка данных на ПК в примерах. СПб.: Питер, 1997. 240 с.

5. Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. СПб.: Фолиант, 2003. 432 с.

6. Лукьянова Е.А. Медицинская статистика. М.: РУДН, 2002. 246 с.

7. Медик В.А., Фишман Б.Б., Токмачев М.С. Руководство по статистике в медицине и биологии. В 2-х томах. Т. 1. М.: Медицина, 2000. 412 с.

8. Медик В.А., Фишман Б.Б., Токмачев М.С. Руководство по статистике в медицине и биологии. В 2-х томах. Т. 2. М.: Медицина, 2001. 352 с.

9. Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте: типовые случаи. Волгоград, ВолГМУ, 2005. 84 с.

10. Петри А., Сэбин К. Наглядная статистика в медицине. М.: ГЭОТАР-МЕД, 2003. 144 с.

11. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология, логика, компьютерные методы. М.: РАМН, 2000. 52 с.

12. Paulson D. S. Biostatistics and Microbiology: A Survival Manual. USA Springer Science Business Media LLC, 2009. 216 рр.

13. Ilstrup D. М. Statistical Methods in Microbiology // ain. Microbial. Rev. 1990. Vol. 3, No. 3. p. 219-26.”

*Andryukov B.G., Timchenko N.F.

STATISTICAL ANALYSIS EXPERIMENTAL DATA MICROBIOLOGYCAL RESEACH: PRIMARY Data PRocESSING

federal state fiscal agencies «1477 navy clinical Hospita» of the Ministry of Defense of the Russian Federation; Federal State budgetary institution, «Research institute of Epidemiology and Microbiology” SB RAMS, director -L.M. isachkova, Vladivostok

Statistical analysis in microbiology, as well as in other biomedical research, not an end in itself but a necessary tool for the description and interpretation of data, rationale and reasoning of findings and decision-making, support for critical thinking. The article presents modern statistical methods, principles, application of statistical concepts and methods in typical cases, the analysis of experimental data of microbiological research. In the first part of the tensor-examined the concept of elementary statistics and methods of primary data in relation to microbiological research.

Keywords: elementary statistics, microbiological investigations.

Corresponding author: B. G. Andryukov, e-mail: [email protected]. 600005, Vladivostok, Ivanovskaya str., 4. Tel. (423) 253-94-43.

Информация об авторах:

Андрюков Борис Георгиевич, заслуженный врач РФ, доктор медицинских наук, ведущий научный сотрудник лаборатории молекулярных основ патогенности бактерий Федерального государственного бюджетного «НИИ ЭМ» СО РАМН; 690005, Владивосток, ул. Ивановская, 4. Тел.: (423)253-94-43; e-mail: [email protected] Тимченко Нелли Федоровна, заслуженный деятель науки РФ, профессор, доктор медицинских наук, лауреат Государственной премии СССР, заведующая лабораторией молекулярных основ патогенности бактерий Федерального государственного бюджетного «НИИ ЭМ» СО РАМН; 690068, Владивосток, Пр. 100-летия Владивостоку, д. 115, кв. 13. Тел.: (423)232-03-66; e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.