Научная статья на тему 'Базовые методы описательной статистики в микробиологических исследованиях'

Базовые методы описательной статистики в микробиологических исследованиях Текст научной статьи по специальности «Математика»

CC BY
2490
426
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕМЕНТАРНАЯ СТАТИСТИКА / МИКРОБИОЛОГИЧЕСКИЕ ИССЛЕДОВАНИЯ / ELEMENTARY STATISTICS / MICROBIOLOGICAL INVESTIGATIONS

Аннотация научной статьи по математике, автор научной работы — Андрюков Борис Георгиевич, Тимченко Нелли Федоровна

Статистический анализ в микробиологии, как и в других медико-биологических исследованиях, не является самоцелью, а необходимым инструментом для описания и интерпретации полученных данных, обоснования и аргументирования полученных выводов и принятых решений, поддержки критического мышления. Корректное и правильное понимание статистических понятий и методов позволит повысить объективность достоверность результатов исследований, правомочность сформулированных выводов. В статье рассмотрены понятия и методы описательной статистики представление и описание совокупности данных микробиологических исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Statistical analysis in microbiology, as well as in other biomedical research vaniyah, not an end in itself but a necessary tool for the description and interpretation of data, rationale and reasoning of findings and decisionmaking, support for critical thinking. Correct and correct understanding of statistical concepts and methods will improve the objectivity of the validity of the study of the, validity of the findings. The article deals with the concepts and methods of descriptive statistics and view the description of a data set of logical microbiological studies.

Текст научной работы на тему «Базовые методы описательной статистики в микробиологических исследованиях»

Эхокардиографическая картина этих состояний представлена уплотнением, утолщением листков перикарда, значительным перикардиальным выпотом, в некоторых случаях- массивными наложениями фибрина на листках перикарда(опухолевые заболевания), синдромом «качающегося сердца»(опухолевые заболевания), расширением нижней полой и печёночных вен, нарушением внутрисердечной гемодинамики в виде патологической регургитации крови на атриовентрикулярных клапанах, нарушением диастолической функции миокарда желудочков.

Выводы.

1. Сочетание трансторакальной эхокардиографии с доппплерографией является высокоинформативным, неинвазивным и общедоступным диагностическим методом раннего выявления синдрома «патологического количества жидкости в полости перикарда» на поликлиническом этапе обследования.

2. ТЭХОКГ и ДопплерЭХОКГ при динамическом обследовании позволяют следить за течением заболевания, таким образом влияя на выбор тактики лечения , оценивают исход заболевания.

3. Современное развитие кардиохирургии приводит к значительному увеличению ультразвуковых исследований сердца на поликлиническом этапе послеоперационного наблюдения перикардитов, связанных с медицинскими вмешательствами, так как данная методика является ведущей при обследовании этой патологии.

ЛИТЕРАТУРА

1. Домницкая Т.М., Зотова А.С. Множественное абсцедирование клапанного аппарата сердца у больного с вторичным инфекционным эндокардитом // Кардиология. 2008. №7. С. 4-9.

2. Коваленко В.Н. Некоронарогенные болезни сердца. Практическое руководство, Киев, Морион, 2001.

3. Гиляревский С Р. Диагностика и лечение заболеваний перикарда, современные подходы. М.: Медиа Сфера, 2004.

4. Новиков В.И., Маджидиан С., Новикова Т.Н. Бессимптомный перикардиальный выпот у больных с ИБС на фоне синусового ритма и фибрилляции предсердий // Ультразвуковая и функциональная диагностика. 2007. №3. С. 54-57.

simakov v.P., shcherbakov N.V., valova L.v., Tolstobrova G.v.

transthoracic echocardiography, doppler in the diagnosis of pericarditis in the advisory diagnostichekoy polyclinics

consultative Diagnostic clinic FGKu «1477 vmKG» the Defense Ministry, vladivostok.

The article provided details of his own observations in the diagnosis of pericarditis conditions of separation of functional diagnostics KDP FGKU «VMKG 1477» Defense of the Russian Federation for the period 2007-2011, the methods of transthoracic echocardiography, Doppler ultrasound, electrocardiography. It is concluded that the diagnostic value of ultrasonic methods in the diagnosis of pericarditis.

Keywords: pericarditis, ultrasound diagnostics.

Сведения об авторах:

Симаков Валерий Павлович, заместитель заведующего КДП ФГКУ «1477 ВМКГ» МО РФ. Домашний адрес: Г. Владивосток, ул. Русская, д. 111, кв. 113; е-mail: 908853@mail.ru

Щербакова Наталья Вадимовна, заведующий кабинетом УЗИ сердечно-сосудистой системы ОФД КДП ФГКУ «1477 ВМКГ» МО РФ. Домашний адрес: г. Владивосток, ул. Экипажная, д.41 кв.15.Тел. 89084536466; е-mail: 027nata027@bk.ru

Валова Лариса Саркисовна, заведующий ОФД КДП ФГКУ «1477 ВМКГ» МО РФ. Домашний адрес: г. Владивосток, ул. Светланская, 143, кв. 7. Домашний телефон 2 22 75 39.

Толстоброва Галина Васильевна, врач функциональной диагностики ОФД КДП ФГКУ «1477» ВМКГ МО РФ. Домашний адрес: г. Владивосток, ул. Толстого, 30, кв. 104; тел.: 2660654.

© Б.Г Андрюков, Н.Ф. Тимченко, 2013 г УДК 519.6

*Андрюков Б.Г, Тимченко Н.Ф.

базовые методы описательной статистики в микробиологических ИССЛЕДОВАНИЯХ

ФГКУ «1477 Военно-морской клинический госпиталь МО РФ»;

ФГБУ «НИИ эпидемиологии и микробиологии им. Г.П. Сомова» СО РАМН, г. Владивосток

Статистический анализ в микробиологии, как и в других медико-биологических исследованиях, не является самоцелью, а необходимым инструментом для описания и интерпретации полученных данных,

обоснования и аргументирования полученных выводов и принятых решений, поддержки критического мышления. Корректное и правильное понимание статистических понятий и методов позволит повысить объективность достоверность результатов исследований, правомочность сформулированных выводов. В статье рассмотрены понятия и методы описательной статистики представление и описание совокупности данных микробиологических исследований.

Ключевые слова: элементарная статистика, микробиологические исследования.

Введение

Для специалистов медико-биологического профиля корректное и правильное применение статистических методов для обработки и анализа данных, полученных в ходе экспериментальных исследований, является не менее важным, чем наличие базовых навыков и знаний. В наши дни доступность компьютерной техники и программного обеспечения дает широкие возможности в обработке результатов деятельности, однако. комплексная статистическая обработка представляет собой достаточно сложную задачу. Безусловно, овладеть всеми секретами статистического анализа не под силу врачу или биологу, не имеющим специального математического образования, однако они должны знать и понимать его основные принципы. Корректное и правильное понимание статистических понятий и методов позволит повысить объективность достоверность результатов исследований, правомочность сформулированных выводов [1,4].

Характер отечественных вузовских программ подготовки специалистов-микробиологов не предусматривает детального изучения прикладной статистики. Подготовка на этапах последипломного образования и аспирантуры по основам медицинской информатики вообще отсутствует. В тоже время современный уровень развития микробиологии все больше требует понимания основы и логики применения методов статистического анализа, рационального и корректного применения доступных программно-технических средств [2,7].

Статистическое сопровождение научных исследований, представленных в виде диссертаций или публикаций всеми признается важной и необходимой составляющей, однако анализ отечественной научной периодики и авторефератов, показали, что до 55% авторов либо вообще не используют статистическую обработку результатов исследований, либо делают это некорректно [3, 6, 9]. Аналогичные исследования, проведенные за рубежом, также показали недостаточно обоснованное применение методов статистического анализа [5,10,11].

Между тем, теория и практика доказательной медицины, ищущей пути повышения эффективности диагностики и лечения, диктуют необходимость статистически обоснованных выводов и аргументов, отхода от интуитивных обобщений и описательного подхода к результатам исследований [8].

Традиционно считается, что микробиология относится к естественнонаучным дисциплинам, в

которых часто трудно получить действительно удовлетворительное количественное определение. Однако достаточно рассмотреть лишь применение статистики при планировании экспериментов, теории случайных процессов - при изучении роста микроорганизмов или теории информации - при обсуждении некоторых вопросов изменении резистентности бактерий к антибиотикам, чтобы понять, что и в микробиологии существует много важных проблем, где математические методы обеспечивают такой результат, который невозможно достигнуть чисто описательным путем.

Целью данного сообщения является попытка в упрощенной и доступной форме изложить основы современных наиболее распространенных методов описательной статистики применительно к микробиологическим исследованиям.

Множество мыслимых изучаемых объектов называется генеральной совокупностью, измерить которую достаточно сложно, а иногда не представляется возможным. Например, невозможно дать какую-либо количественную характеристику всех микроорганизмов данного вида (рода, серотипа). Для выполнения практических научных целей и задач обычно используют выборочный метод наблюдения, при котором исследуется некоторая совокупность данных (переменных), составляющих от нескольких десятков до несколько тысяч результатов измерений индивидуальных характеристик. Она так и называется

- выборочная совокупность или просто - выборка.

Для корректной интерполяции полученных в результате исследований выборочной совокупности на всю генеральную совокупность выборка должная быть репрезентативной (представительной) и удовлетворять требованиям: а) - случайности и независимости и б) - достаточной численности.

В статистике принято различать два вида выборочной совокупностей по объему: большие выборки (100-200 и более чисел переменных) и малые выборки - с числом вариантов менее 30.

На современном уровне развития науки ни одно сколько-нибудь существенное обобщение в микробиологии невозможно без использования параметров описательной статистики. В процессе наблюдений или исследований в эксперименте накапливаются десятки, сотни, а иногда и тысячи единиц наблюдений, первичных результатов (совокупность), которые необходимо сгруппировать и описать. Методы описательной статистики помогают выполнить эту

задачу с помощью различных обобщающих величин, в частности, определения средних величин изучаемых явлений и процессов, оценке разброса данных по отношению к найденной центральной тенденции.

Основными задачами описательной статистики являются:

- группировка данных и определение числовых характеристик переменных;

- определение статистических рядов переменных и оценка их соответствия распределения;

- оценка значимости различия показателей в выборках.

Группировка данных.

Для группировки данных необходимо расположить все однородные совокупности величин в возрастающем порядке. Уже при первом взгляде на полученные ряды можно заметить, что одни значения встречаются чаще, а другие - реже. При группировке данные с одинаковыми или близкими значениями объединяют в классы и определяют частоту каждого класса.

Для наглядного представления и первичного визуального анализа результатов измерений характеристик экспериментальных и контрольных данных используют показатели описательной характеристики, состоящие из нескольких групп показателей: положения, разброса, ассиметрии, гистограмма и др.

Показатели положения описывают положение данных на числовой оси (максимум и минимум выборки, среднее арифметическое значение, медиана, мода и др.).

Показатели разброса описывают степень разброса данных относительно среднего значения (дисперсия, размах и др.).

Показатели ассиметрии: положение медианы относительно среднего значения и др.

Определение числовых характеристик переменных.

Числовые характеристики переменных подразделяются на три вида: положения, рассеяния и распределения.

Для количественного выражения положения наиболее часто рассчитывают показатели средней арифметической величины - х (mean), медианы - Me (median) и моды - Mo (mode).

К характеристикам рассеяния значений переменных относятся: минимальное (min) и максимальное (max) значения выборки, дисперсия («S'2), среднее квадратичное отклонение (S), 25%-й (LQ) и 75%-^UQ) квартили и межквартильный размах (RQ = UQ - LQ), стандартная ошибка среднего значения (mj), 95% доверительный интервал истинного среднего значения.

Количественные характеристики распределения характеризуют показатели ассиметрии (As) и эксцесса (Ех).

Ниже будут приведены формулы расчетов этих значений, однако на практике современные исследователи обычно пользуются калькуляторами со специальными функциями, либо используют одну из компьютерных систем обработки данных, знание которых является в наши дни обязательным элементом эрудиции любого врача или биолога.

Мода является наиболее простым из всех показателей и соответствует наиболее частому числовому значению переменных в выборке. В случаях, когда ряд переменных имеет 2 моды, говорят о бимодальном распределении, имея в виду, что данная совокупность имеет две относительно самостоятельные группы переменных.

Например, по результатам бактериологического обследования контактных по коклюшу в 2002-2010 гг. был выявлен % положительных результатов: 1,3; 1,4; 1,2; 1,6; 1,7; 1,4, 1,5; 1,8; 1,4. Для этого ряда данных мода будет равна 1,4, т.к. именно это значение встречается чаще (3 раза).

Медиана соответствует срединному значению переменной, которая делит ранжированный ряд значений на две равные по численности части. Так для вариационного ряда данных из предыдущего примера медианой будет величина 1,4 (ранжирование: 1,2; 1,3; 1,4; 1,4; 1,4; 1,5; 1,6; 1,7; 1,8) . В случае, если число данных четное, медиана равна средней арифметической между значениями, находящимися в ряду на n/2 и n/2+1 местах.

Например, при санитарно-гигиеническом обследовании методом смывов на бактерии группы кишечной палочки 8 столовых и 7 детских садов было выявлено, соответственно 2,2; 2,5; 3,1; 4,2; 2,8; 3,3; 3,5; 3,6 (%) и 2,9; 2,3; 1,9; 2,0; 2,5; 2,2; 2,5 (%) положительных проб. В первом ряду данных значение медианы соответствует средней арифметической между значениями, находящимися в ряду на 4 и 5 местах ранжированного ряда (т.е. (3,1 + 3,3)/2) и равно 3,2. Во втором ряду данных медиана соответствует четвертому значению ранжированного ряда, т.е. 2,3. На значения медианы практически не влияют редкие экстремальные значения переменных. Медиану используют в методах непараметрической статистики.

В богатой библиотеке статистических методов компьютерной программы Microsoft Excel для Windows определение моды и медианы легко проводится применением инструмента Вставка\Мастер функций\Статистиче ские функции\Мода(Медиана). Кроме того, современные многочисленные пакеты прикладных программ статистического анализа (Statistica for Windows, Statgraphics plus for Windows. SPSS и др.) предоставляют широкие возможности для определения числовых характеристик выборки.

Средняя арифметическая (jc) - величина, характеризующая одним числовым значением ряд

индивидуально варьирующих переменных. Она является основной характеристикой выборки по количественным признакам. С одной стороны, именно в средней величине, характеризующей совокупность наблюдений, происходит сглаживание индивидуальных особенностей, и проявляются те или иные устойчивые тенденции, с другой - этот показатель сильно зависит от разброса данных (выбросов) и размера выборки: чем меньше выборка, тем больше влияние выбросов на значения средних. Необходимым условием научного применения средних величин является качественная однородность изучаемой совокупности.

В микробиологии средние величины достаточно широко используются при изучении явлений, характеризуемых количественными признаками, которые можно измерить такие показатели, как размеры бактериальной клетки, оптимальные диапазоны культивирования: рН, температуры и другие. Средние величины также распространены и при научных исследованиях.

Для того, чтобы вычислить среднюю арифметическую для ряда переменных нужно суммировать эти переменные и полученную сумму разделить на число переменных (обозначаемую как п).

В общем виде формула расчета средней арифметической величины имеет вид:

В общем виде формула расчета средней взвешенной арифметической величины имеет вид:

X + X + X + ...X , = ,

Зс=—----2----3-------п = ^=^, (1)

п п

где х - средняя арифметическая величина; х1 + х2 + х3 + ...х - значения переменных; п - число наблюдений; £ - знак суммирования.

Например, при изучении группы 5 штаммов стафилококка было обнаружено, что представители каждого из них имели разные показатели антили-зоцимной активности: 34,60; 28,80; 36,50; 26,80 и 30,70.

Средняя арифметическая величины данного признака у этих штаммов стафилококка составит:

34,6 + 28,8 + 36,5 + 26,8 + 30,7 157,4 х= = =31,48 (2)

В приведенном примере каждое числовое значение частоты встречаемости признака встретилось только по одному разу, то есть частота числовых значений в данной выборке равна 1. Такая средняя арифметическая величина называется простой. Простую среднюю арифметическую вычисляют обычно при малом числе наблюдений (меньше 30). На практике значительно чаще встречаются выборки, в которых числовые значения признака повторяются. Такая средняя арифметическая величина называется взвешенной. Она представляется, как правило, в виде ряда распределения (или вариационного ряда).

Ё

2=1

_= Хі Рі + х2 Р 2 + хз Рз ..., Хпрп = ^

(3)

п п

где х - средняя арифметическая взвешенная; х]р1 + х2р2 + хр>3 + ...хпрп - числовые значения переменных (х) и их частоты (р); т - число групп (одинаковых числовых значений) в ряду.

Например, для дальнейшего изучения стафилококков мы решили измерить диаметр их колоний на мясопептонном агаре при суточной инкубации при 37оС. В данном случае в качестве признака будет выступать диаметр колоний в миллиметрах. Для исследования взяли 50 штаммов стафилококка. Было обнаружено, что бактерии разных штаммов росли в виде выпуклых с ровными краями колоний с разным диаметром, то есть мы обнаружили разную частоту встречаемости признака. Однако в этом случае числовые значения признака повторялись с определенной частотой. Представим полученные данные в виде таблицы (табл. 1).

Таблица 1

Диаметр колоний штаммов стафилококка после суточной инкубации (мясопептонный агар, 37оС, п = 50)

Группы, т Варианты числовых значений признака, х. (мм) Частота числовых значений встречаемости признака, р.

1 2,4 2

2 2,8 7

3 3,0 9

4 3,2 12

5 3,5 11

6 3,6 8

7 3,9 1

Всего (п): 50

Для вычисления средней арифметической взвешенной величины необходимо:

1) Умножить варианты числовых значений признака (диаметра) на соответствующие им частоты (х1 * р1);

2) Суммировать полученные произведения:

т

Е (хгРг

1=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3) Разделить полученную сумму на общее число

наблюдений т

Е (хгРг) п: — .

Средняя арифметическая взвешенная величина диаметра колоний стафилококка на мясопептонном агаре составит:

- _ (2,4*2)+(2,8*7)+(3,0*9)+(3,2*12)+3,5*11)+(3,6*8)+3,9 _ 161

X =

50

— Ж — "I 99

— 50

п

В Microsoft Excel для Windows определение средней арифметической проводится применением инструмента Вставка\Мастер функций\Статистиче-ские функции\СРЗНАЧ.

Как уже говорилось, средняя арифметическая величина является основной характеристикой совокупности наблюдений, однако она не характеризует их с

точки зрения вариации количественных значений переменных, что в свою очередь не позволяет решить вопрос о типичности величины средней для данной выборки. На практике часто при одинаковых или близких по значению средних арифметических переменных в сравниваемых выборках индивидуальные значения признака резко отличаются друг от друга (табл. 2).

Диаметр грамположительных кокков (мясопептонный агар, Э7оС, суточная культура)

Таблица 2

Staphylococcus aureus Streptococcus pyogenes

Диаметр, xi, мкм Частота, pi xi * pi и 7 — 1=1 Диаметр, xi, мкм Частота, pi xi * pi и 2>iA 7 — 1=1

69 69

0,78 Э 2,Э4 = _ 79,64 _ Ї£Ї Ї 1,01 ^ _ 75,97 _

0,81 б 4,05 1,0Э 2 2,06

1,Э4 7 9,Э8 Ї£б 2 2,1

1,52 8 12,16 1,07 4 4,28

1,0Э ЇЇ 11,ЭЭ X 69 = 1,15 мкм 1,08 б 5,4 69 = 1,10 мкм

1,22 Ю 12,2 Ї£9 8 8,72

1,52 8 9,84 Ї,Ю 12 1Э,2

0,72 7 9,Э8 Ї,ЇЇ 14 15,54

O,^ б 6,85 1,12 ЇЇ 12,Э2

1,2Э Э 4,56 1,1Э 8 9,04

1,Э7 2 Э,04 Ї,Їб 2 2,Э

и П = 69; =79,64 i=i її П = 69; 75,97 і=і

Вариация значений диаметра Staphylococcus aureus значительно больше, чем Streptococcus pyogenes. Для характеристики выборки следует определять степень вариации (разброса) признака (в данном случае - диаметра), то есть степень рассеяния отдельных значений относительно средней. Это можно определить с помощью показателей, которые называются дисперсия (о2) и среднеквадратичное отклонение (стандартное отклонение, о):

2 1=1

о2=----------

£{х,-Х)>р,

і

(4)

где ((х,.-Х) - квадраты отклонения индивидуальных значений признака от средней величины; р - число случаев (частоты); п - численность совокупности.

Извлекая квадратный корень из дисперсии, получаем важнейший показатель вариации значений выборки - среднеквадратичное (стандартное) отклонение (о) - показатель, который отражает среднюю изменчивость (разброс, вариацию) значений переменной вокруг значения их средней арифметической.

£(х,-Х)2Р1

о = \^—;------- (5)

и-1

При n>30 в формуле вычисления стандартного отклонения в знаменателе можно брать не n -1, а просто n, т.к. это существенно не сказывается на величине показателя.

Стандартное отклонение тем больше, чем больше варьирует признак и, наоборот, уменьшается при слабом варьировании.

Существует, так называемое, «правило трех сигм», подтвержденное математической статистикой и практическим опытом, согласно которому определены устойчивые соотношения между средней арифметической величиной и стандартным отклонением: 99,7% показателей выборки лежат в пределах интервала «среднее ±3 о», 95,4% - в пределах «среднее ±2 о» и 68,3% - «среднее ±о». Это правило справедливо для всех распределений, включая нормальное.

Проиллюстрируем вычисление стандартного отклонения и дисперсии на нашем примере.

Для вычисления стандартного отклонения и дисперсии диаметров грамположительных кокков необходимо провести 6 вычислений уже по известным формулам:

1) найти средний диаметр Staphylococcus aureus и Streptococcus pyogenes по измеренным значениям соответствующих выборок;

2) сгруппировать данные величины диаметра и частоты величины признака;

3) определить отклонения каждого варианта диаметра от среднего значения;

4) возвести каждое отклонение в квадрат;

5) перемножить квадраты отклонений на частоты;

Несмотря на то, что средние значения диаметров Staphylococcus aureus и Streptococcus pyogenes оказались примерно одинаковыми, их вариации значительно разнятся, о чем свидетельствуют полученные показатели стандартного отклонения: у стафилококков (S = 0,24 мкм) она почти в 10 раз больше, чем у стрептококков (S = 0,03 мкм). Исходя из того, что стандартное отклонение отражает разброс данных, можно сделать вывод, что у Streptococcus pyogenes отдельные конкретные значения диаметра расположены ближе к среднему значению.

Пользуясь правилом трех сигм, можно сделать объективное и научно-обоснованное заключение о диаметрах грамположительных кокков и о степени варьирования этого признака. Таким образом, среднее отклонение значительно расширяет представление о внутренней структуре и характере изучаемого явления в целом. Оно позволяет статистически обосновать и установить точность, надежность, устойчивость найденной средней величины. Среднюю арифметическую величину и среднее квадратичное

6) разделить полученную сумму на число наблюдений (получаем дисперсию);

7) из полученного частного извлечь квадратный корень

- получаем величину стандартного отклонения (табл. 3).

отклонение определяют преимущественно в нормальных или близких к ним распределениях.

Однако, в силу того, что стандартное отклонение является величиной именованной (мкм, мл, см и т.д.), с его помощью нельзя сравнить вариабельность признаков, выраженных различными единицами. Как, например, сравнить между собой по величине стандартного отклонения возраст пациентов (в годах) и распространенность носительства штаммов микроорганизмов (в процентах)?

Чтобы стандартное отклонение могло быть использовано в качестве меры сравнения вариабельности признаков, выраженных в различных единицах измерения, используют относительную меру изменчивости, называемую коэффициентом вариации (V), который определяется по формуле:

х

где S - стандартное отклонение; х - средняя арифметическая.

Таблица 3

Вычисление стандартного отклонения и дисперсии диаметров грамположительных кокков

(мясо-пептонный агар, 37оС, рН 7,2)

Staphylococcus aureus

Диаметр, хі, мкм Количество бактерий, pi VPi (х,-Х) (х,-Х) (x,-X)2*Pi Расчет

0,78 3 2,34 -0,39 0,Їб 0,46 _ 79,64 x = 69 = 1,15 мкм Z(*-*)2a о2- « -/1-1 - ^-0,08; 68

0,81 б 4,05 -0,38 0,14 0,72

1,34 7 9,38 -0,29 0,08 0,б9

1,52 8 12,16 -0,19 0,04 0,29

1,03 ЇЇ 11,33 -0,07 G,GG 0,0б

1,22 Ї0 12,2 0,12 0,0Ї 0,14

1,52 8 9,84 0,13 0,02 0,14

0,72 7 9,38 0,24 G,G6 0,29

й,9Ї б 6,85 0,27 0,07 0,37 tb-xfn Н" -1 S = -Уо,08«*0,28 мкм

1,23 3 4,56 0,42 0,18 0,53

1,37 2 3,04 0,42 0,18 0,35

Х=1,15 n = 69 I = 5,34

Streptococcus pyogenes

Диаметр, хі, мкм Количество бактерий, pi VPi (х,-Х) (xi -X)2* Pi Расчет

Ї,0Ї Ї Ї,йЇ -0,0910 0,0083 0,0249 75,97 x — «* 69 «*1,10 мкм £b-xfp, сг= и — 1 0.064 = — «*0,001; 68 і п

1,03 2 2,06 -0,0710 0,00б0 0,0Ї0Ї

Ї,0б 2 2,1 -0,0510 0,0026 0,0052

1,07 4 4,28 -0,0310 0,00Ї0 0,0038

1,08 б 5,4 -0,0210 0,0004 0,0022

Ї,09 8 8,72 -0,0110 0,0001 0,00Ї0

Ї,Ї0 12 13,2 -0,0010 G,GGGG 0,0000

Ї,ЇЇ 14 15,54 G,GG9G 0,000Ї 0,0009

1,12 ЇЇ 12,32 0,0Ї90 0,0004 0,0040 \Z(.x-Xfp, S=V~ :

1,13 8 9,04 0,0290 0,0008 0,0067

Ї,Їб 2 2,3 0,0490 0,0024 0,0048 У n-1 S = д/0,001 ^0,03 мкм

Зс=1,10 n = 69 I = 0,064

Из нашего примера по этой формуле рассчитаем коэффициенты вариации для диаметров Staphylococcus aureus и Streptococcus pyogenes. Полученные значения коэффициентов указывают на то, что вариабельность (изменчивость) диаметра у Staphylococcus aureus (V= 24,35%) заметно больше, чем у Streptococcus pyogenes (2,73%).

Стандартная ошибка среднего значения (т^, standart error, SE, или standart error mean, SEM) является оценкой возможного отличия между значением среднего в анализируемой выборке (выборочной средней) и истинным средним во всей популяции (М, генеральной совокупности). Ошибка выборочной средней - величина именованная, ее выражают в тех же единицах, что и среднюю арифметическую величину. Стандартную ошибку рассчитывают путем деления стандартного отклонения на квадратный корень из числа наблюдений в выборке и, следовательно, ее значение уменьшается с ростом размера выборки. Следовательно, чем больше выборка, тем ближе рассчитанное среднее к истинному (генеральному среднему). При бесконечном увеличении выборки значение ошибки средней стремится к нулю и величины х (выборочной средней) и М (средней генеральной совокупности) практически совпадают. Расчет стандартной ошибки в приведенном выше примере в выборках диаметров грамположительных кокков показал, что у St. aureus она равна 0,03, а у Str. pyogenes - 0,00.

Доверительный интервал (confidence interval, CI) -диапазон значений (область), в которой с определенным уровнем доверия (надежности) содержится истинное значение параметра (например, генерального среднего). 90% доверительный интервал означает, что истинное значение генерального среднего попадает в рассчитанный интервал с вероятностью 90%. В биомедицинских исследованиях доверительный интервал среднего обычно устанавливается на уровне 95% и определяется как ± 1,96 стандартной ошибки (коэффициент 1,96 вытекает из предположения о нормальности распределения значений переменных при условии, что выборка достаточно велика).

Пример: значение среднего диаметра колоний стафилококка составляет 1,15 мкм, а стандартная ошибка - 0,3 мкм, то при 95% доверительном интервале границы диапазона значений диаметра будут

0,56 и 1,74 мкм, что составляет ± 0,59 (0,3 х 1,96) мкм. Совмещая значения среднего и доверительный интервал, можно констатировать, что определенное значение диаметра колоний St. aureus составляет 1,15 мкм и при этом мы на 95% уверены, что истинное значение находится в интервале между 0,56 и 1,74 мкм. В англоязычной литературе это описывается как 1,15 [0,56 - 1,74], mean [95%С1].

В компьютерной программе Microsoft Excel для Windows указанные расчеты основных числовых ха-

рактеристик переменных выполняются применением инструмента Сервис\Анализ данных\Описатель-ная статистика. В качестве примера приведем расчет с помощью указанного программного инструмента уже полученных числовых характеристик (табл. 4)

Таблица 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Описательная статистика данных измерения диаметра колоний грамположительных кокков с применением инструмента анализа данных Microsoft Excel для Windows

Характеристики Staph Strept

Среднее 1,15 1,10

Стандартная ошибка 0,03 0,00

Медиана 1,22 1,11

Мода 1,52 1,11

Стандартное отклонение 0,28 0,03

Дисперсия выборки 0,08 0,00

Эксцесс -1,32 2,07

Асимметрия -0,12 -1,16

Интервал 0,80 0,14

Минимум 0,72 1,01

Максимум 1,52 1,15

Сумма 79,64 75,97

Счет 69,00 69,00

Наибольший(1) 1,52 1,15

Наименьший(1) 0,72 1,01

Уровень надежности (95,0%) 0,59 0,01

Какие статистические характеристики изучаемой выборки нужно указывать в описании результатов медико-биологических исследований: среднее ± стандартное отклонение или стандартную ошибку средней? Это зависит от того, разброс чего изучает исследователь: исходной случайной величины или оценки среднего значения. Если непрерывные переменные распределены нормально и разброс данных обусловлен естественными причинами (диаметр колоний, размеры микробной клетки и т.п.) то принято указывать среднее ± стандартное отклонение. Если рассеяние связано с погрешностями измерения (например, прибора), то рекомендуется приводить среднее ± (95%) доверительный интервал или стандартная ошибка средней.

Кроме того, стандартная ошибка средней в отличие от стандартного отклонения, показывает лишь точность выборочной оценки среднего, но не разброс данных. Поясним это положение на нашем примере.

В любом случае представляя количественные данные в самой распространенной форме (М±т), всегда следует четко оговорить, что именно подразумевает автор, т.к. эта запись можно трактовать неоднозначно. Напомним, стандартная ошибка среднего в л/й раз меньше стандартного отклонения.

Когда непрерывные данные не подчиняются нормальному распределению, то для их описания, как правило, используют медиану и (95%) доверительный интервал. Дискретные данные представляются в виде пропорций (процента, доли) или таблиц сопряжения.

ЛИТЕРАТУРА

1. Гланц С. Медико-биологическая статистика: Пер. с англ. - М., 1990. - 334 с.

2. Дюк В. Обработка данных на ПК в примерах. -СПб.: Питер, 1997. - 232 с.

3. Котов Ю.Б. Новые математические подходы к задачам медицинской диагностики. - М.: Едиториал УРСС, 2004. - 328 с.

4. Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте (типовые случаи). - Волгоград: ВолГМУ, 2005. - 84 с.

5. Петри А., Сэбин К. Наглядная статистика в медицине. - М.: ГЭОТАР-МЕД, 2003. - 144 с.

6. Платонов А.Е. Статистический анализ в медицине и биологии: задачи, терминология,

логика, компьютерные методы. - М.: РАМН, 2001. - 52 с.

7. Румянцев П.О., Саенко В.А., Румянцева УВ. Статистические методы анализа в клинической практике: часть

1 // Проблемы эндокринологии, 2009. Т. 55. № 5. С. 48-55.

8. Халафян А.А. Современные статистические методы медицинских исследований. - М.: Издательство ЛКИ, 2008. - 320 с.

9. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. - СПб, 2002. - 266 с.

10. Kirkwood B.R., Sterne J.A. Essential medical statistics. - New York, 2003. 186 р.

11. Petrie A., Sabin C. Medical statistics at a glance.

- New York, 2005. 144 р.

Andryukov B.G., Timchenko N.F.

BASIC METHOD OF DESCRIPTIVE STATISTICS IN MICROBIOLOGICAL RESEARCH

FGKU naval hospital clinical Pacific Fleet, Vladivostok; Federal State budgetary institution,

«Research institute of Epidemiology and Microbiology” SB RAMS, Vladivostok

Statistical analysis in microbiology, as well as in other biomedical research vaniyah, not an end in itself but a necessary tool for the description and interpretation of data, rationale and reasoning of findings and decisionmaking, support for critical thinking. Correct and correct understanding of statistical concepts and methods will improve the objectivity of the validity of the study of the, validity of the findings. The article deals with the concepts and methods of descriptive statistics and view the description of a data set of logical microbiological studies.

Keywords: elementary statistics, microbiological investigations.

Сведения об авторах:

Андрюков Борис Георгиевич, заслуженный врач РФ, доктор медицинских наук, заведующий лабораторным отделением 1477 ВМКГ МО РФ, ведущий научный сотрудник лаборатории молекулярных основ патогенности бактерий НИИЭМ СО РАМН, тел.: 8(423)246-78-14; e-mail: andrukov_bg@mail.ru;

Тимченко Нелли Федоровна, заслуженный деятель науки РФ, профессор, доктор медицинских наук, лауреат Государственной премии СССР, заведующая лабораторией молекулярных основ патогенности бактерий Федерального государственного бюджетного «НИИ ЭМ» СО РАМН; 690068, Владивосток, Пр. 100-летия Владивостоку, д. 115, кв. 13. Тел.: (423)232-03-66; e-mail: ntimch@mail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.